bt365体育|平台

伯克利宇宙学家在机器学习的挑战顶级竞争者

周五,2020年3月20日

在寻找新粒子,物理学家可以依靠暗示一些好地方的外观和一些好办法,找他们理论预测:它就像被交给一个隐藏针的草图大海捞针。

但盲目搜索是一个复杂得多,就像大海捞针狩猎不知道你在找什么。

找一下传统的计算机算法和科学家可以在粒子对撞机实验收集的数据量巨大忽视,粒子物理学界正转向机器学习,人工智能的应用程序,可以教自己,以提高其搜索技术,因为它进行筛选,通过数据的一个干草堆。

在被称为强子对撞机的大型2020(LHC)机器学习的挑战奥运会,来自美国队的宇宙学家能源部劳伦斯伯克利国家实验室(伯克利实验室)的研发部门确定了最佳的嘲笑在模拟粒子碰撞数据隐藏信号的编码。

宇宙学家?这是正确的。

“这是完全出乎意料的为我们表演得这么好,”乔治说斯坦因,伯克利实验室和bt365体育平台博士后研究员参加了挑战谁 罗斯·塞尔杰克,宇宙学家伯克利实验室,bt365体育平台教授,伯克利中心的副主任宇宙物理学,哪斯坦是一个成员。

十支球队,大部分的粒子物理学家,在竞争中竞争,从十一月跑组成。 19,2019年,到一月12年,2020年。

斯坦率领的两个其他学生的代码ADH研究人员的下Seljak的方向发展适应。本次比赛由机器学习飞机的组织者,2020(ml4jets2020)会议上正式推出。锥体在实验粒子 - 粒子碰撞即可以追溯到物理学家测量他们的粒子源的性质产生的颗粒的窄射流。

宣布比赛结果。在发布会上,这是在纽约大学举行的一月。 15-17。

本纳赫曼,在伯克利实验室的博士后研究员谁是一组的一部分,工程上地图集 - 大探测器在CERN的LHC - 担任活动和竞赛组织者之一。大卫施,在罗格斯大学物理学和天文学教授现在在休假伯克利实验室,格里高尔kasieczka,汉堡在德国的大学教授,是协办单位。

在计算一些比赛让参与者提交和测试代码他们多次来衡量他们是否越来越接近正确的结果,2020年奥运会LHC给了只有一个镜头的竞争团队提交的解决方案。

“这是我们没有使用工具关闭的,现成的很酷的事情,” Seljak说。 “我们使用的工具开发我们有我们的研究。”

我注意到,“在我的组,我们一直在研究无监督的机器学习。这个想法是,你要当数据没有任何标签来描述数据“。

该工具使用的团队被称为切片迭代优化运输。 “这是深度学习的一种形式,而是要形成我们在哪儿一次不优化的一切,” Seljak说。 “相反,我们做迭代”的阶段。

代码是如此高效能说简单的台式机或笔记本电脑上运行。这是一个贝叶斯统计方法作为证据已知的开发。

Seljak说,“假设你正在寻找在一星球上的运输时间异常”,所花费的时间为行星从你的观点较大的物体的前传 - 就像从地球看着在阳光的前水星移动。

“这一个解决方案需要有一个额外的行星,”他说,”其他的解决方案需要额外的月亮,他们是一个不错的选择两者的数据,但非常不同的参数他们。我如何比较两个解决方案这些?“

贝叶斯方法是计算这两种解决方案的证据,看哪个方案具有真正的概率较高。

“这样的例子出现所有的时间,” Seljak说,和他的团队的代码的目的是加快传统方法所需的复杂的计算。 “我们试图在粒子物理学中的一些无关的提高,我们意识到可以作为一般的ESTA机器学习工具。”

我补充说,“我们的解决方案是所谓的异常检测特别有用的:寻找数据非常微小的信号,这比其他ITS数据有些不同。”

在2020年奥运会LHC比赛,参加第一次收到的样本集叫了一些背景资料该粒子的信号数据的数据 - 无论是针和干草堆 - 这让参与者以测试他们的代码。

然后,他们收到了目前的“黑匣子”竞赛数据:刚刚干草堆。他们负责寻找不同的,完全不知道那种隐藏在后台的数据粒子信号,并具体描述信号事件,他们的方法出现了。

合作竞争的组织者石和纳赫曼指出,他们一直在研究的个人异常的检测方法使用一个非常类似的这种做法(所谓的“有条件的密度估计”)由Seljak和Stein开发的技术,是在竞争中进入。

Seljak和Stein咨询与实验室的一些粒子物理学家,其中包括纳赫曼,石,和研究生帕特里克·麦科马克。他们讨论,除其他议题,高能量物理学界如何分析通常在那些比赛一样使用的数据集,但对于目前的“黑盒子”的挑战Seljak和Stein于自己。

作为竞赛贴近走向斯坦说,“我们认为我们找到了一个星期一些关于最后期限之前。”

斯坦和Seljak他们的研究结果在会议开始前提交了几天,“但我们不是粒子物理学家,我们不打算在这次会议要参加,” Seljak说。

然后,从斯坦因会议组织者,谁问飞出他并提出一个谈话对球队的解决方案,一周后收到一封电子邮件。主办方不同意比赛的结果,直到所有的发言者都他们的研究结果提出的。

“我的谈话本来是第一,然后在会议开始前不久到最后我他们感动。我不知道这是否是一件好事,“斯坦说。

这伯克利实验室团队拿起码输入了有关1000个事件,加上或减去200的误差,以及正确的反应是843个事件。他们的代码是该类别中的赢家。

几个团队紧密估计能级,或信号的“共振质谱”,和伯克利实验室的团队是从主信号所产生的辅助信号其共振质谱的最接近的估计。

在会议上,斯坦因所指出的,“当时在我们采取的总体思路巨大的利益。它掀起了波澜“。

阿姆拉姆盎司,在大赛中另一个竞争对手,在推特发布,打趣说:“在LHC奥运会的结果是......宇宙学家都在我们的工作比我们更好的。”但没有正式比赛的组织者宣布获胜者。

纳赫曼,活动主办方之一,他说,“即使乔治和野牛明显优于其他竞争对手,最终很可能没有一个算法将覆盖所有的可能性 - 所以我们需要一组不同的途径来实现广泛的敏感性“。

我补充说,“粒子物理学进入了一个有趣的预测为每一个地方我们在大型强子对撞机试验的新粒子迄今被证明在自然界中没有实现的时间 - 除了粒子物理学的标准模型。而有必要继续的模型驱动的搜索程序,我们也必须开发并行程序是模型无关。这是ESTA挑战的动机“。

Seljak说,他的团队正计划发表一篇论文机器学习STI这些代码的细节。

“我们肯定准备申请这个很多问题天体物理学,”我说。 “我们将寻找有趣的应用程序 - 随着毛刺或瞬变什么,什么反常。我们将努力加快代码,并使其功能更强大。这些种途径可以真正的帮助“。

编辑: 
格伦·罗伯茨JR。
研究领域: