科学家准备迎接大型强子对撞机的数据雪崩
大型强子对撞机每秒将产生数亿次碰撞。(图片提供:CMS/CERN)
本报讯 大型强子对撞机(LHC)将于今年8月正式启动运行。随着首束粒子流进入LHC的临近,物理学家们也正在鼓舞自己,准备迎接这一数十亿美元的加速器产出的“数据雪崩”。
7月20日在西班牙巴塞罗那举行的欧洲科学开放论坛(ESOF)上,LHC研究小组透露了一些令人难以置信的数字。LHC会将质子加速到接近光速,并产生大约每秒6亿次的碰撞。届时,将有成千上万台电脑处理器分析这些碰撞,随之而来的是每秒700兆字节的数据。如果将LHC一年能够产出的数据装进CD中,摞起来将会有2万米高。
LHC系统的最初元件中包括位于探测器旁的耐辐射电子设备,它们能够利用全球数百位物理学家编写的运算法则,快速筛选每一条碰撞数据,并从中挑选出几百次值得进一步细致研究的碰撞事件。
欧洲粒子物理研究中心(CERN)的物理学家Pere Mató说:“一旦你决定丢弃一些数据,它们就再也无法恢复了。因此硬件必须有很高的规格,否则数年后你会意识到,‘天哪,我扔掉了要寻找的东西’。”
在此之后,第二轮计算会介入,进一步筛选数据,并且让物理学家找寻碰撞产生的新粒子,尤其是赋予其他粒子质量的希格斯玻色子。
在所有的数据都被分析后,LHC计划需要更强大的计算力登场,找到这些数字背后的意义。此外,在观察LHC实际碰撞的同时,科学家还将模拟大约25%的碰撞事件,从而对比理论预测和实际发生的情况。
西班牙Port d’Informació Cientifica科学数据处理中心的Gonzalo Merino表示:“数据分析就好比试图让时间倒流,来看看究竟有没有希格斯玻色子或其他新型粒子出现。我们将设法在硅(指电脑处理器)中重现大自然蒙骗过探测器的一切。”
据悉,LHC计划的计算力分布在全世界,连接入一个名为“CERN网格”(CERN Grid)的分布式网络中。同样地,网络按照这种方式分发信息,网格系统负责分配计算力。
Merino表示,此次构建网格和处理“数据雪崩”的经验将同样有助于其他领域,比如天文学和医学。“粒子物理不是唯一发生数据爆炸的学科,其他一些领域所面临的计算挑战与我们目前所面临的情况类似。”