科学家准备迎接大型强子对撞机的数据雪崩

文章正文

发布时间：2024-09-09 19:54

科学家准备迎接大型强子对撞机的数据雪崩

大型强子对撞机每秒将产生数亿次碰撞。（图片提供：CMS/CERN）

本报讯大型强子对撞机（LHC）将于今年8月正式启动运行。随着首束粒子流进入LHC的临近，物理学家们也正在鼓舞自己，准备迎接这一数十亿美元的加速器产出的“数据雪崩”。

7月20日在西班牙巴塞罗那举行的欧洲科学开放论坛（ESOF）上，LHC研究小组透露了一些令人难以置信的数字。LHC会将质子加速到接近光速，并产生大约每秒6亿次的碰撞。届时，将有成千上万台电脑处理器分析这些碰撞，随之而来的是每秒700兆字节的数据。如果将LHC一年能够产出的数据装进CD中，摞起来将会有2万米高。

LHC系统的最初元件中包括位于探测器旁的耐辐射电子设备，它们能够利用全球数百位物理学家编写的运算法则，快速筛选每一条碰撞数据，并从中挑选出几百次值得进一步细致研究的碰撞事件。

欧洲粒子物理研究中心（CERN）的物理学家Pere Mató说：“一旦你决定丢弃一些数据，它们就再也无法恢复了。因此硬件必须有很高的规格，否则数年后你会意识到，‘天哪，我扔掉了要寻找的东西’。”

在此之后，第二轮计算会介入，进一步筛选数据，并且让物理学家找寻碰撞产生的新粒子，尤其是赋予其他粒子质量的希格斯玻色子。

在所有的数据都被分析后，LHC计划需要更强大的计算力登场，找到这些数字背后的意义。此外，在观察LHC实际碰撞的同时，科学家还将模拟大约25%的碰撞事件，从而对比理论预测和实际发生的情况。

西班牙Port d’Informació Cientifica科学数据处理中心的Gonzalo Merino表示：“数据分析就好比试图让时间倒流，来看看究竟有没有希格斯玻色子或其他新型粒子出现。我们将设法在硅（指电脑处理器）中重现大自然蒙骗过探测器的一切。”

据悉，LHC计划的计算力分布在全世界，连接入一个名为“CERN网格”（CERN Grid）的分布式网络中。同样地，网络按照这种方式分发信息，网格系统负责分配计算力。

Merino表示，此次构建网格和处理“数据雪崩”的经验将同样有助于其他领域，比如天文学和医学。“粒子物理不是唯一发生数据爆炸的学科，其他一些领域所面临的计算挑战与我们目前所面临的情况类似。”

标签