编辑丨慕一 编译/排版丨浪味仙 沛贤
深度好文:3700字丨18分钟阅读
如何把超导量子计算机部署到数据中心?数据中心运营商和量子公司面临着以前没有见过的重重难关。
首先,数据中心运营商需要学会托管能提供超低温冷却能力的稀释制冷机,而超导量子计算和超低温稀释制冷机提供商必须了解数据中心的运作方式,以及它们在现有数据基础设施中能够安装的位置……
目前,英国牛津量子计算公司 Oxford Quantum Computing (OQC) 已在两个主机托管数据中心部署了 6 套 QPU 系统。
OQC首席技术官Simon Phillips表示:“我们不希望量子计算机在实验室里默默待两年,就能突然出现在数据中心,而用户就能马上提出使用申请,我们需要做的只是允许访问。”
该公司目前在运营商Cyxtera的数据中心运营着一个实验室,托管其8量子比特的Lucy系统,该系统是2021年部署到托管站点,可通过AWS的Braket服务在线访问。
“一开始我们就遇到了断电的问题,超导量子计算系统的一部分无法正常重新启动。”他解释道,断电会导致超导系统升温并失去超导特性。虽然系统没有损坏并会重新冷却,但它让公司意识到需要更认真地考虑超导量子计算系统的正常运行时间。
“当时我们已经解决了主要问题,正试图证明超导计算机已经准备就绪,只是还不能启动。”
但与此同时,这个概念验证的项目还面临着停滞的风险,因为客户表示无法将实时数据从其外部传输到实验室的数据设施中。
“后来,突然之间我们的数据中心挤满了量子客户。”Phillips说道,“所以我们的新任务是:让研究项目走出实验室,要想访问真实世界的客户数据,我们必须以最低延迟直接连接到已有的算力基础设施中。”
现在,OQC已在数据中心托管公司Cyxtera的“LHR3”设施和日本东京的数据中心运营商Equinix的“TY11”设施中,部署了3个 32 量子比特的超导量子计算系统。
每个数据中心都包含了3个QPU和附带的超低温冷却系统,其中1个QPU能实时运行且为客户提供访问,另外2个也处于运行状态,可用于升级、测试等。其中,每个QPU都需要大约 15-20KW(主要用于6个9KW水冷氦压缩机)的电力,以及50平米左右的占地面积。
2022 年 3 月,OQC首次在Cyxtera数据中心部署量子系统:第一台超低温稀释制冷机于2023年1月安装,最后一台稀释制冷机于 3 月安装。部署工作一直持续到4月,才开始测试,该系统现已上线。
Cyxtera数据中心 的 LHR3 设施(图片来源:谷歌地图)
Cyxtera 使用了该公司的一个独立库房来部署量子系统,上图中的建筑此前曾是用于数据存储的磁带库。
“这个建筑很好,因为电力供应充足。”Cyxtera的战略发展总监Charlie Bernard(查理·伯纳德)说:“在这里我们可以获得足够的电力,以及足够的制冷能力来使超导计算机工作,并且地板下有大量的管道。”
虽然整个系统高于房间天花板高度(系统高3.4m,管道工程需要额外50cm的顶部间隙),但由于库房单层的天花板空间较大,因此Cyxtera拥有了额外的回旋空间。
但是他们必须对天花板和火灾报警系统进行规划整改,以留出足够的顶部空间,通过高架地板环境,数吨重的计算系统的框架直接连接到楼板上,并与高架地板实现了机械隔离。
每个超低温稀释制冷机每周需要泵入多达40升液氮制冷剂,Cyxtera还必须使用建筑物的水管道来冷却液氮压缩机。
为了容纳液氮和氢气,该公司还在房间内安装了氧气探测器,并配有灯光指示器和警报器,用来警示是否存在潜在泄漏,以及气体是否沸腾。
“我们正带领量子科学家们将量子系统部署到数据中心,他们之前一直在实验室的‘孤岛’中从事设计。”Bernard说:“我们这里让他们大开眼界,他们开始了解真实数据中心的承重限制、门尺寸、噪音、干扰等因素的信息。”
“我们会互相分享专业知识,我们学习了如何处理液化气体并将其输送到整个基础设施的实践经验。”Phillips补充了在部署过程中所获得的经验教训:“在实验室里,每个人对待实验室的一切都要认真负责。”
目前,Cyxtera数据中心还兼作OQC的网络运营中心,每天都有许多的员工在现场。
而在东京,OQC将量子系统部署在数据大厅的“笼子”状建筑内,这一设计可以进行远程管理,并保留一支牛津仪器(Oxford Instruments)的服务团队来处理任何问题。
Phillips说:“他们的超低温稀释制冷机与核磁共振扫描仪(MRI)是同一个团队生产的。医院核磁共振系统中的所有低温技术都由他们提供,所以超低温技术对他们来说并不新鲜。”
OQC在东京部署有一个独特的要求,那就是必须适应地震频发的周围环境。例如,超低温系统有一个液氮容器,通常可以独立放置在地板上,但在东京,他们就必须用螺栓把容器固定在地板上,以保证符合防震法规。
Phillips表示,随着公司业务的不断发展和技术人员的不断学习,他预计未来各地的部署将更加顺利。
“我们已经有了关于如何将超导量子计算机安装到世界任一数据中心的执行手册。”Phillips说:“每次我们去到一个新地点,都会找出差异所在:一开始对我们来说,数据中心看起来都很标准,而数据中心人员会说它们各不相同,最终我们发现它们与实验室部署的布局非常相似。”
OQC的量子系统(图片来源:OQC)
此外,在进行这些部署之前,人们并不知道数据大厅的声音、振动和电磁等不同因素的干扰将如何影响量子计算机的部署计划。同样,超导量子系统的高频微波控制如何影响周围的IT硬件,也存在潜在问题。
Phillips表示,目前为止,他还没有发现这方面有任何问题。当被问及这是否仅仅是出于理论考虑,或电磁干扰问题可能被夸大时,他说可能是两者兼而有之。
“我们在屏蔽环境干扰方面做了很多工作,所以我们还没有看到任何会造成问题的情况。”
在运营方面,设施内液氢和液氮的处理是由量子计算系统所有者管理,而不是由托管运营商管理。但数据中心的托管运营商也将了解如何处理这些液体,并可能在未来接管超低温冷却系统。
“运营商需要学习如何运行所有系统。”牛津仪器公司的 Harriet van der Vliet指出:“例如如何正确关闭系统以避免泄漏、如何抽空系统、如何检查系统泄漏等。我们非常擅长为用户培训,助力他们能自己运行系统。”
“当然,这是我们必须要做的事情,因为我们的用户是未经培训的超低温技术专家。理论上他们可以构建自己的系统,所以确实需要一些培训。”
Harriet van der Vliet(图片来源:网络)
Cyxtera和OQC均表示,他们现在为未来的部署做了更好的准备。
“我们的第一次部署非常原始,它们看起来与实验室的东西非常相似。但在部署过许多项目后,一切变得更容易、更快、更适宜,因为我们提出了以前没有人询问的实践问题。”OQC 的Phillips说:“比如,以前从未有人问过冷却的工作方式或空气处理的工作方式。”
Cyxtera的Bernard指出,公司希望将来在其他地方复制这个项目:“这是我们第一次部署,对我们所有人来说是走过了一个很好的学习曲线,我们现在处于优势地位。”
OQC表示,它的目标是首先扩展到更多的市场,然后随着需求的增加,更新现有的部署形式。
Phillips说:“进入全球市场的最大挑战是,金融公司在某个地方聚集,材料科学公司却在另一个地方聚集。我们可以瞄准目标用户,让他们连线接入当地数据中心的QPU,再考虑在客户那建立量子计算中心或扩大规模。我认为,解决方案需要在托管服务中优先考虑。”
“使用量子计算机的最大挑战,是与现有数字基础设施的集成,而不是建立量子比特‘账户’。事实上,我们能谈论数据中心和量子计算机,已经意味着一切都朝着正确的方向发展。”
低温系统供应商牛津仪器公司在其位于英国牛津郡的主基地安装了一台Rigetti量子计算机。这是Rigetti在美国以外的第一个量子计算系统,也是该公司对外发货的少数量子系统之一,它能连接到 Rigetti 的云上,供自己和客户调用。
Rigetti公司的超低温稀释制冷机(图片来源:Rigetti)
牛津仪器公司量子技术产品经理 Harriet van der Vliet说,该公司在此次部署前没有实际的数据中心,并且至今仍然没有我们所认为的传统空白数据大厅。
“我们的工厂并不等同于托管设施。作为英国创新基金的一部分,我们提供了制冷机和低温设备,以便Rigetti及其合作伙伴Phasecraft、渣打银行和其他公司等都能共同致力于量子计算的应用研发。”她说。
“我们必须了解一个将云、备用发电机、备用制冷机都正确连接的商业数据系统,而这些你在实验室中不一定会想到。”她说:“如果大学停电了,你只需说——好吧,我先暂停一下,然后等第二天再把温度降下来。但如果这种情况发生在为客户连接到云的数据中心或系统中,那就绝对不行了。”
当被问及该公司是否希望在未来托管更多的量子计算机或者这只是一次性服务的时候, Harriet van der Vliet表示:在这个领域“总是有机会做更多的事情”。
“我们了解了如何构建冗余,例如备用发电机、冷却器等,以便系统为客户提供良好的正常运行时间。”
除了自己的设施之外,牛津仪器还参与了实时数据中心的许多QPU部署,包括 OQC在Cyxtera中心、Equinix 中心,以及西班牙 CESGA 超级计算中心的部署。
“我们现在已经在数据中心安装了各种系统。”van der Vliet 说:“我们必须在不同的区域进行安装,并且必须为安全做好准备,必须让人们佩戴特定的徽章才能让他们进出数据中心,这是我们不习惯的地方。”
“我们不得不改变系统物理上的安装方式,例如以前我们毫不关心设备是怎么进入数据中心的,一些数据中心的某些区域可能只足够一个19英寸机架通过,而我们的系统显然要比这大得多。”
“但这与此前我们熟悉的学术环境部署并没有太大不同,多年来我们在安装过程中一直遇到这些问题和困难。”她补充道:“这只是为了获得实战经验。我们现在完成了第二次和第三次安装,后两次安装都比第一次好得多。”