全球首富马斯克部署世界最大超级计算机,震撼业界并加剧竞争态势

   日期:2024-11-20     来源:网络整理    作者:二手钢材网    浏览:180    评论:0    
核心提示:四年建设周期缩短至122天今年早些时候,马斯克开始着手整合创建xAI所需的庞大算力。该公司正以“令人难以置信的速度”全速前进,并郑重承诺:“马斯克将亲自监督数据中心的如期交付。为了能在预期时间内完工,马斯克催促孟菲斯当地官员以前所未有的速度批准这个建设项目。

作为世界首富,埃隆·马斯克在极短的时间内放弃了传统的数据中心建设方式,为他的人工智能初创公司xAI部署了世界上最大、最快的数据中心。超级计算机。此举不仅震惊了业内竞争对手,也加剧了微软、谷歌等公司在超大规模数据中心领域的竞争。

巨像以两种方式击晕对手

今年10月一个阳光明媚的日子,一架螺旋桨飞机在美国田纳西州孟菲斯市中心附近一座周围环绕着绿色草坪的雄伟工业建筑上空盘旋。机上乘客记录了该设施的图像。

这次飞行实际上是一次秘密侦察行动。马斯克最近将这座原本是家电制造工厂的建筑改造成一个数据中心,里面有全球最大的服务器集群,专门用于训练人工智能模型。马斯克为xAI打造的人工智能超级计算机的建设速度引起了其他竞争对手高管的广泛担忧和困惑。

据看过照片的知情人士透露,机上乘客来自一家与马斯克数据中心竞争的公司,他们试图深入了解这个戒备森严的数据中心的运营细节。这些内部人士还观察到马斯克用卡车将多台燃气轮机运往现场,为该设施提供电力支持,并致力于探索 xAI 如何有效管理建筑物内服务器的散热。

孟菲斯上空的侦察飞行凸显了这场技术最昂贵的竞赛中的一场高风险战斗。微软、meta、谷歌和亚马逊等科技巨头都在竞相投资新的数据中心,以支持其他人工智能技术。

这是一个冒险的赌注,基于一个简单的信念:服务器集群越大,它可以训练的人工智能就越好。 2022年底,推出的聊天机器人风靡全球,不仅引起科技行业轩然大波,也加剧了各方对超大规模服务器集群的激烈竞争。

作为公司的联合创始人和早期支持者(尽管他们后来分道扬镳),马斯克在数据中心竞赛刚刚开始时就加入了。凭借非凡的雄心、不懈的努力、挑战传统数据中心建设的惯例,他成功地在业界掀起波澜。

马斯克的超级计算机 在两个方面令竞争对手震惊:其庞大的规模和 xAI 惊人的构建速度。这台超级计算机配备了10万个GPU,非常适合训练和运行人工智能软件,并且规模远大于meta等科技巨头过去建造的同类超级计算机。

马斯克损失__马斯克对中国速度

四年工期缩短至122天

将这么大的GPU集群集成到超级计算机中并不是一件容易的事,因为服务器消耗大量的电力,连接芯片的网络设备也面临严重的带宽瓶颈。如此快地完成这个项目对于 xAI 来说是史无前例的。

马斯克和为 提供 GPU 的人工智能芯片领导者 联合宣布,数据中心和超级计算机仅用了 122 天就完工了。在最近的播客采访中,首席执行官黄仁勋承认,这种规模的GPU集群往往需要三年的规划和设计周期,再加上一年的建设时间才能投入使用。

谈及“巨像”项目时,黄仁勋在播客中感慨道:“毫无疑问,现在大家都在翻来覆去!据我所知,马斯克是世界上唯一有这样能力的人。”他对工程、建筑、大型系统构建和资源配置的独特见解是世界上无与伦比的。”

马斯克之所以能够在孟菲斯快速建立一个数据中心,部分原因是他跳过了几个关键步骤。例如,他在能够从电网获取足够的电力来运行 之前就开始了施工。然而,这种非常规的方法是马斯克在许多公司尝试和测试的策略之一。

例如,在特斯拉,马斯克在停车场建造了一条 Model 3 汽车生产线,绕过了在加州扩建汽车工厂所需的繁琐许可程序。现在,他继续敦促工程师简化火箭上他认为不必要的组件,或者使用不是专门为太空设计的更便宜的组件。

尽管xAI的人工智能工具目前明显落后,但马斯克建造超级计算机的速度让首席执行官萨姆·奥尔特曼保持高度警惕。据内部消息称,马斯克在 X 平台发帖后,奥特曼与微软基础设施高管发生了争执。他对xAI的发展速度可能超过微软表示担忧。

还担心 xAI 可能很快成为更强大的超级计算机。这种担忧促使人们首先考虑与微软之外的合作选择。目前,德克萨斯州阿比林市的一片贫瘠平原上正在建设替代计划,一些公司正在为即将建成的数据中心做准备,预计明年将部署 10 万个芯片。

德克萨斯州阿比林一处数据中心建设工地,预计明年将部署一台拥有10万颗芯片的超级计算机

现场施工进展极其迅速。在最近的一次现场考察中,一名项目承包商透露,大多数建筑物尚未建墙。承包商正在场外预制该设施的大部分组件,以便可以在现场快速组装。

也许在不久的将来,即使是阿比林和孟菲斯的超级计算机也会显得相对微不足道。包括微软在内的一些科技巨头已经开始讨论建设更大的数据中心项目,这些项目将包含数百万个 GPU,预计每个项目的成本将超过 1000 亿美元。

这种趋势可能会持续下去,因为数据中心行业几乎所有参与者都在密切关注竞争对手的一举一动。

“数据中心市场相对较小,每个人都在关注行业的一举一动,”DPR高级数据中心团队负责人John 表示。 DPR已经为meta等大公司建设了数据中心,目前正在参与项目的建设。

打造“计算超级工厂”

今年早些时候,马斯克开始致力于整合创建 xAI 所需的大量计算能力。 xAI是他于2023年创立的公司,并迅速成为人工智能领域的有力竞争对手。当时,马斯克已经从 租用了 GPU 来训练 xAI 大型语言模型 Grok 的初始版本。

为了进一步提高 Grok 的性能,马斯克迫切需要扩展计算资源。今年5月,他通过视频连线与潜在的xAI投资者进行了沟通,作为筹集数十亿美元资金的第一步。据一位出席会议的投资者透露,马斯克在会上描述了建造世界上最大的超级计算机的愿景,他将其命名为“计算超级工厂”,就像特斯拉在全球的庞大生产基地一样。 。

马斯克与 xAI 不到 12 人的团队围坐在一张桌子旁,详细介绍了他将 10 万个 H100(当时市场上最先进的 GPU)集成到超级计算机集群中的计划。屏幕上显示的图表清楚地表明,xAI 构建超级计算机的速度将比大多数企业快五倍。该公司正以“令人难以置信的速度”全速前进,并郑重承诺:“马斯克将亲自监督数据中心的按期交付。”

马斯克告诉投资者,他尚未就是否与云计算服务提供商合作或独立推进该项目做出最终决定。

几周后,几位甲骨文高管与马斯克召开视频会议,讨论第一个合作方案。据知情人士透露,马斯克向甲骨文提议,甲骨文为xAI打造一台超级计算机,此举将使这家人工智能初创公司成为甲骨文的重要客户之一。

孟菲斯电气设备制造商的工厂现已成为 xAI 超级计算机的所在地

马斯克原本希望将 xAI 数据中心选址在孟菲斯的前工厂旧址,并预计在 2024 年秋季顺利竣工。不过,据与会者透露,在一次电话会议上,甲骨文高管向马斯克承认,他们无法以马斯克预期的速度完成建设任务。

据知情人士透露,甲骨文高管指出,马斯克选择的大楼没有足够的电力来满足他计划安装的芯片数量的能源需求。马斯克很快就对甲骨文高管的反对感到失望和沮丧。最终,他决定让xAI放弃,独立开发孟菲斯数据中心。

马斯克在社交媒体上写道:“甲骨文无疑是一家伟大的公司……但当我们的命运取决于成为有史以来最快的公司时,我们必须掌舵,而不仅仅是后座上的乘客!”

打破规则,采用临时供电方案

马斯克敦促孟菲斯当地官员以前所未有的速度批准该建设项目,以便在预期时间内完成。孟菲斯也相当渴望满足马斯克的需求,以吸引他的生意,为这座城市带来发展机会。

大孟菲斯商会会长 Ted 在接受采访时表示:“我们日以继夜地加班加点,时刻接收短信和电话,努力展示与 xAI 及其期望相匹配的能量和效率”。

今年6月初,汤森公开宣布马斯克已选择孟菲斯作为xAI超级计算机的所在地。在接下来的几周里,马斯克和他在 xAI 的团队迅速拆除了孟菲斯的旧工厂,为 GPU 的机架腾出空间,并开始安装各种电气、机械和管道设备,并为服务器配备了先进的水冷系统。

然而,在如此快速的建设进度中,电力供应却成为了一大障碍。最初,孟菲斯工厂提供的电力根本无法满足 xAI 所有耗能 GPU 的需求。通常,这些类型的问题可能会导致数据中心项目脱轨或延迟。

但马斯克总能想出巧妙的解决方案:在等待地方当局批准他为该地点增加 100 兆瓦电力的请求时,他引入了移动天然气涡轮机作为临时补充。田纳西河谷管理局上周批准了他的请求。

马斯克对中国速度__马斯克损失

但马斯克的举动很快引发了当地环保组织的强烈反对。他们写信给当地卫生部门,指责xAI未经许可运行天然气涡轮机,造成严重的空气污染。一位在微软数据中心工作的高管也表示,考虑到微软在气候方面设定的目标和举措,该公司不可能做类似的事情。

南方环境法中心高级专职律师阿曼达·加西亚( )对田纳西河谷管理局的决定表示反对,她表示:“使用天然气涡轮机就像未经批准建造非法发电厂一样,令人震惊。毕竟,空气污染已经是一个巨大的挑战在孟菲斯西南部。”

然而,马斯克能够快速完成这个项目的背后可能还有其他因素。数据中心业务主管透露,在 xAI 开始使用这个超级计算机集群之前, 超级计算机可能不需要进行任何合规性测试。这主要是因为xAI计划将超级计算机专门用于自己的需求,而不是租赁给其他客户。

相比之下,微软在将服务器移交给或其他Azure云客户之前必须经过多项数据安全测试。这些客户通常希望服务器能够满足某些正常运行时间或隐私标准。

“我们必须通过所有这些不同的行业认证,”数据中心运营商首席执行官劳尔·马丁内克(Raul )说。 “我可以肯定地说,xAI 数据中心目前不会通过这些认证。”

马斯克建造“”超级计算机的努力确实遭到了很多质疑。几位数据中心高管认为,将制造工厂等建筑物改造成适合 GPU 服务器和液体冷却系统的设施极其困难。据两位与 xAI 员工交谈的人士透露,过去几个月,该设施的翻修工作多次中断。

但这些问题似乎并没有减缓 xAI 的速度。马斯克和英伟达表示,在第一批服务器机架进入数据中心仅 19 天后,他们就开始了下一代 Grok 模型的首次训练。

在最近的一次采访中,马斯克的密友安东尼奥·格拉西斯( )是他多家公司的长期投资者,他透露 xAI 正在重新思考构建数据中心的整个过程,“我们从最基本的原则开始。努力使其更经济、更高效、更快捷。”

格拉西斯继续说道:“我在特斯拉和特斯拉等公司看到过这种情况的发生。在这些公司中,马斯克是领导者,有数十名工程师在他的领导下共同努力,致力于开发出尽可能最好、最高效的系统。”

其他科技巨头正在迎头赶上

马斯克损失_马斯克对中国速度_

今年夏天,随着马斯克在超级计算方面取得显着进展的消息逐渐传开,来自亚马逊、微软和谷歌等巨头的数据中心高管致电英伟达,询问了同样的问题:马斯克是如何在超级计算机项目上取得成功的?已经取得这么快的进展了吗?

不仅如此,据与这些公司交谈过的人士透露,包括 meta 在内的其他公司的高管已经联系了一家小型云提供商,看看这些公司是否能够比自己更快地建设数据中心。速度给了他们所需的能力。

随着孟菲斯数据中心的信息不断被披露,这些公司越来越渴望揭开该项目成功的秘密。数据中心和云计算主管仔细研究该设施的图像,试图收集有关其设计的任何信息。

为了进一步满足公众的好奇心,马斯克在社交媒体平台 X 上发布了几张数据中心内部的照片。上个月,一位行业分析师还在 上发布了一段参观 设施后的视频。

xAI 孟菲斯数据中心内部

与此同时,在今年夏天与 xAI 的谈判破裂后,甲骨文迅速与 xAI 达成协议,提供计算能力。据悉,新数据中心将位于阿比林,为此,甲骨文已与初创公司和联合创始人签署了开发协议。

上个月,它成功筹集了超过30亿美元的资金,用于推进数据中心的初步建设。该数据中心将配备 10 万个 即将推出的新型 GPU,即 GB 200。

与马斯克在孟菲斯的项目一样,也有推动该项目快速完成的努力。 DPR 的 承担了该项目的建设工作,并表示这是他参与过的最快的建设项目之一。两家公司从 3 月份开始讨论数据中心的设计,并于 6 月份破土动工。

几周前,建筑工人每天忙着砍伐阿比林工地上的树木,为新发电站腾出空间,并尽快浇筑混凝土。据三位知情人士透露,为了确保电力能够按时输送到现场,项目合作伙伴已被要求考虑使用天然气涡轮机作为备用选项。

在最近的一次现场考察中,当被问及为什么数据中心的快速建设引起如此多的关注时,一位承包商回答说:“谁能更快地建造自己的超级计算机,几乎就能统治世界!” (腾讯科技专用编译器金鹿)

 
打赏
 
更多>同类资讯

0相关评论
推荐热播视讯

推荐视频

    Copyright © 2017-2020  二手钢材网  版权所有  
    Powered By DESTOON 皖ICP备20008326号-2