全球最实用的IT互联网信息网站!

AI人工智能P2P分享&下载搜索网页发布信息网站地图

当前位置:诺佳网 > AI人工智能 > AI通用技术 >

千亿美元打造一个系统,成本越来越高的AI超算

时间:2024-04-09 00:19

人气:

作者:admin

标签: AI 

导读:电子发烧友网报道(文/周凯扬)从近年来新发布的超算机器和新的HPC AI性能榜单可以看出,AI算力已经在超算中成了不可忽视的性能指标之一,但也为厂商带来了更大的成本挑战。比如...

电子发烧友网报道(文/周凯扬)从近年来新发布的超算机器和新的HPC AI性能榜单可以看出,AI算力已经在超算中成了不可忽视的性能指标之一,但也为厂商带来了更大的成本挑战。比如微软近期就爆出和OpenAI合作,打造一个千亿美元级别的超算系统。

千亿美元打造AI超算

根据外媒报道,此次打造的千亿美元超算系统名为Stargate,星门。这一超算系统仅仅只是微软和OpenAI一系列数据中心合作项目之一,但造价已经高到离谱了。从规模上看,这个超算的硬件配置已经到了远超现有系统的程度。据爆料,星门将集成百亿个最新的英伟达GPU,造价可能会达到1150亿美元。不过在互联方案上,微软可能会跳过英伟达的InfiniBand专用方案,而采用更加通用以太网方案。

当然了,虽然总成本较高,但微软并没有一次建成的部署策略,而是分拆成五个阶段,整个项目在2028年成功建成。这样可以尽早让该系统投入使用,毕竟对于新的模型而言,率先发布才不会错失市场机会。这或许也与微软采用通用的以太网方案有关,毕竟面对跨度如此长的方案而言,专用方案很可能会面临被兼容性差和被淘汰的局面。微软预计会在第四阶段,也就是2026年左右,正式启用这一超算系统。

除此之外,超算的部署地点依然待定,这无疑与部署地的电网供电能力息息相关,当地政府如果能提供支持自然最好。不过从硬件规模来看,单系统的耗电已经达到千兆瓦级,无论是对美国哪个州而言,都是巨大的供电挑战。也正因如此,微软正在考虑核能在内的其他替代能源方案。

超算部署成本发生的变化

时至今日,微软已经在OpenAI上花了130亿美元,使用其数据中心来为ChatGPT之类的应用提供硬件支持。但此次的星门项目更是规模浩大,这也说明了新模型的训练和推理,仍在对数据中心的硬件提出新的要求,需要用性能更强的AI超算来解决。

但这并不意味着普遍的超算成本真的有这么夸张的变化,要知道目前TOP500上排名第一的超算Frontier,其成本也只有6亿美元。对于科研专用的单个超算系统而言,虽然造价不算低,但在政府的科研经费支持下,研究机构还是可以负担起的。

不过值得注意的是,TOP500上的超算都有公开的跑分成绩,为了实现这样的成绩,需要一定时间的优化,再运行一段时间的测试才会有此成绩。而市面上,尤其是在不少大型互联网公司内部,也存在并没有公开提交成绩的超算,因为这类系统几乎是从诞生起就被投入商业使用了。

所以市面上肯定有超过6亿美元的超算系统,比如Meta就在几个月前打造了两套系统,分别集成了2万个H100 GPU,总成本在10亿美元以上。其他的互联网公司,诸如国内的百度、腾讯等,想必也有庞大的硬件购买计划。

写在最后

随着HPC与AI在需求和计算负载上的融合,市场趋势从前几年的“带AI功能的HPC系统”变成了“同样可以用于HPC的AI系统”。但从其规模来看,对于HPC市场也未尝不是一件好事,毕竟目前AI超算的商业价值更高,能够吸引到更多的投资和补贴,也有望进一步推动HPC硬件的革新速度。

温馨提示:以上内容整理于网络,仅供参考,如果对您有帮助,留下您的阅读感言吧!
相关阅读
本类排行
相关标签
本类推荐

CPU | 内存 | 硬盘 | 显卡 | 显示器 | 主板 | 电源 | 键鼠 | 网站地图

Copyright © 2025-2035 诺佳网 版权所有 备案号:赣ICP备2025066733号
本站资料均来源互联网收集整理,作品版权归作者所有,如果侵犯了您的版权,请跟我们联系。

关注微信