全球最实用的IT互联网信息网站!

AI人工智能P2P分享&下载搜索网页发布信息网站地图

当前位置:诺佳网 > AI人工智能 > AI通用技术 >

AI服务器异构计算深度解读

时间:2024-04-12 12:27

人气:

作者:admin

导读:AI服务器异构计算深度解读-AI服务器按芯片类型可分为CPU+GPU、CPU+FPGA、CPU+ASIC等组合形式,CPU+GPU是目前国内的主要选择(占比91.9%)。...

服务器随着场景需求经历通用服务器-云服务器-边缘服务器-AI服务器四种模式,AI服务器采用GPU增强其并行计算能力;AI服务器按应用场景可分为训练和推理,训练对芯片算力的要求更高,根据IDC,随着大模型的应用,2025年推理算力需求占比有望提升至60.8%;

AI服务器按芯片类型可分为CPU+GPU、CPU+FPGA、CPU+ASIC等组合形式,CPU+GPU是目前国内的主要选择(占比91.9%);AI服务器的成本主要来自CPU、GPU等芯片,占比25%-70%不等,对于训练型服务器其80%以上的成本来源于CPU和GPU。

据ARK Invest预测,Chat GPT-4参数量最高达15000亿个,由于参数量与算力需求间存在正比关系,所以可推算GPT-4算力需求最高达到31271 PFlop/s-day。随着国内外厂商加速布局千亿级参数量的大模型,训练需求有望进一步增长,叠加大模型落地应用带动推理需求高速增长,共同驱动算力革命并助推AI服务器市场及出货量高速增长。

美国对中国禁售英伟达高性能芯片A100和H100,英伟达特供中国的削弱互联带宽的版本A800或为当前可替代方案;

以海光信息、壁仞科技等为代表的国产GPU部分单卡指标接近英伟达,在推理场景中具有一定竞争力;国产AI服务器厂商全球份额超35%,浪潮信息位列榜首;国产AI服务器厂商各具优势,有望受到下游需求拉动。

本文来自“大模型算力:AI服务器行业(2023)”。关于CPU、服务器和存储详细技术,请参考“更新下载:存储系统基础知识全解(终极版)”、“存储芯片技术基础知识介绍(2023)”等等。

eb32b930-f882-11ee-a297-92fbcf53809c.png

eb3fa546-f882-11ee-a297-92fbcf53809c.png

eb45f518-f882-11ee-a297-92fbcf53809c.png

eb68f48c-f882-11ee-a297-92fbcf53809c.png

eb854fa6-f882-11ee-a297-92fbcf53809c.png

eb9593e8-f882-11ee-a297-92fbcf53809c.png

eba27914-f882-11ee-a297-92fbcf53809c.png

ebac151e-f882-11ee-a297-92fbcf53809c.png

ebbc3020-f882-11ee-a297-92fbcf53809c.png

ebce3072-f882-11ee-a297-92fbcf53809c.png

ebde4aa2-f882-11ee-a297-92fbcf53809c.png

ebe296b6-f882-11ee-a297-92fbcf53809c.png

ebeacfd4-f882-11ee-a297-92fbcf53809c.png

ebfa7d58-f882-11ee-a297-92fbcf53809c.png

ebfed146-f882-11ee-a297-92fbcf53809c.png

ec10cc20-f882-11ee-a297-92fbcf53809c.png

ec1f4e1c-f882-11ee-a297-92fbcf53809c.png

ec2ca210-f882-11ee-a297-92fbcf53809c.png

审核编辑:黄飞

温馨提示:以上内容整理于网络,仅供参考,如果对您有帮助,留下您的阅读感言吧!
相关阅读
本类排行
相关标签
本类推荐

CPU | 内存 | 硬盘 | 显卡 | 显示器 | 主板 | 电源 | 键鼠 | 网站地图

Copyright © 2025-2035 诺佳网 版权所有 备案号:赣ICP备2025066733号
本站资料均来源互联网收集整理,作品版权归作者所有,如果侵犯了您的版权,请跟我们联系。

关注微信