2025世界人工智能大会(WAIC)将于7月26日至28日在上海启幕。华为昇腾384真机亮相,性能碾压英伟达 GB200华为在本次的展区面积超过 800平方米,将首次线下展出昇腾 384超节点真机。
华为的AI算力集群解决方案CloudMatrix 384,基于384颗异腾芯片构建,通过全互连拓扑架构实现芯片间高效协同,可提供高达300 PFLOPs的密集BF16算力,接近达到英伟达GB200 NVL72系统的两倍。此外CM384在内存容量和带宽方面同样占据优势,总内存容量超出英伟达方案3.6倍,内存带宽也达到 2.1倍,为大规模 AI训练和推理提供了更高效的硬件支持。按照国外投行的说法,华为的规模化解决方案“领先于英伟达和 AMD目前市场上的产品一代”,并认为中国在 AI基础设施上的突破将对全球 AI产业格局产生深远影响。
华为昇腾384超节点真机首秀:中国AI算力“核爆点”来了华为将首次在线下展出昇腾384 超节点真机。这一技术成果不仅实现了业界规模最大的384 卡高速总线互联,更标志着国产 AI 算力基础设施迈入全新发展阶段。昇腾 384 超节点通过 384 颗昇腾芯片构建全对等架构超级计算单元。
昇腾384 超节点采用创新的全对等高速互联架构,打破了传统服务器以 CPU 为核心的冯诺依曼架构局限。依托新型高速总线 MatrixLink 技术,该超节点实现了 384 张芯片间 2.8T 超大带宽的纳秒级时延无阻塞互联,较传统以太网络通信效率提升 15 倍,时延降低 10 倍。这种架构设计让整个计算集群如同单一高效的计算单元,为大规模分布式训练和推理任务提供了强大支撑。
在算力规模方面,昇腾384 超节点可提供 300 PFLOPs 的密集 BF16 算力,接近英伟达 GB200 NVL72 系统的两倍。通过创新的内存池化技术 EMS,其总内存容量达到英伟达方案的 3.6 倍,内存带宽达 2.1 倍,有效缓解了大模型训练中的 "内存墙" 瓶颈。以 MoE(混合专家模型)训练为例,昇腾 384 的算力利用率从业界平均 30% 提升至 41%,实验室环境下更是超过 45%,资源利用效率提升超 50%。
虽然单颗昇腾芯片性能约为英伟达Blackwell 架构 GPU 的三分之一,但凭借系统级工程创新,昇腾 384 在整体效能上实现了超越。
国际分析机构 SemiAnalysis 报告指出,昇腾 384 的系统级性能已 "领先英伟达和 AMD 当前产品一代",具体优势体现在:推理效能:在DeepSeek-R1 推理测试中,昇腾 384 单卡吞吐达到 2300 TPS,与英伟达 H100 水平相当,系统级效能更具领先性;
内存能力:3.6 倍于英伟达方案的内存容量和 2.1 倍的带宽,使其在处理 7180 亿参数的 MoE 大模型时仍能保持高效运行;
成本与扩展灵活性:相比英伟达GB200 NVL72,昇腾 384 通过规模化系统设计降低了对单卡性能的依赖,同时支持扩展至数万卡的 Atlas 900 SuperCluster 集群,为未来模型发展提供弹性算力支撑。
华为在昇腾生态构建上持续深耕,通过分层开放 CANN 架构和全栈工具链降低开发者迁移门槛。
在 2025 开发者大会上,昇腾发布了一系列开发者支持工具:
CATLASS 算子模板库:提供细粒度运行时接口,助力开发者高效定制算子;
MindIE Motor 推理服务加速库:将单卡推理吞吐提升至传统服务器堆叠方案的4 倍,超节点结合大 EP 方案性能达到业界4倍水平;
核心技术开源:计划开放FlashComm 通算优化、四流并发掩盖等核心技术,推动生态协同发展。
截至2025 年 5 月,昇腾生态已汇聚超过 665 万开发者和 8800 家合作伙伴,完成 23900 多个解决方案认证,逐步形成从芯片到行业应用的完整生态闭环。
国际机构评价认为,昇腾384 的系统级创新标志着中国在 AI 基础设施领域已具备与国际巨头正面竞争的能力,其规模化解决方案将对全球 AI 产业格局产生深远影响。英伟达CEO 黄仁勋曾评价昇腾 384"在性能上超越了英伟达",这一认可虽然是客气,但是在某种程度上讲也是一种褒奖。
华力“算力核弹”昇腾384超节点在超越英伟达 NVL72的同时,功耗也达到后者的4.1倍。华为384昇腾超节点目前最大的问题在于能耗过大,配套电源亟需升级扩张;
泰嘉股份 深度绑定华为服务器电源、受益384昇腾超节点电源升级需求,并且子公司雅达电子提供系列电源模块的代工生产。
上周五,
麦格米特 早上一字,下午
恒为科技 、
直真科技 两个拉涨停,对超预期的华为昇腾384超节点,
下周是绕不开的。
主要是因为多方数据测算AI服务器电源价值量大幅超预期,数据中心电源价值量得以重估。相关个股:麦格米特、泰嘉股份、
朗科科技 、恒为科技、直真科技、
天源迪科 等。
泰嘉股份是华为昇腾910C及 CloudMatrix 384超节点服务器电源模块的独家代工厂,承担核心供电系统的设计、制造与扩产任务,深度绑定华为昇腾AI(昇腾384超节点)算力基础设施。(风险提示:所有的逻辑挖掘,仅代表个人见解或个人买卖记录,不代表市场看法,不要做为自己买卖依据,风险须自控自负自担!)
$泰嘉股份(sz002843)$$麦格米特(sz002851)$$恒为科技(sh603496)$$直真科技(sz003007)$$朗科科技(sz300042)$