下载
登录/ 注册
主页
论坛
视频
热股
可转债
下载
下载

国产算力拼图:华丰科技、华工科技、海光信息、寒武纪、芯原股份各卡哪一环?

26-06-29 20:46 38次浏览
股散打
+关注
博主要求身份验证
登录用户ID:
高速互连,算力集群的“毛细血管”与“神经末梢”

为什么要聊高速互连?

咱们聊算力,过去这两年,目光几乎全被GPU吸走了。谁家在卷算力、谁家在堆HBM带宽、谁家的制程又往前推了一步。

但有一个问题一直摆在那儿:芯片算力上去了,数据怎么在芯片之间、在服务器之间、在机柜之间跑得通、跑得顺?

这就涉及到高速互连。

算力集群不是一堆芯片简单堆在一起就行。几百张卡并行跑一个模型,卡与卡之间要频繁交换梯度、同步参数。带宽不够,卡再多也是干瞪眼。打个比方:CPU/GPU是算力集群的“心脏”,那高速互连就是“毛细血管”和“神经末梢”,负责把数据和指令精准快速地送到每一个计算单元。

高速互连,到底在解决什么问题?

咱们把场景拆开看。

第一个场景:芯片内部。 一颗芯片上几十亿个晶体管,信号要在不同模块之间传递。这个层面的互连,考验的是芯片设计能力和EDA工具。

第二个场景:芯片之间。 多颗芯片封装在一个基板上,比如英伟达的Grace Hopper、AMD的MI300 ,都是CPU+GPU合封。芯片之间的互连带宽和延迟,直接决定了整个模组的有效算力。

第三个场景:服务器内部。 GPU卡插在服务器上,卡与卡之间通过背板连接器、光模块、铜缆互连。华丰科技 做的224G高速背板连接器,就落在这个层面。

第四个场景:服务器之间。 数据中心里几百上千台服务器互联,靠的是交换机和光模块。华工科技 做的800G光模块,就是干这个活的。

所以你看,高速互连不是一个单一产品,是一整套从芯片到机柜的物理层解决方案。每一层都有不同的技术路线和玩家。

连接器,容易被忽视的“卡脖子”环节

连接器这东西,听起来不性感,但门槛不低。

高速背板连接器,是要装在服务器机箱背板上,连接各个板卡的。信号频率越高,对连接器的插损、回损、串扰要求就越苛刻。224G速率下,信号的电气特性已经非常敏感,连接器的结构设计、材料选型、加工精度任何一个环节出偏差,信号就畸变了。

这个领域以前是海外厂商主导,华丰科技是少数在224G速率上能拿出量产产品的国内企业。加工精度干到±0.01毫米,这不是简单靠设备堆出来的,需要的是对材料热膨胀系数的控制、对注塑和冲压工艺的反复迭代。

光模块与光芯片,自主化走到哪一步了?

光模块这边,技术迭代的逻辑比较清晰:速率越来越高,功耗越来越低。

400G到800G,再到1.6T,每一代都在卷更高速率的激光器、更精密的调制方案、更低功耗的DSP。

华工科技的800G LPO方案,把功耗压了一截。LPO的核心思路是去掉DSP,用线性驱动技术来补偿信号损耗。少一颗芯片,功耗自然下来。当然这对光模块的设计和测试能力要求更高——没有DSP帮你修正信号,所有链路预算都得靠模拟前端硬扛。

光芯片是另外一个话题。光模块的成本构成里,光芯片占了三四成。高端光芯片之前也依赖海外,华工科技在光芯片上做了自研布局,虽然高端电芯片还是海外为主,但光芯片的自主化至少让供应链多了一层安全保障。

CPU、DCU、AI芯片的算力底座

高速互连把数据通路打通了,但最核心的计算任务,还得落在处理器上。

海光信息 走的是x86路线。这个路线的优势在于生态兼容性——大量的服务器软件、开发工具、操作系统都是基于x86架构的。海光的CPU在信创市场拿了不少份额,金融、电信、政府这些对信息安全 要求高的行业,采购量一直在释放。

DCU(深度计算处理器)是海光的另一条腿。深算二号已经在跑,面向AI训练和推理。DCU的优势在于跟主流AI开发框架的适配做得比较顺,客户迁移成本低。对很多国产算力用户来说,CUDA生态的替代是个难题,海光的DCU在这块解决了一部分问题。

寒武纪 是另一条技术路线。他们从第一天起就做自有架构,思元系列的AI加速卡在云端推理和训练场景都有布局。自有架构的好处是可以在特定AI负载上做深度优化,能效比有优势。但挑战也很明显——生态得从头建,开发工具链、框架适配、开发者社区都需要时间积累。

这两家公司代表了国产算力芯片的两种路径:一个借力成熟生态快速落地,一个自建架构追求长期能效优势。没有绝对的好坏,只是在不同阶段、不同场景下各有适用。

IP,卖铲子的人

最后聊一下芯原股份

前面说的几家都是做芯片卖给客户的,芯原卖的是IP,也就是芯片设计的底层模块。

比如某家公司想设计一颗AI芯片,但不想从头写NPU(神经网络处理器)的代码和电路,那就直接买芯原的NPU IP授权,拿回来集成到自己的芯片里。

这个模式的好处是轻,不承担库存风险,不用跟晶圆厂博弈产能。坏处是规模不容易做大,IP授权费有天花板,定制设计的项目制收入也有周期波动。

但芯原的卡位确实特殊。国产算力链条不管哪家跑出来,只要用了他们的IP,他们就能吃到一块蛋糕。卖铲子的人,不直接参与淘金,但淘金的人越多,铲子越好卖。

大概这么个格局

高速互连和国产算力,不是一个单一赛道,是一个技术栈:

· 连接器:华丰科技,224G高速背板
· 光模块:华工科技,800G LPO方案
· CPU/DCU:海光信息,x86生态+AI加速
· AI芯片:寒武纪,自有架构训练推理
· IP:芯原股份,底层设计授权

各自卡的位置不同,技术路线和客户结构也不同。唯一的共同点是:都指向同一个方向——国产算力基础设施的自主化在往前推。

至于技术路线最终谁能跑得更远,那是产业竞争的事,不是一篇文章能下结论的。

免责声明:本文仅为产业技术与公开信息梳理,不构成任何投资建议。不持有相关仓位。市场有风险,请自行判断。
打开淘股吧APP
0
评论(0)
收藏
展开
热门 最新
提交