下载
登录/ 注册
主页
论坛
视频
热股
可转债
下载
下载

又一个deekseep!

25-09-01 00:41 359次浏览
坐在金矿上
+关注
博主要求身份验证
登录用户ID:
英伟达 H20 平替!阿里AI芯片--解析(附相关标的)

原创 Aiden硬科技行研 Aiden的硬科技行研

 2025年08月31日 20:35 广东

中国AI芯片的“天团”除了华为昇腾寒武纪 ,又多了阿里。8月29日,据华尔街日报, 阿里巴巴 通过旗下平头哥半导体公司研发了新一代AI推理芯片。这款芯片可兼容英伟达的CUDA生态,旨在填补英伟达GPU在中端市场受限后留下的空白。主要用来做AI推理,目前已经在测试中。此消息一出,8月31日,资本市场迎来震撼一幕——阿里巴巴美股盘前暴涨近13%,市值激增超3000亿元。

阿里在AI算力、大模型、达摩研究院、云服务应用上,一直保持巨大优势,如果补齐推理芯片这一短板,构建生态全栈能力,可谓如虎添翼。

今天我们就来解析国产替代,又一大厂脊梁--阿里平头哥的AI芯片。

一、平头哥基础知识扫盲

1、平头哥的诞生与寓意

平头哥:T-Head,全称,平头哥半导体有限公司,成立于2018年10月31日,是阿里巴巴全资半导体芯片业务主体。于2018云栖大会主论坛上,阿里CTO张建峰提出由阿里此前全资收购的中国唯一拥有自主嵌入式CPU IP Core的公司“中天微”与“达摩院”自研芯片团队合并而成。

其拥有端云一体全栈产品系列,涵盖数据中心芯片、IoT芯片等,实现芯片端到端设计链路全覆盖。是阿里在半导体领域长期布局与战略整合的必然选择,是从单点技术突破到全栈自主可控的生态闭环重构。

平头哥本身是“非洲草原一哥”--蜜獾 的别称,其个性是“生死看淡,不服就干”,是“世界上最无所畏惧的动物”。马云亲自拍板用该名字,让天猫、蚂蚁、菜鸟、飞猪…阿里动物园又多了一名新成员。

马云将半导体公司命名为“平头哥”,象征阿里巴巴做芯片业务的大胆投入、勇于拼搏的决心、和咬定青松不放松的信念。

2、公司产品的两条主线

平头哥的团队有两条研发主线,一边是利用ARM的IP为阿里云数据中心研发芯片,在云端提供普惠算力,也即现在的倚天系列和含光系列;

另一边集中在RISC-V处理器架构的研发,比如玄铁、羽阵系列,主要应用是在AIoT领域。

(1)翻越两座大山,开创RISC-V业务线:玄铁处理器IP、羽阵系列

一直以来,X86与ARM架构是两种主流的CPU架构,X86是主导桌面PC和服务器市场,ARM是主导移动设备手机和物联网硬件市场。是绝对的霸主。然而,X86和ARM是封闭授权模式,需支付高昂授权费(如架构授权费数千万美元,单芯片版税约1%-3%),指令集复杂,版本间兼容性差,厂商无法自由修改指令集。

于是,2010年,加州大学伯克利分校的David Patterson教授团队领导研发了RISC-V指令集,并宣布对外开源,任何企业、开发者都可以免费使用它。

平头哥的RISC-V业务线,就是在这样的背景下,翻越了X86与ARM这两座高山,发展起来,并且进展迅速,成为RISC-V技术全球生态的核心贡献者。

2019年7月,成立不到一年时间,平头哥便交出第一颗RISC-V处理器芯片玄铁910,比当时业界最好的RISC-V处理器性能高40%以上。随后不久,平头哥又发布面向AIoT的一站式芯片设计平台“ 无剑100 Open”提供集芯片架构、基础软件、算法与开发工具于一体的整体解决方案。

2022年11月云栖大会上,平头哥发布全新RISC-V高能效处理器玄铁C908,计算能效较业界同性能处理器提升超20%,更能满足低碳时代的算力需求,可用于智能交互、多媒体终端、AR/VR、无线通讯等AIoT场景。

平头哥凭借玄铁系列在RISC-V领域处于领先地位,并正在推动RISC-V从低功耗场景向高性能计算(如数据中心)渗透,试图构建一个不同于ARM和x86的第三极生态。

另外,针对智慧仓储物流和零售场景,平头哥于2021年的云栖大会上发布了羽阵600超高频RFID(射频识别)芯片,搭配羽阵600的电子标签已经在智慧物流 “周转循环箱”系统中实现应用。

2022年11月国际物联网展 (IOTE) 上,平头哥发布超高频 RFID 电子标签芯片 —— 羽阵 611 和羽阵 612。官方称两款芯片性能高、稳定性好、低功耗、可满足商超零售、智慧物流、资产管理等复杂场景下的高识别率要求。

   

(2)云端芯片提供算力:倚天和含光系列

2021年10月的云栖大会上,平头哥发布了基于ARM架构的首款自研云芯片“倚天710”。这标志着其正式攻入高性能服务器CPU这一核心领域,为阿里云“一云多芯”战略提供了坚实的技术底座,旨在摆脱对单一芯片架构的依赖。

① 倚天710: 通用服务器芯片

21年发布,采用5nm工艺兼容ARM v9服务器CPU,128核CPU,2.5D封装,实现多DIE合封,集成8通道DDR5内存,最高速率4400MT/s,峰值总带宽 281GB/s。专为阿里云数据中心设计,满足高性能、低功耗计算需求,还可用于视频编解码、提升云服务性价比。

② 含光800 :AI推理芯片

“含光”,寓意含而不露,光而不耀,于2019年发布。是阿里第一颗数据中心芯片,也是一颗高性能AI推理芯片。

采用12nm制程工艺,集成170亿晶体管,性能峰值算力达820 TOPS。其自研神经网络处理器(NPU)架构为AI推理专门定制和创新,包括专有计算引擎和执行单元192M本地存储(SRAM)以及便于快速存取数据的核间通信,从而实现了高算力、低延迟的性能体验。

含光800支持主流的深度学框架,包括TensorFlowMXNet、Caffe、ONNX等。在ResNet-50测试中,推理性能达到78563 IPS,能效比500 IPS/W,性能远超同期同类产品。主要用于云计算服务、视觉场景,如城市大脑 、电商智能搜索等,并通过阿里云对外输出AI算力。

③ 镇岳510:企业级SSD主控芯片

是平头哥自研的一款高性能PCIE Gen5 企业级SSD主控芯片,提供PCle Gen5 x 4接口,支持1xxL/2XXL TLC/QLC NAND Flash;支持NVME1.4b规范,支持ZNS接口协议;支持多流、原子写、10虚拟化等多种企业特性; 全路径支持E2E Data Protection;支持热插拔,满足云上各种业务应用场景;同时提供高可靠性。

适用于高性能分布式存储、高性能数据库、OLTP/OLAP、高性能AI应用、大数据分析等业务场景。

3、此AI芯片名称与定位

官网中未明确提及这款新AI芯片的具体名称,但平头哥在2019年曾发布云端AI推理芯片含光800,新一代产品可以看作是它的升级版或新工艺。基于前几代 “含光” 系列迭代,我们暂时假设命名为“含光X”(网上有传内部代号为 “倚天 700+”,但官方暂未公布证实)。

该芯片聚焦云侧推理,而不是训练芯片,预计会采用7nm工艺,实际性能应该和华为早期昇腾910B差不多,目标替代英伟达 H20(中国市场售价$2.8万/片,阿里芯片定价$1.9 万 / 片,成本低 32%)。

4、该芯片的三处强大之处

(1)兼容CUDA优势

英伟达高端GPU对华出口受限,让中国AI企业面临“缺芯”的困境。国产芯片的自主可控迫在眉睫。阿里这颗新芯片能完美兼容英伟达CUDA生态,这意味着开发者无需重新编写代码,就能将原本在英伟达芯片上跑的模型迁移到新芯片上,开发者迁移项目的学成本和修改代码的时间能节省70%以上,降低了国产芯片的使用门槛。

(2)精准定位AI推理场景

首先训练芯片:是专注于构建复杂的神经网络模型,通过大量数据迭代调整参数的,需支持FP32/FP64等高精度计算,大规模并行计算和高带宽存储,成本高昂(如英伟达A100售价20万元/张),单芯片功耗高,部署成本高,需多卡集群协同。

而推理芯片不同,它是基于训练好的模型,快速处理新数据并输出结果,注重低延迟、高能效比和低成本。通常采用低精度计算(如INT8、FP8),优化前向传播流程。需兼顾功耗、成本和实时性。广泛应用于云端、边缘端推理和直接嵌入终端设备(如手机NPU、自动驾驶汽车)。

平头哥的这款AI芯片,它主要针对AI推理场景。与华为昇腾910C,侧重训练+推理。寒武纪思元600,侧重边缘推理不同,“含光X” 聚焦云侧推理场景,特别是云计算、模型部署后的实际应用场景,比如智能客服、语音助手、AI搜索,都是推理场景。目前占中国AI芯片需求约70%,推理需求巨大,直接对标英伟达H20。

(3)供应链自主:

过去阿里的芯片是靠台积电 代工,现在受限于美国芯片管制,台积电不能再用先进制程给中国企业做AI芯片。阿里这次完全依靠国内代工厂,但这些厂商的产能有限,工艺水平也和国际顶尖有差距。

新芯片由国内代工厂生产(如中芯国际 多重曝光实现7nm、长江存储的14nm工艺),减少了对海外先进制程的依赖,供应链风险显著降低。

5、与华为昇腾、寒武纪的比

在国产AI芯片赛道,华为昇腾和寒武纪曾是"双龙头",但阿里“含光X”的登场将彻底改写竞争规则。

如果华为走的是“全能六边形战士”路线,不依赖别人,从架构到芯片、再到系统和生态,全栈自己掌握,是全村的希望。寒武纪是AI特种兵,专攻AI芯片,思元和MLU系列主打推理与训练市场;那阿里的策略是一边兼容英伟达的CUDA生态,一边推进自主突围。三者比较如下:

维度

   “含光X”

华为昇腾910B寒武纪思元590定位两面能手:专注AI推理,更通用架构,支持广泛任务,兼容cuda生态,便于开发者迁移全面战士,训推一体(训练+推理),适用于云端和边缘计算AI特种兵,专用AI加速,训推一体,注重云端训练,性能接近英伟达A100的80%工艺预计为中芯国际 7nm台积电7nm(受美国制裁)中芯国际14nm生态兼容全兼容英伟达CUDA,迁移成本低仅支持华为昇腾CANN,需重写代码部分兼容CUDA依赖第三方适配优&缺优:专注AI推理(模型部署后高效计算);缺:更多内部使用,训练能力弱256TOPS(INT8)110TOPS(INT8)应用场景云计算、智能客服、AI搜索等推理政府、金融、银行事业单位、大B算力中心边缘计算(安防无人机、自动驾驶等

二、产业链&相关标的

阿里平头哥是一家Fabless公司,专注于芯片的研发与设计,而将制造、封装、测试等环节外包完成。是产业链涉及上中下游多个环节。

上游:包括EDA软件、芯片的设计、RISC-V 架构IP授权;中游:为芯片的生产、代工与封测,下游:是生态应用和系统集成。

1、上游

上游是芯片设计与IP授权,是技术壁垒极高的环节。包含EDA和RISC-V 架构IP授权等。

EDA(电子设计自动化):芯片设计离不开EDA工具,这被誉为“芯片之母”。平头哥与新思科技 (Synopsys)、铿腾(Cadence)等国际EDA巨头保持紧密合作,同时积极拥抱国产EDA力量,与华大九天 、合见工软等本土企业展开合作,共同攻克RISC-V芯片在AI等复杂场景下的验证挑战。

平头哥自主研发了玄铁系列RISC-V处理器IP(如C910、C930)和羽阵系列SoC芯片。其他合作企业如下:

① 华大九天:国产EDA绝对龙头,在全球市场中,该领域长期被新思科 技、楷登电子和西门子EDA三巨头垄断。而华大九天作为国内最早从事EDA研发的企业之一,经过多年发展,已成为国内规模最大、技术实力最强的EDA企业,市场份额占比约6%,华大九天预计为平头哥及生态伙伴提供设计工具支持。

② 全志科技 :国内领先的智能应用处理器SoC设计厂商,与阿里平头哥联合开发全球首款量产RISC-V芯片“D1”,应用于智能家居 、工业视觉等领域,下一代车载芯片集成RISC-V NPU单元。

 润和软件 :基于平头哥玄铁C910芯片推出“曳影1520”,适配智能驾驶和工业控制,子公司润开鸿入选玄铁“优选伙伴”。

 ④ 芯原股份 :作为中国RISC-V产业联盟理事长单位,为平头哥提供RISC-V GPU IP及一站式设计服务,覆盖汽车电子、AIoT等领域。

2、中游

中游为芯片的生产、代工与封测,芯片制造是国内半导体产业发展的关键。

这里只做简单介绍,之前梳理过,是近3w的阅读量,具体请看行业的基石!半导体8大设备:全解析(附全球Top10榜&细分标的)

以下是该环节的核心标的:

① 中芯国际:国内最大代工厂,承接阿里平头哥AI芯片订单,14nm工艺良率超90%,预计代工阿里新一代兼容英伟达架构的AI芯片。

华虹公司 :全球第五大、国内第二晶圆代工厂,专注于成熟制程(55nm及以上),技术覆盖嵌入式存储、功率器件等领域。

长电科技 /通富微电华天科技 :这三家公司是国内封装测试的龙头,预计承担阿里平头哥AI芯片的封测,采用SIP和3D封装技术。

利扬芯片 :为玄铁系列芯片提供核心测试服务,覆盖含光800云端训练芯片的三温测试,与阿里达摩院合作开发AI芯片自动化测试平台。

3、下游

阿里芯片的下游是算力生态应用和系统集成,相关企业如下:

数据港 :阿里云IDC核心供应商,承担60%算力基建,液冷技术领先,承建超20个数据中心,阿里相关业务占营收80%以上。

浪潮信息 :阿里云AI服务器主供商,液冷技术使PUE降至1.1以下,预计拿下阿里新增机柜50%以上订单。

润泽科技 :为阿里云建设智算中心,签订10年长约锁定1万P算力资源,全浸没式液冷方案适配高功率AI芯片。

④ 软通动力阿里云战略级技术服务商,深度参与AI 芯片数据中心架构设计与运维,覆盖云计算、AI全链路服务。其为阿里云定制的云管理平台,已支撑超百万企业级用户数字化转型。

4、RISC-V生态与其他受益标的

旋极信息 :阿里玄铁C930芯片独家代理商,联合开发低功耗物联网SOC平台,计划3年出货5000万颗。

乐鑫科技 :RISC-V内核WiFi MCU全球市占率领先,与阿里合作推出支持星闪技术的AI开发平台,2025年发布的ESP32-C6芯片集成RISC-V双核,AI算力提升200%。

中际旭创 :阿里云800G光模块主力供应商,1.6T产品已通过验证,2025年光模块出货量同比增长300%。

以上是不完全列举。

三、总结与展望

2025年8月,国家提出“人工智能+”的政策指导,在智算新纪元的今天,阿里平头哥以“端云一体”之姿,成为中国AI芯片领域的一柄利剑,突破“无人区”。

它凭借玄铁RISC-V处理器在开源生态开疆拓土,借力含光系列在云端推理市场破局而立,更以软硬协同的创新架构直面国际巨头。这条崛起之路,既是阿里巴巴“云芯协同”战略的深远布局,更是中国半导体产业自主化的一次艰难攀登。

展望前路,平头哥正站在时代的关键节点。一方面,它承载着RISC-V架构进军高性能计算的历史使命,试图在Arm与x86的垄断铁幕中撕裂一道缺口;另一方面,其兼容CUDA的生态策略正降低产业迁移门槛,为国产算力替代开辟通途。然而面对核心制程受限、生态建设维艰,仍需以长期主义穿越周期。

山海虽远,行则必至。阿里平头哥正以 “兼容 -- 替代-- 超越” 之路打破英伟达垄断。

平头哥作为我国AI芯片的天团,其征程不仅是一家企业的创新突围,更是我国在智算时代争取技术主权的深刻注脚。

期待国产AI芯片的一路繁花!
打开淘股吧APP
1
评论(0)
收藏
展开
热门 最新
提交