你敢信?大过年的,豆包居然“撂挑子”了。
视频通话功能直接暂停,页面上写着“新春人数较多,暂不支持”。话是说得挺客气,但明眼人都懂——算力被干爆了,服务器扛不住了。
这事儿放在2026年开年,其实特别有象征意义。
除夕那天豆包多猛?19亿次AI互动,峰值633亿 tokens/分钟。看着是字节又秀了一把肌肉,但背后的真相是:用户冲进来了,算力没跟上。 这就好比你家门口排了1000个人等着吃饭,结果后厨只有两个灶,老板只能出来鞠躬说“今天打烊了”。
我一直有个观点:前几年大家吹AI,吹的都是训练、是参数、是刷榜,那是“实验室逻辑”。真正考验实力的,是C端用户涌进来那一刻——几亿人同时点开对话框,哪怕就是聊个天、生成个表情包,那才是对算力最真实的“压力测试”。
豆包这次暂停功能,恰恰印证了一件事:推理侧的算力缺口,比我们想象的还要疯。 腾讯、阿里春节也没闲着,都在抢流量、抢入口。2026年的AI战,打的是巷战,拼的是后勤——说白了,就是算力。
智谱 这波操作,把国产芯片拉上了牌桌
就在这个节骨眼上,智谱搞了个大新闻。
2月12号凌晨发的GLM-5,模型本身确实能打,Coding和Agent能力都怼到了开源SOTA,体感上快追上Claude了。但我更在意的不是参数,是他们甩出来的那份合作伙伴名单:
华为昇腾、
摩尔线程 、
寒武纪 、昆仑芯、沐曦、燧原、
海光信息 。
七家国产芯片,全量适配,而且是算子级的优化。
懂行的都知道,这事儿的含金量在哪。以前国产芯片和大模型之间,总隔着一层“窗户纸”——你跑你的,我训我的,生态各玩各的。智谱这次相当于硬生生把这层纸捅破了。国产大模型终于不再是只吃“细粮”的娇贵主,而是能靠着国产“粗粮”集群,跑出高吞吐、低延迟的稳定运行。
这背后其实是“逼上梁山”。
英伟达 的卡虽好,但买不到、太贵、还得看人脸色的日子,谁都不想再过。GLM-5主动去适配这些芯片,不是做慈善,是在提前占坑,把国产算力链条从“能用”往“好用”的方向推。
谁在闷声发财?
别只盯着做应用的,真正赚钱的,还是那些“卖铲子”和“修路”的。
海光信息
这家公司最近走得挺稳。我看过一些数据,他们的C86架构在
SPEC Cloud测试里破了国产纪录,扩展性拉到91%以上。这意味什么?意味着在云上跑大规模
AI应用,它不再是短板。以前推它,可能是因为“国产替代”的故事,现在是因为性能真的跨过了“能用”到“好用”那条线。研发人员占比91%,七百多项专利,这技术壁垒不是吹的。在国产芯片圈子里,海光已经是绕不开的名字了。
中科曙光 这家动作更大,直接甩出80亿的再融资计划,全砸向AI算力集群、训推一体机和国产化存储。他们看得明白:未来的算力不是卖盒子,是卖“系统”。搞的那个scaleX640超节点,能把芯片到整机的链路打通,甚至把CPU、GPU、NPU统一管起来。这种“通吃”的策略,在当前算力碎片化的阶段,杀伤力很强。下游客户懒得自己折腾,谁给我开箱即用、性能拉满,我就用谁。中科曙光手里还握着中科院的资源,这步棋走得挺稳。
寒武纪
这家最近股价有点颠,甚至因为一篇“小作文”就跌了不少。我觉得这反而是个观察点。市场这么敏感,说明大家对国产芯片的预期太高了,高到有点风吹草动就慌。但换个角度看,寒武纪、摩尔线程、沐曦这批公司密集上市和适配,恰恰说明牌桌上的人越来越多了。以前只有寒武纪一个人在台上独舞,现在是一群人同台竞技。竞争当然激烈,但也意味着整个国产芯片的生态开始百花齐放,不再是单押一支票。
一点个人看法
豆包暂停功能这事儿,其实是个信号。2026年,AI应用会像潮水一样涌过来,但算力这座“发电厂”要是跟不上,再好的应用也得断电。
所以我的判断是:国产算力链的行情,才刚走过上半场。 上半场讲的是“我们有什么芯片”(比如海光信息、寒武纪),下半场讲的是“这些芯片怎么组成网络、怎么稳定跑应用”(比如中科曙光的集群能力、智谱的适配能力)。
也别只盯着GPU,存储这块同样重要。
闪迪 、美光这些海外大厂虽然涨价凶,但国产替代的
香农芯创 、做上游材料的
华正新材 、
德福科技 ,这些“卖水人”的订单只会越来越满。还有做
云计算落地的
首都在线 、
优刻得 ,他们承接着那些买不起整柜服务器、但又想用AI的中小公司,流量生意才刚开始。
说到底,这波浪潮的核心逻辑就一句话:应用倒逼算力,算力倒逼硬件。 而国产硬件,终于等到了属于自己的“黄金时代”。