0
字节漫剧赛道日耗峰值达到3000万,行业高景气度有望延续。
0
AI推理引爆需求!AMD、
英特尔CPU产能告急 拟将服务器CPU价格上调10%至15%
0
马斯克亮相达沃斯:FSD最快2月在中国获批
0
阿里千问:Qwen3-TTS全家桶开源上线!
0
minimax创始人闫俊杰受邀中央政治局和国务院座谈会
0
【DeepSeek新模型MODEL1曝光 代码预示新架构】
据量子位公众号消息,DeepSeek-R1发布一周年之际,新模型“MODEL1”曝光。DeepSeek在GitHub更新FlashMLA代码,横跨114个文件中有28处提到MODEL1,与V32作为不同的模型出现。已知V32是DeepSeek-V3.2,MODEL1很可能是新的架构。代码中的具体差异体现在KV缓存布局、稀疏性处理和FP8解码方面,在内存优化上有多处不同。此前有消息称DeepSeek将在2月中旬春节前后发布下一代旗舰模型。结合DeepSeek最近发布的优化残差链接“mHC”和AI记忆模块“Engram”两篇论文,或许我们将看到整合了这两项技术的新模型。
(华尔街见闻)
1
迎爆发时刻!阿里等科技大厂纷纷布局AI Agent 机构:万亿市场启幕 商业化落地加速
0
0