DP是不是来了二波浪？_铁杆老韭菜

铁杆老韭菜

25-02-25 09:06

0

波士顿动力创始人：已购买宇树机器人 DeepSeek创新只是个开始

铁杆老韭菜

25-02-25 09:00

1

DeepSeek一体机需求热度攀升机构预测市场规模两年内超5000亿元

2025年02月25日 00:31

铁杆老韭菜

25-02-25 08:58

0

美股收盘：“算力怀疑论”冲击科技股

铁杆老韭菜

25-02-25 08:36

0

特斯拉将于近期在中国推送FSD功能，可支持城区NOA，并将分车型逐步进行推送。符合去年9月特斯拉公布的FSD路线图。

中海达

铁杆老韭菜

25-02-24 19:28

0

DeepSeek崩溃次数变少了？内部人士：通过技术优化实现

铁杆老韭菜

25-02-24 19:06

1

浙江众成：AI情趣+浙江

铁杆老韭菜

25-02-24 19:05

0

灵巧手概念股（材料）：尤夫股份、南山智尚

铁杆老韭菜

25-02-24 18:01

0

DeepSeek让微软变卦了？被曝取消多个数据中心租约缩减开支大幕已开启

①微软被传取消与多家私营数据中心运营商的租赁协议，引发市场猜测其或因DeepSeek低成本AI模型而考虑缩减成本；
②微软回应称取消部分租约是战略性调整，但否认缩减支出，并重申其800亿美元的财年支出目标。

铁杆老韭菜

25-02-24 15:36

0

【算力成本又挨“一刀”！DeepSeek首个开源代码库为FlashMLA 显著提升大模型推理效率】

突破H800计算上限！DeepSeek放出第一个开源库，FlashMLA再掀降本潮？2月24日周一，DeepSeek宣布启动“开源周”，首个开源的代码库为Flash MLA，目前已投入生产。据介绍，FlashMLA的灵感来自FlashAttention 2&3和cutlass项目，是针对英伟达Hopper架构的GPU优化的高效MLA解码内核，主要在变长序列的场景进行了深度优化，能够显著提升大模型推理效率。

MLA是DeepSeek提出的创新注意力架构，是DeepSeek在系列模型中实现成本大幅降低的关键所在。分析认为，随着FlashMLA的应用，算力成本有望继续下降。性能方面，FlashMLA在 CUDA 12.6环境下，H800 SXM5内存受限配置下可实现3000 GB/s的带宽，计算受限配置下则可达580 TFLO PS的算力。有网友指出，FlashMLA的计算速度已达行业平均水准的8倍，甚至超过了H800 1681GB/s的传输峰值。

（华尔街见闻）

铁杆老韭菜

25-02-24 11:55

0

【打破算力垄断、加速AI普惠的关键一步！DeepSeek发布开源第一弹让大模型在GPU上跑得更快】

2月24日，DeepSeek启动“开源周”，开源了首个代码库FlashMLA。据介绍，这是DeepSeek针对Hopper GPU优化的高效MLA解码内核，专为处理可变长度序列而设计，现在已经投入生产使用。简单来说，FlashMLA是一个能让大语言模型在H800这样的GPU上跑得更快、更高效的优化方案，尤其适用于高性能AI任务。

DeepSeek开源这一代码有何影响？记者用这一问题询问了DeepSeek，它回答称，这一代码就像给AI推理引擎装上了一台“涡轮增压器“，让大模型在处理复杂任务时更快、更省资源，同时降低了技术门槛。FlashMLA的意义不单是技术优化，更是打破算力垄断、加速AI普惠的关键一步。

（一财）