大模型新周期开始,25H2就是24H1!(0720)
海外GPT-5预期集中出现。1)路线还是Sam在2月讲的,是在推理/非推理/工具使用模型之间切换的统一系统。2)官方时间说“soon”。3)有些传闻说试用过GPT-5很强,但是没法证实/证伪。OpenAI实验性模型拿下最新数学奥赛IMO金牌是预热,相应技术「会用到GPT-5中」。
IMO金牌再次全方位证明Scaling Law:1)「pre-training scaling」:模型是在不使用工具和联网的情况下实现的,纯靠预训练知识积累。2)「test-time scaling」:推理时间达到约100分钟。3)「post-training scaling」模型完全自然语言推理,不依赖专门定理证明器。且OpenAI已经在非清晰、非可验证奖励的# RL 范式上有新突破 ,# RL泛化性 或许得到解决。马斯克所说的模型“可能在明年和两年内发现新的物理学”,未必是吹牛。
一定要用全球眼光看待模型发展,不然是看不懂为什么Meta狂投入/挖人,OpenAI为什么给
ORCL 这么大单,马斯克为什么要百万卡集群,
GOOG L为什么要创新架构。海外模型进展是# 超前/超预期/超想象 的。
除了算力,我们认为# 软件/云 行情同样值得重视 。「Kimi K2就是DS V4的化身」!软件行情在蓄势,全球模型进步,应用能力/边界水涨船高(
微软copilot近期激活率在提高)。软件的3种演绎,参见我们之前段子,重点关注下周开启的美股软件股财报。
META 、
GOOGL 甚至有可能再上调CapEx。
【华泰电子/计算机】