12月底关注的
精测电子 ,而昨天的CES大会,
英伟达 CEO黄仁勋进一步强调了:存储必须被重构!这番言论不但加速了早盘
存储芯片的表现,同时也助力了半导体设备扩产的相关标的,精测电子就是前道量检测设备之一!
黄仁勋进一步重视存储,除了直接利好的存储芯片,还有一个被大家忽视的预期差方向:
GPU-Native数据库!!今天就重点来说说这个!
一、事件催化背景和意义1月6日,黄仁勋在CES 2026大会讲话上提出“
存储必须被重构”。英伟达首次完整披露了由BlueField-4驱动的推理上下文内存存储平台(Inference Context Memory Storage Platform),核心目标是在GPU内存和传统存储之间创建一个“第三层”。
为何要新建第三层?因为当AI处理需要多轮对话、多步推理的复杂任务时,会产生大量上下文数据(KV Cache)。传统架构要么把它们塞进昂贵且容量有限的GPU内存,要么放到普通存储里(访问太慢)。
这个“存储瓶颈”如果不解决,再强的GPU也会被拖累。既足够快,又有充足容量,还能支撑AI长期运行:
1)BlueField-4 负责在硬件层面加速上下文数据的管理与访问,减少数据搬移和系统开销;
2)Spectrum-X 以太网提供高性能网络,支持基于 RDMA 的高速数据共享;
3)DOCA、NIXL和Dynamo等软件组件,则负责在系统层面优化调度、降低延迟、提升整体吞吐。
AI原生存储系统有望显著提升向量数据库在AI Infra的核心地位 AI原生存储系统或改变软件设计的基本范式——以
DRAM 为中心转变为以 SSD 为导向,如在近似最近邻搜索 (ANN)任务中利用其超高 IOPS 对所谓的降维向量进行高速扫描,然后使用完整向量进行细化,从而实现速度和精度的双重保留。
二、存储新方向-向量数据库同样的,要实现Agent记忆的提升,需要大量存储,以及存储技术的升级。但同时,也需要数据库软件的升级,记忆功能的每个维度的变化,都需要数据库软件作为支持实现。
AgentAI推理时代带来新的GPU存储架构。NV规划硬件GPU直连SSD增加存储量和传输速率,SCADA软件架构控制存储IO,加快推理速度。
底层硬件变革带动软件重构GPU-Native数据库到来。从“以CPU为中心”到“以GPU为中心”,数据库软件需要围绕 GPU的数据获取和处理能力重新设计,核心组件层面升级改造。
为了理解这部分的内容,我们可以打个比喻来理解:
1、KV Cache代表了推理的规模化,而推理规模化需要RAG。
2、如果把大模型比作学生。
KV Cache像是这个学生解题时用的“草稿纸”。RAG是这个学生考试时允许带的“官方参考资料手册”,确保答案准确、有依据。
向量数据库就是这本“参考资料手册”的智能目录和索引系统。
KV Cache和RAG存储的爆发,必然带来向量数据库需求的大增。
三、未来的向量数据库有多重要?英伟达下一代 GPU 直连 SSD/HBF 技术是存储架构的重大革新,旨在解决 AI 计算中数据传输瓶颈问题。
传统存储路径:· SSD → CPU → PCIe Switch → GPU → HBM
· 瓶颈:CPU 成为数据传输中介,限制带宽并增加延迟
直连架构:· SSD/HBF → PCIe 7.0/CXL 3.0 → GPU (直接连接)
· 核心突破:GPU 直接控制数据路径和控制路径,完全绕过 CPU
英伟达在ssd上,实现了向量化,把向量数据库做成了基础。
在推理时代,向量数据库承担的角色,和 CPU 时代的 cache coherence / memory hierarchy 控制逻辑非常相似:它决定——哪些数据该被“提升到昂贵层级(HBM / token 上下文)”,哪些数据留在“便宜层级(SSD / 数据湖)。
在推理时代需要判断,哪些知识 / KV / 文档值得进入 prompt?值得占用 HBM?只该存在 SSD?哪些 token 是“热的”?哪些向量是“值得被反复访问的”?
向量数据库做的正是这个决策层,他是相关性裁决器,上下文仲裁器,HBM 入场券发放者;
四、向量数据库怎么实现盈利?N
VIDIA 系统级隐性收费
向量数据库 → 提高 GPU 有效利用率
GPU 利用率提高 → 客户更愿意买
推理时代,向量数据库不是一个数据库产品,
而是一层“决定谁有资格占用昂贵算力资源”的系统控制平面。
它的商业价值,不在它本身,而在它能为 GPU 释放多少空间。
五、相关受益品种××××:
1,公司已与NV实现合作(这两天),主要为公司的认知数据库和NV的GPU进行双向优化和适配,实现AI推理的加速计算。
2,当前是在NV的GB系列上进行优化,后续将会在NV的下一代GPU直连SSD/HBF上进行优化(这是重点),构建以GPU为中心的数据库。
3,NV志在打造以GPU为核心的硬件存储架构(铠侠、海力士已经开始研发),数据库等软件生态以GPU为核心构建,预期测算这个市场有1600亿美金(和传统数据库一个量级)。
4,公司能被NV选中,代表了对其技术的认可,很稀缺。一旦成功切入这个市场,收入弹性大。
感兴趣的朋友欢迎一起交流!
打开APP领取红包