下载
登录/ 注册
主页
论坛
视频
热股
可转债
下载
下载

[红包]2026存储新方向:向量数据库,这家公司独供NV!

26-01-07 21:59 4614次浏览
热点擒龙手
+关注
博主要求身份验证
登录用户ID:
12月底关注的精测电子 ,而昨天的CES大会,英伟达 CEO黄仁勋进一步强调了:存储必须被重构!这番言论不但加速了早盘存储芯片的表现,同时也助力了半导体设备扩产的相关标的,精测电子就是前道量检测设备之一!

黄仁勋进一步重视存储,除了直接利好的存储芯片,还有一个被大家忽视的预期差方向:GPU-Native数据库!!今天就重点来说说这个!

一、事件催化背景和意义

1月6日,黄仁勋在CES 2026大会讲话上提出“存储必须被重构”。英伟达首次完整披露了由BlueField-4驱动的推理上下文内存存储平台(Inference Context Memory Storage Platform),核心目标是在GPU内存和传统存储之间创建一个“第三层”。

为何要新建第三层?

因为当AI处理需要多轮对话、多步推理的复杂任务时,会产生大量上下文数据(KV Cache)。传统架构要么把它们塞进昂贵且容量有限的GPU内存,要么放到普通存储里(访问太慢)。

这个“存储瓶颈”如果不解决,再强的GPU也会被拖累。既足够快,又有充足容量,还能支撑AI长期运行:

1)BlueField-4 负责在硬件层面加速上下文数据的管理与访问,减少数据搬移和系统开销;
2)Spectrum-X 以太网提供高性能网络,支持基于 RDMA 的高速数据共享;
3)DOCA、NIXL和Dynamo等软件组件,则负责在系统层面优化调度、降低延迟、提升整体吞吐。

AI原生存储系统有望显著提升向量数据库在AI Infra的核心地位 AI原生存储系统或改变软件设计的基本范式——以 DRAM 为中心转变为以 SSD 为导向,如在近似最近邻搜索 (ANN)任务中利用其超高 IOPS 对所谓的降维向量进行高速扫描,然后使用完整向量进行细化,从而实现速度和精度的双重保留。

二、存储新方向-向量数据库

同样的,要实现Agent记忆的提升,需要大量存储,以及存储技术的升级。但同时,也需要数据库软件的升级,记忆功能的每个维度的变化,都需要数据库软件作为支持实现。

AgentAI推理时代带来新的GPU存储架构。NV规划硬件GPU直连SSD增加存储量和传输速率,SCADA软件架构控制存储IO,加快推理速度。

底层硬件变革带动软件重构GPU-Native数据库到来。从“以CPU为中心”到“以GPU为中心”,数据库软件需要围绕 GPU的数据获取和处理能力重新设计,核心组件层面升级改造。

为了理解这部分的内容,我们可以打个比喻来理解:

1、KV Cache代表了推理的规模化,而推理规模化需要RAG。
2、如果把大模型比作学生。

KV Cache像是这个学生解题时用的“草稿纸”。RAG是这个学生考试时允许带的“官方参考资料手册”,确保答案准确、有依据。
向量数据库就是这本“参考资料手册”的智能目录和索引系统。

KV Cache和RAG存储的爆发,必然带来向量数据库需求的大增。

三、未来的向量数据库有多重要?

英伟达下一代 GPU 直连 SSD/HBF 技术是存储架构的重大革新,旨在解决 AI 计算中数据传输瓶颈问题。

传统存储路径:
· SSD → CPU → PCIe Switch → GPU → HBM
· 瓶颈:CPU 成为数据传输中介,限制带宽并增加延迟

直连架构:
· SSD/HBF → PCIe 7.0/CXL 3.0 → GPU (直接连接)
· 核心突破:GPU 直接控制数据路径和控制路径,完全绕过 CPU

英伟达在ssd上,实现了向量化,把向量数据库做成了基础。

在推理时代,向量数据库承担的角色,和 CPU 时代的 cache coherence / memory hierarchy 控制逻辑非常相似:它决定——哪些数据该被“提升到昂贵层级(HBM / token 上下文)”,哪些数据留在“便宜层级(SSD / 数据湖)。

在推理时代需要判断,哪些知识 / KV / 文档值得进入 prompt?值得占用 HBM?只该存在 SSD?哪些 token 是“热的”?哪些向量是“值得被反复访问的”?

向量数据库做的正是这个决策层,他是相关性裁决器,上下文仲裁器,HBM 入场券发放者;

四、向量数据库怎么实现盈利?

NVIDIA 系统级隐性收费
向量数据库 → 提高 GPU 有效利用率
GPU 利用率提高 → 客户更愿意买
推理时代,向量数据库不是一个数据库产品,
而是一层“决定谁有资格占用昂贵算力资源”的系统控制平面。
它的商业价值,不在它本身,而在它能为 GPU 释放多少空间。

五、相关受益品种

××××:

1,公司已与NV实现合作(这两天),主要为公司的认知数据库和NV的GPU进行双向优化和适配,实现AI推理的加速计算。
2,当前是在NV的GB系列上进行优化,后续将会在NV的下一代GPU直连SSD/HBF上进行优化(这是重点),构建以GPU为中心的数据库。
3,NV志在打造以GPU为核心的硬件存储架构(铠侠、海力士已经开始研发),数据库等软件生态以GPU为核心构建,预期测算这个市场有1600亿美金(和传统数据库一个量级)。
4,公司能被NV选中,代表了对其技术的认可,很稀缺。一旦成功切入这个市场,收入弹性大。

感兴趣的朋友欢迎一起交流!
打开APP领取红包
打开淘股吧APP
40
评论(89)
收藏
展开
热门 最新
泽歆明

26-01-07 22:23

0
bull001

26-01-07 22:21

0
666
小赌怡情98

26-01-07 22:19

0
666
护心

26-01-07 22:12

0
1
勤能出巧

26-01-07 22:08

0
科创板买不了呀
蔚蓝海岸DL

26-01-07 22:08

2
先赞后看!
刷新 首页 上一页 下一页末页
提交