HBF技术目前主要指高带宽闪存(High Bandwidth Flash),是一种专为AI领域设计的新型存储器架构,结合了3D NAND闪存和高带宽存储器(HBM)特性,旨在满足大规模AI模型的存储和推理需求
技术原理与设计
HBF采用类似HBM的堆叠设计,通过硅通孔(TSVs)将多个高性能闪存核心芯片堆叠在一起,并连接到一个可以并行访问闪存子阵列的逻辑芯片上。这种架构基于SanDisk的BICS 3D NAND技术,采用CMOS直接键合到阵列(CBA)设计。
核心优势
高容量:在相似成本下,HBF可实现比HBM高出8到16倍的容量提升。单堆栈容量可达512GB,八个堆栈可实现4TB总容量
高带宽:能够匹配HBM的带宽性能,满足AI推理对高带宽的需求
成本效益:相比HBM,在提供相近带宽的同时显著提升了容量,更适合大规模AI推理部署
应用场景
主要面向AI推理场景,特别是需要低功耗、高容量模型驻留的边缘设备。单GPU搭载4TB HBF存储可直接加载GPT-4等大型AI模型,减少数据迁移延迟34。
发展进展
闪迪与SK海力士已签署谅解备忘录,共同制定HBF规范并推动标准化。计划2026年下半年实现HBF样品出样,2027年初推出搭载HBF的AI推理设备原型。
技术挑战
NAND闪存的延迟高于
DRAM ,需要依赖接口优化和算法补偿
写耐久性问题尚未完全解决
生态系统仍在建设中,需要GPU厂商的深度参与
需要注意的是,HBF在不同领域可能有不同含义,在水声探测中指超波束形成技术,在通信领域可能指混合波束成形技术,但当前产业关注的重点是高带宽闪存这一应用方向6。