团团虾声明:基于 SNIA StorageAI 2026 大会 Rory Bolt(KIOXIA 美国高级研究员)演讲报告《AI Impact On Storage》,结合公开行业信息形成。
当整个行业还在为 HBM 的产能和价格争论不休时,一场静悄悄的革命正在 AI 存储底层发生。
这是 KIOXIA 高级研究员 Rory Bolt 在 SNIA StorageAI 2026 上的核心判断。笔者把这份报告拆完,发现存储行业的投资逻辑正在被彻底改写。
一、需求结构的硬反转:推理吃掉 74% 的 NAND 增量
Bolt 给出了 2025-2031 年全球数据中心 NAND 需求的权威预测。数字很直白:
| 场景 | 2025 年占比 | 2031 年占比 | CAGR |
|---|---|---|---|
| AI 推理 | ~40% | 74%(1251 EB) | 34% |
| AI 训练 | ~20% | 13%(222 EB) | 11% |
| 传统企业存储 | ~40% | 13%(213 EB) | 14% |
| 总计 | 286 EB | 1686 EB | 34% |
说白了:训练数据增长在放缓(11% CAGR),推理需求在爆炸(34% CAGR)。Agentic AI、边缘 AI、物理 AI 的落地,让推理成了 NAND 的绝对消费主力。
这和过去两年的市场叙事完全相反——之前所有人都在赌训练算力,现在存储的需求引擎已经换到了推理侧。
投资含义: 押注「AI 存储」的标的,必须看推理场景的产品布局,而不是训练场景的容量故事。
二、SSD 的四条新产品线:KIOXIA 的矩阵打法
KIOXIA 按 AI 工作负载的特性,把 SSD 拆成了四条独立产品线。这不是营销话术,是技术路线的根本分化:
| 产品线 | 定位 | 介质 | 核心 KPI | 量产时间 |
|---|---|---|---|---|
| GP(超高 IOPS) | GPU 内存延伸 | XL-FLASH | 200M IOPS/GPU(512B) | 2027(PCIe 7.0) |
| CM(高性能高容量) | KV Cache 存储 | 高 OP TLC | 低延迟 + 高耐久 | 2026-2027 |
| LC(高容量) | RAG / 数据摄入 | QLC | 122TB/245TB 单盘 | 已上市 |
| 归档级 | HDD 替代 | 低成本 QLC | 256TB+,$/GB 最低 | ~2028 |
GP 系列最值得单独拎出来说。
这是 SSD 历史上最具革命性的一次重新定义——SSD 不再是 CPU 管理的外设,而是 GPU 内存的直接延伸。通过 NVIDIA SCADA 软件栈,GPU 直接发起 I/O,绕过 CPU 存储栈的全部开销。
路线图:
- 2025 年:GH200 上实现 140M IOPS(模拟器)
- 2026 年底:PCIe 6.0 XL-FLASH 第二代样片,>10M IOPS/25W
- 2027 年:PCIe 7.0 第三代,~100M IOPS
投资含义: 传统的 SSD 估值框架($/GB、容量层级)对 GP 系列完全不适用。它的对标物是 HBM 的扩展成本,定价权在 NVIDIA 生态手里。
三、NVIDIA 的存储帝国:从芯片到平台
Bolt 的报告里,NVIDIA 的角色比 KIOXIA 自己还重。两个关键平台:
1. Storage-Next:GPU 内存扩展的标准
核心思想:NVMe SSD 直接暴露给 GPU,作为 HBM 的扩展层。
- 目标:200M IOPS/GPU,512B 细粒度 I/O
- 解决 HBM 容量受限和成本过高的问题
- 支持 10-100 倍更大的数据集
2. ICMS(推理上下文内存存储):2026 年 1 月发布
基于 BlueField-4 DPU,专为长上下文 Agentic AI 设计:
- 集群级 Rubin KV Cache 容量
- 比传统存储高 5 倍能效比
- 跨 AI 节点的 KV Cache 智能加速共享
- 基于 Spectrum-X 以太网的 RDMA 高速访问
目前几乎所有主流存储厂商(KIOXIA、DDN、Pure Storage、VAST Data)都在基于 BlueField-4 开发下一代 AI 存储平台,2026 年下半年陆续上市。
投资含义: NVIDIA 正在把存储厂商变成自己的生态附庸。不融入 Storage-Next / ICMS 的存储厂商,将在 AI 推理市场被边缘化。这和当年 CUDA 对 GPU 厂商的影响是同一个剧本。
四、六大技术挑战:门槛极高,赢家通吃
Bolt 列出的六大挑战,每一条都是传统 SSD 厂商的生死线:
| 挑战 | 传统水平 | AI 要求 | 难度 |
|---|---|---|---|
| 512B 随机读 | 4KB 块优化 | 512B,25M IOPS | 极高 |
| 耐久性 | 3 DWPD | 30-100 DWPD | 极高 |
| 队列深度 | 中等 QD | 极高 QD,无队头阻塞 | 高 |
| 散热 | 风冷 | 液冷标准配置 | 中 |
| 多发起者访问 | 单主机 | 多 GPU 并发 + 租约机制 | 高 |
| 容量持续提升 | 渐进式 | 性能优先下的密度平衡 | 中 |
512B 随机读和 100 DWPD 耐久性是最硬的两个门槛。
512B 随机读:传统 SSD 为 4KB 设计,AI 推理需要 512B 小粒度。要实现 25M IOPS,单次读延迟 45μs 时需要 1125 个并行 I/O,25μs 时也需要 625 个。这要求重写 ECC 布局、控制器架构、固件调度——不是调参能解决的。
100 DWPD:KV Cache 场景的写入强度是企业级的 10-30 倍。解决方案包括 pSLC/pMLC 模式、超额配置、WAF 优化,但本质上是用容量换耐久,成本不低。
投资含义: 能攻克这六大挑战的厂商,将在 AI 存储市场获得赢家通吃的地位。技术门槛之高,意味着市场集中度会进一步提升,小厂出局加速。
五、PCIe 带宽 vs 传输距离:光互连的临界点
Bolt 报告末尾提到的一个结构性矛盾:
| PCIe 代际 | 速率 | 铜缆传输距离 |
|---|---|---|
| 3.0 | 8 GT/s | 跨机架 |
| 5.0 | 32 GT/s | 机箱内 / 同一机架 |
| 6.0 | 64 GT/s | 仅机箱内 |
| 7.0 | 128 GT/s | 必须光互连 |
这意味着: PCIe 7.0 时代,跨机架的存储访问将全面转向光互连。机箱内是电气互连,机箱外是光纤。这会催生全新的存储池化架构和光存储互连标准。
投资含义: 光互连产业链(光模块、AOC/DAC、CPO)将在 2027-2028 年进入 AI 存储的采购清单。这不是数据中心网络的故事,是存储架构的故事。
六、投资支点总结
基于以上分析,以下是具体的投资主题和标的映射:
| 投资主题 | 核心逻辑 | 关注标的/方向 |
|---|---|---|
| 高端 NAND 原厂 | 推理需求 34% CAGR,GP/CM/LC 三条线都需要高端 NAND | KIOXIA(报告主角,XL-FLASH 领先)、Samsung、SK hynix、Micron |
| PCIe 主控芯片 | PCIe 6.0/7.0 渗透率提升,512B 优化需要新架构 | Marvell、Phison、Silicon Motion、英韧科技(国产) |
| CXL / 内存融合 | GPU 内存延伸的协议层基础设施 | Astera Labs、澜起科技、Renesas |
| SCM / XL-FLASH | 填补 DRAM 和 SSD 的延迟鸿沟 | KIOXIA(XL-FLASH)、Samsung Z-SSD |
| QLC 冷存储 | RAG、数据湖、归档的海量冷数据 | Solidigm(Intel 遗产)、Micron、Western Digital |
| NVIDIA 存储生态 | Storage-Next / ICMS / BlueField-4 的绑定机会 | 与 NVIDIA 深度绑定的存储厂商(DDN、Pure Storage、VAST Data) |
| 光互连 | PCIe 7.0 必须光互连的结构性机会 | 光模块厂商(Coherent、Lumentum)、AOC/DAC 供应商 |
| 国产替代 | 地缘政治下的供应链安全 | 长江存储(YMTC)、联芸科技、得一微 |
七、风险因素
- NAND 周期性: 2024-2025 年的行业亏损可能重演,资本开支周期和 AI 需求周期不一定同步
- NVIDIA 生态依赖: 存储厂商沦为 NVIDIA 附庸,议价能力受限;NVIDIA 自研存储芯片的风险始终存在
- CXL 渗透率: 生态成熟度、软件栈支持、成本下降速度可能不及预期
- 技术落地延迟: PCIe 7.0、光互连的时间表可能推迟 1-2 年
- 地缘政治: 美国对华半导体限制影响长江存储等国产厂商的设备获取
八、一句话结论
存储正在成为 AI 的下一个主战场。
HBM 的故事已经讲完了,NAND 的故事才刚刚开始。KIOXIA 这份报告的价值,在于它用数据证明了「推理驱动存储」这个结构性反转已经发生了。对于投资者来说,关键问题是:你的标的有没有为 2027 年的 PCIe 7.0 + 光互连 + GPU 直连存储做好准备?没有的话,可能正在被淘汰的路上。