由 XSKY星辰天合 发布于2026-06-29
2026 年 6 月 26 日,开放数据中心委员会(ODCC)夏季全会如期召开。本次大会上,ODCC AI 存储实验室正式公布了面向 KV Cache 存储系统的评测成果,XSKY 星辰天合自主研发的 MeshFusion 推理存储系统,凭借出色的性能表现与技术领先性,从众多参评方案中脱颖而出,斩获 ODCC 官方权威成果认证证书。

ODCC 作为国内数据中心领域最具影响力的行业组织之一,其 AI 存储实验室的评测体系涵盖架构设计、性能表现、兼容适配、系统工程等多个维度,认证标准极为严苛。此次 MeshFusion 通过评测并获颁证书,标志着该方案在面向 AI 推理的 KV Cache 存储领域已达到业界领先水平,也为行业用户提供了经过权威验证的可靠选择。
在本次 ODCC 夏季全会存储焦点组专题研讨会上,中国信通院工程师段世茹详细展示了 AI 推理场景下 KV Cache 存储方案的测试情况,XSKY MeshFusion 在多模型、多场景压力测试中均展现出显著的推理性能优势。


KV Cache为何成为 AI 推理核心瓶颈?
大模型推理的爆发式增长,让 KV Cache 存储成为 AI 基础设施不可忽视的瓶颈。推理过程中,KV Cache 数据量随并发请求和序列长度线性增长,KV 缓存持续占用 GPU 显存,推高硬件成本,拖慢响应速度,制约集群扩容。
将 KV Cache 卸载到外部存储已成为行业共识,但这条路并不平坦。数据路径绕行 CPU 与内存带来的高延迟、新型混合注意力模型适配难、纠删码损耗性能、网络带宽无法充分利用等痛点,正是 MeshFusion 在此次评测中逐一攻破的方向。
MeshFusion 六大技术突破:破解推理存储核心难题
依托 ODCC 标准化测试环境,项目组搭建了包含 DPU、高速网络、多类硬件与主流大模型的测试集群,完整还原各类智算业务场景。MeshFusion 在实测中完成多项技术突破,系统展示了 MeshFusion 在不同硬件形态与模型架构下的适配能力与性能表现。

▶ 国内首个实现类似 NVIDIA CMX 近存计算架构
创新 DPU+JBOF 直通部署架构,数据绕过 CPU 与内存直达 GPU 显存,大幅降低长序列推理延迟,提升整体吞吐。JBOF 硬件可完全替代传统 X86 存储服务器,企业硬件部署选择更加灵活。
▶ 存储与网络双栈深度优化,性能逼近物理极限
底层存储软件可充分打满 RDMA 高速网络硬件带宽,硬件资源利用率接近物理上限;集群带宽可随网口规模线性扩容,企业在规划大规模推理集群时,可精准测算硬件投入与性能收益。
▶ 率先支持混合注意力大模型异构 KV 布局
原生适配 DeepSeek-V4、GLM-5.1 等新一代混合注意力架构大模型,完美兼容差异化 KV 缓存排布逻辑,对新旧两代主流大模型均能稳定实现缓存卸载加速,适配未来模型迭代需求。
▶ EC 纠删码实现性能无损
纠删码存储策略与单副本模式推理性能无明显差距,在保障缓存数据可靠、提升存储空间利用率的同时,不会牺牲推理吞吐与响应速度,打破性能与可靠性无法兼顾的行业固有局限。
▶ Spectrum-X 网络高级特性显著提升推理性能
深度适配 Spectrum-X 高速网络配套高级调度功能,通过智能路由与拥塞控制优化存储与算力间的数据传输效率,进一步降低推理延迟、提升整体业务吞吐,实现存网深度协同。
▶ 网络带宽量化选型,精准规划推理集群
覆盖多档位高速存储、计算网络场景完成对比测试,清晰区分不同带宽硬件的适用业务规模。针对 PD 分离分布式推理架构完成专项验证,为各类大中小规模推理集群提供清晰、可落地的网络硬件选型依据。
作为 ODCC AI 存储实验室的重要实践,MeshFusion 获 ODCC 官方权威认证,表明国产 KV Cache 存储方案在架构创新、模型兼容、性能优化、系统工程等维度已达到领先水平。本次评测完整验证 DPU+JBOF 近存架构、无损 EC 纠删码、混合注意力模型适配、高速网络协同等核心技术路线,为国内 AI 基础设施标准化、规模化落地输出可复用评测体系与选型基准。
更多深度技术解读,敬请关注「XSKY星辰天合」官方账号,ODCC专项评测完整技术拆解即将上线,欢迎业界同仁交流探讨。