由 XSKY星辰天合 发布于2020-08-11
非结构化数据正以前所未有的速度增长。IDC 的预测表明,到 2025 年,全球将有 80%的数据是非结构化的。文件协议是存取非结构化数据最普遍的使用方式,根据 IDC 统计,2019 年度,中国的软件定义存储市场约 60% 是文件存储。
尽管非结构化数据并不是什么新鲜事,但 IT 团队承受着巨大压力,他们希望以简单和易于使用的方式快速、一致地存储和管理非结构化数据,但传统文件系统有很多的限制:
元数据和数据使用本地存储,无法横向扩展,不具备节点级高可用;
受限于元数据的存储空间和性能,实际可保存的文件数有限,一般小于1亿,存储空间为 TB 级别;
非统一命名空间,多个挂载目录之间无法互通,使用复杂;
文件存储网关不可扩展,无法提升带宽,造成访问瓶颈;
不支持大数据和容器等新业务。
分布式文件架构,如何和硬件与时俱进?
数字化转型下的软件定义存储架构,可以很好的满足用户各种需求,如在标准服务器上的敏捷部署,可灵活扩展,性能和容量随服务器节点数增长而线性增长,硬件升级与更换无需跨存储系统迁移数据,硬件升级换代红利即时享用,业务层无感知、无影响等。
但是软件定义,也需要充分利用最新的硬件技术,与时俱进。
分布式文件存储,最复杂的就是元数据的保存和处理。根据统计,大部分的 AI/ML 分析应用,90% 的 I/O 都是请求元数据操作。
上一代的分布式文件系统,由于当时的硬件限制,为了解决元数据的容量瓶颈,部分产品(如 CephFS)将元数据保存在后端的 RADOS 集群里,I/O 路径长,并且由于复杂的同步和互锁机制,性能损耗较高,性价比并不理想;
部分产品(如 HDFS)采用内存来保存所有的元数据,虽然元数据性能较好,但由于内存的容量有限,系统支持的文件数比较少,扩展能力有限。
有没有一种架构,能够以较低的成本,极简的架构,满足现代文件系统元数据处理的性能和容量要求?
现在,大容量高速 SSD 的普及,使得鱼和熊掌兼得变成现实。NVMe 协议的出现,大大降低接口协议的开销,SCM(存储级内存)的出现,大大提升介质的性能,加上颗粒成本的下降,使得 5TB 以上的大容量 NVMe SSD 较为普遍。
这些 SSD 新技术的发展,加上 CPU 的核数越来越多,使得全闪存元数据节点完全可以应对大规模文件系统的需求,比如,只需要 5TB 的 NVMe SSD 的元数据空间,就可以轻松保存和处理百亿规模文件。
XGFS 重新定义下一代分布式文件系统
XGFS(XSKY Global File System)是 XSKY 提供的新一代分布式文件存储系统,具有单一全局的命名空间。
XGFS 基于灵活的 SDS 架构,支持 NFS、SMB、FTP、POSIX、HDFS、Kubernetes CSI(容器存储接口)等丰富的协议,不仅可以用于企业的文件共享,备份归档通用场景,也可以应用于视频监控、媒资管理、高性能计算等高性能、大带宽、大容量的场景,还支持最新的大数据和容器场景。
XGFS 企业级分布式存储系统架构图
XGFS 创新利用最新的多核 CPU、大容量和高性能 NVMe SSD,只需要 3 个全闪存元数据高可用节点(可以共用数据节点),就可以高效保存和处理 100 亿数量文件规模的数据,同时提供每秒上百万元数据读写请求处理能力,具有极高的性价比。
而 XGFS 的数据节点,则充分利用 XSKY 久经市场考验的可靠自主分布式存储集群,成熟稳定,可以轻松扩展到上千个节点。
XGFS 企业级分布式存储系统用户界面
XGFS元数据服务的架构具有如下优势:
基于最新一代 NVMe / SCM 存储介质设计,充分发挥出新兴介质近百万级 IOPS 和数 GB 带宽的性能优势,轻松满足对于文件系统的高频率元数据访问需求;
利用高性能 LSM 存储引擎,结合 XSKY 独有专利技术的键值设计,构建出完全自主的元数据服务;既兼容 POSIX 文件语义和 S3 对象语义,又支持用户 / 用户组、权限 / ACL、扩展属性等;
元数据在本节点的日志保护和节点间的强一致性复制,使得元数据集群轻松应对慢盘、网络异常、节点重启/掉电等故障场景,提供 RPO=0 的元数据通路;
使用 XSKY 自研的高速网络传输模块,原生为RoCE / RDMA高性能网络量身打造,大大降低节点间元数据复制包的传输时延,使得整个元数据集群拥有更高的 IOPS 性能。
XGFS 分布式文件存储系统由元数据服务集群和混合盘数据服务共同组成,使得该产品继承了 XSKY 多年在分布式混合盘上的深厚积累以及大规模存储运维能力:
多级缓存技术、支持副本与 EC 纠删码、支持延展集群双活、硬盘和网络亚健康处理等,成熟稳定,特性丰富且运维简单。
产品特点
1、全局命名空间
单一命名空间:提供统一持续高性能的文件单一全局命名空间,使用简单;
丰富的协议支持:支持 NFS, SMB, POSIX, FTP, HDFS,Kubernetes CSI 等协议, 简化业务 IT 架构的同时解除对业务的锁定;
新兴业务场景支持:支持 HPC、大数据和容器等新兴负载。
2、灵活扩展
软件定义,可自定义节点属性,并支持各种品牌的通用 x86 服务器和国产服务器;
灵活部署,可从 3 个节点扩展到 4096 个节点,满足不同业务需求;
按需扩展,性能和容量随节点数增加而增长,满足不断增长的业务对性能和容量的需求。
3、丰富的企业级功能
数据冗余:支持多副本和 EC 不同冗余策略,提供基于服务器、机架、数据中心的三个级别故障域管理。支持快照保护;
支持文件网关负载均衡和 HA 保护,支持 AD 域、LDAP 域对接,本地认证等多种认证方式。支持配额管理;
通过内嵌 X3DS 可以实现文件和对象间的复制、迁移、备份、归档等丰富的数据管理功能,并且支持阿里云和百度云等公有云平台。
典型应用场景
XGFS 可以作为企业级分布式文件系统,支持丰富的大容量非结构化数据保存和分析场景:
1、文件共享、企业办公存储
单一全局命名空间,使用简单。支持文件共享、网盘、FTP 等办公场景。
2、视频监控、流媒体、CDN 存储
横向扩展,滚动升级,数据永久保存。
3、大数据、HPC 后端存储
兼容 HDFS, 高效文件元数据处理机制,灵活应对 A I/ ML 数据分析要求。
4、容器共享存储
支持 Kubernetes CSI 接口,支持多个 PODs 共享数据。
5、集中灾备资源池
利用 X3DS(XSKY立体数据管理系统)和 ODPF(开放数据保护框架),可以作为大容量的共享灾备资源池。
6、企业数据湖底座
支持 Hadoop 存算分离部署,接口协议丰富,可以扩展到上千节点。
XSKY XGFS 充分利用 SDS 优势,适配最新的 NVMe SSD 新技术,支持最新的 HDFS 和 Kubernetes CSI 协议,性价比高,无需在性能和容量之间做出妥协,是企业的数据湖建设的理想底座。
在线咨询:
9:00-18:00
快速响应您的问题
方案咨询
400-016-6101
售后支持
400-606-0072
官方微信