由 XSKY星辰天合 发布于2024-12-20
随着技术的进步,SSD 的价格不再高不可攀,几年前混闪存储的价格,现在可以买到全闪存储,性价比非常合适。同时,业务的快速增长和竞争压力,也使企业要求更高效,因此,2024 年上半年,全闪分布式存储市场份额达到了 170%的惊人增长。但很多客户对于 SSD 的寿命限制仍有顾虑:
SSD 到底能用多久?
到寿命了,怎么更换,会影响存储运行吗?
我们来剖析一下。
SSD 到底能用多久
SSD 的“基因寿命”有多长?
众所周知,SSD 是有寿命的,他的寿命主要是由 NAND Flash 颗粒决定的,就像人类的基因决定了人的寿命上限。不同类型的颗粒(SLC、MLC、TLC、QLC)具有不同的擦写次数(P/E Cycle),这直接影响了 SSD 的寿命。通常 SLC 可擦写 10 万次以上,而 TLC 只能擦写 1000-3000 次。回想一下手机或电动车的电池,充电次数多了,确实不耐用了,SSD 也是类似。
SSD 到底能用多久?
知道了 SSD 的“基因”寿命,我们的顾虑反而更深了,只能擦几千次,感觉用不了多久。而且虽然存储上可以监控到 SSD 的剩余寿命,但并不能直观的估测出还能用多久。
DWPD(Drive Writes Per Day),另一种描述 SSD 寿命方式,中文意思是“质保期内,每日全盘写入次数”,DWPD = 3 就意味着,假如质保期是 5 年,那么 5 年内,每天整盘容量可以写满 3 次。感觉好多了,如果每天写不了这么多数据,至少 5 年内,应该不用担心寿命问题,但仍然没有解决还能用多久的问题。
TBW(Terabytes Written),更直观一些的 SSD 寿命描述,表示在 SSD 达到其耐用极限之前,可以写入的总数据量,以 TB 为单位。例如,三星 PM9A3 7.68 TB NVMe SSD,其 TBW 为 14000 左右,即总共能写 14000 TB 的数据量,可以换算成 DWPD:
可擦写 14000/7.68 = 1822.9 遍;
1822.9/365 = 4.99 年;
如果质保期 5 年的话,4.99/5=1,即 DWPD = 1。
TBW 给了我们一个和数据量直接相关的绝对值,根据业务的日均数据量,我们可以大致估算出,剩余寿命的天数,以便于提前规划。例如寿命还剩 15%,业务日均数据量为 10 TB,那么 SSD 剩余寿命大概是 14000 * 15%/10 = 210 天,按照 30 天采购、30 天到货、30 天实施的规划,时间还是相对充裕的。
影响 SSD 寿命的因素:写放大是杀手
上面提到,擦写次数是 SSD 的“基因”寿命,但 TLC 才能擦写 1000 多次,那写一个小文件,也会占用整块 SSD 的擦写次数吗?当然不是。实际上,SSD 的最小读写操作单元叫页(Page),而擦除操作则是以块(Block,由多个 Page 构成)为单位来执行。不同型号的 SSD Page 和 Block 大小并不一致,Page 的大小通常是 4KB、8KB、16KB,Block 的大小通常是 512KB、1MB。
那么问题来了,假如 Page 大小是 4KB,写入一个 1KB 的数据,占了多少空间?答案是 4KB,这就是我们常说的写放大现象,有点像不足 15 分钟,按 15 分钟计费。写放大占用了 TBW,使 SSD 的寿命减少。
写放大产生的源头有 3 种:
后台垃圾回收:SSD 无法像 HDD 那样覆盖写,要修改数据必须擦除颗粒、重新写入,Block 是擦除的最小单元。当少量数据修改时,就会引发像整理房间一样,先把老房间的东西全部搬出来,再放到新房间里重新布置的情况,即少量的数据更新,会引发更大面积颗粒的擦写;
小 I/O 补齐:不足 Page 大小的数据占用 1 个 Page 页;
元数据变化:在 SSD 上,元数据是描述数据的索引,一般紧密地存放在一些 Block 区域。当用户频繁修改数据时,对应的每份元数据也必须跟着被修改、重定向,造成多次读写、擦写。
此外,SSD 的工作环境,像温度、湿度等因素也会对其寿命产生影响。高温环境下,粒子运动会加快,这会促使电子大量快速地逃逸,加速存储单元的磨损。同时,如果 SSD 长期处于潮湿或者灰尘较多等不良环境中,也可能会出现性能下降甚至损坏的情况,进而影响到它的使用寿命。而这些外部环境在一定时期内通常是既定的,在此我们暂不做深入讨论。
根据 SNIA 发布的《Endurance of NVMe®, SAS, and SATA SSDs》白皮书,定义“写放大”是:WAF (Write Amplification Factor) = NAND writes / host writes.
SSD 主控使用需要盘内 OP 区域来执行 GC 算法,OP 区域越大,GC 效率越高,WAF 越小。
DWPD=1 的企业级 SSD 一般会配置 7%~10%的 OP 区域,在 4kB 随机写工作负载下,最大 WAF 是 5~6;
DWPD=3 的企业级 SSD 一般会配置 25%~30%的 OP 区域,在 4kB 随机写工作负载下,最大 WAF 是 2~3。
星飞全闪分布式存储,如何解决 SSD 寿命焦虑
01
全局磨损均衡
全闪分布式存储管理的并不是 1 块 SSD,通常来说,1 套 3 节点的全闪分布式存储,每节点可插 24 块 SSD,1 个集群有 72 块 SSD。XSKY 星飞采用全局磨损均衡技术,保证每块 SSD 的寿命基本一致。SSD 寿命不一致将给运维带来极大压力,每日都要关注有哪些 SSD 即将到寿命,这周需要更换哪些 SSD。
02
小 IO 合并的追加顺序写技术
在 XSKY 的混闪产品中,就采用了 XSPEED 技术,进行小 IO 合并,主要原因是 HDD 的大块顺序写性能更好,同时可采用 EC 大幅降低成本。星飞全闪存储同样继承了 XSPEED 能力,来解决写放大问题,延长 SSD 寿命。
03
软件层面实现更大的 OP 预留
星飞通过软件层面实现软 OP 预留,减少 SSD 盘写放大,延长 SSD 寿命。
04
更少的写盘 IO
影响 SSD 寿命的主要方法除了降低盘内写放大以外,另外一个方法是尽量减少写盘 IO。
通过 EC+压缩,可以把客户端的写数据缩减到更低,这就减少了写盘 IO。
05
批量换盘,快速数据重构
根据 XSKY 的内部测试,根据业务负载不同,3 节点星飞全闪系统的数据恢复速度可达 2GB/s 至 6GB/s,1TB 数据的重构时间仅需 3 至 8 分钟。这意味着在更换故障 SSD 时,可以迅速恢复数据,确保存储系统的高可用性。
06
SSD 单盘容量提升,集群 TBW 足够
SSD 容量发展很快,现在 7.68 TB、15.36TB 已成为主流,30TB 产品也已发布,这已经不是 10 年前的 400GB 单盘容量的时代。以 7.68TB 为例,单节点星飞全闪裸容量为 7.68 TB/盘 * 24 盘 = 184.32 TB,单节点 TBW 为 14000TBW/盘 * 24 盘 = 336000 TB = 336 PB。也就是需要往这个节点写入 336PB 的数据,SSD 的寿命才能耗尽。而且这个还不算上我们通过“小 IO 合并追加顺序写”、“软件层面实现更大的 OP 预留”、“更少的写盘 IO”带来的 SSD 寿命巨大提升。
总结
SSD 容量已经不是 400 GB 的时代了,有足够的容量和寿命支撑业务数据的增长,5 年后还可以换更好的 SSD,要充分享受硬件红利;
全局磨损均衡可以大幅降低运维的紧张感;
小 IO 合并技术可以减少写放大,从而延长 SSD 寿命;
SSD 性能高,重构速度更快,SDS 换盘很容易。
因此,您可以放心的选一款性价比高的全闪分布式存储来替换混闪存储。
在线咨询:
9:00-18:00
快速响应您的问题
方案咨询
400-016-6101
售后支持
400-606-0072
官方微信