位衰减:多年未动图片大块损坏发绿竟因为…

什么是位衰减

    位衰减是一个数据位随机翻转的现象 (由0到1或相反)。尽管有很多原因引发位衰减,但通常情况下是由 物理媒介的退化 所引起的。它也被称为比特衰变、数据腐烂、数据衰变和静默数据损坏。

    下面是一个发生了位衰减文件的例子。如您所见,衰减位已经多到图像的绝大部分不可恢复。

未发生位衰减的图片

已发生位衰减的图片

其中发生位衰减的图片坏块可能有绿色、褐色等等

危害

    随着数据存储容量的增长,由位衰减(数据中的单比特错误)导致的问题越来越让存储管理员感到头疼。

    位衰减——这种磁能渗漏常常存放磁盘或芯片的一个单元的二进制数据的状态,无论这种渗漏是由于降低绝缘或辐射或者是气候变化所导致。

    一项对150万块硬盘的研究表明,每90块硬盘就有1块有这种“软错误”,这个错误不但会导致数据丢失,还会导致RAID错误。

如何防护

    解决方案即为虚拟化磁盘介质并且使用不同的记录方式,如工作在硬件层的XIO的冗余分配网格系统(RAGS),以及工作在文件系统层的Amplidata的BitSpread技术。Hadoop、ZFS以及其他技术也能解决这个问题。

使用纠删编码应对位衰减

    随着数据存储容量的增长,由位衰减(数据中的单比特错误)导致的问题越来越让存储管理员感到头疼。

    Toigo Partners International公司的创始人、灾难恢复专家Jon Toigo讨论了一种可以帮助降低数据错误风险的方法——纠删编码(erasure coding)。

     Toigo指出,尽管数据中发生位衰减(也称静默损坏)的频率很低,但是随着存储容量的增长,发生位衰减的几率会随之增加。“位衰减有过很多名字,它表示数据在被写入时被损坏,或是在它所在的位置被损坏。

    “其实,这点你不用担心,因为它发生的几率只有1016之一(这个数字是一块SAS或光纤通道硬盘发生位衰减的几率)”。而90块SATA硬盘会有一块发生静默损坏,相当于每67TB的数据会有一个错误。所以根据你拥有的数据量的大小或存储的大小,你可能会有多块硬盘出现问题。 

    而Toigo引用的一个研究表明,5%至10%的无法自动恢复的存储系统故障都与位衰减有关。许多现有的数据保护方法也有它们自己的缺点,如数据完整性区域(DIF)标准并没有被大部分阵列控制器支持。其它方法(如文件系统级校验和)又会影响存储阵列的性能。

    Toigo认为,纠删编码可以作为一个数据保护的方法,它将数据分解成对象级碎片并存储到多个位置,而数据在需要恢复的时候还能重建,纠删编码会处理你正在写入的应用数据,将它们发送到解析引擎并创建对象。这是纠删编码对数据处理的算法。

    它将这些对象分解成碎片并将它们存储到其他位置,这样你可以在任何硬盘上将其中的一个、两个或三个对象加入到数据重建算法中,然后你就可以重建这个对象的数据了。和使用RAID不同,你是将对象分解成多个部分并将它们存储在整个存储阵列中。Amplidata公司的云存储产品目前正在使用类似的技术,他们称之为BitSpread。它能通过有效的比特位重建数据,无论数据在云端的哪个位置。

默认图片
Marugu Fuyeor
欢迎来到复网 - 教程与解决方案 - Marugu Fuyeor
文章: 95

留下评论