上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.2 机械故障或系统故障
笔者在20世纪90年代早期进入数据保护行业,那时我们照常使用备份系统的头号理由就是机械故障或系统故障。文件系统与数据库都直接放在物理硬盘上,如果硬盘“挂了”,上面的数据也就一起完蛋了。
现在的情形跟当年有很大区别,造成这种区别的原因比较多,其中第一个原因就是:关键的工作数据现在都保存在某种形式的固态介质上。另外,在终端用户所使用的设备(例如笔记本计算机、智能手机、平板计算机以及物联网设备)中,数据也保存在这样的介质上。于是,目前的IT人员就不太可能遇到我们当年经历的那种设备问题。
我们的存储设备比原来更加健壮,而且任何一个重视数据的数据中心,都会配备RAID这样的冗余存储机制以及纠删码(erasure coding)技术。另外,磁盘生产商似乎也会在设备的固件里面内置完整性检查(integrity checking)逻辑,宁可让数据无法保存,也不让磁盘发生故障。这意味着现在已经很少出现因为硬盘故障而恢复数据的情形,但这并不意味着这种情形绝不会发生。
就算有能够同时处理多个磁盘故障的RAID与纠删码技术,我们也还是会遇到刚说的硬件故障。例如依然要面对停电的问题,而且某些固件可能导致多个硬盘驱动器全都出现错误。当然,整个RAID阵列中的磁盘同时故障的情况相当少见,但也不是从来没有发生过。因此,即便有RAID或纠删码,我们也还是得做备份。虽然很少遇到这种因发生机械故障而必须恢复数据的情形,但这样的情形确实存在。