这事说起来挺复杂的,不同文件系统,不同设备,不同介质,效果都是有区别的。
断电的一瞬间,很多事情是无法确定的:
1. 你无法确定你试图向设备驱动发送的写指令是否成功,驱动程序本身一般都有缓存;
2. 即使写指令正常返回,你也无法确定设备实际上是否写成功,因为设备本身可能也有缓存。目前没有设备能保证写指令返回的情况下,所有数据一定成功的保存在介质上(但部分厂商能保证少量数据一定能成功写入),对存储设备的flush操作并非绝对可靠;
3. 哪些成功哪些失败可能是乱序的,换句话说,如果先发送写请求A,再发送写请求B,并且都成功返回,掉电时请求A可能丢失,但B成功(NCQ功能);
4. 机械式磁盘可能会出现丢失半截数据的情况(比如,一个512字节扇区只写入了100字节,也就是题主说的bit级错误),但这种一般都会通过校验位检测出来。
因为有以上这么多的限制,实际上文件系统一般没办法保证数据一定不丢失,甚至哪些丢失哪些能恢复也是不确定的。
一般来说,文件系统有以下的几种策略:
1. 完全不管错误的事情,错了就错了;
2. 打标记位的方式,如果怀疑有错,通过磁盘检测功能恢复;
3. 在设计上保证文件系统结构上可恢复,但不保证用户数据可恢复;
4. 能在用户数据层面上保证数据的绝对正确。
第一种和第二种策略现在比较少见,FAT文件系统算是属于这类;主流文件系统基本上都能保证第三种,比如NTFS之类的;第四种比较难,一般都要配合存储驱动一起,多见于Flash介质的专属文件系统。
保证数据不损坏,具体的方案一般有:
方案1:Copy-On-Write,写数据的时候不在原来的位置写,而是先读一份,然后写到另外一个位置,当确认写成功时,把文件系统的指针指向新的位置。如下图:
实际应用中,比这个情况复杂,因为Data2写入的过程中,File1本身的一些信息(修改时间等)也发生了变化,所以CopyOnWrite产生的影响不止这一个块,而是很多。
方案2:日志(Journal)技术。使用日志记录meta-data甚至是数据块的变化情况(NTFS就是这种策略),一旦出现掉电情况,在日志中反推到一个正确的状态上,就可以保证meta-data不损坏。
常见的方案就这两种,当然还有别的更复杂的技术,可以参考这个链接(Comparison of file systems),但不管用什么方案,本质上都是以牺牲性能为代价换取结构上的稳定。
最后回到题主的问题,文件系统如何保证数据的正确性?如果是指文件的数据部分,是无法保证的,因为文件系统无法确定数据到底写没写进去,绝大多数文件系统只能保证自身结构是正确的,但这个正确可能是回滚之后的状态,具体回滚多少内容,文件系统自己也不能保证。
DIY绝对没有死,只是会长期处于“与高价显卡卡共存”的状态。
在当下这个显卡价格飙升的时代,我们应当客观看待问题、全面认识现状,要立足当前以着眼长远,抓住机遇以应对挑战。
我认为,作为普通消费者,在应对买卡难、买卡贵的问题上,应该保持“十个心”:
对DIY事业的热心,对形势变化的关心
对逐步降价的耐心,对公平交易的真心
对抵制奸商的决心,对显卡市场的关心
对光明未来的信心,对长久斗争的决心
对艰难困苦的恒心,对忘我奉公的义心
对DIY要做到不动摇,不放弃;不改变,不妥协。
看准时机购买显卡,该出手时就出手,应当做到“十个点”:
着眼立足点,找准出发点
认清优缺点,明确轻重点
找准切入点,明确落脚点
探寻突破点,把握着重点
结合关键点,牢记中心点
扬弃优缺点,贯彻根本点
面对变化多端的市场环境,我们既要笃定坚守初心,也要勇于开拓进取,务求贯彻“十个新”:
看清新形式,抓准新要求
开创新思路,制定新方案
发展新水平,追求新境界
采用新举措,谋求新高度
探索新实践,推动新发展
我们在面对高价黄牛卡时,要保持头脑特别情形,态度特别鲜明,行动特别果断。要坚决冲破旧思想观念的束缚,坚决破除利益固化的藩篱,坚决守护人民群众的利益!