LanternD +

担心硬盘数据丢失的年纪

随着时间的推移,当初觉得无须担心的事情开始起了变化。谈谈数据的保存。

 

Nature's first green is gold,
Her hardest hue to hold.
Her early leaf's a flower;
But only so an hour.
Then leaf subsides to leaf.
So Eden sank to grief,
So dawn goes down to day.
Nothing gold can stay.
——Robert Frost (1923)

一个问题引发的……

 前几天,朋友问我个问题:「旧笔记本拆下来的64G ssd,怎么利用?」我思考了一番,回了个「放抽屉里」,毕竟我手上的U盘都128GB了;他接着问:「加30元变成移动硬盘靠谱么?」我回:「不靠谱,我现在只认网盘」。

 我意识到,现在似乎到了该面对大量冗余数据的时候了。我(们)得开始面对过去积累的数据应该怎么处理的问题了。这个又分为两个层面,一个是过多的数据应该如何保存,第二是数据丢失怎么办。

 我第一次的深刻记忆是,我曾经有个移动硬盘,存着很多我高中阶段录的老师讲课的音频,结果貌似被偷了,反正找不着了。我觉得特别可惜。从那时候起我对我拥有的数据倍加珍惜。

 在这个时间点,我平时存东西的一个移动硬盘已经有5岁了,每次插上电源,盘子都得转个两三分钟电脑才能识别出来,我觉得不久的将来它就要坏了。

 另一个例子是我台式机的机械硬盘,当年组装电脑是SSD系统盘加机械硬盘作为数据盘的组合。目前看起来系统SSD没啥不适,但是机械盘则出现了点进一个文件夹以后缩略图加载好久才出来,或者是文件夹打开有个进度条走半天才出来的情况。在我看来这也是它老化和可靠性下降的表现。

 有趣的是,现在的初中高中生们似乎已经被手机和流媒体服务占据了,根本不考虑数据储存(尤其是音频和视频)的问题。或许对数据的丢失的担心也是一个时代性问题。不过我一直觉得有一部分人的无法摆脱对PC的依赖,因为大屏幕这个需求是很多人无法割舍的。5年前在文章里讨论过,现在趋势仍和当时变化趋势一致。

原因一

 第一个原因是,硬盘的容量通常超过了我们的需求。

 在高中的时候256GB的硬盘(HDD)是主流。经历了一段时间后,到大学期间变成了最大3TB和4TB左右,后来民用级别的硬盘好像就到顶了(貌似现在见到一个盘最大16TB的)。更大容量只能靠继续堆硬盘个数了。但是,除了一直在收藏游戏和高清资源的朋友们,其他人根本用不完这么大的硬盘。就算我疯狂的拍RAW格式照片,几年下来也没超过1TB。其他的文档类的东西加起来顶多十几个GB,不值一提。

 硬盘容量大了之后面临新的问题就是,我们很长时间都不会换新的硬盘。而磁介质这种东西,确实不那么靠谱,要是不及时通一下电,5-10年撑死了,如果没有及时挽救……就救不回来了。

 买越大的盘越容易有这方面的担忧。

原因二

 机龄长。最近突然发现,电脑这东西我已经快用了二十年了。我几乎经历了大部分电脑(和互联网)的变迁。时间长了东西就变成不确定的了(此处和前面的诗形成照应,反映了作者对好东西不易保存的感叹)。如果原因一是外部环境或者因素,那么原因二就是个体因素了。

 很简单的道理,用电脑时间长了数据就多,数据多就得大的盘,大的盘就出现了原因一。

 机龄长还有个特点,就是换过的电脑不计其数,笔记本七八台,台式机四五台。这些前前后后加起来有近二十个硬盘,每台机都有各自独特的一份数据Copy,根本难以处理。

原因三

 大量网盘服务不靠谱。版权资源的保护力度加大了。这一点堵死了用网盘的道路。上传到网上就被净网行动给净了,资源就没了。

 那么开头我为什么会说「我只认网盘呢」?因为其实我只认Dropbox,国内的网盘就用过坚果云稍微靠谱,其他的都是噱头,步子迈大了把用户坑了。Dropbox则是我为数不多的愿意掏钱的应用,因为确实值。

 还有就是,网盘在国内通常是被监管的,所以很多数据就是在裸奔一样,所以不能把敏感数据扔到网上。国外的网盘通常对保护隐私比较重视,如果爆出隐私泄露的话基本就混不下去了。对个人来说,保护好自己的网盘的密码比较重要(参考之前某明星iCloud照片泄露)。

 这些缺点导致有些数据必须存在本地,然后就对实体硬盘有所依赖,然后就有了对硬盘靠谱程度的担忧。不过网盘和实体硬盘都有担忧,本质上一样。

原因四

 操作系统和硬件的不停演进。

 记得在初高中的时候我需要频繁地弄Ghost重装系统,一言不合就重装。一方面是各种操作经常把系统整崩溃,另一方面是病毒实在是有些猖狂。曾经我的软件库需要随着系统频繁地重装,以至于我通常都是放在D盘之类的地方,而且是所谓的「绿色版」或者「Portable版」。

 到了现在系统也稳定了很多,所有软件放在系统盘毫无压力,而且没有重装的必要。我主力的Windows从2014年用到现在都没重装过一次。至于Linux桌面版,直接无脑默认分区就行了,东西都放在一个盘里,数据都Dropbox同步搞定,不需要Windows那样切换盘符。macOS就更无脑了,开箱即用,暂时不知道重装系统是什么东西。

 系统的稳定减少了折腾的次数,所以不折腾的话硬件就比较稳定了。后果是历史数据堆积成山,一个硬盘用个七八年。

 除了操作系统,机器的硬件也处于过剩的阶段。高配电脑主要是为了玩游戏,如果把这个需求去掉,电脑的性能通常供过于求,这就导致不玩游戏的话很长时间不需要更新电脑配置。这也延长了硬盘的使用时间。

数据收藏癖

 还有一点,我(们)现在拥有的数据完全超过了我(们)可以消费的能力。每时每刻都有新的东西进入视线,那些私货放在角落里,根本没有重见天日的时候。有时候去翻一下老的文件夹,就有种在床底找到了丢了很久的某样东西的感觉。在这个前提下,区分数据的优先级就变得有必要了。

 比如我以前会收集软件安装包,MATLAB 2010到2018都有(D版)。明明知道我再也不会再打开那些老版本的东西,但是我也不舍得删掉它们,仿佛它们身上还有附有我的某些记忆片段。再比如大学很多课程的课件,似乎也是再也不会打开了,因为那些知识我再也没用过,而网上也能搜到比那些更全更具体的信息。这一类我称之为「鸡肋数据」。

 还有一类是我长期收集的各种资源,书籍PDF,epub,音频,纪录片,电影之类。它们比鸡肋数据的信息量大,毕竟是我没探索过的,但是我没那么功夫把它们都看一遍。这类我称之为「床底数据」,说不定会看到,但是哪天能看到也说不定。现在占着硬盘的东西都是当年脑子进的水。

实例化

 上面说的也不是什么特别的原因,只是不知道起什么小标题而已。

 回到最开始的问题就是,如果我们把旧硬盘变成了一个移动硬盘,我们就会往里放数据。时间久了,一方面是我们无法直观地知道这个盘里放了什么(因为长成这样的盘手边会有一大堆,比我有七八个U盘,根本不知道哪个里面有什么),另一方面,我们记不住这个硬盘上一次检查数据完整性是啥时候。存在这些问题后,这一份数据就变成了有风险的数据。它们存在于虚无缥缈的空间中,不知道什么时候会出现光照亮它们,也有可能从此湮灭。

 就我自己而言,我第一步是把数据分为三类:第一类是高频数据,比如代码,常用文档,PDF库,还有项目的数据等等,这些数据是优先级最高的,而且最好我能在什么地方都能访问到。第二类是版权数据,所有容易被盯上的数据归为此类,属于「别人创造的数据」。第三类是我自己多年前创造的过时的数据和上面提到的部分鸡肋数据,比如照片、视频,还有一些课件啥的。

 第二步是不同数据类型按不同方式处理。第一类数据全部扔到Dropbox里,等于是每年掏120刀把这部分数据的维护工作外包了。我可以从不同的电脑随时随地访问到它们。我的工作环境也变得非常有序。这部分其实也就几十个GB,Dropbox目前也是大材小用。第二类数据我扔到了NAS里,大概3个多TB,主要是一堆1080P的电影和纪录片,因为NAS年龄不长,而且是双硬盘备份,所以暂时还没这么担心,大概3年后我会重新迁移一遍数据,希望那时候有更大更快的硬盘可供选择。目前的原则是不看就不下载,所以平均大约以一两周4-8GB的步长增加。第三类数据则是让我最纠结的,我怕他们消失,但是我又不想维护它们。三年前,我把七八个曾经的移动硬盘里面的东西都弄进了一个2TB的移动硬盘里。现在它们存在文章开头提到的通电转三分钟才能识别的硬盘里,其实有一定消失的风险。我目前还没有闲工夫处理它们(也没闲钱)。目前只能先这样尬着了。

 第三步并没有完全付诸实践——把一些有价值的回忆重点关照一下。具体策略是把有价值的照片打印出来,把认真处理的视频扔到YouTube上(公开还是Private看情况)。有意思的是很多公司已经大到倒不了了,比如Google这种,自己不作死应该会一直存在(某些业务会关掉,但是YouTube不是其中之一)。所以短期内我还不担心这部分数据的安全性。

 一些杂项,确保我可以确保我的数据是Bounded的:

 (有没有发现,除了游戏和多媒体,其他常见的东西没啥数据量。机器学习的数据其实是不常见的东西。)

 第四步:定期访问并挪动数据。旧的数据挪到更大更新的容器中。这也是我没有付诸实践的。那2TB的数据还在风雨飘摇中。我计划再买一个NAS,并用多盘备份的方式(RAID1变种)去记录重要数据。

第零步

 最重要的:放松心态,如果数据丢失了,别太心疼。这个靠克服心里那道坎了,通过长期自我洗脑解决。

扩展阅读

 如何长时间保存重要数据? - 韦易笑的回答 - 知乎

LanternD
LanternD_Logo






订阅

RSS订阅 微信公众号

图书馆分类法

更多关于『blog』的文章