π导航  


【首页】

避免数据存储灾难的11种方法


【2019-04-01】 自然杂志】


1. 应用3-2-1规则

加州诺瓦托数据恢复公司DriveSavers的工程总监迈克尔•科布(Michael Cobb)说,备份数据时要遵循的经验法则是“3-2-1”。例如,你可以在你的个人电脑、外部硬盘和基于云的文件同步服务Dropbox上保存副本(每个用户每月12.50美元,用于3个或更多的用户和3 tb的存储空间)。伊利诺伊大学厄巴纳-香槟分校的信息科学家伊丽莎白•威克斯指出:“这是一个从法律中获取灵感的规则,而不是法律。”珍贵的数据可能需要额外的预防措施。

2. 与专家交谈

位于马萨诸塞州波士顿的哈佛催化剂公司(Harvard Catalyst)负责数据管理的朱莉安娜施耐德(Juliane Schneider)建议,你所在的机构雇佣员工全职思考数据问题,所以要和他们谈谈。你的研究计算中心可能提供免费或低成本的机构备份系统;你的图书管理员可以帮助你制定数据管理策略;您的赠款办公室可以就资助机构的要求向您提供建议,包括如何以及多长时间必须维护数据。她说:“他们想帮助你保存你的数据——尤其是如果你有助学金的话。”

3.管理你的数据

可靠的备份需要聪明的数据管理。加州大学伯克利分校(University of California, Berkeley)的数据科学家西拉?蒂尔笑着补充道,“你不能只保留那些给你带来快乐的数据!”

建立文件命名和组织的约定——例如,每个项目都有自己的文件夹;数据和代码进入专用子目录;每个项目文件夹都包含一个文件,该文件记录了项目的目标、方法、元数据和文件。计划数据在何处以及如何备份,并制定一个时间表——例如,每天或每周——以便这样做。

原始数据应该始终保存,但是中间处理文件通常可以被丢弃。庞大的数据集需要特殊的考虑:一些基于云的提供商限制了存储文件的大小,数据传输和存储成本可能变得令人望而却步。

4. 保护隐私

从病人或学生那里收集的数据常常受到限制,这意味着它们不能存储在任何地方。威克斯说,在她的研究所,研究人员有几个基于云的数据备份选项,但只有一个被批准用于敏感数据。您部门的IT团队可以提供建议。“不遵守数据保护规定可能会非常严重。你可能会面临经济处罚,或者失去进行研究的能力。

5. 自动备份

在进行备份时,自动化是关键。澳大利亚布里斯班昆士兰大学(University of Queensland)的心脏遗传学家凯利·史密斯(Kelly Smith)可以访问一个共享的网络驱动器,该驱动器被复制到磁带上。她过去常常手动将文件移动到硬盘上,但只是每月一次;如果驱动器失败,则可能丢失较新的文件。来自加利福尼亚Sunnyvale数据保护公司Druva inSync的一个名为Druva inSync的自动化云备份系统现在消除了这种担忧。“这是我不用担心的一件事,”她说。

“你必须不去想它,”蒂尔解释道。“因为当你压力最大的时候,事情就会变糟,你会忘记过去三个月的备份。”

6. 保护原始数据

所有的数据都是宝贵的,但是原始数据是不可替代的:重新创建它们的唯一方法是再次运行实验。因此,必须备份这些文件,并将其作为只读文件保存。威克斯曾经不得不终止一个项目,因为她在Microsoft Excel中打开了一个关键文件,该文件会自动格式化一个列,更改值并破坏底层数据集。

7. 使备份成为可能

对于实验室的新成员以及熬夜的博士后来说,数据管理计划必须易于遵循。“你可能会说,‘哦,这是一个完美的系统。“好吧,现在,你打算在凌晨3点做吗?”,在你为某事工作了24小时之后?你会在处理代码问题的时候这么做吗?”芯说。作为一个团队来讨论这个策略,并确保它是可行的。然后,就像你在零下80°C的冰箱中所做的那样,模拟灾难来袭时会发生什么:你会丢失哪些数据,以及恢复的速度有多快?蒂尔说:“至少,这是一个有价值的思想实验。”

8. 定期测试备份

不要假设备份是有效的:测试它们。你能打开你的文件吗?您是否有必要的应用程序、登录凭证和注册密钥来运行它们?威克斯的部门IT服务为员工提供了一个免费的CrashPlan账户,该账户来自明尼苏达州明尼阿波利斯市的Code42 Software,可以自动备份到云端。一天,威克斯决定测试她的备份,结果发现它在六个月前就停止同步了。她说:“我很好,因为我也有一台本地的时光机备份。”她指的是苹果为运行麦金塔(Macintosh)操作系统的电脑准备的备份系统。科布重申了他在技巧1中给出的建议:“因此,3-2-1备份,然后恢复(一些关键文件)。然后在不同的电脑上、不同的房间里、不同的设备上进行测试——因为如果最坏的情况发生了,你就不会拥有你的设备了。”

9. 预期意想不到的

生活发生了。科布在2017年的一场野火中失去了所有的个人财产,他的一个客户在消防洒水器下储存了96个硬盘。有一天,洒水器爆了,圆盘被水淹没了。“这些数据都没有得到备份,”他说。纽约市洛克菲勒大学(Rockefeller University)的神经生物学家莱斯利·沃肖尔(Leslie Vosshall)在2012年几乎丢失了她的蚊子基因组测序数据。此类事件是不可避免的,但往往是可以预料到的——因此,要努力寻找漏洞。大约一年半前,科布的办公室发生了一次小地震——这在加州并不奇怪。美国前总统、前客户杰拉尔德•福特(Gerald Ford)的一张照片从墙上掉了下来,“正好”砸在他的笔记本电脑上,屏幕被砸得粉碎。“在那之后,我就想,‘我最好把东西搬来搬去,这样我就能做好更好的准备。’”

10. 保存脱机备份

联网的备份设备非常方便:数据随时可用。但这些设备也很容易受到用户错误和恶意软件(恶意软件)的攻击。数据恢复公司Data Mechanix的首席技术官克雷格•拉格尔(Craig Rager)表示,他的许多客户都遭受过勒索软件攻击,即病毒对计算机硬盘进行加密,使其无法使用。Data Mechanix是一家位于加州欧文的数据恢复公司。他指出,备份驱动器,无论是直接连接到计算机上还是通过网络,也可能在这样的攻击中受到攻击。“因为你永远不可能100%消除这种威胁,所以你唯一能做的就是让你备份的设备离线,或者无法进入你的网络,”例如,关掉电源。

11. 提前计划

最终,您的数据需要在将来可用。所以,考虑一下“未来的你”,蒂尔说。考虑保存数据的媒体以及用于打开数据的应用程序。试着跟上时代。她说,Vosshall的大部分早期数据都是以过时的磁盘格式存储的,这意味着它们是备份的,但无法访问。“我得去古董店找个读者。即使是云计算也不能提供保证:数据存储公司可以改变他们的业务优先级,否则你可能会失去对你账户的访问权。因此,请确保保持本地备份——或者至少在独立服务上备份数据。“人们会问,‘你是说,你不信任谷歌医生?“维克说。“这并不一定要相信谷歌文档,而是要相信你不会失去访问权限。”



                  
   
        

copyright©2018-2024 gotopie.com