一行代码毁掉整个公司
事件经过
一家小 型主机托管公司的老板Marco Marsala于4月10日在serverfault论坛发帖请求帮助,他表示自己的公司,有1535位客户,使用Ansible配置和管理工具去管理服 务器。4月9日晚上,他不小心在所有服务器上执行了一个Bash脚本,因为代码存在bug,他的rm -rf命令删除了所有服务器文件即所有客户的数据,包括刚刚挂载的远程存储里的备份文件。(新闻来源:Soft Pedia|cnbeta.com 编译)
事件原因
这一错误源自Ansible上糟糕的代码设计,这款Linux实用工具被用于在多台不同服务器上自动执行脚本。开发者解释到,实际参数应该是“rm -rf {foo}/{bar}”,foo和bar是脚本中动态传递的两个变量。
然而由于变量处理出错,通用语法未能成功在bash命令中插值,所以最终指令就变成了可怕的“rm -rf /”。
“rm -rf/”意味着擦除根路径“/”下挂载的所有内容而无需询问。
鉴于Marsala运行着1535个集群,其本来是能够在数小时(至数日)内恢复的。在通常情况下,备份网络理应和正常的生产力基础设施隔离开的。但由于Marco Marsala未能妥善实现隔离,备份档也全没了。
除了人祸,还有天灾,机房面临的潜在威胁实际要比我们想象中多。
2009 年:西雅图Fisher Plaza数据中心的变压器起火引发火灾。造成包括微软Bing Travel、Authorize.net、Redfin、Big Fish Games、Survey Analytics等网站服务器的中断运行以及其他数据中心的宕机。
2010年:澳大利亚遭遇暴雨引发的洪水,Datacom网络中心的天花板被冲毁,服务器、存储和网络设备都遭到损坏,直接导致通信服务中断。
2011年:日本9级大地震,东京的IBM数据中心受损严重,包括很多大型机和传统服务器受损。
2012年:美国东海岸受超级飓风“桑迪”影响,整个地区停电,殃及游戏巨头暴雪的数据中心,引发《使命召唤》和《吉他英雄》系列的网络服务大规模瘫痪。
有些灾难无法避免,但是灾难造成的数据损毁是完全可以避免的。
解决方法就是——三份备份,云端储存!
众 所周知,企业的灾备方案核心在于两点,一个是备份,一个是恢复。传统灾备方案无一不是在这两方面做文章,在备份、恢复的速度、容量、方式、可扩展性等方面 有所创新。但大数据时代的到来,让传统灾备方案的创新面临窘境。例如,传统灾备方案多基于磁盘方案,但闪存应用开始普及,存储介质的革新开始影响灾备效率 的重新思考;传统灾备方案多基于结构化数据,但移动互联、物联网的应用普及将非结构化数据的利用推向新的课题,数据形式的多样性开始影响存储形态、存储架 构更多的思考;传统灾备方案多依靠本地网络能力的资源限制了资源的传输效率,致使备份与恢复发展缺乏应有的效果……如今,云服务来了,灾备系统当然不能停 留在故步自封的状态,云灾备已成为当今大数据环境下企业的刚性需求。
要实现全面的数据保护,企业应存有三份备份数据(其中一份在生产环境),存放于2种不同媒体,并有一个备份存于异地环境。
也许有企业会认为三份数据备份有点过度,但假设数据故障是独立事件,同时遗失三份数据的机率便是百万分之一,并非是只有一份备份时的百分之一,这样可大大提高可靠性。另一个需要多于两份备份的原因,是可将主副本及备份存于不同地方。
用两种不同媒介保存可确保不会因为使用同一装置存储数据而引起相同的故障。由于同一存储方案的不同硬盘有可能连续发生故障,建议将数据存于至少两种存储媒介,而且媒介需要位于不同地方。此外,由于火灾等意外即可损坏所有硬本备份,把数据存放于云端上也是最优之选。
云灾备——灾备领域新兴容灾方式
云 灾备是指将灾备看做一种服务,由客户付费使用灾备服务提供商 提供的灾备服务的模式。采用这种模式,客户可以利用服务提供商的优势技术资源、丰富的灾备项目经验和成熟的运维管理流程,快速实现客户的灾备目标,降低客 户的运维成本和工作强度,降低灾备系统的总体拥有成本。使用公有云的基础设施来实现数据保护、备份归档和灾难备份,比起传统IT有着更多无法比拟的巨大优 势:一是低成本,视需要使用云来备份,可以减少多达85%的灾备支出;二是无需自建管理数据中心,免去购买使用维护各种硬件所带来的烦恼;三是高效,云中 建立的高可用高容错架构可以提升恢复时间和恢复点目标;四是方便,基于云平台就可以简便快速灵活地构建灾备站点。
云角的QuikDR跨云灾备解决方案为 企业提供了一个行之有效的灾备方案。运用四层灾备——服务器基础架构灾备,文件灾备,数据库灾备,网络灾备等一系列的保护技术,通过不同等级的 RTO/RPO定义,为客户提供不同等级的异地或跨云灾备服务,在最小的成本基础上,将受灾者的数据资料及业务恢复时间降到最低。
当面对电 力、网络中断、硬件故障、自然灾害、人为错误造成的数据丢失和应用瘫痪,容灾服务就是最后一道保障。随着云计算、大数据的兴起与普及,企业不仅关注数据中 心服务的日常数据处理表现,也对业务连续性和稳定性提出了更高的要求。数据中心正在拥抱云计算,加快了灾备服为的创新步伐,促使云灾备成为与时俱进的最佳 选择。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。