网络时代的数据存储
ChinaByte Linux专区授权转载
作者:宏宇
1、数据存储技术的发展和趋势
随着信息社会的发展,越来越多的信息被数据化,尤其是伴随着Internet的发展,数据呈爆炸式增长。因而在未来几年内,存储技术将成为令人瞩目的一个市场。据IDC预测,1999年,世界范围的存储服务市场为210亿美元;而到2003年,更将达到400亿美元以上。在今后的几年内,存储服务市场将进入飞速发展期。基于Internet的应用比如电子商务、电子邮件和客户关系管理(CRM)等将成为存储服务的主要市场,因为他们都需要对大量数据的快速访问。从存储服务的发展趋势来看,一方面,是对数据的存储量的需求越来越大,另一方面,是对数据的有效管理提出了更高的要求。
数据存储和存储管理技术最早起源于70年代的终端/主机的计算模式,当时由于数据集中在主机上,因此,连接在主机上的硬盘和磁带是当时主要的存储和备份的设备。80年代以后,由于个人电脑的发展,尤其是客户机/服务器模式的出现,使得数据存储分布化。此时网络上文件服务器和数据库服务器往往是重要数据集中的地方,而客户机上也有一定量的数据,数据的分布造成数据存储管理的复杂化。而九十年代Internet的迅猛发展,也使得存储技术发生着革命性的变化。这种变化主要表现在三个方面:首先是存储容量的急剧膨胀,从而对于存储服务器提出了更大的需求;其次是数据持续时间的增加。今天,Internet使网络数据必须保证每天24小时、每周7天、每年365天处于可获得状态。最后,对数据存储的管理提出了更高的要求。数据的多样化、地理上的分散性、对重要数据的保护等等都对数据管理提出了更高的要求。
2、数据存储的重要性
从国际上看,以美国为首的发达国家都非常重视数据存储备份技术,而且将其充分利用,服务器与备份设备的连接已经达到60%以上。而在国内,只有不到15%的服务器连有备份设备,这就意味着85%以上的服务器中的数据面临着随时有可能遭到全部破坏的危险。对于一个企业来说,网络数据的安全性是极为重要的,一旦重要的数据被破坏或丢失,就会对企业日常生产造成重大的影响,甚至是难以弥补的损失。根据3M公司的调查,对于市场营销部门来说,恢复数据至少需要19天,耗资17,000美元;对于财务部门来说,这一过程至少需要21天,耗资19,000美元;而对于工程部门来说,这一过程将延至42天,耗资达98,000美元。而且在恢复过程中,整个部门实际上是处在瘫痪状态。在今天,长达42天的瘫痪足以导致任何一家公司破产! 据美国劳工部的统计数据,93%的有严重数据丢失的公司在5年之内破产;维斯康星大学的统计结果也显示,43%的美国公司在数据灾难后关门;而29%的公司在两年之内破产。这些统计数字表明,提供可靠的数据存储保证是至关重要的,而有效的手段是采取数据备份技术。
3、存储备份技术
存储备份技术并不仅仅指数据的简单备份,还包括内容及备份的管理等多方面。存储备份包括硬件备份和软件备份两大类,而真正意义的存储备份更强调软件的备份。硬件备份不能代替数据存储备份,若发生人为的错误,由此引起的数据丢失也就无法恢复了。事实证明,只有采取硬件备份和很好的管理软件相结合,才能为人们提供安全的数据保护。
数据存储备份技术一般包含硬件技术及软件技术等,硬件技术主要是磁带机等存储硬件技术,因为磁带可以提供高容量、高可靠性以及可管理性,而且价格便宜,因此是硬件备份的首选设备。软件技术主要是通用和专用备份软件技术等。备份软件技术在整个数据存储备份过程中具有相当的重要性。除了操作系统本身提供的一些基本的备份功能之外,专业的备份软件是十分重要的。比如比较流行的备份软件有CA的ArcServe2000、Veritas的BackupExce以及Legato的Networker等。
4、数据复制和同步技术
除了存储备份技术之外,随着数据在地理上越来越分散,在不同的地域之间提供存储数据的复制和同步服务业变得至关重要。可以想象,对于一个为客户提供服务的大型网站而言,数据的及时更新是必不可少的。而人工对地理上分散的服务器进行更新是非常的困难,而且容易出现错误。因此需要专业的数据复制和同步技术来实现地理上分散的服务器之间的同步。
5、NAS和SAN存储技术
传统的直接存储的模式是直接将存储设备连接到服务器上,一方面,当存储容量增加时,这种方式很难扩展;另一方面,当服务器出现异常时,会使数据不可获得。
NAS和SAN的出现适应了三种重要的发展趋势:网络正成为主要的信息处理模式;需要存储的数据量大大增加;数据作为企业的生命和核心竞争力的重要性在增加。
NAS(Network Attached Storage) —— 网络连接存储,即将存储设备连接到现有的网络上,提供数据和文件服务。NAS服务器一般由存储硬件、操作系统以及其上的文件系统等几个部分。可以实现即插即用的功能,提供方便快捷的存储服务。
这种方法从两方面改善了数据的可用性。第一,即使相应的应用服务器不再工作了,仍然可以读出数据。第二,简易服务器本身不会崩溃,因为它避免了引起服务器崩溃的首要原因,即应用软件引起的问题。
NAS产品具有几个引人注意的优点。首先,NAS产品是真正即插即用的产品。NAS设备一般支持多计算机平台,用户通过网络支持协议可进入相同的文档。其次,NAS设备的放置位置同样是灵活的。无需应用服务器的干预,NAS设备允许用户在网络上存取数据,这样既可减小服务器的负荷,也能显著改善网络的性能。
SAN( Storage Area Network)—— 存储区域网络,即通过特定的互连方式连接的若干台存储服务器组成一个单独的数据网络,提供企业级的数据存储服务。SAN方式易于集成,并可扩展,能改善数据可用性及网络性能。利用SAN,不仅可以提供更大容量的存储数据,而且地域上可以分散,并缓解了大量数据传输对于局域网的影响。SAN的结构允许任何服务器连接到任何存储阵列,这样不管数据置放在那里,服务器都可直接存取所需的数据。
因为SAN解决方案是从基本功能剥离出存储功能,所以运行备份操作就无需考虑它们对网络总体性能的影响。SAN方案也使得管理及集中控制实现简化,特别是对于全部存储设备都集群在一起的时候。
SAN主要用于存储量大的工作环境,如ISP、IDC、银行等,随着这些用户业务量的增大,SAN也有着广泛的应用前景。
二、Linux在存储技术的应用
那么,Linux可以在存储服务领域起到什么样的作用呢?
一方面,Linux系统越来越成熟,并有很好的网络支持和文件系统支持。目前,Linux几乎支持所有主流的网络硬件、网络协议和文件系统,因此是NAS的一个很好的平台。
此外,由于Linux有很好的文件系统支持,因此它是数据备份、同步和复制的很好的平台。
再者,在存储区域网络SAN领域,可以利用Linux系统和一般硬件作为存储服务器。美特尔科技有限公司的LinuxDisk技术正是利用Linux平台和普通的Intel硬件提供存储服务。这使得Linux在几乎存储服务的个个主要领域都可以起到很大的作用。
发布人:netbull 来自:Linux专区