盘点备份中重复数据删除方法

  2009-11-03 15:35:25  来源:TechTarget  

   本文介绍了重复数据删除遵循了IT业界常有的模式:产生一个新技术来满足由来已久的需求,但是当其应用逐渐拓展的时候,又提出了怎样才能更好地利用这一技术以及它将如何影响周遭环境的问题。

    重复数据删除对数据存储专业人员来说是2009年最热门的话题。它不再是高精尖的技术,而其成本节省对预算有限而数据又在迅速增长的企业来说非常诱人。作为回应,存储厂商正在推出更多的重复数据删除产品和方案来降低数据存储点的大小。

    结果是,重复数据删除遵循了IT业界常有的模式:产生一个新技术来满足由来已久的需求,但是当其应用逐渐拓展的时候,又提出了怎样才能更好地利用这一技术以及它将如何影响周遭环境的问题。幸运的是,有足够多经验丰富的存储专业人士正在使用重复数据删除来检验所有这些方式的优缺点。

    “很多厂商都将重复数据删除作为一个功能推向市场,更多的厂商将要推出”ESG分析师LaurenWhitehouse说“客户面临着一片未知的丛林,但是也存在很多新的困惑。”

    重复数据删除的不同方法

    独立备份专家W.CurtisPreston说,重复数据删除方法可以分为两大类:和硬件捆绑的及纯软件的。硬件产品包括IP连接的NAS和光纤连接的虚拟带库。软件方面,可以粗略分为在服务器级处理重复数据删除的“源”产品,和在NAS或者虚拟带库上处理的“目标”产品。

    Preston在评估产品时的首要原则是,只有少数的用例必须使用特殊的方案。其它的则可依据个人喜好。90%的用户可以使用任何(市场上的产品)而将工作完成的很好。

    基于硬件的方案(见下表)不需要对正在使用的备份软件做改变。硬件可以被优化来提升性能,但是重复数据删除的计算是由软件进行的。

    基于硬件的重复数据删除产品

    通常来说,基于IP的NAS和虚拟带库方式在性能和扩展性方面是最好的。美国某医院和卫生所组织MultiCareHealthSystem在试用过DataDomain之后,选择了SepatonInc.sS2100-ES2虚拟带库来备份他们的Windows数据,因为它的扩展性较好。

    MultiCare的资深SAN、Unix系统管理员EricZuspan在1月份告诉SearchStorage.com说DataDomain的DD460DD560重复数据删除磁盘阵列“性能十分有限”。一个典型的DataDomain用掉4.5小时的Windows备份,在Sepaton系统上只用了1小时20分钟。Zuspan说他们公司的Windows小组仍在使用DataDomain,但是可能会在未来将其淘汰掉。

    在线和后处理重复数据删除

    在具有足够的容量的情况下,有些在线厂家争辩说后处理可能会导致备份超出时间窗口。美国某治安局的备份和E-mail管理员DouglasBlackburn,一个DataDomain用户,说他喜欢在线重复数据删除,“因为(备份)结束的时候就一切都结束了。”不过,后处理的好处是,不用担心耗费CPU的重复数据删除进程会在备份服务器和次级存储目标之间造成一个瓶颈。

    Sepaton和FalconStor最近开始提供他们所谓的“同时处理”。这种方式仍先把数据存储到一个磁盘的缓冲区中,但是不等待备份完成就会进行重复数据删除。

    遍布全球:全局重复数据删除

    当客户将更多的数据进行去重复之后,厂家能否跨越多个控制器来进行数据去重复就变得重要起来了。这就是所说的全局去重复。截至目前,只有FalconStor,IBM,NEC和Sepaton的产品能提供这一功能。

    作为代价,客户必须在多个设备之间分裂备份流,并平衡他们的负载。治安局已经碰到了DataDomain的扩展性问题,该到为主用的DD560增加一个扩展机柜的时候了,这是那个设备的局限。如果橙郡增加一个新的设备,那套系统将不能看到网络里的另一套系统。Blackburn说他想加入一套DataDomain的DD690网关,以便他选择自己的存储以及后端上的扩展策略。

    “我想使用我们自己的EMC存储。”Blackburn说。

    不过,DataDomain的网关不支持EMC的存储,──这是现在这个市场上很常见的兼容性症结的一个例子。DataDomain的CEOFrankSlootman将这个指责完全归咎于EMC。

    “我认为EMC在和我们合作的时候没有把客户放在第一位,”他说。一个EMC发言人拒绝就此发表评论。

    有些客户根据他们是否需要整合磁带来选择硬件目标设备。“两种设备(DataDomain和Quantum)在定价方面都十分具有侵略性。”加拿大OntarioAIC有限公司IT基础架构经理BenBarnes说“但是最后,当我们查看Quantum的报价的时候,所有东西都包括了──系统,磁带,软件授权和支持,所有都在一个价格内,而DataDomain则不是一次购齐的。”

    这不足为奇,尽管Quantum的基于磁盘的业务正在更快速地成长,它的传统还是一个磁带供应商。DataDomain则是作为一个磁带的替代方案而兴起的。Barnes大约9个月前安装了一套Quantum的带有重复数据删除的DXi5500光纤虚拟带库。

    尽管很多和Barnes的公司容量规模差不多的公司都在努力彻底摆脱磁带,Barnes说为了法规遵从磁带还是必须要有的。他们公司每个月通过Symantec的BackupExec和Quantum的Scalar50磁带库进行一次全备份,作为归档用途。这个过程耗时接近24小时,他说,但是因为运营恢复现在是通过磁带进行的,“这不会对流程有什么影响──我们就让它在那运行着了。”

    安装光纤虚拟带库系统的时候也考虑到了未来的增长。“如果业务产生变化,我们不希望有需要做出巨大的变化的情形出现。”

编辑:白雪
2
发表评论
关于我们 | 广告服务 | 版权声明 | 服务条款 | 隐私声明 | 联系我们 | 友情链接 | 网站地图 | RSS
中企动力商务 © 版权所有
本文介绍了重复数据删除遵循了IT业界常有的模式:产生一个新技术来满足由来已久的需求,但是当其应用逐渐拓展的时候,又提出了怎样才能更好地利用这一技术以及它将如何影响周遭环境的问题。