|
日久更见容量优化的效益所在 重复数据删除技术大约是从去年进入人们视线的,最初提供这项技术产品的企业包括Asigra、Avamar、DataDomain、Diligent以及OEM软件企业Rocksoft等。如今,我们看到几乎所有销售数据保护产品的企业都开始涉猎这项技术,业内人士对重复数据删除技术寄予厚望。 市场的活跃使用户能够享受越来越廉价的存储产品,但是因数据疯狂增长带来的高成本支出使得企业IT部门仍然恨不能把一分钱掰成两半花。这一需求造就了重复数据删除技术及工具的大热,它理论上能以20∶1的比例压缩已有数据,释放存储空间,大大降低企业存储备份的成本。 重复数据删除技术的核心理念就是:在存储数据时检查和比较已存在的数据,如果它们是相同的,那么就过滤掉这部分数据的备份,然后通过指针引用已存在的数据。 重复数据删除技术粗略可以分为在线处理和后处理。在线处理即先接收到所有的数据并写入磁盘,然后再通过重复数据删除处理将这些数据重新读取并处理一次;后处理则是在接收数据的同时就直接删除重复的数据。究竟是选择在线处理还是后处理,则要根据实际情况工作量的大小来确定。 节约空间和带宽 重复数据删除的客户价值是多方面的,但是最显著的优点是解决了一直困扰备份恢复业界多年的“容量膨胀”问题,因为重复数据删除可以在后端大大减少备份数据量。 节省备份设备的磁盘空间并不是子文件重复删除技术的惟一应用。新一代的备份软件,包括Asigra的Televaulting、EMC的Avamar Axio和赛门铁克的NetBackup PureDisk采用基于散列的重复数据删除技术,减少了通过广域网发送备份内容所需的带宽。 举例来说,如果CEO把一个100 MB的PowerPoint演示文档发送到100个分支机构,该文档就会在最先执行备份计划的那个分支机构备份起来。其他所有分支机构只要发送散列到总部,就会被告知“我们已得到该文档,谢谢!”已经应用该技术的用户在报告中写到,他们在不对备份流程做大改动的情况下,的确获得了20∶1的缩减比例。 这些是如何做到的呢?与进行增量备份的任何传统备份软件一样,这些新一代备份软件使用归档位、上一次修改日期和文件系统更改日志等通常方法,来分辨上一次备份后发生变化的文件。首先,当本地服务器接收到新文档(文件)时,它们对文件进行交叉分析,并把文件分成比较小的数据块,为每个数据块算出一一对应的散列;然后,将这些散列与在本地备份的数据块的本地缓存散列进行比较,如果散列没有出现在本地缓存和文件系统元数据中,就会被发送到该企业的中央备份服务器,由该服务器再将数据与散列表进行比较。检查完毕之后,中央备份服务器会向本地服务器发回散列表,上面列的是它以前未发现的散列。然后本地服务器将发送那些“未发现的散列”代表的数据块到中央服务器进行保存。与被备份到多个目标的服务器数据进行“重复删除”的备份方案相比,上述这些备份方案缩减数据的程度更高。 从边缘走向主流 重复数据删除在成本上可能产生的巨大收益,让更多的用户无法抵御它的诱惑。 一家总部设在明尼阿波利斯的律师事务所Winthrop & Weinstine使用了重复数据删除技术提供的新的备份模式,该事务所使用的是Data Domain提供的备份和恢复软件,将数据复制到远程站点。当数据量被压缩了20倍左右之后,基于磁盘介质的备份模式不再昂贵得无法接受,而该事务所也得以摆脱了传统的磁带备份, 有了全新的容灾架构选择。 2006年,业界对于重复数据删除技术的关注持续升温。2007年,重复数据删除技术成为存储技术的亮点,客户数不断增长并已经覆盖金融、政府、制造、教育等多个行业,各种成功案例给潜在用户以很大信心,这也预示着重复数据删除技术已经从边缘走向主流。 链 接:专家建议 重复数据删除技术也许是现在最热门的话题,但是分析师们表示用户应以谨慎的态度来对待这个广受炒作的技术。鉴于此,一些学者专家提出建议: 认真研究替代产品 StorageIO Group分析师Greg Schulz认为:“重复数据删除技术并不是减少数据量的惟一方法,数据压缩技术带来的数据减少率可小于前者,但是它的性能水平相对更稳定一些。” 注意安全因素 新泽西教育服务供应商Timecruiser公司首席技术官James Wang表示:“我们已经采用了重复数据删除技术,它强调单实例存储器。当你在进行重复数据删除时,会失去以前的许多副本,最后只保留一个副本,因此你必须很小心地去保护它。” 做好自己的功课 Glass House公司副总裁Curtis Preston说:“采购任何一款重复数据删除方案必须亲自体验,你必须明确区分的事情包括整体性能和单独的备份流量性能,同时恢复以及单独恢复新近备份数据和较早以前备份数据的效果。每一个拥有大量数据的用户至少都应该试一试重复数据删除技术。目前这个领域内已有众多竞争者,不同厂商的重复数据删除方案实现方式各有不同,因此有些方案可能对某些用户来说是很好的选择,但对于其他人就不一定合适了。” 厂商声音 NetApp资深技术顾问姜群: “重复数据删除技术能让企业用户正视磁盘备份的价值所在。虽然磁盘价格已经大幅下滑,但其成本仍与磁带有一段差距,导致迄今为止部分企业用户仍未大举采用磁盘。数据重复删除技术则能凸显磁盘备份相对于磁带备份的强项。” Data Domain公司销售副总裁David Schneider:“为了保证数据的安全和可靠,公司的磁盘备份产品采用了RAID 6技术,而且所有硬件都是冗余的。此外,在数据压缩的过程中,公司的磁盘备份产品会不断地从头检测被压缩的数据是否正确,从而保证了备份数据的安全。” (责任编辑:罗洪泽)
|