background image

支持连续数据保护的云备份系统架构设计

摘要:为了解决目前云备份系统恢复目标时间点不连续以及恢复粒度太粗的问题,将连续

数据保护技术应用到云备份系统中,提出了一种支持连续数据保护的云备份系统。本系统能

够提供秒级的连续恢复时间点,且数据块级别的备份层次能够屏蔽异构平台,具有更广泛

的应用前景。系统以私有云为架构基础,部署在防火墙内部,对数据安全有很高的保障。

    随着计算机技术的快速发展,保障数据的完整性变得越来越重要。德州大学的研究结果表
明,一旦关键业务数据丢失,可能引起

34%的公司立即倒闭,51%的公司在两年内倒闭,

所以构建完善的数据保护系统是近年来研究的热点。多版本备份是保护数据最有效最常用的
方案,面对海量数据的增长,

PB 级的海量存储需求越来越普遍,企业和个人迫切需要大量

的空间来备份数据。云备份是一个很好的解决方案,可以满足企业和个人海量数据备份的需
求。目前云备份系统仍属于起步阶段,尽管其实现架构没有统一标准,但国内外少数公司已
提供了相关产品:微软的

Azure Storage 是一种能提供块级数据备份服务的云备份产品,但

其只支持单一快照节点,用户只能恢复到最后一次上传数据的状态,恢复丢失的数据量

Recovery Point Objective,RPO)取决于网络质量,而且目标恢复时间点局限性太大,远

不能满足用户需求;

EMC 和上海电信合作开发的产品“e 云”,虽然支持多快照节点备份,

可供用户选择的恢复目标时间点不再是单一的,但其仍然采用传统备份方法,即根据用户
设定的备份时间间隔,定期进行数据备份,粒度为分钟,若磁盘阵列的写速率为

500 

MB/s,1 分钟能够存储的数据大约是 30 GB,因此最多只能恢复到 1 分钟前的数据状态,

RPO≈30 GB。针对目前云备份产品的缺陷,本文提出一种支持连续数据保护的云备份系

统(

Continuous DataProtection Cloud Backup,CDP-CB),该系统以私有云架构为基础,引

入连续数据保护技术,彻底打破了传统以时间间隔为基础的周期性备份方案,主动截获每
个时刻的数据更新并立即将其备份,备份数据的时间是连续的,不再有时间空隙,能够提
供秒级的连续恢复时间点,

RPO≈0,具有更高的可靠性和可用性。

1 CDP-CB 系统关键技术
    CDP-CB 系统是一种基于私有云架构的数据备份和防护系统,通过引入连续数据保护技
术,实现了比

Azure Storage 和“e”云更完善的云备份功能,主要包含两个关键技术:连续数

据保护技术和云备份技术。

1.1 连续数据保护技术
    连续数据保护技术(Continuous Data Protection,CDP)是一种最高形式的数据保护技术,
对任何引起数据丢失的故障或者灾难都具有保护能力,比如病毒侵袭、地震、火灾等,都可
以 确 保 业 务 数 据 不 丢 失 。 按 照 存 储 网 络 行 业 协 会 (

StorageNetworking  Industry 

Association,SNIA)的定义,所谓的连续数据保护技术是指连续捕捉和保存数据状态的变
化,并将变化后的数据独立保存在原始数据之外,从而允许将数据恢复到过去任意时间点
的状态。它打破了传统数据保护方案的周期性备份以及离散的可恢复时间点的缺陷,真正将
数据丢失量降到最低,即

RPO≈0。

    目前已有的云备份系统,比如“e”云,给用户提供多个恢复目标时间点,但由于其仍然采
用传统的周期性备份方案,即每隔一段时间对业务数据进行备份,使得恢复目标时间点不
连续且恢复粒度太粗,如果发生故障或灾难,会造成部分业务数据丢失。为了解决以上问题,