在云备份系统中引入连续数据保护技术,实时地将客户端每一次数据更新保存到云备份服
务器中,并能够实现任意历史时间点的恢复,保证在发生各种故障或者灾难的情况下用户
数据都不会丢失,确保业务数据的连续性,提高云备份系统的可用性。此外,按照
CDP 捕
捉更新数据的层次可分为
[3]:块级 CDP、文件级 CDP 和应用级 CDP,其中对于文件级
CDP,不同的文件系统需要做不同的设计,应用级 CDP 是嵌入具体的应用软件当中,而块
级
CDP 部署在文件系统下层,可以屏蔽异构文件系统。CDP-CB 系统采用块级的连续数据
保护技术,具有更加广泛的应用前景。
1.2 云备份技术
云备份是云存储的一个特殊运用,都是为了保存客户端的业务数据,只是数据类型有差
异,云备份保存的是备份数据,云存储保存的是原始数据。云备份实现的技术方案与云存储
类似,也是通过集群应用、网格技术或分布式文件系统等技术,将网络中大量各种不同类型
的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和备份功能。按照云备
份中数据的规模可将云分为
3 类:私有云、公有云和混合云。其中私有云的应用通常部署在
一个区域或者企业的防火墙内部,服务质量(
Quality of Service,QoS)非常稳定,不会受
到网络不稳定的影响,因而能够提供对数据安全和服务质量的最有效控制。比起公有云和混
合云,私有云具有部署快速、成本低廉的优势,并能够提供更加安全可靠的备份服务。云备
份架构有以下两种方案:紧耦合对称(
Tightly CoupledSymmetric,TCS)架构和松散耦合
非对称(
Loose Coupling Asymmetric,LCA)架构[4]。TCS 架构不存在集中管理的节点,是
通过执行某种策略来使每个节点知道自己所要执行的操作,利用分布式锁管理共享数据,
适合于单文件
I/O 操作频繁的系统;LCA 架构有一个统一管理所有节点的中央元数据控制
服务器,所有的操作命令都是通过该服务器发出,通过利用虚拟化技术进行系统扩展和调
整。
CDP-CB 系统的主要职能是备份用户的更新数据,并允许任意时间点的恢复,没有频繁
的单文件
I/O 操作,所以采用 LCA 架构更有利于系统动态管理和控制。综上,CDP-CB 系统
采用基于
LCA 的私有云备份架构。
2 CDP-CB 系统工作原理
2.1 CDP-CB 系统整体框架
CDP-CB 系统按照地域划分为本地客户端和云备份端,二者通过 iscsi 协议传输数据,其
整体框架如图
1。
本地客户端是家庭用户或者企业用户的总称,以卷(
volume)为保护单位,安装完客
户端软件之后,会自动加载
CDP 客户端代理模块(CDP proxy),该模块的详细功能在 2.2
节介绍。此外,在客户机的磁盘管理中会多出一个虚拟日志卷(
Virtual Log Volume),该卷
初始大小为
0,用户通过付费机制向云备份端申请备份空间,虚拟日志卷大小会随着空间
申请自动扩容。云备份端是由一系列的服务器(
Server)组成,这些服务器利用局域网
(
LAN)互联,按照职能划分为元数据服务器和 CDP 备份服务器。元数据服务器存储了客
户端信息和节点的空间、状态等信息,并利用集群技术、虚拟机技术来管理云备份端的节点,
包括节点的加入、撤销、空间扩容等;
CDP 备份服务器利用虚拟化技术将异构的存储介质组
织成存储池,按用户需求划分指定大小的空间,并将客户端的更新数据以日志的形式保存
在所属空间中,存储池中不同的空间划分被称为日志卷。每个
CDP 备份服务器也有一个
CDP 服务器代理模块(CDP proxy),详情见 2.2 节。
2.2 CDP-CB 系统结构
CDP-CB 系统捕获本地客户端的更新数据,将其整合之后保存到云备份端。按照备份数