蓝盟IT外包聊聊最容灾最重要的指标“RTO”和“RPO”

发布者:蓝盟IT外包 来源:www.linemore.com

如今企业的IT应用环境几乎都运行在数据中心中,数据中心越来越复杂,业务数据也越来越重要,这个时候灾备也就也来越重要。而天灾和人祸是不可避免的,所以需要建立数据中心的灾难恢复系统,来保证数据中心业务的安全性。建立灾难恢复系统的目的,是为了在灾难发生后能够以最快速的恢复数据,保证企业业务的持续稳定运行,在数据中心灾难恢复系统中,最常见的指标是恢复时间目标(RTO)和恢复点目标(RPO)。
RTO:恢复时间目标是应用程序可以中断或关闭多少时间而不会对业务造成重大损害。有些应用程序可能会停机数天而不会产生严重的后果。而一些高优先级的应用程序只能停下来几秒钟,否则将会让企业和客户难以应对,并导致业务丢失。
RTO不仅仅是业务损失和恢复之间的持续时间。这个目标还包括IT部门必须采取的步骤来恢复应用程序及其数据。如果IT已经投入高优先级应用程序的故障转移服务,那么它们可以在几秒钟内安全地表达RTO(IT部门必须恢复本地环境,但由于应用程序正在云中进行处理,因此IT部门可能需要一些时间)。
企业的RTO任务是根据优先级和潜在业务损失对应用程序进行分类,并相应地匹配企业的资源。例如,接近零的RTO的典型计划将需要故障转移服务。4小时RTO允许从裸机恢复开始进行本地恢复,并以完整的应用程序和数据可用性结束。对于8小时以上的RTO,IT团队可以与本地系统集成商签署维护合同。


RPO:恢复点目标是指企业的损失容限:在对业务造成重大损害之前可能丢失的数据量。该目标表示为从丢失事件到最近一次在前备份的时间度量。
如果以定期计划的24小时增量备份全部或大部分数据,那么在最坏的情况下,企业将丢失24小时的数据。对于某些应用来说,这是可以接受的,对于其他人来说并不是这样。
例如,如果企业的应用程序具有4小时RPO,那么备份和数据丢失之间的间隔时间将为4小时。拥有4小时的RPO并不一定意味着企业将失去4小时的数据。例如一个文字处理应用程序在午夜停止运行并在凌晨出现故障,那么可能没有丢失太多(或任何)数据。但是如果一个任务繁忙的应用程序在上午10点关闭并且直到下午2点才恢复,那么企业可能会失去4个小时的高价值并且可能无法替代的数据。在这种情况下,需要进行更加频繁的备份,以便访问特定于应用程序的RPO。这取决于应用优先级,单个RPO的范围通常为24小时、12小时、8小时、4小时。以秒为单位测量到接近零。只要对生产系统的影响最小,8小时以上的RPO就可以利用现有的备份解决方案。4小时的RPO将需要计划的快照复制,而接近零的RPO将需要连续复制。在RPO和RTO都接近于零的情况下,将连续复制与故障转移服务结合使用,以实现接近100%的应用程序和数据可用性。根据以上两个简单的原则,企业不以对现有的数据系统作出,也可以按照既定的RTO及RPO要求,选购最适合企业数据中心的灾备方案。
RTO及RPO与方案售价有着密切的关系,然而完美的方案当然是RTO及RPO皆为零,表示当灾难发生后,系统立即恢复,而且完全没有数据丢失,可是其造价是非常昂贵的,而且也不一定有这个必要。
因此,最佳方案必需在RTO,RPO,维护及价钱多方面,都能达致平衡。尤其是中小企业,在资源紧拙的情况,应先好好了解对RTO及RPO的要求,然后再看看价钱,那就比较容易找到,适合企业的方案了。各个企业的情况不同,要根据自己的情况选择合适的恢复机制。灾难恢复的目的是保证企业业务连续进行,因此无论采用RTO还是RPO,都要为这个核心服务。
如需对降低RTO和RPO有进一步的了解,请联系蓝盟IT外包获取免费咨询。

文/上海蓝盟   IT外包专家

>
400-635-8089
立即
咨询
电话咨询
服务热线
400-635-8089
微信咨询
微信咨询
微信咨询
公众号
公众号
公众号
返回顶部