你知道什么是灾难恢复吗?

2022-11-28 00:00:23

您有没有想过如果发生地震或其他自然灾害,您在某家银行的账户信息是否会丢失?你银行里还有钱吗?

其实,我们大可不必担心。银行用户信息是非常重要的数据,所以在银行成立之前,必须有一套完整的容灾方案来解决这类问题,即建立容灾系统。

所谓容灾系统,字面意思就是容忍灾难的系统。有了这个系统,即使发生灾难,银行内的用户数据也能安然无恙。这种灾难的范围从自然灾害到物理故障。为保证数据安全和业务可靠性,各家银行会在全国多个地区建立一个或多个容灾站点,相互备份数据,相当于创建了多个“副本”。

当主站点遭受灾难破坏,导致数据永久丢失时,可以依靠灾备站点的“副本”来实现数据恢复。如果没有灾备站点的数据备份,将造成不可估量的经济损失和恶劣的社会影响。

银行有灾备系统,但是通信系统有灾备系统吗?答案是肯定的。每个运营商都制定了完整严密的容灾方案,保护所有用户的通信数据,包括您的通话余额!

无论是3G、4G还是5G,每个运营商都在区域内建立了通信业务的容灾站点。容灾站点除了要保证各种数据的可靠性外,还要保证服务的可用性。这是建立容灾系统最重要的意义。

以5GC为例,与金融系统类似,5GC也采用跨地域异地容灾部署。数据中心(DC、DataCenter)部署在两个不同的地域。当一个数据中心的网络设备因故不可用时,另一个数据中心将迅速接管业务,保证5G服务的可用性。这是双 DC 部署。双数据中心部署是实现部署可靠性的一种方式。

除了双DC部署,5GC容灾方案还提供了哪些措施来实现容灾?

5GC容灾方案支持双DC部署、互斥部署、NF(NetworkFunction网络功能)分区部署、网络双平面实现部署可靠性。

互斥部署是指将虚拟机部署在不同的物理机上,以保证当一台物理机出现异常时,其他虚拟机仍然可以提供服务。简而言之,“不要把所有的鸡蛋都放在一个篮子里”。

NF域部署是指通过分离管理域、服务域和转发域来进行NF部署。

网络双平面是指5GCNF的所有逻辑网络接口至少有两个不同的物理网络平面互为备份。当其中一个网络平面发生故障时,另一个网络平面可以接管所有网络流量,保证业务不中断。

5GC容灾方案支持负载分担和无状态特性,实现架构可靠性。

负载分担是指所有运行的实例共同分担和处理业务。当部分正在运行的实例异常宕机时,其余正常运行的实例将分担处理业务,保证业务的正常运行。负载分担采用NM冗余方式,即当N个实例能够满足系统容量的业务处理时,再提供M个实例进行冗余。

上图是典型的3×1冗余方式。当三个实例可以满足系统的业务处理能力时,再提供一个实例进行冗余。当任何一个正在运行的实例发生故障时,其他三个正在运行的实例将继续工作,从而保证系统容量和业务处理不受影响。

无状态是指微服务的无状态设计。 3GPP定义了UDSF(UnstructuredDataStorageFunction,非结构化数据存储函数)用于NF状态数据(也称为非结构化数据,如移动数据等)的统一存储。

业务逻辑App可以随时进行弹性、扩容、销毁、再生、迁移等操作,是计算和存储的分离。无状态设计不仅实现了结构的可靠性,也保证了数据的可靠性。

5GC的NF是采用无状态的方式设计的。当前处理流程完成后,用户、会话上下文等状态数据存储在UDSF中,UDSF保存数据的多份。 UDSF支持1对1冗余,双DC部署容灾,保证数据可靠性。

5GC容灾方案支持链路检测、自愈等机制,实现资源可靠性。

自愈方式:对于不断发生故障的业务处理节点,系统会进行节点的多级自愈。系统根据用户的自愈策略配置,采用重启容器、重新推送容器、重启虚拟机、重建虚拟机的策略逐步进行自愈,从而恢复业务尽快。

链路检测是指:服务节点会定时向管理节点发送心跳保活消息。如果管理节点检测到长时间没有发送心跳的节点,则判断为故障节点,从而触发业务迁移流程,将故障节点的业务迁移到其他正常节点,从而保证业务的可靠性。

好吧,话虽如此,你再也不用担心你的电话费余额,更不用说存在银行的钱了!您还知道什么是灾难恢复。

本文来自微信公众号:中兴文档(ID:ztedoc)