1.4.4 保护恢复技术的分类

网络的生存性已成为现代网络规划设计和运行的关键考虑因素之一,其性能优劣主要取决于网络恢复算法、物理拓扑结构以及备用容量的大小和分布,其中恢复算法是关键。

1.按协议层分类

在现代网络结构中,至少在网络的IP层、ATM层、SDH层和OTN层都可以有自愈保护恢复机制。表1.1总结了上述4层结构的主要自愈保护恢复机制。

表1.1 多层网络各个子层可采用的恢复方案

(1)IP层的恢复技术

IP层自愈保护功能是IP网络中的一个基本功能。最原始的IP网络设计中就已经考虑了网络状态的动态变化,并设计了完整的动态路由规则。IP层的通路检测通常使用路由协议的链路检测机制,检测速度约为60s(若HELLO间隔为30s)。因此,完全依靠路由协议实现IP网络自愈恢复所花费的时间都在分钟级,这样低速的切换在超高速网络上会导致网络数据的大量丢失,同时也无法满足电信业务对于服务质量的要求。现代的路由技术通常会结合低层的检测机制,实现快速的重路由。

(2)ATM层恢复技术

ATM层具有强大的生存能力。与STM相比,基于VP的ATM技术具有下列特征:

● 非分级的通道结构;

● 通退路由建立和容量分配的独立;

● 丰富、灵活快速的OAM信元;

● 由于只改写VPI的路由表,VPX的逻辑重构很快。

VP路由和容量管理的独立性以及分级的通道复用导致了ATM网络的两个重要特性:动态容量分配和适应性网络重构,两者均可应用于恢复技术之中,再加上OAM信元的应用,

使得ATM层更能有效、快速地检测软故障。例如,检测10E-4~10E-5的误码率,ATM只需要1ms,而SDH需要2s,可见ATM技术能够大大提高网络的生存能力。ATM VP子层的PS、SHR、SHN技术以及VP子层的重定路由技术正处于研究之中。

(3)SDH层恢复技术

在SDH层实现恢复最明显的优点是速度快且已经实用化。SDH的APS和SHR已经被ITU-T(G.841)标准化,SHN的相关标准也在讨论之中。在SDH层实现自愈环比ATM要快,这是由于SDH具有更简单而有效的控制机制。恢复消息的传送和保护倒换的启动都是通过SDH的开销来实现的。

与PDH相比,SDH具有的数据通道(DCC)使得其实现分布式恢复算法(DRA)变为可能,能够实现比集中式恢复技术更快的恢复速度。但是由于SDH DXC网络的路由选择和容量分配的不独立性使得SDH的DRA比ATM的DRA更复杂,而且只要现存的SDH-DXC系统的串行信息处理、串行交叉连接和交换的硬件技术不变,则SDH的分布式DXC恢复系统就不可能在2s内实现业务恢复。

(4)光层恢复技术

WDM光网络是一个面向连接的网络,它的网络单元和所使用的网络技术与SDH网络极为相似。光传送网的核心设备是光的交叉连接设备(OXC)和分插复用设备(OADM),它们可以实现光信号的交叉连接和分插复用,而无须将其转换到电域上进行相关处理。WDM光传送网也是一个分层网络,相邻子层之间是客户−雇主的关系。这些因素决定了二者的恢复策略极为相似。WDM光网络的恢复方案也可以分为保护倒换和利用OXC重新选路进行业务恢复,前者适用于线路应用和环形网络,后者适用于含有OXC的网状网。前者的实现可以基于光通道层,也可以基于光复用段层,后者一般基于光通路层。光网络恢复结构既可以用集中式,又可以用分布式控制,或者采用二者相结合的方式。表1.2给出了多层网络各个子层恢复方案的特点。

表1.2 多层网络各个子层恢复方案的特点

2.按网络功能划分

恢复技术从网络功能划分的角度,可以分为业务恢复和设备恢复。业务恢复用于交换网(由交换机和路由器组成),而设备恢复用于设备传送网(由各种复用设备、交叉连接以及分插复用设备组成)。总之从宏观上来看,网络恢复可以分为两大类,即业务层恢复和传送层恢复。前者主要用于业务层网络,如交换网、AT M网、IP网等;后者主要用于传送网,又称设施恢复。

业务恢复是将单个呼叫围绕着某个故障点重新进行选路,所以业务层恢复只涉及为单个呼叫、信元或包重选路由以绕过失效电路,诸如动态无级选路(DNHR)和IP选路均属此类恢复。设备恢复是指围绕着某一故障点以一个较大的单位对传输带宽进行分配。由此可见设备恢复的基本“粒度”大,所需操作比单个呼叫的重新选路要少,因此能在很短的时间内恢复较多的业务。

传送层恢复常常与通道有关,而与业务无关(除非有关通道已经专门分给了某种业务)。传送层的这种恢复技术有可能涉及业务层的许多个电路、信元或包,影响面大,因而需要只执行较少的操作,就可在较短的时间内恢复更多的业务,对网络生存性更加重要。而另一方面,在业务层面上实施恢复也有其特有的优点。诸如可以恢复所有业务层及业务层以下层面的故障,比较简单灵活,可以按不同业务要求分别实施保护恢复。两者的比较见表1.3。

表1.3 业务层恢复和传送层恢复的比较

在给定的业务生存性要求下,设备的恢复技术又可以分为两类:

静态恢复技术(或专用设备恢复技术),它是利用专用的设备或容量,以便失效发生后恢复业务,如APS、SHR、双回归技术都属于传统的静态恢复技术。它的特点是系统设计简单、实现容易、恢复速度快,但所需的容量和成本高。

动态恢复技术(或动态设备恢复技术),它不要求专用设备,只利用网络中的空闲容量

来恢复受影响的业务。它包括动态DXC恢复技术以及OXC重选路由。其特点是系统设计和实现复杂、恢复速度相对慢一些,但是所需要的容量小、成本低。

表1.4归纳了静态恢复技术和动态恢复技术的特点。

表1.4 静态恢复技术和动态恢复技术的特点

3.按控制方式分类

网络恢复控制方法有两种,即集中控制方法和分布控制方法。集中控制方法是传统的控制方法,比较成熟,自愈控制算法存于集中网管系统中,无须DXC之间进行通信,因而不同厂家设备间的兼容性比较容易实现。集中控制方法仅须对控制响应消息实现标准化,而分布控制需要对控制响应消息以及路内算法都实现标准化才行,因此十分困难。此外,理想的生存性策略要求规划算法在网络范围提供合适的空闲备用容量,而选路算法能以可控和有效的方式接入网络空闲备用容量。为了达到所要求的容量规划和实时恢复之间的协调,恢复算法的可预测性是十分必要的,这方面集中控制方法具有明显优势,而分布算法很难达到选路的可预测性。集中控制方法,特别是全自动恢复的主要缺点是:恢复速度慢(几分钟至几十分钟),系统脆弱。其中后一条可以通过集中控制系统的双备份来解决,而恢复时间是难以大幅度减小的,这是由于集中控制需要访问中央网络数据库,在网络范围内模拟和计算各种替代路由,少则需要几分钟,多则几十分钟(取决于可用空闲备用容量的大小),其间所有业务都将丢失。另外,集中控制需要维持一个完整、一致和准确的庞大网络数据库,随着网络规模的扩大和动态变化,其存储、响应时间、准确性和成本都是问题。分布控制的最大优点是恢复时间短,仅算法本身可小于1s,其管理成本也较低。实际网络中越来越倾向采用预计算通道的半自动恢复方式,不仅可以大大减少业务恢复时间,而且也可以事先确保有可靠的保护通道。

4.按网络拓扑结构分类

网络从拓扑结构上可划分为环网和网状网,更特殊的还有双回归结构。与拓扑结构相对应的网络生存性策略如图1.18所示。恢复技术从网络拓扑结构的角度,可以分为线形保护切换、双归法、自愈环以及自愈网,如图1.18所示。

图1.18 从拓扑结构上分类的网络生存性策略

(1)线形保护切换(Protection Switching,PS)

线形保护切换是指网络中既包含工作实体又包含保护实体,一旦某个工作实体失效,则由某个备用实体替换。线形保护又包括专用保护和共享保扩。专用保护包括1+1或1:1保护,共享保护包括1:N PS(不同路由)或1:N PS(非不同路由)。

(2)双归法(Dual-Homing)

该技术主要用于分级网络,来保护主要汇接局故障。特殊端局(CO)与两个汇接局(即本地和外地汇接)相连。当本地汇接局发生故障时,该特殊CO仍可以通过备用汇接局与其他CO相连。双归法要求该特殊CO配有一个数字交叉连接系统,且连接该CO去外地汇接局的光纤系统具有一定空闲容量。

(3)自愈环(Self-Healing Ring,SHR)

自愈环是利用电或光的分插复用器(ADM或OADM)构成环状拓扑结构。其工作原理是利用ADM或OADM的分插能力和智能性,以及冗余的容量和网络设备,在失效的情况下自动恢复受影响的业务。

SDH SHR已经商用化。SDH SHR按节点之间所用光纤数量可分为二纤和四纤环路,按照正常情况下业务流向可分为单向和双向环路,按照保护对象可分为通道保护和复用段保护。在ITU-T G.841建议中已经做出了相关建议。

(4)自愈网(Self-Healing Networks,SHN)

自愈网的主要网络单元是电或光的交叉连接设备(DXC或OXC),其基本拓扑结构是网状网。在这种网络中,DXC或OXC彼此互连,从而实现两点之间路由的多样性。在网络出现故障时,对于受影响的业务,利用交叉连接单元来连接空闲的逻辑或物理通道,实现网络的重构和业务的恢复。在SHN中,网络中的可用空闲容量为整个网络所共享,从而提高了资源的利用率,在经济上更具有优势。SDH中的电交叉连接单元已经实用化,WDM系统中光交叉连接设备也有了长足的进展,已经推出了实验室的科研样机。但是由于自愈网本身的串行信息处理、串行交叉连接的工作方式,使得网络恢复时间较慢。

简单的路由备用线路保护方式配置容易、网管简单、恢复时间短(50ms以内),但需要的空闲容量大、成本高,主要适用于两点间有稳定的大业务量的点到点场合。

环形网结构具有很好的生存性,网络恢复时间很短(可小于50ms),具有良好的业务疏导能力,因而受到很大欢迎。其主要缺点是网络规划较困难,开始很难预计将来的发展,因此在开始时须规划较大的容量。这种结构所需空闲容量即使在业务量比较平衡时也高达100%,否则往往要求高达150%的备用容量。其经济性在距离短、拓扑简单时较好。

用于保护主集线器的双回归结构没有恢复性能,但它与DXC连接就可以满足恢复性能。

采用网状网恢复策略也具有很高的生存性,在同样的网络生存性下所需的附加空闲容量可远小于环形网,通常为30%~60%。具体所需网络空闲容量的大小与节点间的互连密度有关,节点间互连程度低,迂回路由就少,所需空闲容量就大;反之所需空闲容量则少。一般来说,网络拓扑较复杂时,例如,在高度互连的长途网中,采用网状网恢复比环形网更为经济和灵活,也便于规划和设计。由于网状网提供的是网络范围内的恢复,出而对付严重的网络故障的能力较强,对网络拓扑的限制也最小。网状网恢复的一个严重缺点是恢复时间较长,通常要数秒至数分钟。

5.按恢复容量的粒度来划分

为了综合利用各种方法的优缺点,不同的层和不同的子网可以采用不同的保护和恢复方法。如图1.19所示为按粒度对光网络生存性技术进行的分类。

图1.19 按粒度对光网络生存性技术进行的分类

① 基于链路的恢复技术(或称为物理设备保护):由失效NE的相邻节点负责实施,以集合方式恢复该失效NE上的所有连接,而不考虑业务的源、宿节点情况,它只有一对恢复控制节点。链路恢复的主要缺点是由于变更路由,恢复过程存在着回拉现象。

② 基于通道的恢复技术(逻辑通道恢复):当失效发生时,以端到端的方式逐个恢复受失效影响的逻辑通道,它存在多个同时执行恢复过程的控制节点对。

选用哪一种技术取决于对恢复速度、空闲容量的利用率和重选路由决策复杂程度的折中和权衡。通常,为了降低复杂性和减少恢复时间,恢复技术大多在通道层实现。如果在电路层(复用段层)进行恢复则需要涉及成千上万个电路、信元或包的检测、处理、选路、测试和业务转移,因而十分复杂且恢复时间很长。出于同样的理由,即使在通道层内部,网络恢复也主要在高阶通道层VE-4上实施,从而达到快速有效恢复业务的目的。需要注意, IP业务层可以将固有的选路机制作为恢复机制,因而恢复机制是生来就具备的。表1.5对链路级恢复和通道级恢复进行了比较。

表1.5 链路级恢复和通道恢复的特点