1.4.7 网状光网络的生存性
与环网的OADM节点只具有本地上下路和直通功能不同,网状光网络依靠具有交叉连接功能的OXC节点连接任何方向的任何光纤。在OXC中,通过合适地配置空分交换机,任一条波长通道都能够在入口、出口和本地光纤之间随意进行倒换和连接。
按照是否具有波长转换能力可按OXC分为波长路由光交叉连接器(WR-OXC)和波长转换光交叉连接器(WT-OXC)。WR-OXC也称为波长选择交叉连接器(WSXC),WT-OXC通常也被称为波长交换交叉连接器(WIXC)。在由WR-OXC构成的网络中,由于是由单个波长来表征一个光通道的,所以可将该网络称为波长通道网,同样由WT-OXC构成的网络就是虚(逻辑)波长通道光网络。WR-OXC只能将入口处任何光纤上的任何一条波长通路交叉连接到任何出口光纤中波长相同的一条光通道上。如果出口光纤中该波长被其他入口的波长占用,则该通道连接就被拒绝,即波长阻塞。结构更灵活的OXC(也就是光交换机)可以将任何输入光纤上的任何一条光通路交叉连接到任何一条输出光纤上的任何一条光通路上(它可以在具有不同波长数值的光通路之间建立连接),这时往往需要给该交换机的输入端口、输出端口或者两端都引入波长转换功能,则它既可以完成空间交换又可以进行波长转换。但要注意如果波长转换不是全光的,则破坏了原有的交换透明性。WT-OXC在增加OXC连通性的同时也增大了成本和交换机构的配置复杂度。
光交叉连接器在网状光网络中的使用不仅提供了选路灵活性,而且当网络出现故障时可将受影响的业务重新路由到网络中的空闲容量上,所以网络的保护和恢复都可以使用重选路由机制。保护一般是将受损业务重选路由到预先分配好的一条保护路由上,这条备用路由已经在网络建立时被预留好了(这样可以实现100%的保护),相反恢复通常是利用网络中的所有空闲容量基于某种优化算法来重选路由的,因此恢复比保护在容量使用效率方面具有优势。
1.网状网的恢复
恢复从本质上讲就是重选路由。根据重选路由的计算和执行原理,可把恢复分为集中式和分布式的恢复;根据重选路由的类型,又可把恢复分为基于通道(Path-based)和基于链路(Link-based)的恢复方法;根据失效发生后路由计算的时效性,又可分为实时和预计算的恢复。
恢复算法的优化目标一般采用下面几种目标。
● 最大恢复:给定由一系列节点(WXCs)和链路所规定好的一个网络,并已知一套点到点的需求和每一条需求在光网络中所对应的业务路由,以及每一条链路上的空闲容量也已知的情况下,那么在链路容量受限的条件下为尽可能多的需求寻找恢复路由通道。
● 最小容量恢复:给定一系列节点(WXCs)和链路所规定好的一个网络,并已知一套点到点的需求和每一条需求在光网络中所对应的业务路由,以及每一条链路上的空闲容量也已知的情况下,那么为所有需求都寻找恢复路由通道(实现l00%的恢复)使所需要的网络容量最小。
● 联合优化:给定一个网络中的节点和链路以及一套点到点的需求,为每一个需求寻找业务路由和相应的可替换的恢复路由以使网络所需的容量最小化。
通常在一个网络中用4种性能因素来评定一种恢复方案的性能优劣:恢复速度、可恢复性、容量效率和算法的可扩展性。
恢复速度可以定义为在故障发生时到故障恢复后这期间的持续时间。可恢复性是指一个给定的方案对故障(如链路故障、节点故障或多重故障)的处理能力。算法的可扩展性是指随着网络规模的增大及业务需求的增多,路由的计算时间和恢复时间是否仍能够保持在系统可接受的范围内。如上所述,恢复速度对于光网络来说是一个很关键的因素。
如图1.28所示,基于链路的恢复方案是围绕故障链路为已经中断的业务流量重新寻找路由,而基于通道(如图1.29所示)的重新路由则是在发起这个连接请求的两个端节点之间重新寻找一条通道以代替原来的整个通道。基于链路的恢复方案要求该链路两端的节点必须能够标识出和找出故障的链路。这种方法一旦遇到节点故障时就会使链路的恢复变得很困难,此外它还限制了对恢复路径的选择,因此需要更多的容量。
图1.28 链路保护恢复原理
图1.29 通道保护恢复原理
路由的预先计算方法能够在故障发生前就计算好恢复通道,而实时方法却不能达到这样的目的。前者允许节点能够事先知道重新路由的信息,一旦检测到故障之后就能够进行快速的恢复;而后者则是在检测到故障后才计算可替换的路由,因此在时间上来说可能就慢了一些。
集中式恢复方法是在中央控制器中计算所有业务需求的恢复路由,这时在中央控制器中要不断地更新网络信息。由中央控制器计算的路由可下载到节点数据库中作为主路由和恢复路由表。这些算法一般来说是基于通道的。通常在检测到故障或预先计算好路由之后就需要找到所需的容量(容量发现)。对于故障的检测和定位问题,一般来说受故障影响的网元通常会利用告警信息来通知故障信息,并确认剩余网络拓扑和剩余容量信息,接着为出现故障的业务找到最佳的替代路由。这种方法虽然慢,但就容量的利用来说却非常有效。然而当考虑到恢复速度的重要性和光层中对故障快速隔离的困难等情况时,这种方法是不具有吸引力的。由于在中央控制器中能够了解整个网络的拓扑和容量情况,因此集中式控制方法通常的容量利用率是很高的。然而中央控制器要维护不断更新的拓扑和容量信息就需要与节点数据库之间不断地进行信息的交互,此外,一旦当业务需求增长时,集中式处理的路由计算就不能扩展到更大的网络中,这就使得在光网状网中利用分布式的计算方法来计算恢复路由成为更加具有吸引力的解决方案。
分布式的方法也包括预先计算路由表和实时发现容量路由两种方式。基于发现容量的实时方法在发生故障后通过流消息来寻找可用的链路容量,接着围绕故障链路来为故障链路重新安排路由。这种基于链路的、实时的技术的优势是它具有操作简单和分布式控制的特点,缺点是恢复操作缓慢、容量利用的效率低并且只能恢复单个的链路故障(例如这种方法就不能恢复节点故障)。因此,分布式的预先计算路由的恢复方法相对来说就比较实用。
在过去,很多研究人员已经提出了多种分布式的预先计算路由的恢复方法。但是在这些方法中,恢复路径是依赖于故障的,这有利于更好地利用容量。然而过于大量地恢复路由,即为每个故障情形都对应一套恢复通道,必须预先计算并存储在存储器中,这就带来了扩展性的问题。此外,光网络的快速故障隔离的固有困难使得这种方法同样不具有吸引力。
不依赖于故障的恢复方案是基于不相交通道(The Disjoint Path)的思想,也就是说,业务路由和恢复路由在拓扑上是完全不同的(包括所使用的一切节点和链路)。边不相交通道保护是基于通道的保护恢复方案的特例。要求保护通道与工作通道除了源节点和目的节点外,不能有相同的节点和链路。无论工作通道上何处发生故障,连接都切换到边不相交保护通道上,因而每个连接也只需要存储一条保护通道的数据,同时保护倒换也不需要故障定位,与通道保护相比能更快地恢复,但由于选样保护通道的边不相交限制,以及无故障定位导致无法释放工作通道上的正常资源,使得此保护方案需要更多的保护资源。可见,这种方案既可以恢复链路故障也可以恢复节点故障。尽管这种方法对每个业务路由都分配了一个恢复路由,但并不需要对恢复路由预留专用的容量,这就节省了容量。不相交的通道恢复和非专用通道的节省容量思想最初是由Kawamura和Tokizawa为建立ATM虚通道而提出的,并进一步由Kawamura、Sato和Tokizawa改进和修订而成。
边不相交通道保护方案又可分为专用和共享两种模式。在采用专用模式时,保护通道与工作通道同时建立,当工作通道出现故障时,保护切换操作只需要在连接的源和目的节点进行,速度较快,但需要更多保护资源;采用共享模式时,保护通道在工作通道正常时并未建立,因此无相同链路和节点的工作通道之间可以共享保护通道资源。与专用模式相比,共享模式能更有效地利用资源,所需保护资源较少,但由于是在工作通道出故障时才建立保护通道,需要保护通道上的所有节点参与操作,因而恢复速度较慢。
尽管一些设备制造商宣称能够实现50ms以内的恢复速度,但是由于不可预期的业务故障、发生故障后网络所需要交互传递的告警信息和需要执行的一系列动作,使得在实际操作中需要比想象多得多的时间才能完成恢复。网络一旦发现一次故障,首先要隔离故障,然后才决定解决故障的行为(既可以是集中式控制方式也可以是分布式控制方式),包括告知各个光交叉连接器并执行交叉连接动作。为了在网状网中实现快速的业务恢复,保护结构是更好的一种选择,因为它不需要大量的网元设备之间的协调。
2.网状网的保护
网状网中的通道保护技术为每一路工作通道预留一条专用的端到端保护通道,也可以使用1+1或1︰1的保护倒换。如果保护机制仅仅是保护链路故障,则工作通道和保护通道可以是链路无关的;如果保护机制是要保护节点故障,则它们也可以是节点不相关的。链路保护称为光复用段(OMS),其保护的执行是交换整个复用段,它既可以是另一条专用的平行光纤,也可以是被路由到在网络中与该链路不相交的其他光纤。链路保护也可以以共享方式工作,例如,采用M︰1结构,即在一条链路中有M条工作光纤,而它们只共享一条保护光纤。这种保护方式可以应付设备故障或对一路工作光纤的维护。
对于通道保护,空闲信道被专用于保护目的并同工作信道一起镶嵌在光纤中,对OXC设备来说这些空闲信道和工作信道一样是随时可用的,因此它们平常也要占用交换矩阵的端口。对于光复用段OMS保护来说,可以半静态地或在交叉连接器外使用简单的交换开关的方式接入专用的保护资源,这样可简化节点的结构。