首页 / 通信网络风险图

通信网络风险图实质审查 发明

技术内容

通信网络风险图 [0001] 相关申请交叉引用 [0002] 本申请要求于2021年1月22日提交的序列号为17/155,256、题为“通信网络风险图(Risk Map for Communication Networks)”的美国非临时专利申请的权益和优先权。 发明领域 [0003] 本发明大体上涉及通信网络的风险评估领域,尤其涉及用于对光通信网络进行基于模拟的风险评估的系统和方法。 背景技术 [0004] 数据业务正在呈指数级增长,主要原因是高带宽应用,例如云计算、视频和游戏流媒体、虚拟现实、触觉以及需要网络带宽量不断增加的许多其他日渐流行的应用。这些应用和服务的底层传送网络中任何中断都可能导致大量数据丢失以及伴随的收益损失。 [0005] 此外,通信服务提供商通常会在服务水平协议(service level agreement,SLA)中指定所提供连接的最低保证可用性,对所承诺可用性的任何违反都将招致处罚。网络运营商需要以下框架:该框架中包含用于进行风险评估和决策(采取预防措施和主动措施)的相关联工具,以最大限度地提高服务可用性,避免/尽量减少此类处罚。 [0006] 由于存在许多复杂的因素会影响风险评估过程,分析方法无法提供令人满意的解决方案。而尝试对光通信网络(例如密集波分复用(dense wavelength division  multiplexed,DWDM)网络)进行风险评估时,甚至更复杂。在这些网络中使用的光连接会受制于复杂的相互依赖关系,也称为通道耦合。光连接中的通道耦合可能是由例如功率偏移以及受激拉曼散射(stimulated Raman scattering,SRS)或交叉相位调制(cross‑phase modulation,XPM)等非线性效应引起的。要提高光网络针对可能发生的故障(例如断纤)的恢复能力和生存能力,就需要清楚地了解各种网络组件和服务之间复杂的相互依赖关系。 目前的风险评估模型无法处理这些相互依赖关系。 发明内容 [0007] 有利地,本发明提供了用于基于光学行为模拟来生成DWDM网络的风险图的系统和方法。所公开的模拟平台将网络拓扑和服务图作为输入,采用一系列分析性的和基于机器学习的光学设备模型来准确地模拟光网络在可能的假设场景中的行为。这种模拟能够模拟直接影响和间接影响,例如与这些假设场景相关联的功率偏移(power excursion)和非线性效应(例如受激拉曼散射、交叉相位调制)。基于模拟结果,将风险等级与每个风险因素和每个服务相关联,并生成可视风险图,以帮助网络运营商降低风险,从而提高光网络的可靠性和性能。 [0008] 以前实施本公开内容的技术是不切实际的,因为如本公开内容所述,对整个光网络上的每个风险因素执行准确的光学行为模拟需要以前还不可获得的计算和存储资源。此外,以前没有光网络组件的准确模型可供使用。随着当前光学组件建模的进步以及计算平台的性能和存储容量的改进,本文公开的模拟平台和风险图生成已经具备商业实用性。 [0009] 根据本发明的一个方面,本技术被实施为一种用于对光网络进行风险评估的系统。系统包括处理器、耦合到所述处理器的存储器和被配置成接收来自光网络的网络遥测数据的接口。模拟框架驻留在存储器中并在处理器上执行。模拟框架包括风险图引擎,风险图引擎包括性能预测引擎,性能预测引擎被配置成至少部分地基于输入的网络拓扑来生成光网络的模拟。预测性能引擎被配置成运行模拟,以至少部分地基于网络遥测数据来预测假设场景中表示的风险因素对光网络的直接影响和间接影响。风险图引擎还包括风险评估引擎,风险评估引擎被配置成至少部分地基于所预测的风险因素的直接影响和间接影响以及风险因素发生的可能性来确定与风险因素相关联的风险。风险评估引擎生成显示多个风险因素对所述光网络造成的综合风险的风险图。 [0010] 根据上述方面的一些实施例,模拟框架还包括场景生成器,场景生成器为所述多个风险因素生成假设场景。在这些实现方式中,性能预测引擎可以被配置成针对为所述多个风险因素中每个风险因素生成的假设场景来运行模拟。 [0011] 根据上述方面的一些实施例,所述模拟至少部分地通过预测风险因素对光网络上多个服务中的每个服务的直接影响和间接影响来预测对光网络的直接影响和间接影响。所述多个服务可以在输入的服务图中定义。在这样的实现方式中,所述风险评估引擎可以生成显示对所述多个服务中的每个服务构成的综合风险的风险图。 [0012] 根据上述方面的一些实施例,间接影响可以由功率偏移引起。根据上述方面的一些实施例,间接影响可以由光学非线性效应引起,例如受激拉曼散射和/或交叉相位调制。 根据上述方面的一些实施例,所述光网络可以是密集波分复用光网络。 [0013] 根据上述方面的一些实施例,风险图引擎可以包括模型存储库,模型存储库包含用于光网络中使用的每一类组件的模型。在这样的实现方式中,性能预测引擎可以通过将来自模型存储库的模型根据输入的网络拓扑进行组合来生成光网络的模拟。根据上述方面的一些实施例,模型存储库中的至少一个模型是基于机器学习的模型。 [0014] 根据上述方面的一些实施例,风险图引擎可以包括光网络的组件的可靠性规范。 在这样的实现方式中,风险评估引擎可以被配置成至少部分地基于可靠性规范来确定风险因素发生的可能性。 [0015] 根据上述方面的一些实施例,风险评估引擎基于与风险因素的直接影响和间接影响相关联的预测剩余裕度来确定与风险因素相关联的风险。根据上述方面的一些实施例,风险评估引擎基于预测的中断数据业务量来确定与风险因素相关联的风险。根据上述方面的一些实施例,风险评估引擎基于预测的收益损失来确定与风险因素相关联的风险,所述收益损失可以至少部分地基于光网络上的服务的服务水平协议来确定。根据上述方面的一些实施例,风险评估引擎生成关于降低光网络上的风险的建议。根据上述方面的一些实施例,风险评估引擎生成显示光网络中的每条光复用段链路构成的风险的风险图。 [0016] 根据本发明的另一方面,本技术被实施为一种用于对光网络进行风险评估的方法。方法包括:在计算机上接收来自光网络的网络遥测数据;至少部分地基于输入的网络拓扑在计算机上生成光网络的模拟;在计算机上运行模拟,以至少部分地基于网络遥测数据来预测表示为假设场景的风险因素对光网络的直接影响和间接影响;至少部分地基于所预测的风险因素的直接影响和间接影响以及风险因素发生的可能性,在计算机上确定与风险因素相关联的风险;在计算机上生成和显示示出多个风险因素对光网络造成的综合风险的风险图;基于风险图来降低光网络上的风险。 [0017] 根据上述方面的一些实施例,方法还包括为多个风险因素生成假设场景。在这些实现方式中,运行模拟可以包括针对为多个风险因素中每个风险因素生成的假设场景单独运行模拟。 [0018] 根据上述方面的一些实施例,运行模拟包括预测风险因素对光网络上多个服务中的每个服务的直接影响和间接影响。多个服务在输入的服务图中定义。在这样的实现方式中,生成和显示风险图可以包括生成和显示示出对多个服务中的每个服务构成的综合风险的风险图。 [0019] 根据上述方面的一些实施例,方法还包括生成关于降低光网络上的风险的建议。 根据上述方面的一些实施例,确定与风险因素相关联的风险包括使用光网络上的服务的服务水平协议来预测收益损失。 [0020] 根据本发明的另一方面,本技术被实施为一种用于生成光网络的风险图的方法。 方法包括在计算机上确定多个风险。多个风险表示多个风险因素对光网络上的服务构成的风险,多个风险通过对光网络的组件进行模拟以确定多个风险因素的直接影响和间接影响来确定。方法还包括:基于多个风险生成多个风险因素对光网络上的服务构成的综合风险等级的表示,并显示综合风险等级的表示。 [0021] 根据第二方面的一些实施例,生成服务的综合风险等级的表示包括生成高风险服务的列表。显示综合风险等级的表示包括显示列表。 [0022] 根据第二方面的一些实施例,生成服务的综合风险等级的表示包括将综合风险等级映射到图形中的多个边,其中,图形中的每个边表示服务的综合风险等级,并且其中,图形中的每个节点表示服务的接入点。显示综合风险等级的表示包括显示图形。 [0023] 根据第二方面的一些实施例,生成服务的综合风险等级的表示包括生成关于降低对高风险服务构成的风险的建议列表。显示综合风险等级的表示包括显示建议列表。 [0024] 根据本发明的又一方面,本技术被实施为一种用于生成光网络的风险图的方法。 方法包括在计算机上确定多个风险。多个风险表示光网络中的每条链路由于多个风险因素而构成的风险,多个风险通过对光网络的组件进行模拟以确定多个风险因素的直接影响和间接影响来确定。方法还包括:基于多个风险生成光网络中的链路构成的综合风险等级的表示,并显示综合风险等级的表示。 [0025] 根据第三方面的一些实施例,生成光网络中的链路构成的综合风险等级的表示包括生成对网络构成高风险的光网络的元件的列表。显示综合风险等级的表示包括显示列表。 [0026] 根据第三方面的一些实施例,生成光网络中的链路构成的综合风险等级的表示包括将综合风险等级映射到图形中的多个边,其中图形中的每个边表示光网络中的链路构成的综合风险等级,并且其中,图形中的每个节点表示光网络的元件。显示综合风险等级的表示包括显示图形。 [0027] 根据第三方面的一些实施例,生成光网络中的链路构成的综合风险等级的表示包括生成关于降低高风险链路构成的风险的建议列表。显示综合风险等级的表示包括显示建议列表。 附图说明 [0028] 根据以下结合附图做出的详细描述,本公开内容的特征和优点将变得显而易见,在附图中: [0029] 图1示出了光网络的简化示例图,用于说明断纤事故对若干连接的影响; [0030] 图2示出了由可能性和影响组合产生的风险等级的示例; [0031] 图3是根据所公开技术的实现方式的模拟平台的框图; [0032] 图4示出了可以由根据所公开技术的实现方式的风险图引擎生成的风险表的示例; [0033] 图5示出了可以由根据所公开技术的实现方式的风险图引擎生成的风险图的示例,该风险图显示对每个服务构成的风险和由每条链路所构成的风险; [0034] 图6是根据所公开技术的实现方式的可以用于执行模拟的计算机系统的框图。 [0035] 应当理解,在所有附图和对应的描述中,类似的特征由类似的附图标记标识。此外,还应当理解,附图和随后的描述仅用于说明目的,并且这些公开内容并不旨在限制权利要求书的范围。 具体实施方式 [0036] 下文将参考附图更全面地描述所公开技术的各种代表性实施例。但是,本技术概念可以以许多不同的形式体现,并且不应解释为限于本文所述的代表性实施例。在附图中,为了清晰起见,可能夸大了层和区域的尺寸和相对尺寸。在整个说明书中,相似数字是指相似元件。 [0037] 应当理解,尽管术语第一、第二、第三等在本文中可以用于描述各种元件,但这些元件不应受到这些术语的限制。这些术语用于区分一个元件和另一个元件。因此,在不脱离本公开内容教导的情况下,下文论述的第一元件可以称为第二元件。本文中使用的术语“和/或”包括相关联的所列项目中的一个或多个的任意和所有组合。 [0038] 应当理解,当一个元件称为“连接”或“耦合”到另一个元件时,它可以直接连接或耦合到另一个元件,也可以存在中间元件。相反,当一个元件称为“直接连接”或“直接耦合”到另一个元件时,不存在中间元件。用于描述元件之间关系的其他词语应以类似的方式解释(例如,“之间”与“直接之间”、“相邻”与“直接相邻”等)。此外,应当理解,元件可以通过机械、电、通信、无线、光学等方式“耦合”或“连接”,这取决于正在耦合或连接的元件的类型和性质。 [0039] 本文使用的术语仅用于描述特定的代表性实施例,并不用于限制本技术。除非上下文清楚说明,否则本文所用的单数形式“一”、“一个”和“所述”也包括复数形式。还应当理解,本文中所使用的术语“包括”用于说明存在所述的特征、整数、步骤、操作、元件和/或组件,但并不排除存在或添加一个或更多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。 [0040] 图中所示的各种元件的功能,包括标记为“处理器”的任何功能块,可以通过使用专用硬件以及能够执行指令的硬件与适当的软件指令相关联来提供。当由处理器提供时,这些功能可以由单个专用处理器、单个共享处理器或多个单独处理器提供,其中一些处理器可以共用。在本技术的一些实现方式中,处理器可以是通用处理器,如中央处理器(central processing unit,CPU),或专用于特定目的的处理器,如数字信号处理器(digital signal processor,DSP)。此外,术语“处理器”的显式使用不应解释为专门指能够执行软件的硬件,而是可以隐式地包括但不限于专用集成电路(application‑specific integrated circuit,ASIC)、现场可编程门阵列(field‑programmable gate array,FPGA)、用于存储软件的只读存储器(read‑only memory,ROM)、随机存取存储器(random access memory,RAM)和非易失性存储设备。还可以包括其他常规的和/或定制的硬件。 [0041] 软件模块,或者简单地,暗示为软件的模块或单元,在本文中可以表示为流程图元素或指示流程步骤的执行和/或文本描述的其他元素的任意组合。这类模块可以由明确示出或隐式示出的硬件来执行。此外,应当理解,模块可以包括例如但不限于提供所需能力的计算机程序逻辑、计算机程序指令、软件、堆栈、固件、硬件电路或其组合。还应当理解,“模块”通常定义如上所述的与定义的功能相关联的相关软件代码或其他元素的逻辑分组或组织。因此,相关领域的普通技术人员应当理解,在一些实现方式中,被描述为“模块”一部分的特定代码或元素可以被放置在其他模块中,具体取决于软件代码或其他元素的逻辑组织,并且这种修改在权利要求书所定义的本公开内容的范围内。 [0042] 还应注意,如本文所使用的,术语“优化”意味着改进。其并非用于传达技术产生了客观上“最佳”的方案,而是产生了改进的(至少在一个方面)方案。在内存访问的上下文中,其通常意味着内存访问的效率或速度可以提高。 [0043] 如本文所使用的,术语“确定”通常意味着进行直接或间接的运算、计算、决定、查找、测量或检测。在某些情况下,这种确定可能是近似的。因此,确定一个值表明该值或该值的近似值是通过直接或间接运算、计算、决定、查找、测量、检测等方式得到的。如果一个项目是“预先确定”的,则其在被指示为“预先确定”的时刻之前的任何时间确定。 [0044] 本技术可以实施为系统、方法和/或计算机程序产品。计算机程序产品可以包括存储计算机可读程序指令的计算机可读存储介质(或媒介),这些计算机可读程序指令在由处理器执行时,使处理器执行所公开技术的各个方面。计算机可读存储介质可以是例如电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或这些设备的任何适当组合。计算机可读存储介质的更具体示例的非详尽列表包括:便携式计算机磁盘、硬盘、随机存取存储器(random access memory,RAM)、只读存储器(read‑only memory,ROM)、闪存、光盘、记忆棒、软盘、机械或视觉编码介质(例如打孔卡或条形码),和/或这些介质的任何组合。如本文所使用的计算机可读存储介质应被解释为非瞬时性计算机可读介质。其不应解释为瞬时信号,例如无线电波或其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如穿过光纤线缆的光脉冲),或通过电线传输的电信号。 [0045] 应当理解,计算机可读程序指令可以从计算机可读存储介质下载到相应的计算或处理设备,或者通过互联网、局域网、广域网和/或无线网等网络下载到外部计算机或外部存储设备。每个计算/处理设备中的网络接口可以通过网络接收计算机可读程序指令,并转发这些计算机可读程序指令以便存储在相应计算或处理设备内的计算机可读存储介质中。 用于执行本公开内容的操作的计算机可读程序指令可以是汇编指令、机器指令、固件指令、集成电路的配置数据,或者以一种或更多种编程语言的任何组合编写的源代码或目标代码。 [0046] 本文中描述本技术的原理、方面和实现方式的所有说明以及其具体示例都旨在包括其结构和功能等效物,而无论它们是目前已知的还是未来开发的。因此,例如,本领域技术人员应当理解,本文中的任何框图都表示体现本技术原理的说明性电路的概念视图。类似地,应当理解,任何流程图、流程图表、状态转换图、伪代码等均表示可以基本上用计算机可读程序指令表示的各种过程。这些计算机可读程序指令可以提供给处理器或其他可编程数据处理装置以制造机器,使得通过计算机处理器或其他可编程数据处理装置执行的指令创建用于实现流程图和/或框图块中指定的功能/动作的方法。这些计算机可读程序指令还可以存储在计算机可读存储介质中,该计算机可读存储介质可以指示计算机、可编程数据处理装置和/或其他设备以特定方式运行,使得有指令存储在其中的计算机可读存储介质包括含有指令的制品,这些指令实现流程图、流程图表、状态转换图、伪代码等中指定的功能/动作的各个方面。 [0047] 计算机可读程序指令还可以加载到计算机、其他可编程数据处理装置或其他设备上,使得在计算机、其他可编程装置或其他设备上执行一系列操作步骤以产生由计算机实现的过程,从而使在计算机、其他可编程装置或其他设备上执行的指令实现流程图、流程图表、状态转换图、伪代码等中指定的功能/动作。 [0048] 在一些替代性实现方式中,流程图、流程图表、状态转换图、伪代码等中标注的功能可能不按图中标注的顺序执行。例如,实际上,流程图中连续示出的两个方框可以几乎同时执行,或者有时候可以按照相反的顺序执行,这取决于所涉及的功能。还应注意,图中标注的每个功能以及这些功能的组合可以通过执行指定功能或动作的基于专用硬件的系统来实现,或通过专用硬件和计算机指令的组合来实现。 [0049] 基于这些基本原理,现在将考虑一些非限制性的示例以说明本公开内容各个方面的各种实现方式。应当注意的是,尽管结合DWDM网络来描述各种实现方式,但是对于本领域普通技术人员来说,类似的技术可以用于其他类型的通信网络是显而易见的。 [0050] 根据所公开的技术,获得DWDM网络的综合风险图的一种方法是基于光学行为模拟。为了方便进行这种模拟,可以使用将网络拓扑和服务图作为输入的模拟平台,该模拟平台采用各种分析性的和基于机器学习的光学设备模型来准确地模拟光网络在可能的“假设”场景中的行为。在一种实现方式中,模拟平台可以使用关于裕度水平的信息和用于光学性能预测的内置能力来评估服务故障的风险。 [0051] 光DWDM网络的风险因素包括三大类:光纤链路故障,主要是由断纤导致,在某些情况下由设备故障和人为操作错误导致;光学组件故障;可能导致中断的杂项事件,包括人为操作。这些因素中的每一个都可能产生直接和间接影响。 [0052] 例如,如果发生断纤事故,那么整个光复用段(optical multiplex section,OMS)(即,两个光分插复用器之间的段)将失效。这一故障既产生直接影响,又产生间接影响。直接影响会立即在所有经过故障OMS的光通道(optical channel,OCh)路由上显示出来。间接影响是由例如通道负载的变化和由此导致的功率偏移(例如,由于复杂的光纤放大器行为)引起的,这可能会影响整个网络中的许多其他OCh服务。 [0053] 图1示出了这样的事件。在光网络100中,可重构光分插复用器(optical add‑drop multiplexer,ROADM)A130与ROADM B 132之间的光纤链路102(沿着该链路存在许多光放大器104)被切断(示为断纤106)。作为直接影响,这将导致经过该链路的所有OCh路由被丢弃,包括连接ABDG 160(即,经过ROADM A 130、ROADM B 132、ROADM D 136和ROADM G 142的连接)。但这并不是该事件对光网络100的唯一影响,因为光通道之间存在许多相互依赖关系,这些相互依赖关系会导致间接影响,甚至是对于不经过光纤链路102的OCh路由也会有影响。 [0054] 例如,连接CBDE 162(经过ROADM C 134、ROADM B 132、ROADM D 136和ROADM E  138的连接)会受到间接影响,因为ROADM B 132与ROADM D 136之间的光纤链路上的通道负载会发生变化。当光纤链路102被切断时,承载连接ABDG 160的波长上将不再有功率。这会影响ROADM B 132与ROADM D 136之间的其他通道上的功率电平,包括连接CBDE 162。这些其他通道承载于DWDM网络中的不同波长上。在一些DWDM网络中,C波段(1530纳米–1565纳米)中可能有例如80个通道,每个通道承载于单根光纤上的不同波长上——不过C波段中可能有更多或更少的通道。一些网络还能够使用L波段(1565纳米–1625纳米)中的波长在单根光纤上添加额外的通道。 [0055] 随着功率电平的变化,连接的性能可能会发生变化,例如,如目的地误码率的变化所指示。当连接的性能低于阈值时,连接可能会丢失。因此,即使断纤106对连接CBDE 162没有直接影响,也存在可能导致连接丢失的间接影响,这增加了连接CBDE 162的风险。 [0056] 第三连接CDE 164(即,经过ROADM C 134、ROADM D 136和ROADM E 138的连接)也间接受到断纤106的影响。这是因为上文讨论的连接CBDE 162上的功率偏移也影响了ROADM D 136与ROADM E 138之间的通道。虽然连接CDE 164并不与发生断纤106的原始连接ABDG  160共享任何光纤链路,但是其仍然受到影响,这是因为连接CBDE 162上的功率电平发生变化。因此,对连接CDE 164存在第二级间接影响,这会导致连接丢失,从而增加连接CDE 164的风险。 [0057] 第四连接AEF 166(即,经过ROADM A·130、ROADM E 138和ROADM F 140的连接)不受断纤106的直接或间接影响。这是因为连接AEF 166中没有光纤链路与任何直接或间接受影响的连接共享。 [0058] 关于这种直接和间接影响的风险信息对网络运营商具有重大价值,因为传输网络中任何类型的中断都可能导致网络运营商的收益损失。网络运营商的客户通常有服务水平协议(service level agreement,SLA),该协议通常会对未能满足指定要求的情况施加经济处罚。本文所述类型的风险评估框架可以让网络运营商更好地了解与各种可能场景相关联的直接和间接风险,从而增强他们采取预防性措施以减少或降低风险和/或收益损失的能力。 [0059] 对于DWDM网络,诸如上述的间接影响通常是由功率偏移或非线性效应引起的。功率偏移可能是由光网络中的嵌入式功率控制和调整算法所进行的功率调整引起的,功率调整可能会在添加或删除通道时进行。由于这些功率调整,增加或删除光通道可能会影响光纤上的所有其他通道。功率偏移效应还可能是由光放大器(例如DWDM网络中常用的掺铒光纤放大器(erbium doped fiber amplifier,EDFA))的复杂行为引起的。响应于光纤链路上的通道负载和功率电平的变化,EDFA可能会导致该光纤链路上的所有通道发生功率偏移。 [0060] 除了功率偏移之外,间接影响还可能由受激拉曼散射(stimulated Raman scattering,SRS)或交叉相位调制(cross‑phase modulation,XPM)等非线性效应引起。SRS会导致在通过光纤进行双极性传输时的从低波长通道到高波长通道的功率转移,这可能在EDFA尝试补偿该光纤中的功率平衡时发生。在C+L波段中,SRS串扰与两个通道之间的频率差近似成正比。需要注意的是,与仅C波段或仅L波段操作相比,在C+L波段中SRS效应的增益要高得多(在某些情况下高达3倍)。XPM是由于光纤上的一个波长发生变化,通过光学克尔效应而改变该光纤上另一波长的相位的非线性效应。 [0061] DWDM网络中的间接影响的这些来源在文献中有据可查,并且对于本领域普通技术人员来说是已知的。这些影响也可以模拟或建模,如下所述。 [0062] 现参考图2,描述了如本公开内容中应用的“风险”的概念。就所公开的技术而言,风险可以视为不理想结果的期望值。风险将各种可能事件的概率和对相应损失的某种衡量标准合并为单一值。这大致可以表示为: [0063] 风险=风险因素的概率×风险因素造成的预期损失 [0064] 图2中的矩阵200示出了由概率(可能性)和损失(影响)组合产生的风险等级的示例。纵轴202表示风险因素发生的可能性,范围从“可能性很小”到“可能性很大”。横轴204显示由该风险因素引起的影响,范围从“可忽略”到“严重”。可以看出,如果事件的影响是严重,那么即使是可能性很小的事件也可能呈现“中等”风险。 [0065] 应当理解,矩阵200仅表示基于可能性和影响进行的风险确定的一个示例。根据网络运营商、服务、被评估的风险因素的类型等的不同,可以为任何给定的可能性和影响指定不同的风险等级。还应当理解,可能存在可以根据本技术使用的其他风险确定方法,图2仅用于说明风险的总体概念。 [0066] 基于上文提供的关于风险、直接和间接影响的讨论以及如果SLA的要求未能得到满足时对网络运营商造成的潜在财务后果,为网络运营商提供用于了解和降低这些风险的工具将是有益的。这些工具有助于识别光网络故障的直接和间接影响,并向网络运营商提供信息以进行冗余规划和/或采取预防性行动。这些工具可以量化每个现有连接的综合风险,并提供网络上运行的最脆弱服务的列表或图。此外,这些工具可以量化每个已识别的风险因素(例如链路故障)所构成的风险,并识别网络中的关键链路和/或组件。此信息可以用于针对服务供应的修改和/或潜在冗余提供建议,以便降低风险。 [0067] 根据所公开的技术,可以使用模拟框架来更好地了解风险,该模拟框架收集来自光网络的遥测并使用光学设备模型来模拟光网络在各种“假设”场景中的行为。这一模拟框架可以用于评估在任何OMS链路发生故障时网络上每个光连接的可用性风险,并基于OMS链路故障对现有连接构成的风险来识别关键OMS链路。模拟框架还可以基于波长丢失所导致的风险来识别关键波长。基于模拟结果,可以生成整个网络的风险图并将其可视化,以便基于所有正在运行的服务的相应裕度水平来为这些服务提供风险信息。模拟框架还可以推荐应急计划以及数据速率的修改或现有连接的路由和/或波长分配的修改,以便增加可用裕度和/或降低特定连接或整个网络的相关联风险。 [0068] 图3示出了这一模拟框架300的结构图。该框架包括风险图引擎302,其将网络拓扑 304、服务图306、“假设”场景308和网络遥测310作为输入。如下文将更全面描述的,风险图引擎302使用该信息在一系列“假设”场景308下模拟光网络,并生成风险图312作为输出。风险图引擎302包括模型存储库314、性能预测引擎316、可靠性规范318和风险评估引擎320。 [0069] 网络拓扑304包括关于构成正在被风险评估的光网络的设备、组件和链路的信息。 这些设备和组件可以包括例如每个网络节点上的硬件(比如板卡)、EDFA、ROADM、转发器等。 这些设备、组件和链路的规范信息也可以包含在网络拓扑304中。 [0070] 服务图306包括关于使用网络的服务的信息。服务图306可以包括服务的源、目的地、带宽、SLA要求和处罚等。 [0071] “假设”场景308是风险图引擎302将要模拟的特定场景。例如,这样的“假设”场景可以包括诸如特定光纤连接上的断纤、特定光放大器的故障、特定组件的硬件故障、通道删除等。“假设”场景由场景生成器322生成,场景生成器322针对所有已知或预期的风险逐一生成场景,并将每个这样的场景发送到风险图引擎302。在一些实现方式中,每个“假设”场景308表示单个已知或预期的风险。 [0072] 网络遥测310包括实际网络的性能信息。要获得网络遥测310,可以使用传感器来监控OMS链路、通道和/或网络组件的性能。这向风险图引擎302提供关于例如通道和/或OMS链路上的功率电平、连接性能、通道的光信噪比(optical signal‑to‑noise ratio,OSNR)、误码率等参数的信息。在一些实现方式中,该信息可以实时或几乎实时地提供给风险图引擎302。 [0073] 在风险图引擎302内,模型存储库314是一个数据库,其存储在网络中使用的每一类组件的模型。这些模型可以是分析性的——即,基于模拟特定类型组件的已知算法或启发式方法。对于某些类型的组件,例如EDFA,组件性能可能是复杂的,因此已知的分析模型在模拟组件行为时无法达到所需的精确度。为了处理网络中这些类型的组件,模型可以基于已知的机器学习(machine learning,ML)技术,而不是基于控制组件物理特性的已知方程。基于ML的模型通常会使用正在使用的设备类型的实际行为数据进行训练。可以用于建模或模拟各类光学组件的行为的ML技术可以包括神经网络(例如深度神经网络、卷积神经网络或其他目前已知或后来开发的神经网络类型)、回归、决策树、贝叶斯机器学习技术、K‑最近邻技术、随机森林技术,和/或其他已知或后来开发的机器学习技术,包括监督学习、无监督学习和/或强化学习。 [0074] 在一些实现方式中,基于机器学习的模型的训练在不同的系统上“离线”进行,模型存储库314中可用的基于机器学习的模型是预先训练的。在其他实现方式中,可以使用例如网络遥测310在用于实现风险图引擎302的同一系统上训练至少一部分模型。 [0075] 性能预测引擎316通过将模型存储库314中的模型根据网络拓扑304进行组合来生成整个网络的模拟。网络模拟将模型存储库314中的详细单独模型相互组合使用,以模拟风险因素对网络的直接和间接(例如功率偏移和非线性效应)影响。这样允许模拟光连接的复杂非线性和功率偏移相关的相互依赖关系,以便更好地评估与服务相关联的风险。 [0076] 性能预测引擎316针对每个“假设”场景308运行单独的模拟会话,该模拟会话预测对网络上所有服务(由服务图306确定)的影响,包括直接和间接影响。网络遥测310还用于性能预测引擎316中,以提供关于实际网络的更准确的信息,例如通道上的OSNR和功率电平。 [0077] 性能预测引擎316针对每个风险因素估计每个OCh的(即,每个服务的)传输质量(quality of transmission,QoT)的衡量标准。在一些实现方式中,该QoT估计可以用每个OCh的OSNR损耗(以dB为单位)来表示,OSNR损耗是由于风险因素(即,“假设”场景)的发生而导致的。这种OSNR损耗随后可以用于基于服务的当前裕度减去所估计的OSNR损耗(也称为“OSNR处罚”)来计算剩余裕度。然后,将针对每个服务和针对每个风险因素的剩余裕度发送到风险评估引擎320。在一些实现方式中,性能预测引擎316还可以为每个预测的剩余裕度确定置信区间,以指定模拟的准确度。该置信区间可以基于被组合以模拟网络性能的每个模型和/或模拟器的准确度和/或置信区间来确定。 [0078] 在一些实现方式中,一些可能受故障影响的服务具有恢复机制,恢复机制提供服务保护或恢复。这些机制可能由故障触发,并可能导致发生各种恢复或重配置动作,这些动作可能产生直接和间接影响。因此,在一些实现方式中,将进行两轮影响评价和风险评估。 在第一轮中,性能预测引擎316针对每个风险因素运行模拟,以在任何恢复和/或重配置动作之前估计每个服务的性能。在第二轮中,性能预测引擎316在恢复和/或重配置动作发生后,估计每个服务在每个风险因素下的性能。这样允许评估此类保护或恢复机制的有效性,并了解它们对网络的直接和间接影响。 [0079] 应当理解,性能预测引擎316运行许多计算密集型模拟。在一些实现方式中,这些模拟可以在单个系统上执行,该系统可以包括多个处理器。在一些实现方式中,模拟可以分布在网络上的许多计算机上。在一些实现方式中,模型可以包含在正被建模的光学组件中,因此模拟是分布式的,使得网络中的组件执行模型以进行模拟。 [0080] 可靠性规范318包括构成网络的光学组件的可靠性信息的数据库。该信息可以以参数为形式,例如在网络中使用的组件的平均无故障时间(mean time between failure,MBTF)或平均修复时间(mean time to repair,MTTR)。这些信息通常由光网络设备制造商公布。应当理解,在一些实施例中,可以使用其他可靠性衡量标准。此外,对于一些风险因素,例如那些取决于网络运营商的行为而不是设备故障的风险因素,MBTF或MTTR等可靠性衡量标准可能不可用或不适合作为风险因素发生可能性的衡量标准,因此可以使用其他衡量标准。通常,可靠性规范318的目标是提供关于系统所模拟的各种风险因素的发生概率的信息。 [0081] 一旦预期的性能预测引擎316模拟了每个“假设”场景对每个服务的影响,关于这些影响的信息就被发送到风险评估引擎320。风险评估引擎320将这些影响(例如剩余裕度)以及不同服务的SLA要求(来自服务图306)和所有风险因素的发生概率(基于可靠性规范 318)作为输入,并计算每个服务的综合风险以及每个风险因素所构成的风险。这可以例如通过如下方式实现:通过如上文结合图2描述的方式,将影响的严重程度(基于剩余裕度)与风险因素发生的可能性相结合,以确定风险等级。一旦完成了这一点,对于每个服务,就可以将与每个风险因素相关联的风险等级合并起来,以便提供服务的综合风险。同样,对于每个风险因素,每个服务的风险等级可以合并,以提供每个风险因素构成的总体风险。在一些实现方式中,风险评估引擎320还可以生成网络的总体网络风险评分。在一些实现方式中,还可以例如使用来自可靠性规范318的MTTR信息来确定预测的中断时长。 [0082] 风险评估引擎320还生成风险图312以及关于减少或降低每个高风险连接或整个网络的风险的建议列表。如下文更详细地讨论的,在一些实现方式中,风险图312可以采取一种或更多种可视化的形式,例如表、显示对每个服务构成的风险的OCh风险图,和/或显示网络中每条链路所构成的风险的关键OMS链路图。建议或应急计划可以包括修改服务数据速率或路由和/或波长的分配以增加可用裕度。根据SLA,在某些情况下,例如预测风险较低或预测服务中断时长较短时,建议可能是什么都不做。 [0083] 在一些实现方式中,风险评估引擎320还可以生成风险的其他表示,例如被风险图引擎识别为对网络构成高风险的光网络元件(例如链路或组件)的列表。在一些实现方式中,风险评估引擎320可以生成高风险连接或服务的列表。例如,可以通过将风险与阈值进行比较来确定网络的元件是否对网络构成高风险,或者连接或服务是否为高风险连接或服务。 [0084] 风险评估引擎320可以使用对预期影响或损失的不同衡量标准来提供适合于不同场景和/或网络运营商的合适的风险衡量标准。在一些实现方式中,可以使用由于连接中断而造成的预期业务损失来确定风险。为了使用该风险衡量标准,风险评估引擎320可以估计如果剩余裕度低于阈值(例如1dB),则连接可用性将丢失。然后,可以使用每个连接的中断数据业务的量(基于通过剩余裕度确定的连接可用性的估计损失,以及例如来自网络遥测 310的数据业务的量)和相应风险因素的可能性来计算每个风险因素所构成的风险。使用该风险衡量标准可以识别高风险服务和关键风险因素,并且提供最大限度地减少服务中断的建议和应急计划。 [0085] 在一些实现方式中,可以将基于SLA的预期收益损失用作风险的衡量标准。为了使用该风险衡量标准,风险评估引擎320可以基于预测的剩余裕度和每个服务的SLA要求来估计每个风险渠道将会引起的收益损失。然后,通过将预测的货币损失与相应风险因素的可能性相结合来计算风险。使用该风险衡量标准可以将风险评估、风险图和建议侧重于服务中断的可能罚款。 [0086] 应当理解,也可以使用其他风险衡量标准。例如,风险评估引擎320可以基于例如修复或恢复服务的预测时间或其他衡量标准来评估风险。还应理解,在一些实现方式中,所使用的风险衡量标准可以由系统用户来选择和改变。 [0087] 现参考图4,描述了可以由风险图引擎302生成的风险表400的示例。在风险表400中,列表示风险因素402,每一列表示可能对网络服务的可用性构成风险的单个风险因素。 风险表400中的行表示服务404,每一行表示网络上的一个可用OCh服务。因此,表中的每个单元格表示由于一个风险因素的直接和间接影响而对一个OCh造成的预测期望损失或影响(例如预测的剩余裕度)。根据所使用的风险衡量标准,这些单元格可以显示其他值,例如预测的收益损失。因此,风险表400提供了光网络漏洞的“大局图”(“big picture”)。应当理解,风险表400中所示的任何值仅用于说明。 [0088] 从风险表400中可以看到,风险因素可以分组成列的集合,每个集合表示相似的风险因素。因此,“光纤链路切断”集合406包括表示由于网络中每个OMS链路上的光纤链路切断而导致的风险的列。“组件故障”集合408包括针对可能发生故障的每个重要的板卡或组件的列。“杂项事件”集合410包括针对每个杂项事件的列,杂项事件包括例如网络运营商执行的通道添加或删除操作,这些操作可能对网络上的服务构成风险。 [0089] 表400还包括:行412,其显示每个风险因素构成的综合风险;列414,其显示每个服务的综合风险;单元格416,其显示网络风险评分。应当理解,在各种实现方式中,风险表400中所示的数据可以通过不同的方式组织或可视化。例如,一些实现方式可以基于例如剩余裕度,以颜色标识表400中的单元格,使得即使在极度缩小的视图中,颜色也可以提供概况。 在一些实现方式中,表400可以不通过可视化形式提供给用户,而是可以在内部用于计算例如综合风险,该综合风险可以使用其他类型的可视化形式(例如风险图)来进行可视化。 [0090] 图5示出了OCh风险图502和关键OMS链路风险图504,OCh风险图502直观地示出了每个服务的综合风险的表示,关键OMS链路风险图504直观地示出了每条链路所构成的风险的表示。OCh风险图502示出了表示为图形的服务图,在该服务图中,各个节点520表示接入点,在接入点处服务被提供给客户端,而边522表示服务。可以看到,两个接入点之间可能存在许多服务,因此两个节点520之间可能存在多个边522。边522中的每一个可以使用诸如颜色或线条样式的表示来表示通过边522表示的服务的综合风险。可以看到,相同节点520之间的两个边522可以与不同的综合风险等级相关联。例如,这可能是由于服务的底层物理路由的差异、与服务相关联的SLA的差异等引起的。 [0091] 关键OMS链路风险图504基于网络拓扑中的OMS链路。节点540中的每一个表示光网络的ROADM或其他元件,边542中的每一个表示两个ROADM或其他元件之间的OMS链路。每个边542使用诸如颜色或线条样式的可视化形式来表示通过边542表示的OMS链路所构成的风险。 [0092] 应当注意,由于OCh风险图502中的接入点(即,节点520)通常与例如与光节点(例如ROADM)共置的路由器相关联,因此OCh风险图502的节点520与关键OMS链路风险图504的一些节点540(即,表示ROADM)之间可能存在对应关系。图5所示的示例可视化形式中示出了这种对应关系。应当理解,OCh风险图502和关键OMS链路风险图504可以一起显示,如图5所示,或者它们也可以单独显示。还应当理解,出于说明的目的,图5所示的风险图示出的光网络远不如使用本公开内容的技术的实际光网络复杂。对于“正常”复杂度的光网络,风险图可视化可能允许缩放和平移以查看整个风险图。 [0093] 图6示出了可以用于例如执行上述模拟框架的计算机系统600。这样的计算机系统 600可以从光网络接收实时或几乎实时的网络遥测以及在模拟平台中使用的其他信息,例如网络拓扑信息、服务图信息和“假设”场景信息或风险因素。计算机系统600随后可以执行模拟框架以产生可以用于提高光网络可靠性和性能的风险图、建议和应急计划。 [0094] 计算机系统600可以是多用户计算机、单用户计算机、服务器、嵌入式控制系统、在“云”中提供服务的计算机或者当前已知或以后开发的任何其他计算机系统。此外,应当认识到,计算机系统600的部分或全部组件可以虚拟化。如图6所示,计算机系统600包括一个或更多个处理器602、存储器610、存储接口620和网络接口640。这些系统组件通过总线650互联,总线650可以包括一个或多个更内部和/或外部总线(未示出)(例如PCI总线、通用串行总线、IEEE 1394“火线(Firewire)”总线、SCSI总线、串行‑ATA总线等),各种硬件组件电耦合到总线650。 [0095] 存储器610可以是随机存取存储器或任何其他类型的存储器,并可以包含数据 612、操作系统614和程序616。数据612可以是作为计算机系统600中任何程序的输入或输出的任何数据。操作系统614是MICROSOFT WINDOWS或LINUX等操作系统。程序616可以是包括程序指令的任何程序或一组程序,其中这些程序指令可以由处理器执行以控制计算机系统 600所采取的动作。 [0096] 存储接口620用于将存储设备(例如存储设备625)连接到计算机系统600。一种类型的存储设备625是固态驱动器,其可以使用集成电路组件来持久地存储数据。不同类型的存储设备625是硬盘驱动器,例如使用磁存储设备来存储和检索数字数据的机电设备。类似地,存储设备625可以是光驱、接收可移动存储卡(例如SD卡)的读卡器或可以通过例如通用串行总线(universal serial bus,USB)连接到计算机系统600的闪存设备。 [0097] 在一些实现方式中,计算机系统600可以使用众所周知的虚拟存储技术,这些虚拟存储技术使计算机系统600的程序表现得好像它们可以访问大的连续地址空间,而不是访问多个较小的存储空间,例如存储器610和存储设备625。因此,虽然数据612、操作系统614和程序616显示为驻留在存储器610中,但本领域技术人员将认识到,这些项目不一定同时全部包含在存储器610中。 [0098] 处理器602可以包括一个或更多个微处理器和/或其他集成电路。处理器602执行存储在存储器610中的程序指令。当计算机系统600启动时,处理器602可以首先执行引导例程和/或组成操作系统614的程序指令。 [0099] 网络接口640用于通过网络660将计算机系统600连接到其他计算机系统或网络化设备(未示出)。网络接口640可以包括允许通过网络660进行通信的硬件和软件的组合。在一些实现方式中,网络接口640可以是无线网络接口。网络接口640中的软件可以包括使用一个或更多个网络协议通过网络660进行通信的软件。例如,网络协议可以包括传输控制协议/互联网协议(Transmission Control Protocol/Internet Protocol,TCP/IP)。在一些实现方式中,计算机系统600可以通过网络接口640接收网络遥测数据。在一些实现方式中,网络遥测数据可以通过其他输入/输出接口(未示出)接收,例如USB连接或其他已知接口。 [0100] 应当理解,计算机系统600仅仅是示例,并且所公开的技术可以与具有不同配置的计算机系统或其他计算设备一起使用。 [0101] 应当理解,尽管本文中提出的实施例已经结合特定特征和结构进行了描述,但在不脱离这些公开内容的情况下,可以进行各种修改和组合。因此,说明书和附图仅应视为对论述的实现方式或实施例和所附权利要求书限定的其原理的说明,并且预期涵盖属于本公开内容范围内的任何和所有修改、变化、组合或等效物。

相关技术
通信网络相关技术
风险图相关技术
蒋志平发明人的其他相关专利技术