首页 / 故障分析方法、故障分析装置和服务器

故障分析方法、故障分析装置和服务器有效专利 发明

技术领域

[0001] 本发明实施例涉及通信技术,尤其涉及一种故障分析方法、故障分析装置和服务器。

相关背景技术

[0002] 近年来,光传送网技术有了长足的进步,无论上从传送技术还是网络部署和应用都日趋成熟。随着光传送网技术的成熟,网络的智能化和自动化的程度越来越高,这使得光网络正逐步由传统光网络发展为智能光网络。
[0003] 为保证智能光网络的可靠性,可以是通过该智能光网络中控制器进行网络生存性分析。该控制器进行网络生存性分析,可以是通过对网络故障进行分析,确定网络故障对业务的影响,从而为业务提供故障保护及故障恢复,保证业务的正常运行,保证网络可靠性。常用的网络生存性分析,可以是针对所有的网络故障进行分析。
[0004] 然而,针对所有的网络故障进行分析,可使得故障分析过程较长,从而使得网络生存性分析的过程较长,效率较低。

具体实施方式

[0079] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0080] 本发明实施例提供的故障分析方法、故障分析装置、服务器,可通过对网络故障进行故障分析,从而进行网络的生存性分析。网络的生存性分析指的是网络对故障的抗击能力,即网络故障对网络中承载业务的影响。该故障分析方法可用于对智能光网络进行生存性分析。该智能光网络例如可以为传统智能光网络或软件定义网络(Software Defined Network,简称SDN)光网络。该传统智能光网络例如可以为传统的自动切换光网络(Automatic Switched Optical Network,简称ASON)。该SDN光网络例如可以为基于SDN的ASON。
[0081] 图1为本发明各实施例所应用的网络架构示意图。本发明各实施例的方法可由故障分析装置执行,该装置通常以硬件和/或软件的方式来实现,集成在如图1所示的服务器101上。该服务器101例如可以为数据中心服务器(Data Center,简称DC服务器)。运营支撑系统(Operation Support System,简称OSS)中运营商的终端102或用户的终端103上可安装有该故障分析对应的应用(application)程序,通过该应用(application)程序访问该服务器101,从而获得该服务器101的故障分析结果,或向该服务器101下发分析指令。图1中的控制器104可通过传输网105中的各路由器106获取该传输网105的历史故障信息,并将其发送至服务器101,由服务器101根据该传输网105的历史故障信息对该传输网进行故障分析,继而进行网络生存性分析。若该传输网105为SDN光网络,则该控制器
104可以为SDN控制器。需要说明的是,该图1仅为示意图,因此,该图1中各设备之间的连接可以为有线连接,也可以为无线连接。
[0082] 本发明实施例一提供一种故障分析方法。图2为本发明实施例一提供的一种故障分析方法的流程图。如图2所示,本实施例的方法可以包括:
[0083] S201、确定网络中故障概率最大的网络故障。
[0084] 具体地,该网络可以为运营商部署的传输骨干网。若该传输骨干网的信号传输媒介为光纤,则该传输骨干网可以为光传送网(Optical Transport Network,简称OTN)。该概率最大的网络故障,可以包括:该网络在未来的同一预设时间内发生故障的概率最大的至少一个网络故障。该网络故障可包括:节点故障和/或链路故障。该链路故障例如可包括:多段(Multi-Segment,简称MS)链路故障、管道(Duct)链路故障、电缆(Cable)链路故障和共享风险链路组(Shared Risk Link Group,简称SRLG)故障。该故障概率最大的网络故障可以为网络中的部分网络故障。
[0085] S202、对该故障概率最大的网络故障进行故障分析。
[0086] 具体地,对该故障概率最大的网络故障进行故障分析,可以是通过同步数字体系(Synchronous Digital Hierarchy)中的模拟子系统进行分析,从而确定该故障概率最大的网络故障中各故障对业务的影响,输出故障分析表,并根据该故障分析表确定该故障概率最大的网络故障中对业务影响较大的网络故障,和/或,该网络中的瓶颈。该网络中的瓶颈,可以是该网络的脆弱点例如可以包括:对业务影响较大的网络故障,和/或,故障概率最大的网络故障。
[0087] 需要说明的是,在该S202中对该故障概率最大的网络故障进行故障分析,确定对业务影响较大的网络故障,还可通过为业务提供故障保护及故障恢复,保证业务的正常运行,保证网络可靠性;确定该网络的脆弱点,还可通过对脆弱点进行改善,从而减小网络脆弱点,加强网络的可靠性。
[0088] 本发明实施例一提供的故障分析方法,可通过确定网络中故障概率最大的网络故障,并对该故障概率最大的网络故障进行故障分析,而无需遍历网络中的所有网络故障进行分析,减小故障分析的网络故障数,减短故障分析的过程,从而减短网络生存性分析的过程,提高生存性分析的效率。
[0089] 本发明实施例二在上述实施例一的故障分析方法的基础上,还提供一种故障分析方法。可选的,该方法中S201中确定网络中故障概率最大的网络故障之前,该方法还可包括:
[0090] 确定该网络中每个网络故障的故障概率。
[0091] 图3为本发明实施例二提供的故障分析方法中确定每个网络故障的故障概率的方法流程图。如图3所示,该确定该网络中每个网络故障的故障概率可包括:
[0092] S301、根据该网络中每个网络对象的历史故障信息,确定该每个网络对象的故障概率;该网络对象包括:节点和/或链路。
[0093] 具体地,该每个网络对象的历史故障信息可包括该每个网络对象的至少一个故障类型对应的历史故障信息。因而,根据该网络中每个网络对象的历史故障信息,确定该每个网络对象的故障概率,可以是根据该每个故障类型对应的该每个网络对象的历史故障信息,确定该每个故障类型对应的该每个网络对象的故障概率。
[0094] S302、将该每个网络对象的故障概率确定为该每个网络故障的故障概率。
[0095] 具体地,该每个网络对象的故障概率可以为该每个故障类型对应的该每个网络对象的故障概率,因此,该每个网络故障的故障概率可以为该每个故障类型对应的该每个网络对象的故障概率。
[0096] 可选的,本发明实施例二还提供一种故障分析方法。图4为本发明实施例二提供的另一种故障分析方法的流程图。可选的,如上述所述的S301中根据该每个网络对象的历史故障信息,确定该每个网络对象的故障概率,可以包括:
[0097] S401、根据该每个网络对象的历史故障信息,采用公式1确定该每个网络对象在时刻t的故障概率;该历史故障信息包括历史故障次数,及各历史故障的产生时间。
[0098] ......公式1;
[0099] 其中,ei为第i个网络对象,i为1,2,3...N中任一元素,N为该网络中的网络对象个数。 为ei在时刻t的故障概率; 为ei的k次历史故障的时间序列; 为ei的第1次历史故障的产生时间。
[0100] 可选的,在上述S301中根据该每个网络对象的历史故障信息,确定该每个网络对象的故障概率之前,该方法还可包括:
[0101] S401a、接收控制器发送的该每个网络对象的历史故障信息。
[0102] 具体地,该控制器例如可以为SDN控制器。该每个网络对象的历史故障信息,例如可以为该控制器接收到该传输骨干网中的路由器上报的网络实时信息中获得的该传输骨干网中各节点和/或链路的历史故障信息。
[0103] 可选的,在该实施例二上述方法的基础上,本发明实施例二还提供又一种故障分析方法。图5为本发明实施例二提供的又一种故障分析方法的流程图。如图5所示,该方法在上述实施例一种S201中确定网络中故障概率最大的网络故障,可以包括:
[0104] S501、确定故障概率之和最大的至少一个故障组合;其中,每个故障组合中的网络故障数等于预设网络故障数;该预设网络故障数为同时发生的网络故障数。
[0105] 具体地,该预设网络故障数例如可以为预设的该网络中同时发生的网络故障数。该预设网络故障数可大于或等于1。举例来说,若该预设网络故障数为1,则每个故障组合中的网络故障数可以为1;若该预设网络故障数为读个,则该每个故障组合中的网络故障数可为多个。
[0106] S502、将该至少一个故障组合中的网络故障确定为该故障概率最大的网络故障。
[0107] 可选的,在该实施例二上述方法的基础上,该实施例二还提供再一种故障分析方法。图6为本发明实施例二提供的再一种故障分析方法的流程图。该S501中确定该故障概率之和最大的至少一个故障组合包括:
[0108] S601、确定该预设网络故障数对应的所有故障组合。
[0109] 具体地,该预设网络故障数对应的所有故障组合,可以是通过该预设网络故障数,对该网路中所有的网络故障进行排列组合确定的。该网络中的所有网络故障可以通过该网络中所有网络对象的标识表示,其中,一个网路故障例如可以是通过一个网络对象的标识表示。
[0110] S602、将该所有故障组合的故障概率之和,确定为总故障概率。
[0111] 具体地,该所有故障组合的故障概率之和,可以是通过该所有故障组合中国每个故障组合的概率求和获得。
[0112] S603、确定该所有故障组合中故障概率之和大于或等于预设概率阈值的该至少一个故障组合;该预设概率阈值小于该总故障概率。
[0113] 可选的,将该所有故障组合的故障概率之和,确定为总故障概率之前,该方法还包括:
[0114] 确定该所有故障组合中每个故障组合的故障概率。
[0115] 可选的,若该预设网络故障数为1,该确定该所有故障组合中每个故障组合的故障概率,包括:
[0116] 将该每个故障组合中一个网络故障的故障概率,确定为该每个故障组合的故障概率。
[0117] 可替代地,若该预设网络故障数大于或等于2,则上述确定该所有故障组合中每个故障组合的故障概率可以是包括:
[0118] 采用公式2确定该每个故障组合的故障概率。
[0119] Pm=p(1)*p(2|1)…p(k′|k′-1)......公式2
[0120] 其中,m为1,2,3…M中任一元素;M为该所有故障组合中故障组合个数,且k′为该预设网络故障数,k′≥2;P1~PM依次表示该所有故障组合中从大到小的各故障组合的概率;p(1)为该每个故障组合中的最大故障概率;p(k′|k′-1)为该每个故障组合中故障概率从大到小的第k′-1个网络故障发生故障的情况下第k′个网络故障的故障概率。 可以为N个网络故障中选择k′个网络故障进行排列组合的组合个数。
[0121] 其中, y为该每个故障组合中第k′-1个网络故障的历史故障次数; 为该第k′-1个网络故障的y次历史故障的时间序列;x为该每个故障组合中第k′个网络故障的历史故障次数; 为该第k′-1个网络故障的x次历史故障的时间序列;tr为平均故障修复时间。
[0122] 可选的,如上述所述的S603中确定该所有故障组合中故障概率之和大于或等于预设概率阈值的该至少一个故障组合,可以包括:
[0123] 根据该总故障概率和预设分析精度,采用公式3确定该至少一个故障组合。
[0124] ......公式3
[0125] 其中, 为该总故障概率,a为该预设分析精度,该预设概率阈值为该总故障概率与该预设分析精度的乘积;n′为1,2,3...N′中任一元素, 为该至少一个故障组合的故障概率之和,P1~PN′依次表示该至少一个故障组合中从大到小的各故障组合的概率;P1~PN′对应的故障组合为该至少一个故障组合。
[0126] 具体地,根据该总故障概率,和该预设分析精度,确定该预设概率阈值,继而根据该公式3确定满足该公式3的N′,继而确定P1~PN′对应的故障组合为该至少一个故障组合。
[0127] 可选的,如上述实施例一中S202中对该故障概率最大的网络故障进行故障分析,可以包括:
[0128] 对该至少一个故障组合中每个故障组合中的网络故障进行故障分析,确定该每个故障组合对业务的影响。
[0129] 具体地,本实施例中可以是依次对该至少一个故障组合中的各故障组合中的网络故障进行故障分析。由于不同故障组合之间相互独立,因而本实施例中也可以是同时对该多个故障组合中的各故障组合进行并行故障分析,从而提高分析效率。
[0130] 可选的,对该至少一个故障组合中每个故障组合中的网络故障进行故障分析,包括:
[0131] 根据该每个故障组合中各网络故障对应的网络对象,与该各网络故障对应的网络对象的承载业务信息,确定该每个故障组合影响的业务,和/或,不受该每个故障组合影响的业务。
[0132] 本发明实施例二提供的故障分析方法,可在上述实施例一的基础上,通过提供多个确定网络中故障概率最大的网络故障的实现方法,从而在减小故障分析过程,减短网络生存性分析的基础上,还可保证生存性分析的精度。
[0133] 本发明实施例三还提供一种故障分析方法。图7为本发明实施例三提供的一种故障分析方法的流程图。如图7所示,该方法可包括:
[0134] S701、控制器向服务器发送网络中每个网络对象的历史故障信息,该历史故障信息包括:该每个网络对象的历史故障次数,和,各历史故障的产生时间。
[0135] S702、服务器根据该每个网络对象的历史故障次数、各历史故障的产生时间,确定该每个网络对象的故障概率。
[0136] 该实施例中可以通过网络对象为链路进行说明。若该网络中链路包括:a、b、c、d。根据该S702中可采用如上述公式1,确定链路a的故障概率例如可以为0.8、链路b的故障概率例如可以为0.7、链路c的故障概率例如可以为0.7、链路d的故障概率例如可以为
0.2。
[0137] S703、服务器根据预设的网络故障数,确定该网络中的该网络故障数对应的所有故障组合。
[0138] 该网络故障数,可以为断纤次数,即链路中断次数。该网络故障数例如可以为2。该网络中该网络故障数对应的所有故障组合,则可包括:故障组合a,b、故障组合a,c、故障组合a,d、故障组合b,a、故障组合b,c、故障组合b,d、故障组合c,a、故障组合c,b、故障组合c,d、故障组合d,a、故障组合d,b和故障组合d,c。
[0139] S704、服务器确定该每个故障组合的故障概率。
[0140] 服务器可以是根据该每个网络对象的故障概率,采用上述公式2获得该每个故障组合的故障概率。其中,故障组合a,b的概率P(a,b)例如可以为0.9,故障组合a,c概率P(a,c)为0.1,故障组合a,d的概率P(a,d)为0,故障组合b,a的概率P(b,a)的概率为0,故障组合bc的概率P(b,c)为0.8,故障组合b,d的概率P(b,d)为0,故障组合c,a的概率P(c,a)为0,故障组合c,b的概率P(c,b)为0,故障组合c,d的概率P(c,d)为0,故障组合d,a的概率P(d,a)为0,故障组合d,b的概率P(d,b)为0、故障组合d,c的概率P(d,c)为0。
[0141] 根据该所有故障组合的概率,对该所有故障组合进行排序,获得如下所示的故障组合与概率的对应关系表。
[0142]故障组合 概率
a,b 0.9
b,c 0.8
a,c 0.1
a,d 0
b,a 0
b,d 0
c,a 0
c,b 0
c,d 0
d,a 0
d,b 0
d,c 0
[0143] S705、服务器对该所有故障组合的概率求和,获得总故障概率。
[0144] 该所有故障组合的概率之和,可以为P(a,b)+P(b,c)+P(a,c)=1.8。
[0145] S706、服务器根据该总故障概率和预设分析精度,确定该所有故障组合中故障概率之和大于或等于预设概率阈值的至少一个故障组合。
[0146] 该故障概率为1.8,该预设分析精度,例如可以为0.9,那么该预设概率阈值可以为1.8与0.9的乘积,即1.62。该所有故障组合中,P(a,b)+P(b,c)=1.7,大于该预设概率阈值1.62,则该至少一个故障组合可包括:{a,b b,c}。
[0147] S707、服务器根据该至少一个故障组合中每个故障组合的各网络故障对应的网络对象,与该各网络故障对应的网络对象的承载业务信息,确定该每个故障组合影响的业务,和/或,不受该每个故障组合影响的业务。
[0148] 本发明实施例三通过具体的实例对上述各实施例的故障分析方法进行说明,其有益效果与上述实施例类似,在此不再赘述。
[0149] 本发明实施例四提供一种故障分析装置。图8为本发明实施例四提供的一种故障分析装置的结构示意图。如图8所示,该故障分析装置800可包括:确定模块801和分析模块802。
[0150] 确定模块801,用于确定网络中故障概率最大的网络故障。
[0151] 分析模块802,用于对该故障概率最大的网络故障进行故障分析。
[0152] 可选的,确定模块801,还用于在确定该网络中该故障概率最大的网络故障之前,确定该网络中每个网络故障的故障概率。
[0153] 可选的,确定模块801,还用于根据该网络中每个网络对象的历史故障信息,确定该每个网络对象的故障概率,并将该每个网络对象的故障概率确定为该每个网络故障的故障概率;其中,该网络对象包括:节点和/或链路。
[0154] 可选的,确定模块801,还用于根据该每个网络对象的历史故障信息,采用公式1确定该每个网络对象在时刻t的故障概率;该历史故障信息包括历史故障次数,及各历史故障的产生时间。
[0155] ......公式1;
[0156] 其中,ei为第i个网络对象,i为1,2,3...N中任一元素,N为该网络中的网络对象个数; 为ei在时刻t的故障概率; 为ei的k次历史故障的时间序列; 为ei的第1次历史故障的产生时间。
[0157] 可选的,该故障分析装置800还可包括:
[0158] 接收模块,用于接收控制器发送的该每个网络对象的历史故障信息。
[0159] 可选的,确定模块801,还用于确定故障概率之和最大的至少一个故障组合,将该至少一个故障组合中的网络故障确定为该故障概率最大的网络故障;其中,每个故障组合中的网络故障数等于预设网络故障数;该预设网络故障数为同时发生的网络故障数。
[0160] 可选的,该确定模块801,还用于确定该预设网络故障数对应的所有故障组合;将该所有故障组合的故障概率之和,确定为总故障概率;确定该所有故障组合中故障概率之和大于或等于预设概率阈值的该至少一个故障组合;该预设概率阈值小于该总故障概率。
[0161] 可选的,确定模块801,还用于确定该所有故障组合中每个故障组合的故障概率。
[0162] 可选的,若预设网络故障数为1,确定模块801,还用于将该每个故障组合中一个网络故障的故障概率,确定为该每个故障组合的故障概率。
[0163] 可替代地,若该预设网络故障数大于或等于2,确定模块801,还用于采用公式2确定该每个故障组合的故障概率。
[0164] Pm=p(1)*p(2|1)…p(k′|k′-1)......公式2
[0165] 其中,m为1,2,3...M中任一元素;M为该所有故障组合中故障组合个数,且k′为该预设网络故障数,k′≥2;P1~PM依次表示该所有故障组合中从大到小的各故障组合的概率;p(1)为该每个故障组合中的最大故障概率;p(k′|k′-1)为该每个故障组合中故障概率从大到小的第k′-1个网络故障发生故障的情况下第k′个网络故障的故障概率。
[0166] 其中, y为该每个故障组合中第k′-1个网络故障的历史故障次数; 为该第k′-1个网络故障的y次历史故障的时间序列;x为该每个故障组合中第k′个网络故障的历史故障次数; 为该第k′-1个网络故障的x次历史故障的时间序列;tr为平均故障修复时间。
[0167] 可选的,确定模块801,还用于根据该总故障概率和预设分析精度,采用公式3确定该至少一个故障组合。
[0168] ......公式3;
[0169] 其中, 为该总故障概率,a为该预设分析精度,该预设概率阈值为该总故障概率与该预设分析精度的乘积;n′为1,2,3...N′中任一元素, 为该至少一个故障组合的故障概率之和,P1~PN′依次表示该至少一个故障组合中从大到小的各故障组合的概率;P1~PN′对应的故障组合为该至少一个故障组合。
[0170] 可选的,分析模块802,还用于对该至少一个故障组合中每个故障组合中的网络故障进行故障分析,确定该每个故障组合对业务的影响。
[0171] 可选的,分析模块802,还用于根据该每个故障组合中各网络故障对应的网络对象,与该各网络故障对应的网络对象的承载业务信息,确定该每个故障组合影响的业务,和/或,不受该每个故障组合影响的业务。
[0172] 本发明实施例四提供的故障分析装置,可用于上述实施例一或实施例二中任一实施例所述的故障分析方法,其有益效果与上述实施例类似,在此不再赘述。
[0173] 本发明实施例五还提供一种服务器。图9为本发明实施例五提供的服务器的结构示意图。如图9所示,该服务器900可包括故障分析装置901。该故障分析装置901可以为上述实施例四中任一所述的故障分析装置。
[0174] 本发明实施例五提供的服务器,可包括上述实施例四的故障分析装置,从而执行上述实施例一或实施例二提供的故障分析方法,其有益效果与上述实施例类似,在此不再赘述。
[0175] 本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
[0176] 最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页 第1页 第2页 第3页
相关技术
分析装置相关技术
故障分析相关技术
吴伟发明人的其他相关专利技术