首页 / 一种配网故障预警方法

一种配网故障预警方法有效专利 发明

技术领域

[0001] 本发明涉及电力领域,具体涉及一种配网故障预警方法。

相关背景技术

[0002] 当前,电力系统在故障大数据分析应用领域存在较大挑战,故障风险预警方法有待完善。随着智能电网的发展,配用电系统正在产生出越来越多的数据,利用大数据技术对这些数据进行处理和分析,能够提高配用电系统的运维检修水平。
[0003] 然而目前针对故障预警的研究仍然较少,方法体系还不成熟。现有技术中存在基于信息熵理论展开基于大数据的配网诊断研究。但该研究侧重于配网故障影响指标的构建,对于如何提前进行配网故障预警,仍有待深入研究。
[0004] 随着人工智能的兴起,各领域展开了机器学习技术应用的研究。如何通过分析历史故障数据,提炼出跟故障可能相关的因素,借助机器学习算法,构建频配网故障的主动预警模型,提高故障预警的准确率,是一个需要解决的问题。同时,在对某地理区域范围内配网2017年1月-2018年12月的故障原因进行分析后可以获知,配网故障发生概率较小,从而导致配网正常数据量远大于配网故障数据量,这会为机器学习模型带来新的问题。需要找到一种合理的方法,使得配网正常数据量与配网故障数据量尽量相等,也就是对配网正常数据进行欠采样,对配网故障数据进行过采样,使得二者达到一个相对平衡的状态。现有技术中,对数据集进行过采样一般采取随机过采样的方法,对数据集进进行欠采样一般采用随机欠采样的方法,数据处理的速度较快,但是往往会损失一定的数据集合性质,即由于随机复制的数据过多,使得模型学习到的信息过于特别(Specific)而不够泛化(General)。

具体实施方式

[0012] 为使本发明的目的、技术方案和优点更加清楚,将结合附图对本发明作进一步地详细描述。这种描述是通过示例而非限制的方式介绍了与本发明的原理相一致的具体实施方式,这些实施方式的描述是足够详细的,以使得本领域技术人员能够实践本发明,在不脱离本发明的范围和精神的情况下可以使用其他实施方式并且可以改变和/或替换各要素的结构。因此,不应当从限制性意义上来理解以下的详细描述。
[0013] 根据本发明的第一个方面,提出了一种基于重采样的配网故障预警方法,包括:
[0014] 步骤1000,获取用于配网故障预警的配网数据集合Z={zi|i∈[1,n]},其中,为zi中的第j个参数,m为zi中用于配网故障预警的参数数量,ci为所述第i个数据的配网故障标识;当所述数据zi对应的配网状态为配网正常时,ci为0;当所述数据zi的配网状态为配网故障时,ci为1。
[0015] 根据本发明的一个方面通过对某地理区域范围内配网2017年1月-2018年12月的配网故障原因分析,获取日最高温度、日平均温度、日平均湿度、馈线投运年限,馈线负荷、馈线历史故障次数等与配网故障相关的因素,作为用于配网故障预警的参数;即zi中的参数包括日最高温度、日平均温度、日平均湿度、馈线投运年限,馈线负荷、馈线历史故障次数……。其中,参数馈线投运年限、馈线负荷、馈线历史故障次数等参数可以从位于电力系统内的,与互联网物理和/或逻辑隔离中的一个或多个服务器获得,参数日最高温度、日平均温度、日平均湿度等可以从位于电力系统外的互联网上的服务器获得。收集配网历史故障发生时各种参数值,将所述配网故障标识置为1,可以得到多个配网故障数据,随机抽取配网正常状态时各种参数值,将所述配网故障标识置为0,可以得到多个配网正常数据。根据本发明的一个实施例,例如如果取日最高温度,日平均湿度,馈线投运年限三种参数,且日最高气温32°,日平均湿度90%的某天,馈线投运年限为三年的馈线发生故障,则这一个配网数据可以表示为zi=(32,90%,3,1)。在对某地理区域范围内配网2017年1月-2018年12月的故障原因进行分析后可以获知,配网故障发生概率较小,从而导致配网正常数据量远大于配网故障数据量。
[0016] 进一步的,根据所述用于配网故障预警的参数在历史故障原因中出现的次数确定特征权重,一般而言,出现次数越多,特征权重越高,越容易被选中作为用于配网故障预警的参数,根据本发明,示例性且实验性的,如图1所示,选择特征权重较高的日最高温度、日平均湿度、日最低湿度、日最大风速、日降雨量等10个参数作为配网故障预警参数。本领域技术人员理解,前述实施例中参数的选择和参数数量并不构成对本发明保护范围的限制,事实上,能够影响配网故障预警的参数可以达到几百个的数量级,本发明的图1所示的参数示例仅仅是为了使得本领域技术人员方便理解本发明的方法,而绝不是意味着本发明仅限于处理10个参数或仅具备处理10个数量级的参数的能力。此外,本发明也允许将特征权重作为参数选择的一个依据并结合其他方法(例如德尔菲法等)确定配网故障预警参数。
[0017] 根据本发明的一个实施例,数据zi为配网原始数据,即从电力系统内外部服务器中直接获取的数据。根据本发明的另一个实施例,数据zi为进行预处理后获得的数据,例如,所述数据zi为配网原始数据经过数据清洗后得到的数据
[0018] 步骤2000,当Nn≥l*Ne时,对所述配网数据集合Z进行重采样,得到配网数据集合Y;Nn为所述配网数据集合Z中,ci为0的数据的数量,Ne为所述配网数据集合Z中,ci为1的数据的数量。其中,l为预设常量,l∈[10,1000],优选为100。
[0019] 根据本发明的一个方面,所述步骤2000进一步包括:
[0020] 步骤220,计算Ne和Nn的比值,如果所述比值大于 且Ne大于 那么转入步骤230,如果所述比值小于 且Ne大于 那么转入步骤240,如果所述比值大于 且Ne小于 那么转入步骤260,如果所述比值小于 且Ne小于 那么转入步骤280;其中,q为自定义常量,取值区间为[30,80],优选为50。
[0021] 步骤230,对配网故障数据集A进行第一过采样,使得所述配网故障数据数量增加到平衡数量,其中平衡数量为所述配网数据集Z中的配网故障数据数量和配网正常数据数量的均值,即 为向下取整;对配网正常数据集B进行第一欠采样,使得所述配网正常数据数量减少到平衡数量;所述配网数据集合Y为第一过采样后的配网故障数据集A与第一欠采样后的配网正常数据集B的并集。
[0022] 其中配网故障数据集A为所述配网数据集合Z中Ne个ci为0的数据集合,配网正常数据集B为所述配网数据集合Z中Nn个ci为1的数据集合。
[0023] 步骤240,对所述配网故障数据集进行第一过采样,使得所述配网故障数据数量增加到平衡数量;对所述配网正常数据集进行第二欠采样,使得所述配网正常数据数量减少到平衡数量;所述配网数据集合Y为第一过采样后的配网故障数据集A与第二欠采样后的配网正常数据集B的并集。
[0024] 步骤260,对所述配网故障数据集进行第二过采样,使得所述配网故障数据数量增加到平衡数量;对所述配网正常数据集进行第一欠采样,使得所述配网正常数据数量减少到平衡数量;所述配网数据集合Y为第二过采样后的配网故障数据集A与第一欠采样后的配网正常数据集B的并集。
[0025] 步骤280,对所述配网故障数据集进行第二过采样,使得所述配网故障数据数量增加到平衡数量;对所述配网正常数据集进行第二欠采样,使得所述配网正常数据数量减少到平衡数量;所述配网数据集合Y为第二过采样后的配网故障数据集A与第二欠采样后的配网正常数据集B的并集。
[0026] 根据比值和故障数据数量来决定重采样方法能够取得以下技术效果:考虑故障数据数量和正常数据数量问题,如果故障数据数量较多,使用第一过采样方法保证效率,如果故障数据数量较少,使用第二过采样方法保证故障数据的多样性;如果正常数据数量较少,使用第一欠采样方法保证效率,如果正常数据数量较多,使用第二欠采样方法保证多样性。
[0027] 具体的,第一过采样方法为随机过采样方法,第二过采样方法包括步骤242与步骤246:
[0028] 步骤242,获取第二过采样数据 其中Random(0,1)为0到1之间的随机数; 为ze中的第j个参
数, 为所述配网故障数据集A中的任意一个数据; 为zf中的第j个参
e
数, 为与z距离最近的h个数据中随机选择的一个数据。
[0029] 步骤246,将数据zg放入所述配网故障数据集A,将ne更新为ne+1,如果ne小于为向下取整,那么转入步骤242,否则终止。
[0030] 具体的,第一欠采样方法为随机欠采样方法,第二欠采样方法包括:
[0031] 步骤282,初始化正整数v,w,以及数据集合C;其中v=1,w=0,[0032] 步骤284,获取数据 其中zu为所述配网正常数据集B中任意一个数据, 为zu中的第v个参数,
为 的取
值上限, 为 的取值下限。
[0033] 例如第v个参数为气温参数,气温取值区间为[-15,39],则
[0034] 步骤286,将数据zu放入数据集合C,将w更新为w+1,如果 那么转入步骤284,如果 且v<m,那么将w更新为0,将v更新为v+1,转入步骤284,如果且v=m,那么转入步骤288。
[0035] 步骤288,获取数据集合D,其中所述数据集合D中数据为所述配网正常数据集B中随机获取 个数据,获取第二欠采样后的配网正常数据集B,其中第二欠采样后的配网正常数据集B为所述数据集合C和所述数据集合D的并集。
[0036] 通过步骤282至步骤286,可以从所述配网正常数据集B中获取 个配网正常数据,通过步骤288,可以从所述配网正常数据集B中获取 个数据,从而通过第二欠采样可以从所述配网正常数据集B中获取 个数据。
[0037] 使用这种欠采样方法能够取得以下技术效果:防止欠采样过程中,所有采样的数据集中在一个小范围内,从而丢失数据的很多性质,对最后的机器学习结果造成不良影响,而使用这种欠采样方法,每种参数都在各自的取值区间内较为均匀的分布,避免了数据过于集中可能带来的性质损失,同时步骤288中的随机采样还防止了欠采样数据过于均匀可能带来的性质损失。例如有300个数据,其中100个数据结果为错误,200个数据结果为正确,对300个数据欠采样得到100个数据,如果数据过于集中,有可能得到100个数据结果全部为错,那么最终机器学习结果将全部为错,使得机器学习模型完全不能做出正确判断。例如有300个数据,其中参数Q低于均值的数据有260个,高于均值的数据40个,如果采样过于平均,必然高于均值的40个数据被抽取的概率较大,也难免出现数据集中抽取的现象。
[0038] 步骤3000,根据所述配网数据集合Y,确定配网故障预警模型。
[0039] 进一步的,根据所述配网数据集合Y,确定配网故障预警模型,该配网故障预警模型实现为机器学习模型(例如逻辑回归模型等现有技术中的模型),通过对机器学习模型进行训练和优化,从而获得配网故障预警模型。
[0040] 步骤4000,获取当前的配网故障预警数据。如前所述,参数馈线投运年限、馈线负荷、馈线历史故障次数等参数可以从位于电力系统内的,与互联网物理和/或逻辑隔离中的一个或多个服务器获得,参数日最高温度、日平均温度、日平均湿度等可以从位于电力系统外的互联网上的服务器获得。
[0041] 步骤5000,将所述当前配网故障预警数据输入所述配网故障预警模型(例如前述的逻辑回归模型),如果所述配网故障预警模型输出结果为配网故障,那么进行配网故障报警。根据本发明,故障报警可以采用现有技术中公知的故障报警方式,本发明并非意图充分保护故障报警的具体实现方式,因此不再赘述。
[0042] 此外,本领域技术人员公知,配网故障预警模型也可以实现为逻辑回归之外的其他模型,例如决策树模型,随机森林模型,支持向量机模型等现有技术中的模型,即使用这些模型进行配网故障预警的技术方案也将落入本发明的保护范围。
[0043] 根据本发明的第二个方面,还提供了一种对配网数据集合进行重采样的方法,包括:
[0044] 步骤1000,获取用于配网故障预警的配网数据集合Z={zi|i∈[1,n]},其中,为zi中的第j个参数,m为zi中用于配网故障预警的参数数量,ci为所述第i个数据的配网故障标识;当所述数据zi对应的配网状态为配网正常时,ci为0;当所述数据zi的配网状态为配网故障时,ci为1。
[0045] 步骤2000,当Nn≥l*Ne时,对所述配网数据集合Z进行重采样,得到配网数据集合Y;Nn为所述配网数据集合Z中,ci为0的数据的数量,Ne为所述配网数据集合Z中,ci为1的数据的数量。
[0046] 其中步骤1000和2000中的数据和参数处理以及子步骤均与本发明第一个方面一致,不再赘述。
[0047] 此外,根据公开的本发明的说明书,本发明的其他实现对于本领域的技术人员是明显的。实施方式和/或实施方式的各个方面可以单独或者以任何组合用于本发明的系统和方法中。说明书和其中的示例应该是仅仅看作示例性,本发明的实际范围和精神由所附权利要求书表示。

当前第1页 第1页 第2页 第3页