首页 / 基于深度学习的电力线路对话模型构建方法

基于深度学习的电力线路对话模型构建方法实质审查 发明

技术领域

[0001] 本发明涉及智能配电技术领域,尤其涉及一种基于深度学习的电力线路对话模型构建方法。

相关背景技术

[0002] 在现行的电力系统工作模式和流程中,对电力线路开展运行维护和问题分析仍是一件复杂且有挑战的工作。当某条电力线路发生问题时,电力运维人员需要查阅大量关于该线路的台账资料和报告,才能掌握线路的基本情况、变更记录和修理记录,从而开展针对性的问题分析,并最终确定最优运维策略。也就是说,在日常工作中,有极大概率因为运维人员对线路情况不熟悉而导致所确定的运维策略效果不佳,造成投资浪费。
[0003] 例如,某台区存在因三相不平衡导致的电压越限问题,且历史上曾多次人工调节三相负荷,而运维人员在不知道线路修试记录的情况下继续对该台区开展人工调节三相负荷工作,最终仍未能解决问题。显然,依靠人工查阅修试记录来开展优化工作并非是可靠的运维手段。另外,依赖人工阅读资料的方式会占用大量的工作时间,势必影响工作效率。

具体实施方式

[0034] 为使本发明的目的、技术方案及优点更加清楚、明确,下面结合附图和具体实施方式对本发明的内容做进一步详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
[0035] 实施例一
[0036] 本实施例提出了一种基于深度学习的电力线路对话模型构建方法,如图1所示,包括以下步骤:
[0037] S1,以基础文本语料和电力文本语料为训练数据构建并训练第一深度学习模型。
[0038] 在步骤S1中,需要构建一个能够识别文本信息的模型。比如,基础文本语料包括含有基本语言结构和含义的文本语料,有助于模型理解基本语言结构和含义,为后续输出合适的语序提供基础。而电力文本语料包括电力书籍、电力论文和互联网电力资讯中的至少一种,有助于模型理解基本电力知识。
[0039] 在一示例中,上述第一深度学习模型的构建和训练过程包括:
[0040] S101,对基础文本语料和电力文本语料进行文本语料预处理,得到第一样本数据;
[0041] S102,将第一样本数据划分为第一训练数据集和第一测试数据集;
[0042] S103,根据预设的网络架构构建深度学习模型,基于第一训练数据集对深度学习模型进行自监督学习;
[0043] S104,基于第一测试数据集对深度学习模型进行验证与调优,得到第一深度学习模型。
[0044] 具体的,上述的深度学习模型的网络架构为循环神经网络、长短期记忆网络、卷积神经网络、Transformer,或者基于注意力机制的Seq2Seq。
[0045] S2,基于特定线路的电力线路分析信息对第一深度学习模型进行自监督学习,得到第二深度学习模型。
[0046] 在步骤S2中,需要构建一个能够识别电力线路分析信息的模型。电力线路分析信息包括电力线路CIM文件和电力线路分析报告。比如,电力线路CIM文件,系指电力线路通用信息模型文件,一般是以XML文件为载体电力线路,CIM文件内至少包含特定线路的设备情况和拓扑关系,用于描述一条电力线路的设备情况和拓扑关系。设备情况包括设备的类型和设备的具体属性,设备类型有10kV母线,架空导线,配电变压器等;设备属性,如架空导线的属性有名称,线型,长度;拓扑关系是指设备间的连接关系,如,导线A与导线B通过来连接节点A相连,导线B与配电变压器A通过连接节点B相连。而上述电力线路分析报告,系指对一条或一个范围内电力线路的现状、问题、故障、工程设计等开展评估分析的文档报告。
[0047] 第二深度学习模型的构建和训练过程包括:
[0048] S201,对电力线路CIM文件进行预处理,得到电力线路CIM文本;
[0049] S202,对电力线路CIM文本和线路分析报告进行文本语料预处理,得到第二样本数据;
[0050] S203,将第二样本数据划分为第二训练数据集和第二测试数据集;
[0051] S204,基于第二训练数据集对第一深度学习模型进行自监督学习;
[0052] S205,基于第二测试数据集对第一深度学习模型进行验证与调优,得到第二深度学习模型。
[0053] 可选的,S202中,对电力线路CIM文件进行预处理包括:人工标注电力线路CIM文件中关于电力设备的描述信息、人工标注相同电力线路两个相邻不同日期CIM文件的电力设备差异,以及人工标注相同电力线路多个不同日期CIM文件的电力设备发展历程中的至少一种。
[0054] 以下以某CIM文件作为示例,解释人工标注电力线路CIM文件中关于电力设备的描述信息:
[0055] 假设某电力线路1月1日CIM文件中对交流导线A的描述:
[0056] ···
[0057]
[0058] 电站分支线(#1‑#3)
[0059] 407
[0060] 1[0061] 4
[0062] LGJ
[0063] 183
[0064] 25[0065] LINESTRING(115.5614187 24.129975,115.561388324.1298868)
[0066] [0067] [0068]
[0069]
[0070] 40748
[0071]
[0072] ···
[0073] 显然,CIM文件在未经解译之前,其实际意义无法被模型所识别。而经过人工标注后,电力设备信息描述为:“一条交流导线,rdf:ID为SEG_407,导线名称为电站分支线(#1‑#2
3),mRID为407,状态为在运,线型为LGJ或LGJ‑25,线径大小为25mm,导线长度为183米,导线电压等级是10kV。”解译后的电力设备信息能够被模型所识别。
[0074] S3,对第二深度学习模型进行微调训练,得到针对特定线路的电力线路对话模型。
[0075] 所述微调训练,具体步骤如下:
[0076] S301,准备特定电力线路的名称、电力线路CIM文件和电力线路分析报告;
[0077] S302,对特定电力线路的电力线路CIM文件和电力线路分析报告进行文本语料预处理,得到特定样本数据;
[0078] S303,基于特定样本数据对第二深度学习模型进行自监督学习;
[0079] S304,基于预设的微调任务,对经自监督学习后的第二深度学习模型进行微调训练;
[0080] S305,人工评估模型性能是否达标,若是,得到特定线路的电力线路对话模型,若否,跳转至步骤S304。
[0081] 上述预设的微调任务,包括但不限于实体识别任务、关系抽取任务、时间序列分析任务、摘要任务、问答任务。
[0082] 其中,上述实体识别任务,用于训练第二深度学习模型从特定电力线路CIM文件和特定电力线路分析报告中识别特定线路的关键实体的能力。如,特定线路存在哪些设备、特定线路上某设备的名称、特定线路的某次故障的类型、特定线路的某次故障的原因等。
[0083] 上述关系抽取任务,用于训练第二深度学习模型判断各实体间关系的能力。如,哪个配电变压器属于特定电力线路、特定电力线路的某一次故障处理对应什么故障等。
[0084] 上述时间序列分析任务用于训练第二深度学习模型对于特定电力线路的历史设备变更、历史故障记录的理解能力。如,特定电力线路的配电变压器数量发展情况,特定电力线路的导线总长度发展情况,特定电力线路的故障历史发生情况等。
[0085] 上述摘要任务用于训练第二深度学习模型对于特定电力线路的总结归纳能力。如,特定电力线路的某日期电力CIM文件的概况、特定电力线路的某次故障维修的概要等。
[0086] 上述问答任务用于训练第二深度学习模型基于特定电路身份的问答能力。如,询问特定电力的基本情况、询问特定电力线路的设备情况、询问特定电力线路的电压问题情况等。
[0087] 对于步骤S302中的文本语料预处理,具体步骤如下:
[0088] S3021,清洗数据:
[0089] 删除或替换文本中的非打印字符、特殊符号和无关信息(如HTML标签)。
[0090] ‑去除噪音数据,如错误的格式化、拼写错误等。
[0091] ‑规范化文本,统一使用小写字母,并去除不必要的空格和标点符号。
[0092] ‑去除停用词,(如常见且对于理解文本意义贡献较小的词汇)。
[0093] S3022,分词;
[0094] ‑将连续的文本字符串分割成单独的单词或符号。
[0095] ‑对于需要保留语序信息的模型,保持分词结果与原始序列顺序一致。
[0096] S3023,构建词汇表;
[0097] ‑从预处理后的语料中创建一个包含所有唯一单词的集合,并给每个单词分配一个唯一索引。
[0098] S3024,向量化;
[0099] ‑将每个单词转换为数字表示形式。常用方法有映射法、Word2Vec和GloVe。
[0100] ‑对于基于循环神经网络、长短期记忆网络、卷积神经网络等架构的深度学习模型,在向量化时需要固定向量长度;
[0101] ‑对于基于Transformer的深度学习模型,无需固定向量长度。
[0102] S3025,上下文编码;
[0103] ‑对于Transformer、基于注意力机制的Seq2Seq等需要位置信息的模型,在向量化过程中添加位置编码以保留单词在原始句子中的相对或绝对位置信息。
[0104] S3026,创建训练样本;
[0105] ‑利用滑动窗口切分长文本为多个可供训练使用的样本。
[0106] ‑在自监督学习任务中生成标签。如,在语言模型任务中,可以使用当前单词来预测下一个单词。
[0107] S3027,序列及批次管理;
[0108] ‑组合多个训练样本形成批次以便并行处理。
[0109] 实施例二
[0110] 本实施例提出了一种电力线路对话模型,如图2所示,包括:
[0111] 模型微调组件,用于调用实施例一述的第二深度学习模型,结合用户输入的电力线路分析信息对第二深度学习模型进行微调训练,输出电力线路对话模型;
[0112] 发布管理器,用于发布电力线路对话模型;
[0113] 对话管理器,用于处理用户与电力线路对话模型之间的交互流程;
[0114] 输入输出界面,用于展示电力线路对话模型输出的查询结果。
[0115] 上述实施例只是为了说明本发明的技术构思及特点,其目的是在于让本领域内的普通技术人员能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡是根据本发明内容的实质所做出的等效的变化或修饰,都应涵盖在本发明的保护范围内。

当前第1页 第1页 第2页 第3页