首页 / 一种基于知识图谱的OPC UA信息模型自动构建方法

一种基于知识图谱的OPC UA信息模型自动构建方法实质审查 发明

技术领域

[0001] 本发明涉及工业设备通讯技术领域,具体涉及一种基于知识图谱的OPC UA信息模型自动构建方法。

相关背景技术

[0002] 工业现场存在着大量不支持OPC UA协议的设备,要基于OPC UA实现这些设备的集成以实现互联互通,首先需要为这些设备构建OPC UA信息模型。OPC UA是一种开放式、跨平
台的通信协议,用于在开放制造环境中实现异构设备的互联互通,而OPC UA信息模型是OPC 
UA架构的基础,其定义了统一的框架及描述形式,提供标准化的信息格式、规范化的信息建
模流程和统一的信息呈现形式。
[0003] 基于OPC UA信息模型的设备状态表征,将有利于实现异构设备之间的信息交互,进而实现信息之间的互联互通。目前,设备的OPC UA信息模型大部分都是通过手工创建,这
需要有经验的工程师花费大量的时间和精力才能完成,难以满足工业4.0中小批量、个性化
制造的需求。
[0004] 知识图谱是一个庞大的语义网络,描述了大量物理世界中的实体和关联关系,其由代表实体的节点和代表关系的边构成。申请人发现,OPC UA信息模型与知识图谱的信息
组织方式十分相似,两者都通过实体、属性和关系来描述信息,因此知识图谱技术可以为
OPC UA信息模型构建问题提供有效的解决方案。然而,设备的信息模型知识图谱无法对工
业现场中出现的所有同类设备(如工业现场中第一次出现的未知接入设备)的所有组件、功
能、属性进行建模,即这些信息模型知识图谱都是不完整的,导致无法完成未知接入设备的
OPC UA信息模型构建。因此,如何有效构建知识图谱并完成未知接入设备的OPC UA信息模
型构建是亟需解决的技术问题。

具体实施方式

[0053] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是
本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施
例的组件能够以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实
施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅表示本发明的选定实施
例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的
所有其他实施例都属于本发明保护的范围。
[0054] 应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。在本发明的描述
中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放
的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置
或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。此外,术语“水平”、“竖直”等术语并不表示要求部件绝对水平或悬垂,而是可以稍微倾斜。例如“水平”仅是指其方向相对“竖直”而言更加水平,并不是表示该结构一定要完全水平,而是可以稍微倾斜。在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体
情况理解上述术语在本发明中的具体含义。
[0055] 下面通过具体实施方式进一步详细的说明:
[0056] 实施例:
[0057] 本实施例中公开了一种基于知识图谱的OPC UA信息模型自动构建方法。
[0058] 如图1所示,基于知识图谱的OPC UA信息模型自动构建方法,包括:
[0059] S1:预先为每种类型的设备构建对应的信息模型知识图谱;
[0060] S2:对于待建模的未知接入设备,确定与其关联的信息模型知识图谱;
[0061] 本实施例中,未知接入设备的未知实体包括组件、功能和属性。
[0062] 需要说明的是,确定未知接入设备关联的信息模型知识图谱之前,需要先获取未知接入设备的设备类型。本实施例采用经过训练的TextCNN模型来实现未知接入设备的设
备类型识别。
[0063] 具体的:
[0064] 1)通过现有成熟手段对TextCNN模型进行训练和测试。训练和测试时,对设备数据帧样本进行词嵌入后为其打上相应的设备类型标签,生成数据集,进而将数据集划分为训
练集和测试集;将训练集输入到TextCNN模型中进行训练:在训练过程中TextCNN模型根据
输入和给定的设备类型标签进行优化,并通过反向传播算法更新模型参数,直到达到预定
的停止条件为止;当TextCNN模型训练完成后,使用测试集数据检验模型性能:将测试集输
入到TextCNN模型中进行设备类型识别,将预测的识别结果和给定的设备类型标签进行比
较并统计设备类型识别结果,最终采用评价指标评估TextCNN模型的性能。
[0065] 2)将未知接入设备的设备数据进行词嵌入操作,得到设备数据词向量;进而将未知接入设备的设备数据词向量输入经过训练的TextCNN模型中,输出对应的设备类型预测
结果作为未知接入设备的设备类型。
[0066] 3)基于未知接入设备的设备类型获取为对应类型设备构建的信息模型知识图谱。
[0067] S3:通过开放世界知识补全模型,将未知接入设备的未知实体补全到其关联的信息模型知识图谱中,生成补全信息模型知识图谱;
[0068] 本实施例中,所述的开放世界知识补全模型是一种旨在通过实体描述找到一组缺失的三元组的模型,其可以处理知识图谱中的实体,每条边用一个三元组(头、rel、尾)表
示,其中两个实体由特定的关系连接,该模型采用向量嵌入学习实体和关系的低维表示,通
过评估缺失三元组的可能性来丰富不完整的图。
[0069] S4:通过补全信息模型知识图谱为未知接入设备构建对应的OPC UA信息模型。
[0070] 具体的,补全后的信息模型知识图谱已经包含了未知设备信息模型的所有元素,因此可以从信息模型中直接提取得到对应的OPC UA信息模型,即从补全信息模型知识图谱
中为未知接入设备提取所需的设备信息模型,进而将提取的设备信息模型转换为OPC UA规
范指定的格式,得到对应的OPC UA信息模型。
[0071] 本发明预先为每种类型的设备构建对应的信息模型知识图谱,其中信息模型知识图谱是基于OPC基金会官方为每类设备提供的参考信息模型构建的,可以保证构建的信息
模型知识图谱涵盖了同类型设备的主要组件和属性,更能够反映设备的真实情况。同时,使
用知识图谱表示OPC UA信息模型有利于后续对未知实体进行开放世界知识补全,从而构建
更加完整的信息模型。此外,不同类型设备的信息模型可能存在较大的差异,因此通过为每
种类型的设备构建对应的信息模型知识图谱来更好地满足这种差异性,从而提高设备OPC 
UA信息模型构建的灵活性。
[0072] 本发明通过开发世界知识补全模型将未知接入设备的未知实体补全到关联的信息模型知识图谱中,生成补全信息模型知识图谱,进而为未知接入设备构建OPC UA信息模
型。其中通过开发世界知识补全模型,可以添加更多与未知接入设备实体相关的知识和信
息来完善知识图谱的内容,提高信息模型知识图谱的完整性和丰富性,有助于更好地理解
设备的属性和特性,为后续的建模任务提供更全面的信息支持,并且通过开发世界知识补
全模型,可以根据需要灵活地添加不同来源的知识和信息,使知识图谱更具灵活性和可扩
展性,有助于适应不同的应用场景和需求变化,提高信息模型知识图谱的适应性和可用性,
从而提高未知接入设备OPC UA信息模型建模的有效性和灵活性。
[0073] 本发明在知识图谱补全过程中使用字符级的词嵌入模型,其中字符级的词向量能捕捉同一组件下实体之间存在缩写词导致的单词结构的相似性,解决了数据帧中实体缺乏
实体描述的问题。同时,字符级嵌入能够捕捉到更丰富的语义信息,将文本中的每个字符或
词语映射到低维空间中的一个向量,有助于更好地理解设备实体的属性和关系,丰富知识
图谱的语义表达。此外,字符级嵌入具有上下文敏感性,能够根据相邻字符或词语的关系动
态调整嵌入向量,使得知识图谱更好地捕捉到实体之间的语义联系和上下文信息,提高知
识补全的准确性。
[0074] 具体实施过程中,获取OPC基金会为不同类型设备提供的参考模型,进而基于设备的参考模型以及设备的文档和相关知识库为对应类型的设备构建信息模型知识图谱。
[0075] 具体的,构建信息模型知识图谱的具体步骤如下:
[0076] 1)收集数据:收集有关设备的参考模型以及文档和相关知识库(例如技术文档、用户手册、在线评论等)。
[0077] 2)数据预处理:对收集到的数据进行清洗、去重、格式转换等预处理,以确保数据的质量和可用性。
[0078] 3)实体识别:在预处理后的数据中,使用自然语言处理技术识别出设备相关的实体,例如设备的组件、功能和属性。
[0079] 4)关系抽取:提取实体之间的关系,例如设备之间的关联关系、设备的功能等。
[0080] 5)知识表示学习:利用深度学习技术对识别出的实体和关系进行知识表示学习,帮助将原始数据转换为知识图谱中的节点和边。
[0081] 6)构建知识图谱:根据识别出的实体、关系和知识表示学习结果,构建信息模型知识图谱,其中知识图谱可以包括设备的属性信息、设备之间的关系以及与其他实体的关联
等。
[0082] 具体实施过程中,每一个特定类型设备的信息模型知识图谱都无法对工业现场中出现的所有同类设备(例如,工业现场中第一次出现的未知接入设备)的所有组件、功能、属
性进行建模,换句话说,这些信息模型知识图谱都是不完整的。因此,要利用信息模型知识
图谱完成未知接入设备进行信息模型自动构建,首先要能够将这些新出现的,未在信息模
型知识图谱中进行建模的组件、功能、属性链接到信息模型知识图谱中,本发明通过在信息
模型知识图谱上执行开放世界知识推理任务来实现这一目标。
[0083] 首先需要确定知识图谱知识表示模型,这个知识表示模型将知识图谱中所有的实体和关系嵌入到一个连续的向量空间中,并通过评分函数对三元组的真实性进行评分:
[0084] score(h,r,t)=φ(uh,ur,ut);
[0085] 其中,ux表示实体/关系的嵌入,φ表示评分函数,其形式取决于具体的知识表示模型。
[0086] 然后基于知识表示模型实现开放世界知识补全。假设一个新出现的尾实体(它表示设备的组件、功能或属性),可以将其添加到语料库,通过词嵌入模型(例如Word2Vec)得
到其词向量vt。值得注意的是,文本嵌入与知识图谱嵌入是基于不同的信息独立训练的,它
们不属于一个向量空间,不能指望它们之间存在关联,因此需要训练一个两个向量空间的
map map
映射函数Ψ ,使得Ψ (vt)≈vt,然后,可以用知识表示模型的评分函数为包含映射后的
未知实体嵌入的三元组进行打分了。
[0087] score(h,r,t)=φ(uh,ur,Ψmap(vt));
[0088] 结合图2所示,开放世界知识补全模型的处理逻辑如下:
[0089] S301:通过知识表示模型对未知接入设备关联的信息模型知识图谱进行嵌入,得到对应的知识图谱向量空间;
[0090] 本实施例中,将ComplEx模型作为信息模型知识图谱的知识表示模型。
[0091] S302:通过字符级词向量模型对未知实体进行词嵌入,生成实体文本词向量;
[0092] S303:通过转换函数将实体文本词向量映射到知识图谱向量空间,生成实体知识图谱词向量;
[0093] S304:通过知识表示模型的评分函数将实体知识图谱词向量补全到未知接入设备关联的信息模型知识图谱中,生成补全信息模型知识图谱。
[0094] 本发明在开放世界知识补全时通过字符级嵌入方法生成实体的词向量,其中字符级的词向量能捕捉同一组件下实体之间存在缩写词导致的单词结构的相似性,解决了数据
帧中实体缺乏实体描述的问题。同时,字符级嵌入能够捕捉到更丰富的语义信息,将文本中
的每个字符或词语映射到低维空间中的一个向量,有助于更好地理解设备实体的属性和关
系,丰富知识图谱的语义表达。此外,字符级嵌入具有上下文敏感性,能够根据相邻字符或
词语的关系动态调整嵌入向量,使得知识图谱更好地捕捉到实体之间的语义联系和上下文
信息,提高知识补全的准确性。
[0095] 相比于基于词组的嵌入方式,本发明基于字符的嵌入方式可以缓解同义异构的问题,因为字符是更加抽象和一般化的概念,同义词可以共享相同的字符,从而在词向量空间
中更加接近。基于字符的嵌入方式也可以处理数据帧中某个属性未在词汇表中出现的情
况,因为基于字符的嵌入方式不需要提前定义固定的词汇表,而是将每个字符看作一个独
立的单位,并结合其他字符形成词组。这就意味着,即使数据帧中出现了新的属性,基于字
符的嵌入方式也可以通过将这些新的属性分解为单个字符,并利用这些字符的向量表示来
进行嵌入。除此之外,基于字符的嵌入方式还可以更好地捕获设备数据帧中的细粒度信息,
如拼写错误、缩写等,避免了基于词组的嵌入方式所造成的歧义或信息丢失。
[0096] 具体实施过程中,常用的知识图谱知识表示模型有TransE、DistMult与ComplEx。然而这些模型不是都适用于信息模型知识图谱的嵌入。信息模型知识图谱对同类型物理设
备的组件、功能和属性进行建模,最终形成一个由节点和边形成的关系树。由于一个组件通
常拥有不止一个功能或者属性,这导致信息模型知识图谱中存在着大量的一对多关系,而
TransE不能处理这种一对多的关系。此外,OPC UA信息模型规范中规定的关系都是有方向
的,换句话说,信息模型知识图谱中所有的实体之间的关系都是非对称的,而DistMult模型
会将知识图谱中所有的关系都视为对称关系,ComplEx模型通过将嵌入扩展到复数空间解
决了这个问题,并且它能够处理复杂的非对称及一对多关系。因此,本发明将ComplEx模型
作为信息模型知识图谱的知识表示模型。
[0097] 知识表示模型的评分函数表示为:
[0098]
[0099] 式中:φ表示评分函数;ux表示实体或关系的嵌入;h、r、t表示信息模型知识图谱的中的头实体、边和尾实体。
[0100] 具体实施过程中,在信息模型知识图谱上执行开放世界知识推理的关键是为新的实体生成嵌入,现有的开放世界知识推理模型大都通过对新实体的描述文本进行归纳学习
得到,然而,设备数据帧中的实体缺乏实体描述,因此本发明提出基于字符的嵌入方法来生
成新实体的词向量。
[0101] 结合图3所示,字符级词向量模型的处理步骤如下:
[0102] S3021:基于未知接入设备关联的信息模型知识图谱中的所有实体构建语料库W={w1,…,wN},其中每个实体表示为wn(1<<n<<N),n表示语料库中实体的数量;实体wn的
字符序列定义为Cn={c1,…,cm},其中m是wn中字符的数量;
[0103] S3022:将语料库W中所有实体的字符序列Cn(1<<n<<N)进行水平拼接,得到语料库字符序列C={c1,…,cM},其中M表示语料库中字符的数量;
[0104] S3023:通过连续词袋模型训练得到语料库字符序列C中每个字符的嵌入,得到语料库字符嵌入序列;
[0105] 其中连续词袋模型的目标是使平均对数概率最大化:
[0106]
[0107]
[0108]
[0109] 式中: 表示根据上下文字符计算的中心字符的平均对数概率;C表示语料库字符序列;ci表示目标字符ci的嵌入;co表示所有上下文字符嵌入的平均值;
[0110] S3024:从语料库字符嵌入序列中选取未知实体w中每个字符的嵌入;
[0111] S3025:基于未知实体w中每个字符的嵌入生成对应的实体文本词向量;
[0112] 公式描述为:
[0113]
[0114] 式中:w表示未知实体w的实体文本词向量;N表示未知实体w中字符的数量,ck表示未知实体w第k‑th字符的嵌入。
[0115] 具体实施例过程中,采用如下三种转换函数中的任意一种将实体文本词向量v映map
射到知识图谱向量空间,生成实体知识图谱词向量Ψ (v);
[0116] 1)线性函数:Ψmap(v)=A·v。
[0117] 2)仿射函数:Ψmap(v)=A·v+b;
[0118] 3)具有ReLU激活功能的四层多层感知器(MLP)Ψmpa:输入v,输出Ψmap(v)。
[0119] 具体实施过程中,选择具有ReLU激活功能的四层多层感知器(MLP)Ψmpa作为转换函数时,转换函数的训练过程包括:首先利用ComplEx模型对用于训练的信息模型知识图谱
中的实体进行嵌入,得到实体嵌入序列u1,u2,…,un;然后通过字符级词向量模型训练得到
信息模型知识图谱中的实体以及未知实体的嵌入v1,v2,…,vn;最后通过最小化如下的损失
函数来学习转换函数:
[0120]
[0121] 式中:L表示损失值;Θ表示 的参数; 表示将字符级词向量模型训练得到的词向量vi转换到信息模型知识图谱实体嵌入ui的转换函数; 表示第k个词向量
和实体嵌入。
[0122] 具体实施过程中,通过信息模型知识图谱为设备构建OPC UA信息模型的具体过程可参考如下步骤:
[0123] 1)需求获取:首先需要从系统框架图和应用场景图中获取建模需要的设备类型、设备的参数即属性、设备具有的方法以及设备之间或设备与属性、设备与方法之间的关系。
然后根据特定领域相关规范来验证建模需要的信息,同时进行必要的补充,最后将这些节
点信息归入八个标准的节点类别。
[0124] 2)定义类型模型:根据节点类别中的四个类型(对象类型模型、变量类型模型、引用类型模型、数据类型模型),分别定义这些类型,然后合并为统一的类型模型。
[0125] 3)实例化:在定义了类型模型之后,根据特定领域的具体实例对四个类型模型进行实例化,同时按照OPC UA服务器的标准地址空间方式建立实例化的OPC UA信息模型。
[0126] 最后需要说明的是,以上实施例仅用以说明本发明的技术方案而非限制技术方案,本领域的普通技术人员应当理解,那些对本发明的技术方案进行修改或者等同替换,而
不脱离本技术方案的宗旨和范围,均应涵盖在本发明的权利要求范围当中。

当前第1页 第1页 第2页 第3页
相关技术
构建方法相关技术
模型自动相关技术
江沛发明人的其他相关专利技术