技术领域
[0001] 本说明书实施例涉及计算机技术领域,特别涉及信息抽取方法。
相关背景技术
[0002] 随着计算机技术的发展,文本处理越来越依赖互联网进行。文本处理是对文本进行分析、理解、提取等处理的过程,已被广泛地应用于人们日常生活的各个领域。以信息抽取为例,信息抽取是指从自然语言文本中抽取指定类型的实体、关系、事件等事实信息,并形成结构化数据输出的文本处理技术。
[0003] 目前,通常可以利用机器阅读理解(MRC,MachineReadingComprehension)的方式进行信息抽取,然而针对复杂且多样的信息抽取任务,需要利用不同的机器学习模型才能实现信息抽取,导致模型训练过程资源消耗量大,且信息抽取过程耗时较长,因此,亟需一种高效且普适性高的信息抽取方案。
具体实施方式
[0075] 在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0076] 在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0077] 应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
[0078] 此外,需要说明的是,本说明书一个或多个实施例所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
[0079] 首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
[0080] 通用信息抽取(UIE,UniversalInformationExtraction):按照特定的抽取框架,从给定的一组自由文本中抽取出符合抽取需求的信息结构(实体、关系、事件等)。对于同一输入文本,不同的抽取框架可以抽取不同的信息结构。
[0081] 孪生神经网络(Siameseneuralnetwork):孪生神经网络也可以称为双生神经网络,是基于两个人工神经网络建立的耦合构架。孪生神经网络以两个样本为输入,输出其嵌入高维度空间的表征,以比较两个样本的相似程度。通常情况下的孪生神经网络由两个结构相同,且权重共享的神经网络拼接而成。
[0082] BERT模型:BERT(BidirectionalEncoderRepresentationfromTransformers)模型是一个预训练的语言表征模型,可作为编码器,对输入文本提取特征。它强调了不再像以往一样采用传统的单向语言模型或者把两个单向语言模型进行浅层拼接的方法进行预训练,而是采用新的掩码语言模型,以致能生成深度的双向语言表征。
[0083] 序列到序列模型:(seq2seq,SequencetoSequence)是一个编码器‑解码器结构的网络,它的输入是一个序列,输出也是一个序列。编码器中将一个可变长度的信号序列变为固定长度的向量表达,解码器将这个固定长度的向量变成可变长度的目标的信号序列。
[0084] 随着计算机技术的发展,文本处理越来越依赖互联网进行。文本处理是对文本进行分析、理解、提取等处理的过程,已被广泛地应用于人们日常生活的各个领域。以信息抽取为例,信息抽取是指从自然语言文本中抽取指定类型的实体、关系、事件等事实信息,并形成结构化数据输出的文本处理技术。
[0085] 目前,通用的信息抽取方案包括以下两种:第一种,基于机器阅读理解(MRC,Machine ReadingComprehension)的方式进行信息抽取。然而基于机器阅读理解的方式核心处理器(CPU,CentralProcessingUnit)推理时间较长。第二种,基于seq2seq进行信息抽取。然而基于seq2seq进行信息抽取,存在信息抽取效率欠佳的问题。因此,亟需一种高效且普适性高的信息抽取方案。
[0086] 为了解决上述问题,本说明书实施例中,基于递归的推理设计,将复杂信息抽取任务转换为若干个简单的根据提示信息和待抽取文本,抽取片段(span)的子任务。具体地,接收信息抽取任务,其中,信息抽取任务包括待抽取文本和初始提示信息;解析信息抽取任务,确定信息抽取任务对应的至少两个信息抽取子任务;根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息;将待抽取文本和当前提示信息输入信息抽取模型,确定当前信息抽取子任务对应的抽取结果;根据各信息抽取子任务对应的抽取结果,确定信息抽取任务的目标抽取结果。通过解析信息抽取任务,将复杂的信息抽取任务转化为至少两个简单的信息抽取子任务,使得本方案可以支持任意信息抽取子任务组合的信息抽取任务,提高了信息抽取的普适性。并且,利用信息抽取模型确定各信息抽取子任务的抽取结果,实现了利用一个信息抽取模型完成多个信息抽取子任务,提高了信息抽取效率。
[0087] 在本说明书中,提供了信息抽取方法,本说明书同时涉及一种会议观点抽取方法,一种信息抽取模型训练方法,一种信息抽取装置,一种会议观点抽取装置,一种信息抽取模型训练装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
[0088] 参见图1,图1示出了本说明书一个实施例提供的一种信息抽取系统的架构图,信息抽取系统可以包括客户端100和服务端200;
[0089] 客户端100,用于向服务端200发送信息抽取任务,其中,信息抽取任务包括待抽取文本和初始提示信息;
[0090] 服务端200,用于解析信息抽取任务,确定信息抽取任务对应的至少两个信息抽取子任务;根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息;将待抽取文本和当前提示信息输入信息抽取模型,确定当前信息抽取子任务对应的抽取结果;根据各信息抽取子任务对应的抽取结果,确定信息抽取任务的目标抽取结果;向客户端100发送信息抽取任务的目标抽取结果;
[0091] 客户端100,还用于接收服务端200发送的信息抽取任务的目标抽取结果。
[0092] 应用本说明书实施例的方案,接收信息抽取任务,其中,信息抽取任务包括待抽取文本和初始提示信息;解析信息抽取任务,确定信息抽取任务对应的至少两个信息抽取子任务;根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息;将待抽取文本和当前提示信息输入信息抽取模型,确定当前信息抽取子任务对应的抽取结果;根据各信息抽取子任务对应的抽取结果,确定信息抽取任务的目标抽取结果。通过解析信息抽取任务,将复杂的信息抽取任务转化为至少两个简单的信息抽取子任务,使得本方案可以支持任意信息抽取子任务组合的信息抽取任务,提高了信息抽取的普适性。并且,利用信息抽取模型确定各信息抽取子任务的抽取结果,实现了利用一个信息抽取模型完成多个信息抽取子任务,提高了信息抽取效率。
[0093] 实际应用中,信息抽取系统可以包括多个客户端100以及服务端200。多个客户端100之间通过服务端200可以建立通信连接,在信息抽取场景中,服务端200即用来在多个客户端100之间提供信息抽取服务,多个客户端100可以分别作为发送端或接收端,通过服务端200实现通信。
[0094] 用户通过客户端100可与服务端200进行交互以接收其它客户端100发送的数据,或将数据发送至其它客户端100等。在信息抽取场景中,可以是用户通过客户端100向服务端200发布数据流,服务端200根据该数据流生成抽取结果,并将抽取结果推送至其他建立通信的客户端中。
[0095] 其中,客户端100与服务端200之间通过网络建立连接。网络为客户端100与服务端200之间提供了通信链路的介质。网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。客户端100所传输的数据可能需要经过编码、转码、压缩等处理之后才发布至服务端200。
[0096] 客户端100可以为浏览器、APP(Application,应用程序)、或网页应用如H5(HyperText MarkupLanguage5,超文本标记语言第5版)应用、或轻应用(也被称为小程序,一种轻量级应用程序)或云应用等,客户端100可以基于服务端200提供的相应服务的软件开发工具包(SDK,SoftwareDevelopmentKit),如基于实时通信(RTC,RealTimeCommunication)SDK开发获得等。客户端100可以部署在电子设备中,需要依赖设备运行或者设备中的某些APP而运行等。电子设备例如可以具有显示屏并支持信息浏览等,如可以是个人移动终端如手机、平板电脑、个人计算机等端侧设备。在电子设备中通常还可以配置各种其它类应用,例如人机对话类应用、模型训练类应用、文本处理类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
[0097] 服务端200可以包括提供各种服务的服务器,例如为多个客户端提供通信服务的服务器,又如为客户端上使用的模型提供支持的用于后台训练的服务器,又如对客户端发送的数据进行处理的服务器等。需要说明的是,服务端200可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。服务器也可以是云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN,ContentDeliveryNetwork)以及大数据和人工智能平台等基础云计算服务的云服务器(云侧设备),或者是带人工智能技术的智能云计算服务器或智能云主机。
[0098] 值得说明的是,本说明书实施例中提供的信息抽取方法一般由服务端执行,但是,在本说明书的其它实施例中,客户端也可以与服务端具有相似的功能,从而执行本说明书实施例所提供的信息抽取方法。在其它实施例中,本说明书实施例所提供的信息抽取方法还可以是由客户端与服务端共同执行。
[0099] 参见图2,图2示出了本说明书一个实施例提供的一种信息抽取方法的流程图,具体包括以下步骤:
[0100] 步骤202:接收信息抽取任务,其中,信息抽取任务包括待抽取文本和初始提示信息。
[0101] 本说明书一个或多个实施例中,可以根据信息抽取任务中的待抽取文本和初始提示信息对信息抽取任务进行处理,从而实现信息抽取。
[0102] 具体地,信息抽取任务是指从待抽取文本中抽取信息的任务。信息抽取任务对应的任务类型有多种,任务类型包括但不限于命名实体识别任务、关系抽取任务、事件抽取任务、属性情感抽取任务。任务抽取任务可以是不同场景的任务,不同场景包括但不限于金融场景、会议场景、电商场景。待抽取文本是信息抽取的对象。初始提示信息是用于指导信息抽取过程的信息,初始提示信息可以理解为纲要(schema),纲要是对事物一般的、抽象的描述,体现对事物的认知水平,决定了机器抽取事件的能力转化。
[0103] 需要说明的是,命名实体识别任务是包括实体类型和实体跨度的二元组任务。关系抽取任务是包括主体跨度、关系类型和客体跨度的三元组任务。事件抽取任务是包括事件类型、触发词跨度、论元类型和论元跨度的四元组任务。属性情感抽取任务是包括主题、情感跨度和情感极性的三元组任务。
[0104] 步骤204:解析信息抽取任务,确定信息抽取任务对应的至少两个信息抽取子任务。
[0105] 本说明书一个或多个实施例中,接收信息抽取任务之后,进一步地,可以解析信息抽取任务,确定信息抽取任务对应的至少两个信息抽取子任务。
[0106] 实际应用中,解析信息抽取任务,确定信息抽取任务对应的至少两个信息抽取子任务的方式有多种,具体根据实际情况进行选择,本说明书实施例对此不作任何限定。
[0107] 本说明书一种可能的实现方式中,可以解析信息抽取任务,确定信息抽取任务的目标信息,从而根据目标信息确定信息抽取任务对应的至少两个信息抽取子任务。
[0108] 示例性地,假设信息抽取任务为抽取待抽取文本中的实体以及情感极性,解析信息抽取任务,确定信息抽取任务的目标信息为“实体”和“情感极性”。则将信息抽取任务分为两个信息抽取子任务,这两个信息抽取子任务分别为“实体抽取任务”和“情感极性识别任务”。
[0109] 本说明书另一种可能的实现方式中,可以根据信息抽取任务的任务类型确定信息抽取任务对应的至少两个信息抽取子任务,也即,上述解析信息抽取任务,确定信息抽取任务对应的至少两个信息抽取子任务,可以包括以下步骤:
[0110] 对信息抽取任务进行类型识别,确定信息抽取任务对应的至少一个任务类型;
[0111] 获取各任务类型对应的信息抽取对象;
[0112] 根据初始提示信息和各任务类型对应的信息抽取对象,确定信息抽取任务对应的至少两个信息抽取子任务。
[0113] 具体地,不同类型的信息抽取任务对应的信息抽取对象不同,例如,命名实体识别任务对应的信息抽取对象为实体类型和实体跨度;关系抽取任务对应的信息抽取对象为主体跨度、关系类型和客体跨度。
[0114] 实际应用中,对信息抽取任务进行类型识别,确定信息抽取任务对应的至少一个任务类型的方式有多种,具体根据实际情况进行选择,本说明书实施例对此不作任何限定。本说明书一种可能的实现方式中,可以利用预先训练的类型识别模型对信息抽取任务进行类型识别,确定信息抽取任务对应的至少一个任务类型。本说明书另一种可能的实现方式中,可以将各任务类型对应的关键词与信息抽取任务进行匹配,将与信息抽取任务匹配的关键词对应的任务类型作为信息抽取任务对应的至少一个任务类型。
[0115] 进一步地,确定信息抽取任务对应的至少一个任务类型之后,进一步地,可以从预设对象库中,获取各任务类型对应的信息抽取对象。
[0116] 需要说明的是,由于初始提示信息中可能包括信息抽取对象的抽取结果,因此,确定信息抽取任务对应的至少两个信息抽取子任务时,可以从信息抽取对象中剔除初始提示信息中的已知抽取结果,进一步根据更新后的信息抽取对象确定信息抽取任务对应的至少两个信息抽取子任务。
[0117] 示例性地,假设信息抽取任务对应的任务类型为关系抽取任务,初始提示信息中包括主体类型和关系类型,获取关系抽取任务对应的信息抽取对象为“主体跨度、关系类型和客体跨度”,根据初始提示信息可知,关系类型是已知信息,则关系抽取任务中的未知信息为“主体跨度和客体跨度”,因此,可以将信息抽取任务划分为两个信息抽取子任务,这两个信息抽取子任务分别为“主体跨度抽取子任务”和“客体跨度抽取子任务”。
[0118] 应用本说明书实施例的方案,对信息抽取任务进行类型识别,确定信息抽取任务对应的至少一个任务类型;获取各任务类型对应的信息抽取对象;根据初始提示信息和各任务类型对应的信息抽取对象,确定信息抽取任务对应的至少两个信息抽取子任务,准确将信息抽取任务转化为至少两个简单的信息抽取子任务,使得本方案可以支持任意信息抽取子任务组合的信息抽取任务,提高了信息抽取的普适性。
[0119] 本说明书一种可选的实施例中,上述解析信息抽取任务之后,还可以包括以下步骤:
[0120] 在信息抽取任务不包括信息抽取子任务的情况下,将待抽取文本和初始提示信息输入信息抽取模型,确定信息抽取任务的目标抽取结果。
[0121] 需要说明的是,信息抽取任务可能不包括信息抽取子任务,此时,初始提示信息就是信息抽取任务对应的提示信息,可以直接将待抽取文本和初始提示信息输入信息抽取模型,确定信息抽取任务的目标抽取结果。
[0122] 示例性地,假设信息抽取任务为抽取待抽取文本中的实体跨度,初始提示信息为待抽取文本中的实体类型,对信息抽取任务进行类型识别,确定信息抽取任务对应的任务类型为“命名实体识别任务”,获取命名实体识别任务对应的信息抽取对象为“实体类型和实体跨度”,可知,信息抽取任务就是抽取实体跨度,不包括信息抽取子任务,此时,可以将待抽取文本和初始提示信息输入信息抽取模型,确定信息抽取任务的目标抽取结果。
[0123] 应用本说明书实施例的方案,在信息抽取任务不包括信息抽取子任务的情况下,将待抽取文本和初始提示信息输入信息抽取模型,确定信息抽取任务的目标抽取结果,使得本方案不仅可以处理包含子任务的信息抽取任务,还可以处理不包含子任务的信息抽取任务,提高了信息抽取的适用范围。
[0124] 步骤206:根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息。
[0125] 本说明书一个或多个实施例中,接收信息抽取任务,解析信息抽取任务,确定信息抽取任务对应的至少两个信息抽取子任务之后,进一步地,可以根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息。
[0126] 具体地,已完成信息抽取子任务是指至少两个信息抽取子任务中已经获得抽取结果的子任务。当前信息抽取子任务是指当前信息抽取过程中,即将要进行信息抽取但还未获得抽取结果的信息抽取子任务。
[0127] 示例性地,假设信息抽取任务包括信息抽取子任务A、信息抽取子任务B和信息抽取子任务C,其中,信息抽取子任务A为已完成信息抽取子任务,信息抽取子任务A的抽取结果为a,初始提示信息为Y。在当前信息抽取子任务为信息抽取子任务B的情况下,根据初始提示信息Y和抽取结果a确定信息抽取子任务B的当前提示信息为Y+a。
[0128] 需要说明的是,在根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息之前,可以判断是否存在已完成信息抽取子任务,根据判断结果确定当前信息抽取子任务对应的当前提示信息。
[0129] 本说明书一种可选的实施例中,上述根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息之前,还可以包括以下步骤:
[0130] 查找各信息抽取子任务对应的抽取结果,获得查找结果;
[0131] 根据查找结果,确定当前是否存在已完成信息抽取子任务。
[0132] 示例性地,假设信息抽取任务包括信息抽取子任务A、信息抽取子任务B和信息抽取子任务C,其中,信息抽取子任务A为已完成信息抽取子任务,信息抽取子任务A的抽取结果为a,初始提示信息为Y。在当前信息抽取子任务为信息抽取子任务B的情况下,根据初始提示信息Y和抽取结果a确定信息抽取子任务B的当前提示信息为Y+a,进一步确定信息抽取子任务B对应的抽取结果为b。在当前信息抽取子任务为信息抽取子任务C的情况下,根据初始提示信息Y、抽取结果a和抽取结果b,确定信息抽取子任务C的当前提示信息为Y+a+b,进一步确定信息抽取子任务C对应的抽取结果为c。
[0133] 应用本说明书实施例的方案,根据查找各信息抽取子任务对应的抽取结果生成的查找结果,确定当前是否存在已完成信息抽取子任务,充分完整的遍历各信息抽取子任务,从而保证已完成信息抽取子任务的准确性,进一步提高了当前提示信息的准确性。
[0134] 实际应用中,判断信息抽取过程中是否存在已完成信息抽取子任务,判断结果包括存在和不存在两种,进一步可以针对不同的判断结果确定当前信息抽取子任务对应的当前提示信息,也即,上述根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息,可以包括以下步骤:
[0135] 在至少两个信息抽取子任务中不存在已完成信息抽取子任务的情况下,将初始提示信息作为当前信息抽取子任务对应的当前提示信息;
[0136] 在至少两个信息抽取子任务中存在已完成信息抽取子任务的情况下,根据初始提示信息和已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息。
[0137] 需要说明的是,若不存在已完成信息抽取子任务,则说明当前信息抽取子任务为第一个开始信息抽取的子任务,此时直接将初始提示信息作为当前信息抽取子任务对应的当前提示信息。若存在已完成信息抽取子任务,则说明当前信息抽取子任务并不是第一个开始信息抽取的子任务,当前信息抽取子任务对应的当前提示信息受已完成信息抽取子任务的抽取结果的影响,因此,根据初始提示信息和已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息。
[0138] 进一步地,根据初始提示信息和已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息时,可以合并初始提示信息和已完成信息抽取子任务的抽取结果,即可获得当前提示信息。
[0139] 应用本说明书实施例的方案,通过根据是否存在已完成信息抽取子任务的判断结果,分情况以递归推理的方式,确定当前信息抽取子任务对应的当前提示信息,保证了当前提示信息的准确性。
[0140] 本说明书一种可选的实施例中,以至少两个信息抽取子任务中不存在已完成信息抽取子任务的情况,对上述确定当前信息抽取子任务对应的当前提示信息的过程进一步说明,也即,至少两个信息抽取子任务包括第一信息抽取子任务;上述根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息,可以包括以下步骤:
[0141] 将初始提示信息作为第一信息抽取子任务对应的第一提示信息;
[0142] 将待抽取文本和当前提示信息输入信息抽取模型,确定当前信息抽取子任务对应的抽取结果,包括:
[0143] 将待抽取文本和第一提示信息输入信息抽取模型,确定第一信息抽取子任务的第一抽取结果。
[0144] 具体地,第一信息抽取子任务是指信息抽取子任务的至少两个信息抽取子任务中第一个处理的信息抽取子任务。在第一信息抽取子任务为当前处理子任务时,至少两个信息抽取子任务中不存在已完成信息抽取子任务。
[0145] 进一步地,可以将初始提示信息直接作为第一信息抽取子任务对应的第一提示信息,并将待抽取文本和第一提示信息输入信息抽取模型,确定第一信息抽取子任务的第一抽取结果。
[0146] 需要说明的是,信息抽取模型对待抽取文本和第一提示信息的处理过程与“将待抽取文本和当前提示信息输入信息抽取模型,确定当前信息抽取子任务对应的抽取结果”相同,本说明书实施例便不再进行赘述。
[0147] 应用本说明书实施例的方案,通过将初始提示信息作为第一信息抽取子任务对应的第一提示信息,并利用信息抽取模型确定第一信息抽取子任务的第一抽取结果,提高了信息抽取效率以及第一抽取结果的准确性。
[0148] 进一步地,以至少两个信息抽取子任务中存在已完成信息抽取子任务的情况,对上述确定当前信息抽取子任务对应的当前提示信息的过程进一步说明,假设当前已完成信息抽取子任务为第一信息抽取子任务,其对应的抽取结果为第一抽取结果,至少两个信息抽取子任务还包括第二信息抽取子任务;上述将待抽取文本和第一提示信息输入信息抽取模型,确定第一信息抽取子任务的第一抽取结果之后,还可以包括以下步骤:
[0149] 将第一抽取结果作为已完成信息抽取子任务的抽取结果,将第二信息抽取子任务作为当前信息抽取子任务,并返回执行根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息的步骤,直至不存在当前信息抽取子任务,获得各信息抽取子任务对应的抽取结果。
[0150] 具体地,第二信息抽取子任务是指至少两个信息抽取子任务中,已完成的第一信息抽取子任务之后的未进行信息抽取的子任务。在第二信息抽取子任务为当前处理子任务时,存在已完成信息抽取子任务。
[0151] 示例性地,假设信息抽取任务包括信息抽取子任务A和信息抽取子任务B,第一信息抽取子任务为信息抽取子任务A,信息抽取子任务A的抽取结果为a,初始提示信息为Y。将抽取结果a作为已完成信息抽取子任务的信息抽取结果,并将信息抽取子任务B作为当前信息抽取子任务,根据初始提示信息Y和抽取结果a确定信息抽取子任务B的当前提示信息为Y+a,将待抽取文本和当前提示信息Y+a输入信息抽取模型,确定信息抽取子任务B对应的抽取结果为b。此时,信息抽取子任务A和信息抽取子任务均已完成信息抽取,获得信息抽取子任务A对应的抽取结果a,信息抽取子任务B定的抽取结果b。
[0152] 应用本说明书实施例的方案,由于信息抽取过程中,已完成信息抽取任务是不断更新的,因此,根据初始提示信息和已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息时,实现了递归的推理,从而实现将复杂的信息抽取任务转化为至少两个简单的信息抽取子任务,使得本方案可以支持任意信息抽取子任务组合的信息抽取任务,提高了信息抽取的普适性。
[0153] 步骤208:将待抽取文本和当前提示信息输入信息抽取模型,确定当前信息抽取子任务对应的抽取结果。
[0154] 本说明书一个或多个实施例中,接收信息抽取任务,解析信息抽取任务,确定信息抽取任务对应的至少两个信息抽取子任务,根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息之后,进一步地,可以将待抽取文本和当前提示信息输入信息抽取模型,确定当前信息抽取子任务对应的抽取结果。
[0155] 具体地,抽取结果为待抽取文本中,信息抽取子任务对应的文本片段。信息抽取模型基于多个样本文本、各样本文本携带的信息抽取标签和样本提示信息训练得到,样本提示信息为对样本文本对应的样本抽取任务分析得到。信息抽取模型是机器学习模型,机器学习模型可以理解为经过训练的程序,可以在新数据中发现模式并进行预测。这些模型表示为一个数学函数,它以输入数据的形式接受请求,对输入数据进行预测,然后提供输出作为响应。
[0156] 例如,待抽取文本为“张三是个好人”信息抽取子任务为抽取待抽取文本中的实体片段,当前提示信息为“人物”,则将待抽取文本和当前提示信息输入信息抽取模型,获得抽取结果为“张三”。
[0157] 本说明书一种可选的实施例中,信息抽取模型包括特征提取层、注意力层和输出层,特征提取层包括耦合的第一特征提取层和第二特征提取层;上述将待抽取文本和当前提示信息输入信息抽取模型,确定当前信息抽取子任务对应的抽取结果,可以包括以下步骤:
[0158] 将待抽取文本输入第一特征提取层,获得待抽取文本的文本特征;
[0159] 将当前提示信息输入第二特征提取层,获得当前提示信息的提示特征;
[0160] 将文本特征和提示特征输入注意力层,获得注意力特征;
[0161] 将注意力特征输入输出层,获得当前信息抽取子任务对应的抽取结果。
[0162] 具体地,特征提取层用于生成输入信息的嵌入高维度空间表征,也即文本特征和提示特征。文本特征也可以称为文本向量,提示特征也可以称为提示向量。特征提取层中耦合的第一特征提取层和第二特征提取层中,可以设置结构相同且权重共享的孪生神经(siamese)网络,从而保证文本特征和提示特征维度的一致性。特征提取层包括但不限于循环神经网络(RNN,RecurrentNeuralNetworks)、卷积神经网络(CNN,ConvolutionalNeuralNetwork)等等,具体根据实际情况进行选择,本说明书实施例对此不作任何限定。
[0163] 在获得待抽取文本的文本特征和当前提示信息的提示特征之后,可以将文本特征和提示特征输入注意力层,这里的注意力层为交叉注意力层(crossattentionlayers),交叉注意力层将两个相同维度的嵌入序列(文本特征和提示特征)不对称地组合在一起,其中一个序列用作查询(Query)输入,而另一个序列用作键(Key)和值(Value)输入,从而获得注意力特征。进一步地,可以将注意力特征输入输出层,获得当前信息抽取子任务对应的抽取结果。
[0164] 应用本说明书实施例的方案,将待抽取文本输入第一特征提取层,获得待抽取文本的文本特征;将当前提示信息输入第二特征提取层,获得当前提示信息的提示特征;将文本特征和提示特征输入注意力层,获得注意力特征;将注意力特征输入输出层,获得当前信息抽取子任务对应的抽取结果,保证了抽取结果的准确性。
[0165] 本说明书一种可选的实施例中,由于特征提取层包括耦合第一特征提取层和第二特征提取层,第一特征提取层用于提取待抽取文本的文本特征,第二特征提取层用于提取当前提示信息的提示特征。在至少两个信息抽取子任务处理过程中,待抽取文本是不变的,因此,只需利用第一特征提取层对待抽取文本进行一次特征提取,并将文本特征缓存起来重复利用,即可对信息抽取过程进行加速,也即,上述将待抽取文本输入第一特征提取层,获得待抽取文本的文本特征,可以包括以下步骤:
[0166] 在信息抽取模型中未缓存有待抽取文本的文本特征的情况下,将待抽取文本输入第一特征提取层,获得待抽取文本的文本特征,并将文本特征缓存至信息抽取模型中;
[0167] 在信息抽取模型中缓存有待抽取文本的文本特征的情况下,获取预先缓存的文本特征。
[0168] 需要说明的是,将待抽取文本输入第一特征提取层,获得待抽取文本的文本特征时,可以判断信息抽取模型中是否缓存有待抽取文本的文本特征。若未缓存有待抽取文本的文本特征,说明第一特征提取层是第一次处理待抽取文本,将待抽取文本输入第一特征提取层,获得待抽取文本的文本特征。在获得待抽取文本的文本特征之后,可以将文本特征缓存至信息抽取模型中,在后续处理时直接从缓存中获取待处理文本的文本特征。若缓存有文本特征,则可以直接从缓存中获取待抽取文本的文本特征,无需通过第一特征提取层对待处理文本进行特征提取,对信息抽取过程进行加速。
[0169] 应用本说明书实施例的方案,将信息抽取模型的特征提取层设置为孪生神经网络的方式,缓存待处理文本的文本特征,避免信息抽取模型重复提取,从而提高信息抽取效率。
[0170] 本说明书一种可选的实施例中,输出层可以是指针网络(PointerNetwork),指针网络用于产生一系列指向输入序列元素的指针,从而标识需要抽取片段的起始结束位置,上述将注意力特征输入输出层,获得当前信息抽取子任务对应的抽取结果,可以包括以下步骤:
[0171] 将注意力特征输入输出层,确定开始指针序列和结束指针序列;
[0172] 根据开始指针序列和结束指针序列,从待抽取文本中抽取并输出当前信息抽取子任务对应的抽取结果。
[0173] 具体地,开始指针序列和结束指针序列可以是“01”序列,“01”序列中的“1”表示抽取结果,根据开始指针序列中的“1”和结束指针序列中的“1”,可以确定抽取结果在待抽取文本中的位置信息,进一步根据位置信息和待抽取文本可以获得当前信息抽取子任务对应的抽取结果。
[0174] 示例性地,假设待抽取文本为“张三是好人”,开始指针序列为[10000],结束指针序列为[01000],开始指针序列中的“1”表示抽取结果的开始位置,结束指针序列中的“1”表示抽取结果的结束位置,因此,可以根据开始指针序列和结束指针序列,从待抽取文本中抽取并输出当前信息抽取子任务对应的抽取结果为“张三”。
[0175] 应用本说明书实施例的方案,将注意力特征输入输出层,确定开始指针序列和结束指针序列;根据开始指针序列和结束指针序列,从待抽取文本中抽取并输出当前信息抽取子任务对应的抽取结果,提高了抽取结果的准确性。
[0176] 步骤210:根据各信息抽取子任务对应的抽取结果,确定信息抽取任务的目标抽取结果。
[0177] 本说明书一个或多个实施例中,接收信息抽取任务,解析信息抽取任务,确定信息抽取任务对应的至少两个信息抽取子任务,根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息,将待抽取文本和当前提示信息输入信息抽取模型,确定当前信息抽取子任务对应的抽取结果之后,进一步地,可以根据各信息抽取子任务对应的抽取结果,确定信息抽取任务的目标抽取结果。
[0178] 需要说明的是,获得各信息抽取子任务对应的抽取结果之后,可以整合各信息抽取子任务对应的抽取结果,将整合的各抽取结果作为目标抽取结果。
[0179] 应用本说明书实施例的方案,通过解析信息抽取任务,将复杂的信息抽取任务转化为至少两个简单的信息抽取子任务,使得本方案可以支持任意信息抽取子任务组合的信息抽取任务,提高了信息抽取的普适性。并且,利用信息抽取模型确定各信息抽取子任务的抽取结果,实现了利用一个信息抽取模型完成多个信息抽取子任务,提高了信息抽取效率。
[0180] 本说明书一种可选的实施例中,上述信息抽取模型的训练方式,可以包括以下步骤:
[0181] 获取样本集,其中,样本集包括多个样本文本,样本文本携带信息抽取标签和样本提示信息;
[0182] 从多个样本文本中提取第一样本文本,其中,第一样本文本为多个样本文本中的任一个;
[0183] 将第一样本文本和第一样本携带的第一样本提示信息输入初始信息抽取模型,获得第一样本文本对应的第一预测抽取结果;
[0184] 对比第一预测抽取结果和第一样本文本携带的第一信息抽取标签,计算损失值;
[0185] 根据损失值调整初始信息抽取模型的模型参数,并返回执行从多个样本文本中提取第一样本文本的步骤,直至达到预设停止条件,获得信息抽取模型。
[0186] 具体地,信息抽取模型的训练方式为有监督训练,也即样本集中的各样本文本是携带真实信息抽取标签的,信息抽取标签为信息抽取模型的抽取目标,用于指导信息抽取模型的训练过程。获取样本集的方式可以是从其他数据获取设备或者数据库中读取大量携带信息抽取标签和样本提示信息的样本文本组成样本集。还可以是接收用户输入的大量携带信息抽取标签和样本提示信息的样本文本组成样本集。获取文本训练集的方式具体根据实际情况进行选择,本说明书实施例对此不作任何限定。
[0187] 值得说明的是,“将第一样本文本和第一样本携带的第一样本提示信息输入初始信息抽取模型,获得第一样本文本对应的第一预测抽取结果”的实现方式与上述“将待抽取文本和当前提示信息输入信息抽取模型,确定当前信息抽取子任务对应的抽取结果”的实现方式相同,本说明书实施例便不再进行赘述。
[0188] 本说明书一种可能的实现方式中,预设停止条件包括损失值小于或等于预设阈值。根据第一预测抽取结果和第一样本文本携带的第一信息抽取标签,计算损失值之后,将损失值与预设阈值进行比较。
[0189] 具体地,若损失值大于预设阈值,则说明第一预测抽取结果和第一样本文本携带的第一信息抽取标签之间的差异较大,初始信息抽取模型对于第一样本文本的预测能力较差,此时可以调整初始信息抽取模型的模型参数,并返回执行从多个样本文本中提取第一样本文本的步骤,继续对初始信息抽取模型进行训练,直至损失值小于或等于预设阈值,说明第一预测抽取结果和第一样本文本携带的第一信息抽取标签的差异较小,达到预设停止条件,获得完成训练的信息抽取模型。
[0190] 本说明书另一种可能的实现方式中,除了比较损失值和预设阈值的大小关系之外,还可以结合迭代次数,确定当前的初始信息抽取模型是否训练完成。
[0191] 具体地,若损失值大于预设阈值,则调整初始信息抽取模型的模型参数,并返回执行从多个样本文本中提取第一样本文本的步骤,继续对初始信息抽取模型进行训练,直至达到预设迭代次数的情况下,停止迭代,得到完成训练的信息抽取模型,其中,预设阈值和预设迭代次数具体根据实际情况进行选择,本说明书实施例对此不作任何限定。
[0192] 实际应用中,计算损失值的函数有很多,如圆环损失(Circleloss),具体根据实际情况进行选择,本说明书实施例对此不作任何限定。其中,圆环损失的计算对象为模型输出的第一预测抽取结果和第一样本文本携带的第一信息抽取标签。
[0193] 应用本说明书实施例的方案,根据第一预测抽取结果和第一样本文本携带的第一信息抽取标签,计算获得损失值,将损失值与预设停止条件进行比较,在不满足预设停止条件的情况下继续训练初始信息抽取模型,直至达到预设停止条件,完成训练获得信息抽取模型。通过不断对初始信息抽取模型的模型参数进行调整,能使最终得到的信息抽取模型更加精准。
[0194] 参见图3,图3示出了本说明书一个实施例提供的一种会议观点抽取方法的流程图,具体包括以下步骤:
[0195] 步骤302:接收观点抽取任务,其中,观点抽取任务包括待抽取会议文本和初始提示信息。
[0196] 步骤304:解析观点抽取任务,确定观点抽取任务对应的至少两个观点抽取子任务。
[0197] 步骤306:根据初始提示信息和已完成观点抽取子任务的抽取结果,确定当前观点抽取子任务对应的当前提示信息。
[0198] 步骤308:将待抽取观点文本和当前提示信息输入信息抽取模型,确定当前观点抽取子任务对应的抽取结果。
[0199] 步骤310:根据各观点抽取子任务对应的抽取结果,确定观点抽取任务的目标抽取结果。
[0200] 需要说明的是,步骤302‑步骤310的实现方式,与上述步骤202‑步骤210的实现方式相同,本说明书实施例便不再进行赘述。
[0201] 示例性地,假设观点抽取任务为抽取待抽取会议文本“张三在此次工作中表现良好,特此鼓励”中的人物以及情感极性信息,利用上述会议观点抽取方法可以确定目标抽取结果为“张三,良好”。
[0202] 应用本说明书实施例的方案,通过解析观点抽取任务,将复杂的观点抽取任务转化为至少两个简单的观点抽取子任务,使得本方案可以支持任意观点抽取子任务组合的观点抽取任务,提高了观点抽取的普适性。并且,利用信息抽取模型确定各观点抽取子任务的抽取结果,实现了利用一个信息抽取模型完成多个观点抽取子任务,提高了会议观点抽取效率。
[0203] 参见图4,图4示出了本说明书一个实施例提供的一种信息抽取模型训练方法的流程图,信息抽取模型训练方法应用于云侧设备,具体包括以下步骤:
[0204] 步骤402:获取样本集,其中,样本集包括多个样本文本,样本文本携带信息抽取标签和样本提示信息。
[0205] 步骤404:从多个样本文本中提取第一样本文本,其中,第一样本文本为多个样本文本中的任一个。
[0206] 步骤406:将第一样本文本和第一样本携带的第一样本提示信息输入初始信息抽取模型,获得第一样本文本对应的第一预测抽取结果。
[0207] 步骤408:对比第一预测抽取结果和第一样本文本携带的第一信息抽取标签,计算损失值。
[0208] 步骤410:根据损失值调整初始信息抽取模型的模型参数,并返回执行从多个样本文本中提取第一样本文本的步骤,直至达到预设停止条件,获得信息抽取模型的模型参数。
[0209] 步骤412:向端侧设备发送信息抽取模型的模型参数。
[0210] 需要说明的是,步骤402‑步骤410与上述步骤202‑步骤210的实现方式相同,本说明书实施例便不再进行赘述。
[0211] 实际应用中,云侧设备向端侧设备发送信息抽取模型的模型参数之后,端侧设备可以根据信息抽取模型的模型参数在本地构建信息抽取模型,进一步利用信息抽取模型进行信息抽取。
[0212] 应用本说明书实施例的方案,根据第一预测抽取结果和第一样本文本携带的第一信息抽取标签,计算获得损失值,将损失值与预设停止条件进行比较,在不满足预设停止条件的情况下继续训练初始信息抽取模型,直至达到预设停止条件,完成训练获得信息抽取模型。通过不断对初始信息抽取模型的模型参数进行调整,能使最终得到的信息抽取模型更加精准。
[0213] 参见图5,图5示出了本说明书一个实施例提供的另一种信息抽取方法的流程图。
[0214] 步骤502:接收信息抽取任务,其中,信息抽取任务包括待抽取文本和初始提示信息。
[0215] 步骤504:解析信息抽取任务,确定信息抽取任务对应的至少两个信息抽取子任务。
[0216] 步骤506:根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息。
[0217] 步骤508:在信息抽取模型中未缓存有待抽取文本的文本特征的情况下,将待抽取文本输入第一特征提取层,获得待抽取文本的文本特征,并将文本特征缓存至信息抽取模型中。
[0218] 步骤510:在信息抽取模型中缓存有待抽取文本的文本特征的情况下,获取预先缓存的文本特征。
[0219] 步骤512:将当前提示信息输入第二特征提取层,获得当前提示信息的提示特征。
[0220] 步骤514:将文本特征和提示特征输入注意力层,获得注意力特征。
[0221] 步骤516:将注意力特征输入输出层,确定开始指针序列和结束指针序列。
[0222] 步骤518:根据开始指针序列和结束指针序列,从待抽取文本中抽取并输出当前信息抽取子任务对应的抽取结果。
[0223] 步骤520:根据各信息抽取子任务对应的抽取结果,确定信息抽取任务的目标抽取结果。
[0224] 需要说明的是,步骤502‑步骤520的具体实现方式与上述图2所提供的信息抽取方法的实现方式相同,本说明书实施例便不再进行赘述。
[0225] 应用本说明书实施例的方案,通过解析信息抽取任务,将复杂的信息抽取任务转化为至少两个简单的信息抽取子任务,使得本方案可以支持任意信息抽取子任务组合的信息抽取任务,提高了信息抽取的普适性。并且,将信息抽取模型的特征提取层设置为孪生神经网络的方式,缓存待处理文本的文本特征,避免信息抽取模型重复提取,从而提高信息抽取效率。
[0226] 参见图6,图6示出了本说明书一个实施例提供的一种信息抽取方法的处理过程流程图,具体包括以下步骤:
[0227] 步骤602:接收用户发送的信息抽取请求,其中,信息抽取请求包括信息抽取任务,信息抽取任务包括待抽取文本和初始提示信息。
[0228] 步骤604:解析信息抽取任务,确定信息抽取任务对应的至少两个信息抽取子任务。
[0229] 步骤606:根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息。
[0230] 步骤608:将待抽取文本和当前提示信息输入信息抽取模型,确定当前信息抽取子任务对应的抽取结果。
[0231] 步骤610:根据各信息抽取子任务对应的抽取结果,确定信息抽取任务的目标抽取结果。
[0232] 步骤612:向用户发送信息抽取任务的目标抽取结果。
[0233] 需要说明的是,步骤602‑步骤610与上述步骤202‑步骤210的实现方式相同,本说明书实施例便不再进行赘述。
[0234] 应用本说明书实施例的方案,通过解析信息抽取任务,将复杂的信息抽取任务转化为至少两个简单的信息抽取子任务,使得本方案可以支持任意信息抽取子任务组合的信息抽取任务,提高了信息抽取的普适性。并且,利用信息抽取模型确定各信息抽取子任务的抽取结果,实现了利用一个信息抽取模型完成多个信息抽取子任务,提高了信息抽取效率。向用户发送信息抽取任务的目标抽取结果,提高了用户体验度。
[0235] 参见图7,图7示出了本说明书一个实施例提供的另一种信息抽取方法的处理过程流程图。如图7所示,信息抽取模型的模型参数用预训练模型(如BERT模型)进行初始化,信息抽取模型的前N‑n层为孪生神经网络,也即信息抽取模型的特征提取层,特征提取层中包括耦合的第一特征提取层和第二特征提取层,第一特征提取层用于从待抽取文本中提取文本特征,第二特征提取层用于从提示信息中提取提示特征。信息抽取模型的后n层用作单流(uniflow)的跨文本交叉注意力层,输出层中包括指针网络,可以将注意力层输出的注意力特征输入输出层,在输出层中,确定开始指针序列和结束指针序列,根据开始指针序列和结束指针序列,从待抽取文本中抽取并输出当前信息抽取子任务对应的抽取结果。
[0236] 需要说明的是,对于一个待抽取文本,待抽取文本的前N‑n层输出隐向量(hiddenstates)始终不变,推理时可以缓存起来重复利用,从而实现信息抽取加速,相较于传统方案,信息抽取效率可以提升30%,在低资源场景中信息抽取效果可以提升7%。
[0237] 实际应用中,可以将复杂的信息抽取任务转化为若干个根据提示信息(Prompt)抽取对应的抽取结果的子任务,递归执行。
[0238] 示例性地,针对命名实体识别任务:由于命名实体识别任务包括实体类型和实体跨度,因此,可以将待处理文本和实体类型输入信息抽取模型中,获得实体片段。
[0239] 针对关系抽取任务:由于关系抽取任务包括主体跨度、关系类型和客体跨度,因此,可以将关系抽取任务拆分为两个枚举输入的信息抽取子任务(SpanExtraction):信息抽取子任务1:将待处理文本和主体类型输入信息抽取模型,获得主体片段;信息抽取子任务2:将待处理文本、关系类型和主体片段输入信息抽取模型,获得客体片段。
[0240] 针对事件抽取任务:由于事件抽取任务包括事件类型、论元角色和论元片段,因此,可以将事件抽取任务拆分为两个信息抽取子任务:信息抽取子任务1:将待处理文本和事件类型输入信息抽取模型,获得触发词片段;信息抽取子任务2:将待处理文本、事件类型和触发词片段输入信息抽取模型,获得论元片段。
[0241] 应用本说明书实施例的方案,通过递归的推力设计,将复杂信息抽取任务转化为若干个简单的根据提示信息和文本抽取片段的子任务,从而实现支持任意多元组集合的抽取。并且,在信息抽取模型中,利用孪生神经网络缓存文本隐向量的方式,避免重复计算,提高信息抽取效率,从而实现通用信息抽取。
[0242] 参见图8,图8示出了本说明书一个实施例提供的一种信息抽取界面的界面示意图。信息抽取界面分为信息抽取任务输入界面和信息抽取结果展示界面。信息抽取任务输入界面中包括信息抽取任务输入框、“确定”控件以及“取消”控件。信息抽取结果展示界面中包括信息抽取结果展示框。
[0243] 用户通过客户端显示的信息抽取任务输入框输入信息抽取任务,其中,信息抽取任务包括待抽取文本和初始提示信息。用户点选“确定”控件,服务端接收客户端发送的信息抽取任务,解析信息抽取任务,确定信息抽取任务对应的至少两个信息抽取子任务;根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息;将待抽取文本和当前提示信息输入信息抽取模型,确定当前信息抽取子任务对应的抽取结果;根据各信息抽取子任务对应的抽取结果,确定信息抽取任务的目标抽取结果。并将目标抽取结果发送至客户端。客户端在信息抽取结果展示框中显示目标抽取结果。
[0244] 实际应用中,用户对控件进行操作的方式包括点击、双击、触控、鼠标悬停、滑动、长按、语音控制或摇一摇等任一方式,具体根据实际情况进行选择,本说明书实施例对此不作任何限定。
[0245] 与上述方法实施例相对应,本说明书还提供了信息抽取装置实施例,图9示出了本说明书一个实施例提供的一种信息抽取装置的结构示意图。如图9所示,该装置包括:
[0246] 第一接收模块902,被配置为接收信息抽取任务,其中,信息抽取任务包括待抽取文本和初始提示信息;
[0247] 第一解析模块904,被配置为解析信息抽取任务,确定信息抽取任务对应的至少两个信息抽取子任务;
[0248] 第一确定模块906,被配置为根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息;
[0249] 第一输入模块908,被配置为将待抽取文本和当前提示信息输入信息抽取模型,确定当前信息抽取子任务对应的抽取结果;
[0250] 第二确定模块910,被配置为根据各信息抽取子任务对应的抽取结果,确定信息抽取任务的目标抽取结果。
[0251] 可选地,信息抽取模型包括特征提取层、注意力层和输出层,特征提取层包括耦合的第一特征提取层和第二特征提取层;第一输入模块908,进一步被配置为将待抽取文本输入第一特征提取层,获得待抽取文本的文本特征;将当前提示信息输入第二特征提取层,获得当前提示信息的提示特征;将文本特征和提示特征输入注意力层,获得注意力特征;将注意力特征输入输出层,获得当前信息抽取子任务对应的抽取结果。
[0252] 可选地,第一输入模块908,进一步被配置为在信息抽取模型中未缓存有待抽取文本的文本特征的情况下,将待抽取文本输入第一特征提取层,获得待抽取文本的文本特征,并将文本特征缓存至信息抽取模型中;在信息抽取模型中缓存有待抽取文本的文本特征的情况下,获取预先缓存的文本特征。
[0253] 可选地,第一输入模块908,进一步被配置为将注意力特征输入输出层,确定开始指针序列和结束指针序列;根据开始指针序列和结束指针序列,从待抽取文本中抽取并输出当前信息抽取子任务对应的抽取结果。
[0254] 可选地,该装置还包括:第四确定模块,被配置为在信息抽取任务不包括信息抽取子任务的情况下,将待抽取文本和初始提示信息输入信息抽取模型,确定信息抽取任务的目标抽取结果。
[0255] 可选地,第一解析模块904,进一步被配置为对信息抽取任务进行类型识别,确定信息抽取任务对应的至少一个任务类型;获取各任务类型对应的信息抽取对象;根据初始提示信息和各任务类型对应的信息抽取对象,确定信息抽取任务对应的至少两个信息抽取子任务。
[0256] 可选地,该装置还包括:查找模块,被配置为查找各信息抽取子任务对应的抽取结果,获得查找结果;根据查找结果,确定当前是否存在已完成信息抽取子任务。
[0257] 可选地,第一确定模块906,进一步被配置为在至少两个信息抽取子任务中不存在已完成信息抽取子任务的情况下,将初始提示信息作为当前信息抽取子任务对应的当前提示信息;在至少两个信息抽取子任务中存在已完成信息抽取子任务的情况下,根据初始提示信息和已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息。
[0258] 可选地,至少两个信息抽取子任务包括第一信息抽取子任务;第一确定模块906,进一步被配置为将初始提示信息作为第一信息抽取子任务对应的第一提示信息;第一输入模块908,进一步被配置为将待抽取文本和第一提示信息输入信息抽取模型,确定第一信息抽取子任务的第一抽取结果。
[0259] 可选地,至少两个信息抽取子任务还包括第二信息抽取子任务;该装置还包括:获得模块,被配置为将第一抽取结果作为已完成信息抽取子任务的抽取结果,将第二信息抽取子任务作为当前信息抽取子任务,并返回执行根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息的步骤,直至不存在当前信息抽取子任务,获得各信息抽取子任务对应的抽取结果。
[0260] 可选地,该装置还包括:信息抽取模型训练模块,被配置为获取样本集,其中,样本集包括多个样本文本,样本文本携带信息抽取标签和样本提示信息;从多个样本文本中提取第一样本文本,其中,第一样本文本为多个样本文本中的任一个;将第一样本文本和第一样本携带的第一样本提示信息输入初始信息抽取模型,获得第一样本文本对应的第一预测抽取结果;对比第一预测抽取结果和第一样本文本携带的第一信息抽取标签,计算损失值;根据损失值调整初始信息抽取模型的模型参数,并返回执行从多个样本文本中提取第一样本文本的步骤,直至达到预设停止条件,获得信息抽取模型。
[0261] 应用本说明书实施例的方案,通过解析信息抽取任务,将复杂的信息抽取任务转化为至少两个简单的信息抽取子任务,使得本方案可以支持任意信息抽取子任务组合的信息抽取任务,提高了信息抽取的普适性。并且,利用信息抽取模型确定各信息抽取子任务的抽取结果,实现了利用一个信息抽取模型完成多个信息抽取子任务,提高了信息抽取效率。
[0262] 上述为本实施例的一种信息抽取装置的示意性方案。需要说明的是,该信息抽取装置的技术方案与上述的信息抽取方法的技术方案属于同一构思,信息抽取装置的技术方案未详细描述的细节内容,均可以参见上述信息抽取方法的技术方案的描述。
[0263] 与上述方法实施例相对应,本说明书还提供了会议观点抽取装置实施例,图10示出了本说明书一个实施例提供的一种会议观点抽取装置的结构示意图。如图10所示,该装置包括:
[0264] 第二接收模块1002,被配置为接收观点抽取任务,其中,观点抽取任务包括待抽取会议文本和初始提示信息;
[0265] 第二解析模块1004,被配置为解析观点抽取任务,确定观点抽取任务对应的至少两个观点抽取子任务;
[0266] 第二确定模块1006,被配置为根据初始提示信息和已完成观点抽取子任务的抽取结果,确定当前观点抽取子任务对应的当前提示信息;
[0267] 第二输入模块1008,被配置为将待抽取观点文本和当前提示信息输入信息抽取模型,确定当前观点抽取子任务对应的抽取结果;
[0268] 第三确定模块1010,被配置为根据各观点抽取子任务对应的抽取结果,确定观点抽取任务的目标抽取结果。
[0269] 应用本说明书实施例的方案,通过解析观点抽取任务,将复杂的观点抽取任务转化为至少两个简单的观点抽取子任务,使得本方案可以支持任意观点抽取子任务组合的观点抽取任务,提高了观点抽取的普适性。并且,利用信息抽取模型确定各观点抽取子任务的抽取结果,实现了利用一个信息抽取模型完成多个观点抽取子任务,提高了会议观点抽取效率。
[0270] 上述为本实施例的一种会议观点抽取装置的示意性方案。需要说明的是,该会议观点抽取装置的技术方案与上述的会议观点抽取方法的技术方案属于同一构思,会议观点抽取装置的技术方案未详细描述的细节内容,均可以参见上述会议观点抽取方法的技术方案的描述。
[0271] 与上述方法实施例相对应,本说明书还提供了信息抽取模型训练装置实施例,图11示出了本说明书一个实施例提供的一种信息抽取模型训练装置的结构示意图。如图11所示,该装置应用于云侧设备,包括:
[0272] 获取模块1102,被配置为获取样本集,其中,样本集包括多个样本文本,样本文本携带信息抽取标签和样本提示信息;
[0273] 提取模块1104,被配置为从多个样本文本中提取第一样本文本,其中,第一样本文本为多个样本文本中的任一个;
[0274] 第三输入模块1106,被配置为将第一样本文本和第一样本携带的第一样本提示信息输入初始信息抽取模型,获得第一样本文本对应的第一预测抽取结果;
[0275] 计算模块1108,被配置为对比第一预测抽取结果和第一样本文本携带的第一信息抽取标签,计算损失值;
[0276] 调整模块1110,被配置为根据损失值调整初始信息抽取模型的模型参数,并返回执行从多个样本文本中提取第一样本文本的步骤,直至达到预设停止条件,获得信息抽取模型的模型参数;
[0277] 第一发送模块1112,被配置为向端侧设备发送信息抽取模型的模型参数。
[0278] 应用本说明书实施例的方案,根据第一预测抽取结果和第一样本文本携带的第一信息抽取标签,计算获得损失值,将损失值与预设停止条件进行比较,在不满足预设停止条件的情况下继续训练初始信息抽取模型,直至达到预设停止条件,完成训练获得信息抽取模型。通过不断对初始信息抽取模型的模型参数进行调整,能使最终得到的信息抽取模型更加精准。
[0279] 上述为本实施例的一种信息抽取模型训练装置的示意性方案。需要说明的是,该信息抽取模型训练装置的技术方案与上述的信息抽取模型训练方法的技术方案属于同一构思,信息抽取模型训练装置的技术方案未详细描述的细节内容,均可以参见上述信息抽取模型训练方法的技术方案的描述。
[0280] 与上述方法实施例相对应,本说明书还提供了信息抽取装置实施例,图12示出了本说明书一个实施例提供的另一种信息抽取装置的结构示意图。如图12所示,该装置包括:
[0281] 第三接收模块1202,被配置为接收用户发送的信息抽取请求,其中,信息抽取请求包括信息抽取任务,信息抽取任务包括待抽取文本和初始提示信息;
[0282] 第三解析模块1204,被配置为解析信息抽取任务,确定信息抽取任务对应的至少两个信息抽取子任务;
[0283] 第四确定模块1206,被配置为根据初始提示信息和至少两个信息抽取子任务中已完成信息抽取子任务的抽取结果,确定当前信息抽取子任务对应的当前提示信息;
[0284] 第四输入模块1208,被配置为将待抽取文本和当前提示信息输入信息抽取模型,确定当前信息抽取子任务对应的抽取结果;
[0285] 第五确定模块1210,被配置为根据各信息抽取子任务对应的抽取结果,确定信息抽取任务的目标抽取结果;
[0286] 第二发送模块1212,被配置为向用户发送信息抽取任务的目标抽取结果。
[0287] 应用本说明书实施例的方案,通过解析信息抽取任务,将复杂的信息抽取任务转化为至少两个简单的信息抽取子任务,使得本方案可以支持任意信息抽取子任务组合的信息抽取任务,提高了信息抽取的普适性。并且,利用信息抽取模型确定各信息抽取子任务的抽取结果,实现了利用一个信息抽取模型完成多个信息抽取子任务,提高了信息抽取效率。向用户发送信息抽取任务的目标抽取结果,提高了用户体验度。
[0288] 上述为本实施例的一种信息抽取装置的示意性方案。需要说明的是,该信息抽取装置的技术方案与上述的信息抽取方法的技术方案属于同一构思,信息抽取装置的技术方案未详细描述的细节内容,均可以参见上述信息抽取方法的技术方案的描述。
[0289] 图13示出了本说明书一个实施例提供的一种计算设备的结构框图。该计算设备1300的部件包括但不限于存储器1310和处理器1320。处理器1320与存储器1310通过总线
1330相连接,数据库1350用于保存数据。
[0290] 计算设备1300还包括接入设备1340,接入设备1340使得计算设备1300能够经由一个或多个网络1360通信。这些网络的示例包括公用交换电话网(PSTN,PublicSwitchedTelephone Network)、局域网(LAN,LocalAreaNetwork)、广域网(WAN,WideAreaNetwork)、个域网(PAN,PersonalAreaNetwork)或诸如因特网的通信网络的组合。
接入设备1340可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC,NetworkInterfaceCard))中的一个或多个,诸如IEEE802.11无线局域网(WLAN,WirelessLocalAreaNetworks)无线接口、全球微波互联接入(Wi‑MAX,WorldInteroperabilityforMicrowaveAccess)接口、以太网接口、通用串行总线(USB,UniversalSerialBus)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC,NearFieldCommunication)接口,等等。
[0291] 在本说明书的一个实施例中,计算设备1300的上述部件以及图13中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图13所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
[0292] 计算设备1300可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或个人计算机(PC,PersonalComputer)的静止计算设备。计算设备1300还可以是移动式或静止式的服务器。
[0293] 其中,处理器1320用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述信息抽取方法或者会议观点抽取方法或者信息抽取模型训练方法的步骤。
[0294] 上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的信息抽取方法、会议观点抽取方法和信息抽取模型训练方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述信息抽取方法或者会议观点抽取方法或者信息抽取模型训练方法的技术方案的描述。
[0295] 本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述信息抽取方法或者会议观点抽取方法或者信息抽取模型训练方法的步骤。
[0296] 上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的信息抽取方法、会议观点抽取方法和信息抽取模型训练方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述信息抽取方法或者会议观点抽取方法或者信息抽取模型训练方法的技术方案的描述。
[0297] 本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述信息抽取方法或者会议观点抽取方法或者信息抽取模型训练方法的步骤。
[0298] 上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的信息抽取方法、会议观点抽取方法和信息抽取模型训练方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述信息抽取方法或者会议观点抽取方法或者信息抽取模型训练方法的技术方案的描述。
[0299] 上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0300] 所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read‑OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、电载波信号、电信信号以及软件分发介质等。
[0301] 需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
[0302] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
[0303] 以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。