首页 / 信息抽取方法以及装置

信息抽取方法以及装置实质审查 发明

技术领域

[0001] 本说明书实施例涉及信息处理技术领域,特别涉及一种信息抽取方法。

相关背景技术

[0002] 信息抽取是指从海量的自然语言语料库中,抽取出特定的事件或事实信息,对海量文档中的内容实现自动分类、重要信息提取、生成摘要信息和重构文本结构等。随着自然语言处理(NLP,Natural Language Processing)不断发展,信息抽取技术的使用场景也在不断拓宽。
[0003] 海量的以图片、便携式文档格式(PDF,Portable Document Format)、文档等结构化数字格式存储的数据也需要通过信息抽取来进行内容分析,然而传统的纯文本形式的信息抽取方式在对以图片、便携式文档格式、文档等结构化数字格式存储的数据进行信息抽取时,抽取得到的信息不准确,也即传统的纯文本形式的信息抽取方式逐渐无法满足在实际场景中的使用需求,因此,亟需一种准确的信息抽取方法。

具体实施方式

[0024] 在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0025] 在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0026] 应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
[0027] 此外,需要说明的是,本说明书一个或多个实施例所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
[0028] 首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
[0029] 信息抽取:信息抽取是自然语言处理领域中重要的分支,是一种序列标注任务的子任务,信息抽取具体包括命名体识别、关系抽取和事件抽取三种下游任务。
[0030] 文档级信息抽取:区别于纯文本信息抽取,文档级信息抽取是一种面向以文档结构存储的多模态表现形式的信息抽取任务,文档具有图像、文本、结构、板式信息,是一种天然的多模态场景。
[0031] 文档结构信息:文档数据特有的信息,由于文档一般较长,清晰的组织结构能够更好的呈现文档的内容,具体体现为标题组织的层级关系。
[0032] 注意力机制(Attention Mechanism):是一种特征筛选和增强的有效手段,目前已广泛应用于自然语言处理(NLP,Natural Language Processing)、计算机视觉(CV,Computer Vision)等领域中。
[0033] 信息抽取是指从海量的自然语言语料库中,抽取出特定的事件或事实信息,对海量文档中的内容实现自动分类、重要信息提取、生成摘要信息和重构文本结构等。随着自然语言处理不断发展,信息抽取技术的使用场景也在不断拓宽。
[0034] 海量的以图片、便携式文档格式、文档等结构化数字格式存储的数据也需要通过信息抽取来进行内容分析;目前通常使用的信息抽取方式有三种,第一种是纯文本形式的信息抽取方式:传统的纯文本形式的信息抽取方式在对以图片、便携式文档格式、文档等结构化数字格式存储的数据进行信息抽取时,抽取得到的信息不准确,也即传统的纯文本形式的信息抽取方式逐渐无法满足在实际场景中的使用需求;第二种是考虑图像与文本两个模态的信息抽取方式:仅考虑图像与文本两个模态的信息抽取方式忽略了文档特有的结构信息,导致在长文档数据、跨章节抽取中表现不佳;第三种是通过图谱的方式引入结构信息,但是通过节点粒度进行粒度划分,丢掉了文档结构信息,只保留了实体之间的联系,在长文档数据和跨章节抽取中效果较差,其中,节点粒度是使用节点进行粒度划分,诸如使用人名、时间、地点的细粒度节点,因此,亟需一种准确的信息抽取方法。
[0035] 需要说明的是,本说明书实施例所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
[0036] 在本说明书中,提供了一种信息抽取方法,本说明书同时涉及一种信息抽取装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
[0037] 参见图1,图1示出了本说明书一个实施例提供的一种信息抽取系统架构下的交互流程示意图,如图1所示,该系统包括服务端0101和客户端0102。
[0038] 服务端0101:用于获取文档文本;将所述文档文本输入至信息抽取模型,获得信息抽取结果,其中,所述信息抽取模型包括注意力层,所述注意力层基于所述文档文本对应的版面信息获得所述版面信息中各文本节点对应的文本结构特征,文本结构特征由当前文本节点与祖先文本节点对应的文本特征获得,所述当前文本节点对应的祖先文本节点由所述版面信息确定;
[0039] 客户端0102:用于接收信息抽取结果。
[0040] 应用本说明书实施例中的方案获取文档文本;将文档文本输入至信息抽取模型,获得信息抽取结果,其中,信息抽取模型包括注意力层,注意力层基于文档文本对应的版面信息获得版面信息中各文本节点对应的文本结构特征,文本结构特征由当前文本节点与祖先文本节点对应的文本特征获得,当前文本节点对应的祖先文本节点由版面信息确定。通过版面信息中当前文本节点与祖先文本节点之间的文本特征,获得当前文本节点对应的文本结构特征,使得信息抽取模型抽取得到的信息抽取结果是基于文档文本对应的版面信息中各文本节点对应的文本结构特征进行抽取的,提高了信息抽取结果的准确性。
[0041] 参见图2,图2示出了本说明书一个实施例提供的一种信息抽取系统的框架图,该系统可以包括服务端100以及多个客户端200。多个客户端200之间通过服务端100可以建立通信连接,在信息抽取场景中,服务端100即用来在多个客户端200之间提供信息抽取服务,多个客户端200可以分别作为发送端或接收端,通过服务端100实现通信。
[0042] 用户通过客户端200可与服务端100进行交互以接收其它客户端200发送的数据,或将数据发送至其它客户端200等。在信息抽取场景中,可以是用户通过客户端200向服务端100发布信息抽取请求,服务端100根据该信息抽取请求生成信息抽取结果,并将信息抽取结果推送至其他建立通信的客户端200中。
[0043] 其中,客户端200与服务端100之间通过网络建立连接。网络为客户端200与服务端100之间提供了通信链路的介质。网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。客户端200所传输的数据可能需要经过编码、转码、压缩等处理之后才发布至服务端100。
[0044] 客户端200可以为浏览器、应用程序(APP,Application)、或网页应用如超文本标记语言第5版(H5,HyperText Markup Language5)应用、或轻应用(也被称为小程序,一种轻量级应用程序)或云应用等,客户端200可以基于服务端提供的相应服务的软件开发工具包(SDK,Software Development Kit),如基于实时通信(RTC,Real Time Communication)SDK开发获得等。客户端200可以部署在电子设备中,需要依赖设备运行或者设备中的某些APP而运行等。电子设备例如可以具有显示屏并支持信息浏览等,如可以是个人移动终端如手机、平板电脑、个人计算机等。在电子设备中通常还可以配置各种其它类应用,例如人机对话类应用、模型训练类应用、文本处理类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
[0045] 服务端100可以包括提供各种服务的服务器,例如为多个客户端提供通信服务的服务器,又如为客户端上使用的模型提供支持的用于后台训练的服务器,又如对客户端发送的数据进行处理的服务器等。需要说明的是,服务端100可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。服务器也可以是云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN,Content Delivery Network)以及大数据和人工智能平台等基础云计算服务的云服务器,或者是带人工智能技术的智能云计算服务器或智能云主机。
[0046] 值得说明的是,本说明书实施例中提供的信息抽取方法一般由服务端100执行,但是,在本说明书的其它实施例中,客户端200也可以与服务端具有相似的功能,从而执行本说明书实施例所提供的信息抽取方法。在其它实施例中,本说明书实施例所提供的信息抽取方法还可以是由客户端200与服务端100共同执行。
[0047] 参见图3,图3示出了本说明书一个实施例提供的一种信息抽取方法的流程图,具体包括以下步骤。
[0048] 步骤302:获取文档文本。
[0049] 本说明书实施例应用于具有信息抽取的应用所属的客户端或者服务端,下述以服务端为例进行说明。
[0050] 在有对文档文本进行信息抽取的需求时,服务端获取文档文本,文档文本可以是用户在前端输入的,也可以是服务端从存储文档文本的数据库中获得的。
[0051] 具体地,文档文本是指由多个文本字符组成的文本,文档文本可以是长文档文本,长文档文本中可以包括多个章节,比如文档文本可以是具有多个章节的文档。
[0052] 本说明书一种可能的实现方式中,可以是服务端通过用户的点击,开启一个上传文档文本的通道(比如,通过蓝牙、网络上传等等),由用户上传文档文本,服务端基于用户上传的文档文本进行信息抽取。
[0053] 本说明书另一种可能的实现方式中,可以是服务端中存在有很多文档文本,由用户点击需要上传的文档文本是什么,将选中的目标文档文本作为文档文本,由服务端根据该文档文本进行信息抽取。
[0054] 基于本说明书实施例是对文档文本进行信息抽取,故获取到的是文档文本,以用于后续基于文档文本进行信息抽取。
[0055] 步骤304:将文档文本输入至信息抽取模型,获得信息抽取结果,其中,信息抽取模型包括注意力层,注意力层基于文档文本对应的版面信息获得版面信息中各文本节点对应的文本结构特征,文本结构特征由当前文本节点与祖先文本节点对应的文本特征获得,当前文本节点对应的祖先文本节点由版面信息确定。
[0056] 具体地,信息抽取模型是指对文本的信息进行抽取的模型,其中,信息抽取模型可以是在预训练模型的基础上进行微调获得的,微调可以是在预训练模型中加入注意力层,进行注意力的处理,进而获得信息抽取结果。注意力层是指包括注意力机制的网络层,其中注意力机制用于使特征按照注意力机制中的注意力方式进行学习,获得注意力层的输出。版面信息是指由文档文本进行版面构建生成的,版面信息中包括文档文本中的文本,版面信息的形式可以是树状图结构,也可以是层级图结构,版面信息表征的是图结构信息。文本结构特征是指当前节点在文档文本中的结构特征,表征当前文本节点在文档文本中结构的特征,文本结构特征是由当前文本节点对应的文本特征和祖先文本节点对应的文本特征获得,当前文本节点是指版面信息中当前正在处理的文本节点,当前文本节点在不同的处理时机中可以是版面信息中的任一个文本节点。祖先文本节点是指当前文本节点至根文本节点之间的文本节点,祖先文本节点包括根文本节点。文本特征是指对文本节点中的文本内容进行特征提取获得的。
[0057] 示例性地,文档文本A拥有一个大标题,两个章节标题(章节标题1和章节标题2)以及两个章节标题对应的段落文本(段落文本1和段落文本2),构建得到版面信息为:大标题分别与章节标题1和章节标题2通过边相连,章节标题1又与段落文本1通过边相连,章节标题2也与段落文本2通过边相连,构成由5个文本节点、4条边相连的图结构。
[0058] 信息抽取模型的结构有很多种,可以是包括构建得到版面信息的版面构建层,也可以是不包括构建得到版面信息的版面构建层,具体根据实际情况进行选择,本说明书在此不作任何限定。
[0059] 本说明书一种可能的实现方式中,信息抽取模型不包括构建得到版面信息的版面构建层,具体是,信息抽取模型包括特征提取层、注意力层和信息抽取层,利用该信息抽取模型对文档文本的处理方式如下:将文档文本输入至特征提取层,获得文档文本中各文本字符对应的文本字符特征;除信息抽取模型之外,还包括版面信息构建模型,将文档文本输入至版面信息构建模型,获得版面信息;将版面信息和各文本字符对应的文本字符特征输入至注意力层,注意力层将文本字符特征与版面信息中的文本节点进行对应,获得包含文本特征的版面特征信息,并基于版面特征信息进行注意力处理,获得各文本节点对应的文本结构特征;将文本结构特征输入至信息抽取层,获得信息抽取结果。
[0060] 本说明书另一种可能的实现方式中,信息抽取模型包括版面构建层,具体的,信息抽取模型包括版面构建层、特征提取层、注意力层与信息抽取层;上述步骤304中的将文档文本输入至信息抽取模型,获得信息抽取结果,包括如下步骤:
[0061] 将文档文本输入至版面构建层,获得版面信息,其中,版面信息包括至少两个文本节点与各文本节点之间的文本关系信息;
[0062] 将版面信息输入至特征提取层,获得各文本节点对应的文本特征与各文本节点之间的文本关系特征;
[0063] 将各文本节点对应的文本特征与各文本节点之间的文本关系特征输入至注意力层,获得各文本节点对应的文本结构特征;
[0064] 将各文本节点对应的文本结构特征输入至信息抽取层,获得信息抽取结果。
[0065] 具体地,版面构建层是指基于文档文本进行版面信息构建的网络层。特征提取层是指对文本的信息进行特征提取的网络层。注意力层是指限定文本特征在注意力层的注意力学习方式的网络层,注意力层又叫attent ion层。信息抽取层是指对文档文本中的信息进行抽取的网络层,具体是通过文档文本中文本对应的特征进行信息抽取。文本关系信息是指版面信息中各文本节点之间的边的信息,比如,文本关系信息可以是大标题与章节标题1通过边相连、大标题与章节标题2通过边相连,其中,边可以是有向边。文本关系特征是指对文本关系信息进行特征提取获得的特征,其中,文本关系特征也可以表征文本节点之间的关系。
[0066] 文本关系信息是包含在版面信息中的,在版面信息表征图结构信息的情况下,文本关系信息仅能表明节点与节点之间是通过边进行连接,需要将文本关系信息输入至特征提取层进行特征提取,获得各文本节点之间的特征向量,即文本关系特征。
[0067] 将文档文本输入至版面构建层,获得版面信息的实现方式,可以是将文档文本输入至版面构建层,版面构建层中包括语义识别或关键字识别的功能,确定属于不同层级的文本,并按照不同的层级为文本进行打标,根据打标结果构建版面信息,比如文档文本包括大标题、章节标题1、章节标题2、段落文本1和段落文本2,通过语义识别,确定大标题为最高层级的文本,章节标题1与章节标题2为并列层级,且均为大标题的下层文本,段落文本1与段落文本2为并列层级,段落文本1为章节标题1的下层文本,段落文本2为章节标题2的下层文本,根据识别结果为各文本进行打标,进而根据打标结果构建得到版面信息。
[0068] 可选地,版面构建层构建版面信息时,可以识别属于文本节点中的文本长度,若超过预设文本长度,则将文本节点中的文本进行拆分,获得多个节点文本,拆分后的节点文本具有与拆分前的节点文本相同的文本关系信息,其中,拆分可以是对文本节点中的文本内容进行均匀划分;还可以是每达到预设文本长度划分一次,直至达到最后一个字符,则停止识别,并停止划分。
[0069] 将版面信息输入至特征提取层,获得各文本节点对应的文本特征与各文本节点之间的文本关系特征的实现方式,可以是识别版面信息中各文档文本节点中的文本以及各文本节点之间的文本关系信息,对文本和文本关系信息进行特征映射,映射至向量空间,获得各文本节点对应的文本特征和文本关系信息对应的文本关系特征。
[0070] 将各文本节点对应的文本特征与各文本节点之间的文本关系特征输入至注意力层,获得各文本节点对应的文本结构特征的实现方式,可以是确定各文本节点对应的祖先文本节点,基于文本节点的文本特征与祖先文本节点的文本特征,获得各文本节点对应的文本结构特征。
[0071] 基于文本节点的文本特征和祖先文本节点的文本特征进行注意力处理,获得注意力处理结果;基于注意力处理结果,获得各文本节点对应的文本结构特征。
[0072] 其中,基于注意力处理结果,获得各文本节点对应的文本结构特征的实现方式,可以是基于注意力处理结果,对注意力处理结果进行加权求和处理,获得各文本节点对应的文本结构特征。
[0073] 将各文本节点对应的文本结构特征输入至信息抽取层,获得信息抽取结果的实现方式,可以是将各文本节点对应的文本结构特征输入至信息抽取层,利用信息抽取层,对文本结构特征进行关键特征提取,基于提取到的关键特征,获得信息抽取结果。
[0074] 应用本说明书实施例中的方案,信息抽取模型包括版面构建层、特征提取层、注意力层和信息抽取层,通过信息抽取模型中的各网络层对文档文本进行处理,构建得到版面信息,获得版面信息中各文本节点对应的文本结构特征,进而获得信息抽取结果,使得信息抽取结果是基于版面信息中各文本节点的文本结构特征处理获得的,保证了信息抽取结果的准确性。
[0075] 可选地,将各文本节点的文本特征和各文本节点的文本关系特征输入至注意力层,可以是确定当前文本节点的祖先文本节点,并根据确定的祖先文本节点与当前文本节点进行处理,获得各文本节点对应的文本结构特征,也即,上述步骤将各文本节点对应的文本特征与各文本节点之间的文本关系特征输入至注意力层,获得各文本节点对应的文本结构特征,包括如下步骤:
[0076] 根据各文本节点之间的文本关系特征,确定当前文本节点是否存在对应的祖先文本节点;
[0077] 在当前文本节点存在对应的祖先文本节点的情况下,基于当前文本节点对应的文本特征与祖先文本节点对应的文本特征,获得当前文本节点对应的文本结构特征;
[0078] 在当前文本节点不存在对应的祖先文本节点的情况下,基于当前文本节点对应的文本特征,获得当前文本节点对应的文本结构特征。
[0079] 注意力层根据各文本节点对应的文本特征与各文本节点之间的文本关系特征进行处理时,需要先确定当前文本节点是否存在对应的祖先文本节点,并根据确定结果选定不同的处理方式,保证处理效率。
[0080] 根据各文本节点之间的文本关系特征,确定当前文本节点是否存在对应的祖先文本节点的实现方式,具体是确定当前文本节点,查找各文本节点之间的文本关系特征中当前文本节点对应的祖先文本节点。
[0081] 可选地,在确定当前文本节点存在对应的祖先文本节点的情况下,获取祖先文本节点对应的文本特征和当前文本节点对应的文本特征,其中,获取当前文本节点与祖先文本节点对应的文本特征可以是从缓存数据库进行获取。
[0082] 在当前文本节点存在对应的祖先文本节点的情况下,基于当前文本节点对应的文本特征与祖先文本节点对应的文本特征,获得当前文本节点对应的文本结构特征的实现方式,具体是在确定当前文本存在对应的祖先文本节点的情况下,按照注意力层中预设的注意力学习方式,对当前文本节点的文本特征和祖先文本节点的文本特征进行注意力处理,并基于注意力处理结果,获得当前文本节点对应的文本结构特征,其中,注意力层中预设的注意力学习方式是指基于样本数据集对预训练模型进行训练,实现对预训练模型的微调,得到的注意力学习方式。
[0083] 其中,基于注意力处理结果,获得当前文本节点对应的文本结构特征实现方式,可以是基于注意力处理结果,对注意力处理结果进行加权求和,获得当前文本节点对应的文本结构特征。
[0084] 在当前文本节点不存在对应的祖先文本节点的情况下,基于当前文本节点对应的文本特征,获得当前文本节点对应的文本结构特征的实现方式,具体是在确定当前文本节点不存在对应的祖先文本节点的情况下,按照注意力层中预设的注意力学习方式,对当前文本节点的文本特征进行注意力处理,并基于注意力处理结果,获得当前文本节点对应的文本结构特征。
[0085] 若当前文本节点存在对应的祖先文本节点,则确定当前文本节点为版面信息中除根文本节点之外的其他文本节点;若当前文本节点不存在对应的祖先文本节点,则确定当前文本节点为版面信息中的根文本节点。
[0086] 应用本说明书实施例的方案,在将各文本节点对应的文本特征和各文本节点之间的文本关系特征输入至信息抽取模型中的注意力层,确定当前文本节点是否存在对应的祖先文本节点,根据确定结果选定不同的注意力处理方式,进行注意力处理,在当前文本节点存在对应的祖先文本节点的情况下,利用当前文本节点和祖先文本节点分别对应的文本特征进行注意力处理,获得当前文本节点对应的文本结构特征,使得后续获得信息抽取结果时可以使用各文本节点对应的文本结构特征,保证了获得信息抽取结果的准确性。
[0087] 可选地,基于当前文本节点和祖先文本节点分别对应的文本特征进行处理的方式,可以是进行注意力计算,根据注意力计算结果,获得当前文本节点对应的文本结构特征,也即上述步骤基于当前文本节点对应的文本特征与祖先文本节点对应的文本特征,获得当前文本节点对应的文本结构特征,包括如下步骤:
[0088] 对当前文本节点对应的文本特征与祖先文本节点对应的文本特征进行注意力计算,获得当前文本节点基于祖先文本节点生成的参考文本特征;
[0089] 基于参考文本特征,获得当前文本节点对应的文本结构特征。
[0090] 在信息抽取模型中的注意力层进行处理时,对输入的特征进行注意力计算,根据注意力计算结果,获得注意力层的输出,故需要对当前文本节点对应的文本特征和祖先文本节点对应的文本特征进行注意力计算,获得注意力计算结果。
[0091] 具体地,参考文本特征是指当前文本节点基于祖先文本节点,进行文本特征的计算获得的。
[0092] 对当前文本节点对应的文本特征与祖先文本节点对应的文本特征进行注意力计算,获得当前文本节点基于祖先文本节点生成的参考文本特征的实现方式,可以是按照预设注意力计算规则,对当前文本节点对应的文本特征和祖先文本节点对应的文本特征进行注意力计算,基于注意力计算结果,获得当前文本节点基于祖先文本节点生成的参考文本特征。
[0093] 预设注意力计算规则可以为注意力计算公式,具体参见以下公式(1):
[0094]
[0095] 其中,Attention为参考文本特征,K(Key)为键,V(Value)为值,Q(Query)为查询,TSoftmax的作用是对向量做归一化,dk为K的维度大小,K为K的转置,其中,Q、K和V分别通过以下公式(2)、公式(3)和公式(4)获得:
[0096] Q=Wq×X1                      公式(2)
[0097] K=Wk×X                       公式(3)
[0098] V=Wv×X                       公式(4)
[0099] 其中,Wq、Wk与Wv均为信息抽取模型中注意力层中的可训练的参数矩阵,X1为当前文本节点对应的文本特征;X为祖先文本节点的文本特征。
[0100] 基于注意力计算结果,获得当前文本节点基于祖先文本节点生成的参考文本特征,可以是将注意力计算结果作为当前文本节点基于祖先文本节点生成的参考文本特征。
[0101] 基于参考文本特征,获得当前文本节点对应的文本结构特征的实现方式,可以是将参考文本特征进行特征融合,将融合后的特征作为文本结构特征,其中,特征融合的方式基于当前文本节点对应的祖先文本节点的个数不同而不同。
[0102] 应用本说明书实施例的方案,对当前文本节点对应的文本特征与祖先文本节点对应的文本特征进行注意力计算,获得当前文本节点基于祖先文本节点生成的参考文本特征;基于参考文本特征,获得当前文本节点对应的文本结构特征,使得当前文本节点的文本结构特征是基于当前文本节点的文本特征与祖先文本节点的文本特征进行注意力计算得到的,也即生成的文本结构特征中包含有当前文本节点与祖先文本节点之间的结构信息以及文本特征对应的信息,使得后续基于当前文本节点的文本结构特征进行信息抽取的信息抽取结果可以考虑到文档文本中的结构信息,提高了信息抽取结果的准确性。
[0103] 可选地,在获得参考文本特征之后,需要获取当前文本节点和祖先文本节点之间的文本权重,根据文本权重将参考文本特征进行处理,获得当前文本节点对应的文本结构特征,也即上述步骤基于参考文本特征,获得当前文本节点对应的文本结构特征,包括如下步骤:
[0104] 获取当前文本节点与祖先文本节点之间的文本权重;
[0105] 基于当前文本节点与祖先文本节点之间的文本权重与当前文本节点基于祖先文本节点生成的参考文本特征,获得当前文本节点对应的文本结构特征。
[0106] 当前文本节点对应的祖先文本节点的个数可以是一个也可以是多个,相应的参考文本特征特可以是一个或多个,基于参考文本特征,获得当前文本节点对应的文本结构特征,需要将一个或多个参考文本特征进行处理,获得当前文本节点对应的文本结构特征,而由于版面信息中各文本节点之间的文本关系信息是不同的,有路径上的远近之分,故需要获取当前文本节点与祖先文本节点之间的文本权重,基于文本权重,对参考文本特征进行处理,获得当前文本节点对应的文本结构特征。
[0107] 具体地,文本权重是指两个文本节点之间的权重,一个文本节点至根文本节点划分为一条路径,该文本节点与该路径上的所有文本节点之间的文本权重之和为1。
[0108] 获取当前文本节点与祖先文本节点之间的文本权重,可以是从文本权重设置规则中进行获取的,具体根据实际情况进行设置,本说明书在此不做限定。
[0109] 本说明书一种可能的实现方式中,文本权重设置规则可以是根据文本节点间在路径上的距离,预先设定好的,比如,直接连接的两个文本节点对应的文本节点的文本权重为0.6,间接连接的两个文本节点对应的文本权重为0.3,中间间隔两个文本节点的两个文本节点对应的文本权重为0.1等。
[0110] 本说明书另一种可能的实现方式中,文本权重设置规则还可以是按照文本节点与路径上距离最远的文本节点之间相隔的文本,设置文本权重,比如,当前文本节点与根文本节点之间相隔一个文本节点,也即该路径上共有三个节点,则设置,当前文本节点与中间文本节点之间的文本权重为0.6,当前节点与根文本节点之间的文本权重为0.4。
[0111] 可选地,在根据文本权重设置规则设置当前文本节点与祖先文本节点之间的文本权重之后,还可以对文本权重进行再次修改。
[0112] 基于当前文本节点与祖先文本节点之间的文本权重与当前文本节点基于祖先文本节点生成的参考文本特征,获得当前文本节点对应的文本结构特征的实现方式,可以是基于当前文本节点与祖先文本节点之间的文本权重与当前文本节点基于祖先文本节点生成的参考文本特征进行特征融合,获得当前文本节点对应的文本结构特征,其中,特征融合的方式可以是加权求和也可以是加权拼接,具体根据实际情况进行选择,本说明书在此不作任何限定。
[0113] 应用本说明书实施例的方案,获取当前文本节点与祖先文本节点之间的文本权重;基于当前文本节点与祖先文本节点之间的文本权重与当前文本节点基于祖先文本节点生成的参考文本特征,获得当前文本节点对应的文本结构特征。基于获取的文本权重与参考文本特征,获得当前文本节点对应的文本结构特征,使得获得的文本结构特征是根据对应的文本权重对参考文本特征进行处理得到的,保证了不同参考文本特征在我那本结构特征中所占比重不同,充分运用了各文本节点之间的距离,提高了基于文本结构特征提取得到的信息抽取结果的准确性。
[0114] 可选地,在当前文本节点对应的祖先文本节点有两个时,利用不同的文本权重对两个参考文本特征进行特征融合,获得当前文本节点对应的文本结构特征,也即,当前文本节点对应的祖先文本节点包括至少两个;上述步骤基于当前文本节点与祖先文本节点之间的文本权重与当前文本节点基于祖先文本节点生成的参考文本特征,获得当前文本节点对应的文本结构特征,包括如下步骤:
[0115] 基于当前文本节点与第一祖先文本节点之间的文本权重与当前文本节点基于第一祖先文本节点生成的参考文本特征,确定当前文本节点对应的第一加权文本特征;
[0116] 基于当前文本节点与第二祖先文本节点之间的文本权重与当前文本节点基于第二祖先文本节点生成的参考文本特征,确定当前文本节点对应的第二加权文本特征;
[0117] 基于第一加权文本特征与第二加权文本特征进行特征融合,获得当前文本节点对应的文本结构特征。
[0118] 具体地,第一加权文本特征是指第一祖先文本节点在当前文本节点对应的结构中所对应的文本特征。第二加权文本特征是指第二祖先文本节点在当前文本节点对应的结构中所对应的文本特征。
[0119] 当前文本节点对应的祖先文本节点包括至少两个,则确定当前文本节点对应的参考文本特征包括至少两个,祖先文本节点的个数与参考文本特征的个数一一对应。
[0120] 第一祖先文本节点与第二祖先文本节点为至少两个祖先文本节点中的任意两个祖先文本节点,其中,第一祖先文本节点与第二祖先文本节点不同。
[0121] 基于当前文本节点与第一祖先文本节点之间的文本权重与当前文本节点基于第一祖先文本节点生成的参考文本特征,确定当前文本节点对应的第一加权文本特征的实现方式,可以是将当前文本节点与第一祖先文本节点之间的文本权重与当前文本节点基于第一祖先文本节点生成的参考文本特征相乘,获得当前文本节点对应的第一加权文本特征。
[0122] 基于当前文本节点与第二祖先文本节点之间的文本权重与当前文本节点基于第二祖先文本节点生成的参考文本特征,确定当前文本节点对应的第二加权文本特征的实现方式,可以是将当前文本节点与第二祖先文本节点之间的文本权重与当前文本节点基于第二祖先文本节点生成的参考文本特征相乘,获得当前文本节点对应的第二加权文本特征。
[0123] 基于第一加权文本特征与第二加权文本特征进行特征融合,获得当前文本节点对应的文本结构特征的实现方式,可以是将第一加权文本特征与第二加权文本特征进行相加,获得当前文本节点对应的文本结构特征;还可以是将第一加权文本特征与第二加权文本特征进行拼接,获得当前文本节点对应的文本结构特征。
[0124] 应用本说明书实施例的方案,在当前文本节点对应的祖先文本节点为至少两个时,利用祖先文本节点与当前文本节点之间的文本权重与当前文本节点基于祖先文本节点生成的参考文本特征,获得当前文本节点基于祖先文本节点生成的加权文本特征,并基于各加权文本特征进行处理,获得当前文本节点对应的文本结构特征,以使后续基于当前文本节点对应的文本结构特征进行处理,获得信息抽取结果,保证了信息抽取结果的准确性。
[0125] 可选地,版面信息中包括至少两个文本节点与各文本节点之间的文本关系信息,在将版面信息输入至特征提取层之后,特征提取层是对至少两个文本节点与各文本节点之间的文本关系信息均进行特征提取处理,获得分别对应的文本特征和文本关系特征,也即,上述步骤将版面信息输入至特征提取层,获得各文本节点对应的文本特征与各文本节点之间的文本关系特征,包括如下步骤:
[0126] 获取版面信息中各文本节点对应的文本信息与各文本节点之间的文本关系信息;
[0127] 对各文本节点对应的文本信息进行特征提取,获得各文本节点对应的文本特征;
[0128] 对各文本节点之间的文本关系信息进行特征提取,获得各文本节点之间的文本关系特征。
[0129] 版面信息中包括至少两个文本节点与各文本节点之间的文本关系信息,在对版面信息进行特征提取时,对版面信息中的各个信息都进行特征提取。
[0130] 获取版面信息中各文本节点对应的文本信息与各文本节点之间的文本关系信息的实现方式,可以是对版面信息中的信息进行识别,获得各文本节点对应的文本信息与各文本节点之间的文本关系信息,其中,获得到的信息可以是按照文本节点进行划分的,也可以是按照文本信息和文本关系信息进行划分的,具体根据实际情况进行选择,本说明书在此不作任何限定。
[0131] 对各文本节点对应的文本信息进行特征提取,获得各文本节点对应的文本特征的实现方式,具体是将各文本节点对应的文本信息进行特征映射,映射到向量空间中,获得各文本节点对应的文本特征。
[0132] 对各文本节点之间的文本关系信息进行特征提取,获得各文本节点之间的文本关系特征的实现方式,具体是将各文本节点之间的文本关系信息进行特征映射,映射到向量空间中,获得各文本节点之间的文本关系特征。
[0133] 应用本说明书实施例的方案,通过对版面信息中包含的各文本节点对应的文本信息与各文本节点之间的文本关系信息都进行特征提取,获得各文本节点对应的文本特征与各文本节点之间的文本关系特征,使得后续可以基于获得的文本特征与文本关系特征进行相应处理,获得信息抽取结果,保证了获取信息抽取结果的准确性。
[0134] 可选地,通过特征提取层获得文本特征之后,可以将文本特征存储至缓存数据库,以使后续确定当前文本节点对应的祖先文本节点后,获取祖先文本节点对应的文本特征进行相应处理,也即在上述步骤将版面信息输入至特征提取层,获得各文本节点对应的文本特征与各文本节点之间的文本关系特征之后,还包括如下步骤:
[0135] 将版面信息中各节点对应的文本特征存储至缓存数据库,其中,缓存数据库用于存储版面信息中各文本节点对应的文本特征。
[0136] 注意力层获取各文本节点对应的文本结构特征是通过对各文本节点进行分别处理,故在特征提取层获得各文本节点对应的文本特征之后,可以将文本特征存储至存储与数据库中,在对各文本节点进行处理时,获取对应文本节点对应的文本特征,进行注意力处理,获得各文本节点对应的文本结构特征。
[0137] 具体地,缓存数据库是指存储版面信息中各文本节点对应的文本特征的数据库。
[0138] 将版面信息中各节点对应的文本特征存储至缓存数据库的实现方式,可以是按照版面信息对存储至缓存数据库中的文本特征进行分类,按照分类进行存储。
[0139] 可选地,在信息抽取模型在对版面信息处理完成后,可以将相应版面信息中各文本节点对应的文本特征从缓存数据库中删除。
[0140] 可选地,除了将各文本节点对应的文本特征存储至缓存数据库之外,还可以将各文本节点之间的文本关系特征存储至缓存数据库,以使后续可以从缓存数据库中获得当前文本节点与其他文本节点对应的关系文本特征。
[0141] 应用本说明书实施例的方案,在特征提取层输出各文本节点对应的文本特征后,将各文本节点对应的文本特征存储至缓存数据库中,以使后续再对各文本节点进行处理时,可以从缓存数据库中获得对应的文本特征,以获得各文本节点对应的文本结构特征,并基于各文本节点对应的文本结构特征获得信息抽取结果,以在提高信息抽取结果准确性的同时,保证信息抽取的效率。
[0142] 本说明书一个或多个实施例中,通过将文档版面粒度的文档结构信息引入,使用文档级信息抽取的方式,对文档文本进行信息抽取,能够帮助信息抽取模型进行抽取时,通过结构信息的注意力优化抽取结果,从而优化跨章节抽取与长文档抽取的效果。
[0143] 下述结合附图4a,以本说明书提供的信息抽取方法在文档抽取的应用为例,对所述信息抽取方法进行进一步说明。其中,图4a示出了本说明书一个实施例提供的一种信息抽取方法的处理过程流程图,具体包括以下步骤。
[0144] 步骤402:获取文档文本。
[0145] 获取文档文本,其中文档文本包括一个文档标题、文档标题下包括段落内容1、一级标题1和一级标题2,一级标题1下包括二级标题1和为二级标题2,一级标题2下包括段落内容2,二级标题1下包括段落内容3,二级标题2下包括段落内容4。
[0146] 步骤404:将文档文本输入至版面构建层,获得版面信息,其中,版面信息包括至少两个文本节点与各文本节点之间的文本关系信息。
[0147] 将文档文本输入至版面构建层,获得的版面信息,参见图4b,图4b示出了本说明书一个实施例提供的一种信息抽取方法中版面信息的示意图:
[0148] 文档标题分别与段落内容1、一级标题1和一级标题2相连,一级标题1分别与二级标题1、二级标题2相连,一级标题2与段落内容2相连,二级标题1与段落内容3相连,二级标题2与段落内容4相连,文档标题为根文本节点,按照从根文本节点为起点,到其他任一个文本节点的顺序为相连对应的边赋予方向。
[0149] 其中,版面信息中任一个文本节点中包括文本节点对应的文本信息。
[0150] 步骤406:获取版面信息中各文本节点对应的文本信息与各文本节点之间的文本关系信息。
[0151] 步骤408:对各文本节点对应的文本信息进行特征提取,获得各文本节点对应的文本特征;对各文本节点之间的文本关系信息进行特征提取,获得各文本节点之间的文本关系特征。
[0152] 步骤410:根据各文本节点之间的文本关系特征,确定当前文本节点是否存在对应的祖先文本节点。
[0153] 步骤412:在当前文本节点存在对应的祖先文本节点的情况下,对当前文本节点对应的文本特征与祖先文本节点对应的文本特征进行注意力计算,获得当前文本节点基于祖先文本节点生成的参考文本特征。
[0154] 针对当前文本节点为二级标题1,一级标题1与文档标题为二级标题1对应的祖先文本节点,按照上述公式(1)至公式(4),计算二级标题1基于一级标题1生成的参考文本特征1,计算二级标题1基于文档标题生成的参考文本特征2;
[0155] 同理按照相同的方式,分别计算段落内容1、一级标题1、一级标题2、二级标题1、段落内容2、段落内容3、段落内容4与对应的祖先文本节点;
[0156] 在当前文本节点不存在对应的祖先文本节点的情况下,基于当前文本节点对应的文本特征,获得当前文本节点对应的文本结构特征;
[0157] 针对当前文本节点为文档标题,确定文档标题对应的参考文本特征为文档标题对应的文本特征。
[0158] 步骤414:获取当前文本节点与祖先文本节点之间的文本权重。
[0159] 针对当前文本节点为二级标题1,确定二级标题1与一级标题1之间的文本权重为0.7;二级标题1与文档标题之间的文本权重为0.3。
[0160] 同理获取其他文本节点与对应的祖先文本节点之间的文本权重。
[0161] 下述步骤416至420,针对当前文本节点为二级标题1进行展开描述。
[0162] 步骤416:基于当前文本节点与第一祖先文本节点之间的文本权重与当前文本节点基于第一祖先文本节点生成的参考文本特征,确定当前文本节点对应的第一加权文本特征。
[0163] 将二级标题1与一级标题1之间的文本权重为0.7与为二级标题1基于一级标题1生成的参考文本特征1相乘,获得第一加权文本特征。
[0164] 步骤418:基于当前文本节点与第二祖先文本节点之间的文本权重与当前文本节点基于第二祖先文本节点生成的参考文本特征,确定当前文本节点对应的第二加权文本特征。
[0165] 将二级标题1与文档标题之间的文本权重为0.3与为二级标题1基于文档标题生成的参考文本特征2相乘,获得第二加权文本特征。
[0166] 步骤420:基于第一加权文本特征与第二加权文本特征进行特征融合,获得当前文本节点对应的文本结构特征。
[0167] 将第一加权文本特征与第二加权文本特征相加,获得二级标题1对应的文本结构特征。
[0168] 步骤422:将各文本节点对应的文本结构特征输入至信息抽取层,获得信息抽取结果。
[0169] 应用本说明书实施例中的方案获取文档文本;将文档文本输入至信息抽取模型,获得信息抽取结果,其中,信息抽取模型包括注意力层,注意力层基于文档文本对应的版面信息获得版面信息中各文本节点对应的文本结构特征,文本结构特征由当前文本节点与祖先文本节点对应的文本特征获得,当前文本节点对应的祖先文本节点由版面信息确定。通过版面信息中当前文本节点与祖先文本节点之间的文本特征,获得当前文本节点对应的文本结构特征,使得信息抽取模型抽取得到的信息抽取结果是基于文档文本对应的版面信息中各文本节点对应的文本结构特征进行抽取的,提高了信息抽取结果的准确性。
[0170] 与上述方法实施例相对应,本说明书还提供了信息抽取装置实施例,图5示出了本说明书一个实施例提供的一种信息抽取装置的结构示意图。如图5所示,该装置包括:
[0171] 获取模块502,被配置为获取文档文本;
[0172] 获得模块504,被配置为将文档文本输入至信息抽取模型,获得信息抽取结果,其中,信息抽取模型包括注意力层,注意力层基于文档文本对应的版面信息获得版面信息中各文本节点对应的文本结构特征,文本结构特征由当前文本节点与祖先文本节点对应的文本特征获得,当前文本节点对应的祖先文本节点由版面信息确定。
[0173] 可选地,信息抽取模型包括版面构建层、特征提取层、注意力层与信息抽取层;获得模块504,进一步被配置为将文档文本输入至版面构建层,获得版面信息,其中,版面信息包括至少两个文本节点与各文本节点之间的文本关系信息;将版面信息输入至特征提取层,获得各文本节点对应的文本特征与各文本节点之间的文本关系特征;将各文本节点对应的文本特征与各文本节点之间的文本关系特征输入至注意力层,获得各文本节点对应的文本结构特征;将各文本节点对应的文本结构特征输入至信息抽取层,获得信息抽取结果。
[0174] 可选地,获得模块504,进一步被配置为根据各文本节点之间的文本关系特征,确定当前文本节点是否存在对应的祖先文本节点;在当前文本节点存在对应的祖先文本节点的情况下,基于当前文本节点对应的文本特征与祖先文本节点对应的文本特征,获得当前文本节点对应的文本结构特征;在当前文本节点不存在对应的祖先文本节点的情况下,基于当前文本节点对应的文本特征,获得当前文本节点对应的文本结构特征。
[0175] 可选地,获得模块504,进一步被配置为对当前文本节点对应的文本特征与祖先文本节点对应的文本特征进行注意力计算,获得当前文本节点基于祖先文本节点生成的参考文本特征;基于参考文本特征,获得当前文本节点对应的文本结构特征。
[0176] 可选地,获得模块504,进一步被配置为获取当前文本节点与祖先文本节点之间的文本权重;基于当前文本节点与祖先文本节点之间的文本权重与当前文本节点基于祖先文本节点生成的参考文本特征,获得当前文本节点对应的文本结构特征。
[0177] 可选地,当前文本节点对应的祖先文本节点包括至少两个;获得模块504,进一步被配置为基于当前文本节点与第一祖先文本节点之间的文本权重与当前文本节点基于第一祖先文本节点生成的参考文本特征,确定当前文本节点对应的第一加权文本特征;基于当前文本节点与第二祖先文本节点之间的文本权重与当前文本节点基于第二祖先文本节点生成的参考文本特征,确定当前文本节点对应的第二加权文本特征;基于第一加权文本特征与第二加权文本特征进行特征融合,获得当前文本节点对应的文本结构特征。
[0178] 可选地,获得模块504,进一步被配置为获取版面信息中各文本节点对应的文本信息与各文本节点之间的文本关系信息;对各文本节点对应的文本信息进行特征提取,获得各文本节点对应的文本特征;对各文本节点之间的文本关系信息进行特征提取,获得各文本节点之间的文本关系特征。
[0179] 可选地,获得模块504,进一步被配置为将版面信息中各节点对应的文本特征存储至缓存数据库,其中,缓存数据库用于存储版面信息中各文本节点对应的文本特征。
[0180] 应用本说明书实施例中的方案获取文档文本;将文档文本输入至信息抽取模型,获得信息抽取结果,其中,信息抽取模型包括注意力层,注意力层基于文档文本对应的版面信息获得版面信息中各文本节点对应的文本结构特征,文本结构特征由当前文本节点与祖先文本节点对应的文本特征获得,当前文本节点对应的祖先文本节点由版面信息确定。通过版面信息中当前文本节点与祖先文本节点之间的文本特征,获得当前文本节点对应的文本结构特征,使得信息抽取模型抽取得到的信息抽取结果是基于文档文本对应的版面信息中各文本节点对应的文本结构特征进行抽取的,提高了信息抽取结果的准确性。
[0181] 上述为本实施例的一种信息抽取装置的示意性方案。需要说明的是,该信息抽取装置的技术方案与上述的信息抽取方法的技术方案属于同一构思,信息抽取装置的技术方案未详细描述的细节内容,均可以参见上述信息抽取方法的技术方案的描述。
[0182] 图6示出了本说明书一个实施例提供的一种计算设备的结构框图。该计算设备600的部件包括但不限于存储器610和处理器620。处理器620与存储器610通过总线630相连接,数据库650用于保存数据。
[0183] 计算设备600还包括接入设备640,接入设备640使得计算设备600能够经由一个或多个网络660通信。这些网络的示例包括公用交换电话网(PSTN,Public Switched Telephone Network)、局域网(LAN,Local Area Network)、广域网(WAN,Wide Area Network)、个域网(PAN,Personal Area Network)或诸如因特网的通信网络的组合。接入设备540可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC,network interface controller))中的一个或多个,诸如IEEE802.11无线局域网(WLAN,Wireless Local  Area  Network)无线接口、全球微波互联接入(Wi‑MAX,Worldwide Interoperability for Microwave Access)接口、以太网接口、通用串行总线(USB,Universal Serial Bus)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC,Near Field Communication)。
[0184] 在本说明书的一个实施例中,计算设备600的上述部件以及图6中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图6所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
[0185] 计算设备600可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或个人计算机(PC,Personal Computer)的静止计算设备。计算设备600还可以是移动式或静止式的服务器。
[0186] 其中,处理器620用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述信息抽取方法的步骤。
[0187] 上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的信息抽取方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述信息抽取方法的技术方案的描述。
[0188] 本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述信息抽取方法的步骤。
[0189] 上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的信息抽取方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述信息抽取方法的技术方案的描述。
[0190] 本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述信息抽取方法的步骤。
[0191] 上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的信息抽取方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述信息抽取方法的技术方案的描述。
[0192] 上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0193] 所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read‑On ly Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据专利实践的要求进行适当的增减,例如在某些地区,根据专利实践,计算机可读介质不包括电载波信号和电信信号。
[0194] 需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
[0195] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
[0196] 以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

当前第1页 第1页 第2页 第3页
相关技术
抽取方法相关技术
方法装置相关技术
卿立之发明人的其他相关专利技术