基于Self-Attention机制的煤矿物资管理对话装置、系统及 其一体机 【技术领域】 [0001] 本实用新型属于煤矿物资的智能管理领域领域,尤其涉及基于Self-Attention机制的煤矿物资管理对话、系统及其一体机。 【背景技术】 [0002] 近年来,注意力(Attention)机制被广泛应用到基于深度学习的自然语言处理(NLP)各个任务中。Attention机制的本质来自于人类视觉注意力机制。人们视觉在感知东西的时候一般不会是一个场景从到头看到尾每次全部都看,而往往是根据需求观察注意特定的一部分。而且当人们发现一个场景经常在某部分出现自己想观察的东西时,人们会进行学习在将来再出现类似场景时把注意力放到该部分上。随着注意力机制的深入研究,各式各样的attention被研究者们提出。在2017年6月google机器翻译团队在arXiv上放出的《Attention is all you need》论文受到了大家广泛关注,自注意力(self-attention)机制开始成为神经网络attention的研究热点,在各个任务上也取得了不错的效果。 [0003] 煤矿物资管理是一项庞大的系统工程,因其数目庞大、种类繁多、管理复杂、存储困难等多重特点,煤矿物资的使用管理一直是煤矿经营者的重点工作。特别是对物资管理人员来讲,各类煤矿物资在管理时,都进行了信息化建设,通过建设物资管理系统,以人工输入的方式从物资管理系统中查询物资的存储、种类、数量和使用情况非常繁琐,浪费物资管理人员时间的同时,影响物资使用效率,造成物资管理的各种浪费。 【实用新型内容】 [0004] 本实用新型的目的是提供基于Self-Attention机制的煤矿物资管理对话装置、系统及其一体机,以解决现有物资供应系统中人工查询效率和管理效率低下、无法智能化并实现快速输出所需信息的问题。 [0005] 本实用新型采用以下技术方案:基于Self-Attention机制的煤矿物资管理对话装置,装置为服务器,包括: [0006] 存储模块,用于用户终端输入有关煤矿剩余物资的问题和答案; [0007] 输入模块,用于监听用户终端识别查询煤矿剩余物资的语音请求,并将语音请求发送至处理模块; [0008] 处理模块,用于接收输入模块的的语音请求,还用于将语音请求翻译为文字请求,并发送给转换模块, [0009] 转换模块,利用存储模块中的问题和答案通过Self Attention机制建立模型,并将文字请求通过模型输出对应的查询答案发送给用户终端。 [0010] 本实用新型还公开了基于Self-Attention机制的煤矿物资管理对话方法,方法应用于用户终端,用户终端根据自己的需求,向服务器发送语音请求,语音请求为查询煤矿剩余物资的请求,语音请求经过服务器利用用户终端输入的问题和答案通过Self Attention机制建立模型后,输出对应的查询答案发送给用户终端。 [0011] 本实用新型还公开了基于Self-Attention机制的煤矿物资管理对话系统,包括服务器端和用户终端, [0012] 服务器端包括: [0013] 存储模块,用于用户终端输入有关煤矿剩余物资的问题和答案; [0014] 输入模块,用于监听用户终端识别查询煤矿剩余物资的语音请求,并将语音请求发送至处理模块; [0015] 处理模块,用于接收输入模块的的语音请求,还用于将语音请求翻译为文字请求,并发送给转换模块, [0016] 转换模块,利用存储模块中的问题和答案通过Self Attention机制建立模型,并将文字请求通过模型输出对应的查询答案发送给用户终端; [0017] 用户终端包括: [0018] 发送模块,用于用户终端向服务器发送语音请求, [0019] 显示模块,用于接收服务器的查询答案,并将查询答案展示给用户终端。 [0020] 本实用新型还公开了基于Self-Attention机制的煤矿物资管理对话一体机,包括: [0021] 话筒,电性连接于处理器,用于用户终端通过语音输入语音请求,并将语音请求发送至处理器; [0022] 处理器,为NVIDIA Jetson TX2开发板,利用用户终端输入的问题和答案通过Self Attention机制建立模型,当接收到用户终端的查询煤矿剩余物资的语音请求后,将语音请求转化为文字请求,并将文字请求通过模型输出对应的查询答案发送给显示屏; [0023] 显示屏,用于显示查询答案给用户终端; [0024] 外壳,位于处理器外围,并与显示屏相互配合形成一个封闭空间,封闭空间用于容纳和保护处理器。 [0025] 本实用新型的有益效果是:以企业现有的信息管理系统为依托,利用自注意力机制实现语音分析及意图识别,实现煤矿剩余物资的供应商查询、区队领用查询等信息的语音交互查询,提高了现有物资供应系统的智能化和管理效率,实现了信息共享,改变了效率低下的工作方式,改变了现有物资人工查询的繁琐操作方式,通过人机对话即可获得相关查询信息提高企业效益。 【附图说明】 [0026] 图1为本实用新型一体机的结构示意图。 [0027] 其中:1.显示屏;2.喇叭;3.话筒;4.处理器;5.外壳。 【具体实施方式】 [0028] 下面结合附图和具体实施方式对本实用新型进行详细说明。 [0029] 本实用新型还公开了基于Self-Attention机制的煤矿物资管理对话装置,装置为服务器,包括存储模块、输入模块、处理模块和转换模块。各模块相互配合,使得服务器利用用户终端输入的问题和答案通过Self Attention机制建立模型,当服务器接收到用户终端发送的查询煤矿剩余物资的语音请求后,服务器将语音请求转化为文字请求,并将文字请求通过模型输出对应的查询答案发送给用户终端。 [0030] 存储模块用于用户终端输入有关煤矿剩余物资的问题和答案;用户终端在存储模块内创建并存储每个煤矿剩余物资的多个问题qm和每个煤矿剩余物资的答案yn,其中,m≥n,且每个yn都有对应的qm,一个或多个qm对应一个yn。 [0031] 输入模块用于监听用户终端识别查询煤矿剩余物资的语音请求,并将语音请求发送至处理模块;因为煤矿的环境恶劣,因此语音输入较为适用,工作人员需要通过口头表达即可,无须手动操作,操作方便。 [0032] 处理模块用于接收输入模块的的语音请求,还用于将语音请求翻译为文字请求,通过语音转换云服务,将语音信息转换为文字,处理模块充分的利用了大数据的信息,保证翻译的准确度,进而保证查询答案的准确度,处理模块将翻译的文字请求发送给转换模块。 [0033] 转换模块利用存储模块中的问题和答案通过Self Attention机制建立并训练模型,转换模块将所有的qm形成文件Q,将所有的yn形成文件Y;文件Q中的每一个问题基于self-attention的卷积神经网络,得到每一个问题的答案预测值特征向量i;文件Q中的所有问题的答案预测值特征向量i的集合为I;将文件Y中的每一个答案构建一个字典,按照每一个单词在字典中的顺序,得到该答案的特征编码向量ri,文件Y中的所有答案的特征编码向量ri的集合为r;通过式(1)计算出集合I中的第i项的预测分布概率;通过式(2)计算集合I中的第i项的预测分布概率与文件Y中第i项的特征编码向量的相关度;通过梯度下降法迭代求解,得到最小的Loss值,确定I的最优解X,得出对应的基于self-attention机制的卷积神经网络的权值,在转换模块接收到文字请求后,将文字请求通过模型输出对应的查询答案发送给用户终端。 [0034] 服务器的对话方法为:服务器利用用户终端输入的问题和答案通过Self Attention机制建立模型,当服务器接收到用户终端发送的查询煤矿剩余物资的语音请求后,服务器将语音请求转化为文字请求,并将文字请求通过模型输出对应的查询答案发送给用户终端,其中,语音请求为查询煤矿剩余物资的请求,煤矿剩余物资包括煤矿物资的供应商、区队领用信息、物资验收信息,送货通知单信息、仓库配送信息、物资库存信息、台账信息、到货验收记录信息等。 [0035] 本实用新型针对现有煤矿在物资管理方面存在的问题,并对煤矿物资供应管理系统进行了具体分析,结合目前发展迅速的人工智能技术,提出了基于Self-Attention机制的煤矿物资管理对话装置、系统及其一体机,Self-Attention机制是深度学习中的一种机制,通过该机制可以更准确的识别出用户终端意图。通过解码器输出对应的SQL语句簇; Encoder-Decoder即编码-解码器,是深度学习领域中的一种研究模式,所谓编码就是把输入序列转化成一个固定长度的向量,即中间语义向量;解码就是将编码生成的中间语义向量转化成最终的输出向量。在Encoder-Decoder框架中,采用RNN和CNN是主要的解决方式,其中encoder和decoder连接采用的是Self Attention机制来表达输入与输出之间的全局依赖关系,用来降低了整体计算复杂度,实现并行化。先对输入中文文本进行编码,通过Self Attention机制连接编码器与解码器,最终通过解码器输出对应的SQL语句簇。 [0036] 服务器根据用户终端输入的有关煤矿剩余信息的问题和答案,通过编码器和解码器基于Self Attention机制建立模型,Self-attention机制的对话模型的训练方法由以下步骤组成: [0037] 步骤1:创建并存储每个煤矿剩余物资的多个问题qm和每个煤矿剩余物资的答案yn,其中,m≥n,且每个yn都有对应的qm,一个或多个qm对应一个yn。该步骤是为了创建语料,制作训练数据集,针对煤矿企业开发的,目前针对煤矿企业的语料数据还未出现,因此需要创建与煤矿企业相匹配的语料库用于训练模型,创建语料库需要的信息包括煤矿物资的供应商、区队领用信息、物资验收信息,送货通知单信息、仓库配送信息、物资库存信息、台账信息、到货验收记录信息等。 [0038] 手动创建语料过程如下: [0039] 首先,选取贴合口语化的提问方式作为模板,下面以物资库存查询为例进行陈述。 [0040] 表1物资库存查询部分提问模板 [0041] [0042] [0043] 步骤2:将所有的qm形成文件Q,将所有的yn形成文件Y; [0044] 其次,使用java生成txt文件形式的语料库,其中question.txt存放提问问题,即qm中的某一问题;answer.txt存放答案,即yn中的某一答案;且answer.txt和question.txt两个文件的相同行号的“问题”与“答案”是一一对应的。如下表所示: [0045] 表2部分语料数据 [0046] 序号 question.txt answer.txt 1 给我查一下挂锁还有多少库存 挂锁库存 2 挂锁还有多少 挂锁库存 3 看一看挂锁还有多少 挂锁库存 4 查查挂锁还有没有 挂锁供应商 [0047] 对于其他数据类型的查询,从爬取的“问题”中筛选适合应用场景的模板,以类似创建查询物资库存“问题-答案”的方式,将问题写入question.txt文本文件,即文件Q,答案写入answer.txt文本文件,即文件Y。 [0048] 步骤3:将文件Q中的每一个问题基于self-attention的卷积神经网络,得到每一个问题的答案预测值特征向量i,文件Q中的所有问题的答案预测值特征向量i的集合为I。 [0049] 其中,得到集合I的步骤如下: [0050] 将文件Q中的每一个问题分别分词并构建字典,并根据再字典中出现的顺序构建one-hot的特征向量,将该特征向量送入基于self-attention的卷积神经网络,通过逐层特种抽取,最后得到对输入语句的答案预测值特征编码向量i。 [0051] 步骤4:将文件Y中的每一个答案构建一个字典,按照每一个单词在字典中的顺序,得到该答案的特征编码向量ri,文件Y中的所有答案的特征编码向量ri的集合为r。 [0052] 其中,得到特征编码向量集合r的步骤如下: [0053] 将文件Y中的每一个答案分别分词并构建字典,并根据再字典中出现的顺序构建one-hot的特征向量,得到该答案的特征编码向量ri。 [0054] 步骤5:通过式1计算出集合I中的第i项的预测分布概率 [0055] [0056] 其中:i代表某一个问题的答案预测值特征向量;j代表文件Q中的所有问题的答案预测值特征向量i的个数;Si代表集合I中的第i项的预测分布概率。 [0057] 步骤6:通过式2计算Si与ri的相关度 [0058] Loss=-∑iri ln Si (2) [0059] 其中:Loss代表Si与ri的交叉熵函数;ri表示文件Y中第i项的特征编码向量。损失函数loss function是用来估量模型的集合I中的第i项的预测分布概率与文件Y中第i项的特征编码向量的不一致程度,即相关度,它是一个非负实值函数,损失函数越小,模型的鲁棒性就越好。 [0060] 步骤7:通过梯度下降法迭代求解,得到最小的Loss值,确定I的最优解X,得出对应的基于self-attention机制的卷积神经网络的权值。通过不断优化网络,降低损失函数,根据损失函数计算的相关度通过梯度反向传播的方式,指导深度网络权值的更新优化重复步骤6直至损失函数计算的误差趋近最小值。 [0061] 本实用新型中服务器的对话方法为:服务器利用用户终端输入的问题和答案通过Self Attention机制建立模型,当服务器接收到用户终端发送的查询煤矿剩余物资的语音请求后,服务器将语音请求转化为文字请求,并将文字请求通过模型输出对应的查询答案发送给用户终端。 [0062] 用户终端的对话方法为:用户终端根据自己的需求,向服务器发送语音请求,语音请求为查询煤矿剩余物资的请求,语音请求经过服务器利用用户终端输入的问题和答案通过Self Attention机制建立模型后,输出对应的查询答案发送给用户终端。 [0063] 本实用新型还公开了基于Self-Attention机制的煤矿物资管理对话装置,装置为用户终端,包括发送模块和显示模块,发送模块用于用户终端向服务器发送语音请求,显示模块用于接收服务器的查询答案,并将查询答案展示给用户终端。 [0064] 本实用新型还公开了基于Self-Attention机制的煤矿物资管理对话系统,包括服务器端和用户终端,服务器端包括存储模块、输入模块、处理模块和转换模块。各模块相互配合,使得服务器利用用户终端输入的问题和答案通过Self Attention机制建立模型,当服务器接收到用户终端发送的查询煤矿剩余物资的语音请求后,服务器将语音请求转化为文字请求,并将文字请求通过模型输出对应的查询答案发送给用户终端,用户终端包括发送模块和显示模块。 [0065] 存储模块用于用户终端输入有关煤矿剩余物资的问题和答案;用户终端在存储模块内创建并存储每个煤矿剩余物资的多个问题qm和每个煤矿剩余物资的答案yn,其中,m≥n,且每个yn都有对应的qm,一个或多个qm对应一个yn。 [0066] 输入模块用于监听用户终端识别查询煤矿剩余物资的语音请求,并将语音请求发送至处理模块;因为煤矿的环境恶劣,因此语音输入较为适用,工作人员需要通过口头表达即可,无须手动操作,操作方便。 [0067] 处理模块用于接收输入模块的的语音请求,还用于将语音请求翻译为文字请求,通过语音转换云服务,将语音信息转换为文字,处理模块充分的利用了大数据的信息,保证翻译的准确度,进而保证查询答案的准确度,处理模块将翻译的文字请求发送给转换模块。 [0068] 转换模块利用存储模块中的问题和答案通过Self Attention机制建立并训练模型,转换模块将所有的qm形成文件Q,将所有的yn形成文件Y;文件Q中的每一个问题基于self-attention的卷积神经网络,得到每一个问题的答案预测值特征向量i;文件Q中的所有问题的答案预测值特征向量i的集合为I;将文件Y中的每一个答案构建一个字典,按照每一个单词在字典中的顺序,得到该答案的特征编码向量ri,文件Y中的所有答案的特征编码向量ri的集合为r;通过式1计算出集合I中的第i项的预测分布概率;;通过式2计算集合I中的第i项的预测分布概率与文件Y中第i项的特征编码向量的相关度;通过梯度下降法迭代求解,得到最小的Loss值,确定I的最优解X,得出对应的基于self-attention机制的卷积神经网络的权值,在转换模块接收到文字请求后,将其通过模型输出对应的查询答案发送给用户终端。 [0069] 用户终端包括发送模块和显示模块,发送模块用于用户终端向服务器发送语音请求,显示模块用于接收服务器的查询答案,并将查询答案展示给用户终端。 [0070] 本实用新型还公开了基于Self-Attention机制的煤矿物资管理对话一体机,如图 1所示,包括话筒3,话筒3电性连接于处理器4,话筒3用于用户终端通过语音输入语音请求,并将语音请求发送至处理器4;处理器4为NVIDIA Jetson TX2开发板,利用用户终端输入的问题和答案通过Self Attention机制建立模型,当接收到用户终端的查询煤矿剩余物资的语音请求后,将语音请求转化为文字请求,并将文字请求通过模型输出对应的查询答案发送给显示屏1;显示屏1用于显示查询答案给用户终端,还可以通过喇叭2对用户终端进行播报;处理器4外围还设置有外壳5,外壳5与显示屏1相互配合形成一个封闭空间,封闭空间用于容纳和保护处理器4。 [0071] 该一体机以企业现有的信息管理系统为依托,利用Self-Attention机制实现语音分析及意图识别,实现剩余煤矿物资信息的语音交互查询,提高了现有物资供应系统的智能化和管理效率,实现了信息共享,改变了效率低下的工作方式。与此同时,改变了在物资供应繁琐的操作方式,通过人机对话即可获得相关信息提高企业效益。该一体机利用显示屏1、话筒3、NVIDIA Jetson TX2开发板,结合基于Self-Attention机制构建会话意图识别模型,设备使使用者能够方便的通过语音交互的方式获取自己需要的信息,用户终端在显示屏1上按压输入语音按钮后,NVIDIA Jetson TX2开始监听话筒3信息,NVIDIA Jetson TX2收到语音信息后,通过语音转换云服务,将语音信息转换为文字,通过NVIDIA Jetson TX2上运行的基于self-attention机制的对话模型,识别出用户终端的意图,然后输出对应的查询答案发送给用户终端。