技术领域
[0001] 本发明涉及对话机器人技术领域,具体涉及一种对话机器人的对话方法及其对话系统。
相关背景技术
[0002] 对话机器人,又称聊天机器人,或者问答系统,是指能够让人和机器之间,使用自然语言的方式进行沟通交流的软件系统。随着以深度学习为代表的人工智能技术的进步,对话机器人系统,迎来了新一轮的发展热潮。对话机器人一定程度上已经能够理解来自用户的自然语言问题所表达的真实语义,甚至可以结合对话过程中的上下文信息,从而给出最合适的答案。正因为此,对话机器人,已经开始在人们的工作和生活中扮演越来越重要的角色;现有的一种对话机器人的对话方法及其对话系统应用在企业的服务大厅,例如银行,通过在企业的服务大厅中设置对话机器人供给对话用户进行智能对话,但是对话机器人一次只能服务一个用户,而服务大厅中的人员通常有很多,现有的通过面部采集和唤醒口令进行服务对象锁定,这样的方式如果同一时间有多个对象都想要对话服务时,对话机器人采集到的面部采集和唤醒口令的对话用户可能有多个,这将导致对话机器人锁定的服务对象不准确情况的发生,且服务大厅内各个区域的噪声环境不一样,现有的在提供对话服务时,没有基于各个区域的噪声环境选定合适的对话区域,这将可能导致从环境噪声中区分和识别当前锁定对话用户的难度不低,降低对话服务的效率和质量;
为了解决上述问题,本发明提出了一种解决方案。
具体实施方式
[0010] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0011] 如图1、2所示,一种对话机器人的对话方法及其对话系统,包括跟踪锁定模块、分析引导模块和对话服务模块;所述跟踪锁定模块用于对服务大厅内向对话机器人寻求对话服务的对话用户进行跟踪锁定,所述跟踪锁定模块包括信息采集单元和跟踪锁定单元,在本实施例中,所述服务大厅内设有等候区域;
所述信息采集单元包括对话机器人,所述信息采集单元对当前服务大厅内面对对话机器人说出唤醒口令的多个对话用户的面部图像数据、服装特征数据和唤醒音频数据进行采集并依据其生成当前时刻的唤醒信息数据,所述对话用户指代的是寻求对话服务的用户,一个所述对话用户的服装特征数据包括该对话用户的衣领形状、颜色和纹理,一个所述对话用户的唤醒音频数据指代的是该对话用户说出唤醒口令的音频数据,所述唤醒口令是由对话机器人的维护人员提前输入到对话机器人中的,在本实施例中,所述对话机器人的唤醒口令是连续说出其名字两次,所述对话机器人上搭载有高清摄像头、语音接收设备和噪声传感器;
这里需要说明的是,面对机器人说出唤醒口令的多个对话用户指代的是在对话机器人摄像头视窗范围内的所有对话用户;
所述信息采集单元将当前时刻的唤醒信息数据传输到跟踪锁定单元,所述跟踪锁定单元接收到信息采集单元传输的当前时刻的唤醒信息数据后按照预设跟踪锁定规则确定当前对话机器人的锁定对象,并生成当前对话机器人的锁定对象数据,具体如下:
步骤S11:获取当前时刻唤醒信息数据中包含的所有对话用户,依次标记为A1、A2、...、Aa,a≥1;
步骤S12:基于对话用户A1的面部图像数据获取采集到的对话用户A1的人脸面部的面积B1,并计算获取采集对话用户A1面部图像数据时其脸部与对话机器人搭载的高清摄像头的间隔距离C1;
步骤S13:基于对话用户A1唤醒音频数据,通过分析音频信号在不同频率上的能量分布,计算获取对话用户A1与对话机器人搭载的语音接收设备的间隔距离D1;
步骤S14:利用公式 计算获取对话用户A1的锁定评估指
数E1,这里需要说明的是锁定评估指数为人为定义,用以衡量对话用户A1是否具备跟踪锁定的条件评估指数,所述α1和α2为预设的占比系数;
步骤S15:按照步骤S11到步骤S14计算获取对话用户A1、A2、...、Aa的锁定评估指数E1、E2、...、Ea并获取其中最大值Emax,将Emax对应的对话用户确定为当前对话机器人的锁定对象;
所述跟踪锁定单元获取Emax对应的对话用户的面部图像数据、服装特征数据和唤醒音频数据后依据其生成当前对话机器人的锁定对象数据,将其传输到对话服务模块,所述跟踪锁定单元生成服务引导指令并将其传输到分析引导模块;
这里需要说明的是,若当前时刻唤醒信息数据只包含一个对话用户,则直接依据该对话用户的面部图像数据、服装特征数据和唤醒音频数据生成当前对话机器人的锁定对象数据并将其传输到对话服务模块;
所述对话服务模块,用于向对话用户提供对话服务,所述对话服务模块包括辅助处理单元和对话服务单元;
所述对话服务模块接收到跟踪锁定单元传输的当前对话机器人的锁定对象数据后将其传输到辅助处理单元,所述辅助处理单元接收到对话服务模块传输的当前对话机器人的锁定对象数据后依据其内携带的唤醒音频数据获取当前对话用户的声纹特征数据,对其进行存储;
所述对话用户的声纹特征数据包括频谱特征、声调特征、共振峰特征和时长特征,所述频谱特征包括声音的频率分布和能量分布数据,所述共振峰特征:声音在声道中的传播会引起共振,共振峰的频率和幅度可以用于识别声纹,所述声调特征指代的是声音的音高和抑扬变化特征,所述时长特征指代的是唤醒音频数据中对话用户的发音时长和停顿时长数据;
所述分析引导模块用于将当前对话用户引导到最佳位置进行对话服务,所述分析引导模块包括环境分析单元和服务引导单元;
所述分析引导模块接收到跟踪锁定单元传输的服务引导指令后将其传输到环境分析单元,所述环境分析单元接收到分析引导模块传输的服务引导指令后按照预设分析判定规则生成当前时刻最适对话区域,具体如下:
步骤S21:将服务大厅内为对话人员划分的等候区域等分成若干个边长为F1的正方形区域,将其标定为分析区域,并依次标记为G1、G2、...、Gg,g≥1,所述F1为预设数值;
步骤S22:首选选定分析区域G1为主分析区域,将与主分析区域在位置上相邻的分析区域依次重新标定为关联分析区域,标记为E1、E2、...、Ee,1≤e≤4;
步骤S23:按照预设计算规则计算获取主分析区域内的噪声评定特征量N1,预设计算规则如下:
步骤S231:计算获取h个监测周期内主分析区域内的噪声大小,依次标记为H1、H2、...、Hh,h≥1;所述h个监测周期是以当前监测周期开始向过去回溯h个监测周期,所述当前监测周期是从当前时刻开始向过去回溯P1时间,所述P1为预设的监测时长;
步骤S232:利用公式 计算获取h个监测周期内主分析区域内噪
声大小的离差Y1,将Y1和Y进行大小比较,此处H表示为Hi的均值,所述Y为预设数值;
若Y1≥Y,则按照|Hi‑H|从大到小的顺序依次选中对应的Hi,每选中一个将其删除,删除后重新计算剩余Hi的离散值Y1,并再次将Y1和Y进行大小比较,直至Y1步骤S233:并在删除的Hi中获取所有大于噪声均值J1的噪声大小,依次标记为K1、K2、...、Kk,h>k≥1并利用加和求平均公式计算获取其均值,将其均值重新标定为主分析区域的高噪声均值,标记为L1,利用公式M1=Kmax‑L1计算获取主分析区域的高噪声极差值M1,所述Kmax为K1、K2、...、Kk中的最大值;
步骤S234:利用公式 计算获取主分析区域的噪声评定特征量N1;
步骤S24:按照步骤S23分别计算获取关联分析区域E1、E2、...、Ee的噪声评定特征量O1、O2、...、Oe;
步骤S25:利用公式 计算获取主分析区域基于
关联区域的筛选评定值R1,所述Q1为当前时刻主分析区域内的人数,所述β1和β2为预设调节数值;
步骤S26,按照步骤S22依次选定分析区域G1、G2、...、Gg为主分析区域,依次计算获取分析区域G1、G2、...、Gg基于关联区域的筛选评定值R1、R2、...、Rg;
将基于关联区域的筛选评定值Rmin对应的分析区域位于服务大厅等候区的位置重新标定为当前时刻最适对话区域;
所述环境分析单元将当前时刻最适对话区域传输到服务引导单元,所述服务引导单元接收到环境分析单元传输的当前时刻最适对话区域后引导该对话人员去往当前时刻最适对话区域;
当该对话人员到达当前时刻最适对话区域后,所述服务引导单元生成开始对话指令并将其传输到对话服务模块,所述对话服务模块接收到服务引导单元传输的开始对话指令后将其传输到辅助处理单元;
所述辅助处理单元接收到对话服务模块传输的开始对话指令后实时采集对话机器人周边的环境声音数据并依据其内存储的当前对话用户的声纹特征数据,在采集到的对话机器人周边环境声音数据中识别和区分当前对话人员的一条对话音频数据并将其转换为一条对话文本数据,所述辅助处理单元将转换后的一条对话文本数据传输到对话服务单元,在本实施例中,一条所述对话音频数据的开始和结尾是以当前对话用户说出唤醒指令开始到连续t秒内未发出任何声音结束,所述t为预设时长;
所述对话服务单元包括对话文本数据库,所述对话文本数据库中存储有该服务大厅所有用于向对话用户提供对话服务的文本回复内容数据;在本实施例中,一个所述文本内容数据对应一个对话类别,在本实施例中,基于服务大厅提供的服务内容,将对话类别划分为技术支持类、情感类和账户问题类;
所述对话服务单元接收到辅助处理单元传输的一条对话文本数据后提取该对话文本数据中的关键词和词性,并基于其利用文本分类技术,划定该条对话文本数据的对话类别,基于该条对话文本数据的对话类别,和该条对话文本数据的关键词在对话文本数据库中匹配与相一致的文本回复内容数据,采用语音播报和文字显示的方式同时展现给当前对话用户;
在说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0012] 以上内容仅仅是对本发明所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
[0013] 以上对本发明的一个实施例进行了详细说明,但所述内容仅为本发明的较佳实施例,不能被认为用于限定本发明的实施范围。凡依本发明申请范围所作的均等变化与改进等,均应仍归属于本发明的专利涵盖范围之内。