技术领域
[0001] 本发明涉及语音翻译处理技术领域,特别涉及一种智能车载系统的转译设备及其控制系统。
相关背景技术
[0002] 随着汽车技术与经济的发展,汽车得到了普及,汽车已然成为了人们出行的重要方式之一,随着人工智能的发展,汽车控制也越来越智能化,通过汽车的车载声控系统唤醒语音助手,即可对车辆进行无接触控制,有效提高了汽车驾驶的安全性。
[0003] 随着经济的发展,使得国际之间的交流也越来越紧密,跨国旅游、工作的人越来越多,而汽车现有的车载声控系统主是将汽车所在地的官方语言作为默认语种,驾乘人需要通过默认语种对车载声控系统的语音助手进行唤醒控制,从而导致跨国旅游、工作者除了日常交流困难外,日常出行也出现了问题,虽然现有的汽车控制面板显示文字可以通过选择完成语种切换,但是由于文字不通导致跨国旅游、工作者无法独立完成语种切换设置,而且由于技术的限制,目前大多数语音助手只能识别一种或固定几种语种语音,导致跨国旅游、工作者即使完成控制面板上的语种切换,也可能无法正常使用汽车的车载声控系统对车辆进行控制,减低了驾驶安全性,因此本发明提出一种智能车载系统的转译设备及其控制系统。
具体实施方式
[0068] 以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
[0069] 实施例1:
[0070] 本发明提供一种智能车载系统的转译设备,如图1所示,包括:服务数据终端、麦克风以及扬声器;
[0071] 所述服务数据终端分别与所述麦克风以及扬声器电性连接;
[0072] 所述麦克风用于采集车辆内的实时语音并将所述实时语音发送至服务数据终端;
[0073] 其中,实时语音包括驾乘人语音与车辆语音助手应答语音;
[0074] 所述服务数据终端将实时语音进行识别以及转译,生成转译语音,并发送至扬声器进行播放;
[0075] 其中,转译语音包括目标语种控制语音和转译应答语音;
[0076] 其中,所示服务数据终端上,设置至有两颗三色指示灯,用于显示设备状态;
[0077] 其中,红灯表示设备启动中或异常;
[0078] 绿灯表示设备正常运行,联网状态良好;
[0079] 黄灯表示设备离线或等待连接。
[0080] 本实施例中,转译设备可以放置或者安装至车辆内部的任意位置。
[0081] 上述技术方案的有益效果:本发明通过服务数据终端、麦克风以及扬声器构建一种可以完成多种语言翻译的车载外置翻译终端,所述服务数据终端分别与所述麦克风以及扬声器电性连接;所述麦克风用于采集车辆内的实时语音并将所述实时语音发送至服务数据终端;所述服务数据终端将实时语音进行识别以及转译,生成转译语音,并发送至扬声器进行播放,完成非目标语种的转译工作,帮助驾乘人克服语言不通无法正常使用车载声控系统的问题,同时该转译设备既可以在联网状态下工作也可以在离线状态下工作,及时在信号不好的环境下也可以正常使用,为语言不通发的人的驾乘提供了便利。
[0082] 实施例2:
[0083] 本发明提供一种智能车载系统的转译设备的控制系统,如2所示,包括:语[0084] 音采集模块,用于在确认车辆处于启动状态时,控制麦克风采集车辆内部的实时语音;
[0085] 语音识别模块,用于控制服务数据终端,基于NLP技术对接收到的实时语音进行语种以及语义识别,判断实时语音中是否存在车辆控制唤醒关键词,得到待转译语音;
[0086] 语音转译模块,用于基于待转译语音进行语义识别结果,获得转译文本,结合预设车辆控制语音模板,生成目标语种控制语音;
[0087] 语音交互模块,用于控制服务数据终端对车辆语音助手的应答语音进行转译,获得转译应答语音;
[0088] 播放控制模块,用于控制扬声器对目标语种控制语音或者转译应答语音进行播放。
[0089] 上述技术方案的有益效果:本发明通过语音采集模块在确认车辆处于启动状态时,控制麦克风采集车辆内部的实时语音,然后通过语音识别模块,控制服务数据终端,基于NLP技术对接收到的实时语音进行语种以及语义识别,判断实时语音中是否存在车辆控制唤醒关键词,得到待转译语音,再通过语音转译模块基于待转译语音进行语义识别结果,获得转译文本,结合预设车辆控制语音模板,生成目标语种控制语音,还可以通过语音交互模块控制服务数据终端对车辆语音助手的应答语音进行转译,获得转译应答语音,最后通过播放控制模块控制扬声器对目标语种控制语音或者转译应答语音进行播放,打破语种限制,完成驾乘人预车载声控系统的交互,克服驾乘人语言不通无法正常使用车载声控系统的问题。本发明通过转译设备的多语言转译服务,基于NLP技术对驾乘人进行转译,然后通过播放转译语音唤醒车载声控系统的语音助手,并对语音助手下达控制指令来完成非默认语种的车辆控制,增强车辆的智能化水平,使得驾乘人即使在语言不通的情况下也可以通过语音控制实现车辆的部分功能,显著提升了驾驶安全性,而且转译设备还可以对语音助手的应答语音进行转译播放,实现驾乘人与车载声控系统的智能交互对话,同时,所述转译设备的支持离线和联网两种模式工作,即使在没有网络的情况下也可以完成语音转译任务。
[0090] 实施例3:
[0091] 在实施例2的基础上,语音采集模块,如图3所示,包括:
[0092] 车辆状态检测单元,用于在车门打开后,控制转译设备自动开启,并对车辆内部声音进行监测,当监测到车辆发动机启动声音后,判定给当前车辆为启动状态;
[0093] 采集控制单元,用于在确认车辆启动后,生成人声采集控制指令,发送至人声采集单元;
[0094] 人声采集单元,用于接收到人声控制指令后,控制麦克风陈列切换至人声采集模式,并采集车辆内部的实时语音。
[0095] 上述技术方案的有益效果:本发明通过车辆状态检测单元控制转译设备在车门打开瞬间自动开启,有效确保驾乘人的每一句控制口令都可以被捕捉到,并在确认车辆启动后,通过采集控制单元生成人声采集控制指令,并发送至人声采集单元,开始进行人声采集,实现了对噪音的自动过滤,避免噪音低转译过程的干扰,有效提升转译准确度。
[0096] 实施例4:
[0097] 在实施例语2的基础上,语音识别模块,如图4所示,包括:
[0098] 实时语种识别单元,用于将服务数据终端接收到的实时语音输入至语音识别中心,语音识别中心设置有多语言语种识别模型,对输入的实时语音语种进行识别,确定当前语种;
[0099] 语音对比单元,用于基于当前语种,在预设唤醒语音数据库中,获得对应语种的预设唤醒语音,判断所述当前语种是否为非目标语种,若是,则将实时语音与预设唤醒语音进行对比,判断实时语音中是否存在车辆控制唤醒关键词若存在,则判定所述实时语音为车辆唤醒语音,并将所述车辆唤醒语音作为人机交互起始语音以及待转译语句;
[0100] 同时,在人机交互起始语音上添加临时计时时钟;
[0101] 实时语义识别单元,用于基于语音识别中心设置的多语言语义识别模型对所述人机交互起始语音进行识别,获取驾乘人语义;
[0102] 命令语音甄别单元,用于在所述临时计时时钟到达预设时间前,基于多语言语义识别模型识别驾乘人的第一实时语音,若所述第一实时语音为当前车辆的控制语音,则删除当前临时计时时钟,将所述控制语音作为待转译语音,并在当前车辆的最新控制语音上生成新的临时计时时钟;
[0103] 若在临时计时时钟到达预设时间前,所述多语言语义识别模型没有检测到任何控制语音,则在临时计时时钟到达预设时间时,删除临时计时时钟,并判定当前轮次唤醒控制完成。
[0104] 本实施例中,多语言语种识别模型是通过大量的多种语音数据及其标记结果训练得到的,可以识别出用户输入语音对应的语种,在使用过程中通过大数据技术不断获取新的多种语音数据并对多语音语种识别模型进行深度学习训练,完成多语言语种识别模型的自动更新,使得多语言语种识别模型可以完成多种语种的识别。
[0105] 本实施例中,多语言语义识别模型是通过大量不同语种对应的多种方言数据训练得到的,在使用过程中通过大数据技术不断获取不同语种的新的方言语音数据对多语言语义识别模型进行深度学习训练,完成多语言语义识别模型的自动更新,使得多语言语义识别模型可以完成多种语种的识别。
[0106] 本实施例中,目标语种为语音助手使用的语种,当前语种为实时语音对应的实际语种。
[0107] 本实施例中,多语音既包括多种语种也包括多种语种包含的多种方言。
[0108] 上述技术方案的有益效果:本发明首先通过实时语种识别单元通过多语言语种识别模型对实时语音进行识别,确定实时语音的语种,在实时语音为非目标语种时,基于语音对比单元通过当前语种对应的预设唤醒语音判断实时语音中是存在唤醒关键词,从而判断驾乘人是否存在对车辆进行声控的意向,并将存在唤醒关键词的事实语音作为人机交互起始语音,并在人机交互起始语音上添加临时计时时钟,为单次唤醒语音的有效等待时间的确定提供计时基础;然后通过实时语义识别单元,用于基于语音识别中心设置的多语言语义识别模型对所述人机交互起始语音进行识别,获取驾乘人语义;最后通命令语音甄别单元,在所述临时计时时钟到达预设时间前,基于多语言语义识别模型识别驾乘人的第一实时语音,若所述第一实时语音为当前车辆的控制语音,则删除当前临时计时时钟实现了有效等待时间的自动更新,有效境地语音助手使用过程中的唤醒次数,只要用户在等待有效时间内再次下达指令即使不说出唤醒指令(例如,“嗨,小爱!”、“你好,小新”等)转移设备也可以完成车辆声控指令的识别转译,将所述控制语音作为待转译语音,完成驾乘人声控指令的翻译使得驾乘人即使在语言不通的情况下也可以通过语音控制实现车辆的部分功能,显著提升了驾驶安全性;并在当前车辆的最新控制语音上生成新的临时计时时钟;若在临时计时时钟到达预设时间前,所述多语言语义识别模型没有检测到任何控制语音,则在临时计时时钟到达预设时间时,删除临时计时时钟,并判定当前轮次唤醒控制完成,有效避免语音助手过长等待。
[0109] 实施例5:
[0110] 在实施例语2的基础上,语音转译模块,如图5所示,包括:
[0111] 语音转译单元,用于基于待转译语音对应的语义识别结果,结合目标语种对应的语言逻辑,生成转译文本;
[0112] 文本标准化单元,用于基于语音识别结果,确定驾乘人的控制目的基于控制目的获得对应的语音控制模板,基于语音控制指令模块,对转译文本进行标准化,获得目标语种控制指令文本;
[0113] 文本转化单元,用于基于预设音色结合待转译语音的语调,将目标语种控制指令文本转化目标语种控制语音。
[0114] 上述技术方案的有益效果:本发明首先通过语音转译单元基于待转译语音对应的语义识别结果,结合目标语种对应的语言逻辑,生成转译文本,完成实时语音的语种转化,确保转译文本符合目标语种的使用逻辑,然后通过文本标准化单元基于语音识别结果,确定驾乘人的控制目的基于控制目的获得对应的语音控制模板,基于语音控制指令模块,对转译文本进行标准化,获得目标语种控制指令文本,对语种转化完成的文本进行标准化,确保输出转译文本符合车辆控制的指令逻辑,语音助手听到输出语音后可以快速识别声控指令,并做出响应,提高车辆控制的精准性;最后通过文本转化单元基于预设音色结合待转译语音的语调,将目标语种控制指令文本转化目标语种控制语音,为实现了驾乘人与车载声控系统的智慧对话提供基础。
[0115] 实施例6:
[0116] 在实施例语5的基础上,语音交互模块,如图6所示,包括:
[0117] 应答识别单元,用于将车辆语音助手对应的实时语音进行语义识别,获得应答语音识别结果;
[0118] 交互转译单元,用于根据应答语音识别结果,结合当前语种对应的语言逻辑,生成当前语种对应的转译应答文本,并基于文本转化单元,生成转译应答语音。
[0119] 上述技术方案的有益效果:本发明通过应答识别单元将车辆语音助手对应的实时语音进行语义识别,获得应答语音识别结果,同时还可以通过交互转译单元根据应答语音识别结果,结合当前语种对应的语言逻辑,生成当前语种对应的转译应答文本,并基于文本转化单元,生成转译应答语音,完成了对语音助手的应答语音的转译,为实现驾乘人与车载声控系统的智能交互对话提供基础。
[0120] 实施例7:
[0121] 在实施例语2的基础上,播放控制模块,如图7所示,包括:
[0122] 第一播放单元,用于控制扬声器按照目标播放音量,向车辆语音助手播放目标语种控制语音;
[0123] 第二播放单元,用于控制扬声器按照目标播放音量,向车辆语音助手播放转译应答语音;
[0124] 播放控制单元,用于基于当前麦克风的位置参数以及当前环境噪音数据对扬声器的目标播放音量进行自动调控。
[0125] 上述技术方案的有益效:本发明通过第一播放单元和第二播放单元控制扬声器对目标语种控制语音和转译应答语音的播放音量,增强车辆的智能化水平,使得驾乘人即使在语言不通的情况下也可以通过语音控制实现车辆的部分功能,显著提升了驾驶安全性,实现驾乘人与车载声控系统的智能交互对话,而且在目标语种控制语音或者转译应答语音播放的过程中通过播放控制单元基于当前麦克风的位置参数以及当前环境噪音数据对扬声器的目标播放音量进行自动调控,一方面确保驾乘人以及语音助手在嘈杂的环境下也可以听到转译语音,有效突破转译设备对环境的使用限制,另一方面,由于播放声音的智能调控使得转译翻译器的安装位置不在受到限制。
[0126] 实施例8:
[0127] 在实施例语7的基础上,播放控制单元,包括:
[0128] 智能测试子单元,用于在转译设备安装完成后,自动测试语音向车辆语音助手发送位置确认指令以及音量控制指令,基于车辆语音助手的测试应答语音,确定转译设备与车辆控制台的相对方位;
[0129] 基于转译设备接收到的多个测试应答语音进行声音能量变化,确定转译设备与车辆控制台的相对距离;
[0130] 基于所述相对方位以及相对距离,结合车辆内部空间模型,确定转译设备的安装位置,并生成转译设备的位置参数发送至数据库进行存储;
[0131] 智能监测子单元,用于转译设备的内置声音传感器,获取当前车辆内环境的环境噪音数据;
[0132] 智能调控子单元,用于判断当前转译设备是否处于联网状态,若不是,则基于当前环境噪音大小确定当前环境干扰等级,并基于预设离线调控表,确定所述当前环境干扰等级对应的播放音量,将所述播放音量作为目标播放音量;
[0133] 在当前转译设备是否处于联网状态时,将噪音环境数据以及转移设备的位置参数发送至云端;
[0134] 将转译设备的位置参数与默认安装区域的对应的位置参数进行对比,获得安装位置差异率,基于默认安装区域对应的默认音量和位置安装差异率,获得无干扰播放音量,并将车辆隔离噪音阈值与当前噪音阈值进行对比,获得噪音差异率;
[0135] 根据云端接收到的车辆数据,判断当前车辆是否存在开窗行为;
[0136] 若不存在,则基于噪音差异率,对无干扰播放音量进行修正,获得最佳播放音量,并将所述最佳播放音量作为目标播放音量;
[0137] 若存在,则根据车辆数据,确定当前车辆的开窗位置及其开窗大小,结合为转译设备的位置参数,判断各个开窗位置对转译设备播放声音的影响程度;
[0138] 基于各个开窗位置的影响程度,得到声音损失率,基于声音损失率和噪音差异率,对无干扰播放音量进行修正,获得最佳播放音量,并将所述最佳播放音量作为目标播放音量。
[0139] 本实施例中,判断各个开窗位置对转译设备播放声音的影响程度是指根据开窗位置与转译设备安装位置的远近以及开窗位置与车辆控制台的距离有关,是以驾驶位听到的声音因为准,车型不同车速不同声音损失率会有所差异。
[0140] 以两排轿车为例,后排单个窗户的声音损失率取值在(0,0.15];前排单个窗户的声音损失率取值在(0,0.25];天窗的声音损失率取值在(0,0.2]。
[0141] 本实施例中,根据位置参数与预设的默认安装区域对应的位置参数之间的差异,会对语音助手的应答音量进行调控。
[0142] 上述技术方案的有益效果:本发明通过智能测试子单元的测试数据自动完成了转译设备位置参数的确定,然后通过智能监测子单元实现了对使用环境噪音数据的检测,最后通过智能调控子单元根据转译设备的联网状态作出不同的声音调控策略,有效提升了转译设备的智能化水平,使得所述转译设备的支持离线和联网两种模式工作,即使在没有网络的情况下也可以完成语音转译任务。
[0143] 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。