首页 / 一种离线式语音识别电路、PCB板及装置

一种离线式语音识别电路、PCB板及装置有效专利 实用

技术领域

[0001] 本申请涉及语音识别的技术领域,特别涉及一种离线式语音识别电路、PCB板及装置。

相关背景技术

[0002] 随着人工智能技术的不断发展,语音识别技术也得到了广泛的应用。语音控制装置即可以做为智能游戏辅助装置,还可以通过语音来替代键盘、按键或鼠标等输入装置。通过语音命令的方式执行各种操作,如移动、攻击、跳跃、切换武器等,也可以给不方便使用常规输入设备的地方提供输入方案,并可以通过组合和快捷键,让执行效率更高效,如老人不会或不方便使用键盘,需要防水或多尘的使用环境等。它不仅可以实现手指的自由、减少游戏疲劳,还可以增强游戏者的沉浸感和体验感。
[0003] 但是,在现有技术中,语音识别装置一般都需要实时网络的接入,在没有网络接入的情况下,语音识别装置的部分功能就不能够使用,语音识别的准确性和灵敏度也会大打折扣,导致游戏体验感欠佳。实用新型内容
[0004] 本申请为了解决背景技术中所述的现有的语音识别系统在离线的环境下准确性和灵敏度较差的技术问题,提供了一种离线式语音识别电路、PCB板及装置。
[0005] 第一方面,本申请提供了一种离线式语音识别电路,包括:
[0006] 采集模块,用于采集用户的语音指令;
[0007] 预处理模块,用于对所述采集模块采集到的语音进行预处理;
[0008] 识别模块,包括MCU芯片,所述MCU芯片用于将所述预处理模块传输的语音数据转化为文本指令;以及
[0009] 指令传输模块,包括处理芯片,所述处理芯片用于将所述识别模块识别到的文本指令离线传输给目标设备,以实现语音指令控制目标设备。
[0010] 在一些优选的实施例中,所述指令传输模块设置有蓝牙模块和USB接口。
[0011] 在一些优选的实施例中,所述处理芯片的型号为CH582M。
[0012] 在一些优选的实施例中,所述采集模块包括麦克风。
[0013] 在一些优选的实施例中,所述预处理模块包括第一电阻、第二电阻、第三电阻、第一电容和第二电容,所述麦克风的正极通过第一电容与所述MCU芯片的第一信号端连接,负极通过第二电容与所述MCU芯片的第一信号端连接;所述MCU芯片的检测端通过第一电阻与所述麦克风的正极连接;所述第二电阻连接在所述麦克风的正极与负极之间;第三电阻一端与所述麦克风的负极连接,另一端接地。
[0014] 在一些优选的实施例中,所述MCU芯片的型号为TW‑ASR‑PRO芯片。
[0015] 在一些优选的实施例中,所述电路还包括回声消除模块,所述回声消除模块设置在所述识别模块与所述采集装置之间。
[0016] 在一些优选的实施例中,所述回声消除模块包括第三电容、第四电阻和第五电阻,所述MCU芯片的第三信号端通过依次第三电容和第四电阻与所述采集装置的正极连接;所述第五电阻的一端连接在所述第三电容与第四电阻之间,另一端接地。
[0017] 第二方面,本申请提供一种PCB板,包括如第一方面所述的离线式语音识别电路。
[0018] 第三方面,本申请提供一种离线式语音识别装置,包括如第一方面所述的离线式语音识别电路,或者第三方面所述的PCB板;
[0019] 本申请的有益效果在于:
[0020] 1.本申请通过指令传输模块传输指令来实现语音识别的离线功能。通过离线的采集模块、预处理模块、识别模块对语音数据的处理,最后通过指令传输模块将语音指令传输到目标设备,以此控制目标设备。在离线环境中,本申请具有更高的准确性和灵敏度,可以增强游戏者的沉浸感和体验感。

具体实施方式

[0034] 下面结合附图对本申请的较佳实施例进行详细阐述,以使本申请的优点和特征更易被本领域技术人员理解,从而对本申请的保护范围作出更为清楚的界定。
[0035] 请参照图式,其中相同的组件符号代表相同的组件,本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其它具体实施例。
[0036] 本文所使用的术语“模块”可为在该运算系统上执行的软件或硬件对象。本文所述的不同组件、模块、引擎及服务可为在该运算系统上的实施对象。而本文所述的装置可以在硬件上进行实施,均在本申请保护范围之内。
[0037] 在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0038] 在本申请的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接或可以相互通讯;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
[0039] 实施例一
[0040] 请参阅图1,图1示出了本申请实施例提供的一种离线式语音识别电路的结构示意图。该电路用于语音识别用户的语音指令,并根据语音指令控制目标设备50的动作。该电路包括采集模块10、预处理模块20、识别模块30和指令传输模块40。
[0041] 在本实施中,采集模块10的输出端与预处理模块20的输入端连接。预处理模块20的输出端与识别模块30的输入端连接。识别模块30的输出端与指令传输模块40的输入端连接。指令传输模块40的输出端与外部目标设备50数据连接。
[0042] 其中,采集模块10主要用于采集用户的语音指令。预处理模块20主要用于对采集模块10采集到的语音进行预处理。识别模块30包括MCU芯片U1,MCU芯片U1主要用于建立音频识别模型,通过模型训练将预处理模块20传输的语音信号转化为文本指令,以提成准确率和识别效率。指令传输模块40主要用于将识别模块30识别到的文本指令离线传输给外部目标设备50,以实现输出动作指令控制外部目标设备50。
[0043] 通过上述的结构连接,本申请的工作原理可以为:
[0044] 首先,在用户说话时,采集模块10可以将检测到的声音信号转化为电信号,经过预处理模块20对该电信号进行滤波、放大、降噪等处理以提高语音信号的质量。
[0045] 处理后的语音信号会被传输到识别模块30中,识别模块30会对语音电信号进行数字化处理,将其转换成计算机可以理解的数字信号,此外,识别模块30还会对语音信号进行特征提取,提取出语音信号的频率、能量、语速等特征,这些特征将被用于后续的语音识别。
[0046] 进一步的,MCU芯片U1会根据语音数字信号的特征,将其与预先存储的语音模型进行匹配。语音模型是由大量的语音样本训练得到的,它可以识别出不同的语音单元,如音素、单词、短语等。当语音信号与语音模型匹配成功时MCU芯片U1就会解码输出相应的语音指令或文字信息。
[0047] 最后,指令传输模块40获取MCU芯片U1传输的语音指令或文字信息,并通过蓝牙模块41连接或者USB接口42通讯的方式将指令传输给目标设备50,目标设备50在接收到的指令时做出动作,完成语音控制目标设备50的动作。
[0048] 本申请的识别模块30采用音频识别模型来学习更复杂的语音特征表示,以捕捉到语音信号中的细微差异,从而提高识别的准确性;同时,通过大规模数据的训练,自动学习到不同语音环境下的特征表示,从而具备更好的自适应能力,提高在不同噪声环境下的识别效果。
[0049] 实施例二
[0050] 在上一实施例的基础上,本实施例的不同点在于:
[0051] 请参考图2‑4,图2示出了本申请实施例提供的采集模块10和预处理模块20的电路图。
[0052] 图3示出了本申请实施例提供的识别模块30的电路图。
[0053] 图4示出了本申请实施例提供的指令传输模块40的电路图。
[0054] 本实施例的采集模块10可以设置为麦克风11。
[0055] 在本实施例中,预处理模块20包括第一电阻R1、第二电阻R2、第三电阻R3、第一电容C1和第二电容C2,麦克风11的正极通过第一电容C1与MCU芯片U1的第一信号端U1_MICP L连接,负极通过第二电容C2与MCU芯片U1的第二信号端U1_MICN L连接。MCU芯片U1的检测端U1_MICBIAS通过第一电阻R1与麦克风11的正极连接。第二电阻R2连接在麦克风11的正极与负极之间;第三电阻R3一端与麦克风11的负极连接,另一端接地。第一电阻R1、第二电阻R2、第三电阻R3、第一电容C1和第二电容C2共同配合会对电信号进行滤波、放大、降噪等处理。
[0056] 在本实施例中,MCU芯片U1可以为TW‑ASR‑PRO型号的芯片。识别模块30设置有多个电容和电阻与MCU芯片U1连接,具体见图3。设置有多个电容可以起到滤波、隔离、耦合的作用,稳定电路的工作和减少噪声干扰。电阻可以限制MCU芯片U1引脚电流的流动,调整电路的阻抗和分压比,以及提供电路的保护。
[0057] 在本实施例中,指令传输模块40包括处理芯片U2、蓝牙模块41和USB接口42,处理芯片U2的信号接收端组U2_UAPT1 RX、U2_UAPT1 TX与识别模块30的信号输出端组U1_UAPT0 RX、U1_UAPT0 TX数据连接,第一信号输出端U2_34与蓝牙模块41连接,第二信号输出端U2_14、U2_13与USB接口42连接。处理芯片U2主要通过蓝牙模块41或USB接口42与目标设备50数据连接,可以通过蓝牙或者USB协议发送相应的控制命令来实现设备的远程控制。
[0058] 在本实施例中,USB接口42也可以替换成其他具有通讯功能的串口。
[0059] 在本实施例中,处理芯片U2的型号为CH582M系列型号的芯片。
[0060] 请参考图5,图5示出了本申请实施例提供的回声消除模块60的电路图。
[0061] 在一些优选地实施例中,电路还可以包括回声消除模块60。回声消除模块60主要用于识别并抑制回声信号,以便更清晰地使MCU芯片U1接收和传输语音信号。回声消除模块60包括第三电容C3、第四电阻R4和第五电阻R5,MCU芯片U1的第三信号端U1_MICP_R依次通过第三电容C3和第四电阻R4与外部扬声器的正极SPKL+连接。第五电阻R5的一端连接在第三电容C3与第四电阻R4之间,另一端接地。
[0062] 通过上述的结构连接,本申请实施例的工作可以为:
[0063] 首先,在用户说话时,麦克风11可以将检测到的声音信号转化为电信号,经过预处理模块20对该电信号进行滤波、放大、降噪等处理以提高语音信号的质量。
[0064] 处理后的语音信号会被传输到MCU芯片U1中,MCU芯片U1会对语音电信号进行数字化处理,将其转换成计算机可以理解的数字信号,此外,MCU芯片U1还会对语音信号进行特征提取,提取出语音信号的频率、能量、语速等特征,这些特征将被用于后续的语音识别。
[0065] 进一步的,MCU芯片U1会根据语音数字信号的特征,将其与预先存储的语音模型进行匹配。语音模型是由大量的语音样本训练得到的,它可以识别出不同的语音单元,如音素、单词、短语等。当语音信号与语音模型匹配成功时MCU芯片U1就会解码输出相应的语音指令或文字信息。
[0066] 最后,处理芯片U2获取MCU芯片U1传输的语音指令或文字信息,并通过蓝牙连接或者USB接口42通讯的方式将指令传输给目标设备50,目标设备50在接收到的指令时做出动作,完成语音控制目标设备50的动作。
[0067] 实施例三
[0068] 本申请提供一种PCB板,其包括实施例一或实施例二中所述的离线式语音识别电路。
[0069] 实施例四
[0070] 如图6所示,图6为本申请实施例提供的一种离线式语音识别装置的结构示意图。
[0071] 本申请提供一种离线式语音识别装置a,其包括如实施例一或实施例二所述的离线式语音识别电路b,或者包括有实施例三所述的PCB板。
[0072] 上面结合附图对本申请的实施方式作了详细说明,但是本申请并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本申请宗旨的前提下作出各种改变。

当前第1页 第1页 第2页 第3页
相关技术
板装置相关技术
电路板相关技术
杨志豪发明人的其他相关专利技术