技术领域
[0001] 本实用新型涉及一种实时语音可视化设备,具体为一种多维语音特征提取实时可视化装置。
相关背景技术
[0002] 语音特征提取是指对语音信号进行分析,将声音转换成计算机可识别的数字序列或向量,提取出具有代表性的特征参数。通常情况下,用于语音识别和声音分类等任务中的语音特征有很多,而对这些多维语音特征进行可视化处理,实现图形化显示,便于数据理解与分析,有利于发现隐藏在语音数据中的现象和规律。
[0003] 现有设备虽能对语音特征进行可视化处理,但无法实现实时的可视化操作,仍需人工提取语音特征进而进行可视化呈现,提取过程所使用的设备复杂,携带、安装不方便,甚至需要组装,导致提取操作繁琐且耗时长,工作效率低,限制了语音数据的分析进程。
具体实施方式
[0018] 为使本实用新型实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本实用新型。
[0019] 图中:1、壳体;2、控制面板;3、充电口;4、USB借口;5、麦克风;6、收纳凹槽;7、选择按键(左/中/右);8、音量旋钮;9、扩音孔;10、显示器;11、电源键;12、声卡;13、中央处理器;14、存储器。
[0020] 如图1所示,一种多维语音特征提取实时可视化装置,包括语音录入、语音特征提取以及语音可视化三个模块。在语音录入模块,利用麦克风采集语音信号,传输给中央处理器。在语音特征提取模块进行语音信号的预处理、多维特征提取以及实时可视化处理。在语音可视化模块,利用显示器将语音特征以图形的形式呈现,完成多维语音特征的实时可视化。
[0021] 图2为本实用新型的结构示意图。如图所示,一种多维语音特征提取实时可视化装置包括:壳体1、控制面板2和显示屏10。所述壳体1为矩形结构,表面嵌有显示屏10和电源键11。所述显示屏10与控制面板2固定连接,用于呈现语音波形图。所述电源键11嵌于壳体表面,位于显示屏10的右下方,用于控制装置的启动与关闭。所述控制面板2上表面装有麦克风5,用于语音信号采集。进一步的麦克风5与收纳凹槽6相连,可直立放置,旋转调整方向,也可平放于收纳凹槽6内。音量旋钮08位于麦克风5的右侧,左右旋转即可控制播放音频音量的大小。进一步的,控制面板2表面设有三个选择按键7,分别控制录音及语音信号处理功能的开始/暂停、文件的选择/确认。进一步的,控制面板2的正面设有排列整齐的扩音孔9,用于播放所录制的音频。进一步的,控制面板2的右侧面设有充电口3与USB接口4。进一步的,USB接口4用于传输音频数据到计算机等智能设备。进一步的,控制面板2内部设有声卡
12、中央处理器13和存储器14。所述声卡12用于将音频信号转换为数字信号。所述中央处理器13用于提取语音特征和语音信号可视化处理。所述存储器14用于存储语音数据和图像数据。
[0022] 工作原理:在使用本装置时,点击电源键11启动装置后,单机选择按键7(中)开始录制音频,通过麦克风5收集语音信号并将其传输至主体内部的中央处理器,进一步进行实时语音特征提取与可视化处理。通过显示屏10呈现可视化处理结果。点击选择按键7,选择和控制音频文件,通过扩音孔9进行播放。播放时可旋转音量旋钮8调整音频音量的大小。USB接口4支持将原始音频文件及可视化处理后的文件传输至计算机等外部智能设备。
[0023] 以上所述,仅为本实用新型具体实施方式的部分示例,并不将本实用新型局限于所公开的形式。任何熟悉本技术领域的技术人员在本实用新型揭露的技术范围内,根据本实用新型的技术方案及构思加以同等替换或改变,都应涵盖在本实用新型的保护范围内。
[0024] 以上,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。