技术领域
[0001] 本实用新型实施例涉及语音处理技术领域,具体涉及一种多路语音信号传输和接收处理设备及系统。
相关背景技术
[0002] 随着语音处理技术的发展,语音已在通信、汽车、家电、家庭服务、医学等各个领域有了广泛应用,在音频处理过程中,常常需要在不同设备间传输多路音频信号。以车机接收和处理多路音频信号为例,首先需要接收多路麦克风录制的音频信号,然后经过增益、模数转换、降噪、数模转换等处理后将录制的每路音频传给至车机做下一步处理。现有方法需要对每路音频信号分别进行增益、模数转换、降噪、数模转换等处理,非常消耗软硬件资源;另外,由于传输至车机的是多路音频信号,因此要求车机必须有多路音频接收接口,否则,车机就无法接收多路音频信号。
[0003] 以两路音频信号在不同设备间传输为例(多路音频传输和处理也是类似处理),如图1所示,包括传输设备一和接收设备二,两个设备主要包括8个模块,传输设备一接收多路音频信号,然后经过一系列内部模块处理,最后将多路音频信号传输至接收设备二。传输设备一包括麦克风接收模块、增益器、模数转换器、算法处理模块、数模转换器、增益器,其中增益器、算法处理模块、增益器不是必须的,可以按照实际需要增加或减少。
[0004] 两路麦克风分别接收外部声音信号,然后将声音信号转换成电信号传给对应的增益器;增益器首先放大或衰减(根据实际需要放大或衰减)从麦克风接收到的声音信号,然后传给模数转换器;模数转换器把从增益器接收的模拟信号转换为数字信号,然后传输给算法处理模块;算法处理模块对接收到的数字信号进行处理,例如降噪、回声消除、声源定位等,如果不需要对数字信号进行处理,这个模块也可以删除,这里不做限制,然后转给数模转换器;数模转换器将接收的数字信号转换成模拟信号,然后传输给增益器;增益器放大或衰减接收的模拟信号。
[0005] 传输设备一将增益器的输出信号传输至接收设备二,接收设备二的模数转换器分别接收两路语音信号,然后将模拟信号转换为数字信号,接着将数字信号传输至应用模块;应用模块接收模数转换器输出的两路信号后根据实际的需求将音频传输给相关应用。
[0006] 如果用现有方法实现两路音频信号传输,传输设备一需要两个数模转换器和两个增益器,而接收设备二必须要有两路音频信号接收接口以及两个模数转换器,若传输多路音频信号,则需要多组模块,系统设计成本很高。另外,若接收设备二只支持单路音频输入,则需要重新设计设备二的接收接口以将单路音频输入改成多路音频输入,大大提高了成本。实用新型内容
[0007] 由于现有技术存在上述问题,本实用新型实施例提出一种多路语音信号传输和接收处理设备及系统。
[0008] 第一方面,本实用新型实施例提出一种多路语音信号传输处理设备,包括:多路时域频域信号转换模块、多路频域信号叠加模块和单路频域时域信号转换模块;
[0009] 所述多路时域频域信号转换模块、所述多路频域信号叠加模块和所述单路频域时域信号转换模块依次串行连接;
[0010] 其中,所述多路时域频域信号转换模块接收输入的多路时域信号后,将各路时域信号分别转换为对应的频域信号,并将多路频域信号输出至所述多路频域信号叠加模块;
[0011] 所述多路频域信号叠加模块接收输入的多路频域信号后,将多路频域信号进行叠加处理,得到叠加后的单路频域信号,并将所述单路频域信号输出至所述单路频域时域信号转换模块;
[0012] 所述单路频域时域信号转换模块接收输入的所述单路频域信号后,将所述单路频域信号转换为单路时域信号,并将所述单路时域信号进行输出。
[0013] 可选地,还包括:若干个预处理模块;
[0014] 所述若干个预处理模块分别用于对外部输入的原始语音信号进行预处理,并将预处理后的语音信号输入至多路时域频域信号转换模块;
[0015] 每个预处理模块包括:一个麦克风;
[0016] 每个麦克风用于接收外部输入的原始语音信号。
[0017] 可选地,所述多路时域频域信号转换模块包括若干个模数转换器;
[0018] 每个模数转换器用于对所述外部输入的原始语音信号进行模数转换,并将模数转换后的语音信号输出至所述多路频域信号叠加模块。
[0019] 可选地,所述多路时域频域信号转换模块包括若干个增益器;
[0020] 每个麦克风和对应的增益器、模数转换器依次串行连接;
[0021] 每个增益器用于对接收的信号进行增益放大。
[0022] 可选地,还包括:算法处理模块;
[0023] 所述算法处理模块用于对接收的模数转换器输出的语音信号进行算法处理,并将算法处理后的多路语音信号输出至所述多路频域信号叠加模块。
[0024] 可选地,所述单路频域时域信号转换模块包括一个数模转换器;
[0025] 所述数模转换器用于将所述多路频域信号叠加模块输出的所述模数转换后的语音信号的数字信号转换为模拟信号。
[0026] 可选地,所述单路频域时域信号转换模块还包括一个增益器;
[0027] 所述增益器和所述数模转换器连接,用于对接收的信号进行增益放大。
[0028] 第二方面,本实用新型实施例还提出一种多路语音信号接收处理设备,包括:单路时域频域信号转换模块和单路频域信号分离模块;
[0029] 所述单路时域频域信号转换模块和所述单路频域信号分离模块连接;
[0030] 其中,所述单路时域频域信号转换模块接收输入的单路时域信号后,将所述单路时域信号转换为单路频域信号,并将所述单路频域信号输出至所述单路频域信号分离模块;
[0031] 所述单路频域信号分离模块接收输入的所述单路频域信号后,将所述单路频域信号进行分离处理,得到分离后的多路频域信号,并将所述多路频域信号进行输出。
[0032] 可选地,还包括:一个增益器;
[0033] 所述增益器和所述单路时域频域信号转换模块连接,用于对接收的信号进行增益放大后,输出至所述单路时域频域信号转换模块。
[0034] 可选地,还包括:应用模块;
[0035] 所述应用模块用于对所述单路频域信号分离模块输出的所述多路频域信号进行处理。
[0036] 第三方面,本实用新型实施例还提出一种多路语音信号处理系统,包括上述多路语音信号传输处理设备,以及上述多路语音信号接收设备。
[0037] 由上述技术方案可知,本实用新型实施例通过将多路时域频域信号转换模块、多路频域信号叠加模块和单路频域时域信号转换模块依次串行连接,能够将输入的多路时域信号转换为单路时域信号输出,避免在多路语音信号处理时采用多组数模转换器和增益器;同时通过单路时域频域信号转换模块、单路频域信号分离模块和多路频域时域信号转换模块依次串行连接,能够将输入的单路时域信号转换为多路时域信号输出,避免在多路语音信号接收时采用多个模数转换器,大大节省成本。
具体实施方式
[0045] 下面结合附图,对实用新型的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本实用新型的技术方案,而不能以此来限制本实用新型的保护范围。
[0046] 图2示出了本实施例提供的一种多路语音信号传输处理设备,包括:多路时域频域信号转换模块201、多路频域信号叠加模块202和单路频域时域信号转换模块203;
[0047] 所述多路时域频域信号转换模块201、所述多路频域信号叠加模块202和所述单路频域时域信号转换模块203依次串行连接;
[0048] 其中,所述多路时域频域信号转换模块201接收输入的多路时域信号后,将各路时域信号分别转换为对应的频域信号,并将多路频域信号输出至所述多路频域信号叠加模块202;
[0049] 所述多路频域信号叠加模块202接收输入的多路频域信号后,将多路频域信号进行叠加处理,得到叠加后的单路频域信号,并将所述单路频域信号输出至所述单路频域时域信号转换模块203;
[0050] 所述单路频域时域信号转换模块203接收输入的所述单路频域信号后,将所述单路频域信号转换为单路时域信号,并将所述单路时域信号进行输出。
[0051] 具体的,本实施例提供了一种将多路时域信号转换为单路时域信号输出的设备,所述多路时域频域信号转换模块201、所述多路频域信号叠加模块202和所述单路频域时域信号转换模块203均采用硬件实现,例如多路时域频域信号转换电路、多路频域信号叠加电路和单路频域时域信号转换电路,节省了设备中其它软硬件资源。
[0052] 其中,多路时域频域信号转换模块210主要使用ADC模数转换芯片,ADC模数转换芯片的作用是将时间连续、幅值也连续的模拟量转换为时间离散、幅值也离散的数字信号,ADC数模转换芯片包括取样器、保持器、量化器及编码器4个部件和过程。
[0053] 多路频域信号叠加模块202主要使用ARM处理器,该处理器可实现多路频域信号叠加模块算法的运行、处理和输出,最终获得单路的频域信号。
[0054] 单路频域时域信号转换模块203主要使用DAC数模转换芯片,DAC数模转换芯片的作用是将时间离散、幅值也离散的数字信号转换为时间连续、幅值也连续的模拟信号,DAC数模转换芯片基本上由4个部分组成,即权电阻网络、运算放大器、基准电源和模拟开关。
[0055] 本实用新型实施例通过将多路时域频域信号转换模块、多路频域信号叠加模块和单路频域时域信号转换模块依次串行连接,能够将输入的多路时域信号转换为单路时域信号输出,避免在多路语音信号处理时采用多组数模转换器和增益器,大大节省成本。
[0056] 进一步地,在上述实施例的基础上,所述多路时域频域信号转换模块包括若干个模数转换器;
[0057] 每个模数转换器用于对所述外部输入的原始语音信号进行模数转换,并将模数转换后的语音信号输出至所述多路频域信号叠加模块。
[0058] 其中,模数转换器包括采样器、频率器和IIS(集成音频总线)接口。采样器用于采集数字信号并转换为模拟信号,频率器用于设置采样频率,IIS接口用于信号的传输。
[0059] 进一步地,在上述实施例的基础上,如图3所示,还包括:算法处理模块204;
[0060] 所述算法处理模块204用于对接收的模数转换器输出的语音信号进行算法处理,并将算法处理后的多路语音信号输出至所述多路频域信号叠加模块。
[0061] 具体地,所述算法处理模块204主要使用ARM 4处理器芯片STM32F405OE,通过该芯片,可以实现对多路音频信号进行相应的算法处理,例如实现降噪、回声消除、窄波束等功能。
[0062] 在上述实施例的基础上,如图3所示,还包括:若干个预处理模块(第一预处理模块205、第二预处理模块206、第三预处理模块207……);
[0063] 所述若干个预处理模块分别用于对外部输入的原始语音信号进行预处理,并将预处理后的语音信号输入至多路时域频域信号转换模块。
[0064] 其中,每个预处理模块包括:一个麦克风和一个模数转换器;
[0065] 每个麦克风和一个模数转换器连接,用于接收外部输入的原始语音信号;
[0066] 每个模数转换器用于对所述外部输入的原始语音信号进行模数转换,并将模数转换后的语音信号输出至所述多路频域信号叠加模块。
[0067] 其中,模数转换器包括采样器、频率器和IIS(集成音频总线)接口。采样器用于采集模拟信号并转换为离散信号,频率器用于设置采样频率,IIS接口用于信号的传输。
[0068] 进一步地,在上述实施例的基础上,所述多路时域频域信号转换模块包括若干个增益器;
[0069] 每个麦克风和对应的增益器、模数转换器依次串行连接;
[0070] 每个增益器用于接收麦克风输出的语音信号并对接收的信号进行增益放大。
[0071] 其中,增益器包括放大器和电阻,放大器用于对信号进行放大,电阻用于调节电阻值以改变放大器放大的值。
[0072] 进一步地,在上述实施例的基础上,所述单路频域时域信号转换模块203包括一个数模转换器;
[0073] 所述数模转换器用于将所述多路频域信号叠加模块输出的所述模数转换后的语音信号的数字信号转换为模拟信号。
[0074] 其中,数模转换器包括采样器、频率器和IIS(集成音频总线)接口。采样器用于采集数字信号并转换为模拟信号,频率器用于设置采样频率,IIS接口用于信号的传输。
[0075] 进一步地,在上述实施例的基础上,所述单路频域时域信号转换模块203还包括一个增益器;
[0076] 所述增益器和所述数模转换器连接,用于对接收的信号进行增益放大。
[0077] 具体地,在信号传输处理过程中,分为以下具体步骤:
[0078] A1、通过多路麦克风接收多路音频信号;其中,每个麦克风接收一路音频信号。
[0079] A2、对多路音频信号进行预处理;
[0080] 所述预处理包括通过增益器放大/衰减(根据实际需要选择方法/衰减),经过模数转换器将模拟信号转换为数字信号,经过算法处理模块进行降噪、声源定位等处理操作,然后将数字信号传输至多路时域频域信号转换模块201。
[0081] A3、将多路音频信号叠加为一路音频信号;
[0082] 通过多路时域频域信号转换模块201、多路频域信号叠加模块202和单路频域时域信号转换模块203将多路音频信号叠加为一路音频信号,所述叠加指的是在频域叠加,具体叠加方法如下:
[0083] A31、将多路音频的时域信号转换成频域信号;
[0084] 通过多路时域频域信号转换模块201将多路音频的时域信号转换成频域信号。多路时域频域信号转换模块201通过具体电路实现,具体的实现原理介绍如下:
[0085] 以x1(t)、x2(t)…、xi(t)、...xn(t)表示n路音频的时域信号,n为大于等于2的数,时域信号转换成频域信号有多种方法,以常用的傅里叶变换为例说明。X1(M,l)、X2(M,l)…Xn(M,l)表示经过傅里叶变换的n路音频的第l帧的频域信号,其中Xi(M,l)代表第i路信号的第l帧共M个频段的傅里叶变换结果。傅里叶变换可以用FFT、DFT等,以FFT为例,假设采样率为2*f,M是FFT窗长的一半,FFT的窗长为2*M,由此得到频率分辨率为f/M,由于频谱是对称的,因此只需要取M个频段即可,由公式(1.1)计算得到X1(M,l)、X2(M,l)…Xn(M,l)。然后用行向量表示X1(M,l)、X2(M,l)…Xn(M,l)(代表各个频段幅值或相位等信息);
[0086]
[0087] A3.2、将多路频域信号叠加成一路频域信号;
[0088] 通过多路频域信号叠加模块202将多路频域信号叠加成一路频域信号。多路频域信号叠加模块202通过具体电路实现,具体的实现原理介绍如下:
[0089] 对于n个2*f采样率的语音信号,每个信号x1(t)、x2(t)…、xi(t)、...xn(t)的原始带宽为f Hz,频率范围为0至f Hz。首先对每个信号进行傅里叶变换将时域信号转换成频域信号,然后保持每个语音信号的带宽不变,而仅让其频率范围增加j*f,j的取值范围为1至(n-1),这样得到的每个信号带宽和频率范围分别如下:
[0090] x1(t):带宽为f Hz,频率范围为0~f Hz
[0091] x2(t):带宽为f Hz,频率范围为f~2*f Hz
[0092] …
[0093] xi(t):带宽为f Hz,频率范围为(i-1)*f~i*f Hz
[0094] …
[0095] xn(t):带宽为f Hz,频率范围(n-1)*f~n*f Hz
[0096] 例如:两个16KHz采样率的音频信号,带宽为8KHz,频率范围为0~8KHz,提升其中一个信号的频率范围,得到带宽为8KHz,频率范围为8K~16KHz的语音信号,然后对两个音频信号的频谱进行叠加,得到叠加后的语音信号:带宽16K,频率范围为0~16KHz。
[0097] 以O(j,l)表示频谱拼接后第l帧的音频信号傅里叶变换结果,如公式(1.2)所示,可以得出j=n*M。对于多路音频的每帧信号,由于X1(M,l)、X2(M,l)…Xn(M,l)代表各个频段幅值或相位等的行向量,因此直接将各个行向量的结果拼接起来即可表示0至n*f的频率范围。
[0098] O(n*M,l)=[X1(M,l) X2(M,l)... Xn(M,l)] (1.2)
[0099] A3.3、将所述频域信号转换成时域信号;
[0100] 通过单路频域时域信号转换模块203将一路频域信号转换成时域信号。单路频域时域信号转换模块203通过具体电路实现,具体的实现原理介绍如下:
[0101] 首先将O(n*M,l)通过逆傅里叶变换从频域变换到时域,以O(t)表示经过逆傅里叶变换后得到的时域信号,变换过程如公式(1.3)所示。然后进行overlap-add或overlap-save等操作,此时,窗长已经由2*M变换到n*M了。
[0102] O(t)=IFFT(O(n*M,l)) (1.3)
[0103] 对于多路音频的其他所有帧都按照步骤A3.1-3.3的方法进行处理直至所有帧都执行完一遍操作。然后经过模数转换器模块204和增益器,最终将数字信号转换为模拟信号。
[0104] 图4示出了本实施例提供的一种多路语音信号接收处理设备,包括:单路时域频域信号转换模块401和单路频域信号分离模块402;
[0105] 所述单路时域频域信号转换模块401和所述单路频域信号叠加模块402连接;
[0106] 其中,所述单路时域频域信号转换模块401接收输入的单路时域信号后,将所述单路时域信号转换为单路频域信号,并将所述单路频域信号输出至所述单路频域信号分离模块402;
[0107] 所述单路频域信号分离模块402接收输入的所述单路频域信号后,将所述单路频域信号进行分离处理,得到分离后的多路频域信号,并将多路频域信号进行输出;
[0108] 具体地,单路时域频域信号转换模块401主要使用ADC模数转换芯片,ADC模数转换芯片的作用是将时间连续、幅值也连续的模拟量转换为时间离散、幅值也离散的数字信号,ADC数模转换芯片包括取样器、保持器、量化器及编码器4个部件和过程。
[0109] 单路频域信号分离模块402主要使用ARM处理器,该处理器可实现将单路频域信号分离成多路频域信号。
[0110] 本实用新型实施例通过单路时域频域信号转换模块、单路频域信号分离模块和多路频域时域信号转换模块依次串行连接,能够将输入的单路时域信号转换为多路时域信号输出,避免在多路语音信号接收时采用多个模数转换器,大大节省成本。
[0111] 在上述实施例的基础上,如图5所示,多路语音信号接收处理设备还包括:一个增益器403;
[0112] 所述增益器403和所述单路时域频域信号转换模块401连接,用于对接收的信号进行增益放大后,输出至所述单路时域频域信号转换模块401。
[0113] 其中,增益器403包括放大器和电阻,放大器用于对信号进行放大,电阻用于调节电阻值以改变放大器放大的值。
[0114] 需要说明的是,此处的增益器403与多路语音信号传输处理设备中的单路频域时域信号转换模块中的增益器至少设置一个,也可以设置两个。
[0115] 在上述实施例的基础上,如图5所示,还包括:应用模块404;
[0116] 所述应用模块404用于对所述单路频域信号分离模块402输出的多路频域信号进行处理。
[0117] 其中,所述应用模块404可以根据具体的应用需求,采用芯片或电路实现,可以使用基于A9的CPU处理器实现,例如imx6q芯片,通过此处理器可以实现对相应的音频信号进行具体的应用类处理,例如语音识别、语音唤醒等功能。
[0118] 具体地,在信号接收处理过程中,分为以下具体步骤:
[0119] A4、接收音频信号,转换为数字信号;
[0120] 接收外部输入的一路音频信号(例如步骤A3得到的音频信号),通过模数转换器404将模拟信号转换为数字信号。
[0121] A5、将所述一路音频信号还原为多路音频信号;
[0122] 通过单路时域频域信号转换模块401和单路频域信号分离模块402将单路音频信号分离为多路音频信号,所述分离指的是在频域分离,具体分离方法如下:
[0123] A5.1、将所述音频时域信号转换成多路频域信号;
[0124] 通过单路时域频域信号转换模块401将单路音频时域信号转换成单路频域信号,并通过单路频域信号分离模块402将单路频域信号分离成多路频域信号。单路时域频域信号转换模块401和单路频域信号分离模块402均通过具体电路实现,具体的实现原理介绍如下:
[0125] 以O'(t)表示一路音频信号的时域信号,假设采样率为2n*f,频点个数为n*M,转换后的频域信号用O'(j,l)表示,变换过程如公式(1.4)所示:
[0126] O'(j,l)=FFT(O'(t)) (j=n*M) (1.4)
[0127] 以X1'(M,l)、X2'(M,l)…Xn'(M,l)表示取O'(n*M,l)不同频率范围内的傅里叶变换结果,其中O'(2*M,l)代表取第f至2f频率范围内的结果,O'(i*M,l)代表取第(i-1)*f至i*f频率范围内的结果,X1'(M,l)、X2'(M,l)…Xn'(M,l)计算过程如公式(1.5)所示:
[0128]
[0129] A5.2、将多路频域信号转换成多路时域信号;
[0130] 通过多路频域时域信号转换模块403将多路频域信号转换成多路时域信号,多路频域时域信号转换模块403通过具体电路实现,具体的实现原理介绍如下:
[0131] 将得到的多路频域信号经过逆傅里叶变换得到多路时域信号x1'(t)、x2'(t)…、xn'(t),如公式(1.6)所示。
[0132]
[0133] 然后进行overlap-add或overlap-save等操作,分别得到多路时域语音信号,至此已完成多路音频信号的还原,后续可以将信号传输至应用模块进行相应处理,例如语音识别、翻译等等。
[0134] 图6示出了本实施例提供的一种多路语音信号处理系统,包括上述多路语音信号传输处理设备,以及上述多路语音信号接收设备。
[0135] 具体地,参见图6,由多个麦克风、一个算法处理模块、一个多路时域频域信号转换模块(包括多组增益器和模数转换器)、一个多路频域信号叠加模块、一个单路频域时域信号转换模块(包括一个数模转换器模块和一个增益器)构成多路语音信号传输处理设备;同时由一个增益器、一个单路时域频域信号转换模块、一个单路频域信号分离模块和一个应用模块构成多路语音信号接收处理设备。其中麦克风、增益器、模数转换器、算法处理模块、数模转换器和应用模块,在此不再赘述。相较于现有设备增加了多路时域频域信号转换模块、多路频域信号叠加模块、单路频域时域信号转换模块、单路时域频域信号转换模块和单路频域信号分离模块,但将多个数模转换器、多个增益器、多个模数转换器分别减少为一个,不仅节省了系统软硬件资源,而且适配只有一路音频接收接口的接收设备。在实际应用中,增益器、算法处理模块不是必需的,可以根据实际需要减少相关模块,在此不做限制。本实施例提供的多路语音信号处理系统将多路音频信号叠加成一路信号,然后传输所述音频信号,最后还原成多路音频信号。相较于现有方法,本案只需要使用一个数模转换器、一个增益器、一个模数转换器即可实现多路音频信号传输,从而节省了系统软硬件资源。
[0136] 本实用新型实施例通过将多路时域频域信号转换模块、多路频域信号叠加模块和单路频域时域信号转换模块依次串行连接,能够将输入的多路时域信号转换为单路时域信号输出,避免在多路语音信号处理时采用多组数模转换器和增益器;同时通过单路时域频域信号转换模块、单路频域信号分离模块和多路频域时域信号转换模块依次串行连接,能够将输入的单路时域信号转换为多路时域信号输出,避免在多路语音信号接收时采用多个模数转换器,大大节省成本。
[0137] 本实用新型的说明书中,说明了大量具体细节。然而,能够理解,本实用新型的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0138] 最后应说明的是:以上实施例仅用以说明本实用新型的技术方案,而非对其限制;尽管参照前述实施例对本实用新型进行了详细的说明,本领域的普通技术人员应当理解:
其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本实用新型各实施例技术方案的精神和范围。