技术领域
[0001] 本公开涉及智能座舱技术领域,尤其涉及一种声浪合成方法、装置及车辆。
相关背景技术
[0002] 随着电动车辆的发展,车辆的驾驶性能不断得到提升,同时,对于包括显示和音效在内的智能座舱技术也提出了更高的要求。
[0003] 电动车辆相较于传统车辆,发动机气缸的数量减少,甚至传统的发动机直接被电动机取代。因此,通过优化包括进气和排气系统在内的机械系统,使得具有特有的发动机声音更加困难。为了保持发动机声音的独特性,使用主动发声技术得到车辆引擎声是最有效的方法之一,已经广泛应用于电动车辆。其中,声浪合成则是主动发声技术的关键部分。通过声浪合成,能够对音频进行调制,生成丰富的声音频谱,更趋近于传统发动机声音。
具体实施方式
[0033] 这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
[0034] 需要说明的是,本申请中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
[0035] 车辆在不同运行状态下发出不同的音频,从而使得驾乘人员能够通过车辆发出的音频变化获知车辆的运行状态改变。由于相关技术中,这种对音频信号的变调处理,往往是通过相位声码器对音频信号进行音频移频实现。
[0036] 相位声码器是一种广泛应用的移频技术,通过累计瞬时频率的相位估计值,对相位进行补偿,用于保持音频信号的连续性,以实现信号在时域的缩放,然后通过重采样使信号返回到初始持续时间,从而完成音频信号的移频处理。该方法将每个频率单独视为一个恒定的正弦波,通过累计瞬时频率下的相位估计值,对其进行线性相位处理,从而保持相位连续性。
[0037] 但目前的相位声码器不能对时变正弦信号和非正弦信号进行移频处理,适用范围窄,且无法保证信号的相位连续性和插值连续性,进而使音质损坏。本申请实施例中,利用时间维度和频率维度的瞬态相位补偿和改进的插值方案,提高了算法的鲁棒性,并且提升了合成的音频信号的音质。
[0038] 具体可参考本申请的各实施例,对声浪合成方法、装置及车辆进行说明。
[0039] 图1是根据一示例性实施例示出的一种声浪合成方法的流程图,如图1所示,该处理方法可以由车辆的车机系统执行,主要用于车辆的声浪合成。车机系统执行本实施例中提供的处理方法对第一音频信号进行处理,并将得到的目标音频信号通过车载扬声器进行实时播放。
[0040] 如图1所示,车辆音频的处理方法包括以下步骤:
[0041] 步骤101,对预存声浪的第一音频信号分帧得到多帧信号,对所述多帧信号进行时域到频域的变换,以得到所述多帧信号的各频域分量。
[0042] 其中,预存声浪的第一音频信号,是原始的音频信号,通过本实施例的方法,对该音频信号进行移频,从而得到移频处理后的目标音频信号。
[0043] 可选地,对预存的第一音频信号在时域维度上为了便于处理,通常将第一音频信号划分为多个块,即块信号。继而,针对每一块信号,采用滑窗的方式可以划分为多帧。
[0044] 作为一种可能的划分多帧的方式,滑窗采用汉宁窗或者汉明窗的方式,窗长与帧长相同。滑窗的步长为帧长的设定百分比,取值范围可以为10%至90%,例如:可以为25%、50%和75%。滑窗每移动一个步长,将处于滑窗内的采样点作为一帧。针对每一帧,采用傅里叶变换,实现时域到频域的变换,以得到所述多帧信号的各频域分量。
[0045] 例如:音频信号长度为10s,采样率为16000、44100或者48000。在此场景下,分块得到的块数据最低采样点个数为L=2048个采样点,对该块数据进行分帧和加窗处理,选用的窗长即帧长为N=1024个采样点,滑窗的步长即时域帧移为256个采样点。
[0046] 步骤102,根据车辆的工况参数,确定转换系数。
[0047] 其中,车辆的工况参数,可以包括:转速。该转速可以是纯电动车辆的电机转速,也可以是混合动力车辆的电机转速和内燃机转速,本实施例中对此不作限定。
[0048] 作为一种可能的实现方式,车辆的工况参数,还可以包括用于间接指示转速的其他工况参数,例如油门踏板的开度等。
[0049] 可选地,在工况参数具体为转速的情况下,响应于用户驾驶操作所导致的转速改变,根据当前的转速,基于转速与转换系数之间的映射关系,确定车辆当前工况参数对应的转换系数。
[0050] 转换系数,是用于对第一音频信号在时域进行延长或压缩,但不变调的情况下,所需的延长或压缩比例。本实施例中,通过这种对第一音频信号的在时域的拉长或压缩、补偿等操作,然后再通过差值恢复至原始长度的目标音频,可以实现音频的基于用户驾驶操作的调制。由于转速不同,转换系数不同,最终得到的目标音频也会不同。
[0051] 步骤103,对至少一频域分量,以相邻帧中对应频域分量的原始相位为基础进行相位补偿,以及,以同一帧中不同频域分量的原始相位为基础进行相位补偿,其中,补偿的相位是基于所述转换系数确定。
[0052] 基于前述步骤,可以针对第一音频信号,确定属于同一块信号的多帧信号,其中,每一帧信号通过时频域变换可以得到多帧频域分量,本步骤中,可以对一帧信号中的全部频域分量均进行相位补偿,也可以仅针对部分频域分量进行相位补偿,本实施例中对此不作限定。
[0053] 作为一种可能的实现方式,可以针对任意的一帧,将全部频域分量在时间维度上进行相位补偿,更新当前帧所有频域分量的相位,使得该帧内全部频域分量与前一帧中对应频域分量之间相位连续。以及针对任意的一帧,对至少部分频域分量,在同一帧中与该频域不同频域分量的原始相位的基础上进行相位补偿。
[0054] 步骤104,根据所述多帧信号的至少一频域分量补偿后的目标相位,进行频域到时域的变换,以得到第二音频信号。
[0055] 可选地,在频域到时域的变换针对全部多帧信号的全部频域分量进行,其中,针对所述多帧信号中已补偿相位的至少一帧频域分量,频域到时域的变换基于该至少一帧频域分量补偿后的目标相位,针对多帧中未进行补偿的频域分量,则频域到时域的变换基于原始相位进行。
[0056] 步骤105,调整所述第二音频信号的信号长度,以得到信号长度与所述第一音频信号匹配的目标音频信号。
[0057] 由于前述步骤中,对相位进行了补偿,从而使得频域到时域的变换后得到的第二音频信号相较于第一音频信号在时域上增加了采样点,也可能减少了采样点。本步骤中,进行了信号长度的对齐,通过插值或者合并采样点的方式,将第二音频信号恢复至所需的信号长度,通常来说,恢复至与第一音频信号长度一致。
[0058] 本申请实施例中,通过对预存声浪的第一音频信号中的多帧信号进行时域到频域的变换,以得到所述多帧信号的各频域分量,根据车辆的工况参数,确定转换系数。对至少一频域分量,根据所述转换系数,在相邻帧中对应频域分量的原始相位的基础上,以及,同一帧中不同频域分量的原始相位的基础上进行相位补偿,以得到补偿后的目标相位。进而根据所述多帧信号的至少一频域分量的目标相位,进行所述变换的频域到时域的变换,以得到第二音频信号,并根据第二音频信号,进行信号长度调整,以得到信号长度与所述第一音频信号匹配的目标音频信号。由于在相位补偿时,不仅在时域上基于相邻帧中对应频域分量进行相位补偿,而且在时域上基于同一帧中不同频域分量进行相位补偿,从而可以对时变正弦信号和非正弦信号进行移频处理,解决了相关技术中适用性较差的技术问题。
[0059] 图2是根据一示例性实施例示出的另一种声浪合成方法的流程图,如图2所示,包括顺序执行的三个阶段,第一个阶段为预处理阶段,第二个阶段为相位补偿阶段,第三个阶段为变调阶段。
[0060] 下面分别对这几个阶段进行介绍:
[0061] 首先,是预处理阶段,图3为预处理阶段的流程图,如图3所示,在一些可能的实现方式中,包括以下步骤:
[0062] 步骤201,对预存声浪的第一音频信号中的多帧信号进行时域到频域的变换,以得到所述多帧信号的各频域分量。
[0063] 可选地,对预存的第一音频信号在时域维度上为了便于处理,通常将第一音频信号划分为多个块,即块信号。继而,针对每一块信号,采用滑窗的方式可以划分为多帧。具体可参见前述实施例中的相关步骤,本实施例中对此不再赘述。
[0064] 其中,滑窗的步长即时域帧移记为hoptin。脚标中的t表示时域,in是指在根据转换系数缩放前相邻帧之间的时域帧移。
[0065] 步骤202,根据车辆的工况参数,确定转换系数。
[0066] 转换系数α与车辆的当前转速rpm相关,作为一种可能的实现方式,转换系数α与车辆的当前转速rpm的映射关系见公式:
[0067]
[0068] 其中,RPM_MAX表示电动车辆的转速最大值,RPM_MIN表示电动车辆的转速最小值,R表示转换系数α的取值范围。
[0069] 步骤203,采用所述转换系数对所述第一音频信号中多帧之间的时域间隔进行缩放得到设定时间间隔。
[0070] 其中,第一音频信号中多帧之间的时域间隔,是时域帧移hoptin。
[0071] 将转换系数α与第一音频信号中多帧之间的时域间隔hoptin之间的乘积作为设定时间间隔,即缩放后时域帧移hoptout。
[0072] 因此,转换系数α也可表示为hoptout与hoptin比值,即α=hoptout/hoptin,因此,若缩放前,第一音频信号的各帧信号在时域的长度为L,则对第一音频信号缩放后得到的第二音频信号的各帧信号在时域的长度为αL。
[0073] 步骤204,针对任意的一目标帧的目标频率分量,根据所述目标频率分量与前一帧中对应频率分量的原始相位差,确定时域维度偏差。
[0074] 由于第一音频信号是变频信号,因此,频率偏差Δω(n,m)是时间维度和频率维度的函数。其中,m是多帧信号中所属的帧的帧号,n是m帧中所属的频域分量的频点序号。频率偏差Δω(n,m)中的时域维度偏差表示为Δwt(n,m),频域维度偏差表示为Δωf(n,m)。
[0075] 下面以第m帧中的第n个频点的频域分量为例,说明时域维度偏差Δωt(n,m)的确定过程。
[0076] 在时域维度,根据前一帧相位 和当前帧相位 可以下列公式获得第m帧中的第n个频点的频域分量的时域维度偏差Δωt(n,m)为:
[0077]
[0078] 其中,N表示第m帧信号的频率分量总数。
[0079] 需要说明的是,前述公式中采用了wrap,这是由于相位偏差计算时需要将数据控制在[‑π,π]之间,这种控制相位偏差计算的过程见公式:
[0080]
[0081] 上述公式中round表示四舍五入取整,主要是为了保证相位补偿不超出相位上下边界。wrap(x)表示控制取值范围之后的相位偏差,x表示控制取值范围之前的相位偏差。
[0082] 步骤205,采用所述转换系数,对所述第一音频信号中同一帧的不同频域分量之间的频率间隔进行缩放得到设定频率间隔。
[0083] 参考步骤203,同理,所述第一音频信号中同一帧的不同频域分量之间的频率间隔记为hopfin,缩放后得到设定频率间隔hopfout=αhopfin。
[0084] 步骤206,针对任意的一目标帧的目标频率分量,根据所述目标帧内部,所述目标频率分量与相邻频率分量之间原始相位差,确定频域维度偏差。
[0085] 可选地,针对任意的一目标帧的目标频率分量,根据所述目标帧内部,所述目标频率分量与前一频率分量之间原始相位差,确定前向频域偏差,以及根据所述目标频率分量与后一频率分量之间原始相位差,确定后向频域偏差;根据所述前向频域偏差和所述后向频域偏差,确定所述频域维度偏差。
[0086] 下面以第m帧中的第n个频点的频域分量为例,说明频域维度偏差Δωf(n,m)的确定过程。
[0087] 根据前一频点相位 当前频点相位 和后一频点相位可以分别下列公式获得前向频率偏差Δωf,before(n,m),后向频率偏差Δ
ωf,after(n,m):
[0088]
[0089]
[0090] 作为一种可能的实现方式,根据所述前向频域偏差和所述后向频域偏差,采用以下公式确定频域维度偏差Δωf(n,m):
[0091]
[0092] 需要说明的是,步骤203‑204,与步骤205‑206可如虚线箭头并行执行,也可以如图3中实线箭头在步骤204之后执行205即串行执行,本实施例中对此不作限定。
[0093] 第二阶段,相位补偿阶段,图4为相位补偿阶段的流程图,如图4所示,在一些可能的实现方式中,包括以下步骤:
[0094] 步骤207,对任一目标频域分量,根据所述时域维度偏差,确定在设定时间间隔上的第一相位差。
[0095] 可选地,将所述时域维度偏差与所述设定时间间隔之间的乘积作为所述目标频域分量的第一相位差。下面以第m帧中的第n个频点的频域分量为例,将其作为目标频域分量,如前述步骤中,时域维度偏差为Δωt(n,m),设定时间间隔为hoptout,则第一相位差为hoptout·Δωt(n,m)。
[0096] 步骤208,在相邻帧中对应频域分量的原始相位的基础上,补偿所述第一相位差。
[0097] 作为一种可能的实现方式,采用下列公式在相邻帧中对应频域分量的原始相位的基础上,补偿所述第一相位差:
[0098]
[0099] 其中, 为第m帧中的第n个频点的频域分量补偿第一相位差后的相位。为第(m‑1)帧中的第n个频点的频域分量当前的相位,具体地,第(m‑1)帧中的第n个频点的频域分量需要补偿第一相位差的情况下, 为补偿第一相位差后的相位,在无需补偿第一相位差的情况下, 为补偿前的相位。
[0100] 需要说明的是,本实施例中,可以对全部频域分量均执行了本步骤,即补偿了第一相位差,本领域技术人员可以知晓,也可以仅选取部分频域分量执行本步骤。例如,基于幅值进行频域分量选择后,选取部分频域分量执行本步骤。
[0101] 步骤209,对任一目标频域分量,根据所述频域维度偏差,确定设定频率间隔上的第二相位差。
[0102] 可选地,将所述频域维度偏差与所述设定频率间隔之间的乘积作为所述目标频域分量的第二相位差。下面以第m帧中的第n个频点的频域分量为例,将其作为目标频域分量,如前述步骤中,频域维度偏差为Δωf(n,m),设定时间间隔为hopfout,则第二相位差为hopfout·Δωf(n,m)。
[0103] 为了减小运算量,可仅对部分频域分量补偿第二相位差。其中,需要补偿第二相位差的目标频域分量,作为一种可能的实现方式,可采用以下方式确定:
[0104] 针对所述多帧信号中的任意一目标帧,根据所述目标帧及其前一帧中各频域分量的幅值,确定幅值阈值;根据所述目标帧中幅值大于所述幅值阈值的至少一频域分量,生成所述目标帧的更新集。即,更新集内的频域分量作为待补偿第二相位差的目标频域分量。
[0105] 例如:通过当前帧和前一帧采样点中的幅值最大值,确定需要平滑的幅值阈值(本实施例幅值阈值等于幅值最大值的0.8),创建更新集Λ。将当前帧内幅值大于阈值的频点作为需要更新的频点加入更新集,记为(nh,m)。如果nh=0或者nh=N‑1,则该元素不加入更新集Λ中,防止相位补偿超出频点边界。
[0106] 步骤210,同一帧中相邻频域分量的原始相位的基础上,补偿所述第二相位差,以得到补偿后的所述目标相位。
[0107] 可选地,遍历更新集,针对更新集中所述目标帧的目标频率分量,在所述相邻频域分量的原始频率小于所述目标频率分量的情况下,在所述相邻频域分量的当前相位的基础上,减去所述第二相位差,以得到补偿后的所述目标相位。作为一种可能的实现方式,采用下列公式在相邻频域分量的当前相位 的基础上,减去所述第二相位差,例如:
[0108]
[0109] 对所述目标帧的目标频率分量,在所述相邻频域分量的原始频率大于所述目标频率分量的情况下,在所述相邻频域分量的当前相位的基础上,增加所述第二相位差,以得到补偿后的所述目标相位。作为一种可能的实现方式,采用下列公式在相邻频域分量的当前相位 的基础上,增加所述第二相位差,例如:
[0110]
[0111] 当更新集Λ遍历结束时,获得了各帧信号中各频率分量的目标相位。
[0112] 步骤211,根据所述多帧信号的至少一频域分量的目标相位,进行频域到时域的变换,以及基于频域到时域的变换得到的时域帧信号进行音频合成得到第二音频信号。
[0113] 可选地,对每帧执行逆傅里叶变换,并采用加窗来进行平滑,可获得各帧信号例如,采用如下公式对第m帧进行逆傅里叶变换和平滑,得到时域的信号
[0114]
[0115] 其中,N是第m帧信号的频率分量总数, 是第m帧信号中第n个频点的频率分量的目标相位。X(n,m)是第m帧信号中第n个频点的频率分量的幅值。 是截断函数。是信号 的采样点索引。
[0116] 通过每帧信号的时域叠加,合成变速不变调的音频信号,完成在不改变音调的同时对信号的拉伸或压缩,帧叠加过程如下列公式所示:
[0117]
[0118] 其中,
[0119] 为数字信号中常用的单位阶跃序列,在 中采样点索引 的取值可以为作为为拉伸或压缩后的第二音频信号中采样点的索引,相较于第一音频信号x(l),第二音频信号已经实现在时间上的拉伸或压缩, 表示拉伸或压缩后的第二音频信号,并且其音调相对x(l)没有发生改变。
[0120] 第三个阶段,变调阶段,图5为变调阶段的流程图,如图5所示,在一些可能的实现方式中,包括以下步骤:
[0121] 步骤212,根据所述第二音频信号,进行信号长度调整,以得到信号长度与所述第一音频信号匹配的目标音频信号。
[0122] 在一种可能的场景下,在对第一音频信号进行了压缩得到第二音频信号的情况下,采用三次样条插值的算法,对所述第二音频信号中的各子区间内的采样点分别进行采样点插值,以得到信号长度与所述第一音频信号匹配的目标音频信号。
[0123] 或者,在另一种可能的场景下,在对第一音频信号进行了拉伸得到第二音频信号的情况下,采用三次样条差值的算法,对所述第二音频信号中的各子区间内的采样点分别进行采样点的合并,以得到信号长度与所述第一音频信号匹配的目标音频信号。
[0124] 第二音频信号中的采样点表示为 其中,i是采样点序号,i=0,1,2,…,αL‑1。需要对其进行插值计算,将长度为αL的信号恢复到原始长度L,最终完成信号的变调。
[0125] 可选地,为了避免出现龙格现象,将第二音频信号划分为多个子区间,在每个子区间进行分段插值,同时为了保证插值后信号在节点处的是光滑度,采用三次样条插值。
[0126] 以采样点 和 之间需要插值l′为例进行说明,其中, 该插值过程通过下列公式进行:
[0127]
[0128] 其中,l′=0,…,L‑1表示重采样后的音频数据的数据点索引,ai、bi、ci和di分别为三次样条曲线的系数:
[0129]
[0130]
[0131]
[0132]
[0133] 其中, 为每个子区间的长度, 为在插值点处的二阶导数。此时,变长未变调的第二音频信号被重采样到与原始长度一致的目标音频信号,实现了对第一音频信号音高的改变, 表示重采样后的目标音频信号。
[0134] 本申请实施例中,通过对预存声浪的第一音频信号中的多帧信号进行时域到频域的变换,以得到所述多帧信号的各频域分量,根据车辆的工况参数,确定转换系数。对至少一频域分量,根据所述转换系数,在相邻帧中对应频域分量的原始相位的基础上,以及,同一帧中不同频域分量的原始相位的基础上进行相位补偿,以得到补偿后的目标相位。进而根据所述多帧信号的至少一频域分量的目标相位,进行所述变换的频域到时域的变换,以得到第二音频信号,并根据第二音频信号,进行信号长度调整,以得到信号长度与所述第一音频信号匹配的目标音频信号。由于在相位补偿时,不仅在时域上基于相邻帧中对应频域分量进行相位补偿,而且在时域上基于同一帧中不同频域分量进行相位补偿,从而可以对时变正弦信号和非正弦信号进行移频处理,解决了相关技术中适用性较差的技术问题。
[0135] 图6是根据一示例性实施例示出的一种声浪合成装置600框图。参照图6,该声浪合成装置600包括:第一变换模块610、确定模块620、补偿模块630、第二变换模块640和调整模块650。
[0136] 第一变换模块610,用于对预存声浪的第一音频信号分帧得到多帧信号,对所述多帧信号进行时域到频域的变换,以得到所述多帧信号的各频域分量。
[0137] 确定模块620,用于根据车辆的工况参数,确定转换系数。
[0138] 补偿模块630,用于对至少一频域分量,以相邻帧中对应频域分量的原始相位为基础进行相位补偿,以及,以同一帧中不同频域分量的原始相位为基础进行相位补偿,其中,补偿的相位是基于所述转换系数确定。
[0139] 第二变换模块640,用于根据所述多帧信号的至少一频域分量补偿后的目标相位,进行频域到时域的变换,以及基于频域到时域的变换得到的时域帧信号进行音频合成得到第二音频信号。
[0140] 调整模块650,用于调整所述第二音频信号的信号长度,以得到信号长度与所述第一音频信号匹配的目标音频信号。
[0141] 在一些可能的实现方式中,补偿模块630用于:
[0142] 采用所述转换系数对所述第一音频信号中多帧之间的时域间隔进行缩放得到设定时间间隔;
[0143] 针对任意的一目标帧的目标频率分量,根据所述目标频率分量与前一帧中对应频率分量的原始相位差,确定时域维度偏差;
[0144] 对所述目标频域分量,根据所述时域维度偏差,确定在设定时间间隔上的第一相位差;
[0145] 在相邻帧中对应频域分量的原始相位的基础上,补偿所述第一相位差。
[0146] 可选地,补偿模块630对所述目标频域分量,根据所述时域维度偏差,确定在设定时间间隔上的第一相位差,包括:
[0147] 将所述时域维度偏差与所述设定时间间隔之间的乘积作为所述目标频域分量的第一相位差。
[0148] 在一些可能的实现方式中,补偿模块630用于:
[0149] 采用所述转换系数,对所述第一音频信号中同一帧的不同频域分量之间的频率间隔进行缩放得到设定频率间隔;
[0150] 针对任意的一目标帧的目标频率分量,根据所述目标帧内部,所述目标频率分量与相邻频率分量之间原始相位差,确定频域维度偏差;
[0151] 对所述目标频域分量,根据所述频域维度偏差,确定设定频率间隔上的第二相位差;
[0152] 同一帧中相邻频域分量的原始相位的基础上,补偿所述第二相位差,以得到补偿后的所述目标相位。
[0153] 可选地,补偿模块630对所述目标频域分量,根据所述频域维度偏差,确定设定频率间隔上的第二相位差,包括:
[0154] 将所述频域维度偏差与所述设定频率间隔之间的乘积作为所述目标频域分量的第二相位差。
[0155] 可选地,补偿模块630同一帧中相邻频域分量的原始相位的基础上,补偿所述第二相位差,以得到补偿后的所述目标相位,包括:
[0156] 对所述目标帧的目标频率分量,在所述相邻频域分量的原始频率小于所述目标频率分量的情况下,在所述相邻频域分量的原始相位的基础上,增加所述第二相位差,以得到补偿后的所述目标相位;
[0157] 对所述目标帧的目标频率分量,在所述相邻频域分量的原始频率大于所述目标频率分量的情况下,在所述相邻频域分量的原始相位的基础上,减少所述第二相位差,以得到补偿后的所述目标相位。
[0158] 可选地,补偿模块630针对任意的一目标帧的目标频率分量,根据所述目标帧内部,所述目标频率分量与相邻频率分量之间相位差,确定频域维度偏差,包括:
[0159] 针对任意的一目标帧的目标频率分量,根据所述目标帧内部,所述目标频率分量与前一频率分量之间原始相位差,确定前向频域偏差,以及根据所述目标频率分量与后一频率分量之间原始相位差,确定后向频域偏差;
[0160] 根据所述前向频域偏差和所述后向频域偏差,确定所述频域维度偏差。
[0161] 在一些可能的实现方式中,调整模块650用于:采用三次样条插值的算法,对所述第二音频信号中的各子区间内的采样点分别进行采样点插值,以得到信号长度与所述第一音频信号匹配的目标音频信号。
[0162] 或者,在一些可能的实现方式中,调整模块650用于:采用三次样条差值的算法,对所述第二音频信号中的各子区间内的采样点分别进行采样点的合并,以得到信号长度与所述第一音频信号匹配的目标音频信号。
[0163] 在一些可能的实现方式中,补偿模块630针对所述多帧信号中的任意一目标帧,根据所述目标帧及其前一帧中各频域分量的幅值,确定幅值阈值;
[0164] 根据所述目标帧中幅值大于所述幅值阈值的至少一频域分量,生成所述目标帧的更新集;
[0165] 对所述更新集内的至少一频域分量,根据所述转换系数,在所述目标帧中相邻频域分量的原始相位的基础上进行相位补偿。
[0166] 或者,在一些可能的实现方式中,补偿模块630针对所述多帧信号中的任意一目标帧的目标频率分量,根据所述转换系数,在相邻帧中对应频域分量的原始相位的基础上,进行相位补偿。
[0167] 关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
[0168] 本实施例中的装置,通过对预存声浪的第一音频信号中的多帧信号进行时域到频域的变换,以得到所述多帧信号的各频域分量。对至少一频域分量,根据工况参数对应的转换系数,在相邻帧中对应频域分量的原始相位的基础上,以及,同一帧中不同频域分量的原始相位的基础上进行相位补偿,得到目标相位。进而根据目标相位进行频域到时域的变换,以及信号长度调整得到信号长度与所述第一音频信号匹配的目标音频信号。由于在相位补偿时,不仅在时域上基于相邻帧中对应频域分量进行相位补偿,而且在时域上基于同一帧中不同频域分量进行相位补偿,从而可以对时变正弦信号和非正弦信号进行移频处理,解决了相关技术中适用性较差的技术问题。
[0169] 图7是根据一示例性实施例示出的一种车辆700的框图。例如,车辆700可以是混合动力车辆,也可以是非混合动力车辆、电动车辆、燃料电池车辆或者其他类型的车辆。车辆700可以是自动驾驶车辆、半自动驾驶车辆或者非自动驾驶车辆。
[0170] 参照图7,车辆700可包括各种子系统,例如,信息娱乐系统710、感知系统720、决策控制系统730、驱动系统740以及计算平台750。其中,车辆700还可以包括更多或更少的子系统,并且每个子系统都可包括多个部件。另外,车辆700的每个子系统之间和每个部件之间可以通过有线或者无线的方式实现互连。
[0171] 在一些实施例中,信息娱乐系统710可以包括通信系统,娱乐系统以及导航系统等。
[0172] 感知系统720可以包括若干种传感器,用于感测车辆700周边的环境的信息。例如,感知系统720可包括全球定位系统(全球定位系统可以是GPS系统,也可以是北斗系统或者其他定位系统)、惯性测量单元(inertial measurement unit,IMU)、激光雷达、毫米波雷达、超声雷达以及摄像装置。
[0173] 决策控制系统730可以包括计算系统、整车控制器、转向系统、油门以及制动系统。
[0174] 驱动系统740可以包括为车辆700提供动力运动的组件。在一个实施例中,驱动系统740可以包括引擎、能量源、传动系统和车轮。引擎可以是内燃机、电动机、空气压缩引擎中的一种或者多种的组合。引擎能够将能量源提供的能量转换成机械能量。
[0175] 车辆700的部分或所有功能受计算平台750控制。计算平台750可包括至少一个处理器751和存储器752,处理器751可以执行存储在存储器752中的指令753。
[0176] 处理器751可以是任何常规的处理器,诸如商业可获得的CPU。处理器还可以包括诸如图像处理器(Graphic Process Unit,GPU),现场可编程门阵列(FieldProgrammable Gate Array,FPGA)、片上系统(System on Chip,SOC)、专用集成芯片(Application Specific Integrated Circuit,ASIC)或它们的组合。
[0177] 存储器752可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
[0178] 除了指令753以外,存储器752还可存储数据,例如道路地图,路线信息,车辆的位置、方向、速度等数据。存储器752存储的数据可以被计算平台750使用。
[0179] 在本公开实施例中,处理器751可以执行指令753,以完成上述的声浪合成方法的全部或部分步骤。
[0180] 本公开还提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开提供的声浪合成方法的步骤。
[0181] 本实施例提供的车辆和计算机可读存储介质,通过执行前述处理方法中对预存声浪的第一音频信号中的多帧信号进行时域到频域的变换,以得到所述多帧信号的各频域分量。对至少一频域分量,根据工况参数对应的转换系数,在相邻帧中对应频域分量的原始相位的基础上,以及,同一帧中不同频域分量的原始相位的基础上进行相位补偿,得到目标相位。进而根据目标相位进行频域到时域的变换,以及信号长度调整得到信号长度与所述第一音频信号匹配的目标音频信号。由于在相位补偿时,不仅在时域上基于相邻帧中对应频域分量进行相位补偿,而且在时域上基于同一帧中不同频域分量进行相位补偿,从而可以对时变正弦信号和非正弦信号进行移频处理,解决了相关技术中适用性较差的技术问题。
[0182] 本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
[0183] 应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。