首页 / 用于发音训练的教学辅助系统及其方法

用于发音训练的教学辅助系统及其方法实质审查 发明

技术领域

[0001] 本申请涉及智能辅助领域,且更为具体地,涉及一种用于发音训练的教学辅助系统及其方法。

相关背景技术

[0002] 发音准确和流利是有效的语言交流的关键。学生在练习发音和语言表达的时候,会导致发音错误,发音不够准确,从而影响口语的准确表达和与他人之间的交流。但由于现有的技术中对学生的发音很难准确地判断是否发音正确,进而进行正确的纠正,使他们能够清晰地表达,减少交流过程中的误解。
[0003] 因此,期待一种优化的用于发音训练的教学辅助方案。

具体实施方式

[0033] 下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
[0034] 申请概述
[0035] 如上所述,发音的准确是进行语言交流和表达的重要因素之一。学生在练习发音训练的时候,会导致发音不够准确,发音语速不同等等的原因,导致在和人交流的过程中,无法准确地表达出自己所想,造成他人的误解。但由于现有的技术无法精准的对学生的发音训练有一个反馈结果,判断是否发音准确,进而进行纠正和针对性训练。因此,期待一种优化的用于发音训练的教学辅助方案。
[0036] 针对上述技术问题,本申请的申请人通过获取发音语音信号和发音语音信号的波形图,分别通过卷积神经网络模型进行特征提取,然后进行空间关联,以得到用于表示发音是否准确的分类结果。
[0037] 相应地,在本申请的技术方案中,考虑到发音语音信号,可以分析发音的声音特征,例如音高、音量、音调等,从而评估发音的准确性。同时,发音语音信号的波形图,可以观察声音的时域特征,例如声音的起伏、持续时间等,从而更全面地了解发音的表现。因此,通过获取语音信号和波形图,可以为学生提供准确的发音反馈和个性化的发音训练。
[0038] 近年来,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
[0039] 具体地,在本申请的技术方案中,首先,获取发音语音信号和发音语音信号的波形图。考虑到傅里叶变换可以将一个信号分解成一系列不同频率的正弦和余弦函数的叠加,这些正弦和余弦函数被称为频域成分或频谱。具体地,通过傅里叶变换,可以获得发音语音信号在不同频率上的能量分布情况。这些频域特征可以提供关于发音的声音特性的更详细信息,例如音高、共振峰、谐波等。通过分析这些特征,可以更准确地评估发音的准确性,并提供针对性的发音训练建议。进一步地,傅里叶变换还可以帮助去除发音语音信号中的噪音或干扰,提高发音准确性评估和训练的准确性。通过去除不相关的频域成分,可以更好地聚焦于与发音相关的特征。因此,对所述发音语音信号进行傅里叶变换以得到多个频域特征值,以提取发音语音信号的频域特征,并为学生提供更全面、准确的发音训练和反馈。
[0040] 接着,考虑通过将频域特征值排列为特征向量,我们可以将不同的频域特征组织在一起,形成一个更维度明确的数据结构。这样的数据结构可以更好地被机器学习算法所理解和处理。特征向量可以作为输入,传递给卷积神经网络等模型进行特征编码和分类。特征向量的排列还可以帮助保留特征之间的关系和上下文信息。在本技术方案中,在发音辅助教学中,不同频域特征之间可能存在一定的相关性,特征向量的排列可以更好地捕捉到这些相关性,提供更丰富的信息。此外,将频域特征值排列为特征向量还可以方便进行特征的标准化和归一化处理,以确保不同特征之间的尺度一致性,避免某些特征对模型训练的影响过大。因此,将多个频域特征值排列为频域特征向量有助于提供更结构化、一致性和信息丰富的数据表示形式,以支持后续的特征编码和分类任务。
[0041] 然后,考虑到对于语音信号的频域特征,卷积神经网络可以有效地捕捉到局部和全局的频域特征模式,提取出有用的信息。具体地,卷积神经网络通过多层卷积和池化操作,可以逐渐提取出不同层次的抽象特征,从低级的局部特征到高级的全局特征。这些特征可以用于区分不同的语音发音特征,例如音高、音色、共振等。通过训练卷积神经网络,它可以自动学习到最佳的特征表示,从而提高发音准确性评估的准确性和鲁棒性。此外,卷积神经网络还具有并行计算的能力,可以高效地处理大规模的语音数据。这对于实时性要求较高的发音辅助教学训练非常重要。通过将频域特征向量作为输入,卷积神经网络可以快速地对发音进行评估和反馈,提供即时的发音训练效果。
[0042] 因此,将所述频域特征向量通过作为特征提取器的卷积神经网络模型以得到语音频域特征向量,可以有效地提高发音准确性评估的准确性、实时性和自适应性,为学生提供准确的发音反馈和个性化的发音训练,帮助提高语言交流能力。
[0043] 接着,考虑到波形图是语音信号在时间域上的表示,它包含了语音信号的振幅和时域变化信息。然而,直接使用波形图作为输入进行发音准确性评估存在一些挑战。首先,波形图的维度较高,需要大量的计算资源和存储空间。其次,波形图中的噪音和冗余信息可能会干扰发音特征的提取和准确性评估。在本技术方案中,通过将波形图通过卷积神经网络进行特征提取,可以解决上述问题。卷积神经网络可以自动学习到波形图中的抽象特征,例如语音的频率、语调、音素等。通过多层卷积和池化操作,网络可以逐渐提取出更高级别的特征,从而减少特征的维度并去除冗余信息。这些特征向量可以更好地表示发音的关键特征,例如音素的发音位置、持续时间和强度等。
[0044] 此外,卷积神经网络还可以通过训练来适应不同的发音样本和个体差异,提高发音准确性评估的自适应性。通过对大量的发音样本进行训练,网络可以学习到发音的一般规律,并根据个体差异进行调整,从而更准确地评估发音的正确与否。因此,将所述发音语音信号的波形图通过作为过滤器的卷积神经网络模型以得到发音语音特征向量,可以提取出有用的语音特征,减少冗余信息,提高发音准确性评估的准确性和自适应性。
[0045] 然后,对所述语音频域特征向量和所述发音语音特征向量进行关联以得到分类特征向量。考虑到在发音辅助教学训练中,语音频域特征向量和发音语音特征向量是两种不同的特征表示方式。语音频域特征向量可以捕捉到语音信号的频谱信息,而发音语音特征向量则可以表示发音的特定特征模式。通过进行关联,将这两种不同的特征表示方式结合起来,可以获得更全面和丰富的特征信息。关联的目的是将两种特征表示方式中的相关信息进行融合,以便更好地描述发音的特征和模式。具体地,通过关联,可以将语音频域特征向量和发音语音特征向量进行组合,形成一个分类特征向量。这个分类特征向量可以包含更多的特征信息,能够更准确地描述发音的特征和模式。基于这个分类特征向量,可以进行发音准确性评估和发音训练,提供准确的发音反馈和个性化的发音训练。因此,对所述语音频域特征向量和所述发音语音特征向量进行关联以得到分类特征向量,可以提高发音准确性评估的准确性。进一步地,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示发音是否准确。
[0046] 特别地,语音频域特征向量和发音语音特征向量是从不同的尺度或角度来提取游戏特征的。通过对它们进行关联和融合,可以获得多尺度的特征表达,有效地捕捉游戏特征在不同尺度上的变化和相关性。这有助于提高特征的鲁棒性和泛化能力,从而提升分类的性能。进一步地,考虑到语音频域特征向量和发音语音特征向量分别表示不同的语义信息。通过对这两个特征向量进行特征空间关联,可以综合利用它们所包含的不同信息,并得到更加丰富和全面的分类特征向量。这样的综合特征能够更好地反映游戏的潜在特性和特征的相关性。
[0047] 对语音频域特征向量和发音语音特征向量进行特征向量间的特征空间关联以得到分类特征向量,包括:计算所述语音频域特征向量和所述发音语音特征向量之间的内积;响应于所述语音频域特征向量和所述发音语音特征向量之间的内积为零,将所述语音频域特征向量和所述发音语音特征向量作为分类特征向量的基底;响应于所述语音频域特征向量和所述发音语音特征向量之间的内积不为零,对所述语音频域特征向量和所述发音语音特征向量进行施密特正交化以得到正交的第一单位特征向量和第二单位特征向量;以误差最小化来融合所述第一单位特征向量和所述第二单位特征向量以得到所述分类特征向量。
[0048] 对所述语音频域特征向量和所述发音语音特征向量进行特征向量间的特征空间关联,以利用特征向量之间的内积来分析和表征特征向量间的空间关联结构和特性,并且在特征向量间不存在规范化结构关联时,通过施密特正交化来构造正交的单位特征向量,并基于误差最小化来融合所述第一单位特征向量和所述第二单位特征向量以得到所述分类特征向量,这样,保留源域特征向量的主要特征和结构且利用特征向量间特征关联模式特征来进行强化融合以捕捉到数据的主要变化趋势和次要变化趋势,从而减少信息的损失。
[0049] 基于此,本申请提供了一种用于发音训练的教学辅助系统,其包括:发音语音信号采集模块,用于获取发音语音信号和发音语音信号的波形图;域变换模块,用于对所述发音语音信号进行傅里叶变换以得到多个频域特征值;排列模块,用于将所述多个频域特征值排列为频域特征向量;语音频域特征提取模块,用于将所述频域特征向量通过作为特征提取器的卷积神经网络模型以得到语音频域特征向量;发音语音特征提取模块,用于将所述发音语音信号的波形图通过作为过滤器的卷积神经网络模型以得到发音语音特征向量;空间关联模块,用于对语音频域特征向量和发音语音特征向量进行特征向量间的特征空间关联以得到分类特征向量;以及,分类结果模块,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示发音是否准确。
[0050] 在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
[0051] 示例性系统
[0052] 图1为根据本申请实施例的用于发音训练的教学辅助系统的框图。如图1所示,根据本申请实施例的用于发音训练的教学辅助系统100,包括:发音语音信号采集模块110,用于获取发音语音信号和发音语音信号的波形图;域变换模块120,用于对所述发音语音信号进行傅里叶变换以得到多个频域特征值;排列模块130,用于将所述多个频域特征值排列为频域特征向量;语音频域特征提取模块140,用于将所述频域特征向量通过作为特征提取器的卷积神经网络模型以得到语音频域特征向量;发音语音特征提取模块150,用于将所述发音语音信号的波形图通过作为过滤器的卷积神经网络模型以得到发音语音特征向量;空间关联模块160,用于对语音频域特征向量和发音语音特征向量进行特征向量间的特征空间关联以得到分类特征向量;以及,分类结果模块170,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示发音是否准确。
[0053] 图2为根据本申请实施例的用于发音训练的教学辅助系统的架构示意图。如图2所示,首先,获取发音语音信号和发音语音信号的波形图。接着,对所述发音语音信号进行傅里叶变换以得到多个频域特征值。然后,将所述多个频域特征值排列为频域特征向量。接着,将所述频域特征向量通过作为特征提取器的卷积神经网络模型以得到语音频域特征向量。然后,将所述发音语音信号的波形图通过作为过滤器的卷积神经网络模型以得到发音语音特征向量。接着,对语音频域特征向量和发音语音特征向量进行特征向量间的特征空间关联以得到分类特征向量;。最后,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示发音是否准确。
[0054] 在本申请实施例中,所述发音语音信号采集模块110,用于获取发音语音信号和发音语音信号的波形图。虑到发音语音信号,可以分析发音的声音特征,例如音高、音量、音调等,从而评估发音的准确性。同时,发音语音信号的波形图,可以观察声音的时域特征,例如声音的起伏、持续时间等,从而更全面地了解发音的表现。因此,通过获取语音信号和波形图,可以为学生提供准确的发音反馈和个性化的发音训练。
[0055] 在本申请实施例中,所述域变换模块120,用于对所述发音语音信号进行傅里叶变换以得到多个频域特征值。考虑到傅里叶变换可以将一个信号分解成一系列不同频率的正弦和余弦函数的叠加,这些正弦和余弦函数被称为频域成分或频谱。具体地,通过傅里叶变换,可以获得发音语音信号在不同频率上的能量分布情况。这些频域特征可以提供关于发音的声音特性的更详细信息,例如音高、共振峰、谐波等。通过分析这些特征,可以更准确地评估发音的准确性,并提供针对性的发音训练建议。进一步地,傅里叶变换还可以帮助去除发音语音信号中的噪音或干扰,提高发音准确性评估和训练的准确性。通过去除不相关的频域成分,可以更好地聚焦于与发音相关的特征。因此,对所述发音语音信号进行傅里叶变换以得到多个频域特征值,以提取发音语音信号的频域特征,并为学生提供更全面、准确的发音训练和反馈。
[0056] 在本申请实施例中,所述排列模块130,用于将所述多个频域特征值排列为频域特征向量。考虑通过将频域特征值排列为特征向量,我们可以将不同的频域特征组织在一起,形成一个更维度明确的数据结构。这样的数据结构可以更好地被机器学习算法所理解和处理。特征向量可以作为输入,传递给卷积神经网络等模型进行特征编码和分类。特征向量的排列还可以帮助保留特征之间的关系和上下文信息。在本技术方案中,在发音辅助教学中,不同频域特征之间可能存在一定的相关性,特征向量的排列可以更好地捕捉到这些相关性,提供更丰富的信息。此外,将频域特征值排列为特征向量还可以方便进行特征的标准化和归一化处理,以确保不同特征之间的尺度一致性,避免某些特征对模型训练的影响过大。因此,将多个频域特征值排列为频域特征向量有助于提供更结构化、一致性和信息丰富的数据表示形式,以支持后续的特征编码和分类任务。
[0057] 在本申请实施例中,所述语音频域特征提取模块140,用于将所述频域特征向量通过作为特征提取器的卷积神经网络模型以得到语音频域特征向量。然后,考虑到对于语音信号的频域特征,卷积神经网络可以有效地捕捉到局部和全局的频域特征模式,提取出有用的信息。具体地,卷积神经网络通过多层卷积和池化操作,可以逐渐提取出不同层次的抽象特征,从低级的局部特征到高级的全局特征。这些特征可以用于区分不同的语音发音特征,例如音高、音色、共振等。通过训练卷积神经网络,它可以自动学习到最佳的特征表示,从而提高发音准确性评估的准确性和鲁棒性。此外,卷积神经网络还具有并行计算的能力,可以高效地处理大规模的语音数据。这对于实时性要求较高的发音辅助教学训练非常重要。通过将频域特征向量作为输入,卷积神经网络可以快速地对发音进行评估和反馈,提供即时的发音训练效果。因此,将所述频域特征向量通过作为特征提取器的卷积神经网络模型以得到语音频域特征向量,可以有效地提高发音准确性评估的准确性、实时性和自适应性,为学生提供准确的发音反馈和个性化的发音训练,帮助提高语言交流能力。
[0058] 具体地,在本申请实施例中,所述语音频域特征提取模块,用于:使用所述作为特征提取器的卷积神经网络模型的各层在层的正向传递中对输入数据分别进行:对所述输入数据进行基于一维卷积核的卷积处理以得到卷积特征图;对所述卷积特征图进行基于特征矩阵的池化处理以得到池化特征图;对所述池化特征图进行非线性激活以得到激活特征图;其中,所述作为特征提取器的卷积神经网络模型的第一层的输入为所述频域特征向量,所述作为特征提取器的卷积神经网络模型的最后一层的输出为所述语音频域特征向量。
[0059] 在本申请实施例中,所述发音语音特征提取模块150,用于将所述发音语音信号的波形图通过作为过滤器的卷积神经网络模型以得到发音语音特征向量。考虑到波形图是语音信号在时间域上的表示,它包含了语音信号的振幅和时域变化信息。然而,直接使用波形图作为输入进行发音准确性评估存在一些挑战。首先,波形图的维度较高,需要大量的计算资源和存储空间。其次,波形图中的噪音和冗余信息可能会干扰发音特征的提取和准确性评估。在本技术方案中,通过将波形图通过卷积神经网络进行特征提取,可以解决上述问题。卷积神经网络可以自动学习到波形图中的抽象特征,例如语音的频率、语调、音素等。通过多层卷积和池化操作,网络可以逐渐提取出更高级别的特征,从而减少特征的维度并去除冗余信息。这些特征向量可以更好地表示发音的关键特征,例如音素的发音位置、持续时间和强度等。此外,卷积神经网络还可以通过训练来适应不同的发音样本和个体差异,提高发音准确性评估的自适应性。通过对大量的发音样本进行训练,网络可以学习到发音的一般规律,并根据个体差异进行调整,从而更准确地评估发音的正确与否。因此,将所述发音语音信号的波形图通过作为过滤器的卷积神经网络模型以得到发音语音特征向量,可以提取出有用的语音特征,减少冗余信息,提高发音准确性评估的准确性和自适应性。
[0060] 具体地,在本申请实施例中,所述发音语音特征提取模块,用于:使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行:基于卷积核对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图的通道维度的各个特征矩阵进行全局均值池化以得到池化特征图;以及,对所述池化特征图中各个位置的特征值进行非线性激活以生成激活特征增图;其中,所述作为过滤器的卷积神经网络的最后一层的输出为所述发音语音特征向量,所述作为过滤器的卷积神经网络的第二层至最后一层的输入为上一层的输出,所述作为过滤器的卷积神经网络的第一层的输入为所述发音语音信号波形图。
[0061] 在本申请实施例中,所述空间关联模块160,用于对语音频域特征向量和发音语音特征向量进行特征向量间的特征空间关联以得到分类特征向量。
[0062] 特别地,语音频域特征向量和发音语音特征向量是从不同的尺度或角度来提取游戏特征的。通过对它们进行关联和融合,可以获得多尺度的特征表达,有效地捕捉游戏特征在不同尺度上的变化和相关性。这有助于提高特征的鲁棒性和泛化能力,从而提升分类的性能。进一步地,考虑到语音频域特征向量和发音语音特征向量分别表示不同的语义信息。通过对这两个特征向量进行特征空间关联,可以综合利用它们所包含的不同信息,并得到更加丰富和全面的分类特征向量。这样的综合特征能够更好地反映游戏的潜在特性和特征的相关性。
[0063] 图3为根据本申请实施例的用于发音训练的教学辅助系统中空间关联模块的框图。具体地,在本申请实施例中,如图3所示,所述空间关联模块160,包括:内积计算单元161,用于计算所述语音频域特征向量和所述发音语音特征向量之间的内积;基底构造单元
162,用于响应于所述语音频域特征向量和所述发音语音特征向量之间的内积为零,将所述语音频域特征向量和所述发音语音特征向量作为分类特征向量的基底;施密特正交化单元
163,用于响应于所述语音频域特征向量和所述发音语音特征向量之间的内积不为零,对所述语音频域特征向量和所述发音语音特征向量进行施密特正交化以得到正交的第一单位特征向量和第二单位特征向量;以及,融合单元164,用于以误差最小化来融合所述第一单位特征向量和所述第二单位特征向量以得到所述分类特征向量。
[0064] 更具体地,在本申请实施例中,所述误差最小化,包括:在某些情况下通过分类特征向量来最小化与原始特征向量之间的误差。可以使用最小二乘法或其他优化方法来确定权重,使得分类特征向量与原始特征向量之间的误差最小化。
[0065] 对所述语音频域特征向量和所述发音语音特征向量进行特征向量间的特征空间关联,以利用特征向量之间的内积来分析和表征特征向量间的空间关联结构和特性,并且在特征向量间不存在规范化结构关联时,通过施密特正交化来构造正交的单位特征向量,并基于误差最小化来融合所述第一单位特征向量和所述第二单位特征向量以得到所述分类特征向量,这样,保留源域特征向量的主要特征和结构且利用特征向量间特征关联模式特征来进行强化融合以捕捉到数据的主要变化趋势和次要变化趋势,从而减少信息的损失。
[0066] 在本申请实施例中,所述分类结果模块170,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示发音是否准确。
[0067] 图4为根据本申请实施例的用于发音训练的教学辅助系统中分类结果模块的框图。具体地,在本申请实施例中,如图4所示,所述分类结果模块170,包括:全连接编码单元171,用于使用所述分类器的全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,分类结果生成单元172,用于将所述编码分类特征向量输入所述分类器的Softmax分类函数以得到所述分类结果。
[0068] 综上,基于本申请实施例的用于发音训练的教学辅助系统100被阐明,其采用基于深度神经网络模型的人工智能技术,获取发音语音信号和发音语音信号的波形图,分别通过卷积神经网络模型进行特征提取,然后进行空间关联,以得到用于表示发音是否准确的分类结果。进而可以提供客观的反馈,帮助学生了解他们的发音问题,并针对性地进行训练和改进。
[0069] 示例性方法
[0070] 图5为根据本申请实施例的用于发音训练的教学辅助方法的流程图。如图5所示,根据本申请实施例的用于发音训练的教学辅助方法,包括:S110,获取发音语音信号和发音语音信号的波形图;S120,对所述发音语音信号进行傅里叶变换以得到多个频域特征值;S130,将所述多个频域特征值排列为频域特征向量;S140,将所述频域特征向量通过作为特征提取器的卷积神经网络模型以得到语音频域特征向量;S150,将所述发音语音信号的波形图通过作为过滤器的卷积神经网络模型以得到发音语音特征向量;S160,对语音频域特征向量和发音语音特征向量进行特征向量间的特征空间关联以得到分类特征向量;以及,S170,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示发音是否准确。
[0071] 在一个示例中,在上述用于发音训练的教学辅助方法中,将所述频域特征向量通过作为特征提取器的卷积神经网络模型以得到语音频域特征向量,包括:使用所述作为特征提取器的卷积神经网络模型的各层在层的正向传递中对输入数据分别进行:对所述输入数据进行基于一维卷积核的卷积处理以得到卷积特征图;对所述卷积特征图进行基于特征矩阵的池化处理以得到池化特征图;对所述池化特征图进行非线性激活以得到激活特征图;其中,所述作为特征提取器的卷积神经网络模型的第一层的输入为所述频域特征向量,所述作为特征提取器的卷积神经网络模型的最后一层的输出为所述语音频域特征向量。
[0072] 在一个示例中,在上述用于发音训练的教学辅助方法中,将所述发音语音信号的波形图通过作为过滤器的卷积神经网络模型以得到发音语音特征向量,包括:使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行:基于卷积核对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图的通道维度的各个特征矩阵进行全局均值池化以得到池化特征图;以及,对所述池化特征图中各个位置的特征值进行非线性激活以生成激活特征增图;其中,所述作为过滤器的卷积神经网络的最后一层的输出为所述发音语音特征向量,所述作为过滤器的卷积神经网络的第二层至最后一层的输入为上一层的输出,所述作为过滤器的卷积神经网络的第一层的输入为所述发音语音信号波形图。
[0073] 这里,本领域技术人员可以理解,上述用于发音训练的教学辅助方法中的各个步骤的具体操作已经在上面参考图1到图4的用于发音训练的教学辅助系统的描述中得到了详细介绍,并因此,将省略其重复描述。
[0074] 示例性电子设备
[0075] 下面,参考图6来描述根据本申请实施例的电子设备。图6为根据本申请实施例的电子设备的框图。如图6所示,电子设备10包括一个或多个处理器11和存储器12。
[0076] 处理器11可以是中央处理模块(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理模块,并且可以控制电子设备10中的其他组件以执行期望的功能。
[0077] 存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的用于发音训练的教学辅助系统及其方法中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如发音语音信号和发音语音信号的波形图等各种内容。
[0078] 在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
[0079] 该输入装置13可以包括例如键盘、鼠标等等。
[0080] 该输出装置14可以向外部输出各种信息,包括分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
[0081] 当然,为了简化,图6中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
[0082] 示例性计算机程序产品和计算机可读存储介质
[0083] 除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的用于发音训练的教学辅助方法中的功能中的步骤。
[0084] 所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
[0085] 此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的用于发音训练的教学辅助方法中的功能中的步骤。
[0086] 所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD‑ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0087] 以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
[0088] 本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
[0089] 还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
[0090] 提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
[0091] 为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
[0092] 以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
[0093] 本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
[0094] 还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
[0095] 提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
[0096] 为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

当前第1页 第1页 第2页 第3页