一种语音质检方法、装置、计算机设备和存储介质

一种语音质检方法、装置、计算机设备和存储介质实质审查发明

具体技术细节

[0003] 基于此，有必要针对上述技术问题，提供一种改善人工语音质检效果不佳的语音质检方法、装置、计算机设备和存储介质。

[0004] 一方面，提供一种语音质检方法，所述语音质检方法包括：

[0005] 将语音数据转换为文本数据，对所述文本数据进行断句处理，获取文本片段；

[0006] 根据任务类型配置关键词类型，并检索所述关键词类型对应的关键词，更新关键词库；

[0007] 从所述关键词库中选取关键词文本，与所述文本片段进行比较，获取关键词文本的匹配信息；

[0008] 根据所述关键词文本的匹配信息，与所选关键词文本的数量进行比较，获取所述关键词类型的匹配系数；

[0009] 根据所述关键词类型的匹配系数，与预设的匹配阈值进行比较，获取所述任务类型的质检结果。

[0010] 在其中一个实施例中，所述根据任务类型配置关键词类型，并检索所述关键词类型对应的关键词，更新关键词库的步骤包括：

[0011] 根据任务类型配置关键词类型，其中所述关键词类型包括：标准关键词、禁语关键词、情感关键词；

[0012] 检索各关键词类型的含义和应用场景，获取所对应的关键词；

[0013] 根据所述关键词，更新关键词库。

[0014] 在其中一个实施例中，从所述关键词库中选取关键词文本，与所述文本片段进行比较，获取关键词文本的匹配信息的步骤包括：

[0015] 根据所述关键词库，对于各关键词类型分别选取至少一个关键词文本，构成各关键词类型的单条配置；

[0016] 将所述单条配置从所述文本片段的首个分句开始进行内容匹配和遍历，若所述分句与所述单条配置中的关键词文本存在匹配关系，则记录所述分句处于文本片段中的序号，获取关键词文本的匹配位置；

[0017] 记录所述分句与所述单条配置形成匹配关系的关键词文本数量，若单条配置内的同一个关键词文本在同一分句中重复出现多次，则对该关键词文本数量只计数一次，根据所述关键词文本数量，获取关键词文本的匹配次数；

[0018] 根据所述关键词文本的匹配位置与所述关键词文本的匹配次数，获取关键词文本的匹配信息。

[0019] 在其中一个实施例中，根据所述关键词文本的匹配信息，与所选关键词文本的数量进行比较，获取所述关键词类型的匹配系数的步骤包括：

[0020] 根据所述关键词文本的匹配信息，对匹配次数进行排序，根据排序中数值最大的匹配次数，获取最大匹配次数；

[0021] 将所述最大匹配次数除以所选关键词文本的个数，获取单条配置的匹配系数；

[0022] 对各单条配置设定采样权重，通过所述采样权重与所述单条配置匹配系数，获取单条配置采样系数，单条配置采样系数sp的数学表达式为：

[0023] sp＝w*p

[0024] 其中，sp为所述单条配置采样系数，w为单条配置采样权重，p为单条配置匹配系数；

[0025] 将所述单条配置采样系数与预设的单条配置匹配阈值进行比较，获取关键词类型的匹配系数S，关键词类型匹配系数S的数学表达式为：

[0026]

[0027] 其中，S为所述关键词类型匹配系数，sp为单条配置采样系数，t为单条配置匹配阈值，max(·)表示取最大值,d(·)为微分运算符。

[0028] 在其中一个实施例中，根根据所述关键词类型的匹配系数，与预设的匹配阈值进行比较，获取所述任务类型的质检结果的步骤包括：

[0029] 根据各关键词类型的匹配系数，分别与预设的各匹配阈值进行比较，获取质检结果。

[0030] 在其中一个实施例中，根根据所述关键词类型的匹配系数，与预设的匹配阈值进行比较，获取所述任务类型的质检结果的步骤还包括：

[0031] 对各关键词类型设定采样权重，根据所述采样权重与所述关键词类型的匹配系数，获取采样系数；

[0032] 将所述采样系数与预设的匹配阈值进行比较，获取质检结果。

[0033] 在其中一个实施例中，将语音数据转换为文本数据，对所述文本数据进行断句处理，获取文本片段的步骤包括：

[0034] 分离所述语音数据中的静音内容与语音内容，并获取时间分离标签；

[0035] 根据所述时间分离标签对所述文本数据进行断句，根据句末的色彩关词汇，在句末添加标点符号；

[0036] 对所述文本数据中无标点符号的文本进行字数查询，当无标点符号的文本超过预设字数阈值时，添加标点符号。

[0037] 另一方面，提供了一种语音质检装置，所述语音质检装置包括：

[0038] 语音转换文本模块，用于将语音数据转换为文本数据，对所述文本数据进行断句处理，获取文本片段；

[0039] 任务参数配置模块，用于根据任务类型配置关键词类型，并检索所述关键词类型对应的关键词，更新关键词库；

[0040] 匹配信息获取模块，用于从所述关键词库中选取关键词文本，与所述文本片段进行比较，获取关键词文本的匹配信息；

[0041] 匹配系数获取模块，用于根据所述关键词文本的匹配信息，与所选关键词文本的数量进行比较，获取所述关键词类型的匹配系数；

[0042] 质检结果获取模块，用于根据所述关键词类型的匹配系数，与预设的匹配阈值进行比较，获取所述任务类型的质检结果。

[0043] 另一方面，提供了一种语音质检装置，所述语音质检装置包括质检结果获取模块，所述质检结果获取模块包括：

[0044] 第一获取单元，用于根据各关键词类型的匹配系数，分别与预设的各匹配阈值进行比较，获取质检结果。

[0045] 另一方面，提供了一种语音质检装置，所述语音质检装置包括质检结果获取模块，所述质检结果获取模块还包括：

[0046] 第一获取单元，用于对各关键词类型设定采样权重，根据所述采样权重与所述关键词类型的匹配系数，获取采样系数；

[0047] 第二获取单元，用于将所述采样系数与预设的匹配阈值进行比较，获取质检结果。

[0048] 再一方面，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

[0049] 将语音数据转换为文本数据，对所述文本数据进行断句处理，获取文本片段；

[0050] 根据任务类型配置关键词类型，并检索所述关键词类型对应的关键词，更新关键词库；

[0051] 从所述关键词库中选取关键词文本，与所述文本片段进行比较，获取关键词文本的匹配信息；

[0052] 根据所述关键词文本的匹配信息，与所选关键词文本的数量进行比较，获取所述关键词类型的匹配系数；

[0053] 根据所述关键词类型的匹配系数，与预设的匹配阈值进行比较，获取所述任务类型的质检结果。

[0054] 又一方面，提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

[0055] 将语音数据转换为文本数据，对所述文本数据进行断句处理，获取文本片段；

[0056] 根据任务类型配置关键词类型，并检索所述关键词类型对应的关键词，更新关键词库；

[0057] 从所述关键词库中选取关键词文本，与所述文本片段进行比较，获取关键词文本的匹配信息；

[0058] 根据所述关键词文本的匹配信息，与所选关键词文本的数量进行比较，获取所述关键词类型的匹配系数；

[0059] 根据所述关键词类型的匹配系数，与预设的匹配阈值进行比较，获取所述任务类型的质检结果。

[0060] 上述一种语音质检方法、装置、计算机设备和存储介质，按任务类型设置关键词类型，选取关键词文本与客服语音文本进行比较，获取匹配信息与匹配系数对客服语音质检结果进行判断，可避免人工质检方式存在的缺陷，并降低企业成本，提升语音质检效率，实现客服绩效考核、客户服务满意度系统化。

法律保护范围

涉及权利要求数量10：其中独权4项，从权-4项

1.一种语音质检方法，其特征在于，包括：
将语音数据转换为文本数据，对所述文本数据进行断句处理，获取文本片段；
根据任务类型配置关键词类型，并检索所述关键词类型对应的关键词，更新关键词库；
从所述关键词库中选取关键词文本，与所述文本片段进行比较，获取关键词文本的匹配信息；
根据所述关键词文本的匹配信息，与所选关键词文本的数量进行比较，获取所述关键词类型的匹配系数；
根据所述关键词类型的匹配系数，与预设的匹配阈值进行比较，获取所述任务类型的质检结果。
2.根据权利要求1所述的语音质检方法，其特征在于，所述根据任务类型配置关键词类型，并检索所述关键词类型对应的关键词，更新关键词库的步骤包括：
根据任务类型配置关键词类型，其中所述关键词类型包括：标准关键词、禁语关键词、情感关键词；
根据各关键词类型的含义和应用场景，获取所对应的关键词；
根据所述关键词，更新关键词库。
3.根据权利要求1所述的语音质检方法，其特征在于，从所述关键词库中选取关键词文本，与所述文本片段进行比较，获取关键词文本的匹配信息的步骤包括：
根据所述关键词库，对于各关键词类型分别选取至少一个关键词文本，构成各关键词类型的单条配置；
将所述单条配置从所述文本片段的首个分句开始进行内容匹配和遍历，若所述分句与所述单条配置中的关键词文本存在匹配关系，则记录所述分句处于文本片段中的序号，获取关键词文本的匹配位置；
记录所述分句与所述单条配置形成匹配关系的关键词文本数量，若单条配置内的同一个关键词文本在同一分句中重复出现多次，则对该关键词文本数量只计数一次，根据所述关键词文本数量，获取关键词文本的匹配次数；
根据所述关键词文本的匹配位置与所述关键词文本的匹配次数，获取关键词文本的匹配信息。
4.根据权利要求1或3所述的语音质检方法，其特征在于，根据所述关键词文本的匹配信息，与所选关键词文本的数量进行比较，获取所述关键词类型的匹配系数的步骤包括：
根据所述关键词文本的匹配信息，对匹配次数进行排序，根据排序中数值最大的匹配次数，获取最大匹配次数；
将所述最大匹配次数除以所选关键词文本的个数，获取单条配置的匹配系数；
对各单条配置设定采样权重，通过所述采样权重与所述单条配置匹配系数，获取单条配置采样系数，单条配置采样系数sp的数学表达式为：
sp＝w*p
其中，sp为所述单条配置采样系数，w为单条配置采样权重，p为单条配置匹配系数；
将所述单条配置采样系数与预设的单条配置匹配阈值进行比较，获取关键词类型的匹配系数，关键词类型匹配系数S的数学表达式为：
其中，S为所述关键词类型匹配系数，sp为单条配置采样系数，t为单条配置匹配阈值，max(·)表示取最大值,d(·)为微分运算符。
5.根据权利要求1所述的语音质检方法，其特征在于，根据所述关键词类型的匹配系数，与预设的匹配阈值进行比较，获取所述任务类型的质检结果的步骤包括：
根据各关键词类型的匹配系数，分别与预设的各匹配阈值进行比较，获取质检结果。
6.根据权利要求1或5所述的语音质检方法，其特征在于，根据所述关键词类型的匹配系数，与预设的匹配阈值进行比较，获取所述任务类型的质检结果的步骤还包括：
对各关键词类型设定采样权重，根据所述采样权重与所述关键词类型的匹配系数，获取关键词类型采样系数，关键词类型采样系数SP的数学表达式为：
SP＝S*W
其中，SP为所述关键词类型采样系数，S为关键词类型的匹配系数，W为关键词类型的采样权重；
将所述采样系数与预设的匹配阈值进行比较，获取质检结果。
7.根据权利要求1所述的语音质检方法，其特征在于，将语音数据转换为文本数据，对所述文本数据进行断句处理，获取文本片段的步骤包括：
分离所述语音数据中的静音内容与语音内容，并获取时间分离标签；
根据所述时间分离标签对所述文本数据进行断句，根据句末的色彩词汇，在句末添加标点符号；
对所述文本数据中无标点符号的文本进行字数查询，当无标点符号的文本超过预设字数阈值时，添加标点符号。
8.一种语音质检装置，其特征在于，所述装置包括：
语音转换文本模块，用于将语音数据转换为文本数据，对所述文本数据进行断句处理，获取文本片段；
任务参数配置模块，用于根据任务类型配置关键词类型，并检索所述关键词类型对应的关键词，更新关键词库；
匹配信息获取模块，用于从所述关键词库中选取关键词文本，与所述文本片段进行比较，获取关键词文本的匹配信息；
匹配系数获取模块，用于根据所述关键词文本的匹配信息，与所选关键词文本的数量进行比较，获取所述关键词类型的匹配系数；
质检结果获取模块，用于根据所述关键词类型的匹配系数，与预设的匹配阈值进行比较，获取所述任务类型的质检结果。
9.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述语音质检方法的步骤。
10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述语音质检方法的步骤。

当前第2页第1页第2页第3页