首页 / 一种语音质检方法、装置、计算机设备和存储介质

一种语音质检方法、装置、计算机设备和存储介质实质审查 发明

技术领域

[0001] 本发明涉及信息处理技术领域,特别是涉及一种语音质检方法、装置、计算机设备和存储介质。

相关背景技术

[0002] 随着信息技术的发展,客户通常与企业客服通过语音交流,进行业务咨询、意见投诉等操作。为提升语音服务质量和客户满意度,企业需要对语音客服的绩效进行评估和考核。目前,主要通过人工方式,对一个时间段内客服与客户之间产生的语音交流记录进行整理和质检。然而,随着业务量增大,人工方式存在作业步骤繁琐、执行效率低、质检质量差、人力成本高、主观性过高等缺陷,出现语音质检结果准确率低、语音客服绩效考核结果不合理等问题。

具体实施方式

[0073] 为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0074] 本申请提供的一种语音质检方法,应用流程如图1所示。例如,本申请提供的语音质检方法可应用于客服语音服务质量的检测,通过将语音数据100转换为文本数据101,并将文本数据101通过匹配步骤102获取质检结果103,可避免人工质检方式存在的缺陷,并降低企业成本,提升语音质检效率,实现客服绩效考核、客户服务满意度系统化。
[0075] 本申请提供的一种语音质检方法,可以应用于如图2所示的应用环境中。其中,终端200通过网络与服务器201进行通信。例如,本申请提供的语音质检方法,通过将语音数据转换为文本数据并进行断句处理,根据任务类型配置关键词类型,更新关键词库,从关键词库中选取关键词文本,与文本片段进行比较,然后获取关键词文本的匹配信息,根据匹配信息与所选关键词文本的数量进行比较,获取所述关键词类型的匹配系数,根据匹配系数,与预设的匹配阈值进行比较,获取所述任务类型的质检结果。其中,终端200可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、便携式可穿戴设备或者子服务器,服务器201可以用独立的服务器或者是多个服务器组成的服务器集群或者云计算平台来实现。
[0076] 在一个实施例中,如图3所示,提供了一种语音质检方法,包括以下步骤:
[0077] S1:将语音数据转换为文本数据,对所述文本数据进行断句处理,获取文本片段;
[0078] S2:根据任务类型配置关键词类型,并检索所述关键词类型对应的关键词,更新关键词库;
[0079] S3:从所述关键词库中选取关键词文本,与所述文本片段进行比较,获取关键词文本的匹配信息;
[0080] S4:根据所述关键词文本的匹配信息,与所选关键词文本的数量进行比较,获取所述关键词类型的匹配系数;
[0081] S5:据所述关键词类型的匹配系数,与预设的匹配阈值进行比较,获取所述任务类型的质检结果。
[0082] 通过上述步骤,可改善通过人工方式对客服与客户之间产生的语音交流记录进行整理和质检时,存在作业步骤繁琐、执行效率低、质检质量差、人力成本高、主观性过高等缺陷的问题,将语音数据转换为文本数据,并将文本数据与关键词库中的关键词文本进行比较,设定匹配规则,获取语音质检结果,可避免人工质检方式存在的缺陷,并降低企业成本,提升语音质检效率,实现客服绩效考核、客户服务满意度系统化。
[0083] 由于语音数据包括一段时间内客户与企业客服通过语音交流产生的双向语音记录,而对客服语音服务质量进行检测时需要区分出客户与客服不同的语音内容,并且语音内容中可能存在噪音,因此无法对通过语音数据直接转换为单一文本的文本数据进行检测,在步骤S1中,示例性地说明,可将语音数据转换为文本数据,对所述文本数据进行断句处理,获取文本片段,例如,在获取一段时间内客户与企业客服通过语音交流产生的双向语音记录后,将语音数据进行去除噪音、干扰等预处理,利用语音激活检测等训练方法对语音数据中的静音内容与语音内容进行分离,获取时间分离标签,通过维特比算法等语音识别算法对预处理后的语音数据进行识别,得到文本数据,通过自动快速识别技术等自动语音识别技术对文本数据进行角色分离,得到客户文本数据和客服文本数据,根据时间分离标签对客户文本数据和客服文本数据进行断句,并添加标点符号,根据客户文本数据和客服文本数据的色彩词汇对客户文本数据和客服文本数据进行断句,并添加标点符号,对客户文本数据和客服文本数据无标点符号的文本进行字数查询,当无标点符号的文本超过预设字数阈值时,添加标点符号,获取文本片段。
[0084] 对语音客服质量进行检测时,为了选取较新的或较合适的关键词,需要对关键词库进行更新,在步骤S2中,示例性地说明,可设置一个或多个任务类型,然后根据任务类型配置关键词类型,并检索所述关键词类型的含义和应用场景对应的常用词汇,然后将所述词汇进行组合,更新关键词库,例如,根据不同的任务类型,比如业务咨询、营销外呼、投诉建议等,配置不同的关键词类型,检索不同关键词类型的含义、应用场景等内容所对应的常用词汇,并将所述常用词汇进行组合,更新关键词库,还可以添加新的关键词至关键词库,以及对关键词库中不恰当、不常用或者分类错误的关键词进行删减,更新关键词库。
[0085] 为了检测客服与客户之间的语音交流内容是否符合要求,需要对文本数据进行关键词匹配,在步骤S3中,示例性地说明,可从所述关键词库中选取关键词文本,与所述文本片段进行比较,获取关键词文本的匹配信息。例如根据不同任务类型和不同关键词类型,从关键词库中选取一个或多个关键词文本,从所述文本片段的首个分句开始对关键词文本进行内容匹配和遍历,若分句与关键词文本存在匹配关系,则记录所述分句处于文本片段中的序号,获取匹配位置,并记录关键词文本的匹配次数。
[0086] 获取到关键词文本的匹配信息后,需要统计文本片段中各分句与单关键词文本匹配的数量,在步骤S4中,示例性地说明,可据所述匹配信息,将各分句中存在匹配关系的最大的关键词文本数量除以所选关键词文本的个数,获取关键词文本的匹配系数。
[0087] 获取关键词文本的匹配系数后,为了判断语音质检是否合格,在步骤S5中,示例性地说明,可根据所述匹配系数,与预设的匹配阈值进行比较,获取所述任务类型的质检结果,例如,根据任务类型对各关键词类型设定采样权重,所述采样权重用于表示各关键词类型在不同任务类型中的重要程度,比如对于业务咨询这一任务类型,企业可以将关键词类型中的标准关键词的权重提升,而对于投诉建议这一任务类型,企业可以将关键词类型中的禁语关键词和情感关键词的权重提升,然后根据匹配系数和采样权重,与预设的匹配阈值进行比较,获取质检结果。
[0088] 在对客户与客服之间语音交流内容进行质检之前,需要将语音数据转换为文本数据,如图4所示,将语音数据转换为文本数据,对所述文本数据进行断句处理,获取文本片段的步骤S1包括:
[0089] S11:分离所述语音数据中的静音内容与语音内容,并获取时间分离标签;
[0090] S12:根据所述时间分离标签对所述文本数据进行断句,根据句末的色彩词汇,在句末添加标点符号;
[0091] S13:对所述文本数据中无标点符号的文本进行字数查询,当无标点符号的文本超过预设字数阈值时,添加标点符号。
[0092] 通过上述步骤,可将一段时间内客服与客户之间进行的语音交流内容分割成静音内容与语音内容,同时区分客户与客服不同的语音内容,并且消除语音内容中可能存在的噪音,并对转换后的文本数据添加标点符号进行断句,提升文本数据的适用性。
[0093] 如图4所示,在步骤S11中,示例性地说明,分离所述语音数据中的静音内容与语音内容的方式,可采用语音激活检测训练法对语音数据进行检测,当检测到静音时长超过静音阈值,比如3秒的时候,记录该时间点,获取时间分离标签,利用时间分离标签将静音内容与语音内容分离,比如5秒的时候,记录该时间点,获取时间分离标签,利用时间分离标签将静音内容与语音内容分离。可针对不同语速设定不同的静音阈值,使语音数据中静音内容与语音内容的分离更合理,同时兼顾不同客户、客服进行语音交流时各自的停顿习惯,便于分离后的语音内容更适用于后续语音质检步骤。
[0094] 如图4所示,在步骤S12中,示例性地说明,当在时间分离标签处检索到具有感叹情感色彩词汇,比如:“啊”、“吧”、“嘛”等时,在句末添加感叹号,当在时间分离标签处检索到具有疑问情感色彩词汇,比如:“吗”、“什么”等时,在句末添加问号,通过该方式,可根据客户或客服的情感色彩对文本添加合适的标点符号,便于后续执行语音质检步骤。
[0095] 如图4所示,在步骤S13中,示例性地说明,对文本数据中无标点符号的文本进行字数查询,对于文本数据中的每一个句段,若其字数超过预设字数阈值,比如20个字时,添加句号进行断句,否则添加逗号进行断句,文本数据中最后一个句段直接添加句号进行断句,比如30个字时,添加句号进行断句,否则添加逗号进行断句,文本数据中最后一个句段直接添加句号进行断句。
[0096] 在从关键词库中选取关键词文本之前,需要对关键词库进行更新,以便于选取到合适的关键词文本,如图5所示,在一些实施例中,所述语音质检方法还包括:
[0097] S21:根据任务类型配置关键词类型,其中所述关键词类型包括:标准关键词、禁语关键词、情感关键词;
[0098] S22:检索各关键词类型的含义和应用场景,获取所对应的关键词;
[0099] S23:根据所述关键词,更新关键词库。
[0100] 通过上述步骤,对不同任务类型进行分析,可根据所述任务类型配置不同的关键词类型,进一步分析各关键词类型的含义后,可结合其应用场景,查询其对应的常用词汇,将所述常用词汇进行组合,形成关键词库,并对关键词库进行更新,便于后续从关键词中选取合适的关键词文本,提升所选关键词文本的适用性。
[0101] 如图5所示,在步骤S21中,根据任务类型配置的关键词类型包括:标准关键词、禁语关键词、情感关键词,对于每一个关键词类型,可以设置单个或多个单条配置,每个单条配置里设置一个或多个关键词文本,以此满足企业在针对不同任务类型时,具有的不同考虑范围和质检要求。
[0102] 如图5所示,在步骤S22中,示例性地说明,在配置各关键词类型后,解析关键词类型的含义和应用场景,从互联网检索其对应的关键词,例如,对于营销外呼的任务类型,其标准关键词可以检索到如下关键词:“您好”、“先生”、“女士”、“产品”、“价格”等,以此满足不同任务类型下,对可供选择的关键词的多样性和丰富性。
[0103] 如图5所示,在步骤S23中,示例性地说明,在检索到关键词后,经过人工审核,对关键词库进行新增关键词、删减关键词的操作,例如,检索到“产品”、“价格”关键词时,经过人工审核合格后,将关键词添加至关键词库,对关键词库进行查询,若查询到违法、违规、消极、怠慢等禁语类型词汇时,经过人工审核合格后,将所述禁语类型词汇从关键词库删除,以此保证关键词库的实时性,同时为后续关键词文本的选择提供保障。
[0104] 更新关键词库后,需要选取特定的关键词文本构成各关键词类型的各单条配置,并将各单条配置与文本片段进行比较,如图6所示,在一些实施过程中,提供一种获取关键词文本匹配信息的方法:
[0105] S31:根据所述关键词库,对于各关键词类型,分别选取至少一个关键词文本,构成各关键词类型的单条配置;
[0106] S32:将所述单条配置从所述文本片段的首个分句开始进行内容匹配和遍历,若所述分句与所述单条配置中的关键词文本存在匹配关系,则记录所述分句处于文本片段中的序号,获取关键词文本的匹配位置;
[0107] S33:记录所述分句与所述单条配置形成匹配关系的关键词文本数量若单条配置内的同一个关键词文本在同一分句中重复出现多次,则对该关键词文本数量只计数一次,根据所述关键词文本数量,获取关键词文本的匹配次数;
[0108] S34:根据所述关键词文本的匹配位置与所述关键词文本的匹配次数,获取关键词文本的匹配信息。
[0109] 通过上述步骤,可对语音质检过程中的关键词文本匹配规则进行详细、精准地设定,获取并记录各单条配置与文本片段的匹配位置与匹配次数,提升对关键词匹配文本信息进行查询的便捷度,有助于在语音质检过程中,对各关键词文本的匹配情况进行分析,同时提升语音质检的准确度。
[0110] 如图6所示,在步骤S31中,示例性地说明,对于各关键词类型分别选取至少一个关键词文本,构成各关键词类型的单条配置,例如,当任务类型为营销外呼时,配置三个关键词类型,分别为标准关键词、禁语关键词、情感关键词,对于标准关键词,设置三个单条配置,对于禁语关键词,设置两个单条配置,对于情感关键词,设置两个单条配置,其中,标准关键词单条配置1选取的关键词为:“您好”、“先生”、“女士”,标准关键词单条配置2选取的关键词为:“功能”、“价格”,标准关键词单条配置3选取的关键词为:“解答”,禁语关键词单条配置1选取的关键词为:“欺诈”,禁语关键词单条配置2选取的关键词为:“不清楚”,情感关键词单条配置1选取的关键词为:“谢谢”、“生气”。通过该方式,可满足企业针对不同关键词类型,设置不同单条配置,并且所选关键词文本具有多样性和丰富性的需求。
[0111] 如图6所示,在步骤S32中,示例性地说明,将所述单条配置中的关键词文本看作一个整体,从所述文本片段的首个分句开始,对单条配置进行内容匹配和遍历,若分句与所述单条配置中的关键词文本存在匹配关系,则记录所述分句处于文本片段中的序号,获取关键词文本的匹配位置,例如,当文本片段中第n个分句为“你在胡说,我随便你怎么考虑,与我无关”,而禁语关键词的一个单条配置选取的关键词文本为:“随便”、“垃圾”,则认为第n个分句与所述禁语关键词的一个单条配置中的关键词文本存在匹配关系,而所述分句在文本片段中的序号为n,因此所述单条配置的关键词文本的匹配位置为n,其中n为非负整数。
[0112] 如图6所示,在步骤S33中,示例性地说明,当分句与所述单条配置中的关键词文本存在匹配关系时,记录所述分句与所述单条配置形成匹配关系的关键词文本数量,但如果在该分句中,单条配置内的同一个关键词文本重复出现多次,则对该关键词文本数量只计数一次,例如,单条配置由N个关键词文本构成,而所述N个关键词中,有M个关键词文本均与分句内容存在匹配关系,并且所述M个关键词文本中有Q个关键词文本在该分句内容中出现K次,此时该分句内容中虽然出现了K次所述P个关键词文本,但对所述Q个关键词文本只计数一次,则认为该分句与所述单条配置存在匹配的关键词数量只有M个,因此单条配置的关键词文本匹配次数为M,其中N,M,Q,K为非负整数,并且N≥M≥Q。
[0113] 如图6所示,在步骤S34中,示例性地说明,获取到单条配置的匹配位置与匹配次数后,将匹配位置与匹配次数进行组合,例如,一个分句与单条配置存在匹配关系,所述一个分句在文本片段中的序号为n,而单条配置与所述一个分句进行匹配时,匹配次数为M,则对于所述一个分句,单条配置的匹配信息可以表示为[n,M],对于另一个分句,同样与单条配置存在匹配关系,所述另一个分句在文本片段中的序号为m,而单条配置与所述另一个分句进行匹配时,匹配次数为Q,则对于所述另一个分句,单条配置的匹配信息可以表示为[m,Q],另外,当单条配置与X个分句存在匹配关系时,单条配置的匹配信息表示为X行Y列的矩阵,即X*Y的形式,X表示与单条配置存在匹配关系的分句数量,Y包括单条配置与所述X个分句中每一个分句分别匹配时,获取的匹配位置、匹配次数,其中,n,m,M,Q,X,Y为非负整数。
[0114] 获取单条配置的匹配信息后,由于单条配置可能与多个分句存在匹配关系,因此存在多组匹配位置与匹配次数,而获取质检结果之前,需要对匹配信息进行处理,并获取更多匹配信息,如图7所示,在一些实施过程中,提供一种获取的方法:
[0115] S41:根据所述关键词文本的匹配信息,对匹配次数进行排序,根据排序中数值最大的匹配次数,获取最大匹配次数;
[0116] S42:将所述最大匹配次数除以所选关键词文本的个数,获取单条配置的匹配系数;
[0117] S43:对各单条配置设定采样权重,通过所述采样权重与所述单条配置匹配系数,获取单条配置采样系数,单条配置采样系数sp的数学表达式为:
[0118] sp=w*p
[0119] 其中,sp为所述单条配置采样系数,w为单条配置采样权重,p为单条配置匹配系数;
[0120] S44:将所述单条配置采样系数与预设的单条配置匹配阈值进行比较,获取关键词类型的匹配系数,关键词类型匹配系数S的数学表达式为:
[0121]
[0122] 其中,S为所述关键词类型匹配系数,sp为单条配置采样系数,t为单条配置匹配阈值,max(·)表示取最大值,d(·)为微分运算符。
[0123] 通过上述步骤,可分析各单条配置在与文本片段中不同的分句存在匹配关系时各匹配位置与匹配次数的具体信息,同时选取合适匹配次数用于后续质检结果获取步骤中进行计算,提升语音质检结果的准确度。
[0124] 如图7所示,在步骤S41中,示例性地说明,将匹配信息中多组匹配次数按升序或者降序进行排序,获取所述多组匹配次数中次数最大的匹配次数,例如,当单条配置信息表达式为{[m,M],[n,N],[q,Q]},其中M>N>Q,则认为最大匹配次数为M,其中n,m,q,N,M,Q为非负整数。
[0125] 在步骤S42中,示例性地说明,获取到最大匹配次数以后,将最大匹配次数除以当前单条配置所选的关键词文本数量,获取匹配系数,例如,当单条配置所选取的关键词文本数量为N个,而最大匹配次数为M,则此时单条配置的匹配系数p的数值为p=M/N,其中N,M为非负整数。
[0126] 在一些实施例中,对于步骤S42,当关键词类型为禁语关键词时,获取到最大匹配次数以后,将当前单条配置所选的关键词文本数量减去最大匹配次数,再除以当前单条配置所选的关键词文本数量,获取匹配系数,例如,当单条配置所选取的关键词文本数量为N个,而最大匹配次数为M,那么此时单条配置的匹配系数数值为p=(N‑M)/N,其中N,M为非负整数。
[0127] 在步骤S43中,示例性地说明,对关键词类型对应的各单条配置设定采样权重,将所述采样权重与各单条配置的匹配系数相乘后进行累加,获取所述关键词类型的匹配系数,例如,所述关键词类型具有i个单条配置,所述i个单条配置的匹配系数表示为{p1,p2,...,pi},对所述i个单条配置设定采样权重,表示为{w1,w2,...,wi},则单条配置采样系数sp的计算公式为:
[0128] 在步骤S44中,设定单条配置阈值为t,若sp大于t,则认为各单条配置所构成的一个关键词类型合格,则所述一个关键词类型的匹配系数S计算公式为:其中k,i为正整数,max(·)表示取最大值,d(·)为微分运算符。
[0129] 在另一些实施过程中,对于步骤S43与步骤S44,关键词类型的匹配系数计算方法还包括:
[0130] 对于一个关键词类型,具有i个单条配置,所述i个单条配置的匹配系数表示为{p1,p2,...,pi},对所述i个单条配置设定采样权重,表示为{w1,w2,...,wi},则所述i个单条配置的采样系数为sp={sp1,sp2,…,spi}={p1*w1,p2*w2,…,pi*wi},设定所述i个单条配置阈值为t={t1,t2,…,ti},若第k个单条配置的采样系数大于第k个单条配置的匹配阈值,则认为所述第k个单条配置质检合格,当所有i个单条配置质检均合格时,认为所述i个单条配置构成的一个关键词类型质检合格,则一个关键词类型的匹配系数S的计算公式为: 其中k,i为正整数,max(·)表示取最大值,d(·)为微分运算符。
[0131] 获取各关键词类型的匹配系数后,需要与预设的各关键词类型匹配阈值进行比较,获取质检结果,如图8所示,在一些实施过程中,提供一种获取的方法:
[0132] S51:根据各关键词类型的匹配系数,分别与预设的各匹配阈值进行比较,获取质检结果。
[0133] 在步骤S51中,示例性地说明,获取各关键词类型的匹配系数后,将所述各关键词类型的匹配系数直接与预设的各关键词类型匹配阈值进行比较,根据比较结果获取质检结果,例如,存在三个关键词类型,分别为标准关键词、禁语关键词、情感关键词,所述三个关键词类型的匹配系数分别为S1,S2与S3,预设三个关键词类型的匹配阈值分别为T1,T2与T3,当S1>T1并且S2>T2并且S3>T3时,认为所述三个关键词类型均合格,则本次质检结果合格。
[0134] 在一些实施过程中,还提供一种获取方法:
[0135] S52:对各关键词类型设定采样权重,根据所述采样权重与所述关键词类型的匹配系数,获取关键词类型采样系数,关键词类型采样系数SP的数学表达式为:
[0136] SP=S*W
[0137] 其中,SP为所述关键词类型采样系数,S为关键词类型的匹配系数,W为关键词类型的采样权重;
[0138] S53:将所述采样系数与预设的匹配阈值进行比较,获取质检结果。
[0139] 在步骤S52中,示例性地说明,获取各关键词类型的匹配系数后,预设各关键词类型的采样权重,将所述各关键词类型的匹配系数与所述各关键词类型的采样系数对应相乘后进行累加,获取采样系数,例如,存在三个关键词类型,分别为标准关键词、禁语关键词、情感关键词,所述三个关键词类型的匹配系数分别为S1,S2与S3,所述三个关键词类型的采样权重分别为W1,W2与W3,则采样系数SP计算公式为:SP=S1*W1+S2*W2+S3*W3。
[0140] 通过上述步骤,可满足企业对不同任务类型具有不同重视程度时,对各任务类型质检结果进行综合性评估和判断的需求,以此获取准确度更改、合理性更强的语音质检结果。
[0141] 在步骤S53中,示例性地说明,获取采样系数后,与预设的匹配阈值进行数值比较,获取质检结果,例如:存在三个关键词类型,分别为标准关键词、禁语关键词、情感关键词,所述三个关键词类型的匹配系数为S={S1,S2,S3},所述三个关键词类型的采样权重为W={W1,W2,W3},则采样系数计算SP公式为:SP=S1*W1+S2*W2+S3*W3,预设匹配阈值表达式为T,若SP大于T,则认为质检结果合格。
[0142] 在一些实施过程中,如图9所示,对于步骤S52,获取采样系数的方法还包括:
[0143] 获取各关键词类型的匹配系数后,预设各关键词类型的采样权重,将所述各关键词类型的匹配系数与所述各关键词类型的采样系数对应相乘,获取采样系数,保持各关键词类型采样系数的向量形式,例如,存在三个关键词类型,分别为标准关键词、禁语关键词、情感关键词,所述三个关键词类型的匹配系数为{S1,S2,S3},所述三个关键词类型的采样权重为{W1,W2,W3},则采样系数SP计算公式为:SP={SP1,SP2,SP3}={S1*W1,S2*W2,S3*W3}。
[0144] 在一些实施过程中,对于步骤S53,获取质检结果的步骤还包括:
[0145] 获取向量形式的采样系数后,预设向量形式的匹配阈值,将所述向量形式的采样系数与所述向量形式的匹配阈值进行比较,获取质检结果,例如,存在三个关键词类型,分别为标准关键词、禁语关键词、情感关键词,所述三个关键词类型的匹配系数为{S1,S2,S3},所述三个关键词类型的采样权重为{W1,W2,W3},则采样系数SP计算公式为:
[0146] SP={SP1,SP2,SP3}={P1*W1,P2*W2,P3*W3},预设匹配阈值表达式为{T1,T2,T3},若SP1>T1并且SP2>T2并且SP3>T3,则认为质检结果合格。
[0147] 应该理解的是,虽然图2‑9的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2‑9中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0148] 在一个实施例中,如图10所述,提供了一种语音质检装置,所述语音质检装置包括质检结果获取模块,所述质检结果获取模块包括:
[0149] 第一获取单元,用于对各关键词类型设定采样权重,根据所述采样权重与所述关键词类型的匹配系数,获取采样系数;
[0150] 第二获取单元将所述采样系数与预设的匹配阈值进行比较,获取质检结果。
[0151] 通过所述质检结果获取模块,企业可对不同关键词类型的重要程度进行分析和评估,根据不同需求,对各关键词类型设定采样权重,然后预设匹配阈值,将各关键词类型的匹配结果进行综合评估。
[0152] 在第一获取单元中,示例性地说明,获取各关键词类型的匹配系数后,预设各关键词类型的采样权重,将所述各关键词类型的匹配系数与所述各关键词类型的采样系数对应相乘后进行累加,获取采样系数,例如,存在三个关键词类型,分别为标准关键词、禁语关键词、情感关键词,所述三个关键词类型的匹配系数分别为S1,S2与S3,所述三个关键词类型的采样权重分别为W1,W2与W3,则采样系数SP计算公式为:SP=S1*W1+S2*W2+S3*W3。
[0153] 在第二获取单元中,示例性地说明,获取采样系数后,与预设的匹配阈值进行数值比较,获取质检结果,例如:存在三个关键词类型,分别为标准关键词、禁语关键词、情感关键词,所述三个关键词类型的匹配系数为S={S1,S2,S3},所述三个关键词类型的采样权重为W={W1,W2,W3},则采样系数计算SP公式为:SP=S1*W1+S2*W2+S3*W3,预设匹配阈值表达式为T,若SP大于T,则认为质检结果合格。
[0154] 在一些实施过程中,第一获取单元还包括:获取各关键词类型的匹配系数后,预设各关键词类型的采样权重,将所述各关键词类型的匹配系数与所述各关键词类型的采样系数对应相乘,获取采样系数,保持各关键词类型采样系数的向量形式,例如,存在三个关键词类型,分别为标准关键词、禁语关键词、情感关键词,所述三个关键词类型的匹配系数为S={S1,S2,S3},所述三个关键词类型的采样权重为W={W1,W2,W3},则采样系数SP计算公式为:SP={S1*W1,S2*W2,S3*W3}。
[0155] 在一些实施过程中,第二获取单元还包括:获取向量形式的采样系数后,预设向量形式的匹配阈值,将所述向量形式的采样系数与所述向量形式的匹配阈值进行比较,获取质检结果,例如,存在三个关键词类型,分别为标准关键词、禁语关键词、情感关键词,所述三个关键词类型的匹配系数为S={S1,S2,S3},所述三个关键词类型的采样权重为W={W1,W2,W3},则采样系数计算公式为:SP={SP1,SP2,SP3}={S1*W1,S2*W2,S3*W3},预设匹配阈值表达式为T={T1,T2,T3},若SP1>T1并且SP2>T2并且SP3>T3,则认为质检结果合格。
[0156] 如图11所述,一种语音质检装置还包括语音转换文本模块、任务参数配置模块、匹配信息获取模块、匹配系数获取模块以及质检报告获取模块,在将语音数据转换为文本数据,对所述文本数据进行断句处理,获取文本片段,然后根据任务类型配置关键词类型,并检索所述关键词类型对应的关键词,更新关键词库,并从所述关键词库中选取关键词文本,与所述文本片段进行比较,获取关键词文本的匹配信息,然后根据所述关键词文本的匹配信息,与所选关键词文本的数量进行比较,获取所述关键词类型的匹配系数,最后根据所述关键词类型的匹配系数,与预设的匹配阈值进行比较,获取所述任务类型的质检结果。
[0157] 通过上述装置,可改善通过人工方式对客服与客户之间产生的语音交流记录进行整理和质检时,存在作业步骤繁琐、执行效率低、质检质量差、人力成本高、主观性过高等缺陷的问题,将语音数据转换为文本数据,并将文本数据与关键词库中的关键词文本进行比较,设定匹配规则,获取语音质检结果,可避免人工质检方式存在的缺陷,并降低企业成本,提升语音质检效率,实现客服绩效考核、客户服务满意度系统化。
[0158] 在一些实施例中,任务参数配置模块的步骤包括:
[0159] 根据任务类型配置关键词类型,其中所述关键词类型包括:标准关键词、禁语关键词、情感关键词;
[0160] 检索各关键词类型的含义和应用场景,获取所对应的关键词;
[0161] 根据所述关键词,更新关键词库。
[0162] 在一些实施例中,质检结果获取模块的步骤包括:
[0163] 根据各关键词类型的匹配系数,分别与预设的各匹配阈值进行比较,获取质检结果。
[0164] 在一些实施例中,质检结果获取模块的步骤包括:
[0165] 对各关键词类型设定采样权重,根据所述采样权重与所述关键词类型的匹配系数,获取采样系数;
[0166] 将所述采样系数与预设的匹配阈值进行比较,获取质检结果。
[0167] 在一些实施例中,获取各单条配置的匹配系数后,对各单条配置设定采样权重,将各单条配置的匹配系数与各单条配置的采样权重相乘后累加,获得各关键词类型的匹配系数,然后对各关键词类型设定采样权重,将所述各关键词类型的匹配系数与所述各关键词类型的采样权重进行相乘后累加,获得采样系数,然后将所获采样系数与预设的匹配阈值进行比较,若所述采样系数大于匹配阈值,则认为本次语音质检结果合格,否则不合格。
[0168] 在一些实施例中,获取标准关键词类型的各单条配置的匹配系数后,将标准关键词类型的各单条配置的匹配系数与预设的标准关键词类型的各单条配置阈值进行比较,若标准关键词类型的各单条配置的系数都大于预设的标准关键词类型的各单条配置阈值,则认为标准关键词类型合格,然后获取禁语关键词类型的各单条配置的匹配系数,将禁语关键词类型的各单条配置的匹配系数与预设的禁语关键词类型的各单条配置阈值进行比较,若禁语关键词类型的各单条配置的系数都大于预设的禁语关键词类型的各单条配置阈值,则认为禁语关键词类型合格,最后获取情感关键词类型的各单条配置的匹配系数,将情感关键词类型的各单条配置的匹配系数与预设的情感关键词类型的各单条配置阈值进行比较,若情感关键词类型的各单条配置的系数都大于预设的情感关键词类型的各单条配置阈值,则认为情感关键词类型合格,若标准关键词类型、禁语关键词类型和情感关键词类型全部合格,则认为本次语音质检结果合格,若标准关键词类型、禁语关键词类型和情感关键词类型之中至少有一个关键词类型不合格,则认为本次语音质检结果不合格。
[0169] 关于语音质检装置的具体限定可以参见上文中对于语音质检方法的限定,在此不再赘述。上述语音质检装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0170] 在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图12所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储账户管理的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种账户管理方法。
[0171] 本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0172] 在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
[0173] 将语音数据转换为文本数据,对所述文本数据进行断句处理,获取文本片段;
[0174] 根据任务类型配置关键词类型,并检索所述关键词类型对应的关键词,更新关键词库;
[0175] 从所述关键词库中选取关键词文本,与所述文本片段进行比较,获取关键词文本的匹配信息;
[0176] 根据所述关键词文本的匹配信息,与所选关键词文本的数量进行比较,获取所述关键词类型的匹配系数;
[0177] 根据所述关键词类型的匹配系数,与预设的匹配阈值进行比较,获取所述任务类型的质检结果。
[0178] 在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
[0179] 将语音数据转换为文本数据,对所述文本数据进行断句处理,获取文本片段;
[0180] 根据任务类型配置关键词类型,并检索所述关键词类型对应的关键词,更新关键词库;
[0181] 从所述关键词库中选取关键词文本,与所述文本片段进行比较,获取关键词文本的匹配信息;
[0182] 根据所述关键词文本的匹配信息,与所选关键词文本的数量进行比较,获取所述关键词类型的匹配系数;
[0183] 根据所述关键词类型的匹配系数,与预设的匹配阈值进行比较,获取所述任务类型的质检结果。
[0184] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
[0185] 以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0186] 以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页 第1页 第2页 第3页
相关技术
方法装置相关技术
装置计算机相关技术
张奇发明人的其他相关专利技术