首页 / 一种针对语音识别结果的文本纠错方法

一种针对语音识别结果的文本纠错方法公开 发明

技术领域

[0001] 本发明属于计算机技术领域,涉及自然语言处理,特别是自然语言处理技术中文本纠错方法和文本后处理方法。

相关背景技术

[0002] 语音识别技术在现代社会中得到了广泛应用,能够将语音输入转换为文本形式。然而,由于语音识别过程中的噪音、口音、发音错误等因素,识别结果往往存在一定的错误。
这些错误会导致转录的文本质量下降,给后续处理和应用带来困扰。
[0003]
[0004] 目前,虽然已经存在一些中文文本纠错技术,但针对语音识别后的文本进行准确纠错仍然面临一些挑战。首先,语音识别错误的特点复杂多样,涉及到拼写、语法、标点等多个方面。其次,语音识别错误与正常的打字错误不完全相同,因为它们通常与语音输入的特点相关。

具体实施方式

[0050] 本发明涉及计算机领域中的自然语言处理,具体涉及自然语言处理中文本纠错方法和文本后处理方法,旨在提供高效、准确的文本纠错解决方案,改善语音识别后文本结果的质量和可靠性。下面通过参考附图详细描述本申请的实施例,所述实施例的示例在附图中示出,本申请提供一种方法、设备和计算机可读存储介质,旨在提供高效、准确的文本纠错解决方案,改善语音识别后文本结果的质量和可靠性。其中,方法、设备和计算机可读存储介质是基于同一技术构思的,解决问题的原理相似,因此各主题的实施可以相互参见,重复之处不再赘述。
[0051] 在第一种实施例中,图1是文本纠错模型网络结构示意图,如图1所示,语音纠错方法包括下列步骤:
[0052] 1、语音识别后文本分析:
[0053] 对语音识别后的文本进行分析,探测其中的错误和不一致之处。分析过程包括词法分析、句法分析和上下文理解,以准确把握文本中的语言特征和语义信息。
[0054] 2、错误检测与定位:
[0055] 语音识别后的文本被分析后,可以将对文本中的错误进行检测和定位。利用自然语言处理和机器学习算法,结合领域知识和语料库资源,识别拼写错误、语法错误等常见问题。
[0056] 3、纠错候选生成:
[0057] 基于错误的定位生成纠错候选集合,其中包括可能的替换词语、短语或句子。在生成纠错候选时,综合考虑上下文信息、语言模型和领域知识,以确保纠错候选的准确性和合法性,此外还会考虑语音识别引擎的特点和常见误差,为生成纠错候选提供更精准的选择。
[0058] 4、纠错候选评估与选择:
[0059] 生成纠错候选后,利用基于机器学习算法和语言模型的评估方法,对候选进行权衡和判断。综合考虑候选的语言流畅度、上下文连贯性、语义一致性以及语音识别引擎的误差等因素,以选择最有可能是正确纠正的候选作为最终的输出。
[0060] 在具体实现上,使用自然语言处理领域中的BERT系列预训练模型,并在原有模型结构基础上进行修改,主要的思路有两种,使用判别器和纠错器或者只使用纠错器。主要的原因是预训练模型在训练时的一个预训练任务是掩码语言模型(MLM),十分适合文本纠错任务。文本纠错模型网络结构如图1所示,在预训练模型的基础上,追加一个全连接层作为错误检测,利用detection层和correction层的loss加权得到最终的loss来训练模型,在预测阶段,使用correction层的正确词对原始文本中的错误进行改正。
[0061] 通过使用预训练模型可以完成对语音识别后文本的分析以及错误的检测与定位,纠错候选的范围一般为词表的内容,可根据需求进行扩展。
[0062] 本发明的面向语音识别后的中文文本的纠错方法,通过结合自然语言处理和机器学习算法,以及领域专业知识和语料库资源,该方法能够有效地检测和纠正语音识别文本中的错误,提高文本的质量、准确性和可靠性。
[0063] 在另一种方案中,该纠错方法包括如下步骤:
[0064] 首先,需要准备大规模的经过语音识别后的文本数据集,并对数据进行预处理,以便后续的训练和分析;之后根据上述的文本纠错模型网络结构搭建一个模型,并使用准备好的语料进行训练,将训练好的模型权重进行保存;之后便可将该模型集成到一个完整的中文文本纠错系统中。该系统可以作为一个独立的应用程序或者是集成到语音识别系统中,实现对语音识别后的文本进行自动纠错的功能。通过实施上述的具体实施方式,可以实现面向语音识别后的中文文本的高效、准确的纠错功能,提高语音识别文本的质量和可靠性。
[0065] 基于以上实施例,本申请实施例还提供了一种电子设备,所述电子设备包括:一个或多个处理器,存储器,以及,一个或多个程序;其中,所述一个或多个程序被存储在所述存储器中,所述一个或多个程序包括指令,当所述指令被所述电子设备执行时,使得所述电子设备执行以上实施例提供的所述方法。
[0066] 基于以上实施例,本申请实施例还提供了一种计算机存储介质,该计算机存储介质中存储有计算机程序,所述计算机程序被计算机执行时,使得计算机执行以上实施例提供的所述方法。
[0067] 其中,存储介质可以是计算机能够存取的任何可用介质。以此为例但不限于:计算机可读介质可以包括RAM、ROM、EEPROM、CD‑ROM或其他光盘存储、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。
[0068] 本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD‑ROM、光学存储器等)上实施的计算机程序产品的形式。
[0069] 本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0070] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0071] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0072] 显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

当前第1页 第1页 第2页 第3页