断句阈值动态调整方法、装置、设备、介质及产品

断句阈值动态调整方法、装置、设备、介质及产品实质审查发明

技术总结

本申请提供一种断句阈值动态调整方法、装置、设备、介质及产品，涉及人工智能技术领域。所述方法包括：获取当前音频信号对应的多帧滤波器组特征；将各所述滤波器组特征输入预设语音活动检测模型，生成对应的音频识别结果；若音频识别结果为存在滤波器组特征为语音特征，则确定用户处于说话状态，并确定所述当前音频信号对应的当前语句时长、语速信息以及连续非语音帧时长；若连续非语音帧时长小于原始断句阈值，则采用训练至收敛的断句阈值生成模型基于所述当前语句时长和所述语速信息调整所述原始断句阈值。本申请的方法，可以根据当前语句时长和语速信息调整原始断句阈值，使断句阈值更符合用户体验的需求，提升用户在语音交互中的体验。

技术研发人员：

刘进涛; 原道德; 葛新; 徐雪萍; 张俊

受保护的技术研发主体：

中国建设银行股份有限公司,建信金融科技有限责任公司

技术申请主体：

中国建设银行股份有限公司; 建信金融科技有限责任公司

技术研发申请日期：

2024-06-13

技术被公开/公告日期：

2024-08-23

当前第3页第1页第2页第3页

断句阈值动态调整方法、装置、设备、介质及产品实质审查 发明