首页 / 模式识别

模式识别失效专利 发明

技术领域

本发明涉及模式识别,其中一组特征向量从数字化的输入信号形成,并与候选模式的模板进行比较。

相关背景技术

在模式识别中,输入信号被数字化,并形成特征向量序列。然后这些特征向量与候选模式的模板(例如信号中待识别的声音或者图像)进行比较。在语音识别中,该候选模式可以表示,例如,电话本中的名字。
然而,模式识别,例如语音识别,需要进行大量计算。在许多情况下,例如在嵌入式设备中实现时,由于内存和计算能力有限,需要降低模式识别算法的复杂度。
计算复杂度依赖于几个因素:采样率,候选模型模板数量和特征向量维数。降低上述任一因素都能提高识别速度,从而能够以合理的时间在处理器上运行,但是这样会降低识别准确性。
而且,可用资源通常是在不同进程之间共享,并且因此可用的处理能力和内存容量是可变的。如果在具有有限处理能力的嵌入式设备上开始运行的识别功能在任何时候都能工作,那么最小化或者动态调整处理需求而不降低识别准确性是至关重要的。
传统的降低模式识别器复杂度的方法至少在下述现有的技术中已有介绍:1.特征向量下采样一种在几个连续帧(瞬时时间)中用与一个输入特征向量有关的状态似然度(SL)测度来降低解码复杂度的技术。
2.模型模板聚类这一技术对声学空间进行离线聚类。在解码时,首先在聚类中进行快速搜索,然后只估计那些最优匹配聚类的成员的SL测度。
3.降低特征向量维数使用高等线性变换,例如PCA,LDA等或者神经网络,将特征向量分量个数降低到预先定义的数量。
对于第三类,这一技术的传统实现方法不具有根据可用CPU能力按比例确定计算复杂度的灵活性,而是总是考虑最坏情况。另外,短时谱(Spetrol-Temporal)线性变换或者基于神经网络的映射可能会显著提高前端的复杂度,从而提高了整个识别器的复杂度。
一个降低特征向量维数的例子在“Should recognizers haveears”一文中给出,见《Speech Communication》,1998年第25卷,第三页至第27页。

当前第1页 第1页 第2页 第3页
相关技术
I·基斯发明人的其他相关专利技术