声音文档分类方法_专利转让申请注册交易-盲点网

声音文档分类方法无效专利发明

技术领域

[0001] 本发明总的来说涉及文档分类，而具体地，涉及基于音频换能器捕捉的声音对文档重量或文档厚度进行分类。有关诸如重量或厚度等文档特征的知识可被其他扫描系统使用。

具体实施方式

[0010] 如图1所示，从扫描器4中的输入托盘10来馈给文档5。当文档进入扫描器时，馈给和分离辊15把文档彼此分开，这会产生声音。不同重量的文档产生不同的声音。如图2所示，文档的声音被音频换能器20拾取，并且音频信号55被调节、数字化和处理。 [0011] 如图1所示，音频换能器20拾取来自进入文档传送器30的不同厚度的文档5的音频信号。如图2所示，在音频信号被处理之前，可对其进行信号调节60，例如进行模拟滤波。然后由模数A/D转换器65以合适的速率对调节后的模拟信号进行采样和数字化，以避免信号中存在的最高频的混叠。从A/D转换器中获得的数字采样在数字信号处理器（digital signal processor，DSP）70中被处理。

[0012] 当把文档馈给到75扫描器4中时，文档产生的音频信号被捕捉80。从音频信号中提取特征85，并将该特征与存储器中的特征集相比较90。基于所捕捉的音频信号的被比较的特征以及特征集中的特征，文档被分类为特定的文档重量或文档厚度95。 [0013] 文档分类系统基本上包括两个阶段：音频阶段和分类阶段。在音频阶段中，确定不同厚度的纸张的音频信号中的诸如音高（pitch）或谱重心（spectral centroid）或幅度等各种谱特征，即声波特性。被选择用于学习的谱特征具有针对不同厚度的文档的良好的可区分特性。为了产生音频特征描述符，使用对音频采样的窗口扫描。窗口扫描包括以固定的增量在音频数据上滑动窗口，其中每个窗口代表时间窗口。使用短时傅里叶变换（short time Fourier transform，STFT）技术从滑动窗口中提取频谱特征。STFT提供能够对诸如音高、响度、振幅等各种感知特征进行建模的丰富表示。然后，这些对应于不同的文档厚度的特征向量集合被存储在存储器中。

[0014] 在分类阶段中，目标是基于音频信号来确定当前进入扫描器的新文档相对于特定厚度的类别。分类的第一步是提取与在学习阶段确定的谱特征相同的谱特征。通过将这些提取的特征与存储在存储器51内的特征集相比较，将文档分类为特定的厚度。为了进行该比较，可采用支持向量机（Support vector machines，SVM）。

[0015] 当音频信号在处理器50中被处理时，文档继续移动通过传送器30。处理器50和存储器51可内置于扫描器4中，或置于扫描器4外部。在文档到达超声波传感器25之前，文档的厚度被确定并分类。文档继续通过传送器30到达上成像区40、下成像区45，移动出传送器30，并进入文档输出区域35。

[0016] 部件列表

[0017] 4扫描器

[0018] 5文档

[0019] 10输入托盘

[0020] 15馈给和分离辊

[0021] 20音频换能器

[0022] 25超声波传感器

[0023] 30传送器

[0024] 35文档输出区域

[0025] 40上成像区

[0026] 45下成像区

[0027] 50处理器

[0028] 51存储器

[0029] 55音频信号

[0030] 60信号调节

[0031] 65模数（A/D）转换器

[0032] 70DSP处理器

[0033] 75馈给文档

[0034] 80捕捉馈给路径中的文档的音频信号

[0035] 85从音频信号中提取特征

[0036] 90将特征与存储器中的特征集相比较

[0037] 95基于上述比较把文档分类为特定的厚度。

查看完整全部详细技术资料

当前第1页第1页第2页第3页

声音文档分类方法无效专利发明

技术领域

相关背景技术

具体实施方式

[0002]在文档传送系统中，具有不同厚度的文档被扫描并且通过传送器。当文档移动通过文档传送器时，存...，盲点网为您提供声音文档分类方法专利转让信息专利转让交易数据查询就上盲点网

声音文档分类方法无效专利 发明

技术领域

相关背景技术

具体实施方式

[0002]在文档传送系统中，具有不同厚度的文档被扫描并且通过传送器。当文档移动通过文档传送器时，存...，盲点网为您提供声音文档分类方法专利转让信息专利转让交易数据查询就上盲点网

声音文档分类方法无效专利发明