首页 / 数据处理系统、记录介质以及生产输出物的方法

数据处理系统、记录介质以及生产输出物的方法实质审查 发明

技术领域

[0001] 本发明涉及一种数据处理系统、数据处理程序以及生产输出物的方法。

相关背景技术

[0002] 以往,已知一种基于扫描数据中所包含的字符串而将扫描数据分配至信箱的技术(例如专利文献1)。
[0003] 本发明的课题在于,期望进一步提高对所取得的数据进行处理的情况下的使用便利性。
[0004] 专利文献1:日本特开2013‑50831号公报

具体实施方式

[0016] 此处,按照下述的顺序来对本发明的实施方式进行说明。
[0017] (1)复合机的结构:
[0018] (2)扫描处理:
[0019] (2‑1)指定词语检索处理:
[0020] (3)其他实施方式:
[0021] (1)复合机的结构:
[0022] 图1为表示作为本发明的实施方式所涉及的数据处理系统的复合机1的结构的框图。复合机1具备处理器10、非易失性的存储介质20、UI部30(User Interface:用户界面)、通信部40、印刷部50、读取部60和FAX通信部70。处理器10具备未图示的CPU(Central Processing Unit:中央处理器)、ROM(Read‑Only Memory:只读存储器)、RAM(Random Access Memory:随机存取存储器)等,并能够执行被记录于存储介质20中的各种程序以对复合机1的各个部分进行控制。另外,处理器10既可以由单一的芯片而构成,也可以由多个芯片而构成。此外,例如既可以代替CPU而采用ASIC(Application Specific Integrated Circuit:专用集成电路),也可以为CPU和ASIC协同工作的结构。
[0023] UI部30包括触摸面板显示器。触摸面板显示器具备基于处理器10的控制而对各种各样的信息进行显示的显示面板、以及与该显示面板重叠的触摸检测面板,并对由人的手指等所实施的触摸操作进行检测。触摸面板显示器将表示该触摸操作的信息输出至处理器10。处理器10基于该信息而取得触摸操作。
[0024] 通信部40包括用于利用有线或者无线方式而与其他装置进行通信的各种通信接口。此外,通信部40包括用于与被安装在复合机1中的各种可移动存储器进行通信的接口。
[0025] 印刷部50在本实施方式中具备用于利用喷墨方式或电子照片方式等各种印刷方式而在各种印刷介质上执行印刷的致动器、传感器、驱动电路、机械部件等。读取部(扫描仪)60具备用于实施被载置于原稿台玻璃上的原稿或被安置于ADF原稿托盘上的原稿的读取的装置,例如具备图像传感器、光源、用于对原稿进行输送的致动器、驱动电路、传感器、机械部件等。
[0026] FAX通信部70具备用于经由公共交换电话网而实施表示原稿的图像数据的FAX通信的调制解调器、用于检测或生成用于收发该图像数据的控制信号的电路、以及用于对发送数据进行编码或者对接收数据进行解码的电路等。
[0027] 复合机1具有扫描到信箱(scan to BOX)功能。扫描到信箱功能为将扫描并生成的图像数据保存到用户所指定的文件夹的功能。此外,复合机1具有指定词语分类保存功能。指定词语分类保存功能为扫描图像并进行字符识别、且在包含指定词语的情况下将图像数据自动地分配至与指定词语相对应的文件夹并将之保存于该文件夹中的功能。在本实施方式中,不仅是保存到与指定词语相对应的文件夹中,而且还实现利用与指定词语相对应的输出设定而输出包含该指定词语的图像数据的功能。为了实现这样的利用指定词语来对图像数据进行分类保存、进而利用与指定词语相对应的输出设定来输出图像数据的功能,处理器10能够执行被记录于存储介质20中的未图示的数据处理程序。当数据处理程序被执行时,处理器10作为受理部11、取得部12、判断部13、处理部14而发挥功能。
[0028] 受理部11使处理器10实现如下功能,即,从用户受理指定词语和输出设定,并将受理到的指定词语和输出设定建立对应关系而存储于非易失性的存储介质20中。指定词语为用于以表示被扫描出的图像的图像数据所包含的字符组为对象而实施检索的关键字。输出设定为用于输出图像数据的各项目的参数。取得部12使处理器10实现如下功能,即,使读取部60依据扫描设定而进行工作并读取图像,从而取得表示被读取到的图像的图像数据。判断部13使处理器10实现如下功能,即,针对表示被读取到的图像的图像数据而实施字符识别,并且对在所识别出的字符串之中是否包含从存储介质20读出的指定词语进行判断。处理部14使处理器10实现如下功能,即,在图像数据中包含指定词语的情况下,利用与该指定词语相对应的输出设定而实施关于图像数据的输出。
[0029] 首先,关于从用户受理的输出设定和扫描设定而对详细状况进行说明。图2为表示选择了扫描到信箱功能的情况下的扫描设定画面的一个示例的图。处理器10将图2所示那样的设定画面显示于UI部30的显示器上,并受理由用户所进行的扫描设定。另外,在图2所示的设定画面之中,一次显示在UI部30的显示器上的范围为与显示器的尺寸相应的一部分的范围,虽然被构成为,用户能够通过移动未图示的滚动条的旋钮而对设定画面的整体进行显示,但是为了便于说明,从而在图2中示出了设定画面所包含的各个部分。
[0030] 扫描设定画面为用于针对与扫描动作有关的各种设定项目而对设定值进行设定的画面,如图2所示,在扫描设定画面中配置有各种设定项目的按钮(b2、b4等)。用户通过对这些按钮进行操作,从而能够使与该按钮相对应的详细设定画面进行显示,进而在该详细设定画面中对设定值进行选择。按钮b1为用于保存当前的设定值并指示扫描开始的按钮。
[0031] 在扫描设定中,如按钮b2所示那样包括颜色模式的设定(扫描的颜色设定)。颜色模式的设定值的选项为单色/彩色/灰度。此外,在扫描设定中,如按钮b3所示那样包括扫描分辨率的设定。此外,在扫描设定画面中,如图2所示那样包含按钮b4。按钮b4为用于受理指定词语分类保存功能的详细设定的按钮,当按钮b4被操作时,处理器10对图3所示的设定画面进行显示。
[0032] 图3为表示用于对指定词语分类保存功能的详细内容进行设定的设定画面的一个示例的图。通过受理部11的功能,处理器10将图3所示那样的设定画面显示在UI部30上,并受理用户的操作。关于图3,也与上述的图2同样地,为了便于说明,从而在图3中一次示出了设定画面所包含的各个部分。
[0033] 在本实施方式中,在图3所示的设定画面中,包含选择部g1、选择部g2、语言设定部g3、指定词语输入部g4、组印刷设定部g5、选择部g6和保存按钮b1。选择部g1为用于对由指定词语所决定的分类保存功能的开启/关闭进行选择的操作部。在开启的情况下、且指定词语被包含在图像数据中的情况下,视为处理器10在与该指定词语相对应的文件夹中保存该图像数据的功能为有效。
[0034] 选择部g2为用于对图像分割文件保存功能的开启/关闭进行选择的选择部。在选择了开启的情况下,处理器10在通过一个扫描任务而被生成的图像数据由多个页面而构成的情况下,将图像数据逐页分离地保存到各自的文件中。在选择了关闭的情况下,处理器10在一个扫描任务的图像数据由多个页面而构成的情况下,将全部页面的图像数据作为一个文件而保存。即,通过选择部g2,从而处理器10能够受理将图像数据分离成不同的文件的单位。通过设置选择部g2,从而用户能够对是将图像数据按每个页面作为不同的文件来保存、还是将全部页面作为一个文件来保存进行指定。在按每个页面而分割保存的情况下,用户能够以被保存于文件夹中的文件为单位来对文件的需要与否等进行判断,并且针对不需要的页面的图像数据而实施删除该文件等操作。
[0035] 语言设定部g3为用于对所扫描的图像中所包含的词句的语言进行设定的设定部。处理器10通过语言设定部g3而受理指定词语的语言的指定。处理器10利用与由语言设定部g3所设定的语言相对应的字符识别处理而对图像数据实施字符识别处理。因此,相比于利用与由语言设定部g3所设定的语言不对应的字符识别处理而对图像数据实施字符识别的情况,处理器10能够降低对于图像数据中所包含的字符进行误识别的可能性。
[0036] 指定词语输入部g4为用于受理指定词语的输入的输入部。当指定词语输入部g4被选择时,处理器10在选择了日语的情况下,对五十音图、字母表、数字与符号等软件键盘进行显示,用户对软件键盘进行操作而输入所期望的字符,且如有需要则实施汉字转换等,从而能够进行指定词语的输入。在本实施方式中,针对由一个扫描任务而读取到的图像数据,最多能够指定三个指定词语。例如,在有时将相同的组(可以设想组例如为学校的班级等)以不同的记述或名称而记载于文书中的情况下,可以设想为设定多个指定词语的用例。更具体而言,例如,作为多个指定词语,也可以设定“1年级1班”、以及将“1年级1班”用中文数字记述的“一年级一班”或班主任姓名。
[0037] 组印刷设定部g5为受理图像数据的输出设定的设定部。另外,在本说明书中,“组印刷”表示实施与指定词语建立对应关系而登记的份数的量的印刷。在本实施方式中,设想了输出为印刷处理的情况,输出设定为针对用于印刷图像数据的各设定项目的参数,且包括印刷份数的设定。另外,在输出设定中,除了印刷份数以外,也可以包括馈纸托盘的指定、排纸托盘的指定等。也可以包括印刷品质或彩色/黑白指定。在本实施方式中,作为通过组印刷设定部g5从而用户能够对包含指定词语的图像数据的印刷份数进行设定的情况而继续进行说明。
[0038] 当组印刷设定部g5被选择时,处理器10对用于创建、编辑、删除印刷份数的登记列表的组印刷设定画面进行显示。图4为表示组印刷设定画面的一个示例的图。在组印刷设定画面中,显示有登记在印刷份数的登记列表中的登记名、以及与该登记名相对应的印刷份数的数值。当用户在组印刷设定画面中新输入登记名和印刷份数并对登记/覆盖按钮b11进行操作时,登记名和与该登记名建立了对应关系的印刷份数会被保存到存储介质20中(参照图5的列表L1)。当用户在组印刷设定画面中变更已经登记完毕的登记名和与之相对应的份数并对按钮b11进行操作时,处理器10会用变更后的内容来对列表L1进行更新。而且,当用户在组印刷设定画面中选择已经登记完毕的登记名并对删除按钮b12进行操作时,处理器10会从列表L1中将被选择的登记名及其份数删除。此外,用户在选择被显示于组印刷设定画面上的登记名中的任意一个并对确认按钮b10进行操作时,能够对与指定词语建立了对应关系的印刷份数的登记名进行指定。
[0039] 例如,如图3所示,在作为与“1年级1班”这样的指定词语相对应的印刷份数而于组印刷设定画面中选择了“1年级1班的印刷份数”的情况下,处理器10如图5的对应关系D1所示那样,将“1年级1班的印刷份数”以与“1年级1班”这样的指定词语建立对应关系的方式而保存在存储介质20中。此后,当在图3所示的画面中再次向指定词语输入部g4输入了“1年级1班”的情况下,处理器10也可以参照对应关系D1而自动地选择与“1年级1班”建立了对应关系的“1年级1班的印刷份数”,并将之显示在组印刷设定部g5上。当然,由组印刷设定部g5所设定的印刷份数的登记名也可以由用户从图4的组印刷设定画面上每次手动地设定。
[0040] 接下来,如图5的列表L1所示,对在作为1年级1班的印刷份数例如登记了30份、作为1年级2班的印刷份数例如登记了29份、作为1年级3班的印刷份数例如登记了29份的状态下用于使用户新实施表示1年级的学年整体的份数的印刷的、指定词语输入部g4和组印刷设定部g5的设定例进行说明。作为在“1年级”中存在1班至3班共计三个班的结构而继续说明。用户在图3的指定词语输入部g4中输入“1年级”。然后,用户选择组印刷设定部g5并使组印刷设定画面(图4)进行显示,通过在组印刷设定画面中从登记列表选择“1年级1班的印刷份数”、“1年级2班的印刷份数”和“1年级3班的印刷份数”并对确认按钮b10进行操作,从而能够将“1年级1班的印刷份数”、“1年级2班的印刷份数”和“1年级3班的印刷份数”与“1年级”这样的指定词语建立对应关系(参照对应关系D2)。即,将“30份”+“29份”+“29份”的总计“88份”作为印刷份数而建立对应关系。
[0041] 在该示例的情况下,“1年级1班”、“1年级2班”、“1年级3班”分别为“1年级”这样的指定词语的下位指定词语。换言之,“1年级”为“1年级1班”、“1年级2班”、“1年级3班”这样的指定词语的上位指定词语。下位指定词语包括上位指定词语,并且与该上位指定词语相比而较长。
[0042] 另外,上位指定词语也可以被构成为,由多个下位指定词语的共同部分而被自动地创建。例如,在具有共同部分的指定词语被登记了两个以上的情况下,处理器10也可以从多个下位指定词语的共同部分自动地创建上位指定词语。通过采用此方式,从而可省去用户创建上位指定词语并使存储介质进行存储的劳力和时间,从而会提高使用便利性。此外,在自动地创建出上位指定词语的情况下,也可以采用如下方式,即,向用户询问是否将该上位指定词语登记在存储介质20中,且在用户选择了登记的情况下,将该上位指定词语保存于存储介质20中。此外,也可以由处理器10自动地生成上述的对应关系D2。具体而言,处理器10将与上位指定词语相对应的印刷份数设为与该上位指定词语有关的所有下位指定词语的印刷份数的总计,并以与该上位指定词语建立对应关系的方式而自动地生成对应关系D2。而且,处理器10也可以采用如下方式,即,向用户询问是否将自动地生成的对应关系D2登记在存储介质20中,且在用户选择了登记的情况下,将该对应关系D2保存于存储介质20中。并且,在下一次以后,当在图3中输入了指定词语“1年级”的情况下,也可以采用如下方式,即,在组印刷设定部g5中作为默认而自动地对与“1年级”建立了对应关系的印刷份数的登记列表进行显示。通过采用此方式,从而对于上位指定词语也可以省去用户每次设定组印刷设定部g5的劳力和时间。
[0043] 图3的选择部g6为用于对指定词语关联功能的开启/关闭进行选择的选择部。指定词语关联功能为在于图像数据中包含指定词语的情况下针对该图像数据而关联指定词语的功能。虽然图像数据与指定词语的建立对应可以为任何方式,但是例如既可以采用作为包含图像数据的文件(例如PDF文件等)的文件名的一部分而包含指定词语的方式,也可以采用在文件的信息部(页眉、页脚等)中包含指定词语的方式。或者,也可以被构成为,在与包含图像数据的文件不同的文件(例如与该文件的文件名具有共同的文件名的文件)中记录并保存指定词语。
[0044] 当图3的保存按钮b1被操作时,处理器10将印刷份数以与指定词语建立对应关系的方式而存储于存储介质20中。即,图5所示的对应关系D1和对应关系D2被保存在存储介质20中。而且,在以将组印刷设定部g5设定完毕的状态而对保存按钮b1进行了操作的情况下,处理器10视为与扫描设定一起而被进行了扫描指示,并依据在图2中所设定的扫描设定而使图像传感器进行工作以执行扫描,并实施针对图像数据的字符识别处理,以执行与指定词语相对应的份数的印刷。
[0045] 即,当由读取部60而生成了图像数据时,处理器10通过取得部12的功能从而取得图像数据。然后,处理器10通过判断部13的功能而针对图像数据来实施字符识别处理。在本实施方式中,以图像数据的整体为对象而实施字符识别处理。处理器10实施与利用语言设定部g3而被选择的语言相对应的字符识别处理。处理器10通过使用与字符识别有关的机器学习完毕模式来执行字符识别处理,从而针对视为一套(1个字,1个词组等)的每个字符组而取得与该字符组相对应的候选字符串。针对图像数据的相同的字符组,也可以取得多个候选字符串。针对所取得的每个候选字符串而取得表示该字符组正确的可能性的数值。例如,作为与“1年级1班”相符的字符组的候选字符串以及可能性,如“‘1年级1班’……X%”、“‘I年级I班”……Y%’”、“‘/年级/班’……Z%”这样而取得识别结果。在本实施方式中,作为如下方式来处理,即,表示可能性的数值越大,则与该字符组有关的候选字符串正确的可能性越高。
[0046] 处理器10在满足后文叙述的条件的情况下,判断为在图像数据中包含指定词语。处理器10根据扫描设定而改变对指定词语是否被包含在图像数据中进行判断的条件。即,处理器10通过判断部13的功能,从而在以字符识别的识别精度较低的扫描设定而被进行了扫描的情况下,与以识别精度较高的扫描设定而被进行了扫描的情况相比,使该条件放宽。
通过采用此方式,从而针对以识别精度较低的扫描设定而被进行了扫描的图像数据也能够降低发生指定词语的识别遗漏的可能性。
[0047] 具体而言,例如处理器10以作为识别结果而获得的候选字符串为正确的可能性在阈值以上的候选字符串为对象而对指定词语是否一致进行判断。此处,该阈值为,与以较高的分辨率而被进行了扫描的情况相比,在以较低的分辨率而被进行了扫描的情况下更低的值。将低分辨率扫描的情况下的阈值称为TL,将高分辨率扫描的情况下的阈值称为TH(>TL)。例如,处理器10在高分辨率扫描的情况下,将可能性为80%以上的候选字符串设为对是否与指定词语一致进行判断的对象,而在低分辨率扫描的情况下,将可能性为70%以上的候选字符串设为对是否与指定词语一致进行判断的对象。在此情况下,当以低分辨率来对相同的图像进行扫描时,与以高分辨率来进行扫描的情况相比,可以取得更多的候选字符串,以作为与指定词语的一致判断的对象,从而能够以更多的候选字符串为对象而实施与指定词语的一致判断。因此,即使在低分辨率的扫描中,也易于获得与指定词语一致的候选字符串。其结果为,即使在低分辨率的扫描中,也能够降低发生指定词语的识别遗漏的可能性。
[0048] 处理器10在候选字符串与指定词语的不一致字符数为既定字符数以下的情况下,判断为候选字符串与指定词语一致,且判断为指定词语被包含在图像数据中。此处,该既定字符数为,与以较高的分辨率而被进行了扫描的情况相比,在以较低的分辨率而被进行了扫描的情况下更多的数。将低分辨率扫描的情况下的既定字符数称为NL,将高分辨率扫描的情况下的既定字符数称为NH(<NL)。例如,在指定词语为4个字符的单词的情况下,处理器10在低分辨率的情况下,如果候选字符串和指定词语至少有3个字符一致(不一致字符数=
1),则视为指定词语与候选字符串一致,而在高分辨率时,在有4个字符一致(不一致字符数=0)的情况下,视为指定词语与候选字符串一致。通过采用此方式,从而即使在低分辨率的扫描中也能够降低发生指定词语的识别遗漏的可能性。
[0049] 另外,也可以被构成为,在指定词语与候选字符串的一致率为既定值以上的情况下,判断为二者一致,在此情况下,既定值采用在低分辨率扫描的情况下相比于高分辨率扫描的情况而较低的值。如果将指定词语的字符数设为X,则一致率为X个字符以上的候选字符串之中的连续的X个字符的量的字符串与指定词语一致的程度。
[0050] 另外,在存储介质20中,可以存储不同的多个指定词语。例如设为存储有第一指定词语和第二指定词语。在可能性为第一值的第一候选字符串与第一指定词语一致、且可能性为第二值的第二候选字符串与第二指定词语一致的情况下,处理器10根据第一值大于第二值的情况而将第一指定词语作为图像数据中所包含的指定词语来选择,并且根据第二值大于第一值的情况而将第二指定词语作为图像数据中所包含的指定词语来选择。具体而言,例如在第一指定词语为“1年级”且第二指定词语为“2年级”的情况下、且图像数据内的对象的字符组为“1年级”的可能性是与该字符组为“2年级”的可能性相比而较大的值的情况下,处理器10将可能性的数值较大的“1年级”作为图像数据中所包含的指定词语来选择。另一方面,在图像数据内的对象的字符组为“1年级”的可能性是与该字符组为“2年级”的可能性相比而较小的值的情况下,处理器10将可能性的数值较大的“2年级”作为图像数据中所包含的指定词语来选择。如此,通过选择可能性较高的候选字符串,从而能够降低指定词语提取的失败的可能性。
[0051] 另外,也可以被构成为,通过判断部13的功能,从而处理器10针对表示图像的图像数据而实施字符识别,并输出作为识别出的字符串的候选的候选字符串、和图像数据。例如,处理器10将结束了字符识别处理的图像数据显示在UI部30的显示器上。当用户触摸图像数据的所期望的字符等而进行选择时,处理器10将多个与包含该字符的字符组相对应的候选字符串显示在显示器上。处理器10输出可能性为阈值以上的候选字符串。该阈值为,与以较高的分辨率而被进行了扫描的情况相比,在以较低的分辨率而被进行了扫描的情况下更低的值。其结果为,与以高分辨率而进行了扫描的情况相比,在以低分辨率而对相同的图像进行了扫描的情况下会向用户提示更多的候选字符串。然后,当用户从候选字符串之中选择能够正确地识别的字符串时,处理器10将通过用户而被选择的候选字符串作为表示用户从图像数据内选择的字符组的字符串来采用。处理器10也可以采用如下方式,即,对所采用的字符串是否与指定词语一致进行判断。
[0052] 通过以上方式,对在图像数据中是否包含指定词语进行判断,且在包含的情况下,处理器10通过处理部14的功能并依据输出设定来印刷图像数据,并且将图像数据保存到将指定词语创建成文件夹名的文件夹中。另外,向文件夹的保存在图3的选择部g1被设定为开启的扫描的情况下被实施。
[0053] 在图5的示例的情况下,例如像图6那样而在存储介质20中设置各文件夹。共享文件夹(也称为共有信箱)F1为对不包含任何指定词语的图像数据进行保存的文件夹。“1年级”文件夹F2为对包含作为上位指定词语的“1年级”、但是不包含作为“1年级”的下位指定词语的“1年级1班”、“1年级2班”、“1年级3班”的图像数据进行保存的文件夹。“1年级1班”文件夹F3为对包含作为下位指定词语的“1年级1班”的图像数据进行保存的文件夹。“1年级2班”文件夹F4为对包含作为下位指定词语的“1年级2班”的图像数据进行保存的文件夹。“1年级3班”文件夹F5为对包含作为下位指定词语的“1年级3班”的图像数据进行保存的文件夹。如图6所示,“1年级1班”文件夹F3、“1年级2班”文件夹F4、“1年级3班”文件夹F5也可以作为“1年级”文件夹F2的下位的文件夹而被创建。通过以这种方式来构成文件夹结构,从而易于使用户对上位指定词语与下位指定词语的关系性进行识别。
[0054] 通过处理部14的功能,从而处理器10根据图像数据包含上位指定词语但不包含下位指定词语的情况,而将图像数据保持到上位指定词语的文件夹中,并且依据上位指定词语的输出设定来实施印刷处理。此外,处理器10根据所取得的图像数据包含下位指定词语的情况,而将图像数据保存到下位指定词语的文件夹中,并且不依据上位指定词语而是依据下位指定词语的输出设定来实施印刷处理。
[0055] 在本实施方式中,依据上位指定词语的处理原则上包括依据包含上位指定词语且与上位指定词语相比而较长的所有指定词语的处理。例如,在相对于“1年级”这样的上位指定词语的下位指定词语有“1年级1班”、“1年级2班”和“1年级3班”这三个的情况下,分别依据三个下位指定词语的处理全部被包含在依据上位指定词语的处理中。更具体而言,例如,在如图5那样设定了印刷份数的情况下,处理器10将包含作为上位指定词语的“1年级”但是不包含下位指定词语的图像数据的印刷份数设为30份+29份+29份=88份。处理器10对印刷部50进行控制,以使之将该图像数据印刷88份。通过采用此方式,从而用户在图像数据包含上位指定词语但是不包含下位指定词语的情况下,能够实施依据相对于上位指定词语的所有下位指定词语的处理。
[0056] 另外,依据上位指定词语的处理也可以例外性地并非包含依据相对于上位指定词语的所有下位指定词语的处理。在图5的示例中,也能够变更为,在“1年级”的印刷份数列表中设定“1年级1班的印刷份数”和“1年级2班的印刷份数”,而不设定“1年级3班的印刷份数”。在采用此方式的情况下,能够针对包含上位指定词语但不包含下位指定词语的图像数据而实施依据一部分的下位指定词语的处理。
[0057] 此外,针对包含作为下位指定词语的“1年级1班”的图像数据,处理器10在如图5那样设定了印刷份数的情况下,会印刷与“1年级1班”这样的下位指定词语建立了对应关系的印刷份数、即30份。
[0058] 如以上那样,根据本实施方式,复合机1能够实施与预先和图像数据中所包含的指定词语建立了对应关系的输出设定相应的印刷。因此,与用户针对扫描获得的图像数据而重新实施输出指示(印刷指示)来执行印刷的情况相比,能够省去用户的劳力和时间,进而会提高使用便利性。
[0059] (2)扫描处理:
[0060] 图7为表示扫描处理的流程图。图7的扫描处理为在如下的情况下被执行的处理,该情况为,在图2所示的画面中实施扫描设定,进而在图3所示的画面中将选择部g1设定为开启并设定至少一个指定词语,且以在组印刷设定部g5中选择了任意一个印刷份数的列表的状态而对保存按钮b1进行了操作。
[0061] 当开始实施扫描处理时,处理器10对指定词语进行保存,并受理扫描开始指示(步骤S100)。即,处理器10将被输入至指定词语输入部g4的指定词语和被组印刷设定部g5设定的登记列表名建立对应关系而保存在存储介质20中(例如,参照图5的D1、D2)。并且,处理器10视为通过用户而进行了依据利用图2所示的扫描设定画面而被设定的扫描设定的扫描的开始指示,并前进至步骤S105的处理。
[0062] 处理器10执行扫描(步骤S105)。即,处理器10依据利用图2所示的扫描设定画面而被设定的扫描设定来使图像传感器进行工作以实施扫描,从而生成表示图像的图像数据。
[0063] 接着,处理器10执行指定词语检索处理(步骤S110)。指定词语检索处理为针对作为扫描的结果而被生成的图像数据来执行OCR并在检测出指定词语的情况下设置标志的处理。关于详细内容,将在后文中进行叙述。
[0064] 处理器10在将于步骤S105中被生成的图像数据设为预定的文件形式(例如PDF)的文件的情况下,针对每个文件而使标志建立对应关系。在文件所包含的图像数据中包含在步骤S100中被指定的指定词语的情况下,该文件的标志被设置为1。该文件的标志在与指定词语相应的输出设定的印刷结束之后被设置为0。包含指定词语未被包含的图像数据的文件的标志被保持为0。
[0065] 接着,处理器10对标志是否已被设置为1进行判断(步骤S120)。即,处理器10经过指定词语检索处理而对标志是否已被设置为1进行判断。另外,由于在图像文件分割保存的选择部g2为开启的情况下将一页的图像数据设为一个文件,因此,在生成多个文件的情况下,步骤S120至S140以所生成的文件数的量而被重复实施。
[0066] 在步骤S120中判断为已设置了标志的情况下,处理器10对指定词语用信箱是否已经创建完毕进行判断(步骤S130)。即,对与在步骤S100中被指定的指定词语相对应的文件夹在存储介质20中是否已经创建完毕进行判断。
[0067] 在于步骤S130中并未判断为创建完毕的情况下,处理器10生成指定词语用信箱(步骤S135),并将图像数据保存到所创建的指定词语用信箱中(步骤S140)。即,处理器创建将指定词语设为文件夹名的文件夹,并将包含图像数据的文件保存到该文件夹中。在于步骤S130中判断为创建完毕的情况下,处理器10将图像数据保存到创建完毕的指定词语用信箱中(步骤S140)。即,处理器10将包含图像数据的文件保存到已经创建完毕的与指定词语相对应的文件夹中。
[0068] 另外,在于步骤S120中未判断为已设置了标志的情况下,处理器10将图像数据保存到共享信箱中(步骤S125)。即,将包含图像数据的文件保存到共享文件夹F1(参照图6)中。
[0069] 在执行了步骤S125或者步骤S140之后,处理器10对在指定词语用信箱中是否保存了图像数据进行判断(步骤S145)。在于步骤S145中并未判断为已被保存的情况下(图像数据被保存在共享信箱中的情况下),处理器10结束扫描处理。
[0070] 在步骤S145中,在判断为图像数据已被保存在指定词语用信箱中的情况下,处理器10开始实施步骤S150至S170的组印刷的处理。步骤S150至S170的处理针对被保存在与指定词语相对应的文件夹中的文件,而被逐个文件地执行。即,处理器10对是否已设置了处理对象的文件的标志进行判断(步骤S150),在已设置了标志的情况下视为组印刷的对象(步骤S160),而在未设置标志的情况下视为组印刷的对象外(步骤S155)。
[0071] 在执行了步骤S155或者步骤S160之后,处理器10对是否在指定词语用信箱内的全部文件中都决定了印刷对象进行判断(步骤S165)。在于步骤S165中并未判断为针对全部而都决定了印刷对象的情况下,处理器10返回至步骤S150的处理。在于步骤S165中判断为针对全部而都决定了印刷对象的情况下,处理器10印刷组印刷对象的图像数据,并将标志重置(步骤S170)。即,处理器10基于处理对象的文件中所包含的图像数据和与指定词语建立了对应关系的输出设定而对印刷部50进行控制,以执行印刷。然后,处理器10针对完成了印刷的文件而将标志设置为0。
[0072] (2‑1)指定词语检测处理:
[0073] 图8为表示在图7的步骤S110中被执行的指定词语检测处理的流程图。当开始实施指定词语检测处理时,处理器10针对图像数据而实施字符识别处理(步骤S200)。即,针对图像数据的整体而实施与指定的语言相对应的字符识别处理,且按被推断为1个字的每个单位而取得候选字符串和表示该候选字符串的可能性的数值。
[0074] 接着,处理器10将包含图像数据的文件的标志设置为0(步骤S205)。即,标志以0而被初始化。接着,处理器10对图像数据是否在指定的分辨率以下而被扫描出进行判断(步骤S210)。即,处理器10基于被使用于图像数据的扫描中的扫描设定而对图像数据的分辨率是否为字符识别处理的精度大幅变化的分辨率(例如,200dpi)以下进行判断。处理器10将该分辨率以下的分辨率下的扫描视为低分辨率下的扫描,且将与该分辨率相比而较大的分辨率下的扫描视为高分辨率下的扫描。
[0075] 在于步骤S210中并未判断为低分辨率下的扫描的情况下、即判断为高分辨率下的扫描的情况下,处理器10在存在与指定词语的不一致字符数为既定字符数NH以下、且可能性为阈值TH以上的候选字符串的情况下,将标志设置为1(步骤S215)。阈值TH为与阈值TL相比而较大的值。既定字符数NH在本实施方式中为0。在不存在这样的候选字符串的情况下,该图像数据的标志被保持为0。
[0076] 在于步骤S210中判断为低分辨率下的扫描的情况下,处理器10在存在与指定词语的不一致字符数为既定字符数NL以下、且可能性为阈值TL以上的候选字符串的情况下,将标志设置为1(步骤S220)。既定字符数NL在本实施方式中为1。在不存在所述候选字符串的情况下,该图像数据的标志被保持为0。
[0077] (3)其他实施方式:
[0078] 以上的实施方式为用于实施本发明的一个示例,除此以外,也能够采用各种各样的实施方式。例如,受理部、扫描仪、取得部、判断部、以及输出部既可以被设置在相同的装置中,也可以使其中的至少任意一个被与其他构件分散地设置在不同的装置中。
[0079] 也可以将从FAX等外部装置取得数据的通信连接器或天线作为取得部。
[0080] 处理部中的输出除了复合机1中的印刷以外,也可以为其他印刷装置中的印刷,也可以为FAX发送,还可以为向其他装置的数据传送。输出设定也可以包括输出目的地的信息(收信方FAX号码、输出目的地打印机、传送目的地装置(共享文件夹名))、输出文件形式等。
[0081] 在上述实施方式的复合机1中,也可以被构成为,实施依据扫描设定的扫描,且在完成与输出设定相应的输出之前复合机1的电源被断开了的情况下,在复合机1的电源此后成为开启之后再进行输出。因此,判断部使存储介质对判断结果进行存储。在上述实施方式中,“判断结果”为与图像数据建立了对应关系的标志。处理部在启动时存在未输出的图像数据的情况下,基于从存储介质读取到的判断结果而对未输出的图像数据进行输出。即,在重新启动时,在存在标志保持为1的图像数据的情况下,能够视为该图像数据的输出(印刷)未完成。处理部通过在重新启动后输出标志保持为1的图像数据,从而能够可靠地执行与输出设定相应的输出。
[0082] 判断部并不限于如下方式,即,通过对图像数据实施光学字符识别处理,从而从图像数据的图像之中所包含的字符的图像中对图像数据所包含的字符串进行识别。判断部既可以根据图像数据的图像之中所包含的标记图的方格的位置来对图像数据中所包含的字符串进行识别并判断,也可以对所取得的数据之中是否作为数字数据而包含词语进行判断。
[0083] 判断部除了参照不一致字符数来实施是否为指定词语的判断以外,还可以参照一致字符数、或者参照不一致字符或一致字符的数的相对于指定词语的字符数的比例,来实施是否为指定词语的判断。无论采用何种方式,一致字符数较少的字符串都不会被判断为指定词语。
[0084] 判断部输出与扫描设定相应的数量的候选字符串(作为字符识别的结果的候选字符串)的结构除了可以应用于上述实施方式那样的具备对指定词语是否被包含在图像数据之中进行判断的功能的扫描系统以外,还可以应用于具备字符识别功能的一般的扫描仪、针对从扫描仪被输出的图像数据而实施字符识别处理的各种装置、以及字符识别程序中。此外,与扫描设定相应的数量的候选字符串的输出也可以以显示在显示器上等方式而针对用户来被实施。或者,在为使用字符识别的识别结果而实施其他处理的结构的情况下,也可以针对该其他处理模块而输出与扫描设定相应的数量的候选字符串。虽然字符识别率可能根据扫描设定而有所不同,但是通过向用户提示与扫描设定相应的数量的候选字符串,从而能够使用户根据扫描分辨率而对不同数量的候选字符串进行识别,以作为字符识别结果。此外,通过向其他处理模块输出与扫描设定相应的数量的候选字符串,从而其他处理模块能够根据扫描分辨率而实施使用了不同数量的候选字符串的其他处理。
[0085] 另外,也可以被构成为,在输出作为识别结果而获得的候选字符串为是候选字符串的可能性在阈值以上的候选字符串的结构中,通过与以较高的分辨率而被进行了扫描的情况相比,在以较低的分辨率而被进行了扫描的情况下将阈值设为更低的值,从而输出与扫描设定相应的数量的候选字符串。通过采用此方式,从而能够提高与高分辨率扫描相比在低分辨率扫描的情况下能够输出更多的候选字符串的可能性,并且能够降低在使候选字符串输出的用户或其他处理模块中提取遗漏原本图像数据中所包含的字符串的可能性。
[0086] 判断部也可以被构成为,根据扫描的颜色设定而改变所输出的候选字符串的个数。字符识别处理的识别率(被正确地字符识别出的比例)有时与颜色模式(扫描的颜色设定)以彩色而被进行了扫描的情况以及以灰度而被进行了扫描的情况相比,在以黑白而被进行了扫描的情况下会更加下降。在具备具有这样的特性的扫描仪的情况下,判断部也可以为如下结构,即,与字符识别精度以较高的颜色设定而被进行了扫描的情况相比,在字符识别精度以较低的颜色设定而被进行了扫描的情况下会输出更多的候选字符串。通过采用此方式,从而能够提高可以无遗漏地输出候选字符串的可能性。
[0087] 此外,判断部也可以被构成为,根据图像数据的压缩率来改变所输出的候选字符串的个数。字符识别处理的识别率(被正确地字符识别出的比例)可能成为图像数据的压缩率越高则越降低的趋势。因此,判断部也可以为如下结构,即,与图形数据以低压缩率而被压缩的情况相比,在图像数据以高压缩率而被压缩的情况下会输出更多的候选字符串。通过采用此方式,从而能够提高可以无遗漏地输出候选字符串的可能性。
[0088] 此外,虽然在上述实施方式中,列举出扫描系统具备根据图像数据包含上位指定词语但不包含下位指定词语的情况而依据上位指定词语来进行处理、且根据所取得的图像数据包含下位指定词语的情况而不依据上位指定词语而是依据下位指定词语来进行处理的处理部的示例,但是这样的处理部也可以被设置在扫描系统以外的系统或装置中。对是否包含指定词语进行判断的对象既可以为被实施了字符识别处理的图像数据,也可以不是图像数据而是文本数据。通过构成具备这样的处理部的系统或装置,从而用户能够针对包含上位指定词语但是不包含下位指定词语的数据来实施与上位指定词语相对应的处理,并且针对包含下位指定词语的数据来实施与下位指定词语相对应的处理。
[0089] 在受理部被构成为受理将图像数据分离成不同的文件的单位的情况下,该单位并不限定于1页。例如,也可以设定为以10页为单位来对文件进行划分。此外。例如也可以设定为,根据原稿的纸张的颜色是否为特定的颜色而对文件进行划分。此外,例如在能够识别出图像数据内的页码的情况下、且在以页码成为升序的方式而被扫描了的情况下,也可以以在页码被复位为1的页码以后、和在其之前而对文件进行划分的方式来进行设定。
[0090] 此外,本发明也可以作为计算机所执行的程序、单纯的方法或生产方法来应用。例如,本发明也作为数据处理程序的发明而成立,所述数据处理程序使计算机作为如下部分而发挥功能,即:受理部,其从存储介质受理上位指定词语、以及包含上位指定词语且与上位指定词语相比而较长的下位指定词语;取得部,其取得数据;判断部,其对在所取得的数据中是否包含上位指定词语、或者在数据中是否包含上位指定词语和下位指定词语进行判断;处理部,其根据数据包含上位指定词语但不包含下位指定词语的情况而依据上位指定词语来进行处理,并且,根据所取得的数据包含下位指定词语的情况而不依据上位指定词语而是依据下位指定词语来进行处理。
[0091] 此外,例如本发明也作为输出物的生产方法的发明而成立,所述输出物的生产方法包括如下操作,即:取得数据,根据所取得的数据包含上位指定词语但不包含下位指定词语的情况,而生产依据上位指定词语来进行了处理的输出物,并且,根据所取得的数据包含下位指定词语的情况,而生产不依据上位指定词语而是依据下位指定词语来进行了处理的输出物,其中,所述下位指定词语为包含所述上位指定词语且与所述上位指定词语相比而较长的词语。输出物例如为印刷物或已处理的数据等。
[0092] 此外,以上这样的系统、程序、方法既可以作为单独的装置而被实现,也可以利用多个装置所具备的部件而被实现,其包括各种方式。此外,能够以一部分为软件、一部分硬件等的方式来适当地进行变更。此外,发明也作为对系统进行控制的程序的记录介质而成立。当然,该程序的记录介质既可以为磁记录介质,也可以为半导体存储器,且在今后被开发的任何记录介质中也能够以完全同样的方式来考虑。
[0093] 符号说明
[0094] 1…复合机;10…处理器;11…受理部;12…取得部;13…判断部;14…处理部;20…存储介质;30…UI部;40…通信部;50…印刷部;60…读取部(扫描仪);70…FAX通信部;F1…共享文件夹;F2至F5…与指定词语相对应的文件夹;b1…保存按钮;g1…选择部;g2…选择部;g3…语言设定部;g4…指定词语输入部;g5…组印刷设定部;g6…选择部。

当前第1页 第1页 第2页 第3页