首页 / 信用报告自助解读设备

信用报告自助解读设备无效专利 发明

技术领域

[0001] 本发明属于信用查询技术领域,具体涉及一种信用报告自助解读设备。

相关背景技术

[0002] 目前随着国内征信市场的发展,中国人民银行征信中心信用报告查询量日益增加,中国人民银行已经在各省及国有股份银行网银开通信用报告查询。
[0003] 随着查询的便捷相应的需要进行信用报告解读的需求也逐渐增加,目前在人民银行营业网点查询的用户可选择寻求营业网点的工作人员进行解读。在金融机构代理网点及互联网查询的用户则无相应的人员进行解读工作。
[0004] 而人民银行工作人员进行解读也需要逐页逐项进行查看后进行一一解读,效率低且耗时长。

具体实施方式

[0026] 为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
[0027] 参照图1和图2所示,本发明的实施例提供了一种信用报告自助解读设备,包括:触摸显示屏、柜体以及设置于柜体中的扫描仪和主机;
[0028] 触摸显示屏设置于柜体的上部并和主机连接;
[0029] 柜体上和扫描仪相适配的位置分别设有资料入口2和资料出口4,扫描仪用于对信用报告扫描,并向主机发送相应的扫描文件;
[0030] 主机用于对扫描文件进行解读,并将解读信息通过触摸显示屏进行展示。
[0031] 具体的,用户将打印出的信用报告通过资料入口2,扫描仪在感应到有纸张放入时会开启扫描功能自动将信用报告卷入进行扫描识别,并将扫描后的信用报告资料出口4送出,可在出口处设置相应的承接台来盛放扫描完后的信用报告方便用户拿取。扫描仪会生成相应的信用报告的图片或PDF格式发送到主机,主机可基于图像识别技术对信用报告的图片格式或PDF格式按照预先设定的归纳格式或者依据信用报告本身的格式,因为信用报告本身就是由多个统计表格生成的,因此根据表格本身的划分进行相应的分类识别和归类统计,并将归类解析后的统计结果展示到触摸显示屏上,供用户根据自己的需求选择查看相应的解析数据,从而不必在需要专用的人员进行解析,在实现信用报告解析自动化的同时,提高解析的效率为用户和银行都提供了便利。
[0032] 在本发明的另一具体实施例中,还包括设置于柜体上的扬声器3,扬声器3和主机连接,用于播报相应的解读信息。扬声器3可配合触摸显示屏在展示相应数据的同时,可以播报相应的内容,为视力不好的用户提供了便利。同时扬声器还可配合麦克风进行语音的输入,实现根据用户的语音指令进行相应的展示和语音的播报为用户提供了操作的便利。
[0033] 在本发明的一些具体实施例中,还包括设置于触摸显示屏上方的摄像头1,摄像头1和主机连接,用于人脸图像的获取和身份的识别。在用户使用信用报告自助解读设备进行解析之前,需要通过摄像头进行人脸图像的采集,进而通过后台的人脸识别系统进行身份的识别,并在身份识别通过后,才会开启触摸显示屏和扫描仪进行工作解析,从而对设备的使用进行更精确和有效的管理。
[0034] 在本发明的另一些具体实施例中参照图3所示的工作的流程图,主机包括文字识别模块,用于标记出扫描文件中每个板块的位置信息。
[0035] 主机还包括表格识别模块,用于标记出每个板块内的表格字段位置信息。
[0036] 主机还包括结构输出模块,用于对标记后的板块的位置信息和表格字段位置信息组装成结构化数据。
[0037] 主机还包括数据提取模块,用于基于每个板块的数据项名称提取相应的详细数据。
[0038] 主机还包括数据分类模块,用于对不同类型的详细数据进行分类。
[0039] 主机还包括数据清洗模块,用于将同一类型相同的数据进行删除,对识别后逻辑错误的地方进行补充和更替。
[0040] 还包括:归类存储模块,用于基于不同类型和不同字段将所有数据存入数据库中供数据的调取使用。
[0041] 作为具体的实现方式,通过文字OCR识别标记出每个板块的位置信息;通过表格OCR识别标记出每个板块内的表格字段位置;数据识别标记后会按照原有格式重新组装成结构化的数据;然后根据每个板块的数据项名称将详细数据进行提取;再根据不同类型的数据进行分类;根据数据类型对数据进行处理,将同一类型相同的数据进行删除,对识别后逻辑错误的地方进行补充和更替;按不同的类型和不同的字段将所有的数据存入数据库中;可以按照呆帐、逾期、贷款、信用卡、担保、授信机构、住房公积金等分类将数据从数据库中调取再汇总;最后可按照呆帐、逾期、贷款、信用卡、担保、授信机构、住房公积金等顺序将所有明细数据进行展示。
[0042] 其中OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程包括:
[0043] 灰度化、二值化、降噪、倾斜矫正、文字切分等子步骤,首先进行灰度化(gray processing),在RGB模型中,如果R=G=B时,则彩色表示一种灰度颜色,其中R=G=B的值叫灰度值,因此,灰度图像每个像素只需一个字节存放灰度值(又称强度值、亮度值),灰度范围为0‑255。说通俗一点,就是将一张彩色图片变为黑白图片,灰度化一般有分量法、最大值法、平均值法、加权平均法四种方法对彩色图像进行灰度化;
[0044] 然后进行二值化一幅图像包括目标物体、背景还有噪声,要想从多值的数字图像中直接提取出目标物体,最常用的方法就是设定一个阈值T,用T将图像的数据分成两部分:大于T的像素群和小于T的像素群。这是研究灰度变换的最特殊的方法,二值化的黑白图片不包含灰色,只有纯白和纯黑两种颜色;二值化里最重要的就是阈值的选取,一般分为固定阈值和自适应阈值。比较常用的二值化方法则有:双峰法、P参数法、迭代法和OTSU法等。
[0045] 现实中的数字图像在数字化和传输过程中常受到成像设备与外部环境噪声干扰等影响,称为含噪图像或噪声图像。减少数字图像中噪声的过程称为图像降噪(Image Denoising)图像中噪声的来源有许多种,这些噪声来源于图像采集、传输、压缩等各个方面。噪声的种类也各不相同,比如椒盐噪声,高斯噪声等,针对不同的噪声有不同的处理算法。
[0046] 图像降噪的方法一般有均值滤波器、自适应维纳滤波器、中值滤波器、形态学噪声滤除器、小波去噪等。
[0047] 需要通过程序将图像做旋转处理,来找一个认为最可能水平的位置,这样切出来的图,才有可能是最好的一个效果。
[0048] 倾斜矫正最常用的方法是霍夫变换,其原理是将图片进行膨胀处理,将断续的文字连成一条直线,便于直线检测。计算出直线的角度后就可以利用旋转算法,将倾斜图片矫正到水平位置。
[0049] 然后进行文字切分,在进行切分时同一行的两个字符往往挨的比较紧,有些时候会出现垂直方向上的重叠,投影的时候将他们认为是一个字符,从而造成切割的时候出错(多出现在英文字符);也有些时候同一个字符的左右结构在X轴的投影存在一个小间隙,切割的时候误把一个字符切分为两个字符(多出现在中文字符)。所以相较于行切分,字符切分更难可以预先设定一个字符宽度的期望值,切出的字符如果投影超出期望值太大,则认为是两个字符;如果远远小于这个期望值,则忽略这个间隙,把间隙左右的“字符”合成一个字符来识别。
[0050] 特征是用来识别文字的关键信息,每个不同的文字都能通过特征来和其他文字进行区分。对于数字和英文字母来说,这个特征提取是比较容易的,总共就10+26*2=52个字符,而且都是小字符集。对于汉字来说,特征提取的难度就比较大了,因为首先汉字是大字符集;其次国标中光是最常用的第一级汉字就有3755个;最后汉字结构复杂,形近字多,特征维度就比较大。
[0051] 最后对一个文字图像,提取出特征,丢给分类器,分类器就对其进行分类,告诉你这个特征该识别成哪个文字。分类器的设计就是我们的任务。分类器的设计方法一般有:模板匹配法、判别函数法、神经网络分类法、基于规则推理法等,这里不展开叙述。在进行实际识别前,往往还要对分类器进行训练,这是一个监督学习的过程。成熟的分类器也有很多,有SVM,CNN等。
[0052] 这样实现按照特定的表格区域等事先设定的切割方式进行拼凑识别,最终呈现给用户想要查看的内容。
[0053] 本发明上述实施例所提供的信用报告自助解读设备实现了信用报告的自动化解读,可有效减少人工成本和人工解读导致的判断错误,解决了信用报告人工解读的问题,有效提高了解读的效率。
[0054] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0055] 上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。
[0056] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

当前第1页 第1页 第2页 第3页
相关技术
报告自助相关技术
自助解读相关技术
李俊鹏发明人的其他相关专利技术