首页 / 文本识别设备

文本识别设备有效专利 实用

技术领域

[0001] 本实用新型涉及文本识别技术领域,尤其涉及一种文本识别设备。

相关背景技术

[0002] 目前,随着媒体、新闻等互联网信息的交互与迅速膨胀,人们可以通过互联网迅速了解当下新闻信息。但由于人们长久以来对纸质文化的依赖,使得传统报刊、杂志等媒介在生活中仍然是必不可少的获取外接信息的重要方式。
[0003] 人们通过阅读传统纸质报刊、杂志时,由于纸质自身的缺陷,通过纸质渠道阅读,获取到的只有图片和不可编辑文字信息。随着文本处理技术的迅速发展,可将不可编辑的文字信息通过转换成图像信息后进一步处理,将图像信息转换成可编辑的文字信息,进而可以进行阅览、编辑、存储、语音播报等,例如但不限于OCR技术。
[0004] 基于上述技术本领域已有专用的文本识别设备产品,但是其采用摄像头对目标内容进行拍摄时,自然光会直接或通过介质反射至摄像头,导致采集的介质上的文字信息不准确,进而识别结果受到影响;而且现有设备功能较为单一,不具有影像等内容的输出显示功能,用户体验欠佳。实用新型内容
[0005] 本实用新型的目的是提供一种文本识别设备,解决了如上现有专用文本识别产品的缺陷。
[0006] 本实用新型采用的技术方案如下:
[0007] 一种文本识别设备,包括:
[0008] 设备本体;
[0009] 摄像头模组,设置于所述设备本体上,用于对目标内容进行拍摄;
[0010] 光学偏振片,设置于所述摄像头模组的前方,用于降低入射光线中眩光的透过强度;
[0011] 显示模块,设置于所述设备本体上,用于输出并显示所述目标内容的识别结果和/或影像信息。
[0012] 可选地,所述摄像头模组包括感光摄像头。
[0013] 可选地,所述光学偏振片包括嵌入双面光学玻璃结构的偏光膜或附着于所述摄像头模组表面的偏光膜。
[0014] 可选地,所述文本识别设备还包括设置于所述光学偏振片表面的反光涂层和/或防眩光膜。
[0015] 可选地,所述文本识别设备还包括位于所述光学偏振片两侧、开合角度可调节的支架,所述支架与所述光学偏振片连接,用于调节透过所述光学偏振片的眩光强度,并支撑所述设备本体。
[0016] 可选地,所述文本识别设备还包括内置于所述设备本体的电机联动装置,用于调节所述支架的开合角度。
[0017] 可选地,所述文本识别设备还包括位于所述设备本体侧壁的支架调节旋钮,用于触发所述电机联动装置,并改变所述支架的运动速度。
[0018] 可选地,所述支架与所述光学偏振片接触,或者在所述支架与所述光学偏振片之间设有预设间隙。
[0019] 可选地,所述显示模块包括OLED显示屏。
[0020] 可选地,所述文本识别设备还包括处理器和通讯模块,
[0021] 所述处理器内置于所述设备本体中,与所述摄像头模组、所述显示模块和所述通讯模块连接;
[0022] 所述通讯模块与远程服务器建立无线通讯,用于传输所述目标内容的识别结果和/或影像信息。
[0023] 本实用新型提供一种文本识别设备,在摄像头模组的前方设置有光学偏振片,可以降低进入摄像头模组的光线中眩光的强度,因此可以提高文本识别设备的识别效果,进而提高输出的显示内容的清晰度,而且本实用新型新增的显示模块可以更直观、可视地向用户传递出形式更为丰富的信息,例如影像信息,由此,本实用新型能够大幅改善文本识别设备的交互体验。

具体实施方式

[0036] 下面详细描述本实用新型的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本实用新型,而不能解释为对本实用新型的限制。
[0037] 目前的专用文本识别设备采用摄像头对目标内容进行拍摄,自然光直接入射到摄像头,而入射的自然光中存在反光及眩光,直接影响文本识别设备对目标内容的识别效果,导致文本识别能力较差,而且其只能识别出文字信息,不具有诸如影像信息的输出功能,用户体验欠佳。
[0038] 本实用新型针对现有技术的不足,图1和图2分别示出了本实用新型提供的一种文本识别设备的实施例的主视图和后视图,主要包括:设备本体01、摄像头模组15、光学偏振片14以及显示模块06,摄像头模组15设置于所述设备本体01上,用于对目标内容进行拍摄;光学偏振片14设置于所述摄像头模组15的前方,用于降低入射光线中眩光的透过强度;显示模块06设置于所述设备本体01上,用于输出并显示所述目标内容的识别结果和/或影像信息。
[0039] 所述摄像头模组15所拍摄的目标内容包括但不限于新闻刊物、杂志所对应的新闻信息。光学偏振片14设置在摄像头模组15的前方,这样针对油质纸质存在反光、眩光的情况,摄像头模组15对目标内容进行拍摄时,来自目标内容的自然光线在入射到摄像头模组15之前,光学偏振片14对自然光线中的眩光成分进行过滤,因此可以降低进入摄像头模组
15的光线中眩光的强度,可以起到消除光学反光和眩光的作用,有助于使摄像头模组15捕捉到的图像信息保持纯净,为文本识别提供干净的图像信息,从而提高文本识别的准确性,因此可以提高文本识别设备对目标内容的识别效果。所述光学偏振片14的尺寸与所述摄像头模组15的尺寸一致,或者略小于所述摄像头模组15的尺寸。
[0040] 在本实用新型中,所述摄像头模组15采用后置摄像头,具体地,所述摄像头模组15可为感光摄像头,可以针对不同材质的目标内容实现自动感光,例如可以针对不同纸质的期刊自动感光,能够自动调节适配图像颜色,因此可以实现自动对焦和自动曝光,并根据周围环境的光线水平调整曝光时间,以提高对图像信息进行文本识别的准确性。优选地,所述摄像头红外普通两用摄像头,可以根据光源的不同采用不同模式,在夜间或光线较暗的环境中采用红外拍摄模式,在光线正常的环境中采用普通拍摄模式。
[0041] 进一步地,所述文本识别设备还包括与所述摄像头模组15连接的旋转机构,用于旋转所述摄像头模组15的拍摄角度,可以对目标内容的拍摄角度实现自动纠正。具体地,旋转机构可采用但不限于微型马达等现有的可动镜头技术。所述摄像头模组15用于对目标内容进行拍摄,较佳地,所述摄像头模组15采用感光摄像头,可以针对不同材质的目标内容实现自动感光,例如可以针对不同纸质的期刊自动感光,处理器02将图像信息转换成文字信息时,与感光摄像头配套的感光模组会自动辨识出光线强弱,从而可以进一步自动调整所采集图像的参数使得为后续识别处理提供清晰的待处理图片。而感光摄像头及其相应的感光模组和处理过程,借有现有技术可供参考。
[0042] 其中,所述光学偏振片14可以采用嵌入双面光学玻璃结构的偏光膜或附着于所述摄像头模组15表面的偏光膜。较佳地,所述文本识别设备还包括设置于所述光学偏振片14表面的反光涂层和/或防眩光膜,以进一步提高文本识别设备对目标内容的识别效果。
[0043] 进一步地,所述设备本体01包括外壳07和电池后挡板16,所述文本识别设备还包括位于倾斜地位于所述光学偏振片14两侧、开合角度可调节的支架13,用于调节透过所述光学偏振片14的眩光强度,并支撑所述设备本体01。具体地,所述支架13与所述光学偏振片14直接接触或间接接触,当然也可以不接触(例如在支架13和光学偏振片14之间配置有预设距离的间隙),当支架13动作时,可借助于支架13的开合角度和开合力触及到光学偏振片
14并对光学偏振片14产生挤压或舒张的施力效果,使光学偏振片14发生形变或角度变化,从而调节光学偏振片14的焦距,对偏振光的偏振方向进行特定角度的旋转,因此可以对反光、眩光进行不同程度的滤除。所述支架13靠近光学偏振片14一侧的宽度较窄,远离光学偏振片14一侧的宽度较宽,以支撑所述设备本体01,这样可以方便用户观看在显示模块06上显示的识别结果及影像信息。
[0044] 所述文本识别设备还包括内置于所述设备本体01的电机联动装置(图中未示出),所述电机联动装置包括连杆、齿轮和马达,电机联动装置的马达作为动力源,而电机联动装置的动力输出端则和支架13连接,马达的转动带动齿轮、连杆等部件,进而驱动并改变支架13的开合角度,以实现支架13开合角度的调节。作为一个示例而非限制,所述电机联动装置中的马达可为小型步进电机。所述文本识别设备还包括位于所述设备本体01侧壁的支架调节旋钮08,通过支架调节旋钮08可以触发马达启动,并可基于滑动变阻器原理调节马达的转速,进而改变支架13的运动速度,而其中触发马达启动以及调速控制过程皆为常规技术。
此外,在某些实施例中,两个支架的开合角度为20°-160°,具体的开合角度可以根据目标内容的材质及用户需求而调节,对此本实用新型不作限定。当然,在某些实施例中支架13可不限定其数量,例如可为三个或四个,只要支架之间的开合角度可调即可,对此本实用新型不作限定。对于基于不同目标内容、输出不同开合角度及对应的控制指令,这已有大量相关产品和技术可供参考,本实用新型的目的仍是站在硬件改进的构思,为现有的文本识别产品提供更好的识别效果,而对于如何利用目标内容输出相应的指令,则不在本实用新型的限定范围内。图3示出了支架13与设备本体01的相对位置的一种示意图。支架13与设备本体01均与水平面倾斜,并且倾斜度可通过联动转置进行调节。
[0045] 这里还需对支架13再说明,由上述介绍可知,在本实用新型中支架13至少可起到两个独立或同时存在的技术作用,一个是,支撑设备本体01使显示模块06处于适合用户观看的角度;另一个是,用于向光学偏振片14施力,使其改变形状或角度等以此针对不同的光照环境,得到相适应的防眩效果。
[0046] 如图1所示,所述显示模块06位于文本识别设备的中央位置。作为一个示例,所述显示模块06为OLED显示屏,其具有良好的柔性,因此可实现折叠,厚度较薄,可视角度大,并且防蓝光因而更护眼,功耗低,因而更节能,并且具有较高的分辨率,清晰度更高,能够大幅改善文本本识别设备的交互体验,并且方便用户携带。作为另一示例,所述显示模块06为LCD显示屏,具体为嵌入式LCD显示屏,OLED显示屏及LCD显示屏均可以通过点击实现识别结果及影像信息的选择。
[0047] 综上可见,本实施例提供的文本识别设备的主要特点是,在摄像头模组的前方设置有光学偏振片,这样对目标内容进行拍摄时,可以降低进入摄像头模组的光线中眩光的强度,从而相对现有文本识别产品而言,可以提高文本识别设备的识别效果,进而提高输出的显示内容的清晰度,而且本实用新型新增的显示模块可以更直观、明了地向用户传递出形式更为丰富的信息,由此,本实用新型能够大幅改善文本识别设备的交互体验。
[0048] 需说明的是,其中涉及的对于摄像头模组所采集图像的处理过程皆有现有技术可供参考,本实用新型的目的是提供硬件层面的改进手段,以克服现有产品未对反光及眩光进行处理的缺陷,并为拓展文本识别设备更为智能的交互功能提供硬件基础。
[0049] 如图4所示,进一步地,所述文本识别设备还包括处理器02和通讯模块05,所述处理器02内置于所述设备本体01中,与所述摄像头模组15、所述显示模块06和所述通讯模块05连接;所述通讯模块05与远程服务器04建立无线通讯,用于传输所述目标内容的识别结果和/或影像信息,例如但不限于与识别结果相关的视频等。
[0050] 具体地,所述摄像头模组15将目标内容对应的图像信息经过MIPI接口传输到处理器02,所述处理器02摄取图像信息中的图像信号,并对图像信号经过灰度化、二值化、去噪、校正、运算识别等处理,将图像信息转换成文字信息(具体的处理方式本身皆有本领域的大量成熟方案供借鉴),完成图像信息的识别。作为示例而非限制,所述处理器02采用CPU(例如高通450平台CPU)或GPU(例如赛灵思FPGA加速器)。进一步地,所述处理器02还与前述电机联动装置连接,具体的控制原理并非本实用新型重点,仅作举例,处理器10可以根据不同目标内容控制电机联动装置,实现支架13开合角度的调节。并且处理器10可以在关闭设备或断电的情况下,控制电机联动装置,使支架13自动回缩至与设备本体01贴合的位置,方便用户携带。
[0051] 接着,所述通讯模块05为WLAN功放芯片(例如RPM6743),在其与天线进行校准配置RF后,便可在WiFi条件下进行网络连接,实现上行及下行传输数据,远程服务器04经由通讯模块05接收处理器02的识别结果,基于文字信息中的关键字进行网络数据检索,检索与文字信息对应的待选视频链接,再将检索到的待选视频链接信息经由通讯模块05传输给处理器02;所述远程服务器04可以结合现有的搜索技术(例如百度搜索引擎、谷歌搜索引擎、360搜索引擎等)进行搜索,本实用新型结合该技术的目的,是使得本实用新型提供的文本识别设备在使用层面更为智能。作为一个示例而非限制,所述远程服务器04为云端服务器,可以实时访问云端在线视频,并实时输出待选视频链接信息。较佳地,云端服务器可以与新闻刊物、杂志社、视频网站相联合,以建立特定的视频数据库,该特定的视频数据库专门用于存储与特定的新闻刊物、杂志等纸质载体上刊载内容的相关视频相对应的视频链接库,以便于更加快速便捷地进行图像信息的识别与视频链接的搜索,让读者在获取文字信息的同时可以参考影像信息,让纸质刊物变得有富有科技感,促进新闻报刊、杂志等纸质刊物具有先进科技的纸质文化,极大地提升用户的交互体验。而上述由服务器实现的视频搜索、推送等仅是本实用新型的应用拓展举例,而非限定的重点,并且由服务器实现的上述过程也有多种现有技术可供参考,此处不再赘述。
[0052] 之后,所述显示模块06通过MIPI接口与处理器02相连接,用于显示前述影像信息,例如但不限于待选视频链接信息,并播放用户在所述待选视频链接中所选择的视频链接所对应的影像信息,以供用户进行观看,影像信息中的音频信息还可以通过插入耳机接口17的耳机或设于设备本体的扬声器(图中未示出)进行播放。
[0053] 进一步地,如图1和图2所示,所述文本识别设备还包括外壳07和电池后挡板16,所述处理器02位于由所述外壳07和所述电池后挡板16所构成的腔体内,对此可借鉴大量相关现有产品,本实用新型对此不予限定。
[0054] 进一步地,所述文本识别设备还包括位于所述腔体内并与所述电池后挡板16所在位置对应的供电模块(图中未示出)。所述供电模块包括:锂电池、PMIC(Power Manage IC,电源管理集成电路)、充电保护单元和充电接口03。供电模块通过锂电池,经过PMIC将储存在锂电池中的电能转换成文本识别设备各模块的供电电压,且锂电池可由充电接口03,通过充电保护单元进行充电。优选地,所述充电保护单元为过压保护电路。
[0055] 可选地,所述文本识别设备还包括位于所述外壳07上的按键模块。具体地,所述按键模块包括音量按键10、开关按键11以及确认按键12。如图1和图2所示,音量按键10和开关按键11自上而下地设置于文本识别设备的右侧边,音量按键10的数量为两个,分别为增加音量键和减小音量键,用户在观看视频链接所对应的影像信息时,可通过音量按键10可以实现音量的调节,开关按键11主要用于开关机开关机以及短时间按下实现显示模块06的屏幕亮灭。确认按键12位于文本识别设备下方的中心位置,如图1所示,确认按键12位于显示模块06的下方,主要用于选中命令执行,例如,可以使摄像头模组实现拍照,而且可以使用户在观看视频链接所对应的影像信息的过程中实现视频暂停功能。
[0056] 以上依据图式所示的实施例详细说明了本实用新型的构造、特征及作用效果,但以上仅为本实用新型的较佳实施例,需要言明的是,上述实施例及其优选方式所涉及的技术特征,本领域技术人员可以在不脱离、不改变本实用新型的设计思路以及技术效果的前提下,合理地组合搭配成多种等效方案;因此,本实用新型不以图面所示限定实施范围,凡是依照本实用新型的构想所作的改变,或修改为等同变化的等效实施例,仍未超出说明书与图示所涵盖的精神时,均应在本实用新型的保护范围内。

当前第1页 第1页 第2页 第3页