首页 / OCR识别方法、识别装置和识别系统

OCR识别方法、识别装置和识别系统实质审查 发明

技术领域

[0001] 本申请涉及物流领域,特别是涉及一种OCR识别方法、识别装置和识别系统。

相关背景技术

[0002] OCR(Optical Character Recognition,光学字符识别)是指指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
[0003] 在一些识别场景下,例如物流场景进行OCR识别中,在快递包裹面单识别信息的过程中,利用计算能力较弱的识别终端进行识别,可能会有识别不出、或者识别率低的问题;利用计算能力较强的服务器进行识别,会存在耗时长、且占用服务器资源的问题,目前没有较好的解决办法。
[0004] 此外,用于输出机器学习模型的识别模型的训练往往需要大量人力来进行手动标定数据,导致后续模型优化没有动力去不断完善。这也是现存的问题之一。

具体实施方式

[0040] 下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
[0041] 本申请的核心思想之一在于,提出一种OCR识别方法、装置和系统。通过特定的预设规则,将识别终端获得的图片发送到识别服务器进行识别,或者留在本地识别。提高了针对图片的OCR识别的效率。
[0042] 第一实施例
[0043] 本申请第一实施例提出一种识别系统,包括识别服务器和至少一个识别终端。
[0044] 如图1所示为所述的识别系统的示意图,如图1所示,识别服务器可以为云端服务器或者边缘服务器,识别终端20例如可以为识别终端。其中云端服务器可以是单独的用于进行OCR识别的服务器,或者是整合了其他功能的服务器。边缘服务器是利用边缘计算原理,布置在中心服务器以外的网络边缘的节点上的服务器。边缘计算是一种优化应用程序或云计算系统的技术,是将数据的处理、应用程序的运行,甚至一些功能服务的实现,由中心服务器下放到网络边缘的节点上,在边缘服务器上实现计算。
[0045] 识别终端20例如是设置在用户的终端的装置,或者例如手机、PDA、平板电脑、靶枪等装置,供用户直接使用,对图片进行识别。
[0046] 此处的图片可以是物流场景下的包裹的面单等。包裹的面单上记载的信息可以包括收件人姓名、物流单号、订单号、收件人地址、收件人电话等。
[0047] 在物流场景下,需要高速的识别。每次识别的量大,且不能出错。如果本地识别无法快速识别或者无法准确识别,则需要上传到云端的识别服务器或者边缘服务器去识别。
[0048] 识别终端20例如可以包括图像参数提取模块21、判断模块22、发送模块23和识别模块24。
[0049] 图像参数提取模块21用于从图片中提取图像参数;判断模块22用于利用所述图像参数判断所述图片是否符合预设规则;发送模块23用于当判断出所述图片符合预设规则时,将所述图片发送到识别服务器进行识别;识别模块24用于当判断出所述图片不符合预设规则时,识别所述图片并获得图片信息。
[0050] 在一些实施例中,识别终端20还可以包括图像采集模块25。图像采集模块25可以是终端配置的摄像头,或者是获取终端配置的摄像头所采集的图像信息的模块。例如,摄像头采集图像并转换为数字信号之后,图像采集模块25将该数字信号获取并传输至图像参数提取模块21。
[0051] 图像参数提取模块21可以从图片中提取图像参数。识别终端拍摄后的图片例如为一个数据集,该数据集中包含每一个像素点的RGB像素值。图像参数提取模块可以从中识别获取图片中的条码信息、倾斜角度等信息。
[0052] 图像参数提取模块识别图片的条码区域,例如可以是通过像素来判断。条码区域与其他区域相比,其为黑‑白‑黑‑白等有序排列的颜色。据此图像参数提取模块可以获得图片的条码区域的位置、条码所代表的数字等信息。条码代表的数字确定后,可以根据预设的规则,确定数字代表的内容,例如订单号、物流单号等。前述的条码信息可以包括:1、条码的大小:条码占比图片大小阈值。
[0053] 在一些实施例中,条码占比较小表明拍摄到的手机号码等也较小,本地识别较为困难,故可以上传到云端服务器或者边缘服务器去识别。
[0054] 图像参数提取模块识别图片的倾斜角度,例如可以是通过获取图片拍摄的基准线与图片边缘的夹角大小,确定图片相对于水平坐标轴和数值坐标轴的夹角。
[0055] 此外,图片的倾斜角度也可以包括图片相对于三个坐标轴,即x、y、z的倾斜角度,或者相对于xy平面、yz平面、xz平面各自的倾斜角度等。
[0056] 图片倾斜角度可以包含三个数值,分别是相对于三个轴或者三个平面图片倾斜角度较大,在端侧旋转过程中图片会被切割导致无法识别,同步需要上传到云端识别。
[0057] 将图片留在本地的识别终端进行识别处理还是上传至云端或者边缘识别服务器去处理是判断模块确定的。判断模块根据预设规则,根据图像参数判断图片是否符合预设规则,当符合预设规则时,将图片发送至识别服务器进行识别;当不符合预设规则时,识别图片并获得图片信息。
[0058] 通常来说,可以在云端设置识别能力较强的机器学习模型。而在识别终端,出于硬件的运行速度、容量等原因,终端的计算处理能力,弱于云端。边缘服务器作为中心节点周边的计算节点,其计算处理能力一般弱于云端的识别服务器而强于终端。
[0059] 在一实施例中,识别服务器和识别终端均是由同一个模型训练获得的。本申请的OCR识别系统还可以包括模型训练服务器30。
[0060] 在识别服务器10或者识别终端20进行识别之后,将所识别的数据作为云端的机器学习模型的训练数据上传。该训练数据用于供模型训练服务器30训练机器学习模型。无论在识别服务器10还是识别终端20,在进行识别之后,只要是识别之后被认为是正确的数据,都可以上传至数据库进行训练数据沉淀。也就是说识别服务器10和识别终端20都可以提供样本数据作为历史数据,用来训练机器学习模型。每一个样本数据可以包括数据集(例如数字化的图片)和标签(例如针对该图片的部分或者全部识别出的图片信息,包括物流面单的姓名、电话、地址信息)。如果认为识别之后的数据是错误的,则可以将人工获取的或者从数据库中提取的正确的数据和错误的数据均上传,用于训练机器学习模型。例如当模型识别正确时,通过手动打标或者机器打标的方式,可以得到图片+识别的手机号码;当模型识别错误时,得到图片+识别后的错误手机号码+用户操作更正的手机号码。
[0061] 在一些实施例中,上述的识别服务器10和模型训练服务器30可以设置在一起,也可以分别独立设置。当设置在一起时。云端的服务器的一部分用于训练模型,另一部分用来进行OCR识别。
[0062] 在其他实施例中,所述模型训练服务器30可以设置为三个,例如,分别为针对云端服务器11、边缘服务器12、和识别终端20的模型训练服务器30。上述三个模型训练服务器30可以导出针对云端服务器11、边缘服务器12、和识别终端20的不同的识别模型。
[0063] 在本申请可选实施例提出的方案中,识别服务器10可以包含云端服务器和边缘服务器。通过预设规则,识别终端可以将图片发送至云端服务器、边缘服务器的一者或者留在识别终端进行识别,这种方式充分利识别终端无时延,边缘服务器低时延、高计算力,云端服务器极高算力的特点。
[0064] 在一实施例中,所述识别终端20可以整合于条码扫描枪中,或者与所述条码扫描枪分离设置。例如识别终端20是专门用于识别图片的终端,与采集图片的条码扫描枪或者手机分离设置,识别终端20例如可以设置在货架上等。
[0065] 所述识别终端可以包括物联网设备,所述物联网设备通过物联网协议与条码扫描枪等图片获取装置连接。
[0066] 此外,在本申请实施例提出的方案中,云端服务器、边缘服务器、识别终端可以将识别到的图片信息,例如物流面单的数据进行智能沉淀,根据智能沉淀物流面单图片、识别图片信息例如手机号,及采纳手机号的高置信度样本,可以直接在云端的模型训练服务器进行训练、优化物流面单识别的核心组件即推理引擎。训练、优化后的推理引擎会根据云端服务器、边缘服务器和识别终端的不同模型下发到不同的平台,形成闭环的自我学习型物流面单识别框架。从而极降低人工打标成本,促进精益和智能生产。
[0067] 通过调整模型和不断加入新的数据集合,提高了深度学习模型识别能力。例如当模型识别正确时,通过手动打标或者机器打标的方式,可以得到图片+识别的手机号码;当模型识别错误时,得到图片+识别后的错误手机号码+用户操作更正的手机号码,综上,本申请的方案可以源源不断得到识别的正确数据、识别的错误数据加用户更正的数据,使得模型可以根据这些数据进行不断更正,提高了输出的模型的精度。
[0068] 第二实施例
[0069] 图2所示为本申请所示的第二实施例的示意图。在这实施例中,识别服务器10包括云端服务器11和边缘服务器12。
[0070] 与第一实施例相似地,识别终端20包括图像参数提取模块21、判断模块22、发送模块23、和识别模块24。图像参数提取模块21用于从图片中提取图像参数;判断模块22用于利用所述图像参数判断所述图片是否符合预设规则;发送模块23用于当判断出所述图片符合预设规则时,将所述图片发送到识别服务器进行识别;识别模块24用于当判断出所述图片不符合预设规则时,识别所述图片并获得图片信息。
[0071] 本实施例与上一实施例的不同之处在于,在本实施例中,识别服务器10包括云端服务器21和边缘服务器22,二者均能实现云端的计算。云端服务器可以是单独的用于进行OCR识别的服务器,或者是整合了其他功能的服务器。边缘服务器是利用边缘计算原理,布置在中心服务器以外的网络边缘的节点上的服务器。边缘计算是一种优化应用程序或云计算系统的技术,是将数据的处理、应用程序的运行,甚至一些功能服务的实现,由中心服务器下放到网络边缘的节点上,在边缘服务器上实现计算。
[0072] 当识别终端20的判断模块22确定出所要发送图片的目的地之后,便可以在云端服务器11、边缘服务器12和识别终端20之间进行选择。
[0073] 此外,云端服务器11、边缘服务器12和识别终端20的一个或者多个均可以将识别正确或者识别错误的样本数据上传至云端的数据库,并在云端的服务器中训练OCR识别模型。在利用了大量的数据训练云端OCR识别模型之后,可以分别导出三个模型,对应于云端服务器,识别终端和边缘服务器。三者的模型结构可以是相同或者相似的,或者也可以是不同的。或者可以分别导出应用于识别服务器和识别终端的两种模型。
[0074] 云端服务器11、边缘服务器12和识别终端20计算处理的能力可以是不同的。相对的,图片从识别终端20上传至边缘服务器12或者云端服务器11,再经过边缘服务器12或者云端服务器11返回所需要的延时也是不同的。
[0075] 在一些实施例中,预设规则可以为满足如下二者其中之一,则从识别终端转移到云端服务器11或者边缘服务器12进行识别:
[0076] 1、条码的大小:条码占比图片大小阈值,占比较小表明拍摄到的手机号码等也较小,本地识别较为困难,故会上传到云端服务器11或者边缘服务器12去识别;
[0077] 2、图片倾斜角度:图片倾斜角度较大,在端侧旋转过程中图片会被切割导致无法识别,同步需要上传到云端服务器11或者边缘服务器12识别。
[0078] 在另一些实施例中,预设规则例如为预先估算的当前的图片在端服务器11、边缘服务器12、识别终端20进行识别所需要的延时。例如当前图片存在条码占比过小、图片倾斜角度较大、像素较低等问题时,在识别终端20处理的时间将会更长,当判断出预估的识别延时的长度大于对应的延时阈值时,可以从识别终端20发送到云端服务器11或者边缘服务器12进行处理。对识别延时的判断可以通过专门的程序利用图像参数完成,例如,可以利用条码占比、图片倾斜角度、图片像素,进行加权处理,当图片加权处理后的得分大于特定分数时,则可以认为预估的识别延时超出了对应的延时阈值。在此不再赘述。
[0079] 在另一些实施例中,预设规则例如为预先估算的当前的图片在端服务器11、边缘服务器12、识别终端20进行识别的准确率。例如当前图片存在条码占比过小、图片倾斜角度较大、像素较低等问题时,在识别终端20处理的识别准确率会降低,当预设的识别准确率小于预设的准确率阈值时,可以从识别终端20发送到云端服务器11或者边缘服务器12进行处理。对识别准确率的判断可以通过专门的判断程序或者由前述的识别终端20、或者专门的判断服务器利用图像参数完成,例如,可以利用条码占比、图片倾斜角度、图片像素,进行加权处理,当图片加权处理后的得分大于对应的阈值时,认为预估的识别准确率小于对应的准确率阈值。在此不再赘述。
[0080] 在另一些实施例中,预设规则例如为预先估算的当前的图片识别的难易程度值。图片的识别难易程度值是通过所述图像参数确定的。图像参数除了可以包括前述的条码占比、图片倾斜角度以外,例如可以包括:图片的位置信息、图片中的文本信息、图片的像素值至少其中一者。
[0081] 例如,根据过往的数据判断,当图片的位置信息显示图片是采集自某个特定的仓库时判断的出错率大于平均值,则认为来自该仓库的图片是不易于识别的,可以直接发送至云端服务器11或者边缘服务器12进行处理。因此,可以根据图片的位置信息确定图片可能的识别难易程度;或者,根据过往的数据判断,当图片中的文本信息为非常用的其他语言(例如中文、英文以外的语种),或者包含特定内容(例如特殊符号等),则认为包含这些内容的图片是不易于识别的,可以直接发送至云端服务器11或者边缘服务器12进行处理;或者,根据过往的数据判断,当图片中的像素值低于预设的像素值时,则认为包含这些内容的图片是不易于识别的,可以直接发送至云端服务器11或者边缘服务器12进行处理。
[0082] 因此,可以根据图片的位置信息、图片中的文本信息、图片的像素值至少其中一者确定图片可能的识别难易程度;当难易程度值大于对应阈值时,可以从识别终端20发送到云端服务器11或者边缘服务器12进行处理。
[0083] 预设规则可以设置为由前述的条码大小、图片倾斜角度、识别延时、识别准确率的一者或者几者,由以上参数的全部或者部分确定需要发送至云端、边缘或者留在本地的识别终端进行处理的规则。
[0084] 在本申请可选实施例提出的方案中,识别服务器10可以包含云端服务器和边缘服务器。通过预设规则,识别终端可以将图片发送至云端服务器、边缘服务器的一者或者留在识别终端进行识别,这种方式充分利识别终端无时延,边缘服务器低时延、高计算力,云端服务器极高算力的特点。
[0085] 特别地,在物流场景下,边缘服务器12的计算能力逐渐展开,且网络延时较小。预设规则可以充分考虑边缘服务器的计算能力。
[0086] 此外,在本申请实施例提出的方案中,云端服务器、边缘服务器、识别终端可以将识别到的图片信息,例如物流面单的数据进行智能沉淀,根据智能沉淀物流面单图片、识别图片信息例如手机号,及采纳手机号的高置信度样本,可以直接在云端的模型训练服务器进行训练、优化物流面单识别的核心组件即推理引擎。训练、优化后的推理引擎会根据云端服务器、边缘服务器和识别终端的不同模型下发到不同的平台,形成闭环的自我学习型物流面单识别框架。从而极降低人工打标成本,促进精益和智能生产。
[0087] 通过调整模型和不断加入新的数据集合,提高了深度学习模型识别能力。例如当模型识别正确时,通过手动打标或者机器打标的方式,可以得到图片+识别的手机号码;当模型识别错误时,得到图片+识别后的错误手机号码+用户操作更正的手机号码,综上,本申请的方案可以源源不断得到识别的正确数据、识别的错误数据加用户更正的数据,使得模型可以根据这些数据进行不断更正,提高了输出的模型的精度。
[0088] 第三实施例
[0089] 本申请第三实施例提出一种OCR识别方法。图3所示为本申请第三实施例的OCR识别方法的步骤流程图。如图3所示,本申请实施例的OCR识别方法用于选择地在识别终端或识别服务器中对图片进行识别,具体包括如下步骤:
[0090] S101,从图片中提取图像参数;
[0091] 在步骤S101中,识别终端20,例如手机、PDA、平板电脑、靶枪等装置采集图片,并对图片进行处理,获得图像参数。
[0092] 此处的图片可以是物流场景下的包裹的面单等。包裹的面单上记载的信息可以包括收件人姓名、物流单号、订单号、收件人地址、收件人电话等一者或者多者。
[0093] 识别终端20可以从图片中提取图像参数。识别终端20拍摄后的图片例如为一个数据集,该数据集中包含每一个像素点的RGB像素值。图像参数提取模块可以从中识别获取图片中的条码信息、倾斜角度等信息、
[0094] 识别终端20识别图片的条码区域,例如可以是通过像素来判断。条码区域与其他区域相比,其为黑‑白‑黑‑白等有序排列的颜色。据此图像参数提取模块可以获得图片的条码区域的位置、条码所代表的数字等信息。条码代表的数字确定后,可以根据预设的规则,确定数字代表的内容,例如订单号、物流单号等。前述的条码信息可以包括:1、条码的大小:条码占比图片大小阈值。
[0095] 在一些实施例中,条码占比较小表明拍摄到的手机号码等也较小,本地识别较为困难,故可以上传到云端服务器或者边缘服务器去识别。
[0096] 识别终端20识别图片的倾斜角度,例如可以是通过获取图片拍摄的基准线与图片边缘的夹角大小,确定图片相对于水平坐标轴和数值坐标轴的夹角。
[0097] 此外,图片的倾斜角度也可以包括图片相对于三个坐标轴,即x、y、z的倾斜角度,或者相对于xy平面、yz平面、xz平面各自的倾斜角度等。
[0098] 图片倾斜角度可以包含三个数值,分别是相对于三个轴或者三个平面图片倾斜角度较大,在端侧旋转过程中图片会被切割导致无法识别,同步需要上传到云端识别。
[0099] S102,利用所述图像参数判断所述图片是否符合预设规则;
[0100] 在这一步骤中,识别终端20根据预设规则,根据图像参数判断图片是否符合预设规则,当符合预设规则时,将图片发送至识别服务器进行识别;当不符合预设规则时,识别图片并获得图片信息。
[0101] 通常来说,可以在云端设置识别能力较强的机器学习模型。而在识别终端,出于硬件的运行速度、容量等原因,终端的计算处理能力,弱于云端。边缘服务器作为中心节点周边的计算节点,承担云端的一部分计算处理工作。
[0102] 在一些实施例中,预设规则可以为满足如下二者其中之一,则从识别终端转移到云端服务器11或者边缘服务器12进行识别:
[0103] 1、条码的大小:条码占比图片大小阈值,占比较小表明拍摄到的手机号码等也较小,本地识别较为困难,故会上传到云端服务器11或者边缘服务器12去识别;
[0104] 2、图片倾斜角度:图片倾斜角度较大,在端侧旋转过程中图片会被切割导致无法识别,同步需要上传到云端服务器11或者边缘服务器12识别。
[0105] 在另一些实施例中,预设规则例如为预先估算的当前的图片在端服务器11、边缘服务器12、识别终端20进行识别所需要的时间。例如当前图片的条码占比过小、图片倾斜角度较大时,在识别终端20处理的时间将会更长,当所需要的时间的长度大于指定的时长时,可以从识别终端20发送到云端服务器11或者边缘服务器12进行处理。
[0106] 在另一些实施例中,预设规则例如为预先估算的当前的图片在端服务器11、边缘服务器12、识别终端20进行识别的准确率。例如当前图片的条码占比过小、图片倾斜角度较大时,在识别终端20处理的识别准确率会降低,当成功率小于预设的标准值时,可以从识别终端20发送到云端服务器11或者边缘服务器12进行处理。
[0107] S103,当判断出所述图片符合预设规则时,将所述图片发送到识别服务器进行识别;
[0108] 预设规则可以设置为由前述的条码大小、图片倾斜角度、识别延时、识别准确率的一者或者几者,由以上参数的全部或者部分确定需要发送至云端、边缘或者留在本地的识别终端进行处理的规则。
[0109] 当判断出所述图片符合预设规则时,将所述图片发送到识别服务器进行识别。
[0110] S104,当判断出所述图片不符合预设规则时,识别所述图片并获得图片信息。
[0111] 在这一步骤中,当并没有满足预设规则时,可以认为识别装置20能够识别该图片,因此可以留在本地端进行识别。
[0112] 由上述可知,本申请第一实施例提出的OCR识别方法至少具有如下技术效果:
[0113] 在本申请实施例提出的方案中,利用预设规则将图片发送至识别服务器或者留在本地的识别终端进行识别,减少了图片识别的延时,保证了识别的效率和准确度。
[0114] 在本申请的可选实施例中,所述步骤S104,即当判断出所述图片不符合预设规则时,识别所述图片并获得图片信息的步骤之后还可以包括:
[0115] 将识别出的图片信息上传至机器学习模型训练服务器;
[0116] 所述机器学习模型训练服务器用于训练机器学习模型,并输出训练完成的第一机器学习模型至所述识别服务器,以及输出训练完成的第二机器学习模型至所述识别终端。
[0117] 在本申请的可选实施例中,所述步骤S104,即当判断出所述图片不符合预设规则时,识别所述图片并获得图片信息的步骤之后还可以包括:
[0118] 利用历史数据分别训练第一机器学习模型、第二机器学习模型和第三机器学习模型;
[0119] 将训练完成的第一机器学习模型、第二机器学习模型和第三机器学习模型对应地发送到云端服务器、边缘服务器和识别终端。
[0120] 在本申请可选实施例提出的方案中,云端服务器、边缘服务器、识别终端可以将识别到的图片信息,例如物流面单的数据进行智能沉淀,根据智能沉淀物流面单图片、识别图片信息例如手机号,及采纳手机号的高置信度样本,可以直接在云端的模型训练服务器进行训练、优化物流面单识别的核心组件即推理引擎。训练、优化后的推理引擎会根据云端服务器、边缘服务器和识别终端的不同模型下发到不同的平台,形成闭环的自我学习型物流面单识别框架。从而极降低人工打标成本,促进精益和智能生产。
[0121] 在本申请的可选实施例中,所述图像参数包括:所述图片信息中的条码尺寸和图片倾斜角度。所述预设规则可以包括:所述条码尺寸与所述图片尺寸的占比小于第一阈值,或者所述图片的倾斜角度大于第二阈值。其中第一阈值和第二阈值可以为开发人员设定的阈值。
[0122] 在本申请的可选实施例中,所述步骤S102,即利用所述图像参数判断所述图片是否符合预设规则的步骤可以包括:
[0123] 确定所述图片的条码尺寸与所述图片尺寸的比值;
[0124] 确定所述图片的至少一个倾斜角度;
[0125] 当所述条码尺寸与所述图片尺寸的占比小于第一阈值,或者所述图片的倾斜角度大于第二阈值,将所述图片信息发送至所述识别服务器进行识别;
[0126] 当所述条码尺寸与所述图片尺寸的占比不小于第一阈值,且所述图片的倾斜角度大于第二阈值时,在所述识别终端对所述图片信息进行识别。
[0127] 上述的第一阈值和第二阈值均可以由开发人员指定,以满足使用要求为准,在此不再赘述。
[0128] 在本申请可选实施例提出的方案中,利用预设的规则,对所需要识别的图片进行分配,提高了识别的效率和准确性。
[0129] 在本申请的可选实施例中,所述图片为物流面单,所述物流面单包括条码区域和文字信息区域。
[0130] 在本申请的可选实施例中,所述步骤S103,即当判断出所述图片符合预设规则时,将所述图片发送到识别服务器进行识别的步骤之后,所述方法还可以包括:
[0131] 判断是否存在边缘服务器;
[0132] 当确定存在边缘服务器时,将所述图片发送至所述边缘服务器进行识别。
[0133] 当确定不存在边缘服务器时,将所述图片发送至所述云端服务器进行识别。
[0134] 在本申请可选实施例提出的方案中,识别服务器可以包括云端服务器和边缘服务器,通过判断是否部署了边缘服务器,识别终端可以判断是否可以通过边缘计算的方式对图片进行处理。即,当识别终端认为应当将图片发送至识别服务器进行处理时,可以先判断是否部署了边缘服务器。当判断出除了云端服务器以外还存在更有选的边缘服务器后,可以根据特定的规则,将图片就近发送至边缘服务器进行处理,减小了云端服务器的计算压力,实时或更快的进行数据处理和分析,让数据处理更靠近源,而不是外部数据中心或者云,可以缩短延迟时间。将图片发送至云端服务器、边缘服务器的一者或者留在识别终端进行识别,在一些实施例中,如果存在边缘服务器,则优先发送至边缘服务器进行处理。这种方式充分利识别终端无时延,边缘服务器低时延、高计算力,云端服务器极高算力的特点。
[0135] 在本申请的可选实施例中,所述图片信息包括:姓名、电话、地址信息。在步骤S101即从图片中提取图像参数的步骤之前,所述方法还可以包括:
[0136] S100,采集所述图片。
[0137] 在这一步骤中,识别终端例如手机、平板电脑、PDA、靶枪等,可以对识别对象进行拍照,并将拍摄的图片存储至自身的存储空间中,或者之间进行提取图片参数的处理。此外,作为其他可选的实施例,识别终端还可以不具有拍照等的能力,而是接收从其他装置发送来的图片。
[0138] 综上所述,本申请提出的方案至少具有如下优点:
[0139] 在本申请可选实施例提出的方案中,识别服务器可以包含云端服务器和边缘服务器。通过预设规则,识别终端可以将图片发送至云端服务器、边缘服务器的一者或者留在识别终端进行识别,这种方式充分利识别终端无时延,边缘服务器低时延、高计算力,云端服务器极高算力的特点。
[0140] 除此之外,在本申请可选实施例提出的方案中,识别服务器可以包括云端服务器和边缘服务器,通过预设规则,识别终端可以将图片发送至云端服务器、边缘服务器的一者或者留在识别终端进行识别,这种方式充分利识别终端无时延,边缘服务器低时延、高计算力,云端服务器极高算力的特点。
[0141] 此外,在本申请可选实施例提出的方案中,云端服务器、边缘服务器、识别终端可以将识别到的图片信息,例如物流面单的数据进行智能沉淀,根据智能沉淀物流面单图片、识别图片信息例如手机号,及采纳手机号的高置信度样本,可以直接在云端的模型训练服务器进行训练、优化物流面单识别的核心组件即推理引擎。训练、优化后的推理引擎会根据云端服务器、边缘服务器和识别终端的不同模型下发到不同的平台,形成闭环的自我学习型物流面单识别框架。从而极降低人工打标成本,促进精益和智能生产。
[0142] 通过调整模型和不断加入新的数据集合,提高了深度学习模型识别能力。例如当模型识别正确时,通过手动打标或者机器打标的方式,可以得到图片+识别的手机号码;当模型识别错误时,得到图片+识别后的错误手机号码+用户操作更正的手机号码,综上,本申请的方案可以源源不断得到识别的正确数据、识别的错误数据加用户更正的数据,使得模型可以根据这些数据进行不断更正,提高了输出的模型的精度。
[0143] 第四实施例
[0144] 本申请第四实施例提出一种OCR识别方法。图4所示为本申请第四实施例的OCR识别方法的步骤流程图。本发明第四实施例提出的方案是应用于识别终端对应的识别服务器,如图4所示,本申请实施例的OCR识别方法用于在识别服务器对图片进行识别,具体包括如下步骤:
[0145] S201,接收识别终端发送的符合预设规则的图片;
[0146] S202,利用机器学习模型对所述图片进行识别,获得图片信息;
[0147] 其中,所述图片对应的图像参数符合预设规则,所述预设规则用于确定所述图片是否发送至识别服务器。
[0148] 在可选实施例中,所述图片信息包括:姓名、电话、地址信息、条码号其中至少一者。
[0149] 在可选实施例中,如图4所示,所述方法还可以包括:
[0150] S203,将识别出的图片信息上传至机器学习模型训练服务器;
[0151] 其中,所述机器学习模型训练服务器用于训练机器学习模型,并输出训练完成的第一机器学习模型至所述识别服务器,以及输出训练完成的第二机器学习模型至所述识别终端。
[0152] 在本申请可选实施例提出的方案中,识别服务器可以包含云端服务器和边缘服务器。通过预设规则,识别终端可以将图片发送至云端服务器、边缘服务器的一者或者留在识别终端进行识别,这种方式充分利识别终端无时延,边缘服务器低时延、高计算力,云端服务器极高算力的特点。
[0153] 在本申请可选实施例提出的方案中,云端服务器、边缘服务器、识别终端可以将识别到的图片信息,例如物流面单的数据进行智能沉淀,根据智能沉淀物流面单图片、识别图片信息例如手机号,及采纳手机号的高置信度样本,可以直接在云端的模型训练服务器进行训练、优化物流面单识别的核心组件即推理引擎。训练、优化后的推理引擎会根据云端服务器、边缘服务器和识别终端的不同模型下发到不同的平台,形成闭环的自我学习型物流面单识别框架。从而极降低人工打标成本,促进精益和智能生产。
[0154] 第五实施例
[0155] 本发明第五实施例提出一种OCR识别装置,参考图1所示,本申请OCR识别装置可以包括图像参数提取模块21、判断模块22、发送模块23和识别模块24。
[0156] 图像参数提取模块21用于从图片中提取图像参数;
[0157] 判断模块22用于利用所述图像参数判断所述图片是否符合预设规则;
[0158] 发送模块23用于当判断出所述图片符合预设规则时,将所述图片发送到识别服务器进行识别;
[0159] 识别模块24用于当判断出所述图片不符合预设规则时,识别所述图片并获得图片信息。
[0160] 在可选实施例中所述OCR识别装置还包括:图片采集模块,用于采集图片。
[0161] 由于装置实施例是与方法实施例对应的虚拟装置实施例,在此并不具体介绍。相关内容可以参考方法实施例的描述即可。
[0162] 图5为本申请一实施例提供的终端设备的硬件结构示意图。如图5所示,该终端设备可以包括输入设备90、处理器91、输出设备92、存储器93和至少一个通信总线94。通信总线94用于实现元件之间的通信连接。存储器93可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,存储器93中可以存储各种程序,用于完成各种处理功能以及实现本实施例的方法步骤。
[0163] 可选的,上述处理器91例如可以为中央处理器(Central Processing Unit,简称CPU)、应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,该处理器91通过有线或无线连接耦合到上述输入设备90和输出设备92。
[0164] 可选的,上述输入设备90可以包括多种输入设备,例如可以包括面向用户的用户接口、面向设备的设备接口、软件的可编程接口、摄像头、传感器中至少一种。可选的,该面向设备的设备接口可以是用于设备与设备之间进行数据传输的有线接口、还可以是用于设备与设备之间进行数据传输的硬件插入接口(例如USB接口、串口等);可选的,该面向用户的用户接口例如可以是面向用户的控制按键、用于接收语音输入的语音输入设备以及用户接收用户触摸输入的触摸感知设备(例如具有触摸感应功能的触摸屏、触控板等);可选的,上述软件的可编程接口例如可以是供用户编辑或者修改程序的入口,例如芯片的输入引脚接口或者输入接口等;可选的,上述收发信机可以是具有通信功能的射频收发芯片、基带处理芯片以及收发天线等。麦克风等音频输入设备可以接收语音数据。输出设备92可以包括显示器、音响等输出设备。
[0165] 在本实施例中,该终端设备的处理器包括用于执行各设备中数据处理装置各模块的功能,具体功能和技术效果参照上述实施例即可,此处不再赘述。
[0166] 图6为本申请另一实施例提供的终端设备的硬件结构示意图。图6是对图5在实现过程中的一个具体的实施例。如图6所示,本实施例的终端设备包括处理器101以及存储器102。
[0167] 处理器101执行存储器102所存放的计算机程序代码,实现上述实施例中图3至图4的OCR识别方法。
[0168] 存储器102被配置为存储各种类型的数据以支持在终端设备的操作。这些数据的示例包括用于在终端设备上操作的任何应用程序或方法的指令,例如消息,图片,视频等。存储器102可能包含随机存取存储器(random access memory,简称RAM),也可能还包括非易失性存储器(non‑volatile memory),例如至少一个磁盘存储器。
[0169] 可选地,处理器101设置在处理组件100中。该终端设备还可以包括:通信组件103,电源组件104,多媒体组件105,音频组件106,输入/输出接口107和/或传感器组件108。终端设备具体所包含的组件等依据实际需求设定,本实施例对此不作限定。
[0170] 处理组件100通常控制终端设备的整体操作。处理组件100可以包括一个或多个处理器101来执行指令,以完成上述图3至图4方法的全部或部分步骤。此外,处理组件100可以包括一个或多个模块,便于处理组件100和其他组件之间的交互。例如,处理组件100可以包括多媒体模块,以方便多媒体组件105和处理组件100之间的交互。
[0171] 电源组件104为终端设备的各种组件提供电力。电源组件104可以包括电源管理系统,一个或多个电源,及其他与为终端设备生成、管理和分配电力相关联的组件。
[0172] 多媒体组件105包括在终端设备和用户之间的提供一个输出接口的显示屏。在一些实施例中,显示屏可以包括液晶显示器(LCD)和触摸面板(TP)。如果显示屏包括触摸面板,显示屏可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
[0173] 音频组件106被配置为输出和/或输入音频信号。例如,音频组件106包括一个麦克风(MIC),当终端设备处于操作模式,如语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器102或经由通信组件103发送。在一些实施例中,音频组件106还包括一个扬声器,用于输出音频信号。
[0174] 输入/输出接口107为处理组件100和外围接口模块之间提供接口,上述外围接口模块可以是点击轮,按钮等。这些按钮可包括但不限于:音量按钮、启动按钮和锁定按钮。
[0175] 传感器组件108包括一个或多个传感器,用于为终端设备提供各个方面的状态评估。例如,传感器组件108可以检测到终端设备的打开/关闭状态,组件的相对定位,用户与终端设备接触的存在或不存在。传感器组件108可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在,包括检测用户与终端设备间的距离。在一些实施例中,该传感器组件108还可以包括摄像头等。
[0176] 通信组件103被配置为便于终端设备和其他设备之间有线或无线方式的通信。终端设备可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个实施例中,该终端设备中可以包括SIM卡插槽,该SIM卡插槽用于插入SIM卡,使得终端设备可以登录GPRS网络,通过互联网与识别服务器建立通信。
[0177] 由上可知,在图6实施例中所涉及的通信组件103、音频组件106以及输入/输出接口107、传感器组件108均可以作为图5实施例中的输入设备的实现方式。
[0178] 本申请实施例提供了一种终端设备,包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述终端设备执行如本申请实施例中一个或多个所述的视频摘要的生成方法。
[0179] 本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0180] 尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
[0181] 最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
[0182] 以上对本申请所提供的一种OCR识别方法、识别装置和识别系统,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页 第1页 第2页 第3页