首页 / 体检报告解读方法及系统

体检报告解读方法及系统实质审查 发明

技术领域

[0001] 本发明涉及医学数据识别领域,具体地,涉及一种体检报告解读方法及系统。

相关背景技术

[0002] OCR(optical character recognit ion)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
[0003] 目前的体检报告解读,由于各体检报告模版不一致,技术提供方往往专注于文字内容的本身识别,缺少对医学的指标知识库的利用,导致识别不出来,或识别出错误的内容,整体的使用体验较差。

具体实施方式

[0051] 下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
[0052] 如图1所示,根据本发明提供的一种体检报告解读方法,包括:
[0053] 步骤1:提取体检报告图片。
[0054] 步骤2:识别体检报告指标。具体的,步骤2包括:
[0055] 步骤2.1:利用OCR技术,识别报告中的文字。在本发明中,使用的百度ocr接口。
[0056] 步骤2.2:利用文本匹配技术,基于自建指标库,识别文字中的指标项、指标值。通过指标库的名称和别名以及英文名去文本中精准匹配指标名称。
[0057] 步骤2.3:基于指标项的取值类型,常用单位,定位并识别文本中,指标项的值。不同的体检报告,取值的位置往往不一样,而由于OCR算法识别的精准度限制,同一份体检报告中,虽然检查项的值位置是固定,但是识别出的取值的位置也可能不固定,因此需进行算法处理。
[0058] OCR识别例子:[血红蛋白,Hb,161.0,130‑175,g/儿,本院,红细胞压积,HCT,0.47,0.40‑0.50,L/L,本院,平均红细胞体积,MCV,88.0,82‑100,fL,本院,平均红细胞血红蛋白含量,MCH,29.9,27‑34,pg,本院,平均红细胞血红蛋白浓度,MCHC,341,316‑354,g/L,本院,红细胞分布宽度‑变异系数,RDW‑CV,12.9,11‑16,%,本院,血小板计数,PLT,224,125‑350,
10^9/L,本院,平均血小板体积,MPV,10.9,9‑16,fL,本院,血小板分布宽度,PDW,8.00‑
20.00,16.5,fL,本院,淋巴细胞百分比,LYMPH%,37.4,20‑50,本院,]。
[0059] 算法流程:
[0060] a.首先找出检查项,检查项的值在字符串中的位置(以逗号分隔),检查项位置固定为第一个位置,通过遍历整个字符串,得到每个识别到的检查项的值的位置的集合:【2,2,2,2,2,2,2,2,3,2】。在本例中则取出现次数最多的2确定为此份报告中检查项值的位置;
[0061] b.根据库中的单位和识别到的单位,对提取出来的指标值进行换算;
[0062] c.如果识别到阴性,阳性等字符串为指标的值,则做映射。
[0063] 步骤2.4:将指标项与指标值进行组装,形成键值对,使用python字典的形式存储。
[0064] 步骤2.2包括以下步骤:
[0065] 步骤2.2.1:精准匹配库中指标项。
[0066] 步骤2.2.2:若精准未匹配,利用同义词进行匹配,在找检查项的名称的时候,也检索同义词库。
[0067] 步骤3:匹配指标值。具体的,步骤3包括:
[0068] 步骤3.1:根据指标项,从自建指标库中提取正常值范围。
[0069] 步骤3.2:对比识别的指标值与所提取的正常值范围。
[0070] 步骤3.3:判断当前指标的状态,分为正常、异常(可进一步分为偏高、偏低)。
[0071] 步骤4:匹配解读内容和建议。具体的,步骤4包括:
[0072] 步骤4.1:根据指标项名称,读取指标的通用解释。
[0073] 步骤4.2:根据指标项的状态,读取对应状态的临床意义,以及应对的建议。
[0074] 步骤5:生产解读报。具体的,步骤5包括:
[0075] 步骤5.1:根据指标值的状态,将识别的指标项区分为正常与异常两类。
[0076] 步骤5.2:针对异常的指标项,标记其状态。
[0077] 步骤5.3:针对异常的指标项,列出其状态对应的临床意义、临床建议。
[0078] 本发明还提供一种体检报告解读系统,所述体检报告解读系统可以通过执行所述体检报告解读方法的流程步骤予以实现,即本领域技术人员可以将所述体检报告解读方法理解为所述体检报告解读系统的优选实施方式。
[0079] 本发明提供的一种体检报告解读系统,包括:
[0080] 报告获取模块:获取体检报告图像。
[0081] 指标识别模块:识别体检报告图像中的指标,所述指标包括指标项和指标值。
[0082] 指标匹配模块:根据识别到的指标项,判断对应的指标值的状态。
[0083] 解读建议模块:根据指标项以及指标值的状态,获取相应的解读内容和建议内容。
[0084] 报告生成模块:对于指标值的状态异常的指标项,列出对应的状态、解读内容和建议内容。
[0085] 本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置、模块、单元以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以,本发明提供的系统及其各项装置、模块、单元可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构;也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
[0086] 以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

当前第1页 第1页 第2页 第3页
相关技术
报告解读相关技术
方法系统相关技术
姚娟娟发明人的其他相关专利技术