CN112116968A - 一种医学检验报告的识别方法、装置、设备及存储介质 - Google Patents

一种医学检验报告的识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112116968A
CN112116968A CN201910543484.7A CN201910543484A CN112116968A CN 112116968 A CN112116968 A CN 112116968A CN 201910543484 A CN201910543484 A CN 201910543484A CN 112116968 A CN112116968 A CN 112116968A
Authority
CN
China
Prior art keywords
medical examination
report
medical
detection data
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910543484.7A
Other languages
English (en)
Inventor
赵维莅
王黎
王硕
曲春光
李维娅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ruinjin Hospital Affiliated to Shanghai Jiaotong University School of Medicine Co Ltd
Original Assignee
Ruinjin Hospital Affiliated to Shanghai Jiaotong University School of Medicine Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ruinjin Hospital Affiliated to Shanghai Jiaotong University School of Medicine Co Ltd filed Critical Ruinjin Hospital Affiliated to Shanghai Jiaotong University School of Medicine Co Ltd
Priority to CN201910543484.7A priority Critical patent/CN112116968A/zh
Publication of CN112116968A publication Critical patent/CN112116968A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种医学检验报告的识别方法,先接收上传的医学检验报告图片,再调用光学图像识别软件提取医学检验报告图片中的检测数据,最后按预设规则将检测数据转换为电子报告,整个过程无需人工介入,即可将对患者随访过程中产生的医学检验报告进行数据化存储。用光学图像识别的方式提取医学检验报告图片中的检测数据,对于不同格式的医学检验报告图片均通用,根据需求设置预设规则,即可将收集到的检测数据以标准化的电子报告的形式进行存储。因此本发明提供的方案既具有通用性,又极大减少了人工介入,提高了医学检验数据收集的效率和准确性,节省了人力。本发明还公开了一种医学检验报告的识别装置、设备及存储介质,具有上述有益效果。

Description

一种医学检验报告的识别方法、装置、设备及存储介质
技术领域
本发明涉及LIS系统技术领域,特别是涉及一种医学检验报告的识别方法、装置、设备及存储介质。
背景技术
医学检验是一种用临床标本进行实验室检测,以获得有关健康的信息,从而帮助诊断、治疗和预防疾病的方式。患者在医院的医学检验数据由LIS系统(LaboratoryInformation System,实验室信息系统)进行存储和管理。LIS系统具有自动接收检验数据、保存检验信息、实时查询检验结果、检验报告无纸化传输和检验报告打印等功能,既可以直接打印纸质报告交付患者,也可以通过开放端口将检验结果传输至HIS系统(HistoryInformation System,病史信息系统)并由主治医师将结果导入患者病史。
收集并存储医学检验数据是LIS系统功能中重要的一环。针对LIS系统的特点,目前有以下两种技术方案收集并存储检验数据:
纸质报告照片存储:医生或专职随访人员会对出院后的患者进行随访,随访方式包括电话随访和APP随访。电话随访仅能口头得知患者外院的检验结果,数据可靠度和准确度差。APP随访一般采用社交APP,也有采用专为患者随访场景开发的APP。APP随访可以实现图片传输与存储功能,患者将纸质的医学检验报告拍照上传,通过APP发送给随访医生,随访医生查看医学检验报告图片并存储至APP内或手机相册中,此后,医生需人工读取图片,并将检验数据手动录入到疾病登记数据库中。
人工智能辅助病史提取:通过“人工标注+机器学习”的技术方式,对患者住院治疗过程中产生的病史文书进行自然语言处理(Natural Language Processing,NLP),从而提取医学检验数据,具体实施方式包括:按照统一的数据标注规则,对病史语料进行人工标注;用经过标注的数据集训练机器学习模型;将训练好的机器学习模型对待识别的医学检验报告或病例文书进行NLP处理,获得医学检验数据并存储。
上述现有技术中,纸质报告照片存储的方式虽然具有较高的通用性,但是极度依赖人工操作,不仅人力耗费巨大,还容易在人工录入检测数据的过程中产生错误,数据可靠性低;人工智能辅助病史提取的方式虽然减少了人工接入,但是由于不同医疗机构的医学检测报告的格式不同,训练出的机器学习模型适用范围较窄,针对各家医疗机构都需要重新训练模型,不利于推广。
提出一种既具有通用性又能够减少人工介入的医学检验数据的收集方法,是本领域技术人员需要解决的技术问题。
发明内容
本发明的目的是提供一种医学检验报告的识别方法、装置、设备及存储介质,既具有通用性又能够减少人工介入,提高了医学检验数据收集的效率和准确性,节省了人力。
为解决上述技术问题,本发明提供一种医学检验报告的识别方法,包括:
接收上传的医学检验报告图片;
调用光学图像识别软件提取所述医学检验报告图片中的检测数据;
按预设规则将所述检测数据转换为电子报告。
可选的,在所述调用光学图像识别软件提取所述医学检验报告图片中的检测数据之前,还包括:
对所述医学检验报告图片进行预处理;
相应的,所述调用光学图像识别软件提取所述医学检验报告图片中的检测数据,具体为:
调用所述光学图像识别软件提取预处理后的医学检验报告图片中的检测数据。
可选的,所述对所述医学检验报告图片进行预处理,具体包括:
基于预设的对正基准对所述医学检验报告图片进行对正处理;
将对正处理后的医学检验报告图片进行色度空间分离处理;
对色度空间分离处理的医学检验报告图片进行降噪处理,得到所述预处理后的医学检验报告图片。
可选的,所述调用光学图像识别软件提取所述医学检验报告图片中的检测数据,具体包括:
对所述医学检验报告图片中的数据项进行识别拆分,得到拆分后的数据项;
查询预设表单的元数据映射表,获得数据表的位置信息;
根据所述数据表的位置信息对所述拆分后的数据项进行结构化处理,得到所述检测数据。
可选的,在按预设规则将所述检测数据转换为电子报告之前,还包括:
调用所述光学图像识别软件对所述检测数据进行纠错处理;
相应的,所述按预设规则将所述检测数据转换为电子报告,具体为:
按所述预设规则将纠错处理后的检测数据转换为所述电子报告。
可选的,还包括:
将所述医学检验报告图片中无法识别的数据项写入错误日志。
可选的,所述电子报告中的项目具体包括:
患者身份信息、检验日期、检验机构、检验指标、检验结果、检验指标单位和检验指标的预设范围。
为解决上述技术问题,本发明还提供一种医学检验报告的识别装置,包括:
接收单元,用于接收上传的医学检验报告图片;
提取单元,用于调用光学图像识别软件提取所述医学检验报告图片中的检测数据;
转换单元,用于按预设规则将所述检测数据转换为电子报告。
为解决上述技术问题,本发明还提供一种医学检验报告的识别设备,包括:
存储器,用于存储指令,所述指令包括上述任意一项所述医学检验报告的识别方法的步骤;
处理器,用于执行所述指令。
为解决上述技术问题,本发明还提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项所述医学检验报告的识别方法的步骤。
本发明所提供的医学检验报告的识别方法,先接收上传的医学检验报告图片,再调用光学图像识别软件提取医学检验报告图片中的检测数据,最后按预设规则将检测数据转换为电子报告,整个过程无需人工介入,即可将对患者随访过程中产生的医学检验报告进行数据化存储。用光学图像识别的方式提取医学检验报告图片中的检测数据,对于不同格式的医学检验报告图片均通用,根据需求设置预设规则,即可将收集到的检测数据以标准化的电子报告的形式进行存储。因此本发明提供的方案既具有通用性,又极大减少了人工介入,提高了医学检验数据收集的效率和准确性,节省了人力。本发明还提供一种医学检验报告的识别装置、设备及存储介质,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种医学检验报告的识别方法的流程图;
图2为本发明实施例提供的一种图1中步骤S102的具体实施方式的流程图;
图3为本发明实施例提供的一种医学检验报告的识别装置的结构示意图;
图4为本发明实施例提供的一种医学检验报告的识别设备的结构示意图。
具体实施方式
本发明的核心是提供一种医学检验报告的识别方法、装置、设备及存储介质,既具有通用性又能够减少人工介入,提高了医学检验数据收集的效率和准确性,节省了人力。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种医学检验报告的识别方法的流程图;图2为本发明实施例提供的一种图1中步骤S102的具体实施方式的流程图。
如图1所示,本发明实施例提供的医学检验报告的识别方法包括:
S101:接收上传的医学检验报告图片。
上述背景技术中已经提到,医学检验报告图片为患者出院后,随访医生对患者进行随访时,由患者提供的纸质医学检验报告的图片,医学检验报告中包括患者的身份信息、检验时间、检验项目和检验结果等。
S102:调用光学图像识别软件提取医学检验报告图片中的检测数据。
光学图像识别(Optical character recognition,OCR)主要为对光学字符的识别,是将键入、手写或打印的文本的图像转换为计算机能够识别和存储的文本数据的一种技术。
预先设计光学图像识别软件架构,具体可以包括两层结构,上层为抽象层,用于对医学单据报告的初步识别、查询单据字段到标准结构映射数据库并提供给下层识别程序、查询datatable数据库获取已注册单据字段以及与整个系统进行交互操作;下层为数据识别层。通过两层软件结构的设计,将与特定医疗单据识别领域相关的处理逻辑与标准光学图像识别系统进行分离,实现良好的结构化同时便于问题的查找。
光学图像识别软件在调用底层识别模块进行具体识别后,得到非结构化的数据流文本,通过数据流结构化模块将数据流格式转化为结构化文本,便于入库及查询工作。因此,如图2所示,步骤S102具体可以包括:
S201:对医学检验报告图片中的数据项进行识别拆分,得到拆分后的数据项。
对数据项进行识别拆分,获得数据的顺序化文本如下(本发明实施例中列举的只有一列,数据可能存在任意列数,以一个或多个空格或制表符分隔):
“4.30
186
13
20
74
13
1[空格]6.6
3.7
71
39
[空行]
1.22
12.2”
需要说明的是,在上述顺序化文本中,由于模拟识别错误,“16.6”识别成了“16.6”两个数据,“39”和“1.22”之间多识别了一个空行。这些识别错误可能会产生严重后果,因此在按预设规则将检测数据转换为电子报告之前,还包括:
调用光学图像识别软件对检测数据进行纠错处理;
相应的,步骤S103具体为:
按预设规则将纠错处理后的检测数据转换为电子报告。
由于光学图像识别软件存在一定的识别错误率,通过容错算法,可以重点消除如下错误:
1、单位识别错误,该类错误尤其发生在将希腊字母识别为应为英文字母或数字的问题上,比如β/B,γ/r,b/6等;
2、识别出多余的空格造成数据错误切断,如“47.5”识别成“4[空格]7.5”两个值;
3、识别出多余的空行。
对于单位识别错误,可以通过建立纠错查找表来进行初步纠错操作。由于医学单位相对固定,根据纠错查找表进行纠错,再通过上下文进行确认即可发现单位识别错误。未通过上下文确认的纠错操作将被取消,并作为错误日志输出。
纠错查找表的格式可以如下所示:
β/B β2-MG
γ/r γ-GT
b/6 HbsAg HbsAb
表1纠错查找表
其中,第一列表示纠错信息,后面各列表示所处的语境。只有在正确语境下,并且正确匹配所在项目的时候,自动纠错才会发生,从而最大限度地保证了数据的准确性。
对于识别出多余的空格造成数据错误切断的问题,通过数据项的数目和取值就行就行辨别。元数据映射表保存着特定单据特定位置的数据项应当有几项,保存着每项的取值范围和单位等信息。当发现识别到的数据项数目与元数据映射表不一致的情况时,对数据行进行左到右,右到左的双向匹配扫描,检查每一项的位置和取值范围。只有位置和取值范围全部满足的数据项才可以被自动纠错,从而最大限度地保证了数据的准确性。无法确定的数据项,会被写入错误日志,等待人工处理。
对于识别出多余的空行的问题,在目前适配的光学图像识别平台前端都有发生。通过对元数据映射表的扫描,忽略无效的空行即可。
可以理解的是,在调用光学图像识别软件提取医学检验报告图片中的检测数据时,会出现无法识别的数据项,在调用光学图像识别软件对检测数据进行纠错处理时,也会出现无法识别的错误数据项,因此,医学检验报告的识别方法还可以包括:
将医学检验报告图片中无法识别的数据项写入错误日志。
S202:查询预设表单的元数据映射表,获得数据表的位置信息。
调用光学图像识别软件对检测数据进行纠错处理后,将步骤S201中的顺序化文本转换为:
“4.30
186
13
20
74
13
16.6
3.7
71
39
1.22
12.2”
而文本数据的位置信息,依赖不同的表单结构,保存于元数据映射表中,如下所示:
Figure BDA0002103286370000081
仅识别元数据映射表中被标明的项目,即视未标明项目为无效项,做跳过处理。
S203:根据数据表的位置信息对拆分后的数据项进行结构化处理,得到检测数据。
在上一步的特定表单的元数据映射表中,数据的分层结构是平铺的,层级关系通过圆点进行区隔。而经过结构化处理的数据,通过树形结构进行组织。如下是包含一个患者的部分结构化数据:
Figure BDA0002103286370000082
Figure BDA0002103286370000091
Figure BDA0002103286370000101
Figure BDA0002103286370000111
利用python作为动态语言的迭代生成算法,对未知数据实现了平铺项目的结构化。python-like伪代码如下:
Figure BDA0002103286370000112
Figure BDA0002103286370000121
对应标识的数据会被插入到相应的数据项目下,完成本次数据的结构化工作。重复录入相同的单据,由于共同的时间戳,不会产生任何影响。同一患者不同次的单据,会通过时间戳识别为独立的数据子项。
S103:按预设规则将检测数据转换为电子报告。
在具体实施中,电子报告中的项目具体可以包括:
患者身份信息、检验日期、检验机构、检验指标、检验结果、检验指标单位和检验指标的预设范围。
本发明实施例提供的医学检验报告的识别方法,先接收上传的医学检验报告图片,再调用光学图像识别软件提取医学检验报告图片中的检测数据,最后按预设规则将检测数据转换为电子报告,整个过程无需人工介入,即可将对患者随访过程中产生的医学检验报告进行数据化存储。用光学图像识别的方式提取医学检验报告图片中的检测数据,对于不同格式的医学检验报告图片均通用,根据需求设置预设规则,即可将收集到的检测数据以标准化的电子报告的形式进行存储。因此本发明实施例提供的方案既具有通用性,又极大减少了人工介入,提高了医学检验数据收集的效率和准确性,节省了人力。
由于医学检测报告图片的扫描位置不可能与模板文件严格对齐,可能存在位移,旋转不正的情况,影响底层识别模块的识别成功率,而患者可能是通过照相机、手机应用完成对医学检测报告图片的拍摄,由于镜头畸变造成前一步对正困难,进而影响底层识别模块的识别成功率,同时,医学检测报告图片可能存在底纹,也将影响光学图像识别软件的底层识别模块的识别成功率。
因此,在上述实施例的基础上,在步骤S102之前,还包括:
对医学检验报告图片进行预处理;
相应的,调用光学图像识别软件提取医学检验报告图片中的检测数据,具体为:
调用光学图像识别软件提取预处理后的医学检验报告图片中的检测数据。
通过对医学检验报告图片进行预处理,尽可能消除原始的医学检测报告图片的位置不正、变形、底纹等问题。
在具体实施中,对医学检验报告图片进行预处理,具体可以包括:
基于预设的对正基准对医学检验报告图片进行对正处理;
将对正处理后的医学检验报告图片进行色度空间分离处理;
对色度空间分离处理的医学检验报告图片进行降噪处理,得到预处理后的医学检验报告图片。
在具体实施中,上述步骤可以基于OpenCV的图像处理算法实现,设计预处理程序,主要包括图像处理模块和图像失真校正模块两部分。其中,图像处理模块包括预处理单元、图像色度转换单元、图像分割单元、去噪单元等,图像色度转换单元包括BAYER图像—RGB空间图像转换单元和RGB空间图像—HIS色度图像转换单元,可以将接收到的BAYER图像转换成为RGB空间图像,并将RGB空间图像转换为HIS色度图像。图像失真校正模块包括图像信息获取单元、图像失真校正单元、图像信息赋值单元和图像孔洞消除单元,其中,图像信息获取单元用于获取图像上的点的信息,点的信息包括点的位置信息和色彩信息,还可以包括其他的信息;图像失真校正单元用于对图像上的点的位置信息进行校正;图像信息赋值单元用于将图像上点的色彩信息赋值给校正后的点;图像孔洞消除单元用于消除校正后的图像的孔洞效应。
对于有标准格式的单据,可以将表头或装订线等信息作为对正基准,对医学检验报告图片进行对正处理。对正处理可以包括透视,旋转,对正,裁剪等处理,得到有效数据区域。
通过转换色彩空间的方式将图像进行色度空间分离。对有底纹的图像,在转换色度空间时滤除底纹,再转换为灰度空间以及位图空间。
为提高识别率,对位图空间进行降噪处理,处理后的信息送往底层识别模块进行识别。
上文详述了医学检验报告的识别方法对应的各个实施例,在此基础上,本发明还公开了与上述方法对应的医学检验报告的识别装置。
图3为本发明实施例提供的一种医学检验报告的识别装置的结构示意图。
如图3所示,本发明实施例提供的医学检验报告的识别装置包括:
接收单元301,用于接收上传的医学检验报告图片;
提取单元302,用于调用光学图像识别软件提取医学检验报告图片中的检测数据;
转换单元303,用于按预设规则将检测数据转换为电子报告。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
图4为本发明实施例提供的一种医学检验报告的识别设备的结构示意图。
如图4所示,本发明实施例提供的医学检验报告的识别设备包括:
存储器401,用于存储指令,所述指令包括上述任意一项实施例所述医学检验报告的识别方法的步骤;
处理器402,用于执行所述指令。
本实施例提供的医学检验报告的识别设备,由于可以通过处理器调用存储器存储的计算机程序,实现如上述任一实施例提供的医学检验报告的识别方法的步骤,所以本分析装置具有同上述医学检验报告的识别方法同样的实际效果。
为了更好地理解本方案,本发明实施例还提供一种存储介质,该存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上任一实施例提到的医学检验报告的识别方法的步骤。
本实施例提供的存储介质,由于可以通过处理器调用存储介质存储的计算机程序,实现如上述任一实施例提供的医学检验报告的识别方法的步骤,所以本存储介质具有同上述医学检验报告的识别方法同样的实际效果。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法、装置、设备及存储介质,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,功能调用装置,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本发明所提供的一种医学检验报告的识别方法、装置、设备及存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种医学检验报告的识别方法,其特征在于,包括:
接收上传的医学检验报告图片;
调用光学图像识别软件提取所述医学检验报告图片中的检测数据;
按预设规则将所述检测数据转换为电子报告。
2.根据权利要求1所述的医学检验报告的识别方法,其特征在于,在所述调用光学图像识别软件提取所述医学检验报告图片中的检测数据之前,还包括:
对所述医学检验报告图片进行预处理;
相应的,所述调用光学图像识别软件提取所述医学检验报告图片中的检测数据,具体为:
调用所述光学图像识别软件提取预处理后的医学检验报告图片中的检测数据。
3.根据权利要求2所述的医学检验报告的识别方法,其特征在于,所述对所述医学检验报告图片进行预处理,具体包括:
基于预设的对正基准对所述医学检验报告图片进行对正处理;
将对正处理后的医学检验报告图片进行色度空间分离处理;
对色度空间分离处理的医学检验报告图片进行降噪处理,得到所述预处理后的医学检验报告图片。
4.根据权利要求1所述的医学检验报告的识别方法,其特征在于,所述调用光学图像识别软件提取所述医学检验报告图片中的检测数据,具体包括:
对所述医学检验报告图片中的数据项进行识别拆分,得到拆分后的数据项;
查询预设表单的元数据映射表,获得数据表的位置信息;
根据所述数据表的位置信息对所述拆分后的数据项进行结构化处理,得到所述检测数据。
5.根据权利要求1所述的医学检验报告的识别方法,其特征在于,在按预设规则将所述检测数据转换为电子报告之前,还包括:
调用所述光学图像识别软件对所述检测数据进行纠错处理;
相应的,所述按预设规则将所述检测数据转换为电子报告,具体为:
按所述预设规则将纠错处理后的检测数据转换为所述电子报告。
6.根据权利要求5所述的医学检验报告的识别方法,其特征在于,还包括:
将所述医学检验报告图片中无法识别的数据项写入错误日志。
7.根据权利要求1所述的医学检验报告的识别方法,其特征在于,所述电子报告中的项目具体包括:
患者身份信息、检验日期、检验机构、检验指标、检验结果、检验指标单位和检验指标的预设范围。
8.一种医学检验报告的识别装置,其特征在于,包括:
接收单元,用于接收上传的医学检验报告图片;
提取单元,用于调用光学图像识别软件提取所述医学检验报告图片中的检测数据;
转换单元,用于按预设规则将所述检测数据转换为电子报告。
9.一种医学检验报告的识别设备,其特征在于,包括:
存储器,用于存储指令,所述指令包括权利要求1至7任意一项所述医学检验报告的识别方法的步骤;
处理器,用于执行所述指令。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述医学检验报告的识别方法的步骤。
CN201910543484.7A 2019-06-21 2019-06-21 一种医学检验报告的识别方法、装置、设备及存储介质 Pending CN112116968A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910543484.7A CN112116968A (zh) 2019-06-21 2019-06-21 一种医学检验报告的识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910543484.7A CN112116968A (zh) 2019-06-21 2019-06-21 一种医学检验报告的识别方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112116968A true CN112116968A (zh) 2020-12-22

Family

ID=73796342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910543484.7A Pending CN112116968A (zh) 2019-06-21 2019-06-21 一种医学检验报告的识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112116968A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112927776A (zh) * 2021-02-03 2021-06-08 昆山慧医优策医疗科技有限公司 一种面向医学检验报告的人工智能自动解读系统
CN113130023A (zh) * 2021-04-22 2021-07-16 嘉兴易迪希计算机技术有限公司 Edc系统中图文识别录入方法及系统
CN113342883A (zh) * 2021-05-25 2021-09-03 国网上海市电力公司 一种电力设备检测数据结构化方法、装置、介质及设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101299225A (zh) * 2007-04-30 2008-11-05 西门子公司 提供医学报告的方法、装置和系统
CN103425975A (zh) * 2013-07-17 2013-12-04 中国中医科学院 一种临床病例数据采集系统及采集方法
CN105956412A (zh) * 2016-04-22 2016-09-21 北京阳光欣晴健康管理有限责任公司 基于智能图文识别实现冠心病临床数据收集的系统及方法
CN106202948A (zh) * 2016-07-18 2016-12-07 上海市第人民医院 一种可数字化超声心动图报告自动管理的方法和系统
CN106383988A (zh) * 2016-08-30 2017-02-08 杭州筹图科技有限公司 一种医疗检查报告单的生成方法及装置
CN108962346A (zh) * 2017-05-22 2018-12-07 深圳大森智能科技有限公司 医疗检验报告电子化方法、存储设备及移动终端
CN109710670A (zh) * 2018-12-11 2019-05-03 河南通域医疗科技有限公司 一种将病历文本从自然语言转换为结构化元数据的方法
JP2019082814A (ja) * 2017-10-30 2019-05-30 株式会社インフォディオ 紙帳票データ化システム、ocrエンジン学習用画像生成装置および画像分析装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101299225A (zh) * 2007-04-30 2008-11-05 西门子公司 提供医学报告的方法、装置和系统
CN103425975A (zh) * 2013-07-17 2013-12-04 中国中医科学院 一种临床病例数据采集系统及采集方法
CN105956412A (zh) * 2016-04-22 2016-09-21 北京阳光欣晴健康管理有限责任公司 基于智能图文识别实现冠心病临床数据收集的系统及方法
CN106202948A (zh) * 2016-07-18 2016-12-07 上海市第人民医院 一种可数字化超声心动图报告自动管理的方法和系统
CN106383988A (zh) * 2016-08-30 2017-02-08 杭州筹图科技有限公司 一种医疗检查报告单的生成方法及装置
CN108962346A (zh) * 2017-05-22 2018-12-07 深圳大森智能科技有限公司 医疗检验报告电子化方法、存储设备及移动终端
JP2019082814A (ja) * 2017-10-30 2019-05-30 株式会社インフォディオ 紙帳票データ化システム、ocrエンジン学習用画像生成装置および画像分析装置
CN109710670A (zh) * 2018-12-11 2019-05-03 河南通域医疗科技有限公司 一种将病历文本从自然语言转换为结构化元数据的方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112927776A (zh) * 2021-02-03 2021-06-08 昆山慧医优策医疗科技有限公司 一种面向医学检验报告的人工智能自动解读系统
CN113130023A (zh) * 2021-04-22 2021-07-16 嘉兴易迪希计算机技术有限公司 Edc系统中图文识别录入方法及系统
CN113342883A (zh) * 2021-05-25 2021-09-03 国网上海市电力公司 一种电力设备检测数据结构化方法、装置、介质及设备

Similar Documents

Publication Publication Date Title
US9785627B2 (en) Automated form fill-in via form retrieval
US11232300B2 (en) System and method for automatic detection and verification of optical character recognition data
CN110751143A (zh) 一种电子发票信息的提取方法及电子设备
US9384389B1 (en) Detecting errors in recognized text
CN109800761A (zh) 基于深度学习模型创建纸质文档结构化数据的方法和终端
US10489645B2 (en) System and method for automatic detection and verification of optical character recognition data
CN112116968A (zh) 一种医学检验报告的识别方法、装置、设备及存储介质
CN105740857A (zh) 一种基于ocr的快速纸笔投票结果自动采集与识别系统
CN111814616A (zh) 一种无需答题卡的试卷自动阅卷处理系统及其实现方法
CN111797729A (zh) 一种化验报告单自动识别方法
KR101966627B1 (ko) 모바일용 의료기록지 번역시스템
CN110110622B (zh) 一种基于图像处理的医疗文本检测方法、系统和存储介质
CN109508712A (zh) 一种基于图像的汉语文字识别方法
CN110059184B (zh) 一种作业错题收集分析方法及系统
CN116798061A (zh) 一种票据审核识别方法、装置、终端和存储介质
CN116958996A (zh) Ocr信息提取方法、系统及设备
CN115457585A (zh) 作业批改的处理方法、装置、计算机设备及可读存储介质
CN112364790B (zh) 基于卷积神经网络的机场工作单信息识别方法及系统
US11335108B2 (en) System and method to recognise characters from an image
CN103425976A (zh) 一种临床病例报告表识别系统及识别方法
JP2007280413A (ja) 財務諸表自動入力装置
CN111046864A (zh) 一种合同扫描件五要素自动提取方法及系统
TWI712979B (zh) 運用深度學習之長短期記憶模型輔助保險理賠系統及其方法
CN116052860A (zh) 一种基于人工智能的医疗设备集成方法
WO2022217689A1 (zh) 一种基于ai技术的游客身份录入方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination