CN109241826A - 一种基于ocr技术的识别医学单据系统和方法 - Google Patents

一种基于ocr技术的识别医学单据系统和方法 Download PDF

Info

Publication number
CN109241826A
CN109241826A CN201810790732.3A CN201810790732A CN109241826A CN 109241826 A CN109241826 A CN 109241826A CN 201810790732 A CN201810790732 A CN 201810790732A CN 109241826 A CN109241826 A CN 109241826A
Authority
CN
China
Prior art keywords
document
magnetic
signal
identification
sensor group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810790732.3A
Other languages
English (en)
Other versions
CN109241826B (zh
Inventor
刘刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Somy Technology Co Ltd
Original Assignee
Beijing Somy Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Somy Technology Co Ltd filed Critical Beijing Somy Technology Co Ltd
Priority to CN201810790732.3A priority Critical patent/CN109241826B/zh
Publication of CN109241826A publication Critical patent/CN109241826A/zh
Application granted granted Critical
Publication of CN109241826B publication Critical patent/CN109241826B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R33/00Arrangements or instruments for measuring magnetic variables
    • G01R33/02Measuring direction or magnitude of magnetic fields or magnetic flux
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Abstract

本发明提供了一种基于OCR技术的识别医学单据系统和方法,解决现有的OCR过程中信号采集质量偏低导致信号识别效率低的技术问题。系统包括:单据头进入检测装置、单据尾进入检测装置、单据头排出检测装置、单据尾排出检测装置、恒定磁场发生器、线性光学传感器组、线性初始磁传感器组、线性校验磁传感器组、平行光光源、第一数据封装处理器、状态判断处理器和控制信号生成处理器。利用两种不同类型的物理信号识别同一单据形成两种内容表达正相关的图像,利用物理信号的差异过滤光学图像中的非字符识别内容,定位字符识别内容区域,减轻了OCR识别的难度和数据处理负荷,节约了时间成本和硬件成本。

Description

一种基于OCR技术的识别医学单据系统和方法
技术领域
本发明涉及图像处理领域,具体涉及一种基于OCR技术的识别医学单据系统和方法。
背景技术
现有医疗环境中会产生大量的纸质医学单据,现有通用光学文本识别 (OpticalCharacter Recognition,OCR)技术对文本图案的识别是基于标准文本的图像特征数据,印刷版医学单据中的人工签注和人工记录内容往往涉及不同的文字、符号等图案,由于笔记潦草、图形混杂和意外污迹折痕使得真实图案的图像特征存在采集误差,无法与标准文本的图像特征数据合理匹配,造成识别率低误识率高。由于采集设备的性能局限,需要对OCR识别算法进行改进,算法开发难度大,研发成本巨大。。
发明内容
本发明实施例提供一种基于OCR技术的识别医学单据系统和方法,解决现有的OCR过程中信号采集质量偏低导致信号识别效率低的技术问题。
本发明实施例的基于OCR技术的识别医学单据系统,包括:
单据头进入检测装置,用于形成单据由扫描通道输入端输入时的第一触发信号;
单据尾进入检测装置,用于形成所述单据由所述扫描通道输入端经过时的第二触发信号;
单据头排出检测装置,用于形成所述单据由所述扫描通道排出端输出时的第三触发信号;
单据尾排出检测装置,用于形成所述单据由所爱护扫描通道排出端经过时的第四触发信号;
恒定磁场发生器,用于根据磁场使能信号产生恒定磁场;
线性光学传感器组,用于根据同步采集使能信号对复合采集区域内的光学识别信号进行采集;
线性初始磁传感器组,用于根据所述同步采集使能信号对所述复合采集区域内的磁性识别信号进行采集;
线性校验磁传感器组,用于根据异步采集使能信号对校验区域内的磁性识别信号进行采集;
平行光光源,用于根据所述同步采集使能信号对复合采集区域内照明。
第一数据封装处理器,用于将各触发信号与时间绑定形成时间数据;
状态判断处理器,用于根据所述时间数据形成所述单据的控制状态和控制时序;
控制信号生成处理器,用于根据所述控制时序形成所述控制状态的控制信号。
在本发明一实施例中,还包括:
第二数据封装处理器,用于对接收的识别信号进行封装,形成各类型识别信号的中间图像数据;
识别图像生成处理器,用于将所述中间图像数据拼接成对应类型的识别图像,并标记识别图像间的重复图案。
在本发明一实施例中,所述平行光光源采用不同频段的至少两个光源,所述至少两个光源形成复合光源或交替频闪。
在本发明一实施例中,还包括:
矢量描述数据生成处理器,用于根据矢量描述模型对所述识别图像进行矢量描述形成矢量比对数据。
在本发明一实施例中,所述扫描通道包括上支撑板、下支撑板和一对支撑侧壁,所述支撑侧壁对称支撑并固定在所述上支撑板和所述下支撑板之间使所述上支撑板和所述下支撑板保持平行,所述支撑侧壁、所述上支撑板和所述下支撑板形成贯通的扫描通道,所述单据由所述扫描通道的进入端输入由排出端输出。
在本发明一实施例中,自所述扫描通道的所述进入端向所述排出端方向,在所述上支撑板中顺序设置所述单据头进入检测装置、所述单据尾进入检测装置、所述线性光学传感器组、所述单据头排出检测装置和所述单据尾排出检测装置,在所述单据头进入检测装置和所述单据尾进入检测装置之间的所述扫描通道侧壁内设置所述恒定磁场发生器,在所述下支撑板上与所述线性光学传感器组对应的位置设置所述线性初始磁传感器组,在所述下支撑板上位于所述单据头排出检测装置和所述单据尾排出检测装置间的位置设置所述线性校验磁传感器组,在所述支撑侧壁上与所述线性光学传感器组对应的位置设置所述平行光光源。
在本发明一实施例中,所述恒定磁场发生器的外侧形成铜材质的第一磁场阻隔层,所述线性初始磁传感器组的外侧形成铜材质的第二磁场阻隔层,所述线性光学传感器组的外侧形成铜材质的第三磁场阻隔层,所述第三磁场阻隔层向所述第二磁场阻隔层投影的轮廓覆盖所述第二磁场阻隔层;所述线性校验磁传感器组的外侧形成铜材质的第四磁场阻隔层,同时在所述扫描通道54的内壁相对位置设置第五磁场阻隔层,所述第五磁场阻隔层向所述第四磁场阻隔层投影的轮廓覆盖所述第四磁场阻隔层。
在本发明一实施例中,所述线性初始磁传感器组的感应面上涂敷纯色漫反射涂层,所述线性初始磁传感器组的感应面与所述线性光学传感器组的感应面相对且平行,同时所述线性初始磁传感器组的感应面与所述线性光学传感器组的延伸方向与所述扫描通道的延伸方向垂直,所述线性校验磁传感器组的感应面与所述线性光学传感器组的感应面的感应面平行。
本发明实施例中基于OCR技术的识别医学单据系统形成的识别医学单据方法,包括:
根据所述第一触发信号的形成,形成所述磁场使能控制信号控制所述恒定磁场发生器向单据中软磁性材料充磁,进入充磁状态;
根据所述第二触发信号的形成,形成所述同步采集使能信号,控制所述平行光光源发光,所述所述线性初始磁传感器组和线性光学传感器组同步采集信号,进入采集状态;
根据所述所述第一触发信号的变化,终止磁场使能控制信号,所述恒定磁场发生器停止向单据中软磁性材料充磁,退出充磁状态;
根据所述第二触发信号的变化,延迟终止所述同步采集使能信号,所述线性初始磁传感器组和所述线性光学传感器组停止采集信号,退出采集状态;
根据所述第三触发信号的形成,形成所述异步采集使能信号,控制所述线性校验磁传感器组采集磁信号,进入校验状态;
根据所述第四触发信号的形成,形成单据已输出信号;
根据所述第三触发信号的变化,延时终止所述异步采集使能信号,控制所述线性校验磁传感器组停止采集磁信号,退出校验状态;
根据所述第四触发信号的变化,形成单据许可输入信号。
本发明一实施例中,还包括:
在所述采集状态时序中,以固定频率同步采集所述复合采集区域内单据图案的光学识别信号和磁性识别信号,形成所述所述光学识别信号的一系列中间图像数据和磁性识别信号的一系列中间图像数据;
在所述校验状态时序中,以固定频率采集校验区域内的磁性识别信号,形成所述磁性识别信号的一系列中间校验图像数据;
在所述第四触发信号的形成后,将所述光学识别信号的一系列中间图像数据形成单据的光学识别图像,将所述磁性识别信号的一系列中间图像数据形成单据的磁性识别图像,将所述磁性识别信号的一系列中间校验图像数据形成单据的磁性识别校验图像。
本发明实施例的基于OCR技术的识别医学单据系统和方法利用两种不同类型的物理信号识别同一单据形成两种内容表达正相关的图像,利用物理信号的差异过滤光学图像中的非字符识别内容,定位字符识别内容区域,减轻了OCR识别的难度和数据处理负荷,节约了时间成本和硬件成本。
附图说明
图1所示为本发明实施例基于OCR技术的识别医学单据系统功能的架构示意图。
图2所示为本发明实施例基于OCR技术的识别医学单据系统结构的主视剖视示意图。
图3所示为本发明实施例基于OCR技术的识别医学单据系统结构的 A-A方向剖视示意图。
图4所示为本发明实施例医学单据智能识别方法的流程图。
图5所示为本发明实施例医学单据智能识别系统的架构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明白,以下结合附图及具体实施方式对本发明作进一步说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例基于OCR技术的识别医学单据系统的架构如图1所示。如图1所示,识别医学单据系统针对由软磁性材料形成标准图案的医学单据,包括:
单据头进入检测装置11,用于形成单据由扫描通道输入端输入时的第一触发信号;
单据尾进入检测装置12,用于形成单据由扫描通道输入端经过时的第二触发信号;
单据头排出检测装置13,用于形成单据由扫描通道排出端输出时的第三触发信号;
单据尾排出检测装置14,用于形成单据由扫描通道排出端经过时的第四触发信号;
恒定磁场发生器15,用于根据磁场使能信号产生恒定磁场;
线性光学传感器组16,用于根据同步采集使能信号对复合采集区域内的光学识别信号进行采集;
线性初始磁传感器组17,用于根据同步采集使能信号对复合采集区域内的磁性识别信号进行采集;
线性校验磁传感器组18,用于根据异步采集使能信号对校验区域内的磁性识别信号进行采集;
平行光光源19,用于根据同步采集使能信号对复合采集区域内照明。
平行光光源19可以采用不同频段的光源,形成复合光源或交替频闪的光源。
还包括:
第一数据封装处理器21,用于将各触发信号与时间绑定形成时间数据;
状态判断处理器22,用于根据时间数据形成单据的控制状态和控制时序;
控制信号生成处理器23,用于根据控制时序形成各控制状态的控制信号;
第二数据封装处理器24,用于对接收的识别信号进行封装,形成各类型识别信号的中间图像数据;
识别图像生成处理器25,用于将中间图像数据拼接成对应类型的识别图像,并标记识别图像间的重复图案。
本发明实施例的基于OCR技术的识别医学单据系统利用两种不同类型的物理信号识别同一单据形成两种内容表达正相关的图像,利用物理信号的差异过滤光学图像中的非字符识别内容,定位字符识别内容区域,减轻了 OCR识别的难度和数据处理负荷,节约了时间成本和硬件成本。
本发明实施例的基于OCR技术的识别医学单据系统还包括:
矢量描述数据生成处理器26,用于根据矢量描述模型对识别图像进行矢量描述形成矢量比对数据。
上述实施例中的处理器和处理装置可以采用单片机或具有相似处理能力的运算单元,必然可以包含必要的存储器、寄存器和输入输出接口,以及编码器件和模数转换器件。可以将处理器和处理装置部署在一个单片机上,也可以在每个单片机上对应部署一个处理器或处理装置。
本发明实施例基于OCR技术的识别医学单据系统的结构如图2和图3 所示。结合图2和图3所示,识别医学单据系统包括一个扫描通道54,扫描通道54包括一对支撑板和一对支撑侧壁,一对支撑侧壁53对称支撑并固定在上支撑板51和下支撑板52之间使上支撑板51和下支撑板52保持平行,一对支撑侧壁53、上支撑板51和下支撑板52的延伸方向一致,形成贯通的扫描通道54,医学单据由的进入端输入由排出端输出。
自扫描通道54的进入端向排出端方向,在扫描通道54的上支撑板51 中顺序设置单据头进入检测装置11、单据尾进入检测装置12、线性光学传感器组16、单据头排出检测装置13和单据尾排出检测装置14,在单据头进入检测装置11和单据尾进入检测装置12之间在上支撑板51和下支撑板52 上设置恒定磁场发生器15,在下支撑板52上与线性光学传感器组16对应的位置设置线性初始磁传感器组17,在下支撑板52上位于单据头排出检测装置13和单据尾排出检测装置14间的位置设置线性校验磁传感器组18,在支撑侧壁53上与线性光学传感器组16对应的位置设置平行光光源19照射线性光学传感器组16和线性初始磁传感器组17间的局部扫描通道54。
进一步具体说明,单据头进入检测装置11、单据尾进入检测装置12、线性光学传感器组16、单据头排出检测装置13和单据尾排出检测装置14 的感光面与扫描通道54的内壁平齐与扫描通道54的轴线平行,线性初始磁传感器组17和线性校验磁传感器组18的感应面与扫描通道54的内壁平齐与扫描通道54的轴线平行。
恒定磁场发生器15采用电磁线圈,电磁线圈在扫描通道54的侧壁内沿扫描通道54的轴线方向缠绕。在扫描通道54的内壁(由上支撑板51形成的部分)内在恒定磁场发生器15的外侧形成铜材质的第一磁场阻隔层55。
在扫描通道54的内壁(由下支撑板52形成的部分)内在线性初始磁传感器组17的外侧形成铜材质的第二磁场阻隔层56,对应在扫描通道54的内壁(由上支撑板51形成的部分)内在线性光学传感器组16的外侧形成铜材质的第三磁场阻隔层57,第三磁场阻隔层57向第二磁场阻隔层56投影的轮廓覆盖第二磁场阻隔层56。
在扫描通道54的内壁(由下支撑板52形成的部分)内在线性校验磁传感器组18的外侧形成铜材质的第四磁场阻隔层58,同时在扫描通道54的内壁(由上支撑板51形成的部分)对应位置设置第五磁场阻隔层59,第五磁场阻隔层59向第四磁场阻隔层58投影的轮廓覆盖第四磁场阻隔层58。
本发明实施例利用磁场阻隔层衰减用于阻隔恒定磁场发生器15和环境磁场对线性初始磁传感器组17和线性校验磁传感器组18的测量干扰。利用第三磁场阻隔层57和第二磁场阻隔层56形成准封闭的电磁环境维持线性初始磁传感器组17独立稳定的磁场测量环境,利用第五磁场阻隔层59和第四磁场阻隔层58形成准封闭的电磁环境维持线性校验磁传感器组18独立稳定的磁场测量环境,这样有利于在较小的长度内形成三个独立的磁感应区域。利用恒定磁场发生器15形成较强恒定磁场磁化利用软磁性材料形成定制图案的原始医疗单据,以获得较高的磁化强度,进而初步使线性初始磁传感器组17精确捕捉一狭长感应范围内的图案不同部分的磁场强度信号,利用软磁性材料磁性强度快速衰减特性,在后续使线性校验磁传感器组18精确捕捉另一狭长感应范围内的图案不同部分的磁场强度衰减信号,形成同一图案位置的磁场强度的变化数据,满足数据处理的数据需求。
进一步具体说明,线性初始磁传感器组17的感应面与线性光学传感器组16的感应面相对且平行,同时线性初始磁传感器组17的感应面与线性光学传感器组16的延伸方向与扫描通道54的延伸方向垂直,线性校验磁传感器组18的感应面与线性光学传感器组16的感应面的感应面平行。
线性光学传感器组16包括沿延伸方向顺序布设的CCD(Charge Coupled Device)光学传感器或CMOS(Complementary Metal-Oxide Semiconductor) 光学传感器,可以是一列或平行相邻的奇数列,光学传感器的排列密度为 30-150dpi(Dots Per Inch)。
线性初始磁传感器组17的感应面上涂敷纯色漫反射涂层,线性初始磁传感器组17包括沿延伸方向顺序布设的一列霍尔传感器,霍尔传感器间采用铜膜隔离,霍尔传感器的排列密度为20-40dpi(Dots Per Inch)。线性初始磁传感器组17感应面中心线与线性初始磁传感器组17感应面中心线相对。
本发明实施例对同一医学单据形成相关的磁性识别图像和光学识别图像,利用两种独立的物理量量化医学单据和利用医学单据形成流转单据上的团信息,形成光学和磁性图案的差分校验和过滤,可以高效过滤定制图案、排除重叠图案。进一步利用线性校验磁传感器组18对同一图案的衰减相关性信息形成对定制图案的精确确定和定位,实现定制图案在光学识别图像中排除和定位的额外精度。
进一步具体说明,在线性初始磁传感器组17与线性光学传感器组16之间的支撑侧壁53上对称设置平行光光源19,平行光光源19的光轴与扫描通道54的延伸方向垂直。
本发明实施例的平行光光源19保证了医学单据不被直接照射,避免出现反射、对焦等环境出现在光学识别图像中的虚影、阴影、亮斑等光学干扰信息,保证了医学单据的照射均匀度。
在本发明一个实施例中,平行光光源19包括一个红外平行光光源(波长800nm-900nm)波长和一个蓝光平行光光源(波长400nm-450nm)。
平行光光源采用两种频段,可以利用波长的吸收差异区分流转单据上的图案成本,确定在流转过程中图案的层次变化,使OCR识别过程中的污迹、混杂图案由光谱上直接区分,增加真实内容的图案准确度,降低识别算法的复杂性。
在本发明一个实施例中,由于光学传感器和磁性传感器存在布设密度差异,必然可以形成同一图案不同解析度的光学信号和磁性信号图像,利用光学信号和磁性信号的排布规律,根据同一图案矢量描述模型可以形成相关的矢量描述数据,利用分辨率比例信息,可以将磁性信号图像的矢量描述数据从光学信号图像的矢量描述数据中直接排除,大大节约了图像处理的计算资源和时间成本。
利用上述基于OCR技术的识别医学单据系统形成的识别医学单据方法包括:
1、根据第一触发信号的形成,形成磁场使能控制信号控制恒定磁场发生器向单据中软磁性材料充磁,进入充磁状态;
2、根据第二触发信号的形成,形成同步采集使能信号,控制平行光光源发光,线性初始磁传感器组和线性光学传感器组同步采集信号,进入采集状态;
3、根据第一触发信号的变化,终止磁场使能控制信号,恒定磁场发生器停止向单据中软磁性材料充磁,退出充磁状态;
4、根据第二触发信号的变化,延迟终止同步采集使能信号,线性初始磁传感器组和线性光学传感器组停止采集信号,退出采集状态;
5、根据第三触发信号的形成,形成异步采集使能信号,控制线性校验磁传感器组采集磁信号,进入校验状态;
6、根据第四触发信号的形成,形成单据已输出信号;
7、根据第三触发信号的变化,延时终止异步采集使能信号,控制线性校验磁传感器组停止采集磁信号,退出校验状态;
8、根据第四触发信号的变化,形成单据许可输入信号。
本发明实施例的识别医学单据方法利用触发信号的形成和变化控制单据信号采集的各阶段控制状态和统一的控制时序(例如上述序号1至9),并向上下游执行机构提供控制信号,将上下游执行机构联动,保证单据在扫描通道中流畅地输入输出。
利用上述基于OCR技术的识别医学单据系统形成的识别医学单据方法包括:
1、在采集状态时序中,以固定频率同步采集复合采集区域内单据图案的光学识别信号和磁性识别信号,形成光学识别信号的一系列中间图像数据和磁性识别信号的一系列中间图像数据;
2、在校验状态时序中,以固定频率采集校验区域内的磁性识别信号,形成磁性识别信号的一系列中间校验图像数据;
3、在第四触发信号的形成后,将光学识别信号的一系列中间图像数据形成单据的光学识别图像,将磁性识别信号的一系列中间图像数据形成单据的磁性识别图像,将磁性识别信号的一系列中间校验图像数据形成单据的磁性识别校验图像。
本发明实施例的识别医学单据方法形成的各识别图像具有相同图案的相关性,偏于图案定位、过滤和消隐,减轻了对特殊图案识别算法的依赖。
利用上述基于OCR技术的识别医学单据系统形成的识别医学单据方法包括:
根据矢量描述模型对各识别图像进行矢量描述形成相应的矢量比对数据。
本发明实施例的识别医学单据方法形成了对团的客观数学描述,有利于运用数学计算直接完成数据过滤、转换和替换,利用图形处理方式减轻了图像处理的负荷。
利用上述基于OCR技术的识别医学单据系统形成的识别医学单据方法包括:
在采集状态时序中,平行光光源采用红外频段和蓝光频段交替照明,形成光学识别信号的一系列红外中间图像数据和一系列蓝光中间图像数据。
本发明实施例的识别医学单据方法通过光源的配置形成对单据图案材质的区分和成像,提供了光学识别的额外数据通道,提升了数据处理的便捷性。
====================================
利用上述基于OCR技术的识别医学单据系统和方法获得的磁性识别图像和光学识别图像进行医学单据智能,识别。
本发明实施例的医学单据智能识别方法包括:
通过软磁性油墨标定原始医学单据中的信息承载范围,向信息承载范围内的光学文本识别过程提供优先特征数据。
本发明实施例的医学单据智能识别方法用于优化复杂定制表格中复杂形式信息内容的光学文本识别过程。利用快速消磁的磁介质标记复杂定制表格,并根据复杂定制表格的坐标标记确定复杂形式信息的具体坐标范围。通过提供该坐标范围内的复杂形式信息的应有信息记载形式,提高光学文本识别过程中对图像特征数据的匹配效率和识别准确度。避免了通用光学文本识别技术中非关键信息对关键信息的识别准确率造成干扰,克服了对非关键信息(如复杂定制表格)与关键信息的识别浪费大量计算资源的技术缺陷。
本发明一实施例的医学单据智能识别方法的流程图如图4所示。如图4 所示,医学单据智能识别方法包括:
步骤100:在油墨材料中添加铁磁粉末形成软磁性的磁性油墨;
采用具有低矫顽力和高磁导率的铁磁粉末磁性材料,例如铁硅合金粉末或以Fe2O3为主成分的亚铁磁性氧化物。
步骤110:通过磁性油墨进行图案印刷形成原始医疗单据;
根据诊疗用途形成一系列具有固定图案的原始医疗单据。固定图案包括针对一确定诊疗阶段的化验单、体检单、诊断单、报销单、药房单据等单据的组成图案和表格。
步骤120:原始医疗单据随疗程在医患双方间流转形成流转单据。
流转单据包括在不同医疗过程或诊疗过程中动态添加的医患信息,医患信息通常根据医疗过程或诊疗过程添加在单据固定的位置。
本发明实施例的医学单据智能识别方法通过磁介质建立了医学单据各部分非关键信息(如复杂定制表格)与关键信息块存在页面上的基本坐标关系,保证了非关键信息的准确定位,为非关键信息与关键信息的区分提供了必要识别基础。
在上述实施例的基础上,本发明另一实施例的医学单据智能识别方法包括:
步骤200:根据原始医疗单据上的原始完整图案形成全局矢量描述数据;
利用Postscript编程语言建立页面矢量描述模型,对原始医疗单据上的原始完整图案进行矢量元素的矢量描述。本领域技术人员可以理解相同矢量元素的矢量描述具有一致性,相同图形的不同矢量元素组合间具有可转换性。同一图案的矢量元素可以具有多样性组合。完整图案的矢量元素的不同组合形成的不同矢量描述数据在整体表达趋势相同,即图形表现一致。局部图案的矢量元素的不同组合形成的不同矢量描述数据在局部表达趋势相似,即图形表现高相关性。
步骤210:根据全局矢量描述数据形成原始医疗单据上各标题图案的图案矢量描述数据;
提取全局矢量描述数据中与原始完整图案中各标题图案相关的矢量描述数据形成原始医疗单据中图案的矢量描述数据。图案可以是表格线条、表格中项目的文字或图案等。
步骤220:根据全局矢量描述数据形成原始医疗单据上各承载图案的位置矢量描述数据;
提取在医患双方间流转时记载、记录或包含附加医患信息的原始完整图案中的承载图案。承载图案包括选项框、与标题图案的项目对应的空白表格范围等。
步骤230:根据标题图案的信息类型为承载图案设定承载信息描述数据;
承载图案与标题图案对应,具有相应的信息类型,信息类型和形式可以定义或限定。承载信息描述数据通常为信息表达的优先类型、信息表达的文字特征、信息表达的编码集形式、信息表达的图形集合、信息表达的符号集形式等。
步骤240:根据原始医疗单据的矢量描述数据和承载信息描述数据形成原始医疗单据的辅助识别数据。
本发明实施例的医学单据智能识别方法使得每一种原始医疗单据的相关各矢量描述数据和承载信息描述数据与对应原始医疗单据关联,使得原始医疗单据的全局图案、局部图案和局部图案的信息特征形成映射。
在上述实施例的基础上,本发明另一实施例的医学单据智能识别方法包括:
步骤300:建立恒定磁场;
恒定磁场为定极向、定强度和定位置的磁场。
步骤310:流转单据通过恒定磁场磁化形成磁性单据;
将包含了流转过程中各诊疗节点附加的医患信息的医疗单据形成磁性单据。
步骤320:对磁性单据进行逐行光学扫描和逐行磁感应扫描,形成每一像素的光学信号和磁性信号;
步骤330:根据磁性信号形成磁性单据的第一磁性识别图像,根据磁性信号利用相应像素的光学信号形成第二光学识别图像;
第一磁性识别图像仅包括对应的原始医疗单据中的原始图案,但由于磁性单据在流转时的损坏,第一磁性识别图像与原始医疗单据的原始图案存在差异,整体上具有相似性。
第二光学识别图像与第一磁性识别图像的图形表达一致。
步骤340:根据第一磁性识别图像形成磁性单据的矢量表述比对数据;
矢量表述比对数据采用与全局矢量描述数据一致的页面矢量描述模型。
步骤360:根据矢量表述比对数据与原始医疗单据的辅助识别数据比对,根据矢量拟合度确定磁性单据的原始医疗单据种类,确定磁性单据的标题位置范围和附加信息位置范围;
通过局部和整体的矢量描述数据的比对可以获得原始医疗单据的类型,原始医疗单据中标题位置范围和在流转过程中附加信息的预设位置范围。
步骤380:根据原始医疗单据的承载信息描述数据确定各附加信息位置范围内的优选识别字符集和/或图案集;
进而获得预设位置范围内附加信息的应有形式和应有数据格式。例如应该是希腊字符集为主,数字字符为辅,中文字符集为辅。
步骤350:根据每一像素的光学信号形成第一光学识别图像;
步骤370:消除第一光学识别图像中的第二光学识别图像形成第三光学识别图像;
第三光学识别图像中准确排除了原始医疗单据的原始图案,降低了第三光学识别图像中与待识别信息无关的干扰信息。
在本发明一实施例中,仅消除不存在图案叠加的第二光学识别图像。当磁性单据流转过程中原始图案被记录的附加信息和污迹覆盖时,仅消除不存在图案叠加的第二光学识别图像可以保证第三光学识别图像中图案不会被过度消除,避免被记录的附加信息受损。
步骤390:根据附加信息位置范围和优选识别字符集和/或图案集对第三光学识别图像进行OCR。
根据具体的附加信息位置范围和优选识别字符集和/或图案集可以有效提高OCR效率和准确性。
经OCR过程形成诊疗数据。
本发明实施例的医学单据智能识别系统包括:
存储器,用于存储上述实施例的医学单据智能识别方法中对应处理过程的程序代码;
运算器,用于运行上述实施例的医学单据智能识别方法中对应处理过程的程序代码。
本发明实施例的医学单据智能识别系统,用于通过软磁性油墨标定原始医学单据中的信息承载范围,向信息承载范围内的光学文本识别过程提供优先特征数据。
本发明一实施例的医学单据智能识别系统的架构如图5所示。如图5所示,本发明实施例的医学单据智能识别系统包括:
油墨改良装置1100,用于在油墨材料中添加铁磁粉末形成软磁性的磁性油墨;
单据改良装置1110,用于通过磁性油墨进行图案印刷形成原始医疗单据;
单据收发装置1120,用于原始医疗单据随疗程在医患双方间流转形成流转单据。
本发明实施例的医学单据智能识别系统还包括:
全局矢量生成装置1200,用于根据原始医疗单据上的原始完整图案形成全局矢量描述数据;
局部图案矢量生成装置1210,用于根据全局矢量描述数据形成原始医疗单据上各标题图案的图案矢量描述数据;
局部位置矢量生成装置1220,用于根据全局矢量描述数据形成原始医疗单据上各承载图案的位置矢量描述数据;
识别策略预置装置1230,用于根据标题图案的信息类型为承载图案设定承载信息描述数据;
原始单据数据集成装置1240,用于根据原始医疗单据的矢量描述数据和承载信息描述数据形成原始医疗单据的辅助识别数据。
本发明实施例的医学单据智能识别系统还包括:
磁场设立装置1300,用于建立恒定磁场;
单据磁化装置1310,用于流转单据通过恒定磁场磁化形成磁性单据;
双路扫描装置1320,用于对磁性单据进行逐行光学扫描和逐行磁感应扫描,形成每一像素的光学信号和磁性信号;
双路成像装置1330,用于根据磁性信号形成磁性单据的第一磁性识别图像,根据磁性信号利用相应像素的光学信号形成第二光学识别图像;
比对矢量生成装置1340,用于根据第一磁性识别图像形成磁性单据的矢量表述比对数据;
矢量拟合装置1360,用于根据矢量表述比对数据与原始医疗单据的辅助识别数据比对,根据矢量拟合度确定磁性单据的原始医疗单据种类,确定磁性单据的标题位置范围和附加信息位置范围;
矢量附加信息装置1380,用于根据原始医疗单据的承载信息描述数据确定各附加信息位置范围内的优选识别字符集和/或图案集;
图像生成装置1350,用于根据每一像素的光学信号形成第一光学识别图像;
图像消隐装置1370,用于消除第一光学识别图像中的第二光学识别图像形成第三光学识别图像;
识别优化装置1390,用于根据附加信息位置范围和优选识别字符集和/ 或图案集对第三光学识别图像进行OCR。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (10)

1.一种基于OCR技术的识别医学单据系统,其特征在于,包括:
单据头进入检测装置,用于形成单据由扫描通道输入端输入时的第一触发信号;
单据尾进入检测装置,用于形成所述单据由所述扫描通道输入端经过时的第二触发信号;
单据头排出检测装置,用于形成所述单据由所述扫描通道排出端输出时的第三触发信号;
单据尾排出检测装置,用于形成所述单据由所爱护扫描通道排出端经过时的第四触发信号;
恒定磁场发生器,用于根据磁场使能信号产生恒定磁场;
线性光学传感器组,用于根据同步采集使能信号对复合采集区域内的光学识别信号进行采集;
线性初始磁传感器组,用于根据所述同步采集使能信号对所述复合采集区域内的磁性识别信号进行采集;
线性校验磁传感器组,用于根据异步采集使能信号对校验区域内的磁性识别信号进行采集;
平行光光源,用于根据所述同步采集使能信号对复合采集区域内照明;
第一数据封装处理器,用于将各触发信号与时间绑定形成时间数据;
状态判断处理器,用于根据所述时间数据形成所述单据的控制状态和控制时序;
控制信号生成处理器,用于根据所述控制时序形成所述控制状态的控制信号。
2.如权利要求1所述的基于OCR技术的识别医学单据系统,其特征在于,还包括:
第二数据封装处理器,用于对接收的识别信号进行封装,形成各类型识别信号的中间图像数据;
识别图像生成处理器,用于将所述中间图像数据拼接成对应类型的识别图像,并标记识别图像间的重复图案。
3.如权利要求1所述的基于OCR技术的识别医学单据系统,其特征在于,所述平行光光源采用不同频段的至少两个光源,所述至少两个光源形成复合光源或交替频闪。
4.如权利要求2所述的基于OCR技术的识别医学单据系统,其特征在于,还包括:
矢量描述数据生成处理器,用于根据矢量描述模型对所述识别图像进行矢量描述形成矢量比对数据。
5.如权利要求1至4任一所述的基于OCR技术的识别医学单据系统,其特征在于,所述扫描通道包括上支撑板、下支撑板和一对支撑侧壁,所述支撑侧壁对称支撑并固定在所述上支撑板和所述下支撑板之间使所述上支撑板和所述下支撑板保持平行,所述支撑侧壁、所述上支撑板和所述下支撑板形成贯通的扫描通道,所述单据由所述扫描通道的进入端输入由排出端输出。
6.如权利要求5所述的基于OCR技术的识别医学单据系统,其特征在于,自所述扫描通道的所述进入端向所述排出端方向,在所述上支撑板中顺序设置所述单据头进入检测装置、所述单据尾进入检测装置、所述线性光学传感器组、所述单据头排出检测装置和所述单据尾排出检测装置,在所述单据头进入检测装置和所述单据尾进入检测装置之间的所述扫描通道侧壁内设置所述恒定磁场发生器,在所述下支撑板上与所述线性光学传感器组对应的位置设置所述线性初始磁传感器组,在所述下支撑板上位于所述单据头排出检测装置和所述单据尾排出检测装置间的位置设置所述线性校验磁传感器组,在所述支撑侧壁上与所述线性光学传感器组对应的位置设置所述平行光光源。
7.如权利要求6所述的基于OCR技术的识别医学单据系统,其特征在于,所述恒定磁场发生器的外侧形成铜材质的第一磁场阻隔层,所述线性初始磁传感器组的外侧形成铜材质的第二磁场阻隔层,所述线性光学传感器组的外侧形成铜材质的第三磁场阻隔层,所述第三磁场阻隔层向所述第二磁场阻隔层投影的轮廓覆盖所述第二磁场阻隔层;所述线性校验磁传感器组的外侧形成铜材质的第四磁场阻隔层,同时在所述扫描通道54的内壁相对位置设置第五磁场阻隔层,所述第五磁场阻隔层向所述第四磁场阻隔层投影的轮廓覆盖所述第四磁场阻隔层。
8.如权利要求7所述的基于OCR技术的识别医学单据系统,其特征在于,所述线性初始磁传感器组的感应面上涂敷纯色漫反射涂层,所述线性初始磁传感器组的感应面与所述线性光学传感器组的感应面相对且平行,同时所述线性初始磁传感器组的感应面与所述线性光学传感器组的延伸方向与所述扫描通道的延伸方向垂直,所述线性校验磁传感器组的感应面与所述线性光学传感器组的感应面的感应面平行。
9.利用权利要求1至8任一所述基于OCR技术的识别医学单据系统形成的识别医学单据方法,其特征在于,包括:
根据所述第一触发信号的形成,形成所述磁场使能控制信号控制所述恒定磁场发生器向单据中软磁性材料充磁,进入充磁状态;
根据所述第二触发信号的形成,形成所述同步采集使能信号,控制所述平行光光源发光,所述所述线性初始磁传感器组和线性光学传感器组同步采集信号,进入采集状态;
根据所述所述第一触发信号的变化,终止磁场使能控制信号,所述恒定磁场发生器停止向单据中软磁性材料充磁,退出充磁状态;
根据所述第二触发信号的变化,延迟终止所述同步采集使能信号,所述线性初始磁传感器组和所述线性光学传感器组停止采集信号,退出采集状态;
根据所述第三触发信号的形成,形成所述异步采集使能信号,控制所述线性校验磁传感器组采集磁信号,进入校验状态;
根据所述第四触发信号的形成,形成单据已输出信号;
根据所述第三触发信号的变化,延时终止所述异步采集使能信号,控制所述线性校验磁传感器组停止采集磁信号,退出校验状态;
根据所述第四触发信号的变化,形成单据许可输入信号。
10.如权利要求9所述的识别医学单据方法,其特征在于,还包括:
在所述采集状态时序中,以固定频率同步采集所述复合采集区域内单据图案的光学识别信号和磁性识别信号,形成所述所述光学识别信号的一系列中间图像数据和磁性识别信号的一系列中间图像数据;
在所述校验状态时序中,以固定频率采集校验区域内的磁性识别信号,形成所述磁性识别信号的一系列中间校验图像数据;
在所述第四触发信号的形成后,将所述光学识别信号的一系列中间图像数据形成单据的光学识别图像,将所述磁性识别信号的一系列中间图像数据形成单据的磁性识别图像,将所述磁性识别信号的一系列中间校验图像数据形成单据的磁性识别校验图像。
CN201810790732.3A 2018-07-18 2018-07-18 一种基于ocr技术的识别医学单据系统和方法 Active CN109241826B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810790732.3A CN109241826B (zh) 2018-07-18 2018-07-18 一种基于ocr技术的识别医学单据系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810790732.3A CN109241826B (zh) 2018-07-18 2018-07-18 一种基于ocr技术的识别医学单据系统和方法

Publications (2)

Publication Number Publication Date
CN109241826A true CN109241826A (zh) 2019-01-18
CN109241826B CN109241826B (zh) 2019-10-15

Family

ID=65072183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810790732.3A Active CN109241826B (zh) 2018-07-18 2018-07-18 一种基于ocr技术的识别医学单据系统和方法

Country Status (1)

Country Link
CN (1) CN109241826B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012226633A (ja) * 2011-04-21 2012-11-15 Seiko Epson Corp 記録媒体処理装置、記録媒体処理装置の制御方法、及びプログラム
CN103996239A (zh) * 2014-06-13 2014-08-20 广州广电运通金融电子股份有限公司 一种基于多线索融合的票据定位识别方法及系统
CN105354281A (zh) * 2014-02-03 2016-02-24 株式会社隆创 图像检查装置和图像检查程序
CN105894589A (zh) * 2014-05-12 2016-08-24 北京仁康华丰科技有限公司 一种用于自动售检票设备的磁票模块
EP3193278A1 (en) * 2016-01-13 2017-07-19 Toshiba TEC Kabushiki Kaisha Magnetic ink character reader and magnetic ink character reading method
CN107123185A (zh) * 2017-06-20 2017-09-01 深圳怡化电脑股份有限公司 一种有价文件磁性字符的识别装置及方法
JP2017199326A (ja) * 2016-04-29 2017-11-02 キヤノン電子株式会社 文字読取装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012226633A (ja) * 2011-04-21 2012-11-15 Seiko Epson Corp 記録媒体処理装置、記録媒体処理装置の制御方法、及びプログラム
CN105354281A (zh) * 2014-02-03 2016-02-24 株式会社隆创 图像检查装置和图像检查程序
CN105894589A (zh) * 2014-05-12 2016-08-24 北京仁康华丰科技有限公司 一种用于自动售检票设备的磁票模块
CN103996239A (zh) * 2014-06-13 2014-08-20 广州广电运通金融电子股份有限公司 一种基于多线索融合的票据定位识别方法及系统
EP3193278A1 (en) * 2016-01-13 2017-07-19 Toshiba TEC Kabushiki Kaisha Magnetic ink character reader and magnetic ink character reading method
JP2017199326A (ja) * 2016-04-29 2017-11-02 キヤノン電子株式会社 文字読取装置
CN107123185A (zh) * 2017-06-20 2017-09-01 深圳怡化电脑股份有限公司 一种有价文件磁性字符的识别装置及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
奕科杰: ""基于多传感器信息处理纸币检测若干关键技术研究"", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Also Published As

Publication number Publication date
CN109241826B (zh) 2019-10-15

Similar Documents

Publication Publication Date Title
US7333653B2 (en) Detecting and correcting redeye in an image
WO2019132589A1 (ko) 다중 객체 검출을 위한 영상 처리 장치 및 방법
CN101295359B (zh) 图像处理装置及图像处理方法
TW559739B (en) Image processor and pattern recognition apparatus using the image processor
CN105103187A (zh) 用于阴影检测和减弱的多光谱成像系统
CN110866932A (zh) 多通道舌体边缘检测装置、方法及存储介质
CN107437293A (zh) 一种基于票据全局特征的票据防伪鉴别方法
JP3018949B2 (ja) 文字読取装置およびその方法
CN110969631A (zh) 一种精细化照片染发方法及系统
McHenry et al. A geodesic active contour framework for finding glass
CN109241826B (zh) 一种基于ocr技术的识别医学单据系统和方法
CN106033534A (zh) 基于直线检测的电子阅卷方法
CN109740586A (zh) 一种防眩光证件自动阅读系统及方法
JP3516786B2 (ja) 顔領域抽出方法及び複写条件決定方法
JP2848749B2 (ja) 特徴画像データの抽出方法
CN111881914A (zh) 一种基于自学习阈值的车牌字符分割方法及系统
Zhang et al. Automatic detection of layout of color yarns of yarn‐dyed fabric. Part 2: Region segmentation of double‐system‐Mélange color fabric
JP2003087562A (ja) 画像処理装置および画像処理方法
CN108805848A (zh) 用于紫外光和可见光成像的图像融合方法
CN109842733A (zh) 图像处理装置
CN109101970A (zh) 一种医学单据智能识别方法与智能识别系统
Joshi et al. Source printer identification from document images acquired using smartphone
Cordelières et al. 3D quantitative colocalisation analysis
JP2003196592A (ja) 画像処理プログラム及び画像処理装置
Zeng et al. Color Recognition of Vehicle Based on Low Light Enhancement and Pixel-wise Contextual Attention

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant