CN106355177A - 一种医疗检验单的检验项信息自动提取方法 - Google Patents

一种医疗检验单的检验项信息自动提取方法 Download PDF

Info

Publication number
CN106355177A
CN106355177A CN201610684785.8A CN201610684785A CN106355177A CN 106355177 A CN106355177 A CN 106355177A CN 201610684785 A CN201610684785 A CN 201610684785A CN 106355177 A CN106355177 A CN 106355177A
Authority
CN
China
Prior art keywords
connected component
result
image
recognition
lab work
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610684785.8A
Other languages
English (en)
Other versions
CN106355177B (zh
Inventor
云楠
吴成宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Smell Data Technology Co Ltd
Original Assignee
Tianjin Smell Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Smell Data Technology Co Ltd filed Critical Tianjin Smell Data Technology Co Ltd
Priority to CN201610684785.8A priority Critical patent/CN106355177B/zh
Publication of CN106355177A publication Critical patent/CN106355177A/zh
Application granted granted Critical
Publication of CN106355177B publication Critical patent/CN106355177B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种医疗检验单的检验项信息自动提取方法,包括如下步骤:S1预处理;S2化验结果识别和定位;S3化验项目名称识别和定位;S4化验项目名称和化验项目结果匹配。本发明实现了复杂医疗检验单拍照图像中的文字识别和信息提取功能,对于文字倾斜、定向错误、噪音干扰、版式复杂、光照不均等情况有较强的鲁棒性,解决了复杂医疗检验单拍照图像中文字倾斜、定向错误、噪音干扰、版式复杂、光照不均等多种情况下的文字识别和信息提取问题。本发明对多种复杂情况下的医疗检验单拍照图像进行文字识别和信息提取,准确率达到90%以上,能够满足个人医疗记录保存和检索等应用的需要。

Description

一种医疗检验单的检验项信息自动提取方法
技术领域
本发明涉及字符识别技术领域,具体涉及一种医疗检验单的检验项信息自动提取方法。
背景技术
光学字符识别(OCR)技术作为图像识别领域的一大重要研究热点,主要针对文档图像中各种语言、字体等字符的识别,被广泛应用于各种证件识别、票据识别、标志牌识别、文档分析等人们生活、工作和学习的各个方面。关于OCR技术的研究始于20世纪初,经过近一个世纪的研究发展,OCR技术目前已可支持多种语言、针对多种场景并可结合不同平台进行开发,应用也日趋成熟,国内外有许多投入市场应用的OCR软件如Tesseract OCR、ABBYYFineReader、清华文通和清华紫光OCR、汉王OCR等等。
现有的字符识别方法基本可分为预处理、文本定位与字符分割、特征提取、分类识别及后处理等几大阶段。文献[1]提出一种针对文档图像的基于像素点的二值化算法,文献[2]通过对比不同的人工神经网络模型并从中选取最优模型进行字符识别,文献[3]则针对的是文本行的提取过程;文献[4-6]对手写字符的识别进行了研究,分别使用基于模糊理论、基于粒子群优化算法和基于离散小波变换的方法,并达到较高的识别准确率;文献[7]则针对的是场景字符的识别,使用ICDAR2003数据集,其中包括书籍杂志封面、海报横幅、街道牌、 商店标牌、商品铭牌、标志标识牌等多场景字符图像,实验识别率均在80%以上;对于各种语言字符识别的研究,则有文献[8]的印度语识别技术、文献[9]对泰文中断裂字符现象的针对性算法以及文献[10]对手写梵文字符的识别研究等等;在其他应用方面,有文献[11]的盲文识别技术、文献[12]的门牌号识别方法、文献[13]对嵌入式系统视频图像中的文字识别、文献[14,15]的车牌自动识别技术以及文献[16-18]的数学公式识别系统等等。
从已有工作上来看,目前还缺少完善的针对医疗检验单的文字识别方法,已有的商业OCR软件无法在复杂的医疗检验单拍照图像上得到满意的识别结果。因此,本工作给出一种针对医疗检验单拍照图像的文字识别和信息提取方法。
参考文献:
[1]Ntirogiannis K,Gatos B,Pratikakis I.Performance evaluationmethodology for historical document image binarization[J].Image Processing,IEEE Transactions on,2013,22(2):595-609.
[2]Sahu V L,Kubde B.Offline Handwritten Character RecognitionTechniques using Neural Network:A Review[J].International journal of scienceand Research(IJSR),2013,2(1):87-94.
[3]Malakar S,Halder S,Sarkar R,et al.Text line extraction fromhandwritten document pages using spiral run length smearing algorithm[C]//Communications,Devices and Intelligent Systems(CODIS),2012InternationalConference on.IEEE,2012:616-619.
[4]Gur E,Zelavsky Z.Retrieval of rashi semi-cursive handwriting viafuzzy logic[C]//Frontiers in Handwriting Recognition(ICFHR),2012InternationalConference on.IEEE,2012:354-359.
[5]Abed M A,Alasadi H A A.Simplifying Handwritten CharactersRecognition Using a Particle Swarm Optimization Approach[J].European AcademicResearch I(5)(August 2013).
[6]Patel D K,Som T,Yadav S K,et al.Handwritten Character RecognitionUsing Multiresolution Technique and Euclidean Distance Metric[J].2012.
[7]Coates A,Carpenter B,Case C,et al.Text detection and characterrecognition in scene images with unsupervised feature learning[C]//DocumentAnalysis and Recognition(ICDAR),2011 International Conference on.IEEE,2011:440-445.
[8]Dutta S,Sankaran N,Sankar K P,et al.Robust recognition of degradeddocuments using character n-grams[C]//Document Analysis Systems(DAS),201210thIAPR International Workshop on.IEEE,2012:130-134.
[9]Sumetphong C,Tangwongsan S.An optimal approach towards recognizingbroken Thai characters in OCR systems[C]//Digital Image Computing Techniquesand Applications(DICTA),2012 International Conference on.IEEE,2012:1-5.
[10]Sankaran N,Jawahar C V.Recognition of printed Devanagari textusing BLSTM Neural Network[C]//Pattern Recognition(ICPR),2012 21stInternational Conference on.IEEE,2012:322-325.
[11]AlSalman A,El-Zaart A,Al-Salman S,et al.A novel approach forBraille images segmentation[C]//Multimedia Computing and Systems(ICMCS),2012International Conference on.IEEE,2012:190-195.
[12]Rhead M,Gurney R,Ramalingam S,et al.Accuracy of automatic numberplate recognition(ANPR)and real world UK number plate problems[C]//Procs 46thIEEE Int Carnahan Conf on Security Technology.IEEE,2012.
[13]Hori O.A video text extraction method for character recognition[C]//Document Analysis and Recognition,1999.ICDAR'99.Proceedings of the FifthInternational Conference on.IEEE,1999:25-28.
[14]Kim K K,Kim K I,Kim J B,et al.Learning-based approach for licenseplate recognition[C]//Neural Networks for Signal Processing X,2000.Proceedings of the2000 IEEE Signal Processing Society Workshop.IEEE,2000,2:614-623.
[15]Anagnostopoulos C N E,Anagnostopoulos I E,Psoroulas I D,etal.License plate recognition from still images and video sequences:A survey[J].Intelligent Transportation Systems,IEEE Transactions on,2008,9(3):377-391.
[16]Hu L,Hart K,Pospesel R,et al.Baseline extraction-driven parsingof handwritten mathematical expressions[C]//Pattern Recognition(ICPR),201221st International Conference on.IEEE,2012:326-330.
[17]Hu Y,Peng L,Tang Y.On-line handwritten mathematical expressionrecognition method based on statistical and semantic analysis[C]//DocumentAnalysis Systems(DAS),2014 11th IAPR International Workshop on.IEEE,2014:171-175.
[18]Kumar P P,Agarwal A,Bhagvati C.A rule-based approach to formmathematical symbols in printed mathematical expressions[M]//Multi-disciplinary Trends in Artificial Intelligence.Springer Berlin Heidelberg,2011:181-192.
发明内容
本发明的目的是针对现有技术中的不足,提供一种医疗检验单拍照图像识别方法,解决医疗检验单拍照图像中文字倾斜、定向错误、噪音干扰、版式复杂、光照不均等多种情况下的文字识别和信息提取问题。
为实现上述目的,本发明公开了如下技术方案:
一种医疗检验单的检验项信息自动提取方法,包括如下步骤:
S1预处理:首先,将拍照得到的彩色图像分别通过灰度化和自适应二值化处理转为二值图像,并在二值图像上进行连通体搜索,得到所有的连通体信息;然后,根据连通体的宽度和高度滤除过宽或过高的连通体,并将重叠率较高的连通体合并;最后,根据每一连通体在多个方向上的识别可信度进行投票,得到医疗检验单拍照图像的正确定向结果;
S2化验结果识别和定位:首先,对每一连通体按英文和数字进行字符识别,将识别可信度较高的连通体保留,并将垂直方向重叠、水平方向距离较近的连通体合并为英文数字字符组;然后,考虑检验结果列有汉字结果的情况,对每一连通体及其可能的组合按汉字进行字符识别,将识别可信度较高的连通体或连通体组合保留,并将垂直方向重叠、水平方向距离较近的字符组合并,生成多个候选检验结果列,以数字结果数量、汉字结果数量、英文结果数量为依据从候选结果中选出可信的结果列;
S3化验项目名称识别和定位:首先,将按英文和数字识别可信度较低的连通体作为候选汉字连通体,将垂直方向重叠、水平方向距离较近的连通体或连通体组合合并为汉字字符组,再将水平方向重叠、垂直方向距离较近的连通体或连通体组合合并为候选项目名称列,并对候选项目名称列进行汉字识别;最后,根据化验项目名称关键词列表从候选项目名称列中找出匹配的项目名称识别结果,不匹配的候选项目名称做出标记,但不删除;
S4化验项目名称和化验项目结果匹配:首先,找到水平方向与化验项目名称列和化验结果列均重叠、且其顶部距离化验项目名称列和化验项目结果列顶部最近的连通体A;然后,以连通体A的上边界作为参考线,计算最顶端化验项目名称和化验结果距该参考线的Y方向距离,确定第一个化验项目名称对应的正确化验结果项,再根据第一对匹配结果的位置进行第二对结果的匹配,以此类推;最后,对于一对匹配结果,如果对应的化验项目名称是不匹配的候选项目名称,且化验结果不是数字、也不是匹配的英文关键词或汉字关键词,则认为该匹配结果无效,将位于顶端或底端的无效结果滤除。
进一步的,在所述步骤S2开始之前,为了减少混杂在化验项目名称中的英文对项目名称识别和定位所造成的干扰,将括号中的英文都滤除掉。
进一步的,所述字符识别方法为基于梯度方向直方图特征HOG的方法,HOG通过提取局部区域的梯度方向直方图作为特征。
进一步的,进行字符识别时,先将图像的检测窗口划分为小的单 元格,计算单元格内所有像素点的一维梯度或边缘方向直方图,然后将若干单元格组成大的块,在块内进行对比度归一化,通过滑动窗口密集扫描图像,获取最终的HOG特征向量。
进一步的,获取最终的HOG特征向量的具体步骤为:首先,按下述公式计算点(x,y)的梯度幅值G(x,y)和方向θ(x,y),图像的梯度图表现了异态汉字的整体轮廓和梯度幅值,
G ( x , y ) = G x ( x , y ) 2 + G y ( x , y ) 2
θ ( x , y ) = a r c t a n [ G y ( x , y ) G x ( x , y ) ]
式中,Gx(x,y),Gy(x,y)分别表示该点水平方向、垂直方向的梯度幅值,其计算方法如下式所示,
Gx(x,y)=I(x+1,y)-I(x-1,y),Gy(x,y)=I(x,y+1)-I(x,y-1)
式中,I(x+1,y)表示图像I在点(x+1,y)上的像素值,I(x-1,y)表示图像I在点(x-1,y)上的像素值,I(x,y+1)表示图像I在点(x,y+1)上的像素值,I(x,y-1)表示图像I在点(x,y-1)上的像素值;
然后,在块内基于单元格统计直方图,对于单元格内每个像素点的权值,根据其梯度幅值采用高斯加权统计到其梯度方向所属的直方图分组中,直方图分组的方向范围为0~π;
为了提高识别性能,削弱图像中光照下不均的影响,对同一块内所有单元格的特征向量进行归一化处理;
最后,通过滑动窗口密集扫描图像,其中滑动窗口移动间隔为单元格大小,将检测窗口中所有块的特征向量依次连接起来,构成HOG特征集合。
进一步的,对同一块内所有单元格的特征向量进行归一化处理时, 采用L2-Hys归一化方式,即,以0.2为上限值对L2-Hys归一化数据修剪后再次归一化,其计算公式如下:
v → v / | | v | | 2 2 + ϵ 2
其中,ν是未归一化的特征向量,ε是一个极小的常量。
本发明公开的一种医疗检验单的检验项信息自动提取方法,具有以下有益效果:
本发明采用预处理、化验结果识别和定位、化验项目名称识别和定位、化验项目名称和化验结果匹配等步骤实现了复杂医疗检验单拍照图像中的文字识别和信息提取功能,对于文字倾斜、定向错误、噪音干扰、版式复杂、光照不均等情况有较强的鲁棒性,解决了复杂医疗检验单拍照图像中文字倾斜、定向错误、噪音干扰、版式复杂、光照不均等多种情况下的文字识别和信息提取问题。本发明对多种复杂情况下的医疗检验单拍照图像进行文字识别和信息提取,准确率达到90%以上,能够满足个人医疗记录保存和检索等应用的需要。
附图说明
图1是本发明的系统流程图;
图2是预处理结果示例图;
图3是匹配结果示例图。
具体实施方式
下面结合实施例并参照附图对本发明作进一步描述。
请参见图1。
一种医疗检验单的检验项信息自动提取方法,包括如下步骤:
S1预处理:首先,将拍照得到的彩色图像分别通过灰度化和自适应二值化处理转为二值图像,并在二值图像上进行连通体搜索,得到所有的连通体信息;然后,根据连通体的宽度和高度滤除过宽或过高的连通体,并将重叠率较高的连通体合并;最后,根据每一连通体在多个方向上的识别可信度进行投票,得到医疗检验单拍照图像的正确定向结果,见图2;
S2化验结果识别和定位:首先,对每一连通体按英文和数字进行字符识别,将识别可信度较高的连通体保留,并将垂直方向重叠、水平方向距离较近的连通体合并为英文数字字符组;然后,考虑检验结果列有汉字结果的情况,对每一连通体及其可能的组合按汉字进行字符识别,将识别可信度较高的连通体或连通体组合保留,并将垂直方向重叠、水平方向距离较近的字符组合并,生成多个候选检验结果列,以数字结果数量、汉字结果数量、英文结果数量为依据从候选结果中选出可信的结果列;
S3化验项目名称识别和定位:首先,将按英文和数字识别可信度较低的连通体作为候选汉字连通体,将垂直方向重叠、水平方向距离较近的连通体或连通体组合合并为汉字字符组,再将水平方向重叠、垂直方向距离较近的连通体或连通体组合合并为候选项目名称列,并对候选项目名称列进行汉字识别;最后,根据化验项目名称关键词列表从候选项目名称列中找出匹配的项目名称识别结果,不匹配的候选 项目名称做出标记,但不删除;
S4化验项目名称和化验项目结果匹配:首先,找到水平方向与化验项目名称列和化验结果列均重叠、且其顶部距离化验项目名称列和化验项目结果列顶部最近的连通体A;然后,以连通体A的上边界作为参考线,计算最顶端化验项目名称和化验结果距该参考线的Y方向距离,确定第一个化验项目名称对应的正确化验结果项,再根据第一对匹配结果的位置进行第二对结果的匹配,以此类推;最后,对于一对匹配结果,如果对应的化验项目名称是不匹配的候选项目名称,且化验结果不是数字、也不是匹配的英文关键词或汉字关键词,则认为该匹配结果无效,将位于顶端或底端的无效结果滤除。化验项目名称和化验结果匹配结果示例图如图3所示。
作为一种具体实施例,在所述步骤S2开始之前,为了减少混杂在化验项目名称中的英文对项目名称识别和定位所造成的干扰,将括号中的英文都滤除掉。
作为一种具体实施例,所述字符识别方法为基于梯度方向直方图特征HOG(histograms of oriented gradients,简称HOG)的方法,其对光照变化、适当的倾斜和小位移具有鲁棒性。HOG特征由SIFT特征发展而来,是一种局部描述符。局部梯度或边缘方向的分布能够很好地表征目标的形状和外形。HOG通过提取局部区域的梯度方向直方图作为特征,无需考虑图像的整体信息。
进行字符识别时,先将图像的检测窗口划分为小的单元格(cell),计算单元格内所有像素点的一维梯度或边缘方向直方图,然后将若干 单元格组成大的块(block),在块内进行对比度归一化,通过滑动窗口密集扫描图像,获取最终的HOG特征向量,具体步骤为:
首先,按下述公式计算点(x,y)的梯度幅值G(x,y)和方向θ(x,y),图像的梯度图表现了异态汉字的整体轮廓和梯度幅值,
G ( x , y ) = G x ( x , y ) 2 + G y ( x , y ) 2
θ ( x , y ) = arctan [ G y ( x , y ) G x ( x , y ) ]
式中,Gx(x,y),Gy(x,y)分别表示该点水平方向、垂直方向的梯度幅值,其计算方法如下式所示,
Gx(x,y)=I(x+1,y)-I(x-1,y),Gy(x,y)=I(x,y+1)-I(x,y-1)
式中,I(x+1,y)表示图像I在点(x+1,y)上的像素值,I(x-1,y)表示图像I在点(x-1,y)上的像素值,I(x,y+1)表示图像I在点(x,y+1)上的像素值,I(x,y-1)表示图像I在点(x,y-1)上的像素值;
然后,在块内基于单元格统计直方图,对于单元格内每个像素点的权值,根据其梯度幅值采用高斯加权统计到其梯度方向所属的直方图分组(bin)中,直方图分组的方向范围为0~π;
为了提高识别性能,削弱图像中光照下不均的影响,对同一块内所有单元格的特征向量进行归一化处理:
采用L2-Hys归一化方式,即,以0.2为上限值对L2-Hys归一化数据修剪后再次归一化,其计算公式如下:
v → v / | | v | | 2 2 + ϵ 2
其中,ν是未归一化的特征向量,ε是一个极小的常量;
最后,通过滑动窗口密集扫描图像,其中滑动窗口移动间隔为单元格大小,将检测窗口中所有块的特征向量依次连接起来,构成HOG 特征集合。
本发明通过基于单字符识别的自动定向方法,使得本发明能够自动校正医疗检验单拍照图像的定向错误;通过自底向上的连通体分析的方法,使得本发明对文字倾斜、噪音干扰、版式复杂等情况具有较强的鲁棒性;通过采用梯度方向直方图特征进行文字识别,使得本发明对文字倾斜、光照不均等情况具有较强的鲁棒性;通过基于医疗单参考线的项目名称域和结果域匹配方法,使得本发明能够在倾斜下得到正确的匹配结果。
以上所述仅是本发明的优选实施方式,而非对其限制;应当指出,尽管参照上述各实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,其依然可以对上述各实施例所记载的技术方案进行修改,或对其中部分或者全部技术特征进行等同替换;而这些修改和替换,并不使相应的技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (6)

1.一种医疗检验单的检验项信息自动提取方法,其特征在于,包括如下步骤:
S1预处理:首先,将拍照得到的彩色图像分别通过灰度化和自适应二值化处理转为二值图像,并在二值图像上进行连通体搜索,得到所有的连通体信息;然后,根据连通体的宽度和高度滤除过宽或过高的连通体,并将重叠率较高的连通体合并;最后,根据每一连通体在多个方向上的识别可信度进行投票,得到医疗检验单拍照图像的正确定向结果;
S2化验结果识别和定位:首先,对每一连通体按英文和数字进行字符识别,将识别可信度较高的连通体保留,并将垂直方向重叠、水平方向距离较近的连通体合并为英文数字字符组;然后,考虑检验结果列有汉字结果的情况,对每一连通体及其可能的组合按汉字进行字符识别,将识别可信度较高的连通体或连通体组合保留,并将垂直方向重叠、水平方向距离较近的字符组合并,生成多个候选检验结果列,以数字结果数量、汉字结果数量、英文结果数量为依据从候选结果中选出可信的结果列;
S3化验项目名称识别和定位:首先,将按英文和数字识别可信度较低的连通体作为候选汉字连通体,将垂直方向重叠、水平方向距离较近的连通体或连通体组合合并为汉字字符组,再将水平方向重叠、垂直方向距离较近的连通体或连通体组合合并为候选项目名称列,并对候选项目名称列进行汉字识别;最后,根据化验项目名称关键词列表从候选项目名称列中找出匹配的项目名称识别结果,不匹配的候选项目名称做出标记,但不删除;
S4化验项目名称和化验项目结果匹配:首先,找到水平方向与化验项目名称列和化验结果列均重叠、且其顶部距离化验项目名称列和化验项目结果列顶部最近的连通体A;然后,以连通体A的上边界作为参考线,计算最顶端化验项目名称和化验结果距该参考线的Y方向距离,确定第一个化验项目名称对应的正确化验结果项,再根据第一对匹配结果的位置进行第二对结果的匹配,以此类推;最后,对于一对匹配结果,如果对应的化验项目名称是不匹配的候选项目名称,且化验结果不是数字、也不是匹配的英文关键词或汉字关键词,则认为该匹配结果无效,将位于顶端或底端的无效结果滤除。
2.根据权利要求1所述的一种医疗检验单的检验项信息自动提取方法,其特征在于,在所述步骤S2开始之前,为了减少混杂在化验项目名称中的英文对项目名称识别和定位所造成的干扰,将括号中的英文都滤除掉。
3.根据权利要求1所述的一种医疗检验单的检验项信息自动提取方法,其特征在于,所述字符识别方法为基于梯度方向直方图特征HOG的方法,HOG通过提取局部区域的梯度方向直方图作为特征。
4.根据权利要求3所述的一种医疗检验单的检验项信息自动提取方法,其特征在于,进行字符识别时,先将图像的检测窗口划分为小的单元格,计算单元格内所有像素点的一维梯度或边缘方向直方图,然后将若干单元格组成大的块,在块内进行对比度归一化,通过滑动窗口密集扫描图像,获取最终的HOG特征向量。
5.根据权利要求4所述的一种医疗检验单的检验项信息自动提取方法,其特征在于,获取最终的HOG特征向量的具体步骤为:首先,按下述公式计算点(x,y)的梯度幅值G(x,y)和方向θ(x,y),图像的梯度图表现了异态汉字的整体轮廓和梯度幅值,
G ( x , y ) = G x ( x , y ) 2 + G y ( x , y ) 2
θ ( x , y ) = a r c t a n [ G y ( x , y ) G x ( x , y ) ]
式中,Gx(x,y),Gy(x,y)分别表示该点水平方向、垂直方向的梯度幅值,其计算方法如下式所示,
Gx(x,y)=I(x+1,y)-I(x-1,y),Gy(x,y)=I(x,y+1)-I(x,y-1)
式中,I(x+1,y)表示图像I在点(x+1,y)上的像素值,I(x-1,y)表示图像I在点(x-1,y)上的像素值,I(x,y+1)表示图像I在点(x,y+1)上的像素值,I(x,y-1)表示图像I在点(x,y-1)上的像素值;
然后,在块内基于单元格统计直方图,对于单元格内每个像素点的权值,根据其梯度幅值采用高斯加权统计到其梯度方向所属的直方图分组中,直方图分组的方向范围为0~π;
为了提高识别性能,削弱图像中光照下不均的影响,对同一块内所有单元格的特征向量进行归一化处理;
最后,通过滑动窗口密集扫描图像,其中滑动窗口移动间隔为单元格大小,将检测窗口中所有块的特征向量依次连接起来,构成HOG特征集合。
6.根据权利要求5所述的一种医疗检验单的检验项信息自动提取方法,其特征在于,对同一块内所有单元格的特征向量进行归一化处理时,采用L2-Hys归一化方式,即,以0.2为上限值对L2-Hys归一化数据修剪后再次归一化,其计算公式如下:
v → v / | | v | | 2 2 + ϵ 2
其中,ν是未归一化的特征向量,ε是一个极小的常量。
CN201610684785.8A 2016-08-17 2016-08-17 一种医疗检验单的检验项信息自动提取方法 Active CN106355177B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610684785.8A CN106355177B (zh) 2016-08-17 2016-08-17 一种医疗检验单的检验项信息自动提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610684785.8A CN106355177B (zh) 2016-08-17 2016-08-17 一种医疗检验单的检验项信息自动提取方法

Publications (2)

Publication Number Publication Date
CN106355177A true CN106355177A (zh) 2017-01-25
CN106355177B CN106355177B (zh) 2019-05-10

Family

ID=57843384

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610684785.8A Active CN106355177B (zh) 2016-08-17 2016-08-17 一种医疗检验单的检验项信息自动提取方法

Country Status (1)

Country Link
CN (1) CN106355177B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106991416A (zh) * 2017-03-14 2017-07-28 浙江大学 一种基于手动拍照的化验单识别方法
CN107516004A (zh) * 2017-07-06 2017-12-26 贵阳朗玛信息技术股份有限公司 医学影像图片的识别处理方法及装置
CN109558876A (zh) * 2018-11-20 2019-04-02 浙江口碑网络技术有限公司 字符识别处理方法及装置
CN110059572A (zh) * 2019-03-22 2019-07-26 中国科学院自动化研究所 基于单字匹配的文档图像中文关键词检测方法、系统
CN110456976A (zh) * 2019-07-29 2019-11-15 腾讯科技(深圳)有限公司 检验单处理方法及装置、存储介质和电子装置
CN110957016A (zh) * 2019-11-21 2020-04-03 山东鲁能软件技术有限公司 基于健康云管理平台的体检数据智能识别系统及方法
CN111090990A (zh) * 2019-12-10 2020-05-01 中电健康云科技有限公司 一种医疗体检报告单文字识别及纠正方法
CN112733651A (zh) * 2020-12-30 2021-04-30 医渡云(北京)技术有限公司 一种医学数据识别方法、装置、存储介质及设备
CN116434266A (zh) * 2023-06-14 2023-07-14 邹城市人民医院 一种医疗检验单的数据信息自动提取分析方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004310251A (ja) * 2003-04-03 2004-11-04 Konica Minolta Medical & Graphic Inc 文字認識方法、文字認識装置および文字認識プログラム
CN102298651A (zh) * 2010-06-23 2011-12-28 株式会社锦宫事务 卡片信息管理装置
WO2014146032A2 (en) * 2013-03-15 2014-09-18 Suarez Sergio David Jr System for method for data sweeping using keywords
CN104268814A (zh) * 2014-10-11 2015-01-07 北京网秦天下科技有限公司 生成电子病历的方法和装置
CN104992173A (zh) * 2015-06-03 2015-10-21 北京好运到信息科技有限公司 用于医学报告单的符号识别方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004310251A (ja) * 2003-04-03 2004-11-04 Konica Minolta Medical & Graphic Inc 文字認識方法、文字認識装置および文字認識プログラム
CN102298651A (zh) * 2010-06-23 2011-12-28 株式会社锦宫事务 卡片信息管理装置
WO2014146032A2 (en) * 2013-03-15 2014-09-18 Suarez Sergio David Jr System for method for data sweeping using keywords
CN104268814A (zh) * 2014-10-11 2015-01-07 北京网秦天下科技有限公司 生成电子病历的方法和装置
CN104992173A (zh) * 2015-06-03 2015-10-21 北京好运到信息科技有限公司 用于医学报告单的符号识别方法及系统

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106991416A (zh) * 2017-03-14 2017-07-28 浙江大学 一种基于手动拍照的化验单识别方法
CN107516004A (zh) * 2017-07-06 2017-12-26 贵阳朗玛信息技术股份有限公司 医学影像图片的识别处理方法及装置
CN109558876A (zh) * 2018-11-20 2019-04-02 浙江口碑网络技术有限公司 字符识别处理方法及装置
CN110059572A (zh) * 2019-03-22 2019-07-26 中国科学院自动化研究所 基于单字匹配的文档图像中文关键词检测方法、系统
CN110059572B (zh) * 2019-03-22 2021-08-10 中国科学院自动化研究所 基于单字匹配的文档图像中文关键词检测方法、系统
CN110456976B (zh) * 2019-07-29 2023-07-18 腾讯科技(深圳)有限公司 检验单处理方法及装置、存储介质和电子装置
CN110456976A (zh) * 2019-07-29 2019-11-15 腾讯科技(深圳)有限公司 检验单处理方法及装置、存储介质和电子装置
CN110957016A (zh) * 2019-11-21 2020-04-03 山东鲁能软件技术有限公司 基于健康云管理平台的体检数据智能识别系统及方法
CN110957016B (zh) * 2019-11-21 2023-08-08 山东鲁能软件技术有限公司 基于健康云管理平台的体检数据智能识别系统及方法
CN111090990A (zh) * 2019-12-10 2020-05-01 中电健康云科技有限公司 一种医疗体检报告单文字识别及纠正方法
CN111090990B (zh) * 2019-12-10 2024-02-02 中电健康云科技有限公司 一种医疗体检报告单文字识别及纠正方法
CN112733651A (zh) * 2020-12-30 2021-04-30 医渡云(北京)技术有限公司 一种医学数据识别方法、装置、存储介质及设备
CN116434266A (zh) * 2023-06-14 2023-07-14 邹城市人民医院 一种医疗检验单的数据信息自动提取分析方法
CN116434266B (zh) * 2023-06-14 2023-08-18 邹城市人民医院 一种医疗检验单的数据信息自动提取分析方法

Also Published As

Publication number Publication date
CN106355177B (zh) 2019-05-10

Similar Documents

Publication Publication Date Title
CN106355177B (zh) 一种医疗检验单的检验项信息自动提取方法
Zhang et al. Text extraction from natural scene image: A survey
Gonçalves et al. Benchmark for license plate character segmentation
Zalpour et al. A new approach for oil tank detection using deep learning features with control false alarm rate in high-resolution satellite imagery
Pan et al. A robust system to detect and localize texts in natural scene images
Chen et al. Text detection and recognition in images and video frames
He et al. Beyond OCR: Multi-faceted understanding of handwritten document characteristics
Blumenstein et al. An investigation of the modified direction feature for cursive character recognition
Cao et al. Robust vehicle detection by combining deep features with exemplar classification
Slavin Using special text points in the recognition of documents
Mehrjardi et al. A survey on deep learning-based image forgery detection
Lu et al. Video text detection
Celar et al. Classification of test documents based on handwritten student ID's characteristics
Cüceloğlu et al. Detecting handwritten signatures in scanned documents
Zhang et al. Research on the text detection and extraction from complex images
Tran et al. A novel approach for text detection in images using structural features
Chen Text detection and recognition in images and video sequences
Mansouri et al. A new approach for automatic Arabic-text detection and localisation in video frames
Rais et al. Using adaptive run length smoothing algorithm for accurate text localization in images
Murthy et al. A Novel method for efficient text extraction from real time images with diversified background using haar discrete wavelet transform and k-means clustering
Islam et al. An efficient ROI detection algorithm for Bangla text extraction and recognition from natural scene images
Vishwanath et al. Multi-lingual character segmentation and recognition based on adaptive projection profiles and composite feature vectors
Wadhawan et al. Automated Recognition of Text in images: A survey
Patel et al. Gujarati Text Localization, Extraction and Binarization from Images
Alghamdi et al. Deep learning Arabic printed document knowledge extraction

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant