CN108875737B - 一种纸质处方单据中检测复选框是否勾选的方法及系统 - Google Patents

一种纸质处方单据中检测复选框是否勾选的方法及系统 Download PDF

Info

Publication number
CN108875737B
CN108875737B CN201810596611.5A CN201810596611A CN108875737B CN 108875737 B CN108875737 B CN 108875737B CN 201810596611 A CN201810596611 A CN 201810596611A CN 108875737 B CN108875737 B CN 108875737B
Authority
CN
China
Prior art keywords
document
image
check box
value
positioning template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810596611.5A
Other languages
English (en)
Other versions
CN108875737A (zh
Inventor
罗安
周聪俊
史鹏翔
许春霞
师改梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Junyi Fudun Technology Co ltd
Original Assignee
Sichuan Junyi Fudun Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Junyi Fudun Technology Co ltd filed Critical Sichuan Junyi Fudun Technology Co ltd
Priority to CN201810596611.5A priority Critical patent/CN108875737B/zh
Publication of CN108875737A publication Critical patent/CN108875737A/zh
Application granted granted Critical
Publication of CN108875737B publication Critical patent/CN108875737B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种纸质处方单据中检测复选框是否勾选的方法,属于图像处理的技术领域,主要包括以下步骤:(1)对处方单据的进行图像采集以得到正面彩色图像;(2)提取处方单据的正面彩色图像,并转换为单据灰度图像;(3)计算单据灰度图像的倾斜角度,进行倾斜校正;(4)对单据灰度图像进行版面识别;(5)对单据灰度图像进行二值化处理,得到单据二值图像;(6)建立定位模板,根据定位模板中配置的各单据特征区域与各复选框区域的相对位置,确定各复选框的初始定位范围;(7)对各复选框进行精确定位;(8)确定各复选框是否勾选,以达到提供检测效率高、识别率高和稳定可靠的单据图像复选框是否勾选的自动检测方法的目的。

Description

一种纸质处方单据中检测复选框是否勾选的方法及系统
技术领域
本发明属于图像处理的技术领域,具体而言,涉及一种纸质处方单据中检测复选框是否勾选的方法及系统。
背景技术
纸质处方单据是指由注册的执业医师和执业助理医师在诊疗活动中为患者开具的、由取得药学专业技术职务任职资格的药学专业技术人员审核、调配、核对,并作为患者用药凭证的医疗文书。处方是医生对病人用药的书面文件,是药剂人员调配药品的依据,具有法律、技术、经济责任。
纸质处方单据的某些要素单元是复选框的方式,单位或个人需要对符合项进行勾选,系统通过检测用户勾选的业务类型进行后续的处理。
银行或单位的单据自动化处理系统在对单据进行处理时,要求待处理单据的勾选框按照要求勾选。例如,按照结算业务申请书的业务类型勾选要求:要用黑色墨汁或碳素墨水或使用结算业务申请书打印机认真勾选,因为黑色笔写出的字保存时间是最长,最不易损坏的,如果待处理单据勾选框不按规定的业务类型和规范的格式勾选时,无法进行后续的处理或操作,因此,如何对单据图像复选框勾选项快速而有效的检测成了业内的一个重要研究对象。
目前,对于单据复选框勾选检测主要存在以下问题:
(1)单据复选框勾选检测一般是由营业人员通过目测的方式来完成的,这种检测方式检测效率较低,不利于单据的批量处理,且不可避免人眼目测所带来的偶然误差;
(2)不同单据的版面是不同的,勾选框在单据图像中的位置也不同,因此做复选框勾选检测需要先进行版面识别,在对各复选框进行精确定位,最后判断复选框是否勾选;
在现有技术中,已经公开了一种文档图像分类识别方法及装置,该发明中提供了现有的比较成熟的版面识别方法,能够有效改善现有文档图像分类识别技术的准确率,提高文档图像分类识别的效率。
还公开了一种紫外防伪支票真伪验证方法中,虽然提出了一种矩形框左上角定位方法,但是并未提出复选框具体的定位方法。
还在发明专利CN103488965A中提到的运单信息录入和彩色色块编码解码系统,运单信息录入和黑白色块编码解码系统中均提到了色块的定位方法,在该定位方法中并未给出若顶点定位失败时的处理方法,并不能够进行复选框框选的检测。
为了进一步减少人工收取单据的时间以及偶尔的失误,提升批量单据处理的效率,急需解决以上问题。
发明内容
为了解决现有技术存在的上述问题,本发明目的在于提供一种纸质处方单据中检测复选框是否勾选的方法及系统以达到提供检测效率高、识别率高和稳定可靠的单据图像复选框是否勾选的自动检测方法的目的。
本发明所采用的技术方案为:一种纸质处方单据中检测复选框是否勾选的方法,主要包括以下步骤:
(1)对处方单据的进行图像采集,以得到处方单据的正面彩色图像;
(2)提取处方单据的正面彩色图像,通过彩色转灰度算法将正面彩色图像转换为单据灰度图像;
(3)计算单据灰度图像的倾斜角度,对单据灰度图像进行倾斜校正;
(4)对单据灰度图像进行版面识别;
(5)对单据灰度图像进行二值化处理,得到单据二值图像D1[i,j],D1[i,j]中表示单据二值图像水平位置为i,垂直位置为j像素点处的值;
(6)建立定位模板,根据定位模板中配置的各单据特征区域与各复选框区域的相对位置,确定各复选框区域的大致位置,并确定初始定位范围;
(7)对各复选框区域内的复选框进行精确定位;
(8)确定各复选框是否勾选,主要采用以下步骤:
1)将复选框的边框二值化为0,将框内的“√”二值化为255以得到前景点数,其余背景区域二值化为0;
2)统计复选框内的前景点数,用Num表示前景点数;
3)用Area表示复选框的面积,求Num与Area之间的比例值;
4)当
Figure BDA0001691759280000021
时,表示勾选;
5)当
Figure BDA0001691759280000022
时,表示未勾选;
6)
Figure BDA0001691759280000023
Figure BDA0001691759280000024
分别将复选框的左、右、上、下外边框分别向外扩充5个像素点后得到外边框,判断外边框与复选框之间的前景点数Total,用Area2表示外边框的面积;
7)当
Figure BDA0001691759280000031
时,表示勾选;否则,表示未勾选。
进一步地,所述步骤(3)中对单据灰度图像进行倾斜校正,主要包括以下步骤:
1)对单据灰度图像进行图像缩放;
2)对缩放后的图像进行图像二值化,采用阈值二值化法处理;
3)通过cvFindContours函数提取轮廓,并通过cvDrawContours函数将轮廓画出;
4)通过cvHoughLines2函数提取直线;
5)计算每条直线的斜率;
6)对于偏水平直线,将斜率相同、相近或者相交的直线合并;对于垂直直线,合并距离相近的;
7)选择水平方向正负10度内且长度最大、角度最大的直线角度作为最终计算的倾角;
8)弧度制转换为角度值:*angle1=180/CV_PI*atan(max_alpa);通过cv::WarpAffine函数对图像做仿射变换完成倾斜校正。
进一步地,所述步骤(5)中的单据二值图像D1[i,j]生成步骤如下:
1)对于读入的单据灰度图像,I[i,j]表示水平位置为i,垂直位置为j的像素点处单据图像的灰度值;
2)遍历单据灰度图像中所有像素点,i是变量,表示窗口图像中像素点的水平位置,取值为i=1,2,......,W0;j是变量,表示窗口图像中像素点的垂直位置,取值为j=1,2,......,H0;其中,W0为单据灰度图像宽度,H0为单据灰度图像高度;
3)对于单据灰度图像的各个像素点,采用阈值分割法,将单据灰度图像中大于分割阈值的像素点置为0,小于分割阈值的像素点置为255,得到单据二值图像D1[i,j]。
进一步地,所述步骤(6)中搜索范围的确定方法如下:
令单据二值图像中第一复选框左上角的大概位置为[x00,y00],对于左上角给予一定的宽裕,水平偏移量为a,垂直偏移量为b,则单据二值图像中第一复选框左上角搜索范围依次为:左上角[x00-a,y00-b],右上角[x00+a,y00-b],左下角[x00-a,y00+b],右下角[x00+a,y00+b],其他复选框以此类推。
进一步地,所述步骤(7)中对各复选框进行精确定位的方法如下:
1)设计定位模板
所述定位模板是指用于定位各顶点,与各顶点进行卷积运算的矩阵,m表示定位模板的列值,n表示定位模板的行值,m=1,2,......,M,n=1,2,.....,N;。其中,M=2*a+1,N=2*b+1;
用T1[n,m]表示左上角定位模板第n行第m列的值,用公式表示如下:
Figure BDA0001691759280000041
用T2[n,m]表示右上角定位模板第n行第m列的值,用公式表示如下:
Figure BDA0001691759280000042
用T3[n,m]表示左下角定位模板第n行第m列的值,用公式表示如下:
Figure BDA0001691759280000043
用T4[n,m]表示右下角定位模板第n行第m列的值,用公式表示如下:
Figure BDA0001691759280000051
2)各复选框精确定位
在搜索范围内,从左上角开始,按自左向右,自上向下的顺序依次平移定位模板,每移动一次定位模板窗口,使定位模板的中心与搜索范围内的相应点重合,计算定位模板与其覆盖下图像的卷积值,如步骤1)所述,定位模板的中心是指定位模板正中间的点,对于左上角定位模板来说,其中心用
Figure BDA0001691759280000052
表示,右上角定位模板的中心为
Figure BDA0001691759280000053
左下角定位模板的中心为
Figure BDA0001691759280000054
右下角定位模板的中心为
Figure BDA0001691759280000055
单据二值图像中第一复选框左上角搜索范围内各像素点与左上角定位模板的卷积值t1[i,j]的计算方法如下:
Figure BDA0001691759280000056
其中,i=x00-a,x00-a+1,...,x00+a,j=y00-b,y00-b+1,...,y00+b;
在计算得到的单据二值图像搜索范围内各像素点的卷积值t1[i,j]中,其最大值对应的位置便为单据二值图像第一复选框左上角的位置,该位置用[x01,y01]表示;
以此类推,分别将右上角搜索范围内各像素点与右上角定位模板卷积,计算最大值对应的位置,得到第一复选框右上角的位置,用[x11,y11]表示;
将左下角搜索范围内各像素点与左下角定位模板卷积,计算最大值对应的位置,得到第一复选框左下角的位置,用[x21,y21]表示;
将右下角搜索范围内各像素点与右下角定位模板卷积,计算最大值对应的位置,得到第一复选框右下角的位置,用[x31,y31]表示。
本发明还提供了一种纸质处方单据中检测复选框是否勾选的系统,其包括:单据票据图像采集单元和单据图像复选框勾选检测单元,所述单据票据图像采集单元用于采集处方单据的正面彩色图像;所述单据票据图像采集单元与单据图像复选框勾选检测单元通信连接,将正面彩色图像传输至单据图像复选框勾选检测单元中;
所述单据图像复选框勾选检测单元用于将正面彩色图像进行处理以得到单据二值图像,并对单据二值图像中的复选框进行勾选检测,以判断处方单据是否按照指定的业务类型和规范进行勾选。
本发明的有益效果为:
1.采用本发明所公开的纸质处方单据中检测复选框是否勾选的方法,利用了原理简单,计算量小的计算方式,利用扫描处方单据以正确检测出单据图像复选框是否按照要求的业务类型和勾选方式进行勾选,无需人工操作,用于解决在批量单据自动化处理过程中因单据勾选不规范和单据业务类型选择不对导致的票据无效现象,减少人工整理单据的时间,提升了批量单据处理的效率;
2.本发明中通过建立定位模块能够确定各个复选框区域的大致位置,再对各复选框区域内的复选框进行精确定位,以实现对各个复选框是否勾选进行快速精确判断,节省了运行时间,提升了判断准确度;
3.本发明中通过采用cv::WarpAffine函数对图像做仿射变换完成倾斜校正,以实现对单据灰度图像进行倾斜校正,以提升对单据灰度图像进行二值化处理的效率,能够得到更加准确的单据二值化图像。
附图说明
图1是本发明提供的纸质处方单据中检测复选框是否勾选的方法的流程示意图;
图2是本发明提供的纸质处方单据中检测复选框是否勾选的方法中复选框内打钩的第一种示意图;
图3是本发明提供的纸质处方单据中检测复选框是否勾选的方法中复选框内打钩的第二种示意图;
图4是本发明提供的纸质处方单据中检测复选框是否勾选的方法中复选框内打钩的第三种示意图;
图5是本发明提供的纸质处方单据中检测复选框是否勾选的方法中复选框内打钩的外边框示意图;
图6是本发明提供的纸质处方单据中检测复选框是否勾选的方法中判断各复选框是否勾选的流程示意图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步阐述。
如图1-图6所示,本发明提供了一种纸质处方单据中检测复选框是否勾选的方法,主要包括以下步骤:
(1)对处方单据的进行图像采集,以得到处方单据的正面彩色图像;
(2)提取处方单据的正面彩色图像,通过彩色转灰度算法将正面彩色图像转换为单据灰度图像;其中,彩色转灰度算法采用通用的灰度化方法即可,以得到单据灰度图像。
(3)计算单据灰度图像的倾斜角度,对单据灰度图像进行倾斜校正;
在所述步骤(3)中对单据灰度图像进行倾斜校正,主要包括以下步骤:
1)对单据灰度图像进行图像缩放,图像缩放可提升对图像的检测速度;
2)对缩放后的图像进行图像二值化,由于单据灰度图像的边界为黑边,因此采用阈值二值化法处理,优选的,选择阈值为60;
3)通过cvFindContours函数提取轮廓,并通过cvDrawContours函数将轮廓画出;
4)通过cvHoughLines2函数提取直线;
5)计算每条直线的斜率,具体的:直线对X轴的倾斜角α的正切值tgα称为该直线的“斜率”,并记作k,k=tgα,倾斜角α用弧度制表示;
6)对于偏水平直线,将斜率相同、相近或者相交的直线合并;对于垂直直线,合并距离相近的;
7)选择水平方向正负10度内且长度最大、角度最大的直线角度作为最终计算的倾角;
8)弧度制转换为角度值:*angle1=180/CV_PI*atan(max_alpa);通过cv::WarpAffine函数对图像做仿射变换完成倾斜校正,其中,其中:atan()为反正切函数,max_alpa表示水平方向正负10度内且长度最大、角度最大的直线斜率,180/CV_PI*()表示弧度所对应的角度值。
(4)对单据灰度图像进行版面识别;优选的,可采用背景技术中所公开的一种文档图像分类识别方法及装置中所采用的版面识别方法;具体包括如下步骤:
A、根据文档图像特征分类信息,分别预设特征文件,存入处方单据种类特征库;
B、对输入文档图像进行偏色校正、去黑边、二值化、框线检测、以及框线颜色提取预处理;
C、提取输入文档图像中的网格特征,分别与处方单据种类特征库中特征文件的网格特征进行比较,若相似度大于预设网格特征阈值,执行步骤D;否则,淘汰所述特征文件,更新处方单据种类特征库,执行步骤D;
D、提取输入文档图像中的框线特征,分别与处方单据种类特征库中剩余的特征文件的框线特征进行比较,若相似度大于预设框线特征阈值,执行步骤E;否则,淘汰所述特征文件,更新处方单据种类特征库,执行步骤E;
D1、提取文档图像的框线颜色特征;
D2、遍历处方单据种类特征库中所有剩余的有效特征文件,将各特征文件保存的框线颜色特征与文档图像的框线颜色特征计算相似度,若相似度大于预设框线颜色特征阈值,执行步骤D3;否则,淘汰所述特征文件,更新处方单据种类特征库,并执行步骤D3;
D3、提取文档图像的框线拓扑结构特征;
D4、遍历处方单据种类特征库中所有剩余的有效特征文件,将各特征文件保存的框线拓扑特征与文档图像的框线拓扑特征计算相似度,若相似度大于预设框线拓扑特征阈值,执行步骤E;否则,淘汰所述特征文件,更新处方单据种类特征库,并执行步骤E;
E、提取输入文档图像中的标题特征,分别与处方单据种类特征库中剩余的特征文件的标题特征进行比较,若相似度大于预设标题特征阈值,执行步骤F;否则,淘汰所述特征文件,更新处方单据种类特征库,执行步骤F;
F、提取输入文档图像中的文本特征,分别与处方单据种类特征库中剩余的特征文件的文本特征进行比较,若相似度大于预设文本特征阈值,执行步骤G;否则,淘汰所述特征文件,更新处方单据种类特征库,执行步骤G;
G、输出处方单据文档分类结果,即对处方单据进行版面识别。
(5)对单据灰度图像进行二值化处理,得到单据二值图像D1[i,j],D1[i,j]中表示单据二值图像水平位置为i,垂直位置为j像素点处的值;在本实施例中,采用最大类间方差法OTSU二值化方法进行二值化。
所述步骤(5)中的单据二值图像D1[i,j]生成步骤如下:
1)对于读入的单据灰度图像,I[i,j]表示水平位置为i,垂直位置为j的像素点处单据图像的灰度值;
2)遍历单据灰度图像中所有像素点,i是变量,表示窗口图像中像素点的水平位置,取值为i=1,2,......,W0;j是变量,表示窗口图像中像素点的垂直位置,取值为j=1,2,......,H0;其中,W0为单据灰度图像宽度,H0为单据灰度图像高度;
3)对于单据灰度图像的各个像素点,采用阈值分割法,将单据灰度图像中大于分割阈值的像素点置为0,小于分割阈值的像素点置为255,得到单据二值图像D1[i,j],D1[i,j]中表示单据二值图像水平位置为i,垂直位置为j像素点处的值。
(6)建立定位模板,根据定位模板中配置的各单据特征区域与各复选框区域的相对位置,确定各复选框区域的大致位置,并确定初始定位范围;
所述步骤(6)中搜索范围的确定方法如下:
令单据二值图像中第一复选框左上角的大概位置为[x00,y00],对于左上角给予一定的宽裕,水平偏移量为a,垂直偏移量为b,则单据二值图像中第一复选框左上角搜索范围依次为:左上角[x00-a,y00-b],右上角[x00+a,y00-b],左下角[x00-a,y00+b],右下角[x00+a,y00+b],其他复选框以此类推,在本实施例中,优选的,a=20,b=20。
(7)对各复选框区域内的复选框进行精确定位;
所述步骤(7)中对各复选框进行精确定位的方法如下:
1)设计定位模板
所述定位模板是指用于定位各顶点,与各顶点进行卷积运算的矩阵,m表示定位模板的列值,n表示定位模板的行值,m=1,2,......,M,n=1,2,.....,N;其中,M=2*a+1,N=2*b+1;优选的,取M=41,N=41。
用T1[n,m]表示左上角定位模板第n行第m列的值,用公式表示如下:
Figure BDA0001691759280000101
用T2[n,m]表示右上角定位模板第n行第m列的值,用公式表示如下:
Figure BDA0001691759280000102
用T3[n,m]表示左下角定位模板第n行第m列的值,用公式表示如下:
Figure BDA0001691759280000103
用T4[n,m]表示右下角定位模板第n行第m列的值,用公式表示如下:
Figure BDA0001691759280000104
2)各复选框精确定位
在搜索范围内,从左上角开始,按自左向右,自上向下的顺序依次平移定位模板,每移动一次定位模板窗口,使定位模板的中心与搜索范围内的相应点重合,计算定位模板与其覆盖下图像的卷积值,如上述步骤1)所述,定位模板的中心是指定位模板正中间的点,对于左上角定位模板来说,其中心用
Figure BDA0001691759280000111
表示,右上角定位模板的中心为
Figure BDA0001691759280000112
左下角定位模板的中心为
Figure BDA0001691759280000113
右下角定位模板的中心为
Figure BDA0001691759280000114
以第一复选框为例,单据二值图像中第一复选框左上角搜索范围内各像素点与左上角定位模板的卷积值t1[i,j]的计算方法如下:
Figure BDA0001691759280000115
其中,i=x00-a,x00-a+1,...,x00+a,j=y00-b,y00-b+1,...,y00+b;
在计算得到的单据二值图像搜索范围内各像素点的卷积值t1[i,j]中,其最大值对应的位置便为单据二值图像第一复选框左上角的位置,该位置用[x01,y01]表示;
以此类推,分别将右上角搜索范围内各像素点与右上角定位模板卷积,计算最大值对应的位置,得到第一复选框右上角的位置,用[x11,y11]表示;
将左下角搜索范围内各像素点与左下角定位模板卷积,计算最大值对应的位置,得到第一复选框左下角的位置,用[x21,y21]表示;
将右下角搜索范围内各像素点与右下角定位模板卷积,计算最大值对应的位置,得到第一复选框右下角的位置,用[x31,y31]表示。
以此类推,采用上述方法,分别得到其他复选框的左上角、右上角、左下角、右下角的位置值。
判断4个顶点的合理性,当有单个顶点定位失败时,用其他3个顶点的位置去推算这个顶点的位置,以克服单个顶点定位失败的情形,优选的,由于复选框为矩形框,可采用其他3个顶点通过相互对称的方法得到第4个顶点的位置。
(8)确定各复选框是否勾选,而复选框为矩形框,复选框内打钩的示意图如图2-图4所表示的情形,“√”不一定完全在复选框的内部,对复选框的勾选与否主要采用以下步骤:
1)将复选框的边框二值化为0,即灰度值设置为0并作为背景,将框内的“√”二值化为255,即灰度值设置为255,以得到前景点数,其余背景区域二值化为0,即灰度值设置为0并作为背景;
2)统计复选框内的前景点数,用Num表示前景点数;
3)用Area表示复选框的面积,求Num与Area之间的比例值;
4)当
Figure BDA0001691759280000121
时,表示勾选;
5)当
Figure BDA0001691759280000122
时,表示未勾选;
6)
Figure BDA0001691759280000123
Figure BDA0001691759280000124
如图5所示,分别将复选框的左、右、上、下外边框分别向外扩充5个像素点后得到外边框,判断外边框与复选框之间的前景点数Total,用Area2表示外边框的面积;
7)当
Figure BDA0001691759280000125
时,表示勾选;否则,表示未勾选;
在实施例中,在上述步骤4)-步骤7)中的TH,优选的,TH=15。
本发明还提供了一种纸质处方单据中检测复选框是否勾选的系统,其包括:单据票据图像采集单元和单据图像复选框勾选检测单元,所述单据票据图像采集单元用于采集处方单据的正面彩色图像,优选的,可通过彩色扫描仪进行采集,对处方单据进行扫描以得到正面彩色图像;所述单据票据图像采集单元与单据图像复选框勾选检测单元通信连接,将正面彩色图像传输至单据图像复选框勾选检测单元中;
所述单据图像复选框勾选检测单元用于将正面彩色图像进行处理以得到单据二值图像,并对单据二值图像中的复选框进行勾选检测,以判断处方单据是否按照指定的业务类型和规范进行勾选。
本发明不局限于上述可选实施方式,任何人在本发明的启示下都可得出其他各种形式的产品,但不论在其形状或结构上作任何变化,凡是落入本发明权利要求界定范围内的技术方案,均落在本发明的保护范围之内。

Claims (4)

1.纸质处方单据中检测复选框是否勾选的方法,其特征在于,主要包括以下步骤:
(1)对处方单据的进行图像采集,以得到处方单据的正面彩色图像;
(2)提取处方单据的正面彩色图像,通过彩色转灰度算法将正面彩色图像转换为单据灰度图像;
(3)计算单据灰度图像的倾斜角度,对单据灰度图像进行倾斜校正;
(4)对单据灰度图像进行版面识别;
(5)对单据灰度图像进行二值化处理,得到单据二值图像D1[i,j],D1[i,j]中表示单据二值图像水平位置为i,垂直位置为j像素点处的值;
(6)建立定位模板,根据定位模板中配置的各单据特征区域与各复选框区域的相对位置,确定各复选框区域的大致位置,并确定初始定位范围;
(7)对各复选框区域内的复选框进行精确定位;
(8)确定各复选框是否勾选,主要采用以下步骤:
1)将复选框的边框二值化为0,将框内的“√”二值化为255以得到前景点数,其余背景区域二值化为0;统计复选框内的前景点数,用Num表示前景点数;
2)用Area表示复选框的面积,求Num与Area之间的比例值;
3)当
Figure FDA0003635055980000021
时,表示勾选;
4)当
Figure FDA0003635055980000022
时,表示未勾选;
5)当
Figure FDA0003635055980000023
Figure FDA0003635055980000024
时,分别将复选框的左、右、上、下外边框分别向外扩充5个像素点后得到外边框,判断外边框与复选框之间的前景点数Total,用Area2表示外边框的面积;
6)当
Figure FDA0003635055980000025
时,表示勾选;否则,表示未勾选;
所述步骤(3)中对单据灰度图像进行倾斜校正,主要包括以下步骤:
1)对单据灰度图像进行图像缩放;
2)对缩放后的图像进行图像二值化,采用阈值二值化法处理;
3)通过cvFindContours函数提取轮廓,并通过cvDrawContours函数将轮廓画出;
4)通过cvHoughLines2函数提取直线;
5)计算每条直线的斜率;
6)对于偏水平直线,将斜率相同或相近的直线合并;对于垂直直线,合并距离相近的;
7)选择水平方向正负10度内且长度最大、角度最大的直线角度作为最终计算的倾角;
8)弧度制转换为角度值:angle1=180/CV_PI*atan(max_alpa);通过cvWarpAffine函数对图像做仿射变换完成倾斜校正;其中,CV_PI的表示为圆周率PI值的实际取值,max_alpa表示长度最大且角度最大的直线角度的弧度值;
所述纸质处方单据中检测复选框是否勾选的方法所采用的系统包括:单据票据图像采集单元和单据图像复选框勾选检测单元,所述单据票据图像采集单元用于采集处方单据的正面彩色图像;所述单据票据图像采集单元与单据图像复选框勾选检测单元通信连接,将正面彩色图像传输至单据图像复选框勾选检测单元中;所述单据图像复选框勾选检测单元用于将正面彩色图像进行处理以得到单据二值图像,并对单据二值图像中的复选框进行勾选检测,以判断处方单据是否按照指定的业务类型和规范进行勾选。
2.根据权利要求1所述的纸质处方单据中检测复选框是否勾选的方法,其特征在于,所述步骤(5)中的单据二值图像D1[i,j]生成步骤如下:
1)对于读入的单据灰度图像,I[i,j]表示水平位置为i,垂直位置为j的像素点处单据图像的灰度值;
2)遍历单据灰度图像中所有像素点,i是变量,表示窗口图像中像素点的水平位置,取值为i=1,2,......,W0;j是变量,表示窗口图像中像素点的垂直位置,取值为j=1,2,......,H0;其中,W0为单据灰度图像宽度,H0为单据灰度图像高度;
3)对于单据灰度图像的各个像素点,采用阈值分割法,将单据灰度图像中大于分割阈值的像素点置为0,小于分割阈值的像素点置为255,得到单据二值图像D1[i,j]。
3.根据权利要求1所述的纸质处方单据中检测复选框是否勾选的方法,其特征在于,所述步骤(6)中搜索范围的确定方法如下:
令单据二值图像中第一复选框左上角的大概位置为[x00,y00],对于左上角给予一定的宽裕,水平偏移量为a,垂直偏移量为b,则单据二值图像中第一复选框左上角搜索范围依次为:左上角[x00-a,y00-b],右上角[x00+a,y00-b],左下角[x00-a,y00+b],右下角[x00+a,y00+b],其他复选框以此类推。
4.根据权利要求3所述的纸质处方单据中检测复选框是否勾选的方法,其特征在于,所述步骤(7)中对各复选框进行精确定位的方法如下:
1)设计定位模板
所述定位模板是指用于定位各顶点,与各顶点进行卷积运算的矩阵,m表示定位模板的列值,n表示定位模板的行值,m=1,2,......,M,n=1,2,.....,N;其中,M=2*a+1,N=2*b+1;用T1[n,m]表示左上角定位模板第n行第m列的值,用公式表示如下:
Figure FDA0003635055980000051
用T2[n,m]表示右上角定位模板第n行第m列的值,用公式表示如下:
Figure FDA0003635055980000052
用T3[n,m]表示左下角定位模板第n行第m列的值,用公式表示如下:
Figure FDA0003635055980000053
用T4[n,m]表示右下角定位模板第n行第m列的值,用公式表示如下:
Figure FDA0003635055980000054
2)各复选框精确定位
在搜索范围内,从左上角开始,按自左向右,自上向下的顺序依次平移定位模板,每移动一次定位模板窗口,使定位模板的中心与搜索范围内的相应点重合,计算定位模板与其覆盖下图像的卷积值,如步骤1)所述,定位模板的中心是指定位模板正中间的点,对于左上角定位模板来说,其中心用
Figure FDA0003635055980000061
表示,右上角定位模板的中心为
Figure FDA0003635055980000062
左下角定位模板的中心为
Figure FDA0003635055980000063
右下角定位模板的中心为
Figure FDA0003635055980000064
单据二值图像中第一复选框左上角搜索范围内各像素点与左上角定位模板的卷积值t1[i*,j*]的计算方法如下:
Figure FDA0003635055980000065
其中,i*=x00-a,x00-a+1,...,x00+a,j*=y00-b,y00-b+1,...,y00+b;在计算得到的单据二值图像搜索范围内各像素点的卷积值t1[i*,j*]中,其最大值对应的位置便为单据二值图像第一复选框左上角的位置,该位置用[x01,y01]表示;以此类推,分别将右上角搜索范围内各像素点与右上角定位模板卷积,计算最大值对应的位置,得到第一复选框右上角的位置,用[x11,y11]表示;将左下角搜索范围内各像素点与左下角定位模板卷积,计算最大值对应的位置,得到第一复选框左下角的位置,用[x21,y21]表示;将右下角搜索范围内各像素点与右下角定位模板卷积,计算最大值对应的位置,得到第一复选框右下角的位置,用[x31,y31]表示。
CN201810596611.5A 2018-06-11 2018-06-11 一种纸质处方单据中检测复选框是否勾选的方法及系统 Active CN108875737B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810596611.5A CN108875737B (zh) 2018-06-11 2018-06-11 一种纸质处方单据中检测复选框是否勾选的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810596611.5A CN108875737B (zh) 2018-06-11 2018-06-11 一种纸质处方单据中检测复选框是否勾选的方法及系统

Publications (2)

Publication Number Publication Date
CN108875737A CN108875737A (zh) 2018-11-23
CN108875737B true CN108875737B (zh) 2022-06-21

Family

ID=64337652

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810596611.5A Active CN108875737B (zh) 2018-06-11 2018-06-11 一种纸质处方单据中检测复选框是否勾选的方法及系统

Country Status (1)

Country Link
CN (1) CN108875737B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583358A (zh) * 2018-11-26 2019-04-05 广东智源信息技术有限公司 一种医疗卫生监督快速精准执法方法
CN111325182B (zh) * 2020-03-19 2023-05-30 四川骏逸富顿科技有限公司 一种基于ocr的医保报销欺诈检测方法
CN113159969A (zh) * 2021-05-17 2021-07-23 广州故新智能科技有限责任公司 一种金融长文本复核系统
CN114299274B (zh) * 2021-12-29 2022-08-09 湖北博盛数字教育服务有限公司 一种问卷调查识别方法及系统
CN116168405B (zh) * 2023-04-23 2023-08-01 杭州实在智能科技有限公司 通用型rpa复选框操作组件的构建方法及系统
CN116311327B (zh) * 2023-05-11 2023-08-08 四川骏逸富顿科技有限公司 处方图像检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592121A (zh) * 2011-12-28 2012-07-18 方正国际软件有限公司 一种ocr漏识判断方法及系统
CN103150330A (zh) * 2013-01-16 2013-06-12 中南大学 一种基于局部对象和块匹配的扫描证书图像检索方法
CN103473518A (zh) * 2013-08-20 2013-12-25 成都三泰电子实业股份有限公司 运单信息录入和黑白色块编码解码系统
CN103488965A (zh) * 2013-08-20 2014-01-01 成都三泰电子实业股份有限公司 运单信息录入和彩色色块编码解码系统
CN104881663A (zh) * 2015-05-13 2015-09-02 京北方信息技术股份有限公司 辨别复选框的选定结果的方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8649600B2 (en) * 2009-07-10 2014-02-11 Palo Alto Research Center Incorporated System and method for segmenting text lines in documents
CN103824373B (zh) * 2014-01-27 2016-06-08 深圳辰通智能股份有限公司 一种票据图像金额分类方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592121A (zh) * 2011-12-28 2012-07-18 方正国际软件有限公司 一种ocr漏识判断方法及系统
CN103150330A (zh) * 2013-01-16 2013-06-12 中南大学 一种基于局部对象和块匹配的扫描证书图像检索方法
CN103473518A (zh) * 2013-08-20 2013-12-25 成都三泰电子实业股份有限公司 运单信息录入和黑白色块编码解码系统
CN103488965A (zh) * 2013-08-20 2014-01-01 成都三泰电子实业股份有限公司 运单信息录入和彩色色块编码解码系统
CN104881663A (zh) * 2015-05-13 2015-09-02 京北方信息技术股份有限公司 辨别复选框的选定结果的方法及装置

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Performance Assessment of A Questionnaire Input Software by Computer Vision;Yong-Ren Pu et al.;《Proceedings of 2012 IEEE International Conference on Mechatronics and Automation》;20121231;第119页 *
smartFIX: A Requirements-Driven System for Document Analysis and Understanding;Andreas R. Dengel.;《DAS 2002》;20021231;第433-444页 *
基于图像处理的自动统计方法研究与软件设计;邵中;《中国优秀硕士学位论文全文数据库 信息科技辑》;20110815;第41-44页 *
复选框图形元素的图像分割方法研究;牛连强等;《小型微型计算机系统》;20060821;第27卷(第8期);第1563-1566页 *
袁善磊.问卷自动分析系统中手写符号的识别及可视化方法研究.《中国优秀硕士学位论文全文数据库 信息科技辑 》.2014, *
问卷自动分析系统中手写符号的识别及可视化方法研究;袁善磊;《中国优秀硕士学位论文全文数据库 信息科技辑 》;20141015;第10-21页 *

Also Published As

Publication number Publication date
CN108875737A (zh) 2018-11-23

Similar Documents

Publication Publication Date Title
CN108875737B (zh) 一种纸质处方单据中检测复选框是否勾选的方法及系统
CN109657665B (zh) 一种基于深度学习的发票批量自动识别系统
US5140650A (en) Computer-implemented method for automatic extraction of data from printed forms
CN111476109A (zh) 票据处理方法、票据处理装置和计算机可读存储介质
JP5500480B2 (ja) 帳票認識装置及び帳票認識方法
US6778703B1 (en) Form recognition using reference areas
CN107491730A (zh) 一种基于图像处理的化验单识别方法
JP6773400B2 (ja) 帳票認識装置、帳票認識システム、帳票認識システムのプログラム、帳票認識システムの制御方法、帳票認識システムプログラムを搭載した記録媒体
JP4694613B2 (ja) 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体
JP2015516609A (ja) 小切手紫外線防偽検証方法
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN111091124B (zh) 一种书脊文字识别方法
US20150169972A1 (en) Character data generation based on transformed imaged data to identify nutrition-related data or other types of data
CN111626292B (zh) 一种基于深度学习技术的楼宇指示标识的文字识别方法
CN113033558B (zh) 一种用于自然场景的文本检测方法及装置、存储介质
Calvo-Zaragoza et al. Avoiding staff removal stage in optical music recognition: application to scores written in white mensural notation
CN113903024A (zh) 一种手写票据数值信息识别方法、系统、介质及装置
CN113158895A (zh) 票据识别方法、装置、电子设备及存储介质
CN114332865A (zh) 一种证件ocr识别方法及系统
CN115631128A (zh) 基于圆幂定理的圆形药品数量检测方法
CN113657377B (zh) 一种机打票据图像结构化识别方法
CN113065404B (zh) 基于等宽文字片段的火车票内容检测方法与系统
CN114445843A (zh) 固定版式的卡证图像文字识别方法和装置
CN114864031A (zh) 一种基于区块链的数据治理协同方法
JP3710068B2 (ja) 健康保険証自動認識方法および装置、並びに老人医療保険証自動認識方法および装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant