CN105550633B - 区域识别方法及装置 - Google Patents

区域识别方法及装置 Download PDF

Info

Publication number
CN105550633B
CN105550633B CN201510726012.7A CN201510726012A CN105550633B CN 105550633 B CN105550633 B CN 105550633B CN 201510726012 A CN201510726012 A CN 201510726012A CN 105550633 B CN105550633 B CN 105550633B
Authority
CN
China
Prior art keywords
predetermined edge
predetermined
edge
region
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510726012.7A
Other languages
English (en)
Other versions
CN105550633A (zh
Inventor
龙飞
张涛
陈志军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201510726012.7A priority Critical patent/CN105550633B/zh
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to PCT/CN2015/099286 priority patent/WO2017071061A1/zh
Priority to JP2017547044A priority patent/JP6392467B2/ja
Priority to KR1020167005597A priority patent/KR101758580B1/ko
Priority to MX2016003318A priority patent/MX2016003318A/es
Priority to RU2016109047A priority patent/RU2633184C2/ru
Publication of CN105550633A publication Critical patent/CN105550633A/zh
Priority to US15/298,340 priority patent/US10095949B2/en
Priority to EP16195105.8A priority patent/EP3163503A1/en
Application granted granted Critical
Publication of CN105550633B publication Critical patent/CN105550633B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/758Involving statistics of pixels or of feature values, e.g. histogram matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • G06V40/173Classification, e.g. identification face re-identification, e.g. recognising unknown faces across different face tracks

Abstract

本公开揭示了一种区域识别方法及装置,属于图像处理领域。所述区域识别方法包括:通过识别证件图像中的预定边缘,预定边缘是位于证件的预定方向上的边缘;在识别出n条候选的预定边缘时,将n条候选的预定边缘中的一条候选的预定边缘确定为目标预定边缘,n≥2;根据目标预定边缘在证件图像中识别出至少一个信息区域;解决了相关技术中对于直接拍摄得到的证件图像中的某些信息区域的识别难度大和对某些信息区域的定位不准确的问题;达到了通过证件图像中的n条候选的预定边缘确定出目标预定边缘,根据目标预定边缘为基准确定出至少一个信息区域,从而对信息区域准确定位的效果。

Description

区域识别方法及装置
技术领域
本公开涉及图像处理领域,特别涉及一种区域识别方法及装置。
背景技术
身份证的自动识别技术是一种通过图像处理对身份证上的文字信息进行识别的技术。
相关技术提供了一种身份证的自动识别方法,通过身份证扫描设备按照固定的相对位置对身份证进行扫描,得到身份证的扫描图像;对扫描图像中的n个预定区域进行文字识别,得到姓名信息、性别信息、民族信息、出生日期信息、地址信息和公民身份号码信息中的至少一种。但是对于直接拍摄得到的身份证图像,仍然有较大的识别难度。
发明内容
为了解决相关技术中的问题,本公开提供一种区域识别方法及装置。所述技术方案如下:
根据本公开实施例的第一方面,提供一种区域识别方法,该方法包括:
识别证件图像中的预定边缘,预定边缘是位于证件的预定方向上的边缘;
在识别出n条候选的预定边缘时,将n条候选的预定边缘中的一条候选的预定边缘确定为目标预定边缘,n≥2;
根据目标预定边缘在证件图像中识别出至少一个信息区域。
在一个可选的实施例中,在识别出n条候选的预定边缘时,将n条候选的预定边缘中的一条候选的预定边缘确定为目标预定边缘,包括:
对n条候选的预定边缘进行排序;
使用第i条候选的预定边缘和第一相对位置关系,在证件图像中尝试识别目标信息区域,1≤i≤n;第一相对位置关系是目标预定边缘与目标信息区域之间的相对位置关系;
若成功识别出目标信息区域,则将第i条候选的预定边缘确定为目标预定边缘;
若未能识别出目标信息区域,则令i=i+1,重新执行使用第i条候选的预定边缘和第一相对位置关系,在证件图像中尝试识别目标信息区域的步骤。
在一个可选的实施例中,对n条候选的预定边缘进行排序,包括:
对于每一条候选的预定边缘,将预定边缘与处理后的证件图像中相同位置处的前景色像素点求交,得到预定边缘对应的交点数;处理后的证件图像是经过索贝尔水平滤波和二值化的图像;
按照交点数由多到少的顺序,将n条候选的预定边缘进行排序。
在一个可选的实施例中,使用第i条候选的预定边缘和第一相对位置关系,在证件图像中尝试识别目标信息区域,包括:
使用第i条候选的预定边缘和第一相对位置关系,在证件图像中截取出兴趣区域;
识别兴趣区域中是否存在符合预定特征的字符区域,预定特征是目标信息区域中的字符区域所具有的特征。
在一个可选的实施例中,识别兴趣区域中是否存在符合预定特征的字符区域,包括:
对兴趣区域进行二值化,得到二值化后的兴趣区域;
对二值化后的兴趣区域按照水平方向计算第一直方图,第一直方图包括:每行像素点的竖坐标和每行像素点中前景色像素点的累加值;
对二值化后的兴趣区域按照竖直方向计算第二直方图,第二直方图包括:每列像素点的横坐标和每列像素点中前景色像素点的累加值;
若第一直方图中前景色像素点的累加值大于第一阈值的行所组成的连续行集合的高度符合预定高度区间,且第二直方图中前景色像素点的累加值大于第二阈值的列所组成的连续列集合的个数符合预定个数,则在兴趣区域中成功识别出符合预定特征的字符区域;
若第一直方图中前景色像素点的累加值大于第一阈值的行所组成的连续行集合的高度不符合预定高度区间,或者第二直方图中前景色像素点的累加值大于第二阈值的列所组成的连续列集合的个数不符合预定个数,则在兴趣区域中未能识别出符合预定特征的字符区域。
在一个可选的实施例中,识别证件图像中的预定边缘,包括:
对证件图像进行索贝尔水平滤波和二值化,得到处理后的证件图像;
对处理后的证件图像中的预定区域进行直线检测,得到至少一条直线;
在直线为n条时,n≥2,将n条直线识别为n条候选的预定边缘。
在一个可选的实施例中,根据目标预定边缘在证件图像中确定出至少一个信息区域,包括:
根据目标预定边缘和第二相对位置关系,确定出至少一个信息区域;第二相对位置关系是目标预定边缘与信息区域之间的相对位置关系。
根据本公开实施例的第二方面,提供一种区域识别装置,该装置包括:
识别模块,被配置为识别证件图像中的预定边缘,预定边缘是位于证件的预定方向上的边缘;
确定模块,被配置为在识别出n条候选的预定边缘时,将n条候选的预定边缘中的一条候选的预定边缘确定为目标预定边缘,n≥2;
区域识别模块,被配置为根据目标预定边缘在证件图像中识别出至少一个信息区域。
在一个可选的实施例中,确定模块,包括:
第一排序子模块,被配置为对n条候选的预定边缘进行排序;
第一识别子模块,被配置为使用第i条候选的预定边缘和第一相对位置关系,在证件图像中尝试识别目标信息区域,1≤i≤n;第一相对位置关系是目标预定边缘与目标信息区域之间的相对位置关系。
第二识别子模块,被配置为在成功识别出目标信息区域时,将第i条候选的预定边缘确定为目标预定边缘;
第三识别子模块,被配置为在未能识别出目标信息区域时,令i=i+1,重新返回第一识别子模块。
在一个可选的实施例中,第一排序子模块,包括:
求交子模块,被配置为对于每一条候选的预定边缘,将预定边缘与处理后的证件图像中相同位置处的前景色像素点求交,得到预定边缘对应的交点数;处理后的证件图像是经过索贝尔水平滤波和二值化的图像;
第二排序子模块,被配置为按照交点数由多到少的顺序,将n条候选的预定边缘进行排序。
在一个可选的实施例中,第一识别子模块,包括:
截取子模块,被配置为使用第i条候选的预定边缘和第一相对位置关系,在证件图像中截取出兴趣区域;
第四识别子模块,被配置为识别兴趣区域中是否存在符合预定特征的字符区域,预定特征是目标信息区域中的字符区域所具有的特征。
在一个可选的实施例中,第四识别子模块,包括:
二值化子模块,被配置为对兴趣区域进行二值化,得到二值化后的兴趣区域;
第一计算子模块,被配置为对二值化后的兴趣区域按照水平方向计算第一直方图,第一直方图包括:每行像素点的竖坐标和每行像素点中前景色像素点的累加值;
第二计算子模块,被配置为对二值化后的兴趣区域按照竖直方向计算第二直方图,第二直方图包括:每列像素点的横坐标和每列像素点中前景色像素点的累加值;
字符识别子模块,被配置为在第一直方图中前景色像素点的累加值大于第一阈值的行所组成的连续行集合的高度符合预定高度区间,且第二直方图中前景色像素点的累加值大于第二阈值的列所组成的连续列集合的个数符合预定个数时,在兴趣区域中成功识别出符合预定特征的字符区域;
第五识别子模块,被配置为在第一直方图中前景色像素点的累加值大于第一阈值的行所组成的连续行集合的高度不符合预定高度区间,或者第二直方图中前景色像素点的累加值大于第二阈值的列所组成的连续列集合的个数不符合预定个数时,在兴趣区域中未能识别出符合预定特征的字符区域。
在一个可选的实施例中,识别模块,包括:
滤波子模块,被配置为对证件图像进行索贝尔水平滤波和二值化,得到处理后的证件图像;
检测子模块,被配置为对处理后的证件图像中的预定区域进行直线检测,得到至少一条直线;
边缘识别子模块,被配置为在直线为n条时,n≥2,将n条直线识别为n条候选的预定边缘。
在一个可选的实施例中,区域识别模块,被配置为根据目标预定边缘和第二相对位置关系,确定出至少一个信息区域;第二相对位置关系是目标预定边缘与信息区域之间的相对位置关系。
根据本公开实施例的第三方面,提供一种区域识别装置,该装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,处理器被配置为:
识别证件图像中的预定边缘,预定边缘是位于证件的预定方向上的边缘;
在识别出n条候选的预定边缘时,将n条候选的预定边缘中的一条候选的预定边缘确定为目标预定边缘,n≥2;
根据目标预定边缘在证件图像中识别出至少一个信息区域。
本公开的实施例提供的技术方案可以包括以下有益效果:
通过识别证件图像中的预定边缘,预定边缘是位于证件的预定方向上的边缘;在识别出n条候选的预定边缘时,将n条候选的预定边缘中的一条候选的预定边缘确定为目标预定边缘,n≥2;根据目标预定边缘在证件图像中识别出至少一个信息区域;解决了相关技术中对于直接拍摄得到的证件图像中的某些信息区域的识别难度大和对某些信息区域的定位不准确的问题;达到了通过证件图像中的n条候选的预定边缘确定出目标预定边缘,根据目标预定边缘为基准确定出至少一个信息区域,从而对信息区域准确定位的效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并于说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种区域识别方法的流程图;
图2是根据另一示例性实施例示出的一种区域识别方法的流程图;
图3A是根据另一示例性实施例示出的一种区域识别方法的流程图;
图3B是根据一示例性实施例示出的一种证件图像二值化的示意图;
图3C是根据一示例性实施例示出的一种证件图像中直线检测的示意图;
图3D是根据一示例性实施例示出的一种证件图像中n条候选预定边缘的示意图;
图4是根据另一示例性实施例示出的一种区域识别方法的流程图;
图5A是根据另一示例性实施例示出的一种区域识别方法的流程图;
图5B是根据一示例性实施例示出的一种确定目标信息区域的示意图;
图6A是根据另一示例性实施例示出的一种区域识别方法的流程图;
图6B是根据一示例性实施例示出的一种按照水平方向计算第一直方图的示意图;
图6C是根据一示例性实施例示出的一种按照竖直方向计算第二直方图的示意图;
图6D是根据一示例性实施例示出的一种连续行集合的示意图;
图6E是根据一示例性实施例示出的一种连续列集合的示意图;
图7是根据另一示例性实施例示出的一种区域识别方法的流程图;
图8是根据一示例性实施例示出的一种区域识别装置的框图;
图9是根据另一示例性实施例示出的一种区域识别装置的框图;
图10是根据另一示例性实施例示出的一种区域识别装置的框图;
图11A是根据一示例性实施例示出的一种区域识别装置中第一排序子模块的框图;
图11B是根据一示例性实施例示出的一种区域识别装置中第一识别子模块的框图;
图12是根据一示例性实施例示出的一种区域识别装置中第四识别子模块的框图;
图13是根据一示例性实施例示出的一种区域识别装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种区域识别方法的流程图。如图1所示,该区域识别方法包括如下步骤。
在步骤102中,识别证件图像中的预定边缘,预定边缘是位于证件的预定方向上的边缘;
证件图像是对证件直接拍摄得到的图像,比如:身份证图像、社会保障卡图像等。
预定边缘可以是证件的上边缘、下边缘、左边缘和右边缘中的任意一个。本公开实施例中均以下边缘来举例说明。对于预定边缘是上边缘、左边缘或右边缘的情况,不再赘述。
在步骤104中,在识别出n条候选的预定边缘时,将n条候选的预定边缘中的一条候选的预定边缘确定为目标预定边缘,n≥2;
由于证件图像的拍摄效果受拍摄角度、背景、光照条件和拍摄参数等因素的多重影响,在识别预定边缘时,有可能会识别出不止一条预定边缘,也即n条候选的预定边缘。
当n≥2时,将n条候选的预定边缘中的某一条预定边缘确定为证件在证件图像中的目标预定边缘。
目标预定边缘可以认为是真实的预定边缘、正确的预定边缘或者准确度较高的预定边缘。
在步骤106中,根据目标预定边缘在证件图像中识别出至少一个信息区域。
证件图像中的目标预定边缘的位置是相对固定的,根据目标预定边缘能够在证件图像中确定出证件上的各个信息区域。
信息区域是指证件图像中携带有文字信息的区域,比如:姓名信息区域、出生日期信息区域、性别区域、地址信息区域、公民身份号码信息区域、编号信息区域、颁发证件机关信息区域、有效日期信息区域等等信息区域中的至少一种。
综上所述,本公开实施例中提供的区域识别方法,通过识别证件图像中的预定边缘,预定边缘是位于证件的预定方向上的边缘;在识别出n条候选的预定边缘时,将n条候选的预定边缘中的一条预定边缘确定为目标预定边缘,n≥2;根据目标预定边缘在证件图像中识别出至少一个信息区域;解决了相关技术中对于直接拍摄得到的证件图像中的某些信息区域的识别难度大和对某些信息区域的定位不准确的问题;达到了通过证件图像中的n条候选的预定边缘确定出目标预定边缘,根据目标预定边缘为基准确定出至少一个信息区域,从而对信息区域准确定位的效果。
图2是根据另一示例性实施例示出的一种区域识别方法的流程图。如图2所示,该区域识别方法包括以下几个步骤。
在步骤202中,识别证件图像中的预定边缘,预定边缘是位于证件的预定方向上的边缘;
可选地,在拍摄证件图像时,拍摄界面中设置有用于引导拍摄的矩形区域,用户将矩形区域对准证件时,拍摄得到证件图像。
可选的,根据拍摄得到的证件图像,通过直线检测技术识别出证件图像中证件的预定边缘。
当通过直线检测技术识别出证件图像中证件的预定边缘仅有一条时,将识别出的该条预定边缘确定为证件在证件图像中的目标预定边缘,直接执行步骤212;
由于拍摄角度、背景、光照条件和拍摄参数等因素,使得直线检测技术识别出证件图像中证件的预定边缘有n条时,执行步骤204至步骤210对n条候选的预定边缘进行处理,n≥2。
在步骤204中,对n条候选的预定边缘进行排序;
在获取到n条候选的预定边缘后,根据n条候选的预定边缘是目标预定边缘的可能性由大到小进行排序。
在步骤206中,使用第i条候选的预定边缘和第一相对位置关系,在证件图像中尝试识别目标信息区域,1≤i≤n;
目标信息区域的识别难度通常较低。本步骤中假设第i条候选的预定边缘是目标预定边缘,尝试用第i条候选的预定边缘识别目标信息区域;若能够成功识别出目标信息区域,则确认第i条候选的预定边缘是目标预定边缘;若未能识别出目标信息区域,则确认第i条候选的预定边缘不是目标预定边缘。
在假定第i条候选的预定边缘是目标预定边缘,尝试用第i条候选的预定边缘识别目标信息区域的步骤中,按照步骤204中排序的预定边缘依次进行尝试。
第一相对位置关系是目标预定边缘与目标信息区域之间的相对位置关系。
在步骤208中,若成功识别出目标信息区域,则将第i条候选的预定边缘确定为目标预定边缘;
若根据第i条候选的预定边缘和第一相对位置关系成功识别出证件图像中的目标信息区域,则将第i条候选的预定边缘确认为目标预定边缘。
在步骤210中,若未能识别出目标信息区域,则令i=i+1,重新执行步骤206;
若根据第i条候选的预定边缘和第一相对位置关系未能识别出证件图像中的目标信息区域,则令i=i+1,将第i+1条候选的预定边缘确定为目标预定边缘,使用第i+1条候选的预定边缘和第一相对位置关系,在证件图像中尝试识别目标信息区域。
在步骤212中,根据目标预定边缘在证件图像中识别出至少一个信息区域。
根据步骤208中确定的目标预定边缘,根据目标预定边缘和第二相对位置关系,确定出至少一个信息区域。
比如:确定出姓名信息区域、出生日期信息区域、性别区域、地址信息区域、公民身份号码信息区域、编号信息区域、颁发证件机关信息区域、有效日期信息区域等等信息区域。
其中,第二相对位置关系是目标预定边缘与信息区域之间的相对位置关系。第一相对位置关系是第二相对位置关系的子集。
比如:第二相对位置关系可以包括:目标预定边缘与姓名信息区域之间的相对位置关系、目标预定边缘与出生日期信息区域之间的相对位置关系,或,目标预定边缘与性别区域之间的相对位置关系等等。
综上所述,本公开实施例中提供的区域识别方法,通过识别证件图像中的预定边缘,预定边缘是位于证件的预定方向上的边缘;对n条候选的预定边缘进行排序;使用第i条候选的预定边缘和第一相对位置关系,在证件图像中尝试识别目标信息区域,1≤i≤n;第一相对位置关系是目标预定边缘与目标信息区域之间的相对位置关系;根据目标预定边缘在证件图像中识别出至少一个信息区域;解决了相关技术中对于直接拍摄得到的证件图像中的某些信息区域的识别难度大和对某些信息区域的定位不准确的问题;达到了通过证件图像中的n条候选的预定边缘确定出目标预定边缘,根据目标预定边缘为基准确定出至少一个信息区域,从而对信息区域准确定位的效果。
同时,通过对n条候选的预定边缘进行排序,达到了提高确定目标预定边缘的速度和对目标预定边缘的准确定位的效果。
在基于图2实施例提供的可选实施例中,步骤202识别证件图像中的预定边缘。可替代实现为如下步骤202a至步骤202c,如图3A所示:
在步骤202a中,对证件图像进行索贝尔水平滤波和二值化,得到处理后的证件图像;
首先对证件图像进行sobel水平滤波,也即采用sobel算子沿水平方向进行滤波。然后,对滤波后的证件图像进行二值化。二值化是指将证件图像中的像素点的灰度值与预设灰度阈值比较,将证件图像中的像素点分成两部分:大于预设灰度阈值的像素群和小于预设灰度阈值的像素群,将两部分像素群在证件图像中分别呈现出黑和白两种不同的颜色,得到二值化后的证件图像,如图3B所示。其中,位于前景的一种颜色的像素点称之为前景色像素点,也即图3B的白色像素点;位于背景的一种颜色的像素点称之为背景色像素点,也即图3B中的黑色像素点。
在步骤202b中,对处理后的证件图像中的预定区域进行直线检测,得到至少一条直线;
该预定区域是位于证件的预定方向的区域。比如:该预定区域是证件的下边缘在证件图像中的区域,或者,该预定区域是证件的上边缘在证件图像中的区域等等。
在获取到索贝尔水平滤波和二值化的证件图像后,对处理后的证件图像进行直线检测,该直线检测包括直线拟合或Hough变换,从而得到至少一条直线,如图3C所示。
在步骤202c中,在直线为n条时,n≥2,将n条直线识别为n条候选的预定边缘。
当获取到的直线为n条时,将n条直线识别为n条候选的预定边缘,其中,n≥2;
比如:针对索贝尔水平滤波和二值化的证件图像,对证件的下边缘在证件图像中的区域进行直线检测,通过直线拟合或Hough变换后,得到n条候选的预定边缘,则n条候选的证件的下边缘在二值化证件图像中的区域,如图3D所示。
当获取到的直线只有一条时,将该条直线直接识别为证件图像中的目标预定边缘,直接执行步骤212。
综上所述,本实施例提供的区域识别方法,通过对证件图像进行索贝尔水平滤波和二值化,得到处理后的证件图像,对处理后的证件图像中的预定区域进行直线检测,得到至少一条直线,将n条直线识别为n条候选的预定边缘,使得在对证件图像的目标预定边缘的检测更加准确,能够提高后续信息区域识别时的准确度。
在基于图2实施例提供的可选实施例中,步骤204对n条候选的预定边缘进行排序可替代实现为如下步骤204a和步骤204b,如图4所示:
在步骤204a中,对于每一条候选的预定边缘,将预定边缘与处理后的证件图像中相同位置处的前景色像素点求交,得到预定边缘对应的交点数;
其中,处理后的证件图像是经过索贝尔水平滤波和二值化的图像;
在获取到n条候选的预定边缘后,首先对证件图像进行sobel水平滤波,也即采用sobel算子沿水平方向进行滤波。然后,对滤波后的证件图像进行二值化。
将每一条候选的预定边缘于处理后的证件图像中相同位置处的前景色像素点求交。也即求取每一条候选的预定边缘在二值化后的证件图像中相同位置处属于前景色像素点的个数。
在步骤204b中,按照交点数由多到少的顺序,将n条候选的预定边缘进行排序。
在获取到每一条候选的预定边缘对应的交点数后,按照交点数的个数有多到少的顺序进行排序,获取排序后的n条候选的预定边缘。
综上所述,本实施例提供的区域识别方法,通过对n条候选的预定边缘进行排序,提高了确定目标预定边缘的速度,有利于对目标预定边缘的准确定位,能够提高后续信息区域识别时的准确性。
在基于图2实施例提供的可选实施例中,步骤206使用第i条候选的预定边缘和第一相对位置关系,在证件图像中尝试识别目标信息区域。可替代实现为如下步骤206a和步骤206b,如图5A所示:
在步骤206a中,使用第i条候选的预定边缘和第一相对位置关系,在证件图像中截取出兴趣区域;
根据第i条候选的预定边缘和第一相对位置关系,可以确定出兴趣区域的上边缘、下边缘、左边缘和右边缘的大概位置,因此,根据确定的兴趣区域的上边缘、下边缘、左边缘和右边缘,在证件图像中截取出兴趣区域。
比如:以目标预定边缘为身份证的下边缘为例,将图3C中的第i条候选的预定边缘确定为身份证的下边缘51,根据身份证的下边缘51与公民身份号码之间的相对位置关系,确定出公民身份号码上边缘52、下边缘53、左边缘54和右边缘55的大概位置,如图5B所示。
其中,兴趣区域是指根据第i条候选的预定边缘和第一相对位置关系确定出的区域。
在步骤206b中,识别兴趣区域中是否存在符合预定特征的字符区域,预定特征是目标信息区域中的字符区域所具有的特征。
在截取出兴趣区域后,根据预定特征识别兴趣区域中是否存在符合预定特征的字符区域。
其中,预定特征是目标信息区域中的字符区域所具有的特征。比如,目标信息区域是公民身份号码区域,则该特征可以是包括有连续的18个字符区域(或称18个数字区域),相邻的两个字符区域之间的字间距较小,且每个字符区域的高度符合预定区间。
当识别出兴趣区域中存在符合预定特征的字符区域时,即成功识别出目标信息区域;
当识别出兴趣区域中不存在符合预定特征的字符区域时,即未能识别出目标信息区域。
可选地,识别兴趣区域中是否存在符合预定特征的字符区域。步骤206b可替代实现成为步骤301至步骤305,如图6A所示。
在步骤301中,对兴趣区域进行二值化,得到二值化后的兴趣区域;
以兴趣区域是公民身份号码区域为例,可选地,先对兴趣区域进行预处理。其中,预处理可以包括:去噪、滤波、提取边缘等操作;将预处理后的兴趣区域进行二值化。
在步骤302中,对二值化后的兴趣区域按照水平方向计算第一直方图,第一直方图包括:每行像素点的竖坐标和每行像素点中前景色像素点的累加值;
将二值化后的兴趣区域按照水平方向计算第一直方图,该第一直方图在竖直方向表示每行像素点的竖坐标,在水平方向表示每行像素点中前景色像素点的个数累加值。前景色像素点是指二值化后的图像中的白色像素点,如图6B所示。
在步骤303中,对二值化后的兴趣区域按照竖直方向计算第二直方图,第二直方图包括:每列像素点的横坐标和每列像素点中前景色像素点的累加值;
将二值化后的兴趣区域按照竖直方向计算第二直方图,该第二直方图在水平方向表示每列像素点的横坐标,在竖直方向表示每列像素点中前景色像素点的个数累加值,如图6C所示。
在步骤304中,若第一直方图中前景色像素点的累加值大于第一阈值的行所组成的连续行集合的高度符合预定高度区间,且第二直方图中前景色像素点的累加值大于第二阈值的列所组成的连续列集合的个数符合预定个数,则在兴趣区域中成功识别出符合预定特征的字符区域;
根据第一直方图可以获取到每一行像素点中前景色像素点的累加值,将每一行像素点中前景色像素点的累加值与第一阈值进行比较,获取第一直方图中前景色像素点的累加值大于第一阈值的行所组成的连续行集合的高度。
连续行集合是指:前景色像素点的累加值大于第一阈值的行是连续的m行,该连续的m行像素点所组成的集合,如图6D所示,对于图中的m行像素点,在位于左侧直方图中的前景色像素点的累加值均大于第一阈值。而该m行像素点在证件图像中对应公民身份号码行“0421199”,则m行像素点的高度即为连续行集合的高度。
根据第二直方图可以获取到每一列像素点中前景色像素点的累加值,将每一列像素点中前景色像素点的累加值与第二阈值进行比较,获取第二直方图中前景色像素点的累加值大于第二阈值的列所组成的连续列集合的个数。
连续列集合是指:前景色像素点的累加值大于第二阈值的列是连续的p列,该连续的p列像素点所组成的集合,如图6E所示,连续列集合为p,也即第二直方图中形成的连续白色区域。对于图中的p列像素点,在位于下侧直方图中的前景色像素点的累加值均大于第二阈值。而该p列像素点在证件图像中对应字符区域“X”。
当连续行集合的高度符合预定高度区间,且,连续列集合的个数符合预定个数时,则认为在兴趣区域中成功识别出符合预定特征的字符区域。
在步骤305中,若第一直方图中前景色像素点的累加值大于第一阈值的行所组成的连续行集合的高度不符合预定高度区间,或者第二直方图中前景色像素点的累加值大于第二阈值的列所组成的连续列集合的个数不符合预定个数,则在兴趣区域中未能识别出符合预定特征的字符区域。
当连续行集合的高度不符合预定高度区间,或者,连续列集合的个数不符合预定个数时,则认为在兴趣区域中未能识别出符合预定特征的字符区域。
综上所述,本实施例提供的区域识别方法,通过对兴趣区域进行二值化,并将二值化后的兴趣区域分别按照水平方向和竖直方向计算第一直方图和第二直方图,根据第一直方图中连续行集合的高度和第二直方图中连续列集合的个数确定是否识别出符合预定特征的字符区域,使得对字符区域的定位更加准确。
在基于图2实施例提供的可选实施例中,在根据目标预定边缘在证件图像中识别出至少一个信息区域后,可以根据如下步骤对信息区域中的字符进行识别。如图7所示:
在步骤701中,对信息区域进行二值化,得到二值化后的信息区域;
以信息区域是公民身份号码区域为例,可选地,先对信息区域进行预处理。其中,预处理可以包括:去噪、滤波、提取边缘等操作;将预处理后的信息区域进行二值化。
在步骤702中,对二值化后的信息区域按照水平方向计算第一直方图,第一直方图包括:每行像素点的竖坐标和每行像素点中前景色像素点的累加值;
在步骤703中,根据第一直方图中前景色像素点的累加值大于第一阈值的行所组成的连续行集合,识别得到a行文字区域,a为正整数;
根据第一直方图可以获取到每一行像素点中前景色像素点的累加值,将每一行像素点中前景色像素点的累加值与第一阈值进行比较,将第一直方图中前景色像素点的累加值大于第一阈值的行所组成的连续行集合,确定为文字区域所在的行。
当然,若该信息区域是地址信息区域或者其他信息区域,文字区域可能为两行或者两行以上。此时,每个连续行集合识别为一行文字区域,a个连续行集合识别为a行文字区域。
在步骤704中,对于第i行文字区域,按照竖直方向计算第二直方图,第二直方图包括:每列像素点的横坐标和每列像素点中前景色像素点的累加值,a≥i≥1,i为正整数;
对于识别出的公民身份号码行,按照竖直方向计算第二直方图,该第二直方图在水平方向表示每列像素点的横坐标,在竖直方向表示每列像素点中前景色像素点的个数累加值。
在步骤705中,根据第二直方图中前景色像素点的累加值大于第二阈值的列所组成的连续列集合,识别得到ai个字符区域。
根据第二直方图可以获取到每一列像素点中前景色像素点的累加值,将每一列像素点中前景色像素点的累加值与第二阈值进行比较,将第二直方图中前景色像素点的累加值大于第二阈值的列所组成的连续列集合,确定为字符区域所在的列。
每个连续列集合识别为一个字符区域,b个连续列集合识别为b个字符区域。在图6E中,能够识别出18个字符区域。
若文字区域有a行,则步骤701和步骤705会针对每一行文字区域执行一次,共执行a次。
对于识别出的每个字符区域,还可以通过字符识别技术,识别出该字符区域中包含的文字。文字可以是汉字、英文字母、数字或其它语种的单个字符。
综上所述,本实施例通过对信息区域二值化,并将二值化后的信息区域按照水平方向计算第一直方图,确定信息区域中a行文字区域,再通过分别对a行文字区域按照竖直方向计算第二直方图,识别出每个文字对应的字符区域,能够提高识别信息区域中字符区域的准确度。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图8是根据一示例性实施例示出的一种区域识别装置的框图,如图8所示,该区域识别装置包括但不限于:
识别模块810,被配置为识别证件图像中的预定边缘,预定边缘是位于证件的预定方向上的边缘;
证件图像是对证件直接拍摄得到的图像,比如:身份证图像、社会保障卡图像等。
预定边缘可以是证件的上边缘、下边缘、左边缘和右边缘中的任意一个。
确定模块820,被配置为在识别出n条候选的预定边缘时,将n条候选的预定边缘中的一条候选的预定边缘确定为目标预定边缘,n≥2;
当n≥2时,确定模块820将n条候选的预定边缘中的某一条预定边缘确定为证件在证件图像中的目标预定边缘。
目标预定边缘可以认为是真实的预定边缘、正确的预定边缘或者准确度较高的预定边缘。
区域识别模块830,被配置为根据目标预定边缘在证件图像中识别出至少一个信息区域。
信息区域是指证件图像中携带有文字信息的区域,比如:姓名信息区域、出生日期信息区域、性别区域、地址信息区域、公民身份号码信息区域、编号信息区域、颁发证件机关信息区域、有效日期信息区域等等信息区域中的至少一种。
综上所述,本公开实施例中提供的区域识别装置,通过识别证件图像中的预定边缘,预定边缘是位于证件的预定方向上的边缘;在识别出n条候选的预定边缘时,将n条候选的预定边缘中的一条预定边缘确定为目标预定边缘,n≥2;根据目标预定边缘在证件图像中识别出至少一个信息区域;解决了相关技术中对于直接拍摄得到的证件图像中的某些信息区域的识别难度大和对某些信息区域的定位不准确的问题;达到了通过证件图像中的n条候选的预定边缘确定出目标预定边缘,根据目标预定边缘为基准确定出至少一个信息区域,从而对信息区域准确定位的效果。
在基于图8实施例提供的可选实施例中,确定模块820可以包括如下子模块,如图9所示:
第一排序子模块821,被配置为对n条候选的预定边缘进行排序;
在获取到n条候选的预定边缘后,第一排序子模块821根据n条候选的预定边缘是目标预定边缘的可能性由大到小进行排序。
第一识别子模块822,被配置为使用第i条候选的预定边缘和第一相对位置关系,在证件图像中尝试识别目标信息区域,1≤i≤n;
假设第i条候选的预定边缘是目标预定边缘,第一识别子模块822尝试用第i条候选的预定边缘识别目标信息区域;若能够成功识别出目标信息区域,则确认第i条候选的预定边缘是目标预定边缘;若未能识别出目标信息区域,则确认第i条候选的预定边缘不是目标预定边缘。
第一识别子模块822在假定第i条候选的预定边缘是目标预定边缘,尝试用第i条候选的预定边缘识别目标信息区域中,按照第一排序子模块821中排序的预定边缘依次进行尝试。
第一相对位置关系是目标预定边缘与目标信息区域之间的相对位置关系。
第二识别子模块823,被配置为在成功识别出目标信息区域时,将第i条候选的预定边缘确定为目标预定边缘;
若根据第i条候选的预定边缘和第一相对位置关系,第一识别子模块822成功识别出证件图像中的目标信息区域,则第二识别子模块823将第i条候选的预定边缘确认为目标预定边缘。
第三识别子模块824,被配置为在未能识别出目标信息区域时,令i=i+1,重新返回第一识别子模块822,执行第一识别子模块822的功能。
可选的,区域识别模块830,还被配置为根据目标预定边缘和第二相对位置关系,确定出至少一个信息区域;第二相对位置关系是目标预定边缘与信息区域之间的相对位置关系。
综上所述,本公开实施例中提供的区域识别装置,通过识别证件图像中的预定边缘,预定边缘是位于证件的预定方向上的边缘;对n条候选的预定边缘进行排序;使用第i条候选的预定边缘和第一相对位置关系,在证件图像中尝试识别目标信息区域,1≤i≤n;第一相对位置关系是目标预定边缘与目标信息区域之间的相对位置关系;根据目标预定边缘在证件图像中识别出至少一个信息区域;解决了相关技术中对于直接拍摄得到的证件图像中的某些信息区域的识别难度大和对某些信息区域的定位不准确的问题;达到了通过证件图像中的n条候选的预定边缘确定出目标预定边缘,根据目标预定边缘为基准确定出至少一个信息区域,从而对信息区域准确定位的效果。
同时,通过对n条候选的预定边缘进行排序,达到了提高确定目标预定边缘的速度和对目标预定边缘的准确定位的效果。
在基于图9实施例提供的可选实施例中,识别模块810可以包括如下子模块,如图10所示:
滤波子模块811,被配置为对证件图像进行索贝尔水平滤波和二值化,得到处理后的证件图像;
首先滤波子模块811对证件图像进行sobel水平滤波,也即采用sobel算子沿水平方向进行滤波。然后,对滤波后的证件图像进行二值化。
二值化是指将证件图像中的像素点的灰度值与预设灰度阈值比较,将证件图像中的像素点分成两部分:大于预设灰度阈值的像素群和小于预设灰度阈值的像素群,将两部分像素群在证件图像中分别呈现出黑和白两种不同的颜色,得到二值化后的证件图像。
检测子模块812,被配置为对处理后的证件图像中的预定区域进行直线检测,得到至少一条直线;
该预定区域是位于证件的预定方向的区域。
获取滤波子模块811处理后的证件图像,检测子模块812对处理后的证件图像进行直线检测,该直线检测包括直线拟合或Hough变换,从而得到至少一条直线。
边缘识别子模块813,被配置为在直线为n条时,n≥2,将n条直线识别为n条候选的预定边缘。
当获取到的直线为n条时,边缘识别子模块813将n条直线识别为n条候选的预定边缘,其中,n≥2;
当获取到的直线只有一条时,将该条直线直接识别为证件图像中的目标预定边缘,直接执行区域识别模块830的功能。
综上所述,本实施例提供的区域识别装置,通过对证件图像进行索贝尔水平滤波和二值化,得到处理后的证件图像,对处理后的证件图像中的预定区域进行直线检测,得到至少一条直线,将n条直线识别为n条候选的预定边缘,使得在对证件图像的目标预定边缘的检测更加准确,能够提高后续信息区域识别时的准确度。
在基于图9实施例提供的可选实施例中,第一排序子模块821可以包括如下子模块,如图11A所示:
求交子模块1110,被配置为对于每一条候选的预定边缘,将预定边缘与处理后的证件图像中相同位置处的前景色像素点求交,得到预定边缘对应的交点数;
其中,处理后的证件图像是经过滤波子模块811处理后的图像;
在边缘识别子模块813获取到n条候选的预定边缘后,首先对证件图像进行sobel水平滤波,也即采用sobel算子沿水平方向进行滤波。然后,对滤波后的证件图像进行二值化。
求交子模块1110将每一条候选的预定边缘于处理后的证件图像中相同位置处的前景色像素点求交。也即求取每一条候选的预定边缘在二值化后的证件图像中相同位置处属于前景色像素点的个数。
第二排序子模块1120,被配置为按照交点数由多到少的顺序,将n条候选的预定边缘进行排序。
在求交子模块1110获取到每一条候选的预定边缘对应的交点数后,第二排序子模块1120按照交点数的个数有多到少的顺序进行排序,获取排序后的n条候选的预定边缘。
综上所述,本实施例提供的区域识别装置,通过对n条候选的预定边缘进行排序,提高了确定目标预定边缘的速度,有利于对目标预定边缘的准确定位,能够提高后续信息区域识别时的准确性。
在基于图9实施例提供的可选实施例中,第一识别子模块822可以包括如下子模块,如图11B所示:
截取子模块1130,被配置为使用第i条候选的预定边缘和第一相对位置关系,在证件图像中截取出兴趣区域;
根据第i条候选的预定边缘和第一相对位置关系,可以确定出兴趣区域的上边缘、下边缘、左边缘和右边缘的大概位置,因此,截取子模块1130根据确定的兴趣区域的上边缘、下边缘、左边缘和右边缘,在证件图像中截取出兴趣区域。
其中,兴趣区域是指根据第i条候选的预定边缘和第一相对位置关系确定出的区域。
第四识别子模块1140,被配置为识别兴趣区域中是否存在符合预定特征的字符区域,预定特征是目标信息区域中的字符区域所具有的特征。
在截取子模块1130截取出兴趣区域后,第四识别子模块1140根据预定特征识别兴趣区域中是否存在符合预定特征的字符区域。
其中,预定特征是目标信息区域中的字符区域所具有的特征。
综上所述,本实施例提供的区域识别装置,通过使用第i条候选的预定边缘和第一相对位置关系,在证件图像中截取出兴趣区域,提高了确定目标信息区域的速度,有利于对目标信息区域的准确定位,能够提高后续信息区域识别时的准确性。
在基于图11B实施例提供的可选实施例中,第四识别子模块1140可以包括如下子模块,如图12所示:
二值化子模块1141,被配置为对兴趣区域进行二值化,得到二值化后的兴趣区域;
以兴趣区域是公民身份号码区域为例,可选地,二值化子模块1141先对兴趣区域进行预处理。其中,预处理可以包括:去噪、滤波、提取边缘等操作;将预处理后的兴趣区域进行二值化。
第一计算子模块1142,被配置为对二值化后的兴趣区域按照水平方向计算第一直方图,第一直方图包括:每行像素点的竖坐标和每行像素点中前景色像素点的累加值;
第一计算子模块1142将二值化子模块1141处理后的兴趣区域按照水平方向计算第一直方图,该第一直方图在竖直方向表示每行像素点的竖坐标,在水平方向表示每行像素点中前景色像素点的个数累加值。
第二计算子模块1143,被配置为对二值化后的兴趣区域按照竖直方向计算第二直方图,第二直方图包括:每列像素点的横坐标和每列像素点中前景色像素点的累加值;
第二计算子模块1143将二值化子模块1141处理后的兴趣区域按照竖直方向计算第二直方图,该第二直方图在水平方向表示每列像素点的横坐标,在竖直方向表示每列像素点中前景色像素点的个数累加值。
字符识别子模块1144,被配置为在第一直方图中前景色像素点的累加值大于第一阈值的行所组成的连续行集合的高度符合预定高度区间,且第二直方图中前景色像素点的累加值大于第二阈值的列所组成的连续列集合的个数符合预定个数时,在兴趣区域中成功识别出符合预定特征的字符区域;
根据第一直方图可以获取到每一行像素点中前景色像素点的累加值,字符识别子模块1144将每一行像素点中前景色像素点的累加值与第一阈值进行比较,获取第一直方图中前景色像素点的累加值大于第一阈值的行所组成的连续行集合的高度。
连续行集合是指:前景色像素点的累加值大于第一阈值的行是连续的m行,该连续的m行像素点所组成的集合。
根据第二直方图可以获取到每一列像素点中前景色像素点的累加值,字符识别子模块1144将每一列像素点中前景色像素点的累加值与第二阈值进行比较,获取第二直方图中前景色像素点的累加值大于第二阈值的列所组成的连续列集合的个数。
连续列集合是指:前景色像素点的累加值大于第二阈值的列是连续的p列,该连续的p列像素点所组成的集合。
第五识别子模块1145,被配置为在第一直方图中前景色像素点的累加值大于第一阈值的行所组成的连续行集合的高度不符合预定高度区间,或者第二直方图中前景色像素点的累加值大于第二阈值的列所组成的连续列集合的个数不符合预定个数时,在兴趣区域中未能识别出符合预定特征的字符区域。
当连续行集合的高度不符合预定高度区间,或者,连续列集合的个数不符合预定个数时,则第五识别子模块1145认为在兴趣区域中未能识别出符合预定特征的字符区域。
综上所述,本实施例提供的区域识别装置,通过对兴趣区域进行二值化,并将二值化后的兴趣区域分别按照水平方向和竖直方向计算第一直方图和第二直方图,根据第一直方图中连续行集合的高度和第二直方图中连续列集合的个数确定是否识别出符合预定特征的字符区域,使得对字符区域的定位更加准确。
本公开一示例性实施例提供了一种区域识别装置,能够实现本公开提供的区域识别方法,该区域识别装置包括:处理器、用于存储处理器可执行指令的存储器;
其中,处理器被配置为:
识别证件图像中的预定边缘,预定边缘是位于证件的预定方向上的边缘;
在识别出n条候选的预定边缘时,将n条候选的预定边缘中的一条候选的预定边缘确定为目标预定边缘,n≥2;
根据目标预定边缘在证件图像中识别出至少一个信息区域。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图13是根据一示例性实施例示出的一种用与区域识别方法的装置的框图。例如,装置1300可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图13,装置1300可以包括以下一个或多个组件:处理组件1302,存储器1304,电源组件1306,多媒体组件1308,音频组件1310,输入/输出(I/O)接口1312,传感器组件1314,以及通信组件1316。
处理组件1302通常控制装置1300的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件1302可以包括一个或多个处理器1318来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1302可以包括一个或多个模块,便于处理组件1302和其他组件之间的交互。例如,处理组件1302可以包括多媒体模块,以方便多媒体组件1308和处理组件1302之间的交互。
存储器1304被配置为存储各种类型的数据以支持在装置1300的操作。这些数据的示例包括用于在装置1300上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1304可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件1306为装置1300的各种组件提供电力。电源组件1306可以包括电源管理系统,一个或多个电源,及其他与为装置1300生成、管理和分配电力相关联的组件。
多媒体组件1308包括在装置1300和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1308包括一个前置摄像头和/或后置摄像头。当装置1300处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件1310被配置为输出和/或输入音频信号。例如,音频组件1310包括一个麦克风(MIC),当装置1300处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1304或经由通信组件1316发送。在一些实施例中,音频组件1310还包括一个扬声器,用于输出音频信号。
I/O接口1312为处理组件1302和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1314包括一个或多个传感器,用于为装置1300提供各个方面的状态评估。例如,传感器组件1314可以检测到装置1300的打开/关闭状态,组件的相对定位,例如组件为装置1300的显示器和小键盘,传感器组件1314还可以检测装置1300或装置1300一个组件的位置改变,用户与装置1300接触的存在或不存在,装置1300方位或加速/减速和装置1300的温度变化。传感器组件1314可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1314还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1314还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件1316被配置为便于装置1300和其他设备之间有线或无线方式的通信。装置1300可以接入基于通信标准的无线网络,如Wi-Fi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件1316经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件1316还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IRDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置1300可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述区域识别方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1304,上述指令可由装置1300的处理器1318执行以完成上述区域识别方法。例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (13)

1.一种区域识别方法,其特征在于,所述方法包括:
识别证件图像中的预定边缘,所述预定边缘是位于所述证件的预定方向上的边缘;
在识别出n条候选的所述预定边缘时,对n条候选的所述预定边缘进行排序,n≥2;
使用第i条候选的所述预定边缘和第一相对位置关系,在所述证件图像中尝试识别目标信息区域,1≤i≤n,所述第一相对位置关系是目标预定边缘与所述目标信息区域之间的相对位置关系;
若成功识别出所述目标信息区域,则将所述第i条候选的所述预定边缘确定为所述目标预定边缘;若未能识别出所述目标信息区域,则令i=i+1,重新执行所述使用第i条候选的所述预定边缘和第一相对位置关系,在所述证件图像中尝试识别目标信息区域的步骤;
根据所述目标预定边缘在所述证件图像中识别出至少一个信息区域。
2.根据权利要求1所述的方法,其特征在于,所述对n条候选的所述预定边缘进行排序,包括:
对于每一条候选的所述预定边缘,将所述预定边缘与处理后的所述证件图像中相同位置处的前景色像素点求交,得到所述预定边缘对应的交点数;所述处理后的所述证件图像是经过索贝尔水平滤波和二值化的图像;
按照所述交点数由多到少的顺序,将n条候选的所述预定边缘进行排序。
3.根据权利要求1所述的方法,其特征在于,所述使用第i条候选的所述预定边缘和第一相对位置关系,在所述证件图像中尝试识别目标信息区域,包括:
使用第i条候选的所述预定边缘和所述第一相对位置关系,在所述证件图像中截取出兴趣区域;
识别所述兴趣区域中是否存在符合预定特征的字符区域,所述预定特征是所述目标信息区域中的字符区域所具有的特征。
4.根据权利要求3所述的方法,其特征在于,所述识别所述兴趣区域中是否存在符合预定特征的字符区域,包括:
对所述兴趣区域进行二值化,得到二值化后的兴趣区域;
对所述二值化后的兴趣区域按照水平方向计算第一直方图,所述第一直方图包括:每行像素点的竖坐标和所述每行像素点中前景色像素点的累加值;
对所述二值化后的兴趣区域按照竖直方向计算第二直方图,所述第二直方图包括:每列像素点的横坐标和所述每列像素点中前景色像素点的累加值;
若所述第一直方图中前景色像素点的累加值大于第一阈值的行所组成的连续行集合的高度符合预定高度区间,且所述第二直方图中前景色像素点的累加值大于第二阈值的列所组成的连续列集合的个数符合预定个数,则在所述兴趣区域中成功识别出符合所述预定特征的字符区域;
若所述第一直方图中前景色像素点的累加值大于第一阈值的行所组成的连续行集合的高度不符合预定高度区间,或者所述第二直方图中前景色像素点的累加值大于第二阈值的列所组成的连续列集合的个数不符合预定个数,则在所述兴趣区域中未能识别出符合所述预定特征的字符区域。
5.根据权利要求1至4任一所述的方法,其特征在于,所述识别证件图像中的预定边缘,包括:
对所述证件图像进行索贝尔水平滤波和二值化,得到处理后的所述证件图像;
对所述处理后的所述证件图像中的预定区域进行直线检测,得到至少一条直线;
在所述直线为n条时,n≥2,将所述n条直线识别为n条候选的所述预定边缘。
6.根据权利要求1至4任一所述的方法,其特征在于,所述根据所述目标预定边缘在所述证件图像中确定出至少一个信息区域,包括:
根据所述目标预定边缘和第二相对位置关系,确定出至少一个信息区域;所述第二相对位置关系是所述目标预定边缘与所述信息区域之间的相对位置关系。
7.一种区域识别装置,其特征在于,所述装置包括:
识别模块,被配置为识别证件图像中的预定边缘,所述预定边缘是位于所述证件的预定方向上的边缘;
确定模块,被配置为在识别出n条候选的所述预定边缘时,将n条候选的所述预定边缘中的一条候选的所述预定边缘确定为目标预定边缘,n≥2;
区域识别模块,被配置为根据所述目标预定边缘在所述证件图像中识别出至少一个信息区域;
其中,所述确定模块,包括:
第一排序子模块,被配置为对n条候选的所述预定边缘进行排序;
第一识别子模块,被配置为使用第i条候选的所述预定边缘和第一相对位置关系,在所述证件图像中尝试识别目标信息区域,1≤i≤n;所述第一相对位置关系是所述目标预定边缘与所述目标信息区域之间的相对位置关系;
第二识别子模块,被配置为在成功识别出所述目标信息区域时,将所述第i条候选的所述预定边缘确定为所述目标预定边缘;
第三识别子模块,被配置为在未能识别出所述目标信息区域时,令i=i+1,重新返回第一识别子模块。
8.根据权利要求7所述的装置,其特征在于,所述第一排序子模块,包括:
求交子模块,被配置为对于每一条候选的所述预定边缘,将所述预定边缘与处理后的所述证件图像中相同位置处的前景色像素点求交,得到所述预定边缘对应的交点数;所述处理后的所述证件图像是经过索贝尔水平滤波和二值化的图像;
第二排序子模块,被配置为按照所述交点数由多到少的顺序,将n条候选的所述预定边缘进行排序。
9.根据权利要求7所述的装置,其特征在于,所述第一识别子模块,包括:
截取子模块,被配置为使用第i条候选的所述预定边缘和所述第一相对位置关系,在所述证件图像中截取出兴趣区域;
第四识别子模块,被配置为识别所述兴趣区域中是否存在符合预定特征的字符区域,所述预定特征是所述目标信息区域中的字符区域所具有的特征。
10.根据权利要求9所述的装置,其特征在于,所述第四识别子模块,包括:
二值化子模块,被配置为对所述兴趣区域进行二值化,得到二值化后的兴趣区域;
第一计算子模块,被配置为对所述二值化后的兴趣区域按照水平方向计算第一直方图,所述第一直方图包括:每行像素点的竖坐标和所述每行像素点中前景色像素点的累加值;
第二计算子模块,被配置为对所述二值化后的兴趣区域按照竖直方向计算第二直方图,所述第二直方图包括:每列像素点的横坐标和所述每列像素点中前景色像素点的累加值;
字符识别子模块,被配置为在所述第一直方图中前景色像素点的累加值大于第一阈值的行所组成的连续行集合的高度符合预定高度区间,且所述第二直方图中前景色像素点的累加值大于第二阈值的列所组成的连续列集合的个数符合预定个数时,在所述兴趣区域中成功识别出符合所述预定特征的字符区域;
第五识别子模块,被配置为在所述第一直方图中前景色像素点的累加值大于第一阈值的行所组成的连续行集合的高度不符合预定高度区间,或者所述第二直方图中前景色像素点的累加值大于第二阈值的列所组成的连续列集合的个数不符合预定个数时,在所述兴趣区域中未能识别出符合所述预定特征的字符区域。
11.根据权利要求7至10任一所述的装置,其特征在于,所述识别模块,包括:
滤波子模块,被配置为对所述证件图像进行索贝尔水平滤波和二值化,得到处理后的所述证件图像;
检测子模块,被配置为对所述处理后的所述证件图像中的预定区域进行直线检测,得到至少一条直线;
边缘识别子模块,被配置为在所述直线为n条时,n≥2,将所述n条直线识别为n条候选的所述预定边缘。
12.根据权利要求7至10任一所述的装置,其特征在于,
所述区域识别模块,被配置为根据所述目标预定边缘和第二相对位置关系,确定出至少一个信息区域;所述第二相对位置关系是所述目标预定边缘与所述信息区域之间的相对位置关系。
13.一种区域识别装置,其特征在于,所述装置包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为:
识别证件图像中的预定边缘,所述预定边缘是位于所述证件的预定方向上的边缘;
在识别出n条候选的所述预定边缘时,对n条候选的所述预定边缘进行排序,n≥2;
使用第i条候选的所述预定边缘和第一相对位置关系,在所述证件图像中尝试识别目标信息区域,1≤i≤n,所述第一相对位置关系是目标预定边缘与所述目标信息区域之间的相对位置关系;
若成功识别出所述目标信息区域,则将所述第i条候选的所述预定边缘确定为所述目标预定边缘;若未能识别出所述目标信息区域,则令i=i+1,重新执行所述使用第i条候选的所述预定边缘和第一相对位置关系,在所述证件图像中尝试识别目标信息区域的步骤;
根据所述目标预定边缘在所述证件图像中识别出至少一个信息区域。
CN201510726012.7A 2015-10-30 2015-10-30 区域识别方法及装置 Active CN105550633B (zh)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN201510726012.7A CN105550633B (zh) 2015-10-30 2015-10-30 区域识别方法及装置
JP2017547044A JP6392467B2 (ja) 2015-10-30 2015-12-28 領域識別方法及び装置
KR1020167005597A KR101758580B1 (ko) 2015-10-30 2015-12-28 영역 인식 방법 및 장치
MX2016003318A MX2016003318A (es) 2015-10-30 2015-12-28 Metodo y aparato para identificacion de area.
PCT/CN2015/099286 WO2017071061A1 (zh) 2015-10-30 2015-12-28 区域识别方法及装置
RU2016109047A RU2633184C2 (ru) 2015-10-30 2015-12-28 Способ и устройство для идентификации области
US15/298,340 US10095949B2 (en) 2015-10-30 2016-10-20 Method, apparatus, and computer-readable storage medium for area identification
EP16195105.8A EP3163503A1 (en) 2015-10-30 2016-10-21 Method and apparatus for area indentification

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510726012.7A CN105550633B (zh) 2015-10-30 2015-10-30 区域识别方法及装置

Publications (2)

Publication Number Publication Date
CN105550633A CN105550633A (zh) 2016-05-04
CN105550633B true CN105550633B (zh) 2018-12-11

Family

ID=55829816

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510726012.7A Active CN105550633B (zh) 2015-10-30 2015-10-30 区域识别方法及装置

Country Status (8)

Country Link
US (1) US10095949B2 (zh)
EP (1) EP3163503A1 (zh)
JP (1) JP6392467B2 (zh)
KR (1) KR101758580B1 (zh)
CN (1) CN105550633B (zh)
MX (1) MX2016003318A (zh)
RU (1) RU2633184C2 (zh)
WO (1) WO2017071061A1 (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106710372A (zh) * 2017-01-11 2017-05-24 成都市极米科技有限公司 拼音卡片识别方法、装置以及终端设备
CN107358150B (zh) * 2017-06-01 2020-08-18 深圳赛飞百步印社科技有限公司 物体边框识别方法、装置和高拍仪
CN109559344B (zh) * 2017-09-26 2023-10-13 腾讯科技(上海)有限公司 边框检测方法、装置及存储介质
US10740644B2 (en) * 2018-02-27 2020-08-11 Intuit Inc. Method and system for background removal from documents
KR102063036B1 (ko) * 2018-04-19 2020-01-07 한밭대학교 산학협력단 딥러닝과 문자인식으로 구현한 시각주의 모델 기반의 문서 종류 자동 분류 장치 및 방법
US11881043B2 (en) * 2018-07-06 2024-01-23 Rakuten Group, Inc. Image processing system, image processing method, and program
JP7018372B2 (ja) * 2018-08-30 2022-02-10 株式会社Pfu 画像処理装置及び画像処理方法
US10331966B1 (en) * 2018-10-19 2019-06-25 Capital One Services, Llc Image processing to detect a rectangular object
CN111325197B (zh) * 2018-11-29 2023-10-31 北京搜狗科技发展有限公司 数据处理方法和装置、用于数据处理的装置
JP2022534658A (ja) * 2019-05-13 2022-08-03 プリスマーデ ラボ ゲーエムベーハー 導電性セキュリティ特徴を検証するための装置および方法ならびに導電性セキュリティ特徴のための検証装置
CN110399872B (zh) * 2019-06-20 2023-04-28 创新先进技术有限公司 图像处理方法以及装置
CN110738204B (zh) * 2019-09-18 2023-07-25 平安科技(深圳)有限公司 一种证件区域定位的方法及装置
CN111260631B (zh) * 2020-01-16 2023-05-05 成都地铁运营有限公司 一种高效刚性接触线结构光光条提取方法
CN111724346A (zh) * 2020-05-21 2020-09-29 北京配天技术有限公司 直线边缘检测方法、机器人及存储装置
CN113835582B (zh) * 2021-09-27 2024-03-15 青岛海信移动通信技术有限公司 一种终端设备、信息显示方法和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488984A (zh) * 2013-10-11 2014-01-01 从兴技术有限公司 基于智能移动设备的二代身份证识别方法及装置
CN104408450A (zh) * 2014-11-21 2015-03-11 深圳天源迪科信息技术股份有限公司 身份证识别方法、装置及系统
CN104573616A (zh) * 2013-10-29 2015-04-29 腾讯科技(深圳)有限公司 一种信息识别方法、相关装置及系统

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08161423A (ja) * 1994-12-06 1996-06-21 Dainippon Printing Co Ltd 照明装置および文字読取装置
DE19958553A1 (de) * 1999-12-04 2001-06-07 Luratech Ges Fuer Luft Und Rau Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
JP3823782B2 (ja) * 2001-08-31 2006-09-20 日産自動車株式会社 先行車両認識装置
KR100608443B1 (ko) 2004-06-30 2006-08-02 노틸러스효성 주식회사 형태복원을 통한 지로인식방법
RU2309456C2 (ru) * 2005-12-08 2007-10-27 "Аби Софтвер Лтд." Способ распознавания текстовой информации из векторно-растрового изображения
EP2143041A4 (en) * 2007-05-01 2011-05-25 Compulink Man Ct Inc PHOTODOCUMENTEGMENTATION METHOD AND METHOD
KR101291195B1 (ko) 2007-11-22 2013-07-31 삼성전자주식회사 문자인식장치 및 방법
CN101751568B (zh) * 2008-12-12 2012-07-18 汉王科技股份有限公司 证件号码定位和识别方法
US8345106B2 (en) * 2009-09-23 2013-01-01 Microsoft Corporation Camera-based scanning
US9639949B2 (en) * 2010-03-15 2017-05-02 Analog Devices, Inc. Edge orientation for second derivative edge detection methods
JP5742399B2 (ja) * 2011-04-06 2015-07-01 富士ゼロックス株式会社 画像処理装置及びプログラム
CN102693421B (zh) * 2012-05-31 2013-12-04 东南大学 基于sift 特征包的牛眼虹膜图像识别方法
CN103577817B (zh) 2012-07-24 2017-03-01 阿里巴巴集团控股有限公司 表单识别方法与装置
CN102982160B (zh) 2012-12-05 2016-04-20 上海合合信息科技发展有限公司 方便电子化的专业笔记本及其电子化文档的自动分类方法
CN108921897B (zh) * 2013-06-03 2021-06-01 支付宝(中国)网络技术有限公司 定位卡片区域的方法和设备
JP6161484B2 (ja) * 2013-09-19 2017-07-12 株式会社Pfu 画像処理装置、画像処理方法及びコンピュータプログラム
KR101663790B1 (ko) 2014-04-11 2016-10-10 (주) 엠티콤 얼굴인식장치 및 그 동작 방법
CN104268864B (zh) * 2014-09-18 2017-04-12 小米科技有限责任公司 卡片边缘提取方法和装置
CN105528600A (zh) 2015-10-30 2016-04-27 小米科技有限责任公司 区域识别方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488984A (zh) * 2013-10-11 2014-01-01 从兴技术有限公司 基于智能移动设备的二代身份证识别方法及装置
CN104573616A (zh) * 2013-10-29 2015-04-29 腾讯科技(深圳)有限公司 一种信息识别方法、相关装置及系统
CN104408450A (zh) * 2014-11-21 2015-03-11 深圳天源迪科信息技术股份有限公司 身份证识别方法、装置及系统

Also Published As

Publication number Publication date
CN105550633A (zh) 2016-05-04
KR101758580B1 (ko) 2017-07-14
KR20170061633A (ko) 2017-06-05
WO2017071061A1 (zh) 2017-05-04
JP2018500703A (ja) 2018-01-11
JP6392467B2 (ja) 2018-09-19
RU2633184C2 (ru) 2017-10-11
RU2016109047A (ru) 2017-09-19
US20170124419A1 (en) 2017-05-04
MX2016003318A (es) 2018-06-22
US10095949B2 (en) 2018-10-09
EP3163503A1 (en) 2017-05-03

Similar Documents

Publication Publication Date Title
CN105550633B (zh) 区域识别方法及装置
JP6392468B2 (ja) 領域認識方法及び装置
CN105426818B (zh) 区域提取方法及装置
KR101864759B1 (ko) 영역 인식 방법 및 장치
KR101782633B1 (ko) 영역 인식 방법 및 장치
CN105528607B (zh) 区域提取方法、模型训练方法及装置
CN107977659B (zh) 一种文字识别方法、装置及电子设备
CN106296665B (zh) 卡片图像模糊检测方法和装置
CN105894042B (zh) 检测证件图像遮挡的方法和装置
CN110286813A (zh) 图标位置确定方法和装置
CN112784858B (zh) 一种图像数据的处理方法、装置及电子设备
CN113869306A (zh) 一种文本定位方法、装置及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant