CN107330433A - 图像处理方法和装置 - Google Patents
图像处理方法和装置 Download PDFInfo
- Publication number
- CN107330433A CN107330433A CN201710348659.XA CN201710348659A CN107330433A CN 107330433 A CN107330433 A CN 107330433A CN 201710348659 A CN201710348659 A CN 201710348659A CN 107330433 A CN107330433 A CN 107330433A
- Authority
- CN
- China
- Prior art keywords
- mrow
- image
- pixel
- certificate
- gray
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Character Input (AREA)
- Image Processing (AREA)
Abstract
本发明提供了一种图像处理方法和装置,该方法包括:检测彩色证件图像中包含证件信息的彩色证件区域,将彩色证件区域转化为灰度图像S;采用图像复原算法从灰度图像S中估计出光照图像L,并利用光照图像L从灰度图像S中分解出反射率图像R;统计反射率图像R的梯度直方图;根据彩色证件图像对应的证件类型的第一预设字符边缘点比例和第二预设字符边缘点比例,从梯度直方图中获取第一梯度阈值和第二梯度阈值;采用边缘检测算法以及第一梯度阈值和第二梯度阈值,检测反射率图像R中属于文字边缘的像素点,记为边缘像素点(i,j);利用预设二值化阈值对边缘像素点(i,j)邻域nb内的每个像素点进行二值化处理。
Description
技术领域
本发明涉及图像处理技术领域,特别是涉及一种图像处理方法和装置。
背景技术
随着移动互联网的发展以及移动设备的广泛普及,采用移动端设备对证件信息录入的需求也日益迫切,具体可以采用移动端设备来对证件进行拍照,然后从拍摄的证件照片中提取文字信息进行快速录入。其中,最常见的就是对个人或企业证件进行移动拍照来识别以获得文字信息。
而相比于传统意义上的光学字符识别(OCR),移动拍照识别文字的难度更大,主要挑战在于如何对拍摄的图像中的需要识别的文字的所在位置进行定位。现有的文字定位算法主要是对图像二值化以后进行版面分析。其中,现有的二值化方法可分为全局阈值法和局部阈值法。对于全局阈值法来说,其二值化处理时会采用单一阈值对整个图像的各像素的数值进行比较,那么当图像光照不匀或部分区域反光高亮时,此方法的二值化效果非常差;而对于局部阈值法来说,当识别区域带有底纹、打印文字深浅不同时,其适应性非常不好,二值化结果中存在有些字符分割不完整或带有大量的背景区域等问题。
由此可见,现有技术中的图像二值化方案在对证件图像中的文字进行定位时,会因为拍照环境不可控(例如相机聚焦情况多样、光照条件变化较大、证件表面容易反光等),以及某些证件带有背景底纹、文字打印深浅不同等因素,而造成二值化结果存在字符分割不完整、背景去除不干净、以及因光照不匀引起的区域成块、区域黏连等问题,从而不利于后端对相应位置的文字识别。
发明内容
本发明提供了一种图像处理方法和装置,以解决现有技术中的图像二值化方案所存在的字符分割不完整、背景去除不干净、识别到的文字区域成块、区域黏连的问题。
为了解决上述问题,根据本发明的一个方面,本发明公开了一种图像处理方法,包括:
检测彩色证件图像中包含证件信息的彩色证件区域,将所述彩色证件区域转化为灰度图像S;
采用图像复原算法从所述灰度图像S中估计出光照图像L,并利用所述光照图像L从所述灰度图像S中分解出反射率图像R;
统计所述反射率图像R的梯度直方图;
根据所述彩色证件图像对应的证件类型的第一预设字符边缘点比例和第二预设字符边缘点比例,从所述梯度直方图中获取第一梯度阈值和第二梯度阈值;
采用边缘检测算法以及所述第一梯度阈值和所述第二梯度阈值,检测所述反射率图像R中属于文字边缘的像素点,记为边缘像素点(i,j);
利用预设二值化阈值对所述边缘像素点(i,j)邻域nb内的每个像素点进行二值化处理。
根据本发明的另一方面,本发明还公开了一种图像处理装置,包括:
转化模块,用于检测彩色证件图像中包含证件信息的彩色证件区域,将所述彩色证件区域转化为灰度图像S;;
分解模块,用于采用图像复原算法从所述灰度图像S中估计出光照图像L,并利用所述光照图像L从所述灰度图像S中分解出反射率图像R;
统计模块,用于统计所述反射率图像R的梯度直方图;
获取模块,用于根据所述彩色证件图像对应的证件类型的第一预设字符边缘点比例和第二预设字符边缘点比例,从所述梯度直方图中获取第一梯度阈值和第二梯度阈值;
检测模块,用于采用边缘检测算法以及所述第一梯度阈值和所述第二梯度阈值,检测所述反射率图像R中属于文字边缘的像素点,记为边缘像素点(i,j);
二值化模块,用于利用预设二值化阈值对所述边缘像素点(i,j)邻域nb内的每个像素点进行二值化处理。
与现有技术相比,本发明包括以下优点:
这样,本发明实施例通过从彩色证件区域对应的灰度图像S中解出反射率图像R进行后续的处理,可以消除图像光照不匀或部分区域反光高亮而对二值化带来的影响;而利用所检测的证件图像的证件类型的两个预设字符边缘比例来从梯度直方图中获取两个梯度阈值,进而能够保证边缘检测算法所检测到的边缘像素点更加准确,消除了待识别区域带有底纹以及打印文字深浅不同而带来的边缘像素点识别不准确的缺陷,使得图像二值化结果不会存在字符分割不完整、背景去除不干净、识别到的文字区域成块、区域黏连的问题,使得图像二值化结果更加准确。
附图说明
图1是本发明的一种图像处理方法实施例的步骤流程图;
图2是本发明一个实施例的图像光照线路示意图;
图3是是本发明的一种图像处理装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明的一种图像处理方法实施例的步骤流程图,具体可以包括如下步骤:
步骤101,检测彩色证件图像中包含证件信息的彩色证件区域,将所述彩色证件区域转化为灰度图像S;
其中,为了对证件图像中的文字进行识别,这里可以检测拍照得到的彩色证件图像中包含证件信息(例如,文字信息)的彩色证件区域,并将该彩色证件区域转换为灰度图像S。
步骤102,采用图像复原算法从所述灰度图像S中估计出光照图像L,并利用所述光照图像L从所述灰度图像S中分解出反射率图像R;
其中,由于彩色证件图像为对原始的证件照拍摄得到的,因此,彩色证件图像存在光照不均或者部分区域反光高亮的问题,同样的,其中,的彩色证件区域所转换而成的灰度图像S同样存在上述问题,那么如果直接对该灰度图像S进行二值化处理,那么将会使灰度图像S中不属于文字的部分误识别为文字,二值化效果差。那么为了避免所识别的图像因为光照不均或反光的问题而造成二值化效果差的问题,本发明实施例可以利用图像复原算法(例如多尺度Retinex算法)来对灰度图像S进行处理。
其中,Retinex理论的基本内容是物体的颜色是由物体对长波(红)、中波(绿)和短波(蓝)光线的反射能力决定的,而不是由反射光强度的绝对值决定的;物体的色彩不受光照非均性的影响,具有一致性,即Retinex理论是以色感一致性(颜色恒常性)为基础的。
本例中,如图2所示,观察者所看到的彩色证件图像(或者,理解为转换后的灰度图像S)是由原始彩色证件表面对入射光L反射得到的,反射率R由彩色证件图像本身决定,不受入射光L变化。
Retinex理论的基本假设是原始图像(即灰度图像S)是光照图像L和反射率图像R的乘积,即可表示为下式的形式:
S(x,y)=R(x,y)·L(x,y),其中,(x,y)为图像坐标系中的每个像素点,S(x,y)为灰度图像中(x,y)像素点的灰度值,R(x,y)为反射率图像中(x,y)像素点的灰度值,L(x,y)为光照图像中(x,y)像素点的灰度值。
基于Retinex的图像增强的目的就是从原始图像S中估计出光照图像L,从而分解出反射率图像R(即不受光照影响的原始证件图像的灰度图像),消除光照不均的影响,以改善图像的视觉效果,正如人类视觉系统那样。
其中,在一个具体实例中,在采用Retinex算法进行处理时,通常将图像转至对数域,即,s=logS,l=logL,r=logR。
从而将乘积关系转换为和的关系:
Log(S)=log(R·L);
logS=logR+logL;
s=r+l。
Retinex方法的核心就是估测光照图像L,从灰度图像S中估测光照图像L分量,并从灰度图像S中去除光照图像L分量,从而得到反射率图像R,即:r=s-f(s);
函数f(x)实现对光照图像L的估计,这样就可以得到r分量,即得到放射率图像R。
当然,本例中只是一种图像复原算法的实施例,在具体应用时,可以采用现有技术中任意一种图像复原算法来从灰度图像S中估计光照图像L,从而解出反射率图像R。
这样,通过步骤102就可以对图像得到可靠的全局灰度信息,即不受光照影响的图像的灰度信息。
然后,就可以采用边缘检测算法(例如,canny算法)来从具有可靠的灰度信息的反射率图像中获取文字的边缘,而由于传统技术中的canny算法是采用算法所指定的梯度上下阈值来判断图像中哪些像素点为文字边缘的,这种指定的梯度上下阈值使得canny算法的适应性非常差,例如面临图像中识别的文字区域具有底纹或者打印文字的深浅不一的情况时,采用这种算法指定的阈值会使得所检测到的边缘像素点不准确,为此,本发明实施例需要结合所处理的证件图像的证件类型的先验信息来设定该梯度上下阈值,从而可以保证所检测到的边缘像素点更加准确,能够与所处理的证件图像的证件类型相匹配。
具体而言,可以采用下述步骤103~步骤105来得到边缘像素点。
步骤103,统计所述反射率图像R的梯度直方图;
其中,由于反射率图像R的计算机表示也是由图像中的每个像素点的灰度值构成的,因此,可以统计该反射率图像R的梯度直方图,即计算每个像素点与该像素点的周围像素点之间的灰度差值(即灰度梯度值),并按照灰度梯度值的不同来对反射率图像R中的像素点数量进行统计,从而得到梯度直方图(横轴为灰度梯度值,纵轴为像素点数量)。
其中,根据像素之间的灰度的变化大小来确定文字的边缘,这就是梯度直方图的核心思想。
步骤104,根据所述彩色证件图像对应的证件类型的第一预设字符边缘点比例和第二预设字符边缘点比例,从所述梯度直方图中获取第一梯度阈值和第二梯度阈值;
其中,由于方案中处理的彩色证件图像的证件类型是已知的,因此,可以根据该证件类型的两个预设字符边缘点比例(其中,两个预设字符边缘点比例的数值不同),来从该梯度直方图中获取第一梯度阈值和第二梯度阈值。
步骤105,采用边缘检测算法以及所述第一梯度阈值和所述第二梯度阈值,检测所述反射率图像R中属于文字边缘的像素点,记为边缘像素点(i,j);
其中,例如采用canny算法来检测该反射率图像R中属于文字边缘的像素点,其中,在检测时需要利用所述第一梯度阈值和所述第二梯度阈值来进行判断。
其中,对于canny算法在利用所述第一梯度阈值和所述第二梯度阈值检测边缘像素点时所采用的检测方案,本发明不做具体限制,本发明可以采用现有技术中任意一种利用所述第一梯度阈值和所述第二梯度阈值来对边缘像素点进行检测的边缘检测算法。
步骤106,利用预设二值化阈值对所述边缘像素点(i,j)邻域nb内的每个像素点进行二值化处理。
最后,在确定了边缘像素点后,就可以利用预设二值化阈值来对所述边缘像素点(i,j)邻域nb内的每个像素点进行二值化处理。
其中,邻域是指一个像素点(x,y)的附近(周围)形成的像素点集合,即,以像素点(x,y)为圆心,半径为nb的圆内的所有像素点的集合。
这样,本发明实施例通过从彩色证件区域对应的灰度图像S中解出反射率图像R进行后续的处理,可以消除图像光照不匀或部分区域反光高亮而对二值化带来的影响;而利用所检测的证件图像的证件类型的两个预设字符边缘比例来从梯度直方图中获取两个梯度阈值,进而能够保证边缘检测算法所检测到的边缘像素点更加准确,消除了待识别区域带有底纹以及打印文字深浅不同而带来的边缘像素点识别不准确的缺陷,使得图像二值化结果不会存在字符分割不完整、背景去除不干净、识别到的文字区域成块、区域黏连的问题,使得图像二值化结果更加准确。
可选地,在一个实施例中,在执行步骤106之前,根据本发明实施例的方法还可包括:
计算所述反射率图像R中边缘像素点的连通域;
将连通域大于预设连通域阈值的边缘像素点过滤掉。
相应的,在执行步骤106时,则对过滤后的边缘像素点进行相应的二值化处理。
其中,在实际应用中,由于证件图像的灰度图像S中可能会存在大面积的深色区域(例如身份证中人脸图像的头发区域),此区域中的像素点可能会误检测为文字的边缘像素点,而由于文字的边缘像素点的连通域的面积都比较小,因此,可以通过计算边缘像素点的连通域来将不符合文字的边缘像素点过滤掉,进一步保证所识别的文字位置更加准确。
此外,在另一个实施例中,
所述预设二值化阈值为GradMulGraySum/GradSum+c;
其中,c为调节常量;
GradSum(i,j)为边缘像素点(i,j)邻域nb内的梯度(Grad)和,其中,
GradMulGraySum(i,j)为边缘像素点(i,j)邻域nb内的梯度Grad与灰度Gray乘积的和;
其中,Grad(i,j)=dx(i,j)+dy(i,j)或Grad(i,j)=max(dx(i,j),dy(i,j)),
dx(i,j)=Gray(i,j+1)-Gray(i,j–1),
dy(i,j)=Gray(i+1,j)-Gray(i+1,j)。
这样,本发明实施例中的二值化阈值为依据每个边缘像素点邻域内的梯度与灰度而计算得到的,能够使二值化阈值的设定更加准确,进一步保证对图像中文字位置的识别准确率。
可选地,在一个实施例中,为了抑制噪声,所述边缘像素点(i,j)邻域nb内的边缘像素点个数的总和大于预设常数阈值。
可选地,在一个实施例中,所述梯度直方图用于反映所述反射率图像R中不同灰度梯度值下像素点数量的分布情况,因此,在执行步骤104时,可以通过以下方式实现:
根据所述梯度直方图,对所述反射率图像R中的像素点按照灰度梯度值从低到高的顺序排序;
根据所述反射率图像R的像素点总数量,确定排列在所述第一预设字符边缘点比例位置的第一像素点,根据所述梯度直方图获取所述第一像素点的灰度梯度值,记为第一梯度阈值;
根据所述反射率图像R的像素点总数量,确定排列在所述第二预设字符边缘点比例位置的第二像素点,根据所述梯度直方图获取所述第二像素点的灰度梯度值,记为第二梯度阈值。
举例来说,梯度直方图中的横轴坐标为灰度梯度值,纵轴为像素点数量,也就是说,本发明实施例的梯度直方图反映了所述反射率图像R中不同灰度梯度值下像素点数量的分布情况,例如反射率图像R包括100个像素点,其中,灰度梯度值在0.1~0.5的像素点数量为30,灰度梯度值在0.5~1.0的像素点数量为70。
那么可以根据所述梯度直方图,来对所述反射率图像R中的像素点按照灰度梯度值从低到高的顺序排序。例如第一预设字符边缘点比例为0.3,第二预设字符边缘比例为0.8,那么本发明实施例就需要从排序后的像素点中确定排在反射率图像R的所有像素点中第30%的位置的第一像素点(这里为排在第30个的像素点),以及从排序后的像素点中确定排在反射率图像R的所有像素点中第80%的位置的第二像素点(这里为排在第80个的像素点)。最后,再从上述梯度直方图中获取该排在第30个的像素点所对应的第一灰度梯度值,记为第一梯度阈值;以及该排在第80个的像素点所对应的第二灰度梯度值,记为第二梯度阈值。
其中,在一个实施例中,由于证件类型相同的证件图像的版面相同、文字内容相对固定,因此,可以利用此先验信息来对每个证件类型的证件图像预先设定两个字符边缘点比例,所谓字符边缘点比例即为所述彩色证件图像对应的证件类型的证件图像中属于字符边缘的最少和最多像素点在所述证件图像的包含证件信息的证件区域的所有像素点中所分别占剧的比例,即,所述第一预设字符边缘点比例和所述第二预设字符边缘比例构成所述彩色证件图像对应的证件类型的证件图像中属于字符边缘的像素点在所述证件图像的包含证件信息的证件区域的所有像素点中所占的范围比例的两个边界值。
例如,身份证的证件图像中包含证件信息的证件区域包括100个像素点,其中,属于字符边缘的像素点(即构成文字的像素点)的个数和在30~80个范围内,因此,身份证的两个预设字符边缘点比例为0.3~0.8。以身份证为例,性别对应的文字均为一个(男或女),身份证号的数字数量也是确定的,只是姓名和住址的字符个数存在区别,这里利用先验信息确定出身份证中属于字符边缘的像素点的最少数量和最多数量,再将它们分别与包含证件信息的区域的像素点总数量作比值,就可以得到两个先验比例值,例如上述0.3和0.8。
其中,由于不同证件类型的证件图像中布局不同,且内容不同,因此,不同证件类型的证件图像的预设字符边缘点比例可以不同。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
与上述本发明实施例所提供的方法相对应,参照图3,示出了本发明一种图像处理装置实施例的结构框图,具体可以包括如下模块:
转化模块31,用于检测彩色证件图像中包含证件信息的彩色证件区域,将所述彩色证件区域转化为灰度图像S;
分解模块32,用于采用图像复原算法从所述灰度图像S中估计出光照图像L,并利用所述光照图像L从所述灰度图像S中分解出反射率图像R;
统计模块33,用于统计所述反射率图像R的梯度直方图;
获取模块34,用于根据所述彩色证件图像对应的证件类型的第一预设字符边缘点比例和第二预设字符边缘点比例,从所述梯度直方图中获取第一梯度阈值和第二梯度阈值;
检测模块35,用于采用边缘检测算法以及所述第一梯度阈值和所述第二梯度阈值,检测所述反射率图像R中属于文字边缘的像素点,记为边缘像素点(i,j);
二值化模块36,用于利用预设二值化阈值对所述边缘像素点(i,j)邻域nb内的每个像素点进行二值化处理。
可选地,所述预设二值化阈值为
GradMulGraySum/GradSum+c;
其中,c为调节常量;
GradSum(i,j)为边缘像素点(i,j)邻域nb内的梯度Grad和,其中,
GradMulGraySum(i,j)为边缘像素点(i,j)邻域nb内的梯度Grad与灰度Gray乘积的和;
其中,Grad(i,j)=dx(i,j)+dy(i,j)或Grad(i,j)=max(dx(i,j),dy(i,j)),
dx(i,j)=Gray(i,j+1)-Gray(i,j–1),
dy(i,j)=Gray(i+1,j)-Gray(i+1,j)。
可选地,所述边缘像素点(i,j)邻域nb内的边缘像素点个数的总和大于预设常数阈值。
可选地,所述梯度直方图用于反映所述反射率图像R中不同灰度梯度值下像素点数量的分布情况,所述获取模块34包括:
排序子模块,用于根据所述梯度直方图,对所述反射率图像R中的像素点按照灰度梯度值从低到高的顺序排序;
第一获取子模块,用于根据所述反射率图像R的像素点总数量,确定排列在所述第一预设字符边缘点比例位置的第一像素点,根据所述梯度直方图获取所述第一像素点的灰度梯度值,记为第一梯度阈值;
第二获取子模块,用于根据所述反射率图像R的像素点总数量,确定排列在所述第二预设字符边缘点比例位置的第二像素点,根据所述梯度直方图获取所述第二像素点的灰度梯度值,记为第二梯度阈值。
可选地,所述第一预设字符边缘点比例和所述第二预设字符边缘比例构成,所述彩色证件图像对应的证件类型的证件图像中属于字符边缘的像素点在所述证件图像的包含证件信息的证件区域的所有像素点中所占的范围比例的两个边界值。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种图像处理方法和一种图像处理装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种图像处理方法,其特征在于,包括:
检测彩色证件图像中包含证件信息的彩色证件区域,将所述彩色证件区域转化为灰度图像S;
采用图像复原算法从所述灰度图像S中估计出光照图像L,并利用所述光照图像L从所述灰度图像S中分解出反射率图像R;
统计所述反射率图像R的梯度直方图;
根据所述彩色证件图像对应的证件类型的第一预设字符边缘点比例和第二预设字符边缘点比例,从所述梯度直方图中获取第一梯度阈值和第二梯度阈值;
采用边缘检测算法以及所述第一梯度阈值和所述第二梯度阈值,检测所述反射率图像R中属于文字边缘的像素点,记为边缘像素点(i,j);
利用预设二值化阈值对所述边缘像素点(i,j)邻域nb内的每个像素点进行二值化处理。
2.根据权利要求1所述的方法,其特征在于,所述预设二值化阈值为
GradMulGraySum/GradSum+c;
其中,c为调节常量;
GradSum(i,j)为边缘像素点(i,j)邻域nb内的梯度Grad和,其中,
<mrow>
<msub>
<mi>Grad</mi>
<mrow>
<mi>S</mi>
<mi>u</mi>
<mi>m</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>x</mi>
<mo>=</mo>
<mo>-</mo>
<mi>n</mi>
<mi>b</mi>
</mrow>
<mrow>
<mi>x</mi>
<mo>=</mo>
<mo>+</mo>
<mi>n</mi>
<mi>b</mi>
</mrow>
</munderover>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>y</mi>
<mo>=</mo>
<mo>-</mo>
<mi>n</mi>
<mi>b</mi>
</mrow>
<mrow>
<mi>y</mi>
<mo>=</mo>
<mo>+</mo>
<mi>n</mi>
<mi>b</mi>
</mrow>
</munderover>
<mi>G</mi>
<mi>r</mi>
<mi>a</mi>
<mi>d</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>+</mo>
<mi>x</mi>
<mo>,</mo>
<mi>j</mi>
<mo>+</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
</mrow>
GradMulGraySum(i,j)为边缘像素点(i,j)邻域nb内的梯度Grad与灰度Gray乘积的和;
<mrow>
<msub>
<mi>GradMulGray</mi>
<mrow>
<mi>S</mi>
<mi>u</mi>
<mi>m</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>x</mi>
<mo>=</mo>
<mo>-</mo>
<mi>n</mi>
<mi>b</mi>
</mrow>
<mrow>
<mi>x</mi>
<mo>=</mo>
<mo>+</mo>
<mi>n</mi>
<mi>b</mi>
</mrow>
</munderover>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>y</mi>
<mo>=</mo>
<mo>-</mo>
<mi>n</mi>
<mi>b</mi>
</mrow>
<mrow>
<mi>y</mi>
<mo>=</mo>
<mo>+</mo>
<mi>n</mi>
<mi>b</mi>
</mrow>
</munderover>
<mi>G</mi>
<mi>r</mi>
<mi>a</mi>
<mi>d</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>+</mo>
<mi>x</mi>
<mo>,</mo>
<mi>j</mi>
<mo>+</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
<mo>*</mo>
<mi>G</mi>
<mi>r</mi>
<mi>a</mi>
<mi>y</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>+</mo>
<mi>x</mi>
<mo>,</mo>
<mi>j</mi>
<mo>+</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
</mrow>
其中,Grad(i,j)=dx(i,j)+dy(i,j)或Grad(i,j)=max(dx(i,j),dy(i,j)),dx(i,j)=Gray(i,j+1)-Gray(i,j–1),
dy(i,j)=Gray(i+1,j)-Gray(i+1,j)。
3.根据权利要求1所述的方法,其特征在于,所述边缘像素点(i,j)邻域nb内的边缘像素点个数的总和大于预设常数阈值。
4.根据权利要求1所述的方法,其特征在于,所述梯度直方图用于反映所述反射率图像R中不同灰度梯度值下像素点数量的分布情况,所述根据所述彩色证件图像对应的证件类型的第一预设字符边缘点比例和第二预设字符边缘点比例,从所述梯度直方图中获取第一梯度阈值和第二梯度阈值的步骤,包括:
根据所述梯度直方图,对所述反射率图像R中的像素点按照灰度梯度值从低到高的顺序排序;
根据所述反射率图像R的像素点总数量,确定排列在所述第一预设字符边缘点比例位置的第一像素点,根据所述梯度直方图获取所述第一像素点的灰度梯度值,记为第一梯度阈值;
根据所述反射率图像R的像素点总数量,确定排列在所述第二预设字符边缘点比例位置的第二像素点,根据所述梯度直方图获取所述第二像素点的灰度梯度值,记为第二梯度阈值。
5.根据权利要求1所述的方法,其特征在于,所述第一预设字符边缘点比例和所述第二预设字符边缘比例构成,所述彩色证件图像对应的证件类型的证件图像中属于字符边缘的像素点在所述证件图像的包含证件信息的证件区域的所有像素点中所占的范围比例的两个边界值。
6.一种图像处理装置,其特征在于,包括:
转化模块,用于检测彩色证件图像中包含证件信息的彩色证件区域,将所述彩色证件区域转化为灰度图像S;
分解模块,用于采用图像复原算法从所述灰度图像S中估计出光照图像L,并利用所述光照图像L从所述灰度图像S中分解出反射率图像R;
统计模块,用于统计所述反射率图像R的梯度直方图;
获取模块,用于根据所述彩色证件图像对应的证件类型的第一预设字符边缘点比例和第二预设字符边缘点比例,从所述梯度直方图中获取第一梯度阈值和第二梯度阈值;
检测模块,用于采用边缘检测算法以及所述第一梯度阈值和所述第二梯度阈值,检测所述反射率图像R中属于文字边缘的像素点,记为边缘像素点(i,j);
二值化模块,用于利用预设二值化阈值对所述边缘像素点(i,j)邻域nb内的每个像素点进行二值化处理。
7.根据权利要求6所述的装置,其特征在于,所述预设二值化阈值为
GradMulGraySum/GradSum+c;
其中,c为调节常量;
GradSum(i,j)为边缘像素点(i,j)邻域nb内的梯度Grad和,其中,
<mrow>
<msub>
<mi>Grad</mi>
<mrow>
<mi>S</mi>
<mi>u</mi>
<mi>m</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>x</mi>
<mo>=</mo>
<mo>-</mo>
<mi>n</mi>
<mi>b</mi>
</mrow>
<mrow>
<mi>x</mi>
<mo>=</mo>
<mo>+</mo>
<mi>n</mi>
<mi>b</mi>
</mrow>
</munderover>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>y</mi>
<mo>=</mo>
<mo>-</mo>
<mi>n</mi>
<mi>b</mi>
</mrow>
<mrow>
<mi>y</mi>
<mo>=</mo>
<mo>+</mo>
<mi>n</mi>
<mi>b</mi>
</mrow>
</munderover>
<mi>G</mi>
<mi>r</mi>
<mi>a</mi>
<mi>d</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>+</mo>
<mi>x</mi>
<mo>,</mo>
<mi>j</mi>
<mo>+</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
</mrow>
GradMulGraySum(i,j)为边缘像素点(i,j)邻域nb内的梯度Grad与灰度Gray乘积的和;
<mrow>
<msub>
<mi>GradMulGray</mi>
<mrow>
<mi>S</mi>
<mi>u</mi>
<mi>m</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>x</mi>
<mo>=</mo>
<mo>-</mo>
<mi>n</mi>
<mi>b</mi>
</mrow>
<mrow>
<mi>x</mi>
<mo>=</mo>
<mo>+</mo>
<mi>n</mi>
<mi>b</mi>
</mrow>
</munderover>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>y</mi>
<mo>=</mo>
<mo>-</mo>
<mi>n</mi>
<mi>b</mi>
</mrow>
<mrow>
<mi>y</mi>
<mo>=</mo>
<mo>+</mo>
<mi>n</mi>
<mi>b</mi>
</mrow>
</munderover>
<mi>G</mi>
<mi>r</mi>
<mi>a</mi>
<mi>d</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>+</mo>
<mi>x</mi>
<mo>,</mo>
<mi>j</mi>
<mo>+</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
<mo>*</mo>
<mi>G</mi>
<mi>r</mi>
<mi>a</mi>
<mi>y</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>+</mo>
<mi>x</mi>
<mo>,</mo>
<mi>j</mi>
<mo>+</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
</mrow>
其中,Grad(i,j)=dx(i,j)+dy(i,j)或Grad(i,j)=max(dx(i,j),dy(i,j)),
dx(i,j)=Gray(i,j+1)-Gray(i,j–1),
dy(i,j)=Gray(i+1,j)-Gray(i+1,j)。
8.根据权利要求6所述的装置,其特征在于,所述边缘像素点(i,j)邻域nb内的边缘像素点个数的总和大于预设常数阈值。
9.根据权利要求6所述的装置,其特征在于,所述梯度直方图用于反映所述反射率图像R中不同灰度梯度值下像素点数量的分布情况,所述获取模块包括:
排序子模块,用于根据所述梯度直方图,对所述反射率图像R中的像素点按照灰度梯度值从低到高的顺序排序;
第一获取子模块,用于根据所述反射率图像R的像素点总数量,确定排列在所述第一预设字符边缘点比例位置的第一像素点,根据所述梯度直方图获取所述第一像素点的灰度梯度值,记为第一梯度阈值;
第二获取子模块,用于根据所述反射率图像R的像素点总数量,确定排列在所述第二预设字符边缘点比例位置的第二像素点,根据所述梯度直方图获取所述第二像素点的灰度梯度值,记为第二梯度阈值。
10.根据权利要求6所述的装置,其特征在于,所述第一预设字符边缘点比例和所述第二预设字符边缘比例构成,所述彩色证件图像对应的证件类型的证件图像中属于字符边缘的像素点在所述证件图像的包含证件信息的证件区域的所有像素点中所占的范围比例的两个边界值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710348659.XA CN107330433B (zh) | 2017-05-17 | 2017-05-17 | 图像处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710348659.XA CN107330433B (zh) | 2017-05-17 | 2017-05-17 | 图像处理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107330433A true CN107330433A (zh) | 2017-11-07 |
CN107330433B CN107330433B (zh) | 2020-01-07 |
Family
ID=60194000
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710348659.XA Active CN107330433B (zh) | 2017-05-17 | 2017-05-17 | 图像处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107330433B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110264489A (zh) * | 2019-06-24 | 2019-09-20 | 北京奇艺世纪科技有限公司 | 一种图像边界检测方法、装置及终端 |
CN110807748A (zh) * | 2019-11-06 | 2020-02-18 | 广州市皓品信息科技有限公司 | 一种基于高动态范围的新色调映射图像增强方法 |
CN111091126A (zh) * | 2019-12-12 | 2020-05-01 | 京东数字科技控股有限公司 | 证件图像反光检测方法、装置、设备及存储介质 |
CN111627009A (zh) * | 2020-05-27 | 2020-09-04 | 歌尔股份有限公司 | 一种屏幕检测方法、装置及头戴显示设备 |
CN113506251A (zh) * | 2021-06-28 | 2021-10-15 | 苏州西热节能环保技术有限公司 | 磨损份额的计算方法及其应用、系统、存储介质、终端 |
CN114511694A (zh) * | 2022-01-28 | 2022-05-17 | 北京百度网讯科技有限公司 | 图像识别方法、装置、电子设备和介质 |
CN115249326A (zh) * | 2022-09-21 | 2022-10-28 | 南通长石科技有限公司 | 基于数据处理的物流转运机器人运行状态检测方法 |
CN116110053A (zh) * | 2023-04-13 | 2023-05-12 | 济宁能源发展集团有限公司 | 基于图像识别的集装箱表面信息检测方法 |
CN117474820A (zh) * | 2023-10-12 | 2024-01-30 | 书行科技(北京)有限公司 | 图像处理方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101556739A (zh) * | 2009-05-14 | 2009-10-14 | 浙江大学 | 基于本征图像分解的车辆检测算法 |
CN103177260A (zh) * | 2013-04-19 | 2013-06-26 | 福州大学 | 一种彩色图像边界提取方法 |
CN103324930A (zh) * | 2013-06-28 | 2013-09-25 | 浙江大学苏州工业技术研究院 | 一种基于灰度直方图二值化的车牌字符分割方法 |
JP2013242817A (ja) * | 2012-05-22 | 2013-12-05 | Naoto Kawamura | 画像処理装置およびその方法 |
CN106504244A (zh) * | 2016-11-03 | 2017-03-15 | 中国矿业大学 | 一种基于Retinex与小波尺度积的矿井图像边缘检测算法 |
-
2017
- 2017-05-17 CN CN201710348659.XA patent/CN107330433B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101556739A (zh) * | 2009-05-14 | 2009-10-14 | 浙江大学 | 基于本征图像分解的车辆检测算法 |
JP2013242817A (ja) * | 2012-05-22 | 2013-12-05 | Naoto Kawamura | 画像処理装置およびその方法 |
CN103177260A (zh) * | 2013-04-19 | 2013-06-26 | 福州大学 | 一种彩色图像边界提取方法 |
CN103324930A (zh) * | 2013-06-28 | 2013-09-25 | 浙江大学苏州工业技术研究院 | 一种基于灰度直方图二值化的车牌字符分割方法 |
CN106504244A (zh) * | 2016-11-03 | 2017-03-15 | 中国矿业大学 | 一种基于Retinex与小波尺度积的矿井图像边缘检测算法 |
Non-Patent Citations (5)
Title |
---|
XIAOYANG TAN,BILL TRIGGS: "Enhanced Local Texture Feature Sets for Face Recognition Under Difficult Lighting Conditions", 《AMFG 2007》 * |
YU LI,MICHAEL S. BROWN: "Single Image Layer Separation using Relative Smoothness", 《COMPUTER VISION AND PATTERN RECOGNITION》 * |
张建伟 等: "基于形态学的硬币镜面区域缺陷检测算法研究", 《成都大学学报(自然科学版)》 * |
梁琳 等: "光照不均图像增强方法综述", 《计算机应用研究》 * |
雷建锋,汪伟: "基于OpenCV的图像阈值分割研究与实现", 《现代电子技术》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110264489A (zh) * | 2019-06-24 | 2019-09-20 | 北京奇艺世纪科技有限公司 | 一种图像边界检测方法、装置及终端 |
CN110807748A (zh) * | 2019-11-06 | 2020-02-18 | 广州市皓品信息科技有限公司 | 一种基于高动态范围的新色调映射图像增强方法 |
CN111091126A (zh) * | 2019-12-12 | 2020-05-01 | 京东数字科技控股有限公司 | 证件图像反光检测方法、装置、设备及存储介质 |
CN111627009A (zh) * | 2020-05-27 | 2020-09-04 | 歌尔股份有限公司 | 一种屏幕检测方法、装置及头戴显示设备 |
CN111627009B (zh) * | 2020-05-27 | 2023-10-20 | 歌尔光学科技有限公司 | 一种屏幕检测方法、装置及头戴显示设备 |
CN113506251A (zh) * | 2021-06-28 | 2021-10-15 | 苏州西热节能环保技术有限公司 | 磨损份额的计算方法及其应用、系统、存储介质、终端 |
CN114511694A (zh) * | 2022-01-28 | 2022-05-17 | 北京百度网讯科技有限公司 | 图像识别方法、装置、电子设备和介质 |
CN114511694B (zh) * | 2022-01-28 | 2023-05-12 | 北京百度网讯科技有限公司 | 图像识别方法、装置、电子设备和介质 |
CN115249326A (zh) * | 2022-09-21 | 2022-10-28 | 南通长石科技有限公司 | 基于数据处理的物流转运机器人运行状态检测方法 |
CN116110053A (zh) * | 2023-04-13 | 2023-05-12 | 济宁能源发展集团有限公司 | 基于图像识别的集装箱表面信息检测方法 |
CN116110053B (zh) * | 2023-04-13 | 2023-07-21 | 济宁能源发展集团有限公司 | 基于图像识别的集装箱表面信息检测方法 |
CN117474820A (zh) * | 2023-10-12 | 2024-01-30 | 书行科技(北京)有限公司 | 图像处理方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN107330433B (zh) | 2020-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107330433A (zh) | 图像处理方法和装置 | |
Yeh et al. | Haze effect removal from image via haze density estimation in optical model | |
Gong et al. | Interactive removal and ground truth for difficult shadow scenes | |
CN104239909B (zh) | 一种图像的识别方法和装置 | |
CN109871845B (zh) | 证件图像提取方法及终端设备 | |
CN110619333B (zh) | 一种文本行分割方法、文本行分割装置及电子设备 | |
WO2019201184A1 (zh) | 一种车牌增强方法、装置及电子设备 | |
CN111259891B (zh) | 一种自然场景下身份证识别方法、装置、设备和介质 | |
CN109934785A (zh) | 图像锐化方法及装置 | |
CN111223078B (zh) | 瑕疵等级判定的方法及存储介质 | |
KR101246120B1 (ko) | 전후면 번호판 영상 기반 차량번호 인식 시스템 | |
WO2018040948A1 (zh) | 一种数字对象唯一标识符doi识别方法与装置 | |
CN110570442A (zh) | 一种复杂背景下轮廓检测方法、终端设备及存储介质 | |
CN113487473B (zh) | 一种添加图像水印的方法、装置、电子设备及存储介质 | |
CN112102402A (zh) | 闪光灯光斑位置识别方法、装置、电子设备及存储介质 | |
CN106156691A (zh) | 复杂背景图像的处理方法及其装置 | |
CN109598736A (zh) | 深度图像与彩色图像的配准方法及装置 | |
WO2019210707A1 (zh) | 一种图像清晰度评测方法、装置及电子设备 | |
CN105761256B (zh) | 图像的亚像素边缘直线获取方法及装置 | |
Gao et al. | Single image dehazing using local linear fusion | |
CN111862040A (zh) | 人像图片质量评价方法、装置、设备及存储介质 | |
CN111311619A (zh) | 一种实现滑块验证的方法和装置 | |
CN110889470A (zh) | 用于处理图像的方法和装置 | |
CN110557622B (zh) | 基于结构光的深度信息获取方法及装置、设备及介质 | |
Yang et al. | A novel binarization approach for license plate |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP02 | Change in the address of a patent holder | ||
CP02 | Change in the address of a patent holder |
Address after: Building 2102, building 1, Haidian District, Beijing Patentee after: BEIJING SINOVOICE TECHNOLOGY Co.,Ltd. Address before: 100193 room 2101, 1f, building a, Zhongguancun Software Park, No. 8, Dongbeiwang West Road, Haidian District, Beijing Patentee before: BEIJING SINOVOICE TECHNOLOGY Co.,Ltd. |