CN117351491A - 用于图像处理的方法、装置和电子设备 - Google Patents
用于图像处理的方法、装置和电子设备 Download PDFInfo
- Publication number
- CN117351491A CN117351491A CN202311253826.4A CN202311253826A CN117351491A CN 117351491 A CN117351491 A CN 117351491A CN 202311253826 A CN202311253826 A CN 202311253826A CN 117351491 A CN117351491 A CN 117351491A
- Authority
- CN
- China
- Prior art keywords
- boundary line
- character
- boundary
- determining
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 112
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000003672 processing method Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
本申请涉及图像处理技术领域,公开一种用于图像处理的方法、用于图像处理的装置和电子设备。该图像处理的方法,包括:获取证件图像的一维扫描数据,一维扫描数据为根据预设步长对证件图像进行一维数据扫描得到的;将证件图像的一维扫描数据进行二值化处理;根据二值化处理得到的图像数据,确定证件图像中的目标空白区域;根据目标空白区域,确定证件图像中含有字符内容的字符区域。本申请实施例提供的用于图像处理的方法降低了用于图像处理的装置的硬件要求,还充分利用了证件图像中字符区域周围有用的目标空白区域即可完成对证件图像中的字符区域的快速定位,极大地降低了对证件图像进行OCR字符识别的应用成本。
Description
技术领域
本申请涉及图像处理领域,具体涉及一种用于图像处理的方法、用于图像处理的装置和电子设备。
背景技术
目前,可以通过图像处理装置对身份证上的文字信息进行自动化识别,极大地提高了对证件图像中的文字内容识别的效率。
在实现本申请实施例的过程中,发现相关技术中至少存在如下问题:
相关技术中,通过图像处理的装置对证件进行扫描可以获取证件图像,对证件图像中的预定区域进行识别,可以得到文字识别的结果。但是通常情况下,在使用图像处理装置对图像进行处理的过程中,需要在图像处理装置中配置深度学习模型,故图像处理装置需要具有较高的硬件配置。例如:需要图像处理装置具有较大的程序存储空间、较高的CPU主频、较大的运行内存,甚至需要额外的硬件加速电路,导致图像处理装置的成本居高不下,适用场景受限。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
本申请实施例提供了一种用于图像处理的方法、用于图像处理的装置和电子设备,对证件图像中的字符区域的定位方法简单、高效,对同于图像处理的装置和电子设备的硬件性能要求较低,可极大降低证件图像中字符识别的应用成本。
在一些实施例中,所述图像处理的方法包括:获取证件图像的一维扫描数据,所述一维扫描数据为根据预设步长对所述证件图像进行一维数据扫描得到的;将证件图像的一维扫描数据进行二值化处理;根据二值化处理得到的图像数据,确定证件图像中的目标空白区域;根据目标空白区域,确定证件图像中含有字符内容的字符区域。
在一些实施例中,图像处理的装置包括获取模块和处理模块。获取模块被配置为获取证件图像的一维扫描数据,一维扫描数据为根据预设步长对证件图像进行一维数据扫描得到的;处理模被配置为将证件图像的一维扫描数据进行二值化处理;处理模块还被配置为根据二值化处理得到的图像数据,确定证件图像中的目标空白区域;处理模块还被配置为根据目标空白区域,确定证件图像中含有字符内容的字符区域。
在一些实施例中,用于图像处理的装置,包括处理器和存储有程序指令的存储器,处理器被配置为在运行程序指令时,执行如上述的用于图像处理的方法。
在一些实施例中,电子设备包括如上述的用于图像处理的装置。
本申请实施例提供的用于图像处理的方法、用于图像处理的装置和电子设备,可以实现以下技术效果:
本申请实施例提供的图像处理的方法,通过以预设步长对证件图像进行一维数据扫描,而非对证件图像的全部区域进行扫描,从而能够快速地完成对证件图像的扫描过程。此外,通过对一维扫描数据进行二值化处理的方式,并根据二值化后得到的图像数据确定出目标空白区域,进而根据目标空白区域确定字符区域,降低了用于图像处理的装置的硬件要求,还充分利用了证件图像中字符区域周围有用的目标空白区域,采用高效、便捷的方法即可完成对证件图像中的字符区域的快速定位,极大地降低了对证件图像的字符区域进行OCR字符识别的应用成本。
以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。
附图说明
一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:
图1是本申请实施例提供的电子设备的示意图;
图2是本申请实施例提供的用于图像处理的方法的流程示意图之一;
图3是本申请实施例提供的用于图像处理的方法的示意图之一;
图4是本申请实施例提供的用于图像处理的方法的示意图之二;
图5是本申请实施例提供的用于图像处理的方法的示意图之三;
图6是本申请实施例提供的用于图像处理的方法的示意图之四;
图7是本申请实施例提供的用于图像处理的装置的示意图之一;
图8是本申请实施例提供的用于图像处理的装置的示意图之二。
具体实施方式
为了能够更加详尽地了解本申请实施例的特点与技术内容,下面结合附图对本申请实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本申请实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或多个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
本申请实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请实施例的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。
除非另有说明,术语“多个”表示两个或两个以上。
本申请实施例中,字符“/”表示前后对象是一种“或”的关系。例如,A/B表示:A或B。
术语“和/或”是一种描述对象的关联关系,表示可以存在三种关系。例如,A和/或B,表示:A或B,或,A和B这三种关系。
术语“对应”可以指的是一种关联关系或绑定关系,A与B相对应指的是A与B之间是一种关联关系或绑定关系。
本申请实施例提供的电子设备可以为计算机、手持终端等设备。示例性地,下面以电子设备为手持终端为例,对本申请进行示例性说明。
本申请实施例提供的电子设备如图1所示,该电子设备10包括芯片100和用于图像处理的装置800。该用于图像处理的装置800包括处理器,本申请实施例提供的用于图像处理的方法的执行主体可以为该处理器。
结合图1所示的电子设备,本申请实施例提供一种用于图像处理的方法,如图2所示,该方法包括:
S201,处理器获取证件图像的一维扫描数据。
其中,一维扫描数据为根据预设步长对证件图像进行一维数据扫描得到的。
处理器获取证件图像,该证件图像可以为电子设备通过图像获取装置获取的图像,也可以为处理器通过与其他电子设备通信从而接收到的图像,或从互联网上获取的图像。该证件图像可以为居民身份证图像、港澳通行证图像、护照图像、签证图像中的任一者。通常情况下,证件图像中的字符区域的上下两侧、左右两侧均有较高或者较宽的空白区域。
处理器可以控制电子设备的图像采集装置对证件图像按照预设步长以预设扫描方向对证件图像进行扫描。示例性地,可以通过光栅扫描的方式对二维的证件图像进行扫描,处理器基于扫描结果将其转化为一维扫描数据。
预设扫描方向可以为从上至下沿水平方方向扫描,也可以为从左至右沿竖直方向扫描,也可以以证件图像的某一个中间位置,向上下或者左右两侧扫描。预设扫描方向也可以与水平方向或者竖直方向具有一定角度,具体可以根据证件图像的倾斜程度设定。
示例性地,处理器可以控制图像采集装置先按一定步长以从上到下顺序地沿水平方向对图像进行线扫描,从而获得每一扫描线上灰度值的一维扫描数据。
预设步长可以理解为两条扫描线之间的间距,该预设步长可以在小于证件图像中字符的高度的范围内选取。如此,在图像采集装置进行一维数据扫描时,可以至少有一条扫描线穿过字符区域中的字符。如图3所示,有一条扫描线300穿过证件图像的身份证号码的字符区域。
需要说明的是,通过预设步长对证件图像进行一维数据扫描,由于不需要对整个证件图像进行全部扫描,从而提高了数据扫描的效率,进而提升了整个图像处理过程的处理效率。
S202,处理器将证件图像的一维扫描数据进行二值化处理。
处理器对一维扫描数据进行二值化处理,可以减少一维扫描数据中噪声的干扰,还可以将证件图像中的前景区域与背景区域分离。
处理器进行二值化处理可以选用定阈二值化、定半径滑动平均阈值二值化、基于噪声估算的波形分析二值化等二值化处理方式中的任一种,本申请实施例对此不做限制。
S203,处理器根据二值化处理得到的图像数据,确定证件图像中的目标空白区域。
处理器对一维扫描数据进行二值化处理后,可以获得图像数据。在图像数据中,背景区域标注为0,前景区域标记为1。
可选地,处理器根据二值化处理得到的图像数据,确定证件图像中的目标空白区域可以通过如下步骤实现:
S2031,处理器根据图像数据确定多个空白区域。
处理器可以根据图像数据将证件图像划分为多个空白区域。具体地,二值化处理后的图像数据被标注为0的背景区域为空白区域,该空白区域用于指示证件图像中没有字符的区域。
S2032,处理器从多个空白区域中确定符合目标条件的目标空白区域。
处理器从上述图像多个空白区域中选择符合目标条件的空白区域。上述目标条件为空白区域的背景宽度,与空白区域沿第一方向相邻的前景区域的宽度的比值大于第一阈值。本申请实施例中,为了便于描述,本申请实施例中可以将上述第一方向设定为水平向右的方向,但是在实际应用中,第一方向并不局限于此。
示例性地,假设某空白区域的背景宽度为bw,当其右侧前景区域的前景宽度为rw,若bw>2×rw(第一阈值可以选取为2),则该空白区域为目标空白区域。或者假设某空白区域的背景宽度为bw,当其左侧前景区域的前景宽度为lw,若bw>2×lw(第一阈值可以选取为2),则该空白区域也可以为目标空白区域。如图3所示,空白区域301的背景宽度大于其右侧的前景区域的字符“1”的宽度2倍以上,可以将空白区域301作为目标空白区域。
如此,处理器根据二值化后的图像数据确定多个空白区域,并从多个空白区域的背景区域和与之相邻的前景区域之间的宽度关系,确定目标空白区域,处理过程对用于图像处理的装置的硬件要求低,且高效、快速。
S204,处理器根据目标空白区域,确定证件图像中含有字符内容的字符区域。
字符区域可以为电子设备通过OCR技术所要识别的证件图像中的字符区域。由于证件图像具有格式固定的特性,通常情况下,在字符区域的周围具有较高宽度和较大宽度的空白区域,通过设置该空白区域的约束条件可以得到上述目标空白区域。
本申请实施例以居民身份证为例,为了便于描述,上述字符区域可以为身份证号码的数字的字符区域。当然,也可以根据需要将所要识别的字符区域设置为具体住址的字符区域,由于具体住址的区域的下方空白区域和右侧空白区域都比较大,因此也可以通过设置空白区域的约束条件,确定该具体住址的字符区域。
以居民身份证为例:身份证号码的数字串的下边缘至证件图像的下边缘的空白区域的高度为6mm±1mm,“公民身份号码”和身份证号码的数字串之间的空白区域宽度为3mm±1mm。利用该目标空白区域与字符区域的位置关系,可以快速定位与目标空白区域临近的字符区域,以便于处理器后续对字符区域内的字符进行有效识别。
本申请实施例提供的图像处理的方法,通过以预设步长对证件图像进行一维数据扫描,而非对证件图像的全部区域进行扫描,从而能够快速完成对证件图像的扫描过程。此外,通过对一维扫描数据进行二值化处理的方式,并根据二值化后得到的图像数据确定出目标空白区域,进而根据目标空白区域确定字符区域,不但降低了用于图像处理的装置的硬件要求,还充分利用了证件图像中字符区域周围的有用的目标空白区域,采用高效、快捷的方法即可完成对证件图像中的字符区域的快速定位,极大地降低了对证件图像的字符区域进行OCR字符识别的应用成本。
本申请实施例提供另一种用于图像处理的方法,该方法包括:
S301,处理器获取证件图像的一维扫描数据。
其中,一维扫描数据为根据预设步长对证件图像进行一维数据扫描得到的。
S302,处理器将证件图像的一维扫描数据进行二值化处理。
S303,处理器根据二值化处理得到的图像数据,确定证件图像中的目标空白区域。
S304,处理器根据目标空白区域确定第一关键点。
处理器根据一维数据扫描线与目标空白区域的交点,以及目标空白区域的背景区域和前景区域的相对位置关系,确定第一关键点。
示例性地,如图3所示,处理器已经确定的目标空白区域301和扫描线300具有两个交点。由于与目标空白区域301临近的前景区域即字符“1”位于目标空白区域301的右侧,则上述两个交点中位于右侧,也即临近字符“1”的交点即为第一关键点。可以理解,该第一关键点可以是目标空白区域和前景区域之间的交界点。
S305,处理器根据第一关键点,确定第一边界线和第二边界线。
可选地,根据第一关键点,确定第一边界线和第二边界线具体包括:
S305a,处理器根据第一关键点,确定第一字符的第一边界点和第二边界点。
其中,第一字符为最接近第一关键点的字符。
在上述实施例中,处理器控制图像扫描装置沿第一方向(水平向右)进行一维数据扫描,并基于此确定了上述第一关键点。该第一关键点是目标空白区域和前景区域之间的临界点,也即该第一关键点趋近于或者位于前景区域中的第一字符的轮廓线上。处理器再建立经过第一关键点且沿第二方向的扫描线,该第二方向垂直于第一方向,则可以认为该沿第二方向的扫描线经过第一字符。
处理器基于该第一关键点并沿第二方向的扫描线向上进行搜索,得到第一边界点,基于该第一关键点并沿第二方向的扫描线向下进行搜索候选点,得到第二边界点。第一边界点和第二边界点为第一字符沿第二方向的两个顶点。第一边界点和第二边界点沿第二方向的扫描线的距离为第一字符的高度d。
示例性地,如图4所示,处理器确定第一关键点302后,处理器再建立经过第一关键点302、第一字符“1”且沿第二方向的扫描线307。处理器沿扫描线307向上进行搜索,得到第一字符“1”的第一边界点306。处理器沿扫描线307向下进行搜索,得到第一字符“1”的第二边界点304。
S305b,处理器根据第一边界点确定第一边界线,以及根据第二边界点,确定第二边界线。
如此,处理器根据目标空白区域的第一关键点就能够确定字符区域的第一边界线和第二边界线,处理方式便捷、快速,并且能够得到第一边界线和第二边界线准确的定位结果,以便于后续处理器对字符区域内的字符进行有效识别。
可选地,根据第一边界点确定第一边界线,具体包括:
S3051,根据第一边界点,确定第二字符的第三边界点,第三边界点和第一边界点间隔第一距离。
处理器基于沿第一方向的扫描线和第一关键点,沿第一方向继续搜索与第一关键点具有第一距离第二关键点。第一距离为K×d,其中d为第一字符的高度,k为2至4之间的常数。通过合理设置k的值,能够使得与第一关键点距离K×d的第二关键点位于第二字符。该第二字符和第一字符的相对方位与第一字符与目标空白区域的相对方位相同。
处理器再建立经过第二关键点且沿第二方向的扫描线,则可以认为该沿第二方向的扫描线经过第二字符。处理器基于该第二关键点并沿第二方向的扫描线向上进行搜索,得到第三边界点。第三边界点为第二字符沿第二方向的一个顶点。
示例性地,如图4所示,处理器确定第二关键点后,处理器再建立经过第二关键点、第二字符“3”且沿第二方向的扫描线401。处理器沿扫描线401向上进行搜索,得到第二字符“3”的第三边界点406。
S3052,根据第一边界点和第三边界点,确定第三方向。
连接第一边界点和第三边界点能够确定第三方向。
S3053,根据第一边界点和第三方向,拟合得到第一边界线。
处理器基于上述第一边界点,以及第三方向的方向向量完成字符区域的第一边界线的拟合。
通过同样的方法,可以根据第二边界点确定第二边界线,具体包括:
S3054,根据第二边界点,确定第二字符的第四边界点。
其中,第四边界点和第二边界点间隔第一距离。
处理器基于该第二关键点并沿第二方向的扫描线向下进行搜索候选点,得到第四边界点。第四边界点为第二字符沿第二方向的另一个顶点。
示例性地,如图4所示,处理器确定第二关键点后,处理器再建立经过第二关键点、第二字符“3”且沿第二方向的扫描线401。处理器沿扫描线401向下进行搜索,得到第二字符“3”的第四边界点404。
S3055,根据第二边界点和第四边界点,确定第四方向。
连接第二边界点和第四边界点能够确定第四方向。
S3056,根据第二边界点和第四方向,拟合得到第二边界线。
处理器基于上述第二边界点,以及第四方向的方向向量完成字符区域的第二边界线的拟合。
如此,处理器根据第一关键点能够确定第一边界点和第二边界点,再基于第一关键点确定第二关键点,从而基于第二关键点确定第三边界点和第四边界点。然后再根据第一边界点和第三边界点拟合第一边界线,根据第二边界点和第四边界点拟合第二边界线。处理过程简便、快速,且对图像处理的装置硬件要求低,并且能够得到准确的对字符区域进行划界的上下边界线,以便于后续处理器对字符区域内的字符进行有效识别。
S306,根据第一边界线和第二边界线,确定字符区域。
可选地,根据第一边界线和第二边界线,确定字符区域包括:
S306a,在第一边界线和第二边界线符合第一约束条件的情况下,根据第一边界线和第二边界线,确定第三边界线和第四边界线。
其中,第一约束条件为:在第一边界线和第二边界线趋近于平行的情况下,第一边界线上方的空白区域的高度大于第一高度,且第二边界线下方的空白区域的高度大于第一高度。
由于证件图像中字符区域的特殊性,字符区域中的数字的上边界线与下边界线之间通常是趋于平行的。因此,如果通过上述图像处理的方法得到的第一边界线和第二边界线趋于平行,则说明第一边界线和第二边界线的划界准确。
在第一边界线和第二边界线趋近于平行的情况下,处理器确认第一边界线上方的空白区域和第二边界线下方的空白区域是否满足第一约束条件。如果满足约束条件,处理器继续确定第三边界线和第四边界线。
具体地,该第一高度可以等于第一字节的高度d。
示例性地,如图6所示,第一边界线上方的空白区域为603,第二边界线下方的空白区域为602,则在空白区域603和空白区域602的高度大于d的情况下,第一边界线和第二边界线符合第一约束条件,说明第一边界线和第二边界线是符合要求的字符区域的两个边界线。
可选地,根据第一边界线和第二边界线,确定第三边界线和第四边界线,包括:
S3061,将第一边界线和第二边界线范围内的字符数据沿第二方向投影至第一边界线。
示例性地,如图5所示,第二方向为Y方向,处理器将第一边界线和第二边界线范围内的字符数据向第一边界线投影。该字符数据可以以灰度数据的形式向第一边界线投影,也可以以前景像素的形式向第一边界线投影。
S3062,确定字符数据在第一边界线上的两个边界点。
处理器将投影后的第一边界线上的一维数据进行二值化处理,并根据字符区域在左右两侧具有空白区域的特性,也即二值化处理后的某个空白区域的背景宽度大于2倍其相邻的前景区域的宽度,则处理器将该空白区域和前景区域的交接点作为边界点。通过这样的方式,处理器可以确定第一边界线上的左右两个边界点。
S3063,根据两个边界点和第二方向,确定第三边界线和第四边界线。
处理器基于上述两个边界点,沿第二方向扫描。该扫描线与第二边界线形成的两个交点,即为第二边界线的两个边界点。处理器根据第一边界线上的两个边界点,以及第二边界线上对应的两个边界点,可以确定出第三边界线和第四边界线。
S306b,根据第一边界线、第二边界线、第三边界线和第四边界线确定字符区域。
如此,处理器对第一边界线和第二边界线进行验证,并根据通过验证的第一边界线和第二边界线确定出第三边界线和第四边界线,以避免最终确定的字符区域存在划界误差,并提高了图像处理的装置的运算效率。处理器根据上述第一边界线、第二边界线、第三边界线和第四边界线确定字符区域,处理方式简单、快速,并且能够得到更为准确的字符区域的定位结果,以便于后续处理器对字符区域内的字符进行有效识别。
本申请实施例提供另一种用于图像处理的方法,该方法包括:
S401,处理器获取证件图像的一维扫描数据。
其中,一维扫描数据为根据预设步长对证件图像进行一维数据扫描得到的。
S402,处理器将证件图像的一维扫描数据进行二值化处理。
S403,处理器根据二值化处理得到的图像数据,确定证件图像中的目标空白区域。
S404,根据目标空白区域,确定证件图像中含有字符内容的字符区域。
S405,在所述字符区域不满足所述第二约束条件的情况下,丢弃所述字符区域。
所述第二约束条件为所述字符区域的长宽比满足第一预设范围,且所述字符区域沿第一方向的两侧的空白区域的宽度大于第二阈值。
具体地,上述第二阈值可以为第一字符高度的2倍,也即第二阈值可以为2d。上述长宽比的范围可以为13:1~23:1。
在处理器确定字符区域后,可以对字符区域进行再次校验,如果字符区域定位准确,则处理器继续对字符区域内的字符进行识别。如果该字符区域定位有误,则处理器可以不再进行后续的字符识别,并提示识别错误的信息,以提高用于图像处理的装置的图像处理效率。
示例性地,如图6所示,处理器确定的字符区域为601,处理器验证其左侧的空白区域604和右侧的空白区域605的宽度是否大于2d,以及字符区域的长宽比是否位于13:1~23:1之间。如果满足上述条件,则说明字符区域的定位准确。
如此,处理器通过对字符区域进行校验,可以进一步保证字符区域的定位准确定,以便处理器后续对于字符区域内的字符进行有效、高效的识别。
结合图7所示,本申请实施例提供一种用于图像处理的装置700,包括获取模块721和处理模块722。获取模块721被配置为获取证件图像的一维扫描数据,一维扫描数据为根据预设步长对证件图像进行一维数据扫描得到的;处理模块722被配置为将证件图像的一维扫描数据进行二值化处理;处理模块722还被配置为根据二值化处理得到的图像数据,确定证件图像中的目标空白区域;处理模块722还被配置为根据目标空白区域,确定证件图像中含有字符内容的字符区域。
采用本申请实施例提供的用于图像处理的装置,通过以预设步长对证件图像进行一维数据扫描,而非对证件图像的全部区域进行扫描,从而能够快速地完成对证件图像的扫描过程。此外,通过对一维扫描数据进行二值化处理的方式,并根据二值化后得到的图像数据确定出目标空白区域,进而根据目标空白区域确定字符区域。不但降低了用于图像处理的装置的硬件要求,还充分利用了证件图像中字符区域周围有用的目标空白区域,采用简单的方法即可完成对证件图像中的字符区域的快速定位,极大地降低了对证件图像进行OCR字符识别的应用成本。
可选地,处理模块722还被配置为根据目标空白区域确定第一关键点;根据第一关键点,确定第一边界线和第二边界线;根据第一边界线和第二边界线,确定字符区域。
可选地,处理模块722还被配置为根据第一关键点,确定第一字符的第一边界点和第二边界点;根据第一边界点确定第一边界线,以及根据第二边界点,确定第二边界线;其中,第一字符为最接近第一关键点的字符,第一边界点和第二边界点为第一字符沿第一方向的两个顶点。
可选地,处理模块722还被配置为根据第一边界点,确定第二字符的第三边界点,第三边界点和第一边界点间隔第一距离;根据第一边界点和第三边界点,确定第三方向;根据第一边界点和第三方向,拟合得到第一边界线;其中,第二字符和第一字符的相对方位与第一字符与目标空白区域的相对方位相同,第三边界点为第二字符沿第一方向的一个顶点。
可选地,处理模块722还被配置为在第一边界线和第二边界线符合第一约束条件的情况下,根据第一边界线和第二边界线,确定第三边界线和第四边界线;根据第一边界线、第二边界线、第三边界线和第四边界线确定字符区域。
可选地,处理模块722还被配置为将第一边界线和第二边界线范围内的字符数据沿第二方向投影至第一边界线;确定字符数据在第一边界线上的两个边界点;根据两个边界点和第二方向,确定第三边界线和第四边界线。
可选地,处理模块722还被配置为根据图像数据确定多个空白区域;从多个空白区域中确定符合目标条件的目标空白区域;其中,目标条件为空白区域中背景区域的宽度,与背景区域沿第一方向相邻的前景区域的宽度的比值大于第二阈值。
结合图8所示,本申请实施例提供一种用于图像处理的装置800,包括处理器(processor)801和存储器(memory)802。可选地,该装置还可以包括通信接口(Communication Interface)803和总线804。其中,处理器801、通信接口803、存储器802可以通过总线804完成相互间的通信。通信接口803可以用于信息传输。处理器801可以调用存储器802中的逻辑指令,以执行上述实施例的用于图像处理的方法。
此外,上述的存储器802中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器802作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序,如本申请实施例中的方法对应的程序指令/模块。处理器801通过运行存储在存储器802中的程序指令/模块,从而执行功能应用以及数据处理,即实现上述实施例中用于图像处理的方法。
存储器8023可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器802可以包括高速随机存取存储器,还可以包括非易失性存储器。
结合图1所示,本申请实施例提供了一种电子设备(例如:计算机、手机等)10,包括:芯片100,以及上述的用于图像处理的装置800。用于图像处理的装置800被安装于芯片。这里所表述的安装关系,并不仅限于在产品内部放置,还包括了与产品的其他元器件的安装连接,包括但不限于物理连接、电性连接或者信号传输连接等。本领域技术人员可以理解的是,用于图像处理的装置800可以适配于可行的产品主体,进而实现其他可行的实施例。
本申请实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,计算机可执行指令设置为执行上述用于图像处理的方法。
上述的计算机可读存储介质可以是暂态计算机可读存储介质,也可以是非暂态计算机可读存储介质。
本申请实施例的技术方案可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括一个或多个指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请实施例方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质,包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
以上描述和附图充分地示出了本申请的实施例,以使本领域的技术人员能够实践它们。其他实施例可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施例的部分和特征可以被包括在或替换其他实施例的部分和特征。而且,本申请中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的,除非上下文清楚地表明,否则单数形式的“一个”(a)、“一个”(an)和“”(the)旨在同样包括复数形式。类似地,如在本申请中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外,当用于本申请中时,术语“包括”(comprise)及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素,和/或组件的存在,但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。在没有更多限制的情况下,由语句“包括一个…”限定的要素,并不排除在包括要素的过程、方法或者设备中还存在另外的相同要素。本文中,每个实施例重点说明的可以是与其他实施例的不同之处,各个实施例之间相同相似部分可以互相参见。对于实施例公开的方法、产品等而言,如果其与实施例公开的方法部分相对应,那么相关之处可以参见方法部分的描述。
本领域技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,可以取决于技术方案的特定应用和设计约束条件。技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能,但是这种实现不应认为超出本申请实施例的范围。技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本文所披露的实施例中,所揭露的方法、产品(包括但不限于装置、设备等),可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,可以仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例。另外,在本申请实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
附图中的流程图和框图显示了根据本申请实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。在附图中的流程图和框图所对应的描述中,不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生,有时不同的操作或步骤之间不存在特定的顺序。例如,两个连续的操作或步骤实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
Claims (10)
1.一种用于图像处理的方法,其特征在于,方法包括:
获取证件图像的一维扫描数据,一维扫描数据为根据预设步长对证件图像进行一维数据扫描得到的;
将证件图像的一维扫描数据进行二值化处理;
根据二值化处理得到的图像数据,确定证件图像中的目标空白区域;
根据目标空白区域,确定证件图像中含有字符内容的字符区域。
2.根据权利要求1所述的图像处理的方法,其特征在于,根据空白区域,确定证件图像中含有字符内容的字符区域,包括:
根据目标空白区域确定第一关键点;
根据第一关键点,确定第一边界线和第二边界线;
根据第一边界线和第二边界线,确定字符区域。
3.根据权利要求2所述的图像处理的方法,其特征在于,根据第一关键点,确定第一边界线和第二边界线,包括:
根据第一关键点,确定第一字符的第一边界点和第二边界点;
根据第一边界点确定第一边界线,以及根据第二边界点,确定第二边界线;
其中,第一字符为最接近第一关键点的字符,第一边界点和第二边界点为第一字符沿第二方向的两个顶点。
4.根据权利要求3所述的图像处理的方法,其特征在于,根据第一边界点确定第一边界线,包括:
根据第一边界点,确定第二字符的第三边界点,第三边界点和第一边界点间隔第一距离;
根据第一边界点和第三边界点,确定第三方向;
根据第一边界点和第三方向,拟合得到第一边界线;
其中,第二字符和第一字符的相对方位与第一字符与目标空白区域的相对方位相同,第三边界点为第二字符沿第二方向的一个顶点。
5.根据权利要求2所述的图像处理的方法,其特征在于,根据第一边界线和第二边界线,确定字符区域,包括:
在第一边界线和第二边界线符合第一约束条件的情况下,根据第一边界线和第二边界线,确定第三边界线和第四边界线;
根据第一边界线、第二边界线、第三边界线和第四边界线确定字符区域。
6.根据权利要求5所述的图像处理的方法,其特征在于,根据第一边界线和第二边界线,确定第三边界线和第四边界线,包括:
将第一边界线和第二边界线范围内的字符数据沿第二方向投影至第一边界线;
确定字符数据在第一边界线上的两个边界点;
根据两个边界点和第二方向,确定第三边界线和第四边界线。
7.根据权利要求2至6中任一项所述的图像处理的方法,其特征在于,对一维扫描数据进行二值化处理,并根据二值化后获取的图像数据,确定目标空白区域,包括:
根据图像数据确定多个空白区域;
从多个空白区域中确定符合目标条件的目标空白区域;
其中,目标条件为空白区域的背景宽度,与空白区域沿第一方向相邻的前景区域的宽度的比值大于第一阈值。
8.根据权利要求7所述的图像处理的方法,其特征在于,根据目标白区域确定第一关键点,包括:
根据一维数据扫描线与目标空白区域的交点,以及目标空白区域的背景区域和前景区域的相对位置关系,确定第一关键点。
9.一种用于图像处理的装置,包括处理器和存储有程序指令的存储器,其特征在于,处理器被配置为在运行程序指令时,执行如权利要求1至8中任一项所述的用于图像处理的方法。
10.一种电子设备,其特征在于,包括:
如权利要求9所述的用于图像处理的装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311253826.4A CN117351491A (zh) | 2023-09-26 | 2023-09-26 | 用于图像处理的方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311253826.4A CN117351491A (zh) | 2023-09-26 | 2023-09-26 | 用于图像处理的方法、装置和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117351491A true CN117351491A (zh) | 2024-01-05 |
Family
ID=89356687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311253826.4A Pending CN117351491A (zh) | 2023-09-26 | 2023-09-26 | 用于图像处理的方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117351491A (zh) |
-
2023
- 2023-09-26 CN CN202311253826.4A patent/CN117351491A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8155443B2 (en) | Image extracting apparatus, image extracting method and computer readable medium | |
US7164795B2 (en) | Apparatus for extracting ruled line from multiple-valued image | |
US9053361B2 (en) | Identifying regions of text to merge in a natural image or video frame | |
KR101690981B1 (ko) | 형태 인식 방법 및 디바이스 | |
CN111461131B (zh) | 身份证号码信息识别方法、装置、设备及存储介质 | |
US20150371100A1 (en) | Character recognition method and system using digit segmentation and recombination | |
CA2401065C (en) | Document matching and annotation lifting | |
US20060078204A1 (en) | Image processing apparatus and method generating binary image from a multilevel image | |
CN115223172A (zh) | 文本提取方法、装置及设备 | |
US6035064A (en) | Apparatus and method for detecting and recognizing character line using simplified projection information | |
KR20010015025A (ko) | 문자인식장치의 문자추출방법 및 장치 | |
CN117351491A (zh) | 用于图像处理的方法、装置和电子设备 | |
CN110321887B (zh) | 文档图像处理方法、文档图像处理装置及存储介质 | |
CN112215783B (zh) | 一种图像噪点识别方法、装置、存储介质及设备 | |
CN102682308B (zh) | 图像处理方法和图像处理设备 | |
EP3267360A1 (en) | Systems and methods for strike through detection | |
JPH11219435A (ja) | 自動車用白線検出装置 | |
CN109409247B (zh) | 交通标志识别方法和装置 | |
CN117291944B (zh) | 图像处理方法及相关设备 | |
JP2003016385A (ja) | 画像処理装置、方法、プログラム、及び記憶媒体 | |
JP2023034823A (ja) | 画像処理装置、画像処理装置の制御方法およびプログラム | |
JPS6343788B2 (zh) | ||
CN117252767A (zh) | 文本图片矫正方法及装置 | |
JP2918363B2 (ja) | 文字分類方法及び文字認識装置 | |
JP2964980B2 (ja) | 光学的文字認識における直線成分検出方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |