CN111914764B - 图像处理方法、图像处理装置、电子设备和存储介质 - Google Patents
图像处理方法、图像处理装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN111914764B CN111914764B CN202010776656.8A CN202010776656A CN111914764B CN 111914764 B CN111914764 B CN 111914764B CN 202010776656 A CN202010776656 A CN 202010776656A CN 111914764 B CN111914764 B CN 111914764B
- Authority
- CN
- China
- Prior art keywords
- pixel
- image
- intersection
- pixels
- selected pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 63
- 238000003672 processing method Methods 0.000 title claims abstract description 47
- 238000012937 correction Methods 0.000 claims abstract description 235
- 230000004044 response Effects 0.000 claims description 47
- 238000004891 communication Methods 0.000 claims description 42
- 230000015654 memory Effects 0.000 claims description 24
- 238000012887 quadratic function Methods 0.000 claims description 13
- 238000000034 method Methods 0.000 description 27
- 238000010586 diagram Methods 0.000 description 25
- 101001076732 Homo sapiens RNA-binding protein 27 Proteins 0.000 description 12
- 102100025873 RNA-binding protein 27 Human genes 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 101100298824 Caenorhabditis elegans rpt-1 gene Proteins 0.000 description 10
- 101100482085 Mus musculus Trim30a gene Proteins 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- ORTYMGHCFWKXHO-UHFFFAOYSA-N diethadione Chemical compound CCC1(CC)COC(=O)NC1=O ORTYMGHCFWKXHO-UHFFFAOYSA-N 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 101100191590 Caenorhabditis elegans rpt-2 gene Proteins 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000002902 bimodal effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/80—Geometric correction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/164—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/60—Rotation of whole images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/1607—Correcting image deformation, e.g. trapezoidal deformation caused by perspective
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20004—Adaptive image processing
- G06T2207/20008—Globally adaptive
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20004—Adaptive image processing
- G06T2207/20012—Locally adaptive
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Image Processing (AREA)
- Geometry (AREA)
Abstract
一种图像处理方法、图像处理装置、电子装置、存储介质。图像处理方法包括:获取输入图像,输入图像包括M个字符行;对输入图像进行全局校正处理,以得到中间校正图像;对中间校正图像进行局部调整,以得到目标校正图像。对中间校正图像进行局部调整,以得到目标校正图像,包括:确定M个字符行下边界;根据M个字符行下边界、中间校正图像的第一图像边界和第二图像边界,确定中间校正图像中的所有像素的相对偏移量;根据中间校正图像中的所有像素的相对偏移量,确定中间校正图像中的所有像素的局部调整偏移量;根据中间校正图像中的所有像素的局部调整偏移量对中间校正图像进行局部调整,以得到目标校正图像。
Description
技术领域
本公开的实施例涉及一种图像处理方法、图像处理装置、电子装置、非瞬时性计算机可读存储介质。
背景技术
随着数字化技术的发展,可以将纸质文件进行扫描或拍摄以转换为电子的文本图像,电子的文本图像易于存储和在互联网中传输。此外,可以利用文本识别技术等对文本图像进行识别,以获取文本图像记载的信息。然而,在将纸质文件转换为文本图像的过程中,可能导致文本图像倾斜等情况,这种倾斜则会对文本图像的分析(例如,文字识别等)等处理产生不利的影响。因此,需要对文本图像进行校正,从而使得文本图像记载的信息被更加准确的存储和传输。
发明内容
本公开至少一个实施例提供一种图像处理方法,包括:获取输入图像,其中,所述输入图像包括M个字符行,所述M个字符行中的每个字符行包括至少一个字符,所述M个字符行沿第一方向排列,M为正整数;对所述输入图像进行全局校正处理,以得到中间校正图像;对所述中间校正图像进行局部调整,以得到目标校正图像,其中,对所述中间校正图像进行局部调整,以得到目标校正图像,包括:根据所述中间校正图像,确定与所述M个字符行对应的M个字符行下边界;基于所述中间校正图像,确定局部调整基准线、所述中间校正图像的第一图像边界和第二图像边界,其中,所述第一图像边界和所述第二图像边界为所述中间校正图像的在所述第一方向上的两个边界;根据所述第一图像边界、所述第二图像边界和所述M个字符行下边界,确定所述中间校正图像中的所有像素的相对偏移量;设定所述局部调整基准线上的所有像素的局部调整偏移量为预定值;根据所述局部调整基准线上的所有像素的局部调整偏移量和所述中间校正图像中的所有像素对应的相对偏移量,确定所述中间校正图像中所述局部调整基准线之外的所有像素的局部调整偏移量;根据所述中间校正图像中所述局部调整基准线之外的所有像素的局部调整偏移量和所述局部调整基准线上的所有像素的局部调整偏移量对所述中间校正图像进行局部调整,以得到所述目标校正图像。
本公开至少一实施例提供一种图像处理装置,包括:获取模块,用于获取输入图像,其中,所述输入图像包括M个字符行,所述M个字符行中的每个字符行包括至少一个字符,所述M个字符行沿第一方向排列,M为正整数;全局校正模块,用于对所述输入图像进行全局校正处理,以得到中间校正图像;局部调整模块,用于对所述中间校正图像进行局部调整,以得到目标校正图像;其中,所述局部调整模块执行对所述中间校正图像进行局部调整,以得到目标校正图像的操作时,包括执行以下操作:根据所述中间校正图像,确定与所述M个字符行对应的M个字符行下边界;基于所述中间校正图像,确定局部调整基准线、所述中间校正图像的第一图像边界和第二图像边界,其中,所述第一图像边界和所述第二图像边界为所述中间校正图像的在所述第一方向上的两个边界;根据所述第一图像边界、所述第二图像边界和所述M个字符行下边界,确定所述中间校正图像中的所有像素的相对偏移量;设定所述局部调整基准线上的所有像素的局部调整偏移量为预定值;根据所述局部调整基准线上的所有像素的局部调整偏移量和所述中间校正图像中的所有像素对应的相对偏移量,确定所述中间校正图像中所述局部调整基准线之外的所有像素的局部调整偏移量;根据所述中间校正图像中所述局部调整基准线之外的所有像素的局部调整偏移量和所述局部调整基准线上的所有像素的局部调整偏移量对所述中间校正图像进行局部调整,以得到所述目标校正图像。
本公开至少一实施例提供一种电子设备,包括:存储器,用于非瞬时性地存储计算机可读指令;处理器,用于运行所述计算机可读指令,所述计算机可读指令被所述处理器运行时实现根据本公开任一实施例所述的图像处理方法。
本公开至少一实施例提供一种非瞬时性计算机可读存储介质,其中,所述非瞬时性计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现根据本公开任一实施例所述的图像处理方法。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例的附图作简单地介绍,显而易见地,下面描述中的附图仅仅涉及本公开的一些实施例,而非对本公开的限制。
图1为本公开至少一实施例提供的一种图像处理方法的示意性流程图;
图2为图1所示的图像处理方法中的步骤S12的示意性流程图;
图3为本公开至少一实施例提供的一种输入图像的示意图;
图4A为本公开一些实施例提供的一种中间校正图像的示意图;
图4B为本公开一些实施例提供的一种中间字符连通图像的示意图;
图4C为本公开一些实施例提供的一种包括字符行下边界对应的多个像素的中间校正图像的示意图;
图4D为本公开一些实施例提供的一种包括字符行下边界的中间校正图像的示意图;
图4E为本公开一些实施例提供的一种示出了局部调整基准线、第一图像边界和第二图像边界的中间校正图像的示意图;
图5A为本公开至少一实施例提供的一种中间校正图像的一种局部示意图;
图5B为本公开至少一实施例提供的另一种中间校正图像的一种局部示意图;
图6A为本公开至少一实施例提供的一种中间校正图像的另一种示意图;
图6B为本公开至少一实施例提供的另一种中间校正图像的另一种示意图;
图6C为本公开至少一实施例提供的又一种中间校正图像的另一种示意图;
图6D为本公开至少一实施例提供的再一种中间校正图像的另一种示意图;
图7A为本公开至少一实施例提供的一种中间校正图像的又一种示意图;
图7B为本公开至少一实施例提供的另一种中间校正图像的又一种示意图;
图7C为本公开至少一实施例提供的又一种中间校正图像的又一种示意图;
图8A为本公开至少一实施例提供的一种中间校正图像的再一种示意图;
图8B为本公开至少一实施例提供的另一种中间校正图像的再一种示意图;
图8C为本公开至少一实施例提供的又一种中间校正图像的再一种示意图;
图9A为本公开一些实施例提供的一种输入图像的二值化图像的示意图;
图9B为本公开一些实施例提供的一种输入字符连通图像的示意图;
图10A为本公开一些实施例提供的一种示出M条中线的输入图像的示意图;
图10B为本公开一些实施例提供的一种示出W条第一等分线的输入图像的示意图;
图10C为本公开一些实施例提供的一种示出Q条第二等分线的输入图像的示意图;
图11A为本公开一些实施例提供的一种目标校正图像的示意图;
图11B为本公开一些实施例提供的一种全局校正和局部校正的示意图;
图12为本公开至少一实施例提供的一种图像处理装置的示意性框图;
图13为本公开至少一实施例提供的一种电子设备的示意性框图;
图14为本公开至少一实施例提供的一种非瞬时性计算机可读存储介质的示意图。
具体实施方式
为了使得本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例的附图,对本公开实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
除非另外定义,本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
为了保持本公开实施例的以下说明清楚且简明,本公开省略了部分已知功能和已知部件的详细说明。
本公开至少一实施例提供一种图像处理方法、图像处理装置、电子装置、非瞬时性计算机可读存储介质。该图像处理方法包括:获取输入图像,其中,输入图像包括M个字符行,M个字符行中的每个字符行包括至少一个字符,M个字符行沿第一方向排列,M为正整数;对输入图像进行全局校正处理,以得到中间校正图像;对中间校正图像进行局部调整,以得到目标校正图像。
对中间校正图像进行局部调整,以得到目标校正图像,包括:根据中间校正图像,确定与M个字符行对应的M个字符行下边界;基于中间校正图像,确定局部调整基准线、中间校正图像的第一图像边界和第二图像边界,其中,第一图像边界和第二图像边界为中间校正图像的在第一方向上的两个边界;根据第一图像边界、第二图像边界和M个字符行下边界,确定中间校正图像中的所有像素的相对偏移量;设定局部调整基准线上的所有像素的局部调整偏移量为预定值;根据局部调整基准线上的所有像素的局部调整偏移量和中间校正图像中的所有像素对应的相对偏移量,确定中间校正图像中局部调整基准线之外的所有像素的局部调整偏移量;根据中间校正图像中局部调整基准线之外的所有像素的局部调整偏移量和局部调整基准线上的所有像素的局部调整偏移量对中间校正图像进行局部调整,以得到目标校正图像。
在本公开实施例提供的图像处理方法中,首先对输入图像进行全局校正以得到中间校正图像,然后对中间校正图像进行局部调整,从而确定目标校正图像,局部调整可以针对在全局校正过程中忽略的细节进行一些补充校正,防止由于全局校正产生的细节丢失,全局校正后图像的部分细节的不光滑区域还是存在,没有对细节部分做校正,所以需要局部调整来进一步处理图像,以提高校正的准确性。
本公开实施例提供的图像处理方法可应用于本公开实施例提供的图像处理装置,该图像处理装置可被配置于电子设备上。该电子设备可以是个人计算机、移动终端等,该移动终端可以是手机、平板电脑等硬件设备。
下面结合附图对本公开的实施例进行详细说明,但是本公开并不限于这些具体的实施例。
图1为本公开至少一实施例提供的一种图像处理方法的示意性流程图,图2为图1所示的图像处理方法中的步骤S12的示意性流程图,图3为本公开至少一实施例提供的一种输入图像的示意图。
如图1所示,本公开的一实施例提供的图像处理方法包括步骤S10至S12。首先,在步骤S10,获取输入图像;在步骤S11,对输入图像进行全局校正处理,以得到中间校正图像;在步骤S12,对中间校正图像进行局部调整,以得到目标校正图像。
例如,在步骤S10中,输入图像包括M个字符行,M个字符行中的每个字符行包括至少一个字符,M为正整数。M个字符行沿第一方向排列,每个字符行中的字符可以沿第二方向排列,第一方向和第二方向可以大体上相互垂直。例如,第一方向可以为竖直方向,相应地,第二方向可以为水平方向;或者,第一方向为水平方向,第二方向可以为竖直方向。例如,如图3所示,在一些实施例中,第一方向可以为Y轴方向,即竖直方向,第二方向可以为X轴方向,即水平方向。
如图3所示,M个字符行可以包括字符“Privacy”、字符“Act”、字符“Statement”、字符“The”、字符“1974”、字符“requires”、字符“that”、字符“you”等,其中,字符“Privacy”、字符“Act”、字符“Statement”排列在同一字符行(例如,第一行),而字符“The”、字符“1974”、字符“requires”、字符“that”、字符“you”等排列在同一字符行(例如,第二行)。
例如,每个字符可以为数字、中文字(中文汉字、中文单词等)、外文字(例如,外文字母、外文单词等)、特殊字符(例如,百分号“%”)、标点符号、图形等。
例如,输入图像为用户对某一对象进行拍照所得的图像,该对象包括字符,对象例如可以是名片、试卷、文档、发票等。如图3所示,在一些实施例中,输入图像可以为对文档进行拍照所得的图像。
例如,在输入图像中,各个字符相对于水平方向或竖直方向可能产生倾斜。如图3所示,以输入图像的左上角为坐标原点确定一个第二坐标系OXY,X轴向右延伸,Y轴向下延伸,例如,水平方向可以为X轴方向,竖直方向可以为Y轴方向,字符“violation”、“or”、“potential”、“law”等排列为一行,而该字符行与水平方向(即X轴方向)之间的夹角为θ,即该字符行相对于水平方向倾斜的角度为θ。需要说明的是,在图3中,为了清楚示出第二坐标系OXY,第二坐标系OXY的原点和输入图像的左上角的像素并没有重叠在一起,然而,本领域技术人员应该知道,坐标系的原点可以和输入图像的左上角的像素重合。本公开不限于此,在另一些实施例中,第二坐标系OXY的原点也可以与输入图像的中心处的像素重合,也可以和输入图像的其他角的像素重合。
需要说明的是,第二坐标系OXY也可以适用于本公开描述的中间校正图像、目标校正图像等各种图像,即基于中间校正图像而确定的第一坐标系和第二坐标系OXY可以为同一个坐标系,但本公开不限于,第一坐标系和第二坐标系OXY也可以分别为两个不同的坐标系。第一坐标系和第二坐标系OXY可以均为直角坐标系。在本公开的实施例的描述中,以第一坐标系和第二坐标系OXY为同一个坐标系为例进行说明。
例如,输入图像的形状可以为矩形等。输入图像的形状和尺寸等可以由用户根据实际情况自行设定。
例如,输入图像可以为通过数码相机或手机拍摄的图像,输入图像可以为灰度图像,也可以为彩色图像。例如,输入图像可以为图像采集装置直接采集到的原始图像,也可以是对原始图像进行预处理之后获得的图像。例如,为了避免输入图像的数据质量、数据不均衡等对于图像处理的影响,在处理输入图像前,该图像处理方法还可以包括对输入图像进行预处理的操作。预处理可以消除输入图像中的无关信息或噪声信息,以便于更好地对输入图像进行处理。
图4A为本公开一些实施例提供的一种中间校正图像的示意图;图4B为本公开一些实施例提供的一种中间字符连通图像的示意图。
例如,如图2所示,在一些实施例中,步骤S12可以包括步骤S120~S125。
在本公开实施例提供的图像处理方法中,通过对全局校正后的中间校正图像进行局部调整,可以减少字符(例如,文本)形变,提高校正效果。
例如,如图2所示,步骤S120:根据中间校正图像,确定与M个字符行对应的M个字符行下边界。
例如,步骤S120可以包括:对中间校正图像进行字符连接处理,以得到中间字符连通图像,其中,中间字符连通图像包括与M个字符行对应的M个中间字符连通区域;根据M个中间字符连通区域和中间校正图像,确定与M个字符行对应的M个字符行下边界。
例如,如图4A所示,在一些实施例中,中间校正图像可以为二值化图像。在该中间校正图像中,字符对应的像素用白色表示,背景对应的像素用黑色表示,也就是说,字符对应的像素的灰阶值为255,背景对应的像素的灰阶值为0。
例如,在步骤S120中,当中间校正图像可以为二值化图像时,可以直接基于数学形态学(morphology)运算对中间校正图像进行字符连接处理,以得到包括M个中间字符连通区域的中间字符连通图像。图4B所示的中间字符连通图像为对图4A所示的中间校正图像进行字符连接处理后得到的图像。
需要说明的是,本公开不限于中间校正图像为二值化图像,在另一些实施例中,中间校正图像也可以为灰度图像或者彩色图像,此时,在步骤S120中,对中间校正图像进行字符连接处理,以得到中间字符连通图像,可以包括:首先,对中间校正图像进行二值化处理,以得到中间校正图像的二值化图像,然后,对中间校正图像的二值化图像进行字符连通处理,以得到中间字符连通图像。
例如,如图4B所示,白色区域即为中间字符连通区域。例如,每个中间字符连通区域可以包括位于同一行的多个字符,M个字符行和M个中间字符连通区域一一对应,也就是说,每个字符行仅对应一个中间字符连通区域。
例如,字符连接处理可以对中间校正图像进行膨胀运算处理,从而将间隔的多个字符连成一条直线,以便于后续进行直线检测;此外,字符连接处理还可以采用其他方式来进行处理,例如采用Mask-RCNN等神经网络模型。
例如,如图4B所示,M个中间字符连通区域沿第一方向(即图3所示的第二坐标系OXY的Y轴方向)排列。
例如,在步骤S120中,基于M个中间字符连通区域可以确定M个中间字符连通区域对应的区域下边界,基于中间校正图像可以确定各个字符行所处的大致范围,根据区域下边界和各个字符行所处的大致范围,从而确定各个字符行对应的字符行下边界。
图4C为本公开一些实施例提供的一种包括字符行下边界对应的多个像素的中间校正图像的示意图,图4D为本公开一些实施例提供的一种包括字符行下边界的中间校正图像的示意图。
例如,在步骤S120中,在一些实施例中,根据M个中间字符连通区域和中间校正图像,确定与M个字符行对应的M个字符行下边界,包括:确定与M个中间字符连通区域一一对应的M个区域下边界;根据M个区域下边界和中间校正图像,对M个字符行执行边界拟合处理,以得到M个字符行下边界。
例如,M个字符行包括第i1个字符行,第i1个字符行和M个区域下边界中的第i1个区域下边界对应的中间字符连通区域对应,i1为正整数且小于等于M。
例如,对第i1个字符行执行边界拟合处理包括:获取第i1个字符行中各个字符的距离第i1个区域下边界最近的多个像素;去除多个像素中的噪声像素,以得到目标像素;对目标像素进行线性或二次拟合,以得到第i1个字符行对应的字符行下边界。
例如,在一些实施例中,对目标像素进行局部线性或二次拟合,以得到第i1个字符行对应的字符行下边界,包括:分别对第i1个字符行中的各个字符对应的目标像素进行局部线性或二次拟合,以得到第i1个字符行中的各个字符对应的各个字符拟合边界;然后,对各个字符拟合边界进行线性或二次拟合以得到第i1个字符行对应的字符行下边界。
例如,在另一些实施例中,对目标像素进行局部线性或二次拟合,以得到第i1个字符行对应的字符行下边界,包括:对第i1个字符行中的各个字符对应的目标像素整体进行线性或二次拟合,以直接得到第i1个字符行对应的字符行下边界。
需要说明的是,对于弯曲比较厉害的字符行,线性拟合是不够的。线性拟合和二次拟合是根据采集到的字符行中距离对应的区域下边界最近的像素点的密度进行设置的,如果采集到的字符行中距离对应的区域下边界最近的像素点较多,就采用二次拟合;如果采集到的字符行中距离对应的区域下边界最近的像素点较少,就采用线性拟合。例如,可以设定一个密度阈值,如果像素点的密度超过了密度阈值,就采用二次拟合。每个像素点的拟合是采用附近局部的几个像素点进行拟合的。对于二次拟合,还有判断异常,比如,如果二次拟合得到的二次项系数太大,就放弃二次拟合的结果,改用线性拟合;或者二次拟合得到的二次线条在插值点处与实际点偏移量太大,也放弃二次拟合的结果,改用线性拟合。
例如,如图4C所示,各个字符行底部的各个黑点、黑短线即为各个字符的距离区域下边界最近的像素。需要说明的是,有些字符中的字母对应的像素可能不具有距离区域下边界最近的像素,如图4C所示,位于第一行中的字符“Privacy”中的字母P和字母r对应的所有像素均不是距离区域下边界最近的像素。
例如,在步骤S120中,每个中间字符连通区域的区域下边界表示该中间字符连通区域的远离第二坐标系OXY的X轴的边界;每个字符行的字符行下边界表示该字符行的远离第二坐标系OXY的X轴的边界。
例如,区域下边界可能并不是一条直线段,而可能是具有细小的波浪形、锯齿形等形状的线段,也可能是具有不规则形状的线段。
例如,在一些实施例中,获取第i1个字符行中各个字符的距离第i1个区域下边界最近的多个像素可以包括:在Y轴方向上,获取第i1个字符行中各个字符的距离第i1个区域下边界最近的多个像素。例如,在Y轴方向上,获取第i1个字符行中各个字符的多个像素中的任意一个像素所在的像素列上距离第i1个区域下边界最近的像素。
例如,去除多个像素中的噪声像素,以得到目标像素,可以包括:按照预定规则去除多个像素中的噪声像素,以得到目标像素。例如,若多个像素中相邻两个像素构成的直线的斜率大于斜率阈值,则该相邻两个像素为噪声像素,此外,若多个像素中的某个像素距离第i1个区域下边界的距离大于距离阈值,则该某个像素也为噪声像素。例如,预定规则可以包括斜率阈值和距离阈值等,斜率阈值和距离阈值可以由用户根据实际情况设置。
需要说明的是,“相邻两个像素”并不表示该两个像素在物理位置上直接相邻,而是表示该相邻两个像素位于不同像素列,例如,若相邻两个像素分别位于第a像素列和第a+b像素列,a为正整数,b为正整数,例如,当b为1时,则该相邻两个像素位于相邻两个像素列,此时,相邻两个像素在物理位置上相邻;当b不为1时,则该相邻两个像素在物理位置上则不相邻。相邻两个像素在物理位置上可以彼此不接触,也可以彼此接触,本公开对此不作具体限制,例如,该相邻两个像素中的一个像素位于第a像素列的第1行,而该相邻两个像素中的另一个像素位于第a+b像素列的第5行,此时,相邻两个像素在物理位置上彼此不接触;若b为1,且该相邻两个像素中的一个像素位于第a像素列的例如第1行,而该相邻两个像素中的另一个像素位于第a+b像素列的例如第1行,此时,相邻两个像素在物理位置上彼此接触。
例如,如图4D所示,每个字符行下方的线条即为拟合得到的该字符行对应的字符行下边界,字符行下边界可能并不是一条直线段,而可能是具有细小的波浪形、锯齿形等形状的线段,也可能是具有不规则形状的线段。需要说明的是,为了清楚示出字符行下边界,图4D所示的中间校正图像并没有体现为二值化图像的形式。
例如,图4D示出了中间校正图像中的所有字符行的字符行下边界。字符行下边界与该字符行下边界对应的字符行可以不交叠,也可以部分交叠,例如,字符“Privacy”所在的字符行(例如,第一行)对应的字符行下边界和字符“Privacy”中的表示字母“y”所有像素中的部分像素交叠。
例如,相邻两个字符行对应的两个字符行下边界可以彼此间隔一定距离。需要说明的是,在多个字符行下边界中,可以具有彼此平行的字符行下边界。本公开对字符行下边界的参数不作具体限制,字符行下边界的长度、斜率等参数可以基于该字符行下边界对应的字符行确定。
图4E为本公开一些实施例提供的一种示出了局部调整基准线、第一图像边界和第二图像边界的中间校正图像的示意图。
例如,如图2所示,步骤S121:基于中间校正图像,确定局部调整基准线、中间校正图像的第一图像边界和第二图像边界,其中,第一图像边界和第二图像边界为中间校正图像的在第一方向上的两个边界。
例如,在步骤S121中,确定局部调整基准线包括:将中间校正图像的沿第一方向(即Y轴方向)延伸的中线作为局部调整基准线。确定中间校正图像的第一图像边界和第二图像边界包括:将中间校正图像的在第一方向上的两个边界分别作为第一图像边界和第二图像边界。
例如,如图4E所示,在一些实施例中,第一图像边界B1为图4E所示的中间校正图像上侧的边界,第二图像边界B2为图4E所示的中间校正图像下侧的边界。例如,第一图像边界B1和第二图像边界B2可以均为直线。例如,第一图像边界B1和第二图像边界B2的具体形状和位置关系可以根据中间校正图像的形状确定,本公开对此不作具体限制,例如,如图4E所示,在一些实施例中,中间校正图像的形状为矩形,从而第一图像边界B1和第二图像边界B2均为直线段,且彼此平行。
需要说明的是,在图4E中,为了明确地示出第一图像边界B1和第二图像边界B2,表示第一图像边界B1和第二图像边界B2的直线段较宽,但是,在实际应用中,例如,第一图像边界B1为一行像素,第二图像边界B2也为一行像素。
例如,如图2所示,步骤S122:根据第一图像边界、第二图像边界和M个字符行下边界,确定中间校正图像中的所有像素的相对偏移量。
例如,如图4E所示,中间校正图像还具有第三图像边界B3,第三图像边界B3为中间校正图像的在与第一方向(即Y轴方向)垂直的第二方向(即X轴方向)上的一个边界,图4E所示的第三图像边界B3为中间校正图像的右侧的边界。例如,第三图像边界B3与第一图像边界B1互相垂直,且与第二图像边界B2互相垂直。
例如,第三图像边界B3具体形状和位置关系可以根据中间校正图像的形状确定,本公开对此不作具体限制,例如,如图4E所示,在一些实施例中,中间校正图像的形状为矩形,从而第三图像边界B3也为直线段。
需要说明的是,在本公开中,“左侧”和“右侧”是从观看者的角度进行划分的。
例如,中间校正图像包括排列为多行多列的像素。中间校正图像中的像素的行方向为X轴方向,中间校正图像中的像素的列方向为Y轴方向。
例如,M个字符行下边界中的每个字符行下边界包括基准像素,例如,如图4E所示出的基准像素RP1和RP2,每个字符行下边界的基准像素为每个字符行下边界的距离第三图像边界B3最近的像素。每个字符行下边界具有一个基准像素,也就是说,M个字符行下边界具有M个基准像素,且M个基准像素与M个字符行下边界一一对应。M个基准像素中的一部分基准像素可以位于同一像素列,M个基准像素中的一部分基准像素也可以分别位于不同的像素列,例如,图4E所示出的基准像素RP1和基准像素RP2分别位于不同的像素列。
例如,在一些实施例中,步骤S122包括:根据M个字符行下边界上的各个像素的位置,确定M个字符行下边界上除了M个字符行下边界的基准像素之外的所有像素的相对偏移量;基于M个字符行下边界上除了M个字符行下边界的基准像素之外的所有像素的相对偏移量、第一图像边界和第二图像边界,确定中间校正图像中M个字符行下边界之外的其余像素和M个字符行下边界的基准像素的相对偏移量。
例如,中间校正图像中的所有像素的相对偏移量包括M个字符行下边界上的各个像素的相对偏移量和M个字符行下边界之外的其余像素的相对偏移量。
例如,像素的位置表示像素在第二坐标系OXY中的坐标值,例如,Y轴坐标值。
例如,在步骤S122中,根据M个字符行下边界上的各个像素的位置,确定M个字符行下边界上除了M个字符行下边界的基准像素之外的所有像素的相对偏移量,包括:针对M个字符行下边界中的第t1个字符行下边界,获取第t1个字符行下边界上的第a1个像素,其中,第a1个像素不是第t1个字符行下边界的基准像素,t1为正整数且小于等于M,a1为正整数且小于等于第t1个字符行下边界上的所有像素的数量;响应于第a1个像素所在的像素列和第t1个字符行下边界的基准像素所在的像素列相邻,根据第t1个字符行下边界的基准像素和第a1个像素之间的位置关系,确定第a1个像素对应的相对偏移量;响应于第a1个像素所在的像素列和第t1个字符行下边界的基准像素所在的像素列不相邻,获取第t1个字符行下边界上的第a2个像素,根据第a1个像素和第a2个像素之间的位置关系,确定第a1个像素对应的相对偏移量,其中,第a2个像素不是第t1个字符行下边界的基准像素,第a2个像素位于第a1个像素的靠近第t1个字符行下边界的基准像素的一侧,且第a1个像素所在的像素列和第a2个像素所在的像素列相邻。
分别对M个字符行下边界中的每个字符行下边界中的每个像素进行上述处理,从而确定M个字符行下边界上除了M个字符行下边界的基准像素之外的所有像素的相对偏移量。
图5A为本公开至少一实施例提供的一种中间校正图像的一种局部示意图;图5B为本公开至少一实施例提供的另一种中间校正图像的一种局部示意图。
例如,如图5A和图5B所示,中间校正图像的M个字符行下边界包括第t1个字符行下边界。像素RPt1表示第t1个字符行下边界的基准像素。第a1个像素Pa1和第a2个像素Pa2表示第t1个字符行下边界上的两个相邻的像素。
例如,如图5A所示,中间校正图像的M个字符行下边界还包括第t10个字符行下边界,第a3个像素Pa3和第a4个像素Pa4表示第t10个字符行下边界上的两个相邻的像素,第a1个像素Pa1和第a3个像素Pa3所在的像素列为像素列m1,第a2个像素Pa2和第a4个像素Pa4所在的像素列为像素列m2。第a1个像素Pa1和第a2个像素Pa2可以位于同一行,也可以位于不同行,第a3个像素Pa3和第a4个像素Pa4可以位于同一行,也可以位于不同行,其根据实际情况确定。
例如,在一个示例中,如图5A所示,在第a1个像素Pa1所在的像素列和第t1个字符行下边界的基准像素RPt1所在的像素列不相邻的情况下,获取第t1个字符行下边界上的第a2个像素Pa2,根据第a1个像素Pa1和第a2个像素Pa2之间的位置关系,确定第a1个像素Pa1对应的相对偏移量,即,第a1个像素Pa1对应的相对偏移量表示为:
ddPa1=dyPa1-dyPa2=(yPa1-y(ref))-(yPa2-y(ref))=yPa1-yPa2,
其中,ddPa1表示第a1个像素Pa1的相对偏移量,dyPa1表示第a1个像素Pa1的局部调整偏移量,dyPa2表示第a2个像素Pa2的局部调整偏移量,yPa1表示第a1个像素Pa1在第二坐标系OXY中的Y轴坐标值,yPa2表示第a2个像素Pa2在第二坐标系OXY中的Y轴坐标值,y(ref)表示参考点在第二坐标系OXY中的Y轴坐标值。这里的y(ref)是假设的某一个参考点,该参考点用于计算各个像素的相对偏移量。该参考点可以根据实际情况设置,具体位置不作限制。
第a2个像素Pa2位于第a1个像素Pa1的靠近第t1个字符行下边界的基准像素RPt1的一侧,也就是说,在第t1个字符行下边界上,第a2个像素Pa2位于第a1个像素Pa1和基准像素RPt1之间。第a1个像素所在的像素列m1和第a2个像素所在的像素列m2相邻。
类似地,第a3个像素Pa3的相对偏移量表示为:
ddPa3=yPa3-yPa4,
其中,ddPa3表示第a3个像素Pa3的相对偏移量,yPa3表示第a3个像素Pa3在第二坐标系OXY中的Y轴坐标值,yPa4表示第a4个像素Pa4在第二坐标系OXY中的Y轴坐标值。
也就是说,中间校正图像中的字符行下边界上每个像素的相对偏移量表示该像素的Y轴坐标值减去位于该像素所在像素列的右侧相邻的像素列上,且与该像素在同一字符行下边界上的像素的Y轴坐标值。
本公开不限于此,在另一个示例中,第a1个像素Pa1的相对偏移量也可以表示为:ddPa1=yPa2-yPa1,第a3个像素Pa3的相对偏移量也可以表示为:ddPa3=yPa4-yPa3,此时,中间校正图像中的字符行下边界上每个像素的相对偏移量表示位于该像素所在像素列的右侧相邻的像素列上,且与该像素在同一字符行下边界上的像素的Y轴坐标值减去该像素的Y轴坐标值。
在本公开的实施例中,以中间校正图像中的字符行下边界上每个像素的相对偏移量表示该像素的Y轴坐标值减去位于该像素所在像素列的右侧相邻的像素列上,且与该像素在同一字符行下边界上的像素的Y轴坐标值为例进行说明。
值得注意的是,对于第t1个字符行下边界的基准像素RPt1,由于,该第t1个字符行下边界上不存在位于基准像素RPt1右侧的像素,因此,此时,无法计算该基准像素RPt1的相对偏移量,基准像素RPt1的相对偏移量可以在后续插值方式中计算得到。
需要说明的是,图5A仅示意性的示出了两个字符行下边界,但是本公开不限于此,中间校正图像中的字符行下边界的数量和位置等可以根据实际情况确定。此外,为了清楚示出第a1个像素Pa1、第a2个像素Pa2、第a3个像素Pa3和第a4个像素Pa4,第a1个像素Pa1和第a2个像素Pa2之间具有较大间隔,第a3个像素Pa3和第a4个像素Pa4之间也具有较大间隔,然而,应该理解的是,实际上,第a1个像素Pa1和第a2个像素Pa2是相邻的,第a3个像素Pa3和第a4个像素Pa4也是相邻的,也就是说,像素列m1和像素列m2是在物理位置上直接相邻的,像素列m1和像素列m2之间不存在其他像素列。
需要说明的是,在本公开的实施例中,中间校正图像上的字符行下边界上的某个像素的“相对偏移量”可以表示某个像素在第二坐标系OXY中的Y轴坐标值和位于该某个像素所在像素列的右侧相邻的像素列上,且与该像素在同一字符行下边界上的像素在第二坐标系OXY中的Y轴坐标值的差值。中间校正图像上的某个像素的“局部调整偏移量”可以表示该某个像素在第二坐标系OXY中的Y轴方向的需要被调整的偏移量。
如图5B所示,在第a1个像素Pa1所在的像素列和第t1个字符行下边界的基准像素RPt1所在的像素列相邻的情况下,根据第t1个字符行下边界的基准像素RPt1和第a1个像素Pa1之间的位置关系,确定第a1个像素Pa1对应的相对偏移量,即,第a1个像素Pa1对应的相对偏移量表示为:
ddPa1=yPa1-yRPt1,
其中,ddPa1表示第a1个像素Pa1的相对偏移量,yPa1表示第a1个像素Pa1在第二坐标系OXY中的Y轴坐标值,yRPt1表示基准像素RPt1在第二坐标系OXY中的Y轴坐标值。
图6A为本公开至少一实施例提供的一种中间校正图像的另一种示意图;图6B为本公开至少一实施例提供的另一种中间校正图像的另一种示意图;图6C为本公开至少一实施例提供的又一种中间校正图像的另一种示意图;图6D为本公开至少一实施例提供的再一种中间校正图像的另一种示意图。
例如,在一些实施例中,如图6A~6D所示,M个字符行下边界包括第t2个字符行下边界,其中,t2为正整数且小于等于M。
例如,在步骤S122中,基于M个字符行下边界上除了M个字符行下边界的基准像素之外的所有像素的相对偏移量、第一图像边界和第二图像边界,确定中间校正图像中M个字符行下边界之外的其余像素和M个字符行下边界的基准像素的相对偏移量,包括:获取位于第t2个字符行下边界上的第一被选择像素,并确定第一被选择像素所在的第一被选择像素列;确定在第一被选择像素列上与第一被选择像素对应的第一交点像素和第二交点像素;响应于第一交点像素位于第一图像边界上和第二交点像素位于第二图像边界上,根据第一图像边界和第二图像边界之间的距离、第一被选择像素和第一交点像素之间的距离和第一被选择像素的相对偏移量,确定第一交点像素的相对偏移量,根据第一被选择像素的相对偏移量和第一交点像素的相对偏移量,确定在第一被选择像素列中位于第一被选择像素和第一交点像素之间的所有像素的相对偏移量;根据第一图像边界和第二图像边界之间的距离、第一被选择像素和第二交点像素之间的距离和第一被选择像素的相对偏移量,确定第二交点像素的相对偏移量,根据第一被选择像素的相对偏移量和第二交点像素的相对偏移量,确定在第一被选择像素列中位于第一被选择像素和第二交点像素之间的所有像素的相对偏移量;响应于第一交点像素位于第一图像边界或第二图像边界上且第二交点像素位于M个字符行下边界中的某个字符行下边界上,根据第一图像边界和第二图像边界之间的距离、第一被选择像素和第一交点像素之间的距离和第一被选择像素的相对偏移量,确定第一交点像素的相对偏移量;根据第一被选择像素的相对偏移量和第一交点像素的相对偏移量,确定在第一被选择像素列中位于第一被选择像素和第一交点像素之间的所有像素的相对偏移量;根据第一被选择像素的相对偏移量和第二交点像素的相对偏移量,确定在第一被选择像素列中位于第一被选择像素和第二交点像素之间的所有像素的相对偏移量;响应于第一交点像素和第二交点像素分别位于M个字符行下边界中的某两个字符行下边界上,根据第一被选择像素的相对偏移量和第一交点像素的相对偏移量,确定在第一被选择像素列中位于第一被选择像素和第一交点像素之间的所有像素的相对偏移量,根据第一被选择像素的相对偏移量和第二交点像素的相对偏移量,确定在第一被选择像素列中位于第一被选择像素和第二交点像素之间的所有像素的相对偏移量。
例如,如图6A~6C所示,第一被选择像素Ps1所在的第一被选择像素列Psc1沿第一方向延伸,第一被选择像素Ps1不为第t2个字符行下边界的基准像素RPt2,即第一被选择像素Ps1和基准像素RPt2为不同的像素。
例如,在第一被选择像素列Psc1上与第一被选择像素Ps1对应的第一交点像素和第二交点像素分别为PC1和PC2;除了第一被选择像素Ps1,在第一被选择像素列Psc1上的第一交点像素PC1和第二交点像素PC2之间不存在其他位于字符行下边界上且不是字符行下边界的基准像素的像素,也就是说,在第一被选择像素列Psc1上,在第一交点像素PC1和第二交点像素PC2之间有且仅有第一被选择像素Ps1位于字符行下边界上,且不是基准像素。如图6D所示,在第一交点像素PC1和第一被选择像素Ps1之间,第一被选择像素列Psc1和字符行下边界t5之间具有交点像素PC3,然而,该交点像素PC3为字符行下边界t5的基准像素,即字符行下边界t5的最靠近第三图像边界B3的像素,则此时,第一交点像素PC1仍为第一被选择像素列Psc1和第一图像边界B1的交点。在后续计算第一交点像素PC1和第一被选择像素Ps1之间的所有像素的相对偏移量时,该交点像素PC3的相对于偏移量可以被计算得到。
例如,如图6A所示,在第一交点像素PC1位于第一图像边界B1上和第二交点像素PC2位于第二图像边界B2上的情况下,由于第一交点像素PC1和第二交点像素PC2分别位于第一图像边界B1和第二图像边界B2上,第一图像边界B1和第二图像边界B2上的所有像素的相对偏移量均未知,因此,首先需要计算第一交点像素PC1和第二交点像素PC2的相对偏移量,此时,根据第一图像边界B1和第二图像边界B2之间的距离H、第一被选择像素Ps1和第一交点像素PC1之间的距离h1和第一被选择像素Ps1的相对偏移量,确定第一交点像素PC1的相对偏移量,根据第一图像边界B1和第二图像边界B2之间的距离H、第一被选择像素Ps1和第二交点像素PC2之间的距离h2和第一被选择像素Ps1的相对偏移量,确定第二交点像素PC2的相对偏移量;然后,根据第一被选择像素Ps1的相对偏移量和第一交点像素PC1的相对偏移量进行线性插值,确定在第一被选择像素列Psc1中位于第一被选择像素Ps1和第一交点像素PC1之间的所有像素的相对偏移量;根据第一被选择像素Ps1的相对偏移量和第二交点像素PC2的相对偏移量进行线性插值,确定在第一被选择像素列Psc1中位于第一被选择像素Ps1和第二交点像素PC2之间的所有像素的相对偏移量。
例如,如图6A所示,第一图像边界B1和第二图像边界B2之间的距离H即为中间校正图像在Y轴方向的长度。
例如,在第一交点像素PC1位于第一图像边界B1或第二图像边界B2上且第二交点像素PC2位于M个字符行下边界中的某个字符行下边界上的情况下,如图6B所示,在一些示例中,第一交点像素PC1位于第一图像边界B1上,第二交点像素PC2位于M个字符行下边界中的某个字符行下边界t3上,由于第一交点像素PC1位于第一图像边界B1上,第一图像边界B1上的所有像素的相对偏移量均未知,而第二交点像素PC2位于字符行下边界t3上,且不是字符行下边界t3的基准像素,第二交点像素PC2的相对偏移量已经得到,因此,需要首先计算第一交点像素PC1的相对偏移量,此时,根据第一图像边界B1和第二图像边界B2之间的距离H、第一被选择像素Ps1和第一交点像素PC1之间的距离h1和第一被选择像素Ps1的相对偏移量,确定第一交点像素PC1的相对偏移量;然后,根据第一被选择像素Ps1的相对偏移量和第一交点像素PC1的相对偏移量进行线性插值,确定在第一被选择像素列Psc1中位于第一被选择像素Ps1和第一交点像素PC1之间的所有像素的相对偏移量;根据第一被选择像素Ps1的相对偏移量和第二交点像素PC2的相对偏移量进行线性插值,确定在第一被选择像素列Psc1中位于第一被选择像素Ps1和第二交点像素PC2之间的所有像素的相对偏移量。
例如,根据第一图像边界和第二图像边界之间的距离、第一被选择像素和第一交点像素之间的距离和第一被选择像素的相对偏移量,确定第一交点像素的相对偏移量,包括:响应于第一图像边界和第二图像边界之间的距离和第一被选择像素和第一交点像素之间的距离满足第一关系式,确定第一交点像素的相对偏移量为预定值;响应于第一图像边界和第二图像边界之间的距离和第一被选择像素和第一交点像素之间的距离满足第二关系式,确定第一交点像素的相对偏移量为第一被选择像素的相对偏移量。
例如,第一关系式表示为:
h1>H/DH,
第二关系式表示为:
h1≤H/DH,
其中,h1为第一交点像素PC1和第一被选择像素Ps1之间的距离,H为第一图像边界B1和第二图像边界B1之间的距离,DH为常数。
例如,在一个示例中,DH可以为10,预定值可以为0。
例如,根据第一图像边界和第二图像边界之间的距离、第一被选择像素和第二交点像素之间的距离和第一被选择像素的相对偏移量,确定第二交点像素的相对偏移量,包括:响应于第一图像边界和第二图像边界之间的距离和第一被选择像素和第二交点像素之间的距离满足第三关系式,确定第二交点像素的相对偏移量为预定值;响应于第一图像边界和第二图像边界之间的距离和第一被选择像素和第二交点像素之间的距离满足第四关系式,确定第二交点像素的相对偏移量为第一被选择像素的相对偏移量。
例如,第三关系式表示为:
h2>H/DH,
第四关系式表示为:
h2≤H/DH,
其中,h2为第二交点像素和第一被选择像素之间的距离。
例如,在一些实施例中,对于第一被选择像素列中的位于第一被选择像素和第一交点像素之间的所有像素的相对偏移量,在第一交点像素PC1位于第一图像边界B1上和第二交点像素PC2位于第二图像边界B2上,或者,第一交点像素PC1位于第一图像边界B1或第二图像边界B2上且第二交点像素PC2位于M个字符行下边界中的某个字符行下边界上(例如,字符行下边界t3)的情况下,即在图6A和图6B所示的示例中,根据第一被选择像素的相对偏移量和第一交点像素的相对偏移量,确定在第一被选择像素列中位于第一被选择像素和第一交点像素之间的所有像素的相对偏移量,包括:响应于第一图像边界和第二图像边界之间的距离和第一交点像素和第一被选择像素之间的距离满足第一关系式,对第一被选择像素的相对偏移量和第一交点像素的相对偏移量进行线性插值,以得到第一被选择像素列中的位于第一被选择像素和第一交点像素之间的所有像素的相对偏移量;响应于第一图像边界和第二图像边界之间的距离和第一交点像素和第一被选择像素之间的距离满足第二关系式,确定第一被选择像素列中的位于第一被选择像素和第一交点像素之间的所有像素的相对偏移量为第一被选择像素的相对偏移量。
在第一被选择像素Ps1和第一交点像素PC1之间的距离h1和第一图像边界B1和第二图像边界B2之间的距离H满足第一关系式的情况下,第一交点像素PC1的相对偏移量为0,然后,第一交点像素PC1和第一被选择像素Ps1之间的所有像素的相对偏移量为在0和第一被选择像素Ps1的相对偏移量之间进行线性插值得到,从而使得越靠近第一被选择像素Ps1的像素的相对偏移量越接近第一被选择像素Ps1的相对偏移量,越靠近第一交点像素PC1的像素的相对偏移量越接近第一交点像素PC1的相对偏移量,即0。
而在第一被选择像素Ps1和第一交点像素PC1之间的距离h1和第一图像边界B1和第二图像边界B2之间的距离H满足第二关系式的情况下,第一交点像素PC1的相对偏移量等于第一被选择像素Ps1的相对偏移量,也就是说,当第一被选择像素Ps1和第一交点像素PC1之间的距离较近时,可以将第一交点像素PC1的相对偏移量设置为第一被选择像素Ps1的相对偏移量,且此时第一交点像素PC1和第一被选择像素Ps1之间的所有像素的相对偏移量均相同,均为第一被选择像素Ps1的相对偏移量。
例如,在一些实施例中,对于第一被选择像素列中的位于第一被选择像素和第二交点像素之间的所有像素的相对偏移量,在第一交点像素PC1位于第一图像边界B1上和第二交点像素PC2位于第二图像边界B2上的情况下,即在图6A所示的示例中,根据第一被选择像素的相对偏移量和第二交点像素的相对偏移量,确定在第一被选择像素列中位于第一被选择像素和第二交点像素之间的所有像素的相对偏移量,包括:响应于第一图像边界和第二图像边界之间的距离和第二交点像素和第一被选择像素之间的距离满足第三关系式,对第一被选择像素的相对偏移量和第二交点像素的相对偏移量进行线性插值,以得到第一被选择像素列中的位于第一被选择像素和第二交点像素之间的所有像素的相对偏移量;响应于第一图像边界和第二图像边界之间的距离和第二交点像素和第一被选择像素之间的距离满足第四关系式,确定第一被选择像素列中的位于第一被选择像素和第二交点像素之间的所有像素的相对偏移量为第一被选择像素的相对偏移量。
在第一被选择像素Ps1和第二交点像素PC2之间的距离h2和第一图像边界B1和第二图像边界B2之间的距离H满足第三关系式的情况下,第二交点像素PC2的相对偏移量为0,然后,第二交点像素PC2和第一被选择像素Ps1之间的所有像素的相对偏移量为在0和第一被选择像素Ps1的相对偏移量之间进行线性插值得到,从而使得越靠近第一被选择像素Ps1的像素的相对偏移量越接近第一被选择像素Ps1的相对偏移量,越靠近第二交点像素PC2的像素的相对偏移量越接近第二交点像素PC2的相对偏移量,即0。
而在第一被选择像素Ps1和第二交点像素PC2之间的距离h2和第一图像边界B1和第二图像边界B2之间的距离H满足第四关系式的情况下,第二交点像素PC2的相对偏移量等于第一被选择像素Ps1的相对偏移量,也就是说,当第一被选择像素Ps1和第二交点像素PC2之间的距离较近时,可以将第二交点像素PC2的相对偏移量设置为第一被选择像素Ps1的相对偏移量,且此时第二交点像素PC2和第一被选择像素Ps1之间的所有像素的相对偏移量均相同,均为第一被选择像素Ps1的相对偏移量。
例如,在第一交点像素PC1位于第一图像边界B1或第二图像边界B2上且第二交点像素PC2位于M个字符行下边界中的某个字符行下边界上(例如,字符行下边界t3)的情况下,即在图6B所示的示例中,根据第一被选择像素的相对偏移量和第二交点像素的相对偏移量,确定在第一被选择像素列中位于第一被选择像素和第二交点像素之间的所有像素的相对偏移量,包括:对第一被选择像素的相对偏移量和第二交点像素的相对偏移量进行线性插值,以得到第一被选择像素列中的位于第一被选择像素和第二交点像素之间的所有像素的相对偏移量。
在第一被选择像素Ps1和第二交点像素PC2均位于字符行下边界上时,则第二交点像素PC2和第一被选择像素Ps1之间的所有像素的相对偏移量为在第二交点像素PC2的相对偏移量和第一被选择像素Ps1的相对偏移量之间进行线性插值得到。
例如,在第一交点像素PC1和第二交点像素PC2分别位于M个字符行下边界中的某两个字符行边界上的情况下,即在图6C所示的示例中,根据第一被选择像素的相对偏移量和第一交点像素的相对偏移量,确定在第一被选择像素列中位于第一被选择像素和第一交点像素之间的所有像素的相对偏移量,包括:对第一被选择像素的相对偏移量和第一交点像素的相对偏移量进行线性插值,以得到第一被选择像素列中的位于第一被选择像素和第一交点像素之间的所有像素的相对偏移量。
根据第一被选择像素的相对偏移量和第二交点像素的相对偏移量,确定在第一被选择像素列中位于第一被选择像素和第二交点像素之间的所有像素的相对偏移量,包括:对第一被选择像素的相对偏移量和第二交点像素的相对偏移量进行线性插值,以得到第一被选择像素列中的位于第一被选择像素和第二交点像素之间的所有像素的相对偏移量。
例如,在第一交点像素PC1和第二交点像素PC2分别位于M个字符行下边界中的某两个字符行下边界上的情况下,如图6C所示,在一些示例中,第一交点像素PC1位于M个字符行下边界中的字符行下边界t4上,第二交点像素PC2位于M个字符行下边界中的字符行下边界t3上,由于第一交点像素PC1和第二交点像素PC2均位于字符行下边界上,且不是字符行下边界(t3和t4)的基准像素,第一交点像素PC1和第二交点像素PC2的相对偏移量均已经得到,因此,可以直接对第一被选择像素Ps1的相对偏移量和第一交点像素PC1的相对偏移量进行线性插值,以确定在第一被选择像素列Psc1中位于第一被选择像素Ps1和第一交点像素PC1之间的所有像素的相对偏移量;直接对第一被选择像素Ps1的相对偏移量和第二交点像素PC2的相对偏移量进行线性插值,以确定在第一被选择像素列Psc1中位于第一被选择像素Ps1和第二交点像素PC2之间的所有像素的相对偏移量。
例如,如图6C所示,对于第一被选择像素列Psc1中的位于第一被选择像素Ps1和第一交点像素PC1之间的像素CC1,该像素CC1的相对偏移量通过对第一被选择像素Ps1的相对偏移量和第一交点像素PC1的相对偏移量进行线性插值而得到;对于第一被选择像素列Psc1中的位于第一被选择像素Ps1和第二交点像素PC2之间的像素CC2,该像素CC2的相对偏移量通过对第一被选择像素Ps1的相对偏移量和第二交点像素PC2的相对偏移量进行线性插值而得到。
需要说明的是,图6A~6D仅示出了中间校正图像中的部分字符行下边界,本公开不限于图6A~6D所示的示例。例如,如图6A~6D所示,在Y轴方向上,第t2个字符行下边界和第一图像边界B1之间具有多条字符行下边界,第t2个字符行下边界和第二图像边界B2之间也具有多条字符行下边界,然而在另一些实施例中,第t2个字符行下边界和第一图像边界B1之间也可以仅具有一条字符行下边界或者不具有字符行下边界;类似地,第t2个字符行下边界和第二图像边界B2之间也可以仅具有一条字符行下边界或者不具有字符行下边界。此外,如图6B~6D所示,在Y轴方向上,第t2个字符行下边界和字符行下边界t3之间具有一条字符行下边界,然而在另一些实施例中,第t2个字符行下边界和字符行下边界t3之间也可以具有多条字符行下边界或者不具有字符行下边界。如图6C所示,在Y轴方向上,第t2个字符行下边界和字符行下边界t4之间不具有字符行下边界,然而在另一些实施例中,第t2个字符行下边界和字符行下边界t4之间也可以具有一条或多条字符行下边界。
图7A为本公开至少一实施例提供的一种中间校正图像的又一种示意图;图7B为本公开至少一实施例提供的另一种中间校正图像的又一种示意图;图7C为本公开至少一实施例提供的又一种中间校正图像的又一种示意图。
例如,在一些实施例中,在步骤S122中,基于M个字符行下边界上除了M个字符行下边界的基准像素之外的所有像素的相对偏移量、第一图像边界和第二图像边界,确定中间校正图像中M个字符行下边界之外的其余像素和M个字符行下边界的基准像素的相对偏移量,包括:获取第二被选择像素,并确定第二被选择像素所在的第二被选择像素列;响应于第二被选择像素列上的所有像素均不与M个字符行下边界中的任一字符行下边界相交,或者响应于在第二被选择像素列与M个字符行下边界的任意字符行下边界之间具有交点像素,且第二被选择像素列与任意字符行下边界之间的交点像素为任意字符行下边界的基准像素,确定第二被选择像素列上的所有像素的相对偏移量为预设值。
例如,如图7A~图7C所示,第二被选择像素Ps2所在的第二被选择像素列Psc2沿第一方向(即Y轴方向)延伸,如图7A所示,第二被选择像素Ps2不位于M个字符行下边界上,或者,如图7B所示,第二被选择像素Ps2为M个字符行下边界中的某个字符行下边界的基准像素,例如,字符行下边界t6的基准像素。
例如,如图7A所示,在第二被选择像素列Psc2上的所有像素均不与M个字符行下边界中的任一字符行下边界相交的情况下,确定第二被选择像素列Psc2上的所有像素的相对偏移量为预设值。
例如,如图7C所示,在第二被选择像素列Psc2与M个字符行下边界的任意字符行下边界(例如,字符行下边界t7)之间具有交点像素PC4,且第二被选择像素列Psc2与任意字符行下边界之间的交点像素PC4为任意字符行下边界的基准像素,确定第二被选择像素列Psc2上的所有像素的相对偏移量为预设值。也就是说,第二被选择像素列Psc2可以包括一个基准像素或多个基准像素,也可以不包括基准像素。
需要说明的是,第二被选择像素Ps2也可以位于第三图像边界B3上,或者,还可以位于与第三图像边界B3彼此相对的第四图像边界(例如,第四图像边界可以为图4E所示的中间校正图像的左侧的边界)上。也就是说,第三图像边界B3和第四图像边界上的所有像素的相对偏移量均为预设值。
例如,如图2所示,步骤S123:设定局部调整基准线上的所有像素的局部调整偏移量为预定值。
例如,在本公开的一些实施例中,局部调整基准线上的所有像素的局部调整偏移量相同,且均为预定值,例如,0。根据实际需求,局部调整基准线上的所有像素的局部调整偏移量还可以为其他合适的值,本公开的实施例对局部调整基准线上的所有像素的局部调整偏移量不作具体限制。
图8A为本公开至少一实施例提供的一种中间校正图像的再一种示意图;图8B为本公开至少一实施例提供的另一种中间校正图像的再一种示意图;图8C为本公开至少一实施例提供的又一种中间校正图像的再一种示意图。
例如,如图2所示,步骤S124:根据局部调整基准线上的所有像素的局部调整偏移量和中间校正图像中的所有像素对应的相对偏移量,确定中间校正图像中局部调整基准线之外的所有像素的局部调整偏移量。
例如,步骤S124可以包括:获取第三被选择像素,其中,第三被选择像素不位于局部调整基准线上;确定第三被选择像素所在的像素行,获取像素行上的与第三被选择像素相邻的像素作为参考像素,其中,参考像素位于第三被选择像素的靠近局部调整基准线的一侧或位于局部调整基准线上;确定参考像素的局部调整偏移量;根据参考像素的局部调整偏移量和第三被选择像素的相对偏移量,确定第三被选择像素的局部调整偏移量。分别对中间校正图像上的所有像素进行上述操作,从而确定中间校正图像上的所有像素的局部调整偏移量。
在确定中间校正图像上的每个像素的局部调整偏移量时,将局部调整基准线上的所有像素的局部调整偏移量设置为预定值(0),然后,从局部调整基准线分别向左侧和右侧依次进行累计计算各个像素的局部调整偏移量,从而得到中间校正图像上的所有像素的局部调整偏移量。
例如,参考像素Pr和第三被选择像素Ps3位于同一像素行,如图8A~图8C所示,第三被选择像素Ps3所在的像素行为像素行Psr3,获取该像素行Psr3上的与第三被选择像素Ps3相邻的像素作为参考像素Pr。
需要说明的是,第三被选择像素Ps3可以位于字符行下边界上,也可以不位于字符行下边界上。
例如,如图8A所示,参考像素Pr位于第三被选择像素Psr3的靠近局部调整基准线CR的一侧,即在X轴方向上,参考像素Pr位于第三被选择像素Psr3和局部调整基准线CR之间。在图8A中,参考像素Pr和第三被选择像素Ps3位于局部调整基准线CR的左侧;在图8C中,参考像素Pr和第三被选择像素Ps3位于局部调整基准线CR的右侧。
例如,如图8B所示,第三被选择像素Ps3位于局部调整基准线CR的左侧,参考像素Pr位于局部调整基准线CR上,即参考像素Pr为局部调整基准线CR上的像素。又例如,在另一些示例中,第三被选择像素Ps3位于局部调整基准线CR的右侧,而参考像素Pr位于局部调整基准线CR上。
例如,在步骤S124中,确定参考像素的局部调整偏移量,包括:当参考像素位于局部调整基准线CR上时,则确定参考像素的局部调整偏移量为预设值;当参考像素不位于局部调整基准线CR上时,则按照上述确定第三被选择像素的局部调整偏移量的方法确定该参考像素的局部调整偏移量,依次类推。
例如,在步骤S124中,根据参考像素的局部调整偏移量和第三被选择像素的相对偏移量,确定第三被选择像素的局部调整偏移量,包括:响应于第三被选择像素位于局部调整基准线的第一侧,第三被选择像素的局部调整偏移量表示为:
dyt=dyc+ddyt,
响应于第三被选择像素位于局部调整基准线的第二侧,第三被选择像素的局部调整偏移量表示为:
dyt=dyc-ddyt,
其中,dyt表示第三被选择像素的局部调整偏移量,dyc表示参考像素的局部调整偏移量,ddyt表示第三被选择像素的相对偏移量。此处,关于相对偏移量的计算过程可以参考上面关于字符行下边界上每个像素的相对偏移量表示该像素的Y轴坐标值减去位于该像素所在像素列的右侧相邻的像素列上,且与该像素在同一字符行下边界上的像素的Y轴坐标值的情况的相关说明,重复之处不再赘述。
例如,第一侧为局部调整基准线CR的左侧,第二侧为局部调整基准线CR的右侧。
也就是说,在本公开的实施例中,在中间校正图像中的字符行下边界上每个像素的相对偏移量表示该像素的Y轴坐标值减去位于该像素所在像素列的右侧相邻的像素列上,且与该像素在同一字符行下边界上的像素的Y轴坐标值的情况下,位于局部调整基准线CR左侧的每个像素的局部调整偏移量为该像素右侧相邻的像素的局部调整偏移量加上该像素相对偏移量;而位于局部调整基准线CR右侧的每个像素的局部调整偏移量为该像素左侧相邻的像素的局部调整偏移量减去该像素相对偏移量。
例如,字符行下边界上的每个像素的相对偏移量表示为:
ddy(x1,y1)=y(x1,y1)-y(x1+1,y1’);
其中,ddy(x1,y1)表示位于第一坐标系中的(x1,y1)处的像素的相对偏移量,y(x1,y1)表示位于第一坐标系中的(x1,y1)处的像素的Y轴坐标值,y(x1+1,y1’)表示位于第一坐标系中的(x1+1,y1’)处的像素的Y轴坐标值。位于第一坐标系中的(x1,y1)处的像素所在的像素列和位于第一坐标系中的(x1+1,y1’)处的像素所在的像素列彼此相邻,且位于第一坐标系中的(x1,y1)处的像素和位于第一坐标系中的(x1+1,y1’)处的像素位于同一字符行下边界上。中间校正图像中的除了字符行下边界上的像素的相对偏移量可以通过插值的方式得到。
然后,位于第一坐标系中的(x2,y2)处的像素和位于第一坐标系中的(x2+1,y2)处的像素均处于局部调整基准线CR的左侧时,位于局部调整基准线CR左侧的像素的局部调整偏移量表示为:
dy(x2,y2)=dy(x2+1,y2)+ddy(x2,y2)。
位于第一坐标系中的(x2,y2)处的像素和位于第一坐标系中的(x2+1,y2)处的像素均处于局部调整基准线CR的右侧时,位于局部调整基准线CR右侧的像素的局部调整偏移量表示为:
dy(x2+1,y2)=dy(x2,y2)-ddy(x2+1,y2)。
其中,dy(x2,y2)表示位于第一坐标系中的(x2,y2)处的像素的局部调整偏移量,dy(x2+1,y2)表示位于第一坐标系中的(x2+1,y2)处的像素的局部调整偏移量,ddy(x2+1,y2)表示位于第一坐标系中的(x2+1,y2)处的像素的相对偏移量,ddy(x2,y2)表示位于第一坐标系中的(x2,y2)处的像素的相对偏移量。位于第一坐标系中的(x2,y2)处的像素和位于第一坐标系中的(x2+1,y2)处的像素彼此相邻,且位于同一像素行上。
例如,如图2所示,步骤S125:根据中间校正图像中局部调整基准线之外的所有像素的局部调整偏移量和局部调整基准线上的所有像素的局部调整偏移量对中间校正图像进行局部调整,以得到目标校正图像。
需要说明的是,输入图像中的字符、中间校正图像中的字符、目标校正图像中的字符的数量和类型等均相同,不同之处在于:输入图像中的字符、中间校正图像中的字符和目标校正图像中的字符的绝对位置可能存在差异,然而,各个字符之间的相对位置可以保持不变,也就是说,在输入图像中相邻的两个字符,在中间校正图像和目标校正图像中,该两个字符仍然相邻。
例如,全局校正用于对输入图像中所有字符的整体形状进行校正。在一些实施例中,全局校正可以采用基于Leptonica(Leptonica是一个开源的图像处理和图像分析库)的思路采用opencv中的算法实现;在另一些实施例中,全局校正也可以采用机器学习(例如,神经网络)的方法实现。
图9A为本公开一些实施例提供的一种输入图像的二值化图像的示意图,图9B为本公开一些实施例提供的一种输入字符连通图像的示意图,图10A为本公开一些实施例提供的一种示出M条中线的输入图像的示意图,图10B为本公开一些实施例提供的一种示出W条第一等分线的输入图像的示意图,图10C为本公开一些实施例提供的一种示出Q条第二等分线的输入图像的示意图。
例如,在一些实施例中,步骤S11可以包括:对输入图像进行二值化处理,以得到输入图像的二值化图像;对二值化图像进行字符连接处理,以得到输入字符连通图像,其中,输入字符连通图像包括与M个字符行对应的M个输入字符连通区域;获取与M个输入字符连通区域一一对应的M条中线,其中,M个输入字符连通区域沿第一方向排列;设置W条第一等分线;获取M条中线和W条第一等分线之间的多个交点作为多个第三交点像素;基于多个第三交点像素进行二次拟合,以得到与W条第一等分线一一对应的W个二次函数;设置Q条第二等分线;获取W条第一等分线和Q条第二等分线之间的多个交点作为多个第四交点像素;基于W个二次函数,计算多个第四交点像素的全局调整偏移量;根据多个第四交点像素的全局调整偏移量,对输入图像进行全局校正处理,以得到中间校正图像。
例如,二值化处理是将输入图像上的像素的灰度值设置为0或255,也就是将整个输入图像呈现出明显的黑白效果的过程,在步骤S120中,二值化处理为反向二值化处理,如图9A所示,在输入图像的二值化图像中,字符对应的像素的灰度值为255,背景对应的像素的灰度值为0,即字符为白色,背景为黑色。
例如,二值化处理的方法可以包括阈值法、双峰法、P参数法、大律法(OTSU法)、最大熵值法、迭代法等。
例如,对二值化图像进行字符连接处理的方法与上面描述的对中间校正图像进行字符连接处理的方法相同,重复之处不再赘述。例如,图9B所示的输入字符连通图像为对图9A所示的输入图像进行字符连接处理后得到的图像。
例如,在步骤S11中,基于多个第三交点像素进行二次拟合,以得到与W条第一等分线一一对应的W个二次函数,包括:基于输入图像确定第二坐标系;确定与多个第三交点像素对应的多个字符中心点在第二坐标系中的坐标值;基于多个字符中心点,计算多个第三交点像素的全局调整偏移量;对多个第三交点像素的全局调整偏移量进行二次拟合,以得到与W条第一等分线一一对应的W个二次函数。
例如,输入图像确定的第二坐标系可以为图3所示的第二坐标系OXY。
例如,在一些实施例中,W可以为30,Q也可以为30。
例如,W条第一等分线沿第一方向延伸,Q条第二等分线沿第二方向延伸,第一方向和第二方向彼此垂直。例如,第二坐标系OXY包括X轴和Y轴,第一方向可以与坐标系的X轴平行,第二方向可以与坐标系的Y轴平行。例如,如图10A所示,LC表示输入字符连通区域对应的中线,图10B示出了四条第一等分线LW1~LW4,图10C示出了五条第二等分线LQ1~LQ5。
例如,如图10B所示,每条第一等分线和M条中线LC中的至少一条中线LC相交,从而确定该第一等分线对应的多个第三交点像素。需要说明的是,由于有些中线较短,从而第一等分线并不一定与M条中线LC均相交,例如,位于图10B所示的最右边的第一等分线LW4和位于第十行的输入字符连通区域(该输入字符连通区域包括字符“The”、“information”、“provided”、“by”、“you”、“in”、“this”、“form”、“will”等)对应的中线不相交。
例如,M条中线LC可以为直线,也可以为曲线。
例如,对于多个第三交点像素中的每个第三交点像素,计算每个第三交点像素的Y轴方向的偏移作为该第三交点像素的全局调整偏移量,即第三交点像素的全局调整偏移量包括第三交点像素在第二坐标系中的Y轴坐标值和第三交点像素对应的字符中心点在第二坐标系中的Y轴坐标值的差值(差值为第三交点像素在第二坐标系中的Y轴坐标值减去第三交点像素对应的字符中心点在第二坐标系中的Y轴坐标值)。例如,字符中心点表示第三交点像素所在的字符行的中心点。
例如,每条第二等分线和W条第一等分线均相交,从而确定该第二等分线对应的多个第四交点像素。如图10C所示,每条第二等分线和四条第一等分线LW1~LW4均相交。对于多个第四交点像素中的每个第四交点像素,第四交点像素的全局调整偏移量包括第四交点像素在第二坐标系中的Y轴方向的偏移量。
例如,基于W个二次函数,计算多个第四交点像素的全局调整偏移量,包括:根据第一等分线对应的二次函数计算该第一等分线和Q条第二等分线之间的多个第四交点像素的全局调整偏移量。例如,如图10B和图10C所示,基于与第一等分线LW1对应的二次函数,可以计算第一等分线LW1和五条第二等分线LQ1~LQ5之间的五个第四交点像素的全局调整偏移量。
例如,多个第四交点像素排列为W*Q的交点矩阵,即得到一组多个第四交点像素组成的网格,例如,当W和Q均为30时,网格为900(30*30)个第四交点像素组成的网格。
例如,在一些实施例中,根据多个第四交点像素的全局调整偏移量,对输入图像进行全局校正处理,以得到中间校正图像,包括:对多个第四交点像素的全局调整偏移量进行二次拟合以得到全局位移调整函数;根据全局位移调整函数获得输入图像中的每个像素的全局调整偏移量;根据输入图像中的每个像素的全局调整偏移量,基于图像插值算法对输入图像进行全局校正处理,从而得到中间校正图像。
例如,图像插值算法包括最近邻插值(nearest-neighbor)、双线性插值(Bilinear)、双立方插值(bicubic)等算法。
例如,在一些实施例中,对输入图像进行全局校正处理,以得到中间校正图像,包括:对输入图像的二值化图像进行全局校正处理,以得到二值化的中间校正图像,该二值化的中间校正图像即为最终的中间校正图像。
需要说明的是,在另一些实施例中,对二值化图像进行全局校正处理,以得到中间校正图像,包括:首先,对输入图像进行全局校正处理,以得到灰度或彩色的中间校正图像,该灰度或彩色的中间校正图像即为最终的中间校正图像。
图11A为本公开一些实施例提供的一种目标校正图像的示意图。
例如,图11A所示的目标校正图像为对图3所示的输入图像依次进行全局校正和局部校正之后的图像。如图11A所示,按照本公开实施例提供的处理方式对输入图像进行处理之后,字符行中的各个字符沿水平方向排列为一行,字符行对应的字符行下边界大致为一条直线,且该直线与水平方向大致平行。
例如,如图11B所示,第一条曲线CR1可以表示一个字符行的偏移情况;第二条曲线CR2可以表示全局校正捕捉到的偏移;第三条曲线CR3可以表示全局校正后的结果,全局校正之后还有细节未调整,第三条曲线CR3可以表示全局校正所忽略的细节;第四条曲线CR4可以表示全局校正加上局部校正之后的结果。
本公开至少一实施例还提供一种图像处理装置,图12为本公开至少一实施例提供的一种图像处理装置的示意性框图。
例如,如图12所示,图像处理装置800包括获取模块801、全局校正模块802和局部调整模块803。
例如,获取模块801用于获取输入图像。输入图像包括M个字符行,M个字符行中的每个字符行包括至少一个字符,M个字符行沿第一方向排列,M为正整数。
全局校正模块802用于对输入图像进行全局校正处理,以得到中间校正图像。
局部调整模块803用于对中间校正图像进行局部调整,以得到目标校正图像。
例如,获取模块801、全局校正模块802和/或局部调整模块803包括存储在存储器中的代码和程序;处理器可以执行该代码和程序以实现如上所述的获取模块801、全局校正模块802和/或局部调整模块803的一些功能或全部功能。例如,获取模块801、全局校正模块802和/或局部调整模块803可以是专用硬件器件,用来实现如上所述的获取模块801、全局校正模块802和/或局部调整模块803的一些或全部功能。例如,获取模块801、全局校正模块802和/或局部调整模块803可以是一个电路板或多个电路板的组合,用于实现如上所述的功能。在本申请实施例中,该一个电路板或多个电路板的组合可以包括:(1)一个或多个处理器;(2)与处理器相连接的一个或多个非暂时的存储器;以及(3)处理器可执行的存储在存储器中的固件。
需要说明的是,获取模块801用于实现图1所示的步骤S10,全局校正模块802用于实现图1所示的步骤S11,局部调整模块803用于实现图1所示的步骤S12。从而关于获取模块801所实现的功能的具体说明可以参考上述图像处理方法的实施例中图1所示的步骤S10的相关描述,关于全局校正模块802所实现的功能的具体说明可以参考上述图像处理方法的实施例中图1所示的步骤S11的相关描述,关于局部调整模块803所实现的功能的具体说明可以参考上述图像处理方法的实施例中图1所示的步骤S12的相关描述。此外,图像处理装置可以实现与前述图像处理方法相似的技术效果,在此不再赘述。
本公开至少一实施例还提供一种电子设备,图13为本公开至少一实施例提供的一种电子设备的示意性框图。
例如,如图13所示,电子设备包括处理器901、通信接口902、存储器903和通信总线904。处理器901、通信接口902、存储器903通过通信总线904实现相互通信,处理器901、通信接口902、存储器903等组件之间也可以通过网络连接进行通信。本公开对网络的类型和功能在此不作限制。
例如,存储器903用于非瞬时性地存储计算机可读指令。处理器901用于执行计算机可读指令时,实现根据上述任一实施例所述的图像处理方法。关于该图像处理方法的各个步骤的具体实现以及相关解释内容可以参见上述图像处理方法的实施例,在此不做赘述。
例如,处理器901执行存储器903上所存放的程序而实现的图像处理方法的其他实现方式,与前述图像处理方法实施例部分所提及的实现方式相同,这里也不再赘述。
例如,通信总线904可以是外设部件互连标准(PCI)总线或扩展工业标准结构(EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
例如,通信接口902用于实现电子设备与其他设备之间的通信。
例如,处理器901和存储器903可以设置在服务器端(或云端)。
例如,处理器901可以控制电子设备中的其它组件以执行期望的功能。处理器901可以是中央处理器(CPU)、网络处理器(NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。中央处理元(CPU)可以为X86或ARM架构等。
例如,存储器903可以包括一个或多个计算机程序产品的任意组合,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机可读指令,处理器901可以运行所述计算机可读指令,以实现电子设备的各种功能。在存储介质中还可以存储各种应用程序和各种数据等。
例如,关于电子设备执行图像处理的过程的详细说明可以参考图像处理方法的实施例中的相关描述,重复之处不再赘述。
图14为本公开至少一实施例提供的一种非瞬时性计算机可读存储介质的示意图。例如,如图14所示,在存储介质1000上可以非暂时性地存储一个或多个计算机可读指令1001。例如,当计算机可读指令1001由处理器执行时可以执行根据上文所述的图像处理方法中的一个或多个步骤。
例如,该存储介质1000可以应用于上述电子设备中,例如,其可以包括电子设备中的存储器903。
例如,关于存储介质1000的说明可以参考电子设备的实施例中对于存储器的描述,重复之处不再赘述。
对于本公开,还有以下几点需要说明:
(1)本公开实施例附图只涉及到与本公开实施例涉及到的结构,其他结构可参考通常设计。
(2)为了清晰起见,在用于描述本发明的实施例的附图中,层或结构的厚度和尺寸被放大。可以理解,当诸如层、膜、区域或基板之类的元件被称作位于另一元件“上”或“下”时,该元件可以“直接”位于另一元件“上”或“下”,或者可以存在中间元件。
(3)在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合以得到新的实施例。
以上所述仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,本公开的保护范围应以所述权利要求的保护范围为准。
Claims (25)
1.一种图像处理方法,包括:
获取输入图像,其中,所述输入图像包括M个字符行,所述M个字符行中的每个字符行包括至少一个字符,所述M个字符行沿第一方向排列,M为正整数;
对所述输入图像进行全局校正处理,以得到中间校正图像;
对所述中间校正图像进行局部调整,以得到目标校正图像,
其中,对所述中间校正图像进行局部调整,以得到目标校正图像,包括:
根据所述中间校正图像,确定与所述M个字符行对应的M个字符行下边界;
基于所述中间校正图像,确定局部调整基准线、所述中间校正图像的第一图像边界和第二图像边界,其中,所述第一图像边界和所述第二图像边界为所述中间校正图像的在所述第一方向上的两个边界;
根据所述第一图像边界、所述第二图像边界和所述M个字符行下边界,确定所述中间校正图像中的所有像素的相对偏移量;
设定所述局部调整基准线上的所有像素的局部调整偏移量为预定值;
根据所述局部调整基准线上的所有像素的局部调整偏移量和所述中间校正图像中的所有像素对应的相对偏移量,确定所述中间校正图像中所述局部调整基准线之外的所有像素的局部调整偏移量;
根据所述中间校正图像中所述局部调整基准线之外的所有像素的局部调整偏移量和所述局部调整基准线上的所有像素的局部调整偏移量对所述中间校正图像进行局部调整,以得到所述目标校正图像;
其中,所述中间校正图像具有第三图像边界,所述第三图像边界为所述中间校正图像的在与所述第一方向垂直的第二方向上的一个边界,所述M个字符行下边界中的每个字符行下边界包括基准像素,其中,所述每个字符行下边界的基准像素为所述每个字符行下边界的距离所述第三图像边界最近的像素,
根据所述第一图像边界、所述第二图像边界和所述M个字符行下边界,确定所述中间校正图像中的所有像素的相对偏移量,包括:
根据所述M个字符行下边界上的各个像素的位置,确定所述M个字符行下边界上除了所述M个字符行下边界的基准像素之外的所有像素的相对偏移量;
基于所述M个字符行下边界上除了所述M个字符行下边界的基准像素之外的所有像素的相对偏移量、所述第一图像边界和所述第二图像边界,确定所述中间校正图像中所述M个字符行下边界之外的其余像素和所述M个字符行下边界的基准像素的相对偏移量,
其中,所述中间校正图像中的所有像素的相对偏移量包括所述M个字符行下边界上的各个像素的相对偏移量和所述其余像素的相对偏移量。
2.根据权利要求1所述的图像处理方法,其中,所述中间校正图像包括排列为多行多列的像素,
根据所述M个字符行下边界上的各个像素的位置,确定所述M个字符行下边界上除了所述M个字符行下边界的基准像素之外的所有像素的相对偏移量,包括:
针对所述M个字符行下边界中的第t1个字符行下边界,获取所述第t1个字符行下边界上的第a1个像素,其中,所述第a1个像素不是所述第t1个字符行下边界的基准像素,t1为正整数且小于等于M,a1为正整数且小于等于所述第t1个字符行下边界上的所有像素的数量;
响应于所述第a1个像素所在的像素列和所述第t1个字符行下边界的基准像素所在的像素列相邻,根据所述第t1个字符行下边界的基准像素和所述第a1个像素之间的位置关系,确定所述第a1个像素对应的相对偏移量;
响应于所述第a1个像素所在的像素列和所述第t1个字符行下边界的基准像素所在的像素列不相邻,获取所述第t1个字符行下边界上的第a2个像素,根据所述第a1个像素和所述第a2个像素之间的位置关系,确定所述第a1个像素对应的相对偏移量,其中,所述第a2个像素不是所述第t1个字符行下边界的基准像素,所述第a2个像素位于所述第a1个像素的靠近所述第t1个字符行下边界的基准像素的一侧,且所述第a1个像素所在的像素列和所述第a2个像素所在的像素列相邻。
3.根据权利要求1所述的图像处理方法,其中,所述中间校正图像包括排列为多行多列的像素,
所述M个字符行下边界包括第t2个字符行下边界,其中,t2为正整数且小于等于M,
基于所述M个字符行下边界上除了所述M个字符行下边界的基准像素之外的所有像素的相对偏移量、所述第一图像边界和所述第二图像边界,确定所述中间校正图像中所述M个字符行下边界之外的其余像素和所述M个字符行下边界的基准像素的相对偏移量,包括:
获取位于所述第t2个字符行下边界上的第一被选择像素,并确定所述第一被选择像素所在的第一被选择像素列,其中,所述第一被选择像素列沿所述第一方向延伸,所述第一被选择像素不为所述第t2个字符行下边界的基准像素;
确定在所述第一被选择像素列上与所述第一被选择像素对应的第一交点像素和第二交点像素,其中,除了所述第一被选择像素,在所述第一被选择像素列上的所述第一交点像素和所述第二交点像素之间不存在其他位于字符行下边界上且不是所述字符行下边界的基准像素的像素;
响应于所述第一交点像素位于所述第一图像边界上和所述第二交点像素位于所述第二图像边界上,
根据所述第一图像边界和所述第二图像边界之间的距离、所述第一被选择像素和所述第一交点像素之间的距离和所述第一被选择像素的相对偏移量,确定所述第一交点像素的相对偏移量,根据所述第一被选择像素的相对偏移量和所述第一交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第一交点像素之间的所有像素的相对偏移量;
根据所述第一图像边界和所述第二图像边界之间的距离、所述第一被选择像素和所述第二交点像素之间的距离和所述第一被选择像素的相对偏移量,确定所述第二交点像素的相对偏移量,根据所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量;
响应于所述第一交点像素位于所述第一图像边界或所述第二图像边界上且所述第二交点像素位于所述M个字符行下边界中的某个字符行下边界上,
根据所述第一图像边界和所述第二图像边界之间的距离、所述第一被选择像素和所述第一交点像素之间的距离和所述第一被选择像素的相对偏移量,确定所述第一交点像素的相对偏移量;
根据所述第一被选择像素的相对偏移量和所述第一交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第一交点像素之间的所有像素的相对偏移量;
根据所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量;
响应于所述第一交点像素和所述第二交点像素分别位于所述M个字符行下边界中的某两个字符行下边界上,根据所述第一被选择像素的相对偏移量和所述第一交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第一交点像素之间的所有像素的相对偏移量,根据所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量。
4.根据权利要求3所述的图像处理方法,其中,在所述第一交点像素和所述第二交点像素分别位于所述M个字符行下边界中的某两个字符行下边界上的情况下:
根据所述第一被选择像素的相对偏移量和所述第一交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第一交点像素之间的所有像素的相对偏移量,包括:
对所述第一被选择像素的相对偏移量和所述第一交点像素的相对偏移量进行线性插值,以得到所述第一被选择像素列中的位于所述第一被选择像素和所述第一交点像素之间的所有像素的相对偏移量;
根据所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量,包括:
对所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量进行线性插值,以得到所述第一被选择像素列中的位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量。
5.根据权利要求3所述的图像处理方法,其中,
根据所述第一图像边界和所述第二图像边界之间的距离、所述第一被选择像素和所述第一交点像素之间的距离和所述第一被选择像素的相对偏移量,确定所述第一交点像素的相对偏移量,包括:
响应于所述第一图像边界和所述第二图像边界之间的距离和所述第一被选择像素和所述第一交点像素之间的距离满足第一关系式,确定所述第一交点像素的相对偏移量为所述预定值;
响应于所述第一图像边界和所述第二图像边界之间的距离和所述第一被选择像素和所述第一交点像素之间的距离满足第二关系式,确定所述第一交点像素的相对偏移量为所述第一被选择像素的相对偏移量;
根据所述第一图像边界和所述第二图像边界之间的距离、所述第一被选择像素和所述第二交点像素之间的距离和所述第一被选择像素的相对偏移量,确定所述第二交点像素的相对偏移量,包括:
响应于所述第一图像边界和所述第二图像边界之间的距离和所述第一被选择像素和所述第二交点像素之间的距离满足第三关系式,确定所述第二交点像素的相对偏移量为所述预定值;
响应于所述第一图像边界和所述第二图像边界之间的距离和所述第一被选择像素和所述第二交点像素之间的距离满足第四关系式,确定所述第二交点像素的相对偏移量为所述第一被选择像素的相对偏移量;
其中,所述第一关系式表示为:
h1>H/DH,
所述第二关系式表示为:
h1≤H/DH,
所述第三关系式表示为:
h2>H/DH,
所述第四关系式表示为:
h2≤H/DH,
其中,h1为所述第一交点像素和所述第一被选择像素之间的距离,h2为所述第二交点像素和所述第一被选择像素之间的距离,H为所述第一图像边界和所述第二图像边界之间的距离,DH为常数。
6.根据权利要求5所述的图像处理方法,其中,
在所述第一交点像素位于所述第一图像边界上和所述第二交点像素位于所述第二图像边界上,或者,所述第一交点像素位于所述第一图像边界或所述第二图像边界上且所述第二交点像素位于所述M个字符行下边界中的某个字符行下边界上的情况下,根据所述第一被选择像素的相对偏移量和所述第一交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第一交点像素之间的所有像素的相对偏移量,包括:
响应于所述第一图像边界和所述第二图像边界之间的距离和所述第一交点像素和所述第一被选择像素之间的距离满足所述第一关系式,对所述第一被选择像素的相对偏移量和所述第一交点像素的相对偏移量进行线性插值,以得到所述第一被选择像素列中的位于所述第一被选择像素和所述第一交点像素之间的所有像素的相对偏移量;
响应于所述第一图像边界和所述第二图像边界之间的距离和所述第一交点像素和所述第一被选择像素之间的距离满足所述第二关系式,确定所述第一被选择像素列中的位于所述第一被选择像素和所述第一交点像素之间的所有像素的相对偏移量均为所述第一被选择像素的相对偏移量;
在所述第一交点像素位于所述第一图像边界上和所述第二交点像素位于所述第二图像边界上的情况下,根据所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量,包括:
响应于所述第一图像边界和所述第二图像边界之间的距离和所述第二交点像素和所述第一被选择像素之间的距离满足所述第三关系式,对所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量进行线性插值,以得到所述第一被选择像素列中的位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量;
响应于所述第一图像边界和所述第二图像边界之间的距离和所述第二交点像素和所述第一被选择像素之间的距离满足所述第四关系式,确定所述第一被选择像素列中的位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量均为所述第一被选择像素的相对偏移量;
在所述第一交点像素位于所述第一图像边界或所述第二图像边界上且所述第二交点像素位于所述M个字符行下边界中的某个字符行下边界上的情况下,根据所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量,包括:
对所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量进行线性插值,以得到所述第一被选择像素列中的位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量。
7.根据权利要求1所述的图像处理方法,其中,所述中间校正图像包括排列为多行多列的像素,
基于所述M个字符行下边界上除了所述M个字符行下边界的基准像素之外的所有像素的相对偏移量、所述第一图像边界和所述第二图像边界,确定所述中间校正图像中所述M个字符行下边界之外的其余像素和所述M个字符行下边界的基准像素的相对偏移量,包括:
获取第二被选择像素,并确定所述第二被选择像素所在的第二被选择像素列,其中,所述第二被选择像素列沿所述第一方向延伸,所述第二被选择像素不位于所述M个字符行下边界上或者所述第二被选择像素为所述M个字符行下边界中的某个字符行下边界的基准像素;
响应于所述第二被选择像素列上的所有像素均不与所述M个字符行下边界中的任一字符行下边界相交,或者响应于在所述第二被选择像素列与所述M个字符行下边界的任意字符行下边界之间具有交点像素,且所述第二被选择像素列与所述任意字符行下边界之间的交点像素为所述任意字符行下边界的基准像素,确定所述第二被选择像素列上的所有像素的相对偏移量为所述预定值。
8.根据权利要求1所述的图像处理方法,其中,所述中间校正图像包括排列为多行多列的像素,
根据所述局部调整基准线上的所有像素的局部调整偏移量和所述中间校正图像中的所有像素对应的相对偏移量,确定所述中间校正图像中所述局部调整基准线之外的所有像素的局部调整偏移量,包括:
获取第三被选择像素,其中,所述第三被选择像素不位于所述局部调整基准线上;
确定所述第三被选择像素所在的像素行,获取所述像素行上的与所述第三被选择像素相邻的像素作为参考像素,其中,所述参考像素位于所述第三被选择像素的靠近所述局部调整基准线的一侧或位于所述局部调整基准线上;
确定所述参考像素的局部调整偏移量;
根据所述参考像素的局部调整偏移量和所述第三被选择像素的相对偏移量,确定所述第三被选择像素的局部调整偏移量。
9.根据权利要求8所述的图像处理方法,其中,根据所述参考像素的局部调整偏移量和所述第三被选择像素的相对偏移量,确定所述第三被选择像素的局部调整偏移量,包括:
响应于所述第三被选择像素位于所述局部调整基准线的第一侧,所述第三被选择像素的局部调整偏移量表示为:
dyt=dyc+ddyt,
响应于所述第三被选择像素位于所述局部调整基准线的第二侧,所述第三被选择像素的局部调整偏移量表示为:
dyt=dyc-ddyt,
其中,dyt表示所述第三被选择像素的局部调整偏移量,dyc表示所述参考像素的局部调整偏移量,ddyt表示所述第三被选择像素的相对偏移量。
10.根据权利要求9所述的图像处理方法,其中,所述第一侧为所述局部调整基准线的左侧,所述第二侧为所述局部调整基准线的右侧。
11.根据权利要求1所述的图像处理方法,其中,确定所述局部调整基准线,包括:
将所述中间校正图像的沿所述第一方向延伸的中线作为所述局部调整基准线。
12.根据权利要求1~11任一项所述的图像处理方法,其中,对所述输入图像进行全局校正处理,以得到中间校正图像,包括:
对所述输入图像进行二值化处理,以得到二值化图像;
对所述二值化图像进行字符连接处理,以得到输入字符连通图像,其中,所述输入字符连通图像包括与所述M个字符行对应的M个输入字符连通区域;
获取与所述M个输入字符连通区域一一对应的M条中线,其中,所述M个输入字符连通区域沿所述第一方向排列;
设置W条第一等分线,其中,所述W条第一等分线沿所述第一方向延伸;
获取所述M条中线和所述W条第一等分线之间的多个交点作为多个第三交点像素;
基于所述多个第三交点像素进行二次拟合,以得到与所述W条第一等分线一一对应的W个二次函数;
设置Q条第二等分线,其中,所述Q条第二等分线沿第二方向延伸,其中,所述第一方向和所述第二方向彼此垂直;
获取所述W条第一等分线和所述Q条第二等分线之间的多个交点作为多个第四交点像素;
基于所述W个二次函数,计算所述多个第四交点像素的全局调整偏移量;
根据所述多个第四交点像素的全局调整偏移量,对所述输入图像进行全局校正处理,以得到所述中间校正图像。
13.根据权利要求12所述的图像处理方法,其中,基于所述多个第三交点像素进行二次拟合,以得到与所述W条第一等分线一一对应的W个二次函数,包括:
基于所述输入图像确定第二坐标系,其中,所述第二坐标系包括X轴和Y轴,所述第一方向与所述Y轴平行,所述第二方向与所述X轴平行;
确定与所述多个第三交点像素对应的多个字符中心点在所述第二坐标系中的坐标值;
基于所述多个字符中心点,计算所述多个第三交点像素的全局调整偏移量;
对所述多个第三交点像素的全局调整偏移量进行二次拟合,以得到与所述W条第一等分线一一对应的所述W个二次函数。
14.一种图像处理装置,包括:
获取模块,用于获取输入图像,其中,所述输入图像包括M个字符行,所述M个字符行中的每个字符行包括至少一个字符,所述M个字符行沿第一方向排列,M为正整数;
全局校正模块,用于对所述输入图像进行全局校正处理,以得到中间校正图像;
局部调整模块,用于对所述中间校正图像进行局部调整,以得到目标校正图像;
其中,所述局部调整模块执行对所述中间校正图像进行局部调整,以得到目标校正图像的操作时,包括执行以下操作:
根据所述中间校正图像,确定与所述M个字符行对应的M个字符行下边界;
基于所述中间校正图像,确定局部调整基准线、所述中间校正图像的第一图像边界和第二图像边界,其中,所述第一图像边界和所述第二图像边界为所述中间校正图像的在所述第一方向上的两个边界;
根据所述第一图像边界、所述第二图像边界和所述M个字符行下边界,确定所述中间校正图像中的所有像素的相对偏移量;
设定所述局部调整基准线上的所有像素的局部调整偏移量为预定值;
根据所述局部调整基准线上的所有像素的局部调整偏移量和所述中间校正图像中的所有像素对应的相对偏移量,确定所述中间校正图像中所述局部调整基准线之外的所有像素的局部调整偏移量;
根据所述中间校正图像中所述局部调整基准线之外的所有像素的局部调整偏移量和所述局部调整基准线上的所有像素的局部调整偏移量对所述中间校正图像进行局部调整,以得到所述目标校正图像;
其中,所述中间校正图像具有第三图像边界,所述第三图像边界为所述中间校正图像的在与所述第一方向垂直的第二方向上的一个边界,所述M个字符行下边界中的每个字符行下边界包括基准像素,其中,所述每个字符行下边界的基准像素为所述每个字符行下边界的距离所述第三图像边界最近的像素,
所述局部调整模块执行根据所述第一图像边界、所述第二图像边界和所述M个字符行下边界,确定所述中间校正图像中的所有像素的相对偏移量的操作时,包括执行以下操作:
根据所述M个字符行下边界上的各个像素的位置,确定所述M个字符行下边界上除了所述M个字符行下边界的基准像素之外的所有像素的相对偏移量;
基于所述M个字符行下边界上除了所述M个字符行下边界的基准像素之外的所有像素的相对偏移量、所述第一图像边界和所述第二图像边界,确定所述中间校正图像中所述M个字符行下边界之外的其余像素和所述M个字符行下边界的基准像素的相对偏移量,
其中,所述中间校正图像中的所有像素的相对偏移量包括所述M个字符行下边界上的各个像素的相对偏移量和所述其余像素的相对偏移量。
15.根据权利要求14所述的图像处理装置,其中,所述中间校正图像包括排列为多行多列的像素,
所述局部调整模块执行根据所述M个字符行下边界上的各个像素的位置,确定所述M个字符行下边界上除了所述M个字符行下边界的基准像素之外的所有像素的相对偏移量的操作时,包括执行以下操作:
针对所述M个字符行下边界中的第t1个字符行下边界,获取所述第t1个字符行下边界上的第a1个像素,其中,所述第a1个像素不是所述第t1个字符行下边界的基准像素,t1为正整数且小于等于M,a1为正整数且小于等于所述第t1个字符行下边界上的所有像素的数量;
响应于所述第a1个像素所在的像素列和所述第t1个字符行下边界的基准像素所在的像素列相邻,根据所述第t1个字符行下边界的基准像素和所述第a1个像素之间的位置关系,确定所述第a1个像素对应的相对偏移量;
响应于所述第a1个像素所在的像素列和所述第t1个字符行下边界的基准像素所在的像素列不相邻,获取所述第t1个字符行下边界上的第a2个像素,根据所述第a1个像素和所述第a2个像素之间的位置关系,确定所述第a1个像素对应的相对偏移量,其中,所述第a2个像素不是所述第t1个字符行下边界的基准像素,所述第a2个像素位于所述第a1个像素的靠近所述第t1个字符行下边界的基准像素的一侧,且所述第a1个像素所在的像素列和所述第a2个像素所在的像素列相邻。
16.根据权利要求14所述的图像处理装置,其中,所述中间校正图像包括排列为多行多列的像素,
所述M个字符行下边界包括第t2个字符行下边界,其中,t2为正整数且小于等于M,
所述局部调整模块执行基于所述M个字符行下边界上除了所述M个字符行下边界的基准像素之外的所有像素的相对偏移量、所述第一图像边界和所述第二图像边界,确定所述中间校正图像中所述M个字符行下边界之外的其余像素和所述M个字符行下边界的基准像素的相对偏移量的操作时,包括执行以下操作:
获取位于所述第t2个字符行下边界上的第一被选择像素,并确定所述第一被选择像素所在的第一被选择像素列,其中,所述第一被选择像素列沿所述第一方向延伸,所述第一被选择像素不为所述第t2个字符行下边界的基准像素;
确定在所述第一被选择像素列上与所述第一被选择像素对应的第一交点像素和第二交点像素,其中,除了所述第一被选择像素,在所述第一被选择像素列上的所述第一交点像素和所述第二交点像素之间不存在其他位于字符行下边界上且不是所述字符行下边界的基准像素的像素;
响应于所述第一交点像素位于所述第一图像边界上和所述第二交点像素位于所述第二图像边界上,
根据所述第一图像边界和所述第二图像边界之间的距离、所述第一被选择像素和所述第一交点像素之间的距离和所述第一被选择像素的相对偏移量,确定所述第一交点像素的相对偏移量,根据所述第一被选择像素的相对偏移量和所述第一交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第一交点像素之间的所有像素的相对偏移量;
根据所述第一图像边界和所述第二图像边界之间的距离、所述第一被选择像素和所述第二交点像素之间的距离和所述第一被选择像素的相对偏移量,确定所述第二交点像素的相对偏移量,根据所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量;
响应于所述第一交点像素位于所述第一图像边界或所述第二图像边界上且所述第二交点像素位于所述M个字符行下边界中的某个字符行下边界上,
根据所述第一图像边界和所述第二图像边界之间的距离、所述第一被选择像素和所述第一交点像素之间的距离和所述第一被选择像素的相对偏移量,确定所述第一交点像素的相对偏移量;
根据所述第一被选择像素的相对偏移量和所述第一交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第一交点像素之间的所有像素的相对偏移量;
根据所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量;
响应于所述第一交点像素和所述第二交点像素分别位于所述M个字符行下边界中的某两个字符行下边界上,根据所述第一被选择像素的相对偏移量和所述第一交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第一交点像素之间的所有像素的相对偏移量,根据所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量。
17.根据权利要求16所述的图像处理装置,其中,在所述第一交点像素和所述第二交点像素分别位于所述M个字符行下边界中的某两个字符行下边界上的情况下:
所述局部调整模块执行根据所述第一被选择像素的相对偏移量和所述第一交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第一交点像素之间的所有像素的相对偏移量的操作时,包括执行以下操作:
对所述第一被选择像素的相对偏移量和所述第一交点像素的相对偏移量进行线性插值,以得到所述第一被选择像素列中的位于所述第一被选择像素和所述第一交点像素之间的所有像素的相对偏移量;
所述局部调整模块执行根据所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量的操作时,包括执行以下操作:
对所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量进行线性插值,以得到所述第一被选择像素列中的位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量。
18.根据权利要求16所述的图像处理装置,其中,所述局部调整模块执行根据所述第一图像边界和所述第二图像边界之间的距离、所述第一被选择像素和所述第一交点像素之间的距离和所述第一被选择像素的相对偏移量,确定所述第一交点像素的相对偏移量的操作时,包括执行以下操作:
响应于所述第一图像边界和所述第二图像边界之间的距离和所述第一被选择像素和所述第一交点像素之间的距离满足第一关系式,确定所述第一交点像素的相对偏移量为所述预定值;
响应于所述第一图像边界和所述第二图像边界之间的距离和所述第一被选择像素和所述第一交点像素之间的距离满足第二关系式,确定所述第一交点像素的相对偏移量为所述第一被选择像素的相对偏移量;
所述局部调整模块执行根据所述第一图像边界和所述第二图像边界之间的距离、所述第一被选择像素和所述第二交点像素之间的距离和所述第一被选择像素的相对偏移量,确定所述第二交点像素的相对偏移量的操作时,包括执行以下操作:
响应于所述第一图像边界和所述第二图像边界之间的距离和所述第一被选择像素和所述第二交点像素之间的距离满足第三关系式,确定所述第二交点像素的相对偏移量为所述预定值;
响应于所述第一图像边界和所述第二图像边界之间的距离和所述第一被选择像素和所述第二交点像素之间的距离满足第四关系式,确定所述第二交点像素的相对偏移量为所述第一被选择像素的相对偏移量;
其中,所述第一关系式表示为:
h1>H/DH,
所述第二关系式表示为:
h1≤H/DH,
所述第三关系式表示为:
h2>H/DH,
所述第四关系式表示为:
h2≤H/DH,
其中,h1为所述第一交点像素和所述第一被选择像素之间的距离,h2为所述第二交点像素和所述第一被选择像素之间的距离,H为所述第一图像边界和所述第二图像边界之间的距离,DH为常数。
19.根据权利要求18所述的图像处理装置,其中,
在所述第一交点像素位于所述第一图像边界上和所述第二交点像素位于所述第二图像边界上,或者,所述第一交点像素位于所述第一图像边界或所述第二图像边界上且所述第二交点像素位于所述M个字符行下边界中的某个字符行下边界上的情况下,所述局部调整模块执行根据所述第一被选择像素的相对偏移量和所述第一交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第一交点像素之间的所有像素的相对偏移量的操作时,包括执行以下操作:
响应于所述第一图像边界和所述第二图像边界之间的距离和所述第一交点像素和所述第一被选择像素之间的距离满足所述第一关系式,对所述第一被选择像素的相对偏移量和所述第一交点像素的相对偏移量进行线性插值,以得到所述第一被选择像素列中的位于所述第一被选择像素和所述第一交点像素之间的所有像素的相对偏移量;
响应于所述第一图像边界和所述第二图像边界之间的距离和所述第一交点像素和所述第一被选择像素之间的距离满足所述第二关系式,确定所述第一被选择像素列中的位于所述第一被选择像素和所述第一交点像素之间的所有像素的相对偏移量均为所述第一被选择像素的相对偏移量;
在所述第一交点像素位于所述第一图像边界上和所述第二交点像素位于所述第二图像边界上的情况下,所述局部调整模块执行根据所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量的操作时,包括执行以下操作:
响应于所述第一图像边界和所述第二图像边界之间的距离和所述第二交点像素和所述第一被选择像素之间的距离满足所述第三关系式,对所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量进行线性插值,以得到所述第一被选择像素列中的位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量;
响应于所述第一图像边界和所述第二图像边界之间的距离和所述第二交点像素和所述第一被选择像素之间的距离满足所述第四关系式,确定所述第一被选择像素列中的位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量均为所述第一被选择像素的相对偏移量;
在所述第一交点像素位于所述第一图像边界或所述第二图像边界上且所述第二交点像素位于所述M个字符行下边界中的某个字符行下边界上的情况下,所述局部调整模块执行根据所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量,确定在所述第一被选择像素列中位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量的操作时,包括执行以下操作:
对所述第一被选择像素的相对偏移量和所述第二交点像素的相对偏移量进行线性插值,以得到所述第一被选择像素列中的位于所述第一被选择像素和所述第二交点像素之间的所有像素的相对偏移量。
20.根据权利要求14所述的图像处理装置,其中,述中间校正图像包括排列为多行多列的像素,
所述局部调整模块执行基于所述M个字符行下边界上除了所述M个字符行下边界的基准像素之外的所有像素的相对偏移量、所述第一图像边界和所述第二图像边界,确定所述中间校正图像中所述M个字符行下边界之外的其余像素和所述M个字符行下边界的基准像素的相对偏移量的操作时,包括执行以下操作:
获取第二被选择像素,并确定所述第二被选择像素所在的第二被选择像素列,其中,所述第二被选择像素列沿所述第一方向延伸,所述第二被选择像素不位于所述M个字符行下边界上或者所述第二被选择像素为所述M个字符行下边界中的某个字符行下边界的基准像素;
响应于所述第二被选择像素列上的所有像素均不与所述M个字符行下边界中的任一字符行下边界相交,或者响应于在所述第二被选择像素列与所述M个字符行下边界的任意字符行下边界之间具有交点像素,且所述第二被选择像素列与所述任意字符行下边界之间的交点像素为所述任意字符行下边界的基准像素,确定所述第二被选择像素列上的所有像素的相对偏移量为所述预定值。
21.根据权利要求14所述的图像处理装置,其中,所述中间校正图像包括排列为多行多列的像素,
所述局部调整模块执行根据所述局部调整基准线上的所有像素的局部调整偏移量和所述中间校正图像中的所有像素对应的相对偏移量,确定所述中间校正图像中所述局部调整基准线之外的所有像素的局部调整偏移量的操作时,包括执行以下操作:
获取第三被选择像素,其中,所述第三被选择像素不位于所述局部调整基准线上;
确定所述第三被选择像素所在的像素行,获取所述像素行上的与所述第三被选择像素相邻的像素作为参考像素,其中,所述参考像素位于所述第三被选择像素的靠近所述局部调整基准线的一侧或位于所述局部调整基准线上;
确定所述参考像素的局部调整偏移量;
根据所述参考像素的局部调整偏移量和所述第三被选择像素的相对偏移量,确定所述第三被选择像素的局部调整偏移量。
22.根据权利要求21所述的图像处理装置,其中,所述局部调整模块执行根据所述参考像素的局部调整偏移量和所述第三被选择像素的相对偏移量,确定所述第三被选择像素的局部调整偏移量的操作时,包括执行以下操作:
响应于所述第三被选择像素位于所述局部调整基准线的第一侧,所述第三被选择像素的局部调整偏移量表示为:
dyt=dyc+ddyt,
响应于所述第三被选择像素位于所述局部调整基准线的第二侧,所述第三被选择像素的局部调整偏移量表示为:
dyt=dyc-ddyt,
其中,dyt表示所述第三被选择像素的局部调整偏移量,dyc表示所述参考像素的局部调整偏移量,ddyt表示所述第三被选择像素的相对偏移量。
23.根据权利要求14~22任一项所述的图像处理装置,其中,所述全局校正模块执行对所述输入图像进行全局校正处理,以得到中间校正图像的操作时,包括执行以下操作:
对所述输入图像进行二值化处理,以得到二值化图像;
对所述二值化图像进行字符连接处理,以得到输入字符连通图像,其中,所述输入字符连通图像包括与所述M个字符行对应的M个输入字符连通区域;
获取与所述M个输入字符连通区域一一对应的M条中线,其中,所述M个输入字符连通区域沿所述第一方向排列;
设置W条第一等分线,其中,所述W条第一等分线沿所述第一方向延伸;
获取所述M条中线和所述W条第一等分线之间的多个交点作为多个第三交点像素;
基于所述多个第三交点像素进行二次拟合,以得到与所述W条第一等分线一一对应的W个二次函数;
设置Q条第二等分线,其中,所述Q条第二等分线沿第二方向延伸,其中,所述第一方向和所述第二方向彼此垂直;
获取所述W条第一等分线和所述Q条第二等分线之间的多个交点作为多个第四交点像素;
基于所述W个二次函数,计算所述多个第四交点像素的全局调整偏移量;
根据所述多个第四交点像素的全局调整偏移量,对所述输入图像进行全局校正处理,以得到所述中间校正图像。
24.一种电子设备,包括:
存储器,用于非瞬时性地存储计算机可读指令;
处理器,用于运行所述计算机可读指令,所述计算机可读指令被所述处理器运行时实现根据权利要求1~13任一项所述的图像处理方法。
25.一种非瞬时性计算机可读存储介质,其中,所述非瞬时性计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现根据权利要求1~13中任一项所述的图像处理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010776656.8A CN111914764B (zh) | 2020-08-05 | 2020-08-05 | 图像处理方法、图像处理装置、电子设备和存储介质 |
US17/387,952 US11783458B2 (en) | 2020-08-05 | 2021-07-28 | Image processing method, image processing device, electronic device and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010776656.8A CN111914764B (zh) | 2020-08-05 | 2020-08-05 | 图像处理方法、图像处理装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111914764A CN111914764A (zh) | 2020-11-10 |
CN111914764B true CN111914764B (zh) | 2023-09-15 |
Family
ID=73287600
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010776656.8A Active CN111914764B (zh) | 2020-08-05 | 2020-08-05 | 图像处理方法、图像处理装置、电子设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11783458B2 (zh) |
CN (1) | CN111914764B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111753832B (zh) * | 2020-07-02 | 2023-12-08 | 杭州睿琪软件有限公司 | 图像处理方法、图像处理装置、电子设备和存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5513304A (en) * | 1993-04-19 | 1996-04-30 | Xerox Corporation | Method and apparatus for enhanced automatic determination of text line dependent parameters |
CN101408937A (zh) * | 2008-11-07 | 2009-04-15 | 东莞市微模式软件有限公司 | 一种字符行定位的方法及装置 |
CN101882434A (zh) * | 2009-01-22 | 2010-11-10 | 索尼公司 | 图像处理器、图像处理方法和程序 |
CN102254171A (zh) * | 2011-07-13 | 2011-11-23 | 北京大学 | 一种基于文本边界的中文文档图像畸变校正方法 |
CN102792333A (zh) * | 2010-03-19 | 2012-11-21 | 拉碧斯半导体株式会社 | 图像处理装置、方法、程序以及记录介质 |
CN105069452A (zh) * | 2015-08-07 | 2015-11-18 | 武汉理工大学 | 基于局部结构分析的直线移除方法 |
CN108985305A (zh) * | 2018-06-26 | 2018-12-11 | 武汉科技大学 | 一种激光蚀刻工业雷管编码图像定位及校正方法 |
CN109308478A (zh) * | 2018-09-26 | 2019-02-05 | 新华三信息安全技术有限公司 | 一种字符识别方法及装置 |
CN109598682A (zh) * | 2018-11-09 | 2019-04-09 | 歌尔股份有限公司 | 图像处理方法、装置和设备 |
CN109753953A (zh) * | 2017-11-03 | 2019-05-14 | 腾讯科技(深圳)有限公司 | 图像中定位文本的方法、装置、电子设备和存储介质 |
CN110659647A (zh) * | 2019-09-11 | 2020-01-07 | 杭州睿琪软件有限公司 | 印章图像识别方法及装置、智能发票识别设备和存储介质 |
CN110705488A (zh) * | 2019-10-09 | 2020-01-17 | 广州医药信息科技有限公司 | 图像文字识别方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5951367B2 (ja) * | 2012-01-17 | 2016-07-13 | シャープ株式会社 | 撮像装置、撮像画像処理システム、プログラムおよび記録媒体 |
US11620733B2 (en) * | 2013-03-13 | 2023-04-04 | Kofax, Inc. | Content-based object detection, 3D reconstruction, and data extraction from digital images |
US8897600B1 (en) * | 2013-12-20 | 2014-11-25 | I.R.I.S. | Method and system for determining vanishing point candidates for projective correction |
US9760788B2 (en) * | 2014-10-30 | 2017-09-12 | Kofax, Inc. | Mobile document detection and orientation based on reference object characteristics |
US9646202B2 (en) * | 2015-01-16 | 2017-05-09 | Sony Corporation | Image processing system for cluttered scenes and method of operation thereof |
US10402673B1 (en) * | 2018-10-04 | 2019-09-03 | Capital One Services, Llc | Systems and methods for digitized document image data spillage recovery |
CN111753832B (zh) * | 2020-07-02 | 2023-12-08 | 杭州睿琪软件有限公司 | 图像处理方法、图像处理装置、电子设备和存储介质 |
-
2020
- 2020-08-05 CN CN202010776656.8A patent/CN111914764B/zh active Active
-
2021
- 2021-07-28 US US17/387,952 patent/US11783458B2/en active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5513304A (en) * | 1993-04-19 | 1996-04-30 | Xerox Corporation | Method and apparatus for enhanced automatic determination of text line dependent parameters |
CN101408937A (zh) * | 2008-11-07 | 2009-04-15 | 东莞市微模式软件有限公司 | 一种字符行定位的方法及装置 |
CN101882434A (zh) * | 2009-01-22 | 2010-11-10 | 索尼公司 | 图像处理器、图像处理方法和程序 |
CN102792333A (zh) * | 2010-03-19 | 2012-11-21 | 拉碧斯半导体株式会社 | 图像处理装置、方法、程序以及记录介质 |
CN102254171A (zh) * | 2011-07-13 | 2011-11-23 | 北京大学 | 一种基于文本边界的中文文档图像畸变校正方法 |
CN105069452A (zh) * | 2015-08-07 | 2015-11-18 | 武汉理工大学 | 基于局部结构分析的直线移除方法 |
CN109753953A (zh) * | 2017-11-03 | 2019-05-14 | 腾讯科技(深圳)有限公司 | 图像中定位文本的方法、装置、电子设备和存储介质 |
CN108985305A (zh) * | 2018-06-26 | 2018-12-11 | 武汉科技大学 | 一种激光蚀刻工业雷管编码图像定位及校正方法 |
CN109308478A (zh) * | 2018-09-26 | 2019-02-05 | 新华三信息安全技术有限公司 | 一种字符识别方法及装置 |
CN109598682A (zh) * | 2018-11-09 | 2019-04-09 | 歌尔股份有限公司 | 图像处理方法、装置和设备 |
CN110659647A (zh) * | 2019-09-11 | 2020-01-07 | 杭州睿琪软件有限公司 | 印章图像识别方法及装置、智能发票识别设备和存储介质 |
CN110705488A (zh) * | 2019-10-09 | 2020-01-17 | 广州医药信息科技有限公司 | 图像文字识别方法 |
Non-Patent Citations (1)
Title |
---|
一种人脸标准光照图像的线性重构方法;熊鹏飞;刘昌平;黄磊;;模式识别与人工智能(第04期);102-109 * |
Also Published As
Publication number | Publication date |
---|---|
CN111914764A (zh) | 2020-11-10 |
US20220044367A1 (en) | 2022-02-10 |
US11783458B2 (en) | 2023-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111598074B (zh) | 边缘检测方法和装置、电子设备和存储介质 | |
CN110298282B (zh) | 文档图像处理方法、存储介质和计算设备 | |
CN111275139B (zh) | 手写内容去除方法、手写内容去除装置、存储介质 | |
JP5387193B2 (ja) | 画像処理システム、画像処理装置およびプログラム | |
CN113343740B (zh) | 表格检测方法、装置、设备和存储介质 | |
CN112926421B (zh) | 图像处理方法和装置、电子设备和存储介质 | |
US12039763B2 (en) | Image processing method and device, electronic apparatus and storage medium | |
JP2007241356A (ja) | 画像処理装置および画像処理プログラム | |
CN112613506A (zh) | 图像中的文本识别方法、装置、计算机设备和存储介质 | |
CN111914764B (zh) | 图像处理方法、图像处理装置、电子设备和存储介质 | |
CN112906532A (zh) | 图像处理方法和装置、电子设备和存储介质 | |
CN112419207A (zh) | 一种图像矫正方法及装置、系统 | |
CN108335266B (zh) | 一种文档图像畸变的矫正方法 | |
CN111753832B (zh) | 图像处理方法、图像处理装置、电子设备和存储介质 | |
CN111767924B (zh) | 图像处理方法、图像处理装置、电子设备、存储介质 | |
WO2023130966A1 (zh) | 图像处理方法、图像处理装置、电子设备、存储介质 | |
CN112070708A (zh) | 图像处理方法、图像处理装置、电子设备、存储介质 | |
CN115527215A (zh) | 包含文本的图像处理方法、系统及存储介质 | |
JP2007041832A (ja) | 差分画像抽出装置 | |
Manikandan et al. | An enhanced algorithm for Character Segmentation in document image processing | |
CN111428707B (zh) | 图形识别码的识别方法、装置、存储介质及电子设备 | |
Chen et al. | Applying Image Processing Technology to Automatically Detect and Adjust Paper Benchmark for Printing Machine. | |
WO2023026441A1 (ja) | 領域補正装置、領域補正方法、及びプログラム | |
CN111860492A (zh) | 一种车牌倾斜矫正方法、装置、计算机设备和存储介质 | |
JP7478628B2 (ja) | 画像処理装置、制御方法及び制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |