CN108805124A - 图片处理方法及装置、计算机可读存储介质 - Google Patents

图片处理方法及装置、计算机可读存储介质 Download PDF

Info

Publication number
CN108805124A
CN108805124A CN201810349840.7A CN201810349840A CN108805124A CN 108805124 A CN108805124 A CN 108805124A CN 201810349840 A CN201810349840 A CN 201810349840A CN 108805124 A CN108805124 A CN 108805124A
Authority
CN
China
Prior art keywords
edge line
identified
coordinate
original image
vertex
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810349840.7A
Other languages
English (en)
Other versions
CN108805124B (zh
Inventor
杜晓刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN201810349840.7A priority Critical patent/CN108805124B/zh
Publication of CN108805124A publication Critical patent/CN108805124A/zh
Priority to CN201980000845.1A priority patent/CN110622172A/zh
Priority to PCT/CN2019/082188 priority patent/WO2019201141A1/en
Application granted granted Critical
Publication of CN108805124B publication Critical patent/CN108805124B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本公开关于一种图片处理方法及装置、计算机可读存储介质,该方法包括:根据原始图片中待识别对象的边缘线,确定待识别对象的各顶点在第一坐标系下的实际坐标;根据待识别对象的边缘线,确定待识别对象的标准尺寸,并根据标准尺寸,获得待识别对象的各顶点在第一坐标系下的标准坐标;根据各顶点的实际坐标和标准坐标,求出畸变校正矩阵,并利用畸变校正矩阵对原始图片进行校正处理,获得校正后的图片。本公开提供的方案,能够实现对原始图片中待识别对象的自动校正。

Description

图片处理方法及装置、计算机可读存储介质
技术领域
本公开涉及图像处理领域,尤其涉及一种图片处理方法及装置、计算机可读存储介质。
背景技术
随着移动互联网的兴起,其在人们工作和生活中发挥的功能越来越多,例如,互联网识别、互联网金融,互联网支付等。在移动互联网领域的流程环节中,可能需要用户上传一些材料图片。而目前,移动终端正在成为人们生活社交不可或缺的一部分,如果将移动终端拍摄获取的图片与移动互联网结合应用,将能够极大提高办事效率,节省成本。
以实际应用举例,在互联网支付领域需要对用户进行身份认证,例如,进行实名制认证,则需要用户上传身份证图片。再例如,目前的光学字符识别(Optical CharacterRecognition,简称OCR)技术可以根据图片识别出其中的字符。但实际应用中,上述应用场景都对图片本身的质量有较为严格的要求,以OCR产品为例,其普遍的应用场景是需要采用专业匹配的拍照设备和扫描仪绑定OCR设别软件来提供识别服务,这既增加了成本也不便捷。
产生上述情形的原因是由于光照、背景复杂、人为因素等方面的影响,通常移动终端拍摄到的图片可能存在各种质量问题,例如,可能存在倾斜畸变,这使得移动终端拍摄的图片无法很好地应用于移动互联网领域。
发明内容
本公开提供一种图片处理方法及装置、计算机可读存储介质。所述技术方案如下:
根据本公开实施例的第一方面,提供一种图片处理方法,包括:根据原始图片中待识别对象的边缘线,确定所述待识别对象的各顶点在第一坐标系下的实际坐标;根据所述待识别对象的边缘线,确定所述待识别对象的标准尺寸,并根据所述标准尺寸,获得所述待识别对象的各顶点在第一坐标系下的标准坐标;根据所述各顶点的实际坐标和标准坐标,求出畸变校正矩阵,并利用所述畸变校正矩阵对所述原始图片进行校正处理,获得校正后的图片。
根据本公开实施例的第二方面,提供一种图片处理装置,包括:获取模块,用于根据原始图片中待识别对象的边缘线,确定所述待识别对象的各顶点在第一坐标系下的实际坐标;所述获取模块,还用于根据所述待识别对象的边缘线,确定所述待识别对象的标准尺寸,并根据所述标准尺寸,获得所述待识别对象的各顶点在第一坐标系下的标准坐标;处理模块,用于根据所述各顶点的实际坐标和标准坐标,求出畸变校正矩阵,并利用所述畸变校正矩阵对所述原始图片进行校正处理,获得校正后的图片。
根据本公开实施例的第三方面,提供一种图片处理装置,该图片处理装置包括:处理器;用于存储计算机程序的存储器;其中,所述处理器运行所述计算机程序执行如前所述的方法的步骤。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前所述的方法的步骤。
本公开实施例提供的技术方案可以包括以下有益效果:
根据需要识别的待识别对象,从拍摄的原始图片中确定出待识别对象的边缘线,根据边缘线确定待识别对象的各个顶点在原始图片中的实际坐标,此外,根据边缘线还可以确定待识别对象的标准尺寸,进而确定各个顶点的标准坐标,这里的标准尺寸和标准坐标是基于最终希望获得的校正后的图片来确定的,后续根据基于实际坐标和标准坐标求出的校正矩阵,对原始图片进行校正处理即可获得希望获得的校正后的图片。基于本方案能够实现对原始图片中待识别对象的自动校正,基于校正后的高质量图片能够更有利于后续的图片处理和识别,从而更好地应用于各种图片应用。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1A-图1D是根据一示例性实施例示出的图片处理方法的流程图;
图2A-图2E是基于一示例性实施例示出的图片处理方法的效果示意图;
图3是根据一示例性实施例示出的一种图片处理装置的结构图;
图4是根据一示例性实施例示出的一种图片处理装置的框图。
此处的附图被并入说明书中并构成说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本发明的原理。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的例子。需要说明的是,本方案中的各实施方式可以单独实施,也可以在不冲突的前提下结合实施。
图1A是根据一示例性实施例示出的一种图片处理方法的流程图,如图1A所示,本实施例以该图片处理方法应用于图片处理装置中来举例说明,该图片处理方法可以包括如下几个步骤:
101、根据原始图片中待识别对象的边缘线,确定所述待识别对象的各顶点在第一坐标系下的实际坐标;
102、根据所述待识别对象的边缘线,确定所述待识别对象的标准尺寸,并根据所述标准尺寸,获得所述待识别对象的各顶点在第一坐标系下的标准坐标;
103、根据所述各顶点的实际坐标和标准坐标,求出畸变校正矩阵,并利用所述畸变校正矩阵对所述原始图片进行校正处理,获得校正后的图片。
在实际应用中,该图片处理装置可以通过计算机程序实现,例如,软件应用等;或者还可以为存储有相关计算机程序的介质,例如,U盘等;或者,该图片处理装置还可以为集成或安装有相关计算机程序的实体装置,例如,芯片、智能手机、计算机等。
结合实际场景举例来说:实际应用中,当接收到某原始图片时可以自动触发执行本方案,这里的原始图片可以通过拍摄获得,或者也可以由用户输入。具体的,首先获取原始图片中待识别对象的边缘线,根据该边缘线确定待识别对象的各顶点的位置,这里的位置为原始图片中所述各个顶点相对于第一坐标系的实际坐标。
可选的,根据待识别对象的边缘线确定待识别对象的顶点可以提高识别的准确性。在一种实施方式中,101具体可以包括:
根据所述待识别对象的每两个相邻边缘线的交点,确定所述原始图片中待识别对象的各顶点;
获取所述原始图片中待识别对象的各顶点在第一坐标系下的实际坐标。
结合后述举例进行示例,如图2D所示,图中所示为基于边缘线的交点确定待识别对象顶点的示意图,图中的小圆圈即为确定的各顶点,其在图中所示坐标系下的坐标,即为各顶点的实际坐标。本实施方式中,基于待识别对象的相邻边缘线的交点能够快速准确确定出待识别对象的顶点。
后续,根据待识别对象的边缘线,还可以确定出待识别对象的标准尺寸,进而获得所述各顶点的标准位置。具体的,标准尺寸和标准位置可以根据最终想要获得的图片效果来设定,举例来说,假设希望最终获得的标准图片中待识别对象是占满整个图片的,那么所述标准尺寸可以是原始图片中待识别对象的尺寸,再举例来说,假设希望最终获得的标准图片中待识别对象是没有倾斜的,则相应的,在确定标准坐标时,可以根据标准尺寸,沿水平和垂直方向来推算各个顶点的标准坐标,使得待识别对象的上下边缘与水平方向平行,左右边缘与垂直方向平行,即不发生倾斜。
在一种示例中,假设校正后希望待识别对象铺满图片,则在任一实施方式的基础上,102中所述根据所述标准尺寸,获得所述待识别对象的各顶点在第一坐标系下的标准坐标,具体可以包括:
将所述待识别对象的任一顶点的标准坐标设定为所述第一坐标系的原点坐标;
根据所述任一顶点的标准坐标和所述标准尺寸,获得所述待识别对象的其它各顶点的标准坐标。
其中,第一坐标系可以预先建立,例如,第一坐标系可以原始图片的左上顶点为原点,沿向右(X轴)和向下(Y轴)的方向建立坐标系。为了使待识别图像最终铺满图片,本实施方式中设定待识别对象的任一顶点的标准坐标为第一坐标系的原点,例如,假设待识别对象为矩形,可以设定其左上顶点的标准坐标为(0,0),再根据待识别对象的标准尺寸,确定其它顶点的坐标。仍举例来说,假设最终希望获得不倾斜的待识别对象,且已获得该待识别对象的标准尺寸包括标准宽度为Wnorm和标准高度为Hnorm,则可推算出右上顶点的标准坐标为(Wnorm,0),左下顶点的标准坐标为(0,Hnorm),右下顶点的标准坐标为(Wnorm,Hnorm)。
本实施方式,可以实现对原始图片中待识别对象的精准裁切。
获得每个顶点的实际坐标和标准坐标后,可求出这两种坐标之间的转换矩阵,即畸变校正矩阵。基于该畸变校正矩阵对原始图片进行处理,即可获得校正后的图片。
可以理解,所述待识别对象的边缘线能够勾勒出待识别对象的轮廓。举例来说,对于轮廓为四边形的待识别对象,其边缘线的数量为四条,可以分别为上边缘线、下边缘线、左边缘线、右边缘线。对于三角形轮廓的待识别对象,其边缘线的数量为三条,即分别为三角形的三条边。
结合实际场景来说,本方案可以应用于证件图片的优化处理,例如,身份证、名片、银行卡等相关证件。相应的,如图1B所示,在任一实施方式的基础上,所述待识别对象的边缘线包括所述待识别对象的上边缘线、下边缘线、左边缘线以及右边缘线;对应的,102中所述根据所述待识别对象的边缘线,确定所述待识别对象的标准尺寸,具体可以包括:
1021、根据所述待识别对象的边缘线,确定所述待识别对象的标准宽度和标准高度。
具体的,由于实际应用中涉及需要识别的待识别对象往往为证件或文档,即通常为矩形,故在一种实施方式中,以矩形的待识别对象为例,对本方案进行示例阐述。对于矩形的待识别对象来说,其边缘线即矩形的四条边,按照其位置可以划分为待识别对象的上边缘线、下边缘线、左边缘线以及右边缘线。另外,矩形的尺寸取决于宽度(横向长度)和高度(纵向长度),故相应的,确定待识别对象的标准尺寸可以理解为确定待识别对象的标准宽度和标准高度。
可选的,为了保证校正后图片的分辨率,避免图片失真,在确定标准宽度和标准高度时,可以采取对图片进行放大的策略。相应的,在一种实施方式中,1021具体可以包括:
将所述上边缘线和所述下边缘线中的最大长度作为所述标准高度,将所述左边缘线和所述右边缘线中的最大长度作为所述标准高度。
本实施方式结合实际的应用场景,针对矩形待识别对象进行识别校正,能够提高图片处理方法的应用效果,更加贴合常用的应用场景。
进一步的,为了基于边缘线获得待识别对象的各顶点位置,需要先获得待识别对象的边缘线。可选的,获取待识别对象的边缘线可以通过多种方案实现,仍以矩形的待识别对象作为示例,如图1C所示,在图1B所示实施方式的基础上,所述方法还包括:
201、采用线检测算法识别出所述原始图片中的所有边缘线段;
202、从所有边缘线段中筛选出满足预设条件的上边缘线集合、下边缘线集合、左边缘线集合以及右边缘线集合,所述条件用于表征待识别对象的边缘线的特征;
203、分别从所述上边缘线集合、所述下边缘线集合、所述左边缘线集合以及所述右边缘线集合中选取最长的边缘线段,作为所述待识别对象的上边缘线、下边缘线、左边缘线以及右边缘线。
结合实际场景举例来说:如图2A为一张包含身份证的原始图片的示例图,假设该原始图片的宽度为W,高度为H,可以看出,该原始图片中的身份证呈现倾斜畸变的特征。在获取该原始图片后,首先可以采用线检测(line segment detector,简称lsd)算法识别出原始图片中的所有边缘线段,仍举例来说,如图2B所示,图2B为线检测算法的效果示意图,如图所示,图中的各线段为检测识别出的边缘线段。
接下来需要过滤掉不属于待识别对象的边缘的线段,并且区分出不同的边缘线,即按照上下左右进行分类。本实施方式中基于证件边缘线的特征设定条件,通过筛选出满足该条件的线段来获得可能为证件边缘线的边缘线集合并进行分类。
另外,基于物理样本获得的边缘线的长度通常比内噪声线长的规律,分别从各类边缘线集合中选取长度最长的线段作为待识别对象的边缘线,从而获得待识别对象的边缘线,仍举例来说,如图2C所示,经过上述处理获得的身份证的边缘线如图2C所示。
本实施方式基于待识别对象的边缘线的特征设定筛选条件,从而筛选出可能为边缘线的集合,进而从中确定出待识别对象的边缘线,该实施方式的算法简便,无需占用过多处理资源,即可准确检测出待识别对象的边缘线,从而实现图像识别校正。
可选的,用于反映矩形待识别对象的边缘特征可以有多种。作为一种示例,如图1D所示,在图1C所示实施方式的基础上,202具体可以包括:
2021、分别从所述原始图片的左区域和右区域,选出其相对于垂直方向的倾斜角度在预设范围内且置信度高于预设阈值的边缘线段,作为所述左边缘线集合和右边缘线集合;
2022、分别从所述原始图片的上区域和下区域,选出其相对于水平方向的倾斜角度在所述范围内且置信度高于预设阈值的边缘线段,作为所述上边缘线集合和下边缘线集合。
其中,原始图片的不同区域可以根据筛选的需要划分确定。具体的,本实施方式中,限定所有边缘线的置信度均需高于一定阈值,其中,不同类型(例如,上下左右)边缘线的置信度的阈值可以相同也可以不同,其中,所述置信度是基于前述线监测算法获得的,其能够反映出识别结果为线段的可能性大小,因此,通过设定置信度可以过滤掉一些明显不为线段的识别结果。进一步的,本实施方式中还基于线段的位置进行分类,即左边缘线应位于原始图片的左区域,右边缘线应位于原始图片的右区域,并以此类推。另外,结合用户的操作习惯,将待识别对象的倾斜程度限定在一定范围内,即明显超出倾斜范围的线段为待识别对象的边缘线的可能性较小。本实施方式基于上述一系列因素设定筛选条件,可以理解,还存在结合其它特征设定筛选条件的实施方式,本实施方式并未对其进行限制。
进一步的,进行上述筛选过程可以有多种实现方案。作为一种示例,在图1D所示实施方式的基础上,所述方法还包括:
获取所述原始图片的宽度W、高度H、以及所述所有边缘线段相对于水平方向的倾斜角度L[θ]i,并以所述原始图片的左上顶点为原点,沿向右的水平方向和向下的垂直方向建立第二坐标系;
相应的,2021具体可以包括:
将满足条件:且置信度高于预设阈值的边缘线段,作为左边缘线段集合;
将满足条件:且置信度高于预设阈值的边缘线段,作为右边缘线段集合;
2022具体可以包括:
将满足条件:且置信度高于预设阈值的边缘线段,作为上边缘线段集合;
将满足条件:且置信度高于预设阈值的边缘线段,作为下边缘线段集合;
其中,L[x]i为边缘线段的端点在所述第二坐标系下的水平坐标,L[y]i为边缘线段的端点在所述第二坐标系下的垂直坐标,θ为预设的证件相对于水平方向的最大倾斜角度。
具体的,所述第二坐标系可以如图2C所示的坐标系。可选的,该第二坐标系可以与第一坐标系相同,或者也可以不同。本实施方式中,基于原始图片的各类参数,通过设定公式来反映筛选条件。具体的,由于实际应用中拍摄的待识别对象相对于整幅原始图片通常比较居中,因此将W/2作为区分左右边缘线的阈值,同理在垂直方向上设置H/2作为区分证件上下边缘线的阈值,从而基于各线段的端点所在的区域对这些线段进行分类。另外,为了降低算法的复杂性,本实施方式中将待识别图像的倾斜度限定在一定范围内,举例来说,可以设定待识别对象相对水平方向的倾斜角度不超过20度,也就是说,本应与水平方向平行的上下边缘相对水平方向的倾斜角度不超过20度,本应与水平方向垂直的左右边缘相对水平方向的倾斜角度不小于90-20,即70度。
本实施方式,结合矩形待识别对象的特征,无需复杂的算法,即可筛选出可能为待识别对象边缘线的线段,从而减小计算的复杂度,提高图片识别校正的效率。
结合前述举例,最终获得的校正后的图片可以如图2E所示。可见,基于本方案能够实现对待识别对象的精准裁切和畸变校正。
本实施例提供图片处理方法,根据需要识别的待识别对象,从拍摄的原始图片中确定出待识别对象的边缘线,根据边缘线确定待识别对象的各个顶点在原始图片中的实际坐标,此外,根据边缘线还可以确定待识别对象的标准尺寸,进而确定各个顶点的标准坐标,这里的标准尺寸和标准坐标是基于最终希望获得的校正后的图片来确定的,后续根据基于实际坐标和标准坐标求出的校正矩阵,对原始图片进行校正处理即可获得希望获得的校正后的图片。基于本方案能够实现对原始图片中待识别对象的自动校正,基于校正后的高质量图片能够更有利于后续的图片处理和识别,从而更好地应用于各种图片应用。
图3是根据一示例性实施例示出的一种图片处理装置的结构图,如图3所示,该图片处理装置包括:
获取模块31,用于根据原始图片中待识别对象的边缘线,确定所述待识别对象的各顶点在第一坐标系下的实际坐标;
获取模块31,还用于根据所述待识别对象的边缘线,确定所述待识别对象的标准尺寸,并根据所述标准尺寸,获得所述待识别对象的各顶点在第一坐标系下的标准坐标;
处理模块32,用于根据所述各顶点的实际坐标和标准坐标,求出畸变校正矩阵,并利用所述畸变校正矩阵对所述原始图片进行校正处理,获得校正后的图片。
在实际应用中,该图片处理装置可以通过计算机程序实现,例如,软件应用等;或者还可以为存储有相关计算机程序的介质,例如,U盘等;或者,该图片处理装置还可以为集成或安装有相关计算机程序的实体装置,例如,芯片、智能手机、计算机等。
结合实际场景举例来说:获取模块31首先获取原始图片中待识别对象的边缘线,根据该边缘线确定原始图片中待识别对象的各个顶点相对于第一坐标系的实际坐标。
可选的,根据待识别对象的边缘线确定待识别对象的顶点可以提高识别的准确性。在一种实施方式中,获取模块31包括:确定单元,用于根据所述待识别对象的每两个相邻边缘线的交点,确定所述原始图片中待识别对象的各顶点;获取单元,用于获取所述原始图片中待识别对象的各顶点在第一坐标系下的实际坐标。本实施方式中,基于待识别对象的相邻边缘线的交点确定顶点,能够快速准确确定出待识别对象的顶点。
后续,根据待识别对象的边缘线,还可以确定出待识别对象的标准尺寸,进而获得所述各顶点的标准位置。具体的,标准尺寸和标准位置可以根据最终想要获得的图片效果来设定。
在一种示例中,假设校正后希望待识别对象铺满图片,则在任一实施方式的基础上,获取模块31可以包括:设定单元,用于将所述待识别对象的任一顶点的标准坐标设定为所述第一坐标系的原点坐标;推算单元,用于根据所述任一顶点的标准坐标和所述标准尺寸,获得所述待识别对象的其它各顶点的标准坐标。本实施方式,可以实现对原始图片中待识别对象的精准裁切。
获取模块31获得每个顶点的实际坐标和标准坐标后,处理模块32可求出这两种坐标之间的转换矩阵,即畸变校正矩阵。处理模块32基于该畸变校正矩阵对原始图片进行处理,即可获得校正后的图片。
结合实际场景来说,本方案可以应用于证件图片的优化处理,例如,身份证、名片、银行卡等相关证件。相应的,在任一实施方式的基础上,所述待识别对象的边缘线包括所述待识别对象的上边缘线、下边缘线、左边缘线以及右边缘线;对应的,获取模块31,具体用于根据所述待识别对象的边缘线,确定所述待识别对象的标准宽度和标准高度。
可选的,为了保证校正后图片的分辨率,避免图片失真,在确定标准宽度和标准高度时,可以采取对图片进行放大的策略。相应的,在一种实施方式中,获取模块31,具体用于将所述上边缘线和所述下边缘线中的最大长度作为所述标准高度,将所述左边缘线和所述右边缘线中的最大长度作为所述标准高度。
本实施方式结合实际的应用场景,针对矩形待识别对象进行识别校正,能够提高图片处理方法的应用效果,更加贴合常用的应用场景。
进一步的,为了基于边缘线获得待识别对象的各顶点位置,需要先获得待识别对象的边缘线。可选的,在前述实施方式的基础上,所述装置还包括:
识别模块,用于采用线检测算法识别出所述原始图片中的所有边缘线段;
过滤模块,用于从所有边缘线段中筛选出满足预设条件的上边缘线集合、下边缘线集合、左边缘线集合以及右边缘线集合,所述条件用于表征待识别对象的边缘线的特征;
所述过滤模块,还用于分别从所述上边缘线集合、所述下边缘线集合、所述左边缘线集合以及所述右边缘线集合中选取最长的边缘线段,作为所述待识别对象的上边缘线、下边缘线、左边缘线以及右边缘线。
本实施方式基于待识别对象的边缘线的特征设定筛选条件,从而筛选出可能为边缘线的集合,进而从中确定出待识别对象的边缘线,该实施方式的算法简便,无需占用过多处理资源,即可准确检测出待识别对象的边缘线,从而实现图像识别校正。
可选的,用于反映矩形待识别对象的边缘特征可以有多种。作为一种示例,在上述实施方式的基础上,所述过滤模块可以包括:
选取单元,用于分别从所述原始图片的左区域和右区域,选出其相对于垂直方向的倾斜角度在预设范围内且置信度高于预设阈值的边缘线段,作为所述左边缘线集合和右边缘线集合;
所述选取单元,还用于分别从所述原始图片的上区域和下区域,选出其相对于水平方向的倾斜角度在所述范围内且置信度高于预设阈值的边缘线段,作为所述上边缘线集合和下边缘线集合。
其中,原始图片的不同区域可以根据筛选的需要划分确定。本实施方式基于上述一系列因素设定筛选条件,可以理解,还存在结合其它特征设定筛选条件的实施方式,本实施方式并未对其进行限制。
进一步的,进行上述筛选过程可以有多种实现方案。作为一种示例,在上述实施方式的基础上,所述装置还包括:
初始模块,用于获取所述原始图片的宽度W、高度H、以及所述所有边缘线段相对于水平方向的倾斜角度L[θ]i,并以所述原始图片的左上顶点为原点,沿向右的水平方向和向下的垂直方向建立第二坐标系;
所述选取单元,具体用于:
将满足条件:且置信度高于预设阈值的边缘线段,作为左边缘线段集合;
将满足条件:且置信度高于预设阈值的边缘线段,作为右边缘线段集合;
所述选取单元,还具体用于:
将满足条件:且置信度高于预设阈值的边缘线段,作为上边缘线段集合;
将满足条件:且置信度高于预设阈值的边缘线段,作为下边缘线段集合;
其中,L[x]i为边缘线段的端点在所述第二坐标系下的水平坐标,L[y]i为边缘线段的端点在所述第二坐标系下的垂直坐标,θ为预设的证件相对于水平方向的最大倾斜角度。
本实施方式,结合矩形待识别对象的特征,无需复杂的算法,即可筛选出可能为待识别对象边缘线的线段,从而减小计算的复杂度,提高图片识别校正的效率。
本实施例提供图片处理装置,根据需要识别的待识别对象,从拍摄的原始图片中确定出待识别对象的边缘线,根据边缘线确定待识别对象的各个顶点在原始图片中的实际坐标,此外,根据边缘线还可以确定待识别对象的标准尺寸,进而确定各个顶点的标准坐标,这里的标准尺寸和标准坐标是基于最终希望获得的校正后的图片来确定的,后续根据基于实际坐标和标准坐标求出的校正矩阵,对原始图片进行校正处理即可获得希望获得的校正后的图片。基于本方案能够实现对原始图片中待识别对象的自动校正,基于校正后的高质量图片能够更有利于后续的图片处理和识别,从而更好地应用于各种图片应用。
以上描述的图片处理装置用于执行上述的图片处理方法。
如图4所示,图4是根据一示例性实施例示出的一种图片处理装置的框图,如图4所示,该图片处理装置可实现为:
处理器;
用于存储计算机程序的存储器;
其中,所述处理器运行所述计算机程序执行如前述任一实施例所述的方法的步骤。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,其上存储有计算机程序,该计算机程序被处理器执行时实现如前述任一实施例所述的方法的步骤。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置的具体工作过程,可以参考前述方法实施例中的对应过程。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (18)

1.一种图片处理方法,其特征在于,包括:
根据原始图片中待识别对象的边缘线,确定所述待识别对象的各顶点在第一坐标系下的实际坐标;
根据所述待识别对象的边缘线,确定所述待识别对象的标准尺寸,并根据所述标准尺寸,获得所述待识别对象的各顶点在第一坐标系下的标准坐标;
根据所述各顶点的实际坐标和标准坐标,求出畸变校正矩阵,并利用所述畸变校正矩阵对所述原始图片进行校正处理,获得校正后的图片。
2.根据权利要求1所述的方法,其特征在于,所述待识别对象的边缘线包括所述待识别对象的上边缘线、下边缘线、左边缘线以及右边缘线;所述根据所述待识别对象的边缘线,确定所述待识别对象的标准尺寸,包括:
根据所述待识别对象的边缘线,确定所述待识别对象的标准宽度和标准高度。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
采用线检测算法识别出所述原始图片中的所有边缘线段;
从所有边缘线段中筛选出满足预设条件的上边缘线集合、下边缘线集合、左边缘线集合以及右边缘线集合,所述条件用于表征待识别对象的边缘线的特征;
分别从所述上边缘线集合、所述下边缘线集合、所述左边缘线集合以及所述右边缘线集合中选取最长的边缘线段,作为所述待识别对象的上边缘线、下边缘线、左边缘线以及右边缘线。
4.根据权利要求3所述的方法,其特征在于,所述从所有边缘线段中筛选出满足预设条件的上边缘线集合、下边缘线集合、左边缘线集合以及右边缘线集合,包括:
分别从所述原始图片的左区域和右区域,选出其相对于垂直方向的倾斜角度在预设范围内且置信度高于预设阈值的边缘线段,作为所述左边缘线集合和右边缘线集合;
分别从所述原始图片的上区域和下区域,选出其相对于水平方向的倾斜角度在所述范围内且置信度高于预设阈值的边缘线段,作为所述上边缘线集合和下边缘线集合。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
获取所述原始图片的宽度W、高度H、以及所述所有边缘线段相对于水平方向的倾斜角度L[θ]i,并以所述原始图片的左上顶点为原点,沿向右的水平方向和向下的垂直方向建立第二坐标系;
所述分别从所述原始图片的左区域和右区域,选出其相对于垂直方向的倾斜角度在预设范围内且置信度高于预设阈值的边缘线段,作为所述左边缘线集合和右边缘线集合,包括:
将满足条件:且置信度高于预设阈值的边缘线段,作为左边缘线段集合;
将满足条件:且置信度高于预设阈值的边缘线段,作为右边缘线段集合;
所述分别从所述原始图片的上区域和下区域,选出其相对于水平方向的倾斜角度在所述范围内且置信度高于预设阈值的边缘线段,作为所述上边缘线集合和下边缘线集合,包括:
将满足条件:且置信度高于预设阈值的边缘线段,作为上边缘线段集合;
将满足条件:且置信度高于预设阈值的边缘线段,作为下边缘线段集合;
其中,L[x]i为边缘线段的端点在所述第二坐标系下的水平坐标,L[y]i为边缘线段的端点在所述第二坐标系下的垂直坐标,θ为预设的证件相对于水平方向的最大倾斜角度。
6.根据权利要求2所述的方法,其特征在于,所述根据所述待识别对象的边缘线,确定所述待识别对象的标准宽度和标准高度,包括:
将所述上边缘线和所述下边缘线中的最大长度作为所述标准高度,将所述左边缘线和所述右边缘线中的最大长度作为所述标准高度。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述根据所述标准尺寸,获得所述待识别对象的各顶点在第一坐标系下的标准坐标,包括:
将所述待识别对象的任一顶点的标准坐标设定为所述第一坐标系的原点坐标;
根据所述任一顶点的标准坐标和所述标准尺寸,获得所述待识别对象的其它各顶点的标准坐标。
8.根据权利要求1-6中任一项所述的方法,其特征在于,所述根据原始图片中待识别对象的边缘线,确定所述待识别对象的各顶点在第一坐标系下的实际坐标,包括:
根据所述待识别对象的每两个相邻边缘线的交点,确定所述原始图片中待识别对象的各顶点;
获取所述原始图片中待识别对象的各顶点在第一坐标系下的实际坐标。
9.一种图片处理装置,其特征在于,包括:
获取模块,用于根据原始图片中待识别对象的边缘线,确定所述待识别对象的各顶点在第一坐标系下的实际坐标;
所述获取模块,还用于根据所述待识别对象的边缘线,确定所述待识别对象的标准尺寸,并根据所述标准尺寸,获得所述待识别对象的各顶点在第一坐标系下的标准坐标;
处理模块,用于根据所述各顶点的实际坐标和标准坐标,求出畸变校正矩阵,并利用所述畸变校正矩阵对所述原始图片进行校正处理,获得校正后的图片。
10.根据权利要求9所述的装置,其特征在于,所述待识别对象的边缘线包括所述待识别对象的上边缘线、下边缘线、左边缘线以及右边缘线;
所述获取模块,具体用于根据所述待识别对象的边缘线,确定所述待识别对象的标准宽度和标准高度。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
识别模块,用于采用线检测算法识别出所述原始图片中的所有边缘线段;
过滤模块,用于从所有边缘线段中筛选出满足预设条件的上边缘线集合、下边缘线集合、左边缘线集合以及右边缘线集合,所述条件用于表征待识别对象的边缘线的特征;
所述过滤模块,还用于分别从所述上边缘线集合、所述下边缘线集合、所述左边缘线集合以及所述右边缘线集合中选取最长的边缘线段,作为所述待识别对象的上边缘线、下边缘线、左边缘线以及右边缘线。
12.根据权利要求11所述的装置,其特征在于,所述过滤模块包括:
选取单元,用于分别从所述原始图片的左区域和右区域,选出其相对于垂直方向的倾斜角度在预设范围内且置信度高于预设阈值的边缘线段,作为所述左边缘线集合和右边缘线集合;
所述选取单元,还用于分别从所述原始图片的上区域和下区域,选出其相对于水平方向的倾斜角度在所述范围内且置信度高于预设阈值的边缘线段,作为所述上边缘线集合和下边缘线集合。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
初始模块,用于获取所述原始图片的宽度W、高度H、以及所述所有边缘线段相对于水平方向的倾斜角度L[θ]i,并以所述原始图片的左上顶点为原点,沿向右的水平方向和向下的垂直方向建立第二坐标系;
所述选取单元,具体用于:
将满足条件:且置信度高于预设阈值的边缘线段,作为左边缘线段集合;
将满足条件:且置信度高于预设阈值的边缘线段,作为右边缘线段集合;
所述选取单元,还具体用于:
将满足条件:且置信度高于预设阈值的边缘线段,作为上边缘线段集合;
将满足条件:且置信度高于预设阈值的边缘线段,作为下边缘线段集合;
其中,L[x]i为边缘线段的端点在所述第二坐标系下的水平坐标,L[y]i为边缘线段的端点在所述第二坐标系下的垂直坐标,θ为预设的证件相对于水平方向的最大倾斜角度。
14.根据权利要求10所述的装置,其特征在于,
所述获取模块,具体用于将所述上边缘线和所述下边缘线中的最大长度作为所述标准高度,将所述左边缘线和所述右边缘线中的最大长度作为所述标准高度。
15.根据权利要求9-14中任一项所述的装置,其特征在于,所述获取模块包括:
设定单元,用于将所述待识别对象的任一顶点的标准坐标设定为所述第一坐标系的原点坐标;
推算单元,用于根据所述任一顶点的标准坐标和所述标准尺寸,获得所述待识别对象的其它各顶点的标准坐标。
16.根据权利要求9-14中任一项所述的装置,其特征在于,所述获取模块包括:
确定单元,用于根据所述待识别对象的每两个相邻边缘线的交点,确定所述原始图片中待识别对象的各顶点;
获取单元,用于获取所述原始图片中待识别对象的各顶点在第一坐标系下的实际坐标。
17.一种图片处理装置,其特征在于,包括:
处理器;
用于存储计算机程序的存储器;
其中,所述处理器运行所述计算机程序执行如权利要求1-8任一项所述方法的步骤。
18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-8任一项所述方法的步骤。
CN201810349840.7A 2018-04-18 2018-04-18 图片处理方法及装置、计算机可读存储介质 Active CN108805124B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201810349840.7A CN108805124B (zh) 2018-04-18 2018-04-18 图片处理方法及装置、计算机可读存储介质
CN201980000845.1A CN110622172A (zh) 2018-04-18 2019-04-11 图像处理方法和系统
PCT/CN2019/082188 WO2019201141A1 (en) 2018-04-18 2019-04-11 Methods and systems for image processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810349840.7A CN108805124B (zh) 2018-04-18 2018-04-18 图片处理方法及装置、计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN108805124A true CN108805124A (zh) 2018-11-13
CN108805124B CN108805124B (zh) 2019-10-18

Family

ID=64094858

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810349840.7A Active CN108805124B (zh) 2018-04-18 2018-04-18 图片处理方法及装置、计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN108805124B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019201141A1 (en) * 2018-04-18 2019-10-24 Beijing Didi Infinity Technology And Development Co., Ltd. Methods and systems for image processing
CN110689501A (zh) * 2019-09-29 2020-01-14 京东方科技集团股份有限公司 一种畸变校正方法、装置、电子设备及计算机可读存储介质
CN110781710A (zh) * 2018-12-17 2020-02-11 北京嘀嘀无限科技发展有限公司 一种目标对象聚类方法及装置
CN111860481A (zh) * 2020-06-30 2020-10-30 湖南三湘银行股份有限公司 一种基于多识别参量的网上银行服务系统
CN114092690A (zh) * 2020-08-06 2022-02-25 杭州睿琪软件有限公司 对象边缘识别和处理方法、系统及计算机可读存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1867940A (zh) * 2003-10-14 2006-11-22 卡西欧计算机株式会社 成像装置及其图像处理方法
CN1937698A (zh) * 2006-10-19 2007-03-28 上海交通大学 图像畸变自动校正的图像处理方法
CN101662581A (zh) * 2009-09-09 2010-03-03 谭洪舟 多功能证件信息采集系统
WO2015123646A1 (en) * 2014-02-14 2015-08-20 Nant Holdings Ip, Llc Edge-based recognition, systems and methods
CN105654097A (zh) * 2015-12-29 2016-06-08 上海珍岛信息技术有限公司 图像中四边形标记物的检测方法
CN106548147A (zh) * 2016-11-02 2017-03-29 南京鑫和汇通电子科技有限公司 一种快速的噪声鲁棒性图像异物检测方法及teds系统
CN106951897A (zh) * 2017-03-11 2017-07-14 深圳市极客思索科技有限公司 一种医疗单据相片的倾斜程度判断方法
CN107105209A (zh) * 2017-05-22 2017-08-29 长春华懋科技有限公司 投影图像几何畸变自动校正系统及其校正方法
CN107480666A (zh) * 2017-08-10 2017-12-15 深圳市碧海扬帆科技有限公司 图像捕获设备及其扫描目标提取方法、装置、存储介质
CN107909544A (zh) * 2017-10-31 2018-04-13 珠海丹德图像技术有限公司 一种图像校正方法及系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1867940A (zh) * 2003-10-14 2006-11-22 卡西欧计算机株式会社 成像装置及其图像处理方法
CN1937698A (zh) * 2006-10-19 2007-03-28 上海交通大学 图像畸变自动校正的图像处理方法
CN101662581A (zh) * 2009-09-09 2010-03-03 谭洪舟 多功能证件信息采集系统
WO2015123646A1 (en) * 2014-02-14 2015-08-20 Nant Holdings Ip, Llc Edge-based recognition, systems and methods
CN105654097A (zh) * 2015-12-29 2016-06-08 上海珍岛信息技术有限公司 图像中四边形标记物的检测方法
CN106548147A (zh) * 2016-11-02 2017-03-29 南京鑫和汇通电子科技有限公司 一种快速的噪声鲁棒性图像异物检测方法及teds系统
CN106951897A (zh) * 2017-03-11 2017-07-14 深圳市极客思索科技有限公司 一种医疗单据相片的倾斜程度判断方法
CN107105209A (zh) * 2017-05-22 2017-08-29 长春华懋科技有限公司 投影图像几何畸变自动校正系统及其校正方法
CN107480666A (zh) * 2017-08-10 2017-12-15 深圳市碧海扬帆科技有限公司 图像捕获设备及其扫描目标提取方法、装置、存储介质
CN107909544A (zh) * 2017-10-31 2018-04-13 珠海丹德图像技术有限公司 一种图像校正方法及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019201141A1 (en) * 2018-04-18 2019-10-24 Beijing Didi Infinity Technology And Development Co., Ltd. Methods and systems for image processing
CN110781710A (zh) * 2018-12-17 2020-02-11 北京嘀嘀无限科技发展有限公司 一种目标对象聚类方法及装置
CN110689501A (zh) * 2019-09-29 2020-01-14 京东方科技集团股份有限公司 一种畸变校正方法、装置、电子设备及计算机可读存储介质
US11295419B2 (en) 2019-09-29 2022-04-05 Boe Technology Group Co., Ltd. Distortion correction method and apparatus, electronic device, and computer-readable storage medium
CN110689501B (zh) * 2019-09-29 2022-07-22 京东方科技集团股份有限公司 一种畸变校正方法、装置、电子设备及计算机可读存储介质
CN111860481A (zh) * 2020-06-30 2020-10-30 湖南三湘银行股份有限公司 一种基于多识别参量的网上银行服务系统
CN111860481B (zh) * 2020-06-30 2021-08-10 湖南三湘银行股份有限公司 一种基于多识别参量的网上银行服务系统
CN114092690A (zh) * 2020-08-06 2022-02-25 杭州睿琪软件有限公司 对象边缘识别和处理方法、系统及计算机可读存储介质

Also Published As

Publication number Publication date
CN108805124B (zh) 2019-10-18

Similar Documents

Publication Publication Date Title
CN108805124B (zh) 图片处理方法及装置、计算机可读存储介质
JP4954081B2 (ja) 人間の画像における虹彩及び瞳孔の検出方法
US7720302B2 (en) Method, apparatus and program for image processing
EP1918872B1 (en) Image segmentation method and system
JP4870779B2 (ja) デジタル画像露光量及びトーンスケールの調節
US7860280B2 (en) Facial feature detection method and device
US7586520B2 (en) Image correction apparatus, image correction program storage medium, image correction method, and image correction system
JP2020536457A (ja) 画像処理方法および装置、電子機器、ならびにコンピュータ可読記憶媒体
US8391595B2 (en) Image processing method and image processing apparatus
KR101725884B1 (ko) 이미지들에 대한 자동 프로세싱
US20050196069A1 (en) Method, apparatus, and program for trimming images
US20050129326A1 (en) Image processing apparatus and print system
JP6798752B2 (ja) 補正画像を生成する方法、ノートブック又はアジェンダの1ページ又は2つの隣接するページに描かれた書込み又は図の選択画像を生成する方法、pc用のコンピュータプログラム、又は、スマートフォン若しくはタブレットコンピュータ用のモバイルアプリケーション
CN105825494A (zh) 一种图像处理方法及移动终端
JP4647289B2 (ja) 画像処理方法および装置並びにプログラム
CN111724470B (zh) 一种处理方法及电子设备
US8498453B1 (en) Evaluating digital images using head points
JP2018107593A (ja) 画像処理装置、画像処理方法およびプログラム
CN111242074B (zh) 一种基于图像处理的证件照背景替换方法
CN106446859B (zh) 利用手机前置摄像头自动识别人眼中黑点和血丝的方法
JP6669390B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2005332382A (ja) 画像処理方法および装置並びにプログラム
RU2329535C2 (ru) Способ автоматического кадрирования фотографий
CN108647680B (zh) 图像定位框检测方法和装置
CN111182207A (zh) 图像拍摄方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant