CN110909816B - 图片识别方法和装置 - Google Patents
图片识别方法和装置 Download PDFInfo
- Publication number
- CN110909816B CN110909816B CN201911204139.7A CN201911204139A CN110909816B CN 110909816 B CN110909816 B CN 110909816B CN 201911204139 A CN201911204139 A CN 201911204139A CN 110909816 B CN110909816 B CN 110909816B
- Authority
- CN
- China
- Prior art keywords
- image area
- target object
- image
- area
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- PCTMTFRHKVHKIS-BMFZQQSSSA-N (1s,3r,4e,6e,8e,10e,12e,14e,16e,18s,19r,20r,21s,25r,27r,30r,31r,33s,35r,37s,38r)-3-[(2r,3s,4s,5s,6r)-4-amino-3,5-dihydroxy-6-methyloxan-2-yl]oxy-19,25,27,30,31,33,35,37-octahydroxy-18,20,21-trimethyl-23-oxo-22,39-dioxabicyclo[33.3.1]nonatriaconta-4,6,8,10 Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2.O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 PCTMTFRHKVHKIS-BMFZQQSSSA-N 0.000 description 1
- 102100032202 Cornulin Human genes 0.000 description 1
- 101000929495 Homo sapiens Adenosine deaminase Proteins 0.000 description 1
- 101000920981 Homo sapiens Cornulin Proteins 0.000 description 1
- 101000625338 Homo sapiens Transcriptional adapter 1 Proteins 0.000 description 1
- 102100025043 Transcriptional adapter 1 Human genes 0.000 description 1
- 101150117319 aba2 gene Proteins 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供一种图片识别方法和装置,通过扫描待识别图片并根据待识别图片中各像素点的像素值,获取属于目标物的像素点的第一图像区域;根据第一图像区域,获取待识别图片中的第二图像区域,其中,第二图像区域包括第一图像区域;根据第一图像区域以及第二图像区域,获得目标物的图像区域;将目标物的图像区域在待识别图片中的位置设置为目标位置;根据设置为目标位置之后的目标物的图像区域,识别目标物的相关信息;其中,目标物的图像区域中目标物的轮廓顶点位于第二图像区域的轮廓上。实现对目标物在待识别图片上的位置的准确定位,从而对目标物图片上的信息所在的位置进行准确定位,提高了对目标物图片上的信息识别的准确性。
Description
技术领域
本发明实施例涉及图片处理技术领域,尤其涉及一种图片识别方法和装置。
背景技术
在办理一些事务时,需要提交身份证信息,随着科技的发展,越来越多的使用计算机技术录入身份证信息,提高了录入的效率。在办理一些事务时,需要提交身份证信息,随着科技的发展,越来越多的使用计算机技术录入身份证信息,提高了录入的效率。
然而,有些部门是通过身份证图片(例如,复印的身份证图片)录入身份证信息,如果在复印身份证时,身份证倾斜放置,会使得身份证图片的旋转、倾斜角度较大,或者身份证图片中含有大量的背景文本(即非身份证信息),都会导致在对身份证图片上的文本行进行定位时,定位不准确,影响对身份证识别的准确性。
发明内容
本发明实施例提供一种图片识别方法和装置,可以提高对目标物在待识别图片上的位置的定位的准确,从而对目标物图片上的信息所在的位置进行准确定位,提高了对目标物图片上的信息识别的准确性。
第一方面,本发明实施例提供一种图片识别方法,包括:
扫描待识别图片并根据所述待识别图片中各像素点的像素值,获取属于目标物的像素点的第一图像区域;
根据所述第一图像区域,获取所述待识别图片中的第二图像区域,其中,所述第二图像区域包括所述第一图像区域;
根据所述第一图像区域以及所述第二图像区域,获得所述目标物的图像区域;
将所述目标物的图像区域在所述待识别图片中的位置设置为目标位置;
根据设置为目标位置之后的所述目标物的图像区域,识别所述目标物的相关信息;
其中,所述目标物的图像区域中所述目标物的轮廓顶点位于所述第二图像区域的轮廓上。
在一些实施例中,所述根据所述第一图像区域以及所述第二图像区域,获得所述目标物的图像区域,包括:
获取所述第一图像区域中的N个像素点;
根据所述N个像素点,获得第三图像区域,所述N个像素点为所述第三图像区域的轮廓上的点;
根据所述第一图像区域、所述第二图像区域与所述第三图像区域,获得所述目标物的图像区域。
在一些实施例中,若所述目标物为N边形,则所述第二图像区域、所述第三图像区域为N边形,所述N为大于等于3;
所述N个像素为所述第三图像区域的轮廓上的顶点。
在一些实施例中,所述N个像素点分别为距离所述第二图像区域的N个顶点最近的N个像素点。
在一些实施例中,所述根据所述第一图像区域、所述第二图像区域与所述第三图像区域,获得所述目标物的图像区域,包括:
将所述第三图像区域中相交于所述第三图像区域的顶点的第一边和第二边延长;
获取第一边与所述第二图像区域的边相交的第一交点,以及第二边与所述第二图像区域的边相交的第二交点;
根据所述第一交点与所述第二交点,确定与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点;
根据确定出的N个与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点,获得所述目标物的图像区域。
在一些实施例中,所述根据所述第一交点与所述第二交点,确定与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点,包括:
根据第一边和第二交点获得第一三角形图像区域,根据第二边和第一交点获得第二三角形图像区域;
获取所述目标物的像素点的图像区域与所述第一三角形图像区域重叠的第一重叠区域,以及所述目标物的像素点的图像区域与所述第一三角形图像区域重叠的第二重叠区域;
根据所述第一重叠区域和所述第二重叠区域,确定与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点为第一交点或第二交点。
在一些实施例中,所述根据所述第一重叠区域和所述第二重叠区域,确定与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点为第一交点或第二交点,包括:
若所述第一重叠区域的面积大于所述第二重叠区域的面积,则确定与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点为第二交点;
若所述第二重叠区域的面积大于所述第一重叠区域的面积,则确定与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点为第一交点。
第二方面,本发明实施例提供一种图片识别装置,包括:
获取模块,用于扫描待识别图片并根据所述待识别图片中各像素点的像素值,获取属于目标物的像素点的第一图像区域;还用于根据所述第一图像区域,获取所述待识别图片中的第二图像区域,其中,所述第二图像区域包括所述第一图像区域;还用于根据所述第一图像区域以及所述第二图像区域,获得所述目标物的图像区域;
确定模块,用于将所述目标物的图像区域在所述待识别图片中的位置设置为目标位置;
识别模块,用于根据设置为目标位置之后的所述目标物的图像区域,识别所述目标物的相关信息;
其中,所述目标物的图像区域中所述目标物的轮廓顶点位于所述第二图像区域的轮廓上。
在一些实施例中,所述获取模块在根据所述第一图像区域以及所述第二图像区域,获得所述目标物的图像区域时,具体用于:
获取所述第一图像区域中的N个像素点;
根据所述N个像素点,获得第三图像区域,所述N个像素点为所述第三图像区域的轮廓上的点;
根据所述第一图像区域、所述第二图像区域与所述第三图像区域,获得所述目标物的图像区域。
在一些实施例中,若所述目标物为N边形,则所述第二图像区域、所述第三图像区域为N边形,所述N为大于等于3;
所述N个像素为所述第三图像区域的轮廓上的顶点。
在一些实施例中,所述N个像素点分别为距离所述第二图像区域的N个顶点最近的N个像素点。
在一些实施例中,所述获取模块字在根据所述第一图像区域、所述第二图像区域与所述第三图像区域,获得所述目标物的图像区域时,具体用于:
将所述第三图像区域中相交于所述第三图像区域的顶点的第一边和第二边延长;
获取第一边与所述第二图像区域的边相交的第一交点,以及第二边与所述第二图像区域的边相交的第二交点;
根据所述第一交点与所述第二交点,确定与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点;
根据确定出的N个与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点,获得所述目标物的图像区域。
在一些实施例中,所述获取模块在根据所述第一交点与所述第二交点,确定与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点时,具体用于:
根据第一边和第二交点获得第一三角形图像区域,根据第二边和第一交点获得第二三角形图像区域;
获取所述目标物的像素点的图像区域与所述第一三角形图像区域重叠的第一重叠区域,以及所述目标物的像素点的图像区域与所述第一三角形图像区域重叠的第二重叠区域;
根据所述第一重叠区域和所述第二重叠区域,确定与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点为第一交点或第二交点。
在一些实施例中,所述获取模块在根据所述第一重叠区域和所述第二重叠区域,确定与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点为第一交点或第二交点时,具体用于:
若所述第一重叠区域的面积大于所述第二重叠区域的面积,则确定与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点为第二交点;
若所述第二重叠区域的面积大于所述第一重叠区域的面积,则确定与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点为第一交点。
第三方面,本发明实施例提供一种电子设备,该电子设备包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,以执行本发明实施例第一方面任一项所述的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,该计算机可读存储介质中存储有程序指令,所述程序指令被处理器执行时实现发明实施例第一方面任一项所述的方法。
第五方面,本申请实施例提供一种程序产品,所述程序产品包括计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备实施本申请发明实施例第一方面任一项所述的方法。
本发明实施例提供一种图片识别方法和装置,通过扫描待识别图片并根据所述待识别图片中各像素点的像素值,获取属于目标物的像素点的第一图像区域;根据所述第一图像区域,获取所述待识别图片中的第二图像区域,其中,所述第二图像区域包括所述第一图像区域;根据所述第一图像区域以及所述第二图像区域,获得所述目标物的图像区域;将所述目标物的图像区域在所述待识别图片中的位置设置为目标位置;根据设置为目标位置之后的所述目标物的图像区域,识别所述目标物的相关信息;其中,所述目标物的图像区域中所述目标物的轮廓顶点位于所述第二图像区域的轮廓上。实现对目标物在待识别图片上的位置的准确定位,从而对目标物图片上的信息所在的位置进行准确定位,提高了对目标物图片上的信息识别的准确性,加快了信息读取的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的图片识别方法的流程图;
图2为本发明一实施例提供的S1033的一种实现方式的流程图;
图3为本发明另一实施例提供的图片识别方法的流程图;
图4为本发明一实施例提供的图片识别的示意图;
图5为本发明另一实施例提供的图片识别装置的结构示意图;
图6为本发明一实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一实施例提供的图片识别方法的流程图,需要说明的是,本发明实施例中的图片例如可以是身份证图片,各种票据等。如图1所示,本实施例的方法可以包括:
S101、扫描待识别图片并根据待识别图片中各像素点的像素值,获取属于目标物的像素点的第一图像区域。
本实施例中,以身份证图片为例对本发明实施例提供的方法进行说明,此时,目标物为身份证。在扫描身份证图片时,采用dhSegment文档布局分析算法对身份证区域框定位裁剪,其算法原理如下:对输入的待识别图片中的每个像素位置进行二分类:属于身份证区域的像素位置标记为1,否则标记为0。利用openCV工具的findContours函数提取标记为1的位置(在身份证区域内)像素点的外轮廓,属于身份证的像素点的第一图像区域。
S102、根据第一图像区域,获取待识别图片中的第二图像区域。
其中,第二图像区域包括第一图像区域。
本实施例中,在获取第一图像区域后,根据第一图像区域,在待识别图片中获取可以将第一图像区域包括在内的第二图像区域,从而根据第二图像区域限制最终获取的目标物的图像区域的范围。其中,例如可以利用openCV工具的minAreaRect函数得到第二图像区域。
S103、根据第一图像区域以及第二图像区域,获得目标物的图像区域。
其中,目标物的图像区域中目标物的轮廓顶点位于第二图像区域的轮廓上。
本实施例中,根据第一图像区域的轮廓以及第二图像区域的轮廓,确定目标物的图像区域,并且使目标物的图像区域中目标物的轮廓顶点位于第二图像区域的轮廓上。
在一些实施例中,S103的一种可能的实现方式为:
S1031、获取第一图像区域中的N个像素点。
S1032、根据N个像素点,获得第三图像区域,N个像素点为第三图像区域的轮廓上的点;
具体的,选取第一图像区域中的N个像素点,根据N个像素点获得一个图像区域,记为第三图像区域,其中,N个像素点为第三图像区域的轮廓上的点,例如,依次连接N个像素点获得第三图像区域。根据N个像素点获得的第三图像区域的轮廓可以是多边形,也可以是不规则图形。
其中,在一些实施例中,目标物可以是为N边形,且N为大于等于3,例如身份证、票据、三角形卡片,等,在选取第一图像区域中的像素点时,像素点的个数与待识别图片中的目标物的边有关,这样可以提高获得的目标物的图像区域与真实的目标物的图像区域的相似性,此时,第二图像区域、第三图像区域均为N边形。根据N个像素点获得第三图像区域的轮廓为N边形,且N个像素点为第三图像区域的轮廓上的顶点。在一些实施例中,选取的N个像素点可以分别为距离第二图像区域的N个顶点最近的N个像素点。使得根据该N个像素点获得的第三图像区域时,可以尽可能多的将目标物在待识别图片上所占的实际区域包含在第三图像区域中,进一步提高获得的目标物的图像区域与真实的目标物的图像区域的相似性。
S1033、根据第一图像区域、第二图像区域与第三图像区域,获得目标物的图像区域。
具体的,在获得第三图像区域后,根据第一图像区域、第二图像区域与第三图像区域,获得目标物的图像区域,例如,将第一图像区域、第二图像区域与第三图像区域的交集作为目标物的图像区域,或者将第一图像区域、第二图像区域与第三图像区域的并集作为目标物的图像区域。
S104、将目标物的图像区域在待识别图片中的位置设置为目标位置。
本实施例中,获取到目标物的图像区域后,将目标物的图像区域在待识别图片中的位置设置为目标位置,例如,识别目标物的相关信息时,移动于用于识别相关信息的扫描框,从而使目标物的图像区域在待识别图片中的位置位于用于识别相关信息的扫描框中,此时,进入扫描框中的位于待识别图片中的位置为目标位置。又例如,采用openCV工具的warpPerspective函数,根据目标物的图像区域、第二图像区域使目标物的图像区域在待识别图片中的位置为目标位置,例如,目标物在待识别图片中的区域相对于扫描框是倾斜的,在获取到目标物的图像区域后,根据warpPerspective函数使目标物的图像区域在待识别图片中的位置进入到扫描框中,相当于在识别时,将目标物的图像区域在待识别图片中的位置进行了移动,而实际上目标物的图像区域在待识别图片中位置并没有发生变化。
S105、根据设置为目标位置之后的目标物的图像区域,识别目标物的相关信息。
本实施例中,目标位例如为身份证时,对身份证上的文本行进行定位检测,获取包含姓名、性别、出生、住址、公民身份号码、签发机关、有效期限等信息的文本行图片,其中,获取到的文本行图片与身份证的正反面有关。然后,采用CRNN等识别算法对裁剪出的文本行图片进行字符识别,获取身份证的信息。
本实施例,通过扫描待识别图片并根据待识别图片中各像素点的像素值,获取属于目标物的像素点的第一图像区域;根据第一图像区域,获取待识别图片中的第二图像区域,其中,第二图像区域包括第一图像区域;根据第一图像区域以及第二图像区域,获得目标物的图像区域;将目标物的图像区域在待识别图片中的位置设置为目标位置;根据设置为目标位置之后的目标物的图像区域,识别目标物的相关信息;其中,目标物的图像区域中目标物的轮廓顶点位于第二图像区域的轮廓上。实现对目标物在待识别图片上的位置的准确定位,从而对目标物图片上的信息所在的位置进行准确定位,提高了对目标物图片上的信息识别的准确性,加快了信息读取的效率。
图2为本发明一实施例提供的S1033的一种实现方式的流程图,如图2所示,在上述各实施例的基础上,本实施例的方法可以包括:
S201、将第三图像区域中相交于第三图像区域的顶点的第一边和第二边延长。
本实施例中,根据N个像素点获得第三图像区域后,对于第三图像区域的轮廓上的每个顶点,将相交于与该顶点的两条边,即第一边和第二边,延长至与第二图像区域的边相交。
S202、获取第一边与第二图像区域的边相交的第一交点,以及第二边与第二图像区域的边相交的第二交点。
本实施例中,延长的第一边与第二图像区域的边相交与一个点,记为第一交点,延长的第二边与第二图像区域的边相交与一个点,记为第二交点,获取第一交点和第二交点。
S203、根据第一交点与第二交点,确定与第三图像区域的顶点对应的目标物的图像区域的顶点。
本实施例中,从第一交点和第二交点中,确定其中一个为所要获得的目标物的图像区域的顶点,其中,目标物的图像区域上的该顶点与第三图像区域的顶点对应。
S204、根据确定出的N个与第三图像区域的顶点对应的目标物的图像区域的顶点,获得目标物的图像区域。
本实施例中,按照S201-S203的步骤,获得与第三图像区域的轮廓上的每个顶点分别对应的N个顶点,其中,该N个顶点也是目标物的图像区域的顶点,从而根据该N个顶点获得目标物的图像区域。
本实施例,在获得目标物的图像区域时,将第三图像区域中相交于第三图像区域的顶点的第一边和第二边延长;获取第一边与第二图像区域的边相交的第一交点,以及第二边与第二图像区域的边相交的第二交点;根据第一交点与第二交点,确定与第三图像区域的顶点对应的目标物的图像区域的顶点;根据确定出的N个与第三图像区域的顶点对应的目标物的图像区域的顶点,获得目标物的图像区域。从而可以对目标物在待识别图片上的位置的准确定位,从而对目标物图片上的信息所在的位置进行准确定位,提高了对目标物图片上的信息识别的准确性。
图3为本发明另一实施例提供的图片识别方法的流程图,如图3所示,在上述各实施例的基础上,本实施例的方法可以包括:
S301、扫描待识别图片并根据待识别图片中各像素点的像素值,获取属于目标物的像素点的第一图像区域。
S302、根据第一图像区域,获取待识别图片中的第二图像区域,其中,第二图像区域包括第一图像区域。
本实施例中,S301和S302的具体实现方式可分别参考S101和S102,此处不再赘述。
S303、获取第一图像区域中的N个像素点。
S304、根据N个像素点,获得第三图像区域,N个像素点为第三图像区域的轮廓上的点。
本实施例中,S303和S304的具体实现方式可分别参考S1031和S1032,此处不再赘述。
S305、将第三图像区域中相交于第三图像区域的顶点的第一边和第二边延长。
S306、获取第一边与第二图像区域的边相交的第一交点,以及第二边与第二图像区域的边相交的第二交点。
本实施例中,S305和S306的具体实现方式可分别参考S201和S202,此处不再赘述。其中,如图4所示,N为4为例,进行说明,对于第三图像区域的轮廓ABCD上的顶点A,延长相交于顶点A的第一边BA和第二边DA,其中,第一边BA与第二图像区域的边相交的第一交点为A1,第二边DA与第二图像区域的边相交的第二交点为A2。
S307、根据第一边和第二交点获得第一三角形图像区域,根据第二边和第一交点获得第二三角形图像区域。
本实施例中,如图4所示,根据第一边BA和第二交点A2,获得一个三角形区域,图4中为三角形图像区域ABA2,记为第一三角形图像区域T1,根据第二边CA和第一交点A1,获得一个三角形区域,图4中为三角形图像区域ADA1,记为第二三角形图像区域T2。
S308、获取目标物的像素点的图像区域与第一三角形图像区域重叠的第一重叠区域,以及目标物的像素点的图像区域与第一三角形图像区域重叠的第二重叠区域。
本实施例中,获取第一三角形图像区域T1与目标物的像素点的图像区域的重第一叠区域,图4中记为S1,获取第二三角形图像区域T2与目标物的像素点的图像区域的重第二叠区域,图4中记为S2。
S309、根据第一重叠区域和第二重叠区域,确定与第三图像区域的顶点对应的目标物的图像区域的顶点为第一交点或第二交点。
S310、根据确定出的N个与第三图像区域的顶点对应的目标物的图像区域的顶点,获得目标物的图像区域。
本实施例中,根据第一叠区域S1以及第二重叠区域S2的面积,或者第一叠区域S1以及第二重叠区域S2的周长,确定与第三图像区域的顶点对应的目标物的图像区域的顶点为第一交点或第二交点。
其中,在一些实施例中,若第一重叠区域的面积大于第二重叠区域的面积,则确定与第三图像区域的顶点对应的目标物的图像区域的顶点为第二交点;若第二重叠区域的面积大于第一重叠区域的面积,则确定与第三图像区域的顶点对应的目标物的图像区域的顶点为第一交点。
具体的,选取第一叠区域S1和第二重叠区域S2中面积较大的重叠区域所对应的组成三角形图像区域的交点为目标物的图像区域的顶点。如图4所示,第一叠区域S1的面积大于第二重叠区域S2的面积,则选取组成第一三角形图像区域T1的第二交点A2为目标物的图像区域的顶点。
按照上述方法,确定出4个与第三图像区域的顶点对应的目标物的图像区域的顶点,依次用直线连接该4个顶点,获取目标物的图像区域。
本实施例,根据目标物的像素点的图像区域与第一三角形图像区域重叠的第一重叠区域,以及目标物的像素点的图像区域与第一三角形图像区域重叠的第二重叠区域,确定与第三图像区域的顶点对应的目标物的图像区域的顶点,可以在提高定位准确定的同时,使根据确定的顶点获得的目标物的图像区域更加接近目标物在待识别图片上实际的区域,提高了目标物图片上的信息识别的准确性,进一步的,采用逼近的思想,取第一叠区域和第二重叠区域中面积较大的重叠区域所对应的组成三角形图像区域的交点为目标物的图像区域的顶点,更加使得根据确定的顶点获得的目标物的图像区域更加接近目标物在待识别图片上实际的区域。
图5为本发明另一实施例提供的图片识别装置的结构示意图,如图5所示,本实施例的装置可以包括:获取模块51、确定模块52和识别模块53。
其中,
获取模块51,用于扫描待识别图片并根据待识别图片中各像素点的像素值,获取属于目标物的像素点的第一图像区域;还用于根据第一图像区域,获取待识别图片中的第二图像区域,其中,第二图像区域包括第一图像区域;还用于根据第一图像区域以及第二图像区域,获得目标物的图像区域;
确定模块52,用于将目标物的图像区域在待识别图片中的位置设置为目标位置;
识别模块53,用于根据设置为目标位置之后的目标物的图像区域,识别目标物的相关信息;
其中,目标物的图像区域中目标物的轮廓顶点位于第二图像区域的轮廓上。
在一些实施例中,获取模块51在根据第一图像区域以及第二图像区域,获得目标物的图像区域时,具体用于:
获取第一图像区域中的N个像素点;
根据N个像素点,获得第三图像区域,N个像素点为第三图像区域的轮廓上的点;
根据第一图像区域、第二图像区域与第三图像区域,获得目标物的图像区域。
在一些实施例中,若目标物为N边形,则第二图像区域、第三图像区域为N边形,N为大于等于3;
N个像素为第三图像区域的轮廓上的顶点。
在一些实施例中,N个像素点分别为距离第二图像区域的N个顶点最近的N个像素点。
在一些实施例中,获取模块51字在根据第一图像区域、第二图像区域与第三图像区域,获得目标物的图像区域时,具体用于:
将第三图像区域中相交于第三图像区域的顶点的第一边和第二边延长;
获取第一边与第二图像区域的边相交的第一交点,以及第二边与第二图像区域的边相交的第二交点;
根据第一交点与第二交点,确定与第三图像区域的顶点对应的目标物的图像区域的顶点;
根据确定出的N个与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点,获得所述目标物的图像区域。
在一些实施例中,获取模块51在根据第一交点与第二交点,确定与第三图像区域的顶点对应的目标物的图像区域的顶点时,具体用于:
根据第一边和第二交点获得第一三角形图像区域,根据第二边和第一交点获得第二三角形图像区域;
获取目标物的像素点的图像区域与第一三角形图像区域重叠的第一重叠区域,以及目标物的像素点的图像区域与第一三角形图像区域重叠的第二重叠区域;
根据第一重叠区域和第二重叠区域,确定与第三图像区域的顶点对应的目标物的图像区域的顶点为第一交点或第二交点。
在一些实施例中,获取模块51在根据第一重叠区域和第二重叠区域,确定与第三图像区域的顶点对应的目标物的图像区域的顶点为第一交点或第二交点时,具体用于:
若第一重叠区域的面积大于第二重叠区域的面积,则确定与第三图像区域的顶点对应的目标物的图像区域的顶点为第二交点;
若第二重叠区域的面积大于第一重叠区域的面积,则确定与第三图像区域的顶点对应的目标物的图像区域的顶点为第一交点。
本实施例以上的图片识别装置,可以用于执行上述各方法实施例中的技术方案,其实现原理和技术效果类似,其中各个模块的功能可以参考方法实施例中相应的描述,此处不再赘述。
图6为本发明一实施例提供的电子设备的结构示意图,如图6所示,本实施例的电子设备可以包括:至少一个处理器61和存储器62。图6示出的是以一个处理器为例的电子设备,其中,
存储器62,用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。存储器62可能包含高速随机存取存储器(random access memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
处理器61,用于执行存储器62存储的计算机执行指令,以实现上述实施例中执行主体为电子设备的图片识别方法。
其中,处理器61可能是一个中央处理器(Central Processing Unit,CPU),或者是特定集成电路(Application Specific Integrated Circuit,ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
可选的,在具体实现上,如果存储器62和处理器61独立实现,则存储器62和处理器61可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(IndustryStandard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器62和处理器61集成在一块芯片上实现,则存储器62和处理器61可以通过内部接口完成相同间的通信。
本实施例以上的电子设备,可以用于执行上述各方法实施例中电子设备的技术方案,其实现原理和技术效果类似,此处不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (5)
1.一种图片识别方法,其特征在于,包括:
扫描待识别图片并根据所述待识别图片中各像素点的像素值,获取属于目标物的像素点的第一图像区域;
根据所述第一图像区域,获取所述待识别图片中的第二图像区域,其中,所述第二图像区域包括所述第一图像区域;
根据所述第一图像区域以及所述第二图像区域,获得所述目标物的图像区域;
将所述目标物的图像区域在所述待识别图片中的位置设置为目标位置;
根据设置为目标位置之后的所述目标物的图像区域,识别所述目标物的相关信息;
其中,所述目标物的图像区域中所述目标物的轮廓顶点位于所述第二图像区域的轮廓上;
所述根据所述第一图像区域以及所述第二图像区域,获得所述目标物的图像区域,包括:
获取所述第一图像区域中的N个像素点;
根据所述N个像素点,获得第三图像区域,所述N个像素点为所述第三图像区域的轮廓上的点;
根据所述第一图像区域、所述第二图像区域与所述第三图像区域,获得所述目标物的图像区域;
若所述目标物为N边形,则所述第二图像区域、所述第三图像区域为N边形,所述N为大于等于3;
所述N个像素为所述第三图像区域的轮廓上的顶点;
所述N个像素点分别为距离所述第二图像区域的N个顶点最近的N个像素点;
所述根据所述第一图像区域、所述第二图像区域与所述第三图像区域,获得所述目标物的图像区域,包括:
将所述第三图像区域中相交于所述第三图像区域的顶点的第一边和第二边延长;
获取第一边与所述第二图像区域的边相交的第一交点,以及第二边与所述第二图像区域的边相交的第二交点;
根据第一边和第二交点获得第一三角形图像区域,根据第二边和第一交点获得第二三角形图像区域;
获取所述目标物的像素点的图像区域与所述第一三角形图像区域重叠的第一重叠区域,以及所述目标物的像素点的图像区域与所述第一三角形图像区域重叠的第二重叠区域;
根据所述第一重叠区域和所述第二重叠区域,确定与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点为第一交点或第二交点;
根据确定出的N个与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点,获得所述目标物的图像区域。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一重叠区域和所述第二重叠区域,确定与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点为第一交点或第二交点,包括:
若所述第一重叠区域的面积大于所述第二重叠区域的面积,则确定与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点为第二交点;
若所述第二重叠区域的面积大于所述第一重叠区域的面积,则确定与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点为第一交点。
3.一种图片识别装置,其特征在于,包括:
获取模块,用于扫描待识别图片并根据所述待识别图片中各像素点的像素值,获取属于目标物的像素点的第一图像区域;还用于根据所述第一图像区域,获取所述待识别图片中的第二图像区域,其中,所述第二图像区域包括所述第一图像区域;还用于根据所述第一图像区域以及所述第二图像区域,获得所述目标物的图像区域;
确定模块,用于将所述目标物的图像区域在所述待识别图片中的位置设置为目标位置;
识别模块,用于根据设置为目标位置之后的所述目标物的图像区域,识别所述目标物的相关信息;
其中,所述目标物的图像区域中所述目标物的轮廓顶点位于所述第二图像区域的轮廓上;
所述获取模块在根据所述第一图像区域以及所述第二图像区域,获得所述目标物的图像区域时,具体用于:
获取所述第一图像区域中的N个像素点;
根据所述N个像素点,获得第三图像区域,所述N个像素点为所述第三图像区域的轮廓上的点;
根据所述第一图像区域、所述第二图像区域与所述第三图像区域,获得所述目标物的图像区域;
若所述目标物为N边形,则所述第二图像区域、所述第三图像区域为N边形,所述N为大于等于3;
所述N个像素为所述第三图像区域的轮廓上的顶点;
所述N个像素点分别为距离所述第二图像区域的N个顶点最近的N个像素点;
所述获取模块在根据所述第一图像区域、所述第二图像区域与所述第三图像区域,获得所述目标物的图像区域时,具体用于:
将所述第三图像区域中相交于所述第三图像区域的顶点的第一边和第二边延长;
获取第一边与所述第二图像区域的边相交的第一交点,以及第二边与所述第二图像区域的边相交的第二交点;
根据第一边和第二交点获得第一三角形图像区域,根据第二边和第一交点获得第二三角形图像区域;
获取所述目标物的像素点的图像区域与所述第一三角形图像区域重叠的第一重叠区域,以及所述目标物的像素点的图像区域与所述第一三角形图像区域重叠的第二重叠区域;
根据所述第一重叠区域和所述第二重叠区域,确定与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点为第一交点或第二交点;
根据确定出的N个与所述第三图像区域的顶点对应的所述目标物的图像区域的顶点,获得所述目标物的图像区域。
4.一种电子设备,其特征在于,包括:存储器和处理器,存储器用于存储程序指令,处理器用于调用存储器中的程序指令执行如权利要求1或2所述的图片识别方法。
5.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序;所述计算机程序被执行时,实现如权利要求1或2所述的图片识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911204139.7A CN110909816B (zh) | 2019-11-29 | 2019-11-29 | 图片识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911204139.7A CN110909816B (zh) | 2019-11-29 | 2019-11-29 | 图片识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110909816A CN110909816A (zh) | 2020-03-24 |
CN110909816B true CN110909816B (zh) | 2022-11-08 |
Family
ID=69821029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911204139.7A Active CN110909816B (zh) | 2019-11-29 | 2019-11-29 | 图片识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110909816B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111951601B (zh) * | 2020-08-05 | 2021-10-26 | 智慧互通科技股份有限公司 | 一种识别配送车辆停放位置的方法及装置 |
CN116630317B (zh) * | 2023-07-24 | 2023-09-26 | 四川新荷花中药饮片股份有限公司 | 一种中药饮片的在线质量监测方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012088902A (ja) * | 2010-10-19 | 2012-05-10 | Fujitsu Advanced Engineering Ltd | 位置関係判定装置、位置関係判定方法、および位置関係判定プログラム |
US8620069B1 (en) * | 2011-02-11 | 2013-12-31 | The United States Of America As Represented By The Secretary Of The Air Force | Automatic triangle orientation detection algrorithm |
CN104036231A (zh) * | 2014-05-13 | 2014-09-10 | 深圳市菲普莱体育发展有限公司 | 人体躯干识别装置及方法、终点影像检测方法、装置 |
CN106951855A (zh) * | 2017-03-16 | 2017-07-14 | 深圳市飘飘宝贝有限公司 | 一种图片中文档定位和拆切方法 |
CN107369150A (zh) * | 2016-05-12 | 2017-11-21 | 株式会社理光 | 一种检测矩形目标的方法及矩形目标检测装置 |
CN107657639A (zh) * | 2017-08-09 | 2018-02-02 | 武汉高德智感科技有限公司 | 一种快速定位目标的方法和装置 |
CN109034153A (zh) * | 2018-07-20 | 2018-12-18 | 泰康保险集团股份有限公司 | 一种应用于图像旋转的图像保真的方法及装置 |
US10262220B1 (en) * | 2018-08-20 | 2019-04-16 | Capital One Services, Llc | Image analysis and processing pipeline with real-time feedback and autocapture capabilities, and visualization and configuration system |
CN110059760A (zh) * | 2019-04-25 | 2019-07-26 | 北京工业大学 | 基于拓扑结构和cnn的几何图形识别方法 |
CN110119741A (zh) * | 2019-04-08 | 2019-08-13 | 浙江大学宁波理工学院 | 一种有背景的卡证图像信息识别方法 |
CN110163076A (zh) * | 2019-03-05 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 一种图像数据处理方法和相关装置 |
CN110414502A (zh) * | 2019-08-02 | 2019-11-05 | 泰康保险集团股份有限公司 | 图像处理方法及装置、电子设备和计算机可读介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7623734B2 (en) * | 2004-09-30 | 2009-11-24 | Microsoft Corporation | Method and system for automatically inscribing noisy objects in scanned image data within a minimum area rectangle |
JP5997808B1 (ja) * | 2015-06-18 | 2016-09-28 | 株式会社Pfu | 画像処理装置、日付識別装置、画像処理方法、および、プログラム |
-
2019
- 2019-11-29 CN CN201911204139.7A patent/CN110909816B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012088902A (ja) * | 2010-10-19 | 2012-05-10 | Fujitsu Advanced Engineering Ltd | 位置関係判定装置、位置関係判定方法、および位置関係判定プログラム |
US8620069B1 (en) * | 2011-02-11 | 2013-12-31 | The United States Of America As Represented By The Secretary Of The Air Force | Automatic triangle orientation detection algrorithm |
CN104036231A (zh) * | 2014-05-13 | 2014-09-10 | 深圳市菲普莱体育发展有限公司 | 人体躯干识别装置及方法、终点影像检测方法、装置 |
CN107369150A (zh) * | 2016-05-12 | 2017-11-21 | 株式会社理光 | 一种检测矩形目标的方法及矩形目标检测装置 |
CN106951855A (zh) * | 2017-03-16 | 2017-07-14 | 深圳市飘飘宝贝有限公司 | 一种图片中文档定位和拆切方法 |
CN107657639A (zh) * | 2017-08-09 | 2018-02-02 | 武汉高德智感科技有限公司 | 一种快速定位目标的方法和装置 |
CN109034153A (zh) * | 2018-07-20 | 2018-12-18 | 泰康保险集团股份有限公司 | 一种应用于图像旋转的图像保真的方法及装置 |
US10262220B1 (en) * | 2018-08-20 | 2019-04-16 | Capital One Services, Llc | Image analysis and processing pipeline with real-time feedback and autocapture capabilities, and visualization and configuration system |
CN110163076A (zh) * | 2019-03-05 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 一种图像数据处理方法和相关装置 |
CN110119741A (zh) * | 2019-04-08 | 2019-08-13 | 浙江大学宁波理工学院 | 一种有背景的卡证图像信息识别方法 |
CN110059760A (zh) * | 2019-04-25 | 2019-07-26 | 北京工业大学 | 基于拓扑结构和cnn的几何图形识别方法 |
CN110414502A (zh) * | 2019-08-02 | 2019-11-05 | 泰康保险集团股份有限公司 | 图像处理方法及装置、电子设备和计算机可读介质 |
Non-Patent Citations (4)
Title |
---|
Automatic Annotation of Object Instances by;Ionut Fıciu et al;《2018 IEEE 14th International Conference on Intelligent Computer Communication and Processing (ICCP)》;20181101;287-290页 * |
Largest inscribed rectangles in convex polygons;Christian Knauer et al;《Journal of Discrete Algorithms》;20130215;第13卷;78-85页 * |
博弈系统中运动信息检测算法研究与应用;邢瑞明;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20160815;第2016年卷(第08期);17-29页 * |
基于最小外接矩形的直角多边形拟合算法;柳娜等;《计算机科学》;20170713;第44卷(第6期);294-297页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110909816A (zh) | 2020-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109740606B (zh) | 一种图像识别方法及装置 | |
CN110866495A (zh) | 票据图像识别方法及装置和设备、训练方法和存储介质 | |
CN111860489A (zh) | 一种证件图像校正方法、装置、设备及存储介质 | |
CN111144400B (zh) | 身份证信息的识别方法、装置、终端设备及存储介质 | |
CN108717744B (zh) | 识别金融单据上的印章序号的方法、装置及终端设备 | |
CN110909816B (zh) | 图片识别方法和装置 | |
CN112528998B (zh) | 证件图像处理方法、装置、电子设备及可读存储介质 | |
CN113420756B (zh) | 证件图像的识别方法和装置、存储介质及电子装置 | |
CN107545223B (zh) | 图像识别方法及电子设备 | |
CN109389110B (zh) | 一种区域确定方法及装置 | |
CN112926421B (zh) | 图像处理方法和装置、电子设备和存储介质 | |
CN112926469A (zh) | 基于深度学习ocr与版面结构的证件识别方法 | |
CN113269752A (zh) | 一种图像检测方法、装置终端设备及存储介质 | |
CN110796130A (zh) | 用于文字识别的方法、装置及计算机存储介质 | |
CN113158895A (zh) | 票据识别方法、装置、电子设备及存储介质 | |
CN111753812A (zh) | 文本识别方法及设备 | |
CN113486715A (zh) | 图像翻拍识别方法、智能终端以及计算机存储介质 | |
CN116597466A (zh) | 一种基于改进YOLOv5s的工程图纸文字检测识别方法及系统 | |
CN115546219B (zh) | 检测板式生成方法、板卡缺陷检测方法、装置及产品 | |
CN108764344B (zh) | 一种基于边缘识别卡片的方法、装置及存储设备 | |
CN113011131B (zh) | 基于图片类电子书的排版方法、电子设备及存储介质 | |
CN112464753B (zh) | 图像中关键点的检测方法、检测装置及终端设备 | |
CN112348112B (zh) | 图像识别模型的训练方法、训练装置及终端设备 | |
CN113962906A (zh) | 一种多任务检测的身份证图像矫正方法及系统 | |
CN115546811A (zh) | 一种识别印章的方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |