CN109559344B - 边框检测方法、装置及存储介质 - Google Patents
边框检测方法、装置及存储介质 Download PDFInfo
- Publication number
- CN109559344B CN109559344B CN201710882948.8A CN201710882948A CN109559344B CN 109559344 B CN109559344 B CN 109559344B CN 201710882948 A CN201710882948 A CN 201710882948A CN 109559344 B CN109559344 B CN 109559344B
- Authority
- CN
- China
- Prior art keywords
- frame
- candidate
- frames
- straight line
- candidate frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 113
- 238000000034 method Methods 0.000 claims abstract description 32
- 238000000605 extraction Methods 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 9
- 238000012706 support-vector machine Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000003709 image segmentation Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
- G06T7/74—Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2178—Validation; Performance evaluation; Active pattern learning techniques based on feedback of a supervisor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/245—Classification techniques relating to the decision surface
- G06F18/2451—Classification techniques relating to the decision surface linear, e.g. hyperplane
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/77—Determining position or orientation of objects or cameras using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/457—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by analysing connectivity, e.g. edge linking, connected component analysis or slices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/48—Extraction of image or video features by mapping characteristic values of the pattern into a parameter space, e.g. Hough transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/32—Indexing scheme for image data processing or generation, in general involving image mosaicing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20048—Transform domain processing
- G06T2207/20061—Hough transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20092—Interactive image processing based on input by user
- G06T2207/20104—Interactive definition of region of interest [ROI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种边框检测方法、装置及存储介质,属于图像处理技术领域。所述方法包括:检测待检测图片中的第一直线段,待检测图片包括目标区域;根据第一直线段,生成目标区域的第一候选边框;从第一候选边框中,获取目标区域的第二候选边框;提取第二候选边框的边框特征;根据第二候选边框的边框特征和预先建立的边框检测模型,从第二候选边框中,获取目标区域的实际边框。本发明通过对待检测图片进行检测,生成第一候选边框,并从第一候选边框中筛选出第二候选边框,进而根据第二候选边框的边框特征和边框检测模型,获取到目标区域的实际边框。该方法并不依赖于选取规则,而是基于边框特征和边框检测模型进行检测,因而检测结果更加准确。
Description
技术领域
本发明涉及图像处理技术领域,特别涉及一种边框检测方法、装置及存储介质。
背景技术
随着图像处理技术的发展,越来越多具有拍照功能的终端逐渐走入用户的生活中。无需借助复印机、传真机等设备,终端通过对各种文档、证件进行拍摄,可获取到文档、证件等对应的图片。终端通过对这些图片进行边框检测,可得到文档、证件等所在的区域,进而从该区域内获取文档、证件等的具体内容。
现有技术在进行边框检测时,可采用如下方法:从待检测图片中检测出第一直线段,该待检测图片包括目标区域;采用霍夫变换将检测出的第一直线段连接成第二直线段,该第二直线段的长度大于第一直线段的长度;从待检测图片中获取位于最左、最右、最上及最下四个位置的第二直线段;将获取到的四条第二直线段连接成目标区域的实际边框。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
终端在对证件、文档等进行拍摄时通常会有一定的背景,背景中深浅不一的线条往往会影响终端对文档或证件所在区域的检测,导致检测结果并不准确。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种边框检测方法、装置及存储介质。所述技术方案如下:
第一方面,提供了一种边框检测方法,所述方法包括:
检测所述待检测图片中的第一直线段,所述待检测图片包括目标区域;
根据所述第一直线段,生成所述目标区域的第一候选边框;
从所述第一候选边框中,获取所述目标区域的第二候选边框;
提取所述第二候选边框的边框特征;
根据所述第二候选边框的边框特征和预先建立的边框检测模型,从所述第二候选边框中,获取所述目标区域的实际边框。
第二方面,提供了一种边框检测装置,所述装置包括:
线段检测模块,用于检测待检测图片中的第一直线段,所述待检测图片包括目标区域;
候选边框生成模块,用于根据所述第一直线段,生成所述目标区域的第一候选边框;
候选边框获取模块,用于从所述第一候选边框中,获取所述目标区域的第二候选边框;
特征提取模块,用于提取所述第二候选边框的边框特征;
实际边框获取模块,用于根据所述第二候选边框的边框特征和预先建立的边框检测模型,从所述第二候选边框中,获取所述目标区域的实际边框。
第三方面,提供了一种服务器,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如第一方面所述的边框检测方法。
第四方面,提供了一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由处理器加载并执行以实现第一方面所述的边框检测方法。
本发明实施例提供的技术方案带来的有益效果是:
通过对待检测图片进行检测,生成第一候选边框,并从第一候选边框中筛选出第二候选边框,进而根据第二候选边框的边框特征和边框检测模型,获取到目标区域的实际边框。该方法并不依赖于选取规则,而是基于边框特征和边框检测模型进行检测,因而检测结果更加准确。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的边框检测方法所涉及的实施环境;
图2是本发明另一个实施例提供的一种边框检测方法的流程图;
图3是本发明另一个实施例提供的一种边框检测中支持向量机分类算法的框架图;
图4是本发明另一个实施例提供的一种边框检测过程的示意图;
图5是本发明另一个实施例提供的一种边框检测装置的结构示意图;
图6是根据一示例性实施例示出的一种用于边框检测的服务器。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
在进行详细说明之前,首先对本发明实施例涉及的概念进行如下解释:
霍夫变换:图像处理中一种特征提取技术,通过在参数空间中计算累计结果的局部最大值,得到符合特定形状的集合作为霍夫变换结果。霍夫变换常用于直线、曲线或圆检测。
SVMs(Support Vector Machines,支持向量机):在机器学习中,SVMs是一种有监督学习方法,可用于统计分类和回归分析。SVMs属于一般化线性分类器,能够在高维或无限维空间中构造超平面或超平面集合,同时最小化经验误差与最大化几何边缘区,因此,SVMs也称为最大边缘区分类器。
LSD(Line Segment Detector,直线线段检测算法):能够在线性时间内得出亚像素级局部直轮廓检测结果。该算法在检测任意图像中的直线时无需参数调节。
特征检测:基于计算机和数学方法分析图像信息,决定图像中的每个点是否属于一个图像特征。特征检测的结果是把图像上的点分为不同的子集,而这些子集往往属于孤立的点、连续的曲线或者连续的区域。特征检测常用于计算机视觉和图像处理等领域。
彩色图像分割(MeanShiftFiltering):Meanshift可用于图像滤波,还可用于视频跟踪,也可用于图像分割。一般而言,一张图片中提取出的特征点至少为5维,即(x,y,r,g,b),其中,x、y为二维平面中的坐标,r、g、b为三个颜色通道。meanshift经常用来寻找模态点,即图片中密度最大的点,因而基于meanshift寻找5维空间的模态点时,由于不同的点最终会收敛到不同的峰值,因此,可将不同点会聚成不同类,从而完成图像分割的目的。
参见图1,其示出了本发明实施例提供的边框检测方法所涉及的实施环境,该实施环境包括:终端101和服务器102。
其中,终端101可以为智能手机、平板电脑、笔记本电脑等设备,本发明实施例不对终端的产品类型作具体的限定。为了满足用户的使用需求,终端101中安装有图片边框检测应用,基于该图片边框检测应用,终端101可存储于本地存储器中的待检测图片发送至服务器102。
服务器102为图片边框检测应用对应的服务器,该服务器102可通过边框检测应用接收终端101发送的待检测图片,并通过对待检测图片进行检测和识别,得到待检测图片中目标区域的实际边框,并将识别结果反馈给终端101。该服务器102包括直线段检测模块、候选边框生成模块、候选边框融合过滤模块和SVM分类模块。该直线段检测模块,用于对待检测图片进行检测,得到直线段;该候选边框生成模块,用于根据检测出的直线段生成候选边框;候选边框融合过滤模块,用于对生成的候选边框进行筛选;SVM分类模块,用于根据边框特征和预先建立的边框检测模型,从筛选后的候选边框中获取待检测图片的目标区域的实际边框。
上述终端101与服务器102之间可通过有线网络或无线网络进行通信。
本发明实施例提供了一种边框检测方法,参见图2,本发明实施例提供的方法流程包括:
201、服务器预先建立边框检测模型。
服务器建立边框检测模型时,可采用如下步骤2011~2016:
2011、服务器检测参考图片中的第一参考直线段。
其中,参考图片包括一个参考区域,该参考区域的实际边框已确定。参考图片的数量可由服务器的处理能力确定,该参考图片的数量可以为1000、2000、3000等,本发明实施例不对参考图片的数量作具体的限定。服务器在获取参考图片时,可采用如下方式:从网络上获取多张实际边框已经确定的图片,并将获取到的多张图片作为参考图片。
需要说明的,在本发明实施例中涉及了两种图片,一种是参考图片,一种是待检测图片,参考图片和待检测图片的功能不同,参考图片中的实际边框已经确定,用于建立边框检测模型;待检测图片的实际边框需要执行本发明实施例提供的方法进行确定。
对于每张参考图片,服务器可采用LSD进行检测,得到第一参考直线段,该第一参考直线段的数量至少为两个。
2012、服务器根据第一参考直线段,生成参考区域的第一参考候选边框。
在本发明实施例中,第一参考直线段的长度较短,需要将第一参考直线段拼接成第二参考直线段,进而基于第二参考直线段构成参考区域的第一参考候选边框。服务器根据第一参考直线段,生成参考区域的第一参考候选边框时,可采用如下步骤20121~20123:
20121、服务器对第一参考直线段进行拼接,得到第二参考直线段。
其中,第一参考直线段的长度小于第二参考直线段的长度。在实际拼接时,服务器可采用霍夫变换将满足拼接条件的第一参考直线段拼接成第二参考直线段。其中,拼接条件包括斜率、距离等。具体地,对于任意两条第一参考直线段,分别计算这两条第一参考直线段的斜率,并计算这两条第一参考直线段之间的距离,如果这两条第一参考直线段之间的距离小于第一阈值,且这两条第一参考直线段的斜率之间的差值小于第二阈值,则将这两条第一参考直线段进行拼接,按照对这两条第一参考直线段的拼接方法,将所有满足拼接条件的第一参考直线段进行拼接,得到一条第二参考直线段。其中,第一阈值和第二阈值可根据霍夫变换的处理精度确定。
20122、服务器根据待生成的第一参考候选边框的属性信息,从第二参考直线段中,获取第三参考直线段。
其中,属性信息包括第一参考候选边框的边框数量和边框相对位置关系等。第三参考直线段有多组,每组第三参考直线段的数量与边框数量相同,且每组第三参考直线段间的相对位置关系与边框相对位置关系相同。
为了便于根据第一参考候选边框中每条边框的边框相对位置关系获取第三参考直线段,服务器还将计算每条第二参考直线段与水平方向的夹角,进而根据每条第二参考直线段与水平方向的夹角,确定每条第二参考直线段的方向。例如,对于任一第二参考直线段,如果该第二参考直线段与水平方向的夹角小于45度,则可确定该条第二参考直线段的方向为水平方向;如果该第二参考直线段与水平方向的夹角大于45度小于90度,则可确定该条第二参考直线段的方向为竖直方向。
服务器在根据待生成的第一参考候选边框的属性信息,从第二参考直线段中,获取第三参考直线段时,可采用如下方法:设定第二参考直线段的条数为n条,其中,m条第二参考直线段的方向为水平方向,n-m条第二参考直线段的方向为竖直方向(m、n为自然数,且n>m),第一参考候选边框的边框数量为k,k条边框的相对位置关系为a条在水平方向上平行,k-a条在竖直方向上平行(k、a为自然数,且n>k>a),则服务器可从m条水平方向的第二参考直线段中随机获取a条,即从n-m条竖直方向的第二参考直线段中随机获取k-a条,即并将获取到a条水平方向和k-a条竖直方向的第二参考直线段,作为一组第三参考直线段。
例如,第一参考候选边框的边框数量为4条,4条边框中有2条在水平方向上平行、2条在竖直方向上平行,第二参考直线段的数量为24条,其中,10条第二参考直线段的方向为水平方向,14条第二参考直线段的方向为竖直方向,服务器可从10条水平方向的第二参考直线段中随机获取2条,从14条竖直方向的第二参考直线段中随机获取两条,并将获取到的2条水平方向和2条竖直方向的第二参考直线段作为一组第三参考直线段。
20123、服务器根据第三参考直线段,生成第一参考候选边框。
基于所获取到的一组第三参考直线段,服务器可生成一个第一参考候选边框。
2013、服务器从第一参考候选边框中,获取参考区域的第二参考候选边框。
其中,第二参考候选边框对应一个标签数值,标签数值用于确定第二候选边框是否为参考区域的实际边框。该标签数值可以为0和1,当标签数值为0,表示该第二参考候选边框为参考区域的实际边框;当标签数值为1,表示该第二参考候选边框不为参考区域的实际边框。
服务器从第一参考候选边框中,获取参考区域的第二参考候选边框时,可采用如下步骤20131~20137:
20131、服务器计算第一参考候选边框的宽高比。
对于由每组第三参考直线段围成的第一参考候选边框,服务器可获取到每个第一参考边框的宽度值和高度值,进而计算每个第一参考候选变宽的宽高比。
20132、服务器根据第一参考候选边框的宽高比,从第一参考候选边框中,获取第三参考候选边框。
对于参考区域内的第二参考候选边框,其宽高比在一定的阈值范围内,基于该阈值范围,服务器可从第一参考候选边框中,选取部分满足该阈值范围的第一参考候选边框,并将该部分满足预设范围的第一参考候选边框作为第三参考候选边框。其中,阈值范围可根据第二候选边框的形状确定。
20133、服务器计算第三参考候选边框的边框面积。
服务器可根据面积公式计算出第三参考候选边框的边框面积。
20134、服务器根据第三候选边框的边框面积,对第三参考候选边框进行排序,得到排序结果。
当计算出每个第三参考候选边框的边框面积之后,服务器可按照由小到大的顺序,对得到的第三参考候选边框进行排序,得到排序结果。
20135、服务器根据排序结果,将第三参考候选边框划分到多个参考候选边框组中。
基于得到的排序结果,为了便于进行分组,服务器可对第三参考候选边框进行编号,进而根据为每个第三参考候选边框所设置的编号,将第三候选参考边框划分到不同的参考候选边框组中。
例如,第三参考候选边框的数量为1000个,编号分别为1~1000,设定每组第三参考候选边框的数量为100个,则服务器可根据排序结果,将编号为1~100的第三参考候选边框划分到一个参考候选边框组中,将编号为101~200的第三参考候选边框划分到一个参考候选边框组中,…,将编号为901~1000的第三参考候选变宽划分到一个参考候选边框组中。
20136、服务器从每个参考候选边框组中获取在组内具有相同排序位置的第三目标参考候选边框。
例如,第三参考候选边框的数量为1000个,编号分别为1~1000,第三参考候选边框组的数量为10个,其中,第1个参考候选边框组内第三参考候选边框的编号分别为1~100,第2个参考候选边框组内第三参考候选边框的编号分别为101~200,…,第10个参考候选边框组内第三参考候选边框的编号分别为901~1000,服务器可从第1个参考候选边框组中获取编号为50的第三候选边框作为第三目标参考候选边框,从第2个参考候选边框组中获取到编码为150的第三候选参考边框作为第三目标参考候选边框,…,从第10个参考候选变宽组中获取到编号为950的第三参考候选边框作为第三目标参考候选边框。
20137、服务器将获取到的所有第三参考目标候选边框作为第二参考候选边框。
服务器将从每个参考候选边框组中获取到的第三参考目标候选边框作为第二参考候选边框。
2014、服务器提取第二参考候选边框的边框特征。
其中,边框特征包括宽高比、边框面积、坐标位置、框内外对比度、平均RGB等等。
2015、服务器根据第二参考候选边框的边框特征和对应的标签数值,确定每维边框特征的边框参数。
基于第二参考候选变宽的边框特征,服务器可将第二参考候选边框的边框特征构成一个特征向量,进而根据该特征向量和对应的标签数值进行训练,得到每维边框特征的边框参数。
需要说明的是,边框特征的维度数可以为一维,也可以为多维,针对一维的情况,边框特征的边框参数为一个;针对多维的情况,边框特征的边框参数为多个。
2016、服务器基于每维边框特征的边框参数,构建边框检测模型。
基于得到的每维边框特征的边框参数,服务器可构建一个检测模型。
对于上述服务器构建边框检测模型过程,为了便于理解,下面将以图3为例进行说明。
参见图3,当获取到第一参考候选边框后,服务器从第一参考候选边框中,获取第二参考候选边框,对提取每个第二参考候选边框的边框特征,例如,宽高比、边框面积、坐标位置、框内外对比度、平均RGB等,进而根据提取的边框特征,构建边框检测模型。
202、服务器获取待检测图片。
其中,待检测图片包括目标区域。服务器获取待检测图片的方式,包括但不限于:终端通过摄像头拍摄对文档、证件等进行拍摄,得到文档、证件等对应的图片,进而通过图片边框检测应用将拍摄的图片发送至服务器,当接收到终端发送的图片后,服务器将该图片作为待检测图片。
203、服务器检测待检测图片中的第一直线段。
服务器可可采用LSD对待检测图片进行检测,得到第一直线段,该第一直线段的数量至少为两个。
204、服务器根据第一直线段,生成目标区域的第一候选边框。
服务器根据第一直线段,生成目标区域的第一候选边框时,可采用如下步骤2041~2043:
2041、服务器对第一直线段进行拼接,得到第二直线段。
其中,第一直线段的长度小于第二直线段的长度。在实际拼接时,服务器可采用霍夫变换将满足拼接条件的第一直线段拼接成第二直线段。
2042、服务器根据待生成的第一候选边框的属性信息,从第二直线段中,获取第三直线段。
其中,属性信息包括第一候选边框的边框数量和边框相对位置关系。第三直线段有多组,每组第三直线段的数量与边框数量相同,且第三直线段间的相对位置关系与边框相对位置关系相同。
2043、服务器根据第三直线段,生成第一候选边框。
205、服务器从第一候选边框中,获取目标区域的第二候选边框。
服务器从第一候选边框中,获取目标区域的第二候选边框时,可采用如下步骤2051~2057:
2051、服务器计算第一候选边框的宽高比。
对于由每组第三直线段围成的第一参考候选边框,服务器可获取到每个第一边框的宽度值和高度值,进而计算每个第一候选变宽的宽高比。
2052、服务器根据第一候选边框的宽高比,从第一候选边框中,获取第三候选边框。
对于目标区域内的第二候选边框,其宽高比在一定的阈值范围内,基于该阈值范围,服务器可从第一候选边框中,选取部分满足该阈值范围的第一候选边框,并将该部分满足预设范围的第一候选边框作为第三候选边框。
2053、服务器计算第三候选边框的边框面积。
服务器可根据面积公式计算出第三参考候选边框的边框面积。
2054、服务器根据第三候选边框的边框面积,对第三候选边框进行排序,得到排序结果。
当计算出每个第三候选边框的边框面积之后,服务器可按照由小到大的顺序,对得到的第三候选边框进行排序,得到排序结果。
2055、服务器根据排序结果,将第三候选边框划分到多个候选边框组中。
基于得到的排序结果,为了便于进行分组,服务器可对第三候选边框进行编号,进而根据为每个第三候选边框所设置的编号,将第三参考边框划分到不同的候选边框组中。
2056、服务器从每个候选边框组中获取在组内具有相同排序位置的第三目标候选边框。
2057、服务器将获取到的所有第三目标候选边框作为第二候选边框。
206、服务器提取第二候选边框的边框特征。
207、服务器根据第二候选边框的边框特征和预先建立的边框检测模型,从第二候选边框中,获取目标区域的实际边框。
服务器根据第二候选边框的边框特征和预先建立的边框检测模型,从第二候选边框中,获取目标区域的实际边框时,服务器将第二候选边框的边框特征输入到边框检测模型中,得到检测数值,如果检测数值大于预设数值,则将第二候选边框作为实际边框。其中,预设数值可由边框检测模型的识别精度确定,该预设数值可以为0.5、0.6等等。
对待检测图片的检测过程,下面将以图4为例进行说明。
参见图4,对于终端输入的任一张待检测图片,服务器采用LSD算法检测该待检测图片的第一直线段,并采用霍夫变换将第一直线段连接成候选边框,进而对该候选边框进行过滤,并提取过滤后的候选边框的边框特征,进而根据边框特征和预先建立的边框检测模型,获取该待检测图片的目标区域的实际边框。
需要说明的两点,第一点,上述以构建边框检测模型,并基于边框检测模型对待检测图片进行检测为例,实际上,还可以使用深度学习中的卷积神经网络对目标区域的边框角点进行回归,从而实现边框检测。在训练数据完全覆盖目标区域所处的场景且模型设计合理的情况下,基于卷积神经网络的方案可替换基于直线段提取-候选边框生成-SVMs分类的流程,从而实现端到端的边框检测。
第二点,在得到多个第一候选边框后,本发明实施例提供的方法可以设计出多个识别模块以应对各种场景,例如,面向个人名片、文档、证件的边框检测场景,面向企业、产品的名片识别辅助办公场景等。同时根据不同业务场景,对边框检测准确性的不同要求,可以选择不同的策略,例如,当对应用场景里面边框识别准确率要求较低时,可以减少候选边框,以提升系统性能。另外,本发明实施例提供的方法还可以用于检测手机、书本等所有带有边框的物体。
本发明实施例提供的方法,通过对待检测图片进行检测,生成第一候选边框,并从第一候选边框中筛选出第二候选边框,进而根据第二候选边框的边框特征和边框检测模型,获取到目标区域的实际边框。该方法并不依赖于选取规则,而是基于边框特征和边框检测模型进行检测,因而检测结果更加准确。
除了上述有益效果外,采用发明实施例提供的方法,还存在以下有益效果:
第一,可以准确裁剪出不同场景图片中的目标区域,并对目标检测区域进行旋转矫正,以方便后续显示或OCR(Optical Character Recognition,光学字符识别)的识别任务。
第二,通过引入特征提取和SVM分类器解决了现有的边框检测算法容易受周围物体干扰边的问题,使算法对不同复杂拍摄场景具有更强的鲁棒性。
第三,避免了主观设置检测规则,通过固定的特征提取方式可以覆盖更边框检测场景,使得算法应用场景更加灵活。
参见图5,本发明实施例提供了一种边框检测装置,该装置包括:
线段检测模块501,用于检测待检测图片中的第一直线段,该待检测图片包括目标区域;
候选边框生成模块502,用于根据第一直线段,生成目标区域的第一候选边框;
候选边框获取模块503,用于从第一候选边框中,获取目标区域的第二候选边框;
特征提取模块504,用于提取第二候选边框的边框特征;
实际边框获取模块505,用于根据第二候选边框的边框特征和预先建立的边框检测模型,从第二候选边框中,获取目标区域的实际边框。
在本发明的另一个实施例中,候选边框生成模块502,用于对第一直线段进行拼接,得到第二直线段,第一直线段的长度小于第二直线段的长度;根据待生成的第一候选边框的属性信息,从第二直线段中,获取第三直线段,该属性信息包括第一候选边框的边框数量和边框相对位置关系,该第三直线段的数量与边框数量相同,且第三直线段间的相对位置关系与边框相对位置关系相同;根据第三直线段,生成第一候选边框。
在本发明的另一个实施例中,候选边框获取模块503,用于计算第一候选边框的宽高比;根据第一候选边框的宽高比,从第一候选边框中,获取第三候选边框;计算第三候选边框的边框面积;根据第三候选边框的边框面积,对第三候选边框进行排序,得到排序结果;根据排序结果,将第三候选边框划分到多个候选边框组中;从每个候选边框组中获取在组内具有相同排序位置的第三目标候选边框;将获取到的所有第三目标候选边框作为第二候选边框。
在本发明的另一个实施例中,该装置还包括:
线段检测模块501,用于检测参考图片中的第一参考直线段,参考图片包括参考区域;
候选边框生成模块502,用于根据第一参考直线段,生成参考区域的第一参考候选边框;
候选边框获取模块503,用于从第一参考候选边框中,获取参考区域的第二参考候选边框,第二参考候选边框对应一个标签数值,标签数值用于确定第二候选边框是否为参考区域的实际边框;
特征提取模块504,提取第二参考候选边框的边框特征;
边框参数确定模块,用于根据第二参考候选边框的边框特征和对应的标签数值,确定每维边框特征的边框参数;
模型构建模块,用于基于每维边框特征的边框参数,构建边框检测模型。
在本发明的另一个实施例中,实际边框获取模块505,用于将第二候选边框的边框特征输入到边框检测模型中,得到检测数值;当检测数值大于预设数值时,将第二候选边框作为实际边框。
综上所述,本发明实施例提供的装置,通过对待检测图片进行检测,生成第一候选边框,并从第一候选边框中筛选出第二候选边框,进而根据第二候选边框的边框特征和边框检测模型,获取到目标区域的实际边框。该方法并不依赖于选取规则,而是基于边框特征和边框检测模型进行检测,因而检测结果更加准确。
图6是根据一示例性实施例示出的一种用于边框检测的服务器。参照图6,服务器600包括处理组件622,其进一步包括一个或多个处理器,以及由存储器632所代表的存储器资源,用于存储可由处理组件622的执行的至少一条指令、至少一段程序、代码集或指令集。所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行图2所示的边框检测方法。
服务器600还可以包括一个电源组件626被配置为执行服务器600的电源管理,一个有线或无线网络接口650被配置为将服务器600连接到网络,和一个输入输出(I/O)接口658。服务器600可以操作基于存储在存储器632的操作系统,例如Windows ServerTM,Mac OSXTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本发明实施例提供的服务器,通过对待检测图片进行检测,生成第一候选边框,并从第一候选边框中筛选出第二候选边框,进而根据第二候选边框的边框特征和边框检测模型,获取到目标区域的实际边框。该方法并不依赖于选取规则,而是基于边框特征和边框检测模型进行检测,因而检测结果更加准确。
本发明实施例提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由处理器加载并执行以实现图2所示的边框检测方法。
本发明实施例提供的计算机可读存储介质,通过对待检测图片进行检测,生成第一候选边框,并从第一候选边框中筛选出第二候选边框,进而根据第二候选边框的边框特征和边框检测模型,获取到目标区域的实际边框。该方法并不依赖于选取规则,而是基于边框特征和边框检测模型进行检测,因而检测结果更加准确。
需要说明的是:上述实施例提供的边框检测装置在检测边框时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将边框检测装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的边框检测装置与边框检测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种边框检测方法,其特征在于,所述方法包括:
检测待检测图片中的第一直线段,所述待检测图片包括目标区域;
对所述第一直线段进行拼接,得到第二直线段,所述第一直线段的长度小于所述第二直线段的长度;
根据待生成的第一候选边框的属性信息,从所述第二直线段中,获取第三直线段,所述属性信息包括所述第一候选边框的边框数量和边框相对位置关系,所述第三直线段的数量与所述边框数量相同,且所述第三直线段间的相对位置关系与所述边框相对位置关系相同;
根据所述第三直线段,生成所述目标区域的第一候选边框;
从所述第一候选边框中,获取所述目标区域的第二候选边框;
提取所述第二候选边框的边框特征;
根据所述第二候选边框的边框特征和预先建立的边框检测模型,从所述第二候选边框中,获取所述目标区域的实际边框。
2.根据权利要求1所述的方法,其特征在于,所述从所述第一候选边框中,获取所述目标区域的第二候选边框,包括:
计算所述第一候选边框的宽高比;
根据所述第一候选边框的宽高比,从所述第一候选边框中,获取第三候选边框;
计算所述第三候选边框的边框面积;
根据所述第三候选边框的边框面积,对所述第三候选边框进行排序,得到排序结果;
根据排序结果,将所述第三候选边框划分到多个候选边框组中;
从每个候选边框组中获取在组内具有相同排序位置的第三目标候选边框;
将获取到的所有第三目标候选边框作为所述第二候选边框。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第二候选边框的边框特征和预先建立的边框检测模型,从所述第二候选边框中,获取所述目标区域的实际边框之前,还包括:
检测参考图片中的第一参考直线段,所述参考图片包括参考区域;
根据所述第一参考直线段,生成所述参考区域的第一参考候选边框;
从所述第一参考候选边框中,获取所述参考区域的第二参考候选边框,所述第二参考候选边框对应一个标签数值,所述标签数值用于确定所述第二候选边框是否为所述参考区域的实际边框;
提取所述第二参考候选边框的边框特征;
根据所述第二参考候选边框的边框特征和对应的标签数值,确定每维边框特征的边框参数;
基于每维边框特征的边框参数,构建所述边框检测模型。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第二候选边框的边框特征和预先建立的边框检测模型,从所述第二候选边框中,获取所述目标区域的实际边框,包括:
将所述第二候选边框的边框特征输入到所述边框检测模型中,得到检测数值;
如果所述检测数值大于预设数值,则将所述第二候选边框作为实际边框。
5.一种边框检测装置,其特征在于,所述装置包括:
线段检测模块,用于检测待检测图片中的第一直线段,所述待检测图片包括目标区域;
候选边框生成模块,用于对所述第一直线段进行拼接,得到第二直线段,所述第一直线段的长度小于所述第二直线段的长度;根据待生成的第一候选边框的属性信息,从所述第二直线段中,获取第三直线段,所述属性信息包括所述第一候选边框的边框数量和边框相对位置关系,所述第三直线段的数量与所述边框数量相同,且所述第三直线段间的相对位置关系与所述边框相对位置关系相同;根据所述第三直线段,生成所述目标区域的第一候选边框;
候选边框获取模块,用于从所述第一候选边框中,获取所述目标区域的第二候选边框;
特征提取模块,用于提取所述第二候选边框的边框特征;
实际边框获取模块,用于根据所述第二候选边框的边框特征和预先建立的边框检测模型,从所述第二候选边框中,获取所述目标区域的实际边框。
6.根据权利要求5所述的装置,其特征在于,所述候选边框获取模块,用于计算所述第一候选边框的宽高比;根据所述第一候选边框的宽高比,从所述第一候选边框中,获取第三候选边框;计算所述第三候选边框的边框面积;根据所述第三候选边框的边框面积,对所述第三候选边框进行排序,得到排序结果;根据排序结果,将所述第三候选边框划分到多个候选边框组中;从每个候选边框组中获取在组内具有相同排序位置的第三目标候选边框;将获取到的所有第三目标候选边框作为所述第二候选边框。
7.根据权利要求5所述的装置,其特征在于,所述装置还包括:
所述线段检测模块,用于检测参考图片中的第一参考直线段,所述参考图片包括参考区域;
所述候选边框生成模块,用于根据所述第一参考直线段,生成所述参考区域的第一参考候选边框;
所述候选边框获取模块,用于从所述第一参考候选边框中,获取所述参考区域的第二参考候选边框,所述第二参考候选边框对应一个标签数值,所述标签数值用于确定所述第二候选边框是否为所述参考区域的实际边框;
所述特征提取模块,用于提取所述第二参考候选边框的边框特征;
边框参数确定模块,用于根据所述第二参考候选边框的边框特征和对应的标签数值,确定每维边框特征的边框参数;
模型构建模块,用于基于每维边框特征的边框参数,构建所述边框检测模型。
8.根据权利要求5所述的装置,其特征在于,所述实际边框获取模块,用于将所述第二候选边框的边框特征输入到所述边框检测模型中,得到检测数值;当所述检测数值大于预设数值时,将所述第二候选边框作为实际边框。
9.一种服务器,其特征在于,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如权利要求1至4中任一项所述的边框检测方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由处理器加载并执行以实现如权利要求1至4中任一项所述的边框检测方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710882948.8A CN109559344B (zh) | 2017-09-26 | 2017-09-26 | 边框检测方法、装置及存储介质 |
EP18860902.8A EP3611702A4 (en) | 2017-09-26 | 2018-08-27 | BORDER DETECTION METHOD, SERVER AND STORAGE MEDIUM |
PCT/CN2018/102581 WO2019062426A1 (zh) | 2017-09-26 | 2018-08-27 | 边框检测方法、服务器及存储介质 |
US16/578,672 US11328427B2 (en) | 2017-09-26 | 2019-09-23 | Border detection method, server and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710882948.8A CN109559344B (zh) | 2017-09-26 | 2017-09-26 | 边框检测方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109559344A CN109559344A (zh) | 2019-04-02 |
CN109559344B true CN109559344B (zh) | 2023-10-13 |
Family
ID=65862702
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710882948.8A Active CN109559344B (zh) | 2017-09-26 | 2017-09-26 | 边框检测方法、装置及存储介质 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11328427B2 (zh) |
EP (1) | EP3611702A4 (zh) |
CN (1) | CN109559344B (zh) |
WO (1) | WO2019062426A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113221929A (zh) * | 2020-02-05 | 2021-08-06 | 华为技术有限公司 | 一种图像处理方法以及相关设备 |
CN111860123B (zh) * | 2020-06-04 | 2023-08-08 | 华南师范大学 | 一种识别工作区域边界的方法 |
CN111899270B (zh) * | 2020-07-30 | 2023-09-05 | 平安科技(深圳)有限公司 | 卡片边框检测方法、装置、设备及可读存储介质 |
CN112215123B (zh) * | 2020-10-09 | 2022-10-25 | 腾讯科技(深圳)有限公司 | 一种目标检测方法、装置及存储介质 |
CN113573137B (zh) * | 2021-07-01 | 2023-08-08 | 厦门美图之家科技有限公司 | 视频画布边界检测方法、系统、终端设备及存储介质 |
CN113936042B (zh) * | 2021-12-16 | 2022-04-05 | 深圳佑驾创新科技有限公司 | 一种目标跟踪方法、装置和计算机可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105096299A (zh) * | 2014-05-08 | 2015-11-25 | 北京大学 | 多边形检测方法和多边形检测装置 |
CN106156777A (zh) * | 2015-04-23 | 2016-11-23 | 华中科技大学 | 文本图片检测方法及装置 |
EP3163503A1 (en) * | 2015-10-30 | 2017-05-03 | Xiaomi Inc. | Method and apparatus for area indentification |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7344082B2 (en) * | 2002-01-02 | 2008-03-18 | Metrologic Instruments, Inc. | Automated method of and system for dimensioning objects over a conveyor belt structure by applying contouring tracing, vertice detection, corner point detection, and corner point reduction methods to two-dimensional range data maps of the space above the conveyor belt captured by an amplitude modulated laser scanning beam |
US7171047B2 (en) * | 2002-12-20 | 2007-01-30 | Lsi Logic Corporation | Adaptive Sem edge recognition algorithm |
US7236266B2 (en) * | 2003-01-23 | 2007-06-26 | Kabushiki Kaisha Toshiba | Image processing apparatus and image processing method |
JP4363151B2 (ja) | 2003-10-14 | 2009-11-11 | カシオ計算機株式会社 | 撮影装置、その画像処理方法及びプログラム |
JP4835459B2 (ja) * | 2007-02-16 | 2011-12-14 | 富士通株式会社 | 表認識プログラム、表認識方法および表認識装置 |
US9879976B2 (en) * | 2010-01-20 | 2018-01-30 | Faro Technologies, Inc. | Articulated arm coordinate measurement machine that uses a 2D camera to determine 3D coordinates of smoothly continuous edge features |
US9165187B2 (en) * | 2012-01-12 | 2015-10-20 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
CN103455995B (zh) * | 2012-05-31 | 2016-08-03 | 富士通株式会社 | 图像处理装置、图像处理方法和扫描仪 |
JP2014092899A (ja) | 2012-11-02 | 2014-05-19 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
US10783615B2 (en) * | 2013-03-13 | 2020-09-22 | Kofax, Inc. | Content-based object detection, 3D reconstruction, and data extraction from digital images |
US11620733B2 (en) * | 2013-03-13 | 2023-04-04 | Kofax, Inc. | Content-based object detection, 3D reconstruction, and data extraction from digital images |
CN103399695B (zh) * | 2013-08-01 | 2016-08-24 | 上海合合信息科技发展有限公司 | 用于智能无线通信终端的四边形边框识别方法及装置 |
CN103500337B (zh) * | 2013-09-30 | 2018-10-09 | 上海合合信息科技发展有限公司 | 用于智能无线通信终端的识别四边形边框的方法及装置 |
EP3146729A4 (en) * | 2014-05-21 | 2018-04-11 | Millennium Three Technologies Inc. | Fiducial marker patterns, their automatic detection in images, and applications thereof |
CN104504684B (zh) * | 2014-12-03 | 2017-05-24 | 小米科技有限责任公司 | 边缘提取方法和装置 |
US9710715B2 (en) * | 2014-12-26 | 2017-07-18 | Ricoh Company, Ltd. | Image processing system, image processing device, and image processing method |
US9483834B1 (en) * | 2015-05-20 | 2016-11-01 | Adobe Systems Incorporated | Object boundary detection in an image |
US9965678B2 (en) * | 2016-06-29 | 2018-05-08 | Konica Minolta Laboratory U.S.A., Inc. | Method for recognizing table and flowchart in document images |
US10902277B2 (en) * | 2018-09-10 | 2021-01-26 | Microsoft Technology Licensing, Llc | Multi-region detection for images |
-
2017
- 2017-09-26 CN CN201710882948.8A patent/CN109559344B/zh active Active
-
2018
- 2018-08-27 EP EP18860902.8A patent/EP3611702A4/en active Pending
- 2018-08-27 WO PCT/CN2018/102581 patent/WO2019062426A1/zh unknown
-
2019
- 2019-09-23 US US16/578,672 patent/US11328427B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105096299A (zh) * | 2014-05-08 | 2015-11-25 | 北京大学 | 多边形检测方法和多边形检测装置 |
CN106156777A (zh) * | 2015-04-23 | 2016-11-23 | 华中科技大学 | 文本图片检测方法及装置 |
EP3163503A1 (en) * | 2015-10-30 | 2017-05-03 | Xiaomi Inc. | Method and apparatus for area indentification |
Non-Patent Citations (2)
Title |
---|
房婧 ; 高良才 ; 仇睿恒 ; 汤帜 ; .版式电子文档表格自动检测与性能评估.北京大学学报(自然科学版).2012,(01),全文. * |
马敬奇 ; 卢亚 ; 李柳琼 ; 卢杏坚 ; 何峰 ; 钟震宇 ; .基于Canny算子和改进型Hough变换的边缘定位方法.自动化与信息工程.2017,(03),全文. * |
Also Published As
Publication number | Publication date |
---|---|
EP3611702A4 (en) | 2021-01-06 |
CN109559344A (zh) | 2019-04-02 |
WO2019062426A1 (zh) | 2019-04-04 |
US20200020105A1 (en) | 2020-01-16 |
EP3611702A1 (en) | 2020-02-19 |
US11328427B2 (en) | 2022-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109559344B (zh) | 边框检测方法、装置及存储介质 | |
US9858472B2 (en) | Three-dimensional facial recognition method and system | |
US9064316B2 (en) | Methods of content-based image identification | |
US8811751B1 (en) | Method and system for correcting projective distortions with elimination steps on multiple levels | |
US8897600B1 (en) | Method and system for determining vanishing point candidates for projective correction | |
US20190164010A1 (en) | Object detection and image cropping using a multi-detector approach | |
US9530045B2 (en) | Method, system and non-transitory computer storage medium for face detection | |
US9646202B2 (en) | Image processing system for cluttered scenes and method of operation thereof | |
US9576210B1 (en) | Sharpness-based frame selection for OCR | |
US8879796B2 (en) | Region refocusing for data-driven object localization | |
CN110008944A (zh) | 基于模板匹配的ocr识别方法及装置、存储介质 | |
WO2014160433A2 (en) | Systems and methods for classifying objects in digital images captured using mobile devices | |
WO2014160426A1 (en) | Classifying objects in digital images captured using mobile devices | |
CN110717366A (zh) | 文本信息的识别方法、装置、设备及存储介质 | |
US8913836B1 (en) | Method and system for correcting projective distortions using eigenpoints | |
CN103353881B (zh) | 一种应用程序搜索方法及装置 | |
EP3093822B1 (en) | Displaying a target object imaged in a moving picture | |
US20210271857A1 (en) | Method and apparatus for identity verification, electronic device, computer program, and storage medium | |
JP2014041477A (ja) | 画像認識装置及び画像認識方法 | |
CN108960221B (zh) | 基于图像的银行卡识别方法及装置 | |
US20180184012A1 (en) | Image processing apparatus, control method, and storage medium | |
CN109815823B (zh) | 数据处理方法及相关产品 | |
US20150003681A1 (en) | Image processing apparatus and image processing method | |
JP6542230B2 (ja) | 投影ひずみを補正するための方法及びシステム | |
CN106056575B (zh) | 一种基于似物性推荐算法的图像匹配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |