CN106960184B - 一种书本边框的图像定位方法 - Google Patents

一种书本边框的图像定位方法 Download PDF

Info

Publication number
CN106960184B
CN106960184B CN201710135203.5A CN201710135203A CN106960184B CN 106960184 B CN106960184 B CN 106960184B CN 201710135203 A CN201710135203 A CN 201710135203A CN 106960184 B CN106960184 B CN 106960184B
Authority
CN
China
Prior art keywords
edge
book
scanning
image
straight line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710135203.5A
Other languages
English (en)
Other versions
CN106960184A (zh
Inventor
熊邦书
熊磊
刘炳集
余淑真
邓辉斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang Hangkong University
Original Assignee
Nanchang Hangkong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang Hangkong University filed Critical Nanchang Hangkong University
Priority to CN201710135203.5A priority Critical patent/CN106960184B/zh
Publication of CN106960184A publication Critical patent/CN106960184A/zh
Application granted granted Critical
Publication of CN106960184B publication Critical patent/CN106960184B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种书本边框的图像定位方法,包括步骤:1)书本图像预处理;2)书本边框上边缘寻找;3)书本边框上边缘左右端点粗定位;4)书本边框上边缘左右端点精定位;5)书本边框下边缘寻找。本发明的优点是,充分利用彩色图像的色彩信息,对低强度的边缘也有较好的检测效果;采用直线扫描法完成书本边缘的快速定位以及书本边缘端点的粗定位;采用直线拟合法完成书本边缘端点的精定位,书本边缘轮廓提取不全时也能完成书本边框的精确定位;具有速度快、精度高、鲁棒性好和环境适应能力强的优点,适合用于各种色彩、桌面背景和光照环境下书本边框的精确定位。

Description

一种书本边框的图像定位方法
技术领域
本发明涉及一种书本边框定位方法,尤其涉及一种书本边框的图像定位方法。
背景技术
随着计算机技术的发展与普及,图像处理技术广泛应用于人类生产和生活中的各个领域。书本识别是图像处理技术应用之一,近年来被广泛应用于儿童早教领域。书本边框定位技术是书本识别技术中最为基础的核心技术,其定位精度影响书本识别精度,对基于书本识别技术的儿童益智产品性能的提升具有重要的意义。
现有的书本边框定位方法主要有三类:(1)基于Hough变换的边框定位方法,根据书本的先验知识,利用Hough变换检测直线的原理找出特定方向的直线,完成书本边框定位,此类方法计算时占用内存多,且易受书本内容和背景的干扰,书本边框定位精度低。(2)基于最大连通域的边框定位方法,通过对图像进行最大连通域检测,获取书本区域,再采用直线拟合方法结合书本的先验知识筛选得到边缘直线,实现书本边框的定位,此类方法的实时性不好,且易受干扰连通域的影响,书本边框定位精度易受背景影响。(3)基于边缘的边框定位方法,采用边缘提取算法提取书本的边缘轮廓,再采用直线拟合方法结合书本的先验知识筛选得到边缘直线,实现书本边框的定位,此类方法的实时性较好,但是对于光照强度低或者不均书本,边框定位效果差,且易受到背景的干扰。
发明内容
本发明的目的在于提供一种书本边框的图像定位方法,采用边缘提取算法分别对R、G和B三通道图像进行边缘提取,并依次进行或运算得到边缘图像,防止低光照强度下书本边缘的丢失;采用直线扫描法寻找出边框的上边缘;根据先验条件进行上边缘左右端点粗定位;采用直线拟合方法对上边缘左右端点进行精定位,提高了书本边框上边缘的定位精度和抗干扰能力。本发明的优点是,充分利用彩色图像的色彩信息,对低强度的边缘也有较好的检测效果;采用直线扫描法完成书本边缘的快速定位以及书本边缘端点的粗定位;采用直线拟合法完成书本边缘端点的精定位,书本边缘轮廓提取不全时也能完成书本边框的精确定位。本发明提供的一种书本边框的图像定位方法解决了现有技术存在的问题,具有速度快、精度高、鲁棒性好和环境适应能力强的优点,适合用于各种色彩、桌面背景和光照环境下书本边框的精确定位。
本发明提供了一种书本边框的图像定位方法,包括以下步骤:
1)书本图像预处理,具体包括以下步骤:
(a)首先将书本彩色图像按R、G和B三色分成三张单通道图像,然后利用Canny算子分别对三张单通道图像进行边缘提取,得到二值化图像;
(b)对步骤(a)得到的三张二值化图像依次进行或运算,得到边缘轮廓图像;
2)书本边框上边缘寻找,具体包括下述步骤:
(a)构建初始扇形区域,以图像左上角为顶点,以书本图像的x轴为角平分线,构建圆心角为2θ的扇形区域;
(b)构建扇形区域内的扫描直线,以扇形的顶点为起点,以与图像x轴的夹角α为直线倾角,构建一条扫描直线,夹角α以沿图像x轴逆时针旋转方向为正,顺时针为负,夹角范围为α∈[-θ,θ];
(c)在扇形区域内通过直线扫描获得具有最长连通线段的扫描直线,首先,以与x轴夹角α=-θ的直线为初始扫描直线,从左至右进行扫描,获得该扫描直线上的最长连通线段;其次,在扇形区域内以Δθ为步长沿逆时针方向构建一条新的扫描直线,直至α=θ为止,对于每一条扫描直线,重复上述扫描过程,获得每一条扫描直线内的最长连通线段;最后,通过比较得到此扇形区域内具有最长连通线段的扫描直线;
(d)通过平移扇形区域获得书本边框上边缘所在的扫描直线,先将初始扇形区域以Δh为步长沿着图像y轴方向平行下移,直至下移至图像高度的γ倍,其中γ∈(0,1),当扇形区域每下移一个位置时,重复步骤(c);再通过比较得到上述所有扇形区域中具有最长连通线段的扫描直线,即书本上边缘包含在该扫描直线中;
(e)旋转原图像并计算图像旋转后的书本边框上边缘,首先,利用步骤(d)得到书本边框上边缘所在的扫描直线,根据该直线与图像x轴夹角α,利用仿射变换原理将图像反向旋转α,使书本边框上边缘与图像坐标的x轴平行;然后,根据旋转图像间y坐标的映射关系计算出旋转后图像上边缘的y轴坐标值yu,即为图像旋转后书本边框上边缘;
3)书本边框上边缘左右端点粗定位,具体包括下述步骤:
(a)创建矩形扫描区域,以步骤2)得到的书本边框上边缘为矩形水平中位线,以2Δh′为矩形的高,以旋转后图像的宽为矩形的宽,创建矩形扫描区域;
(b)在矩形扫描区域内,利用扫描法得到以矩形区域水平中位线为基准线的有向距离集合,首先,沿矩形区域的水平方向从左至右进行扫描;其次,在每一个水平位置,沿垂直方向从上至下进行扫描,记录边缘点到水平中位线的最近距离,若边缘点在水平中位线上方,则距离为正,若在下方,则距离为负,正好在中位线上则距离为0,如果没有扫描到边缘点,则距离定义为2Δh′;最后,完成整个矩形区域扫描后,得到矩形区域水平中位线的有向距离集合;
(c)提取有向距离集合中的有效线段区域,首先,根据步骤(b)得到的有向距离集合,去除离水平中位线较远的边缘点集;其次,去除较短且连续的边缘点集合;再次,根据方差去除连续且波动较大的点集;最后,得到有向距离集合中的有效线段区域;
(d)上边缘左右端点粗定位,根据步骤(c)保留的有效线段区域,首先,将有效线段区域中具有x坐标最小值的边缘点设为书本边框上边缘的左端点,其次,将有效线段区域中具有x轴坐标最大值的边缘点设为书本边框上边缘的右端点,从而实现了上边缘左右端点粗定位;
4)书本边框上边缘左右端点精定位,具体包括下述步骤:
(a)创建矩形区域,以书本上边缘yu为矩形的上边,以y=yu+Δh″的直线为矩形的下边,以图像宽度为矩形的宽,创建矩形扫描区域;
(b)分别创建左和右矩形扫描区域,以步骤(a)得到的矩形区域的垂直中位线为界,将矩形区域分为左和右矩形扫描区域;
(c)得到书本边框的左右边缘点集,首先,在左矩形扫描区域内,从左至右进行扫描,记录边缘点,得到书本边框的左边缘点集;其次,在右矩形扫描区域内,从右至左进行扫描,记录边缘点,得到书本边框的右边缘点集;
(d)计算得到书本边框的左右边缘直线方程,首先,分别根据书本左和右边框直线的特点,去除左和右边缘点集中的奇异点;其次,对剩余的左和右边缘点集,分别采用最小二乘法进行直线拟合,得到书本边框的左边缘直线方程ll和右边缘直线方程lr
(e)上边缘左右端点精定位,首先,计算左边缘直线方程ll与边框上边缘直线y=yu的交点,即为书本上边缘左端点;其次,计算右边缘直线方程lr与边框上边缘直线y=yu的交点,即为书本上边缘右端点,实现上边缘左右端点精定位;
5)书本边框下边缘寻找,具体包括下述步骤:
(a)左边缘下端点定位,根据步骤4)得到的左边缘直线方程ll,以y=yu+Δh″的点为起点,从直线ll左边Δd开始水平扫描到其右边Δd处,若存在边缘点,则令y=y+1继续从直线ll的左边水平扫描到其右边,直至未扫描到边缘点止,记录上一行的y坐标,即为左边缘下端点;
(b)右边缘下端点定位,根据步骤4)得到的右边缘直线方程lr,以y=yu+Δh″的点为起点,从直线lr右边Δd开始水平扫描到其左边Δd处,若存在边缘点,则令y=y+1继续从直线lr的右边水平扫描到其左边,直至未扫描到边缘点止,记录上一行的y坐标,即为右边缘下端点;
(c)书本边框下边缘定位,比较步骤(a)得到左边缘下端点和步骤(b)得到的右边缘下端点,两者y坐标较大的为书本边框下边缘yb
附图说明
图1为本发明的工作流程图。
具体实施方式
本发明方法要求的书本图像一般是以广角镜头俯视拍摄得到的,图像场景中只有单一的书本,且能够完全包含整个书本或者大部分书本,图像中的书本不能倒置或倾斜过大(如:要求倾斜角度|α|≤15°),书本在图像中的位置应尽量居中、平整,图像背景为普通的任意单色桌面。
本发明采用如图1所示的工作流程图,实现基于图像的书本边框定位,其具体实施步骤如下:
1、书本图像预处理
所述书本图像预处理,是采用边缘提取算法对三通道书本图像提取书本边缘轮廓,具体实施步骤如下:
1)将真彩色图像Ia按R、G和B三色分成三张单通道图像,利用Canny算子分别对三张单通道图像进行边缘提取,得到二值化图像Ir、Ig和Ib
2)依次将图像Ir、Ig和Ib的每一个像素进行或运算,得到书本边缘图像Id,具体计算公式为
Figure BDA0001240930570000061
2、书本边框上边缘寻找
首先,利用直线扫描法寻找边框上边缘所在的扫描直线;然后,根据扫描直线的参数,采用仿射变换旋转图像,使得书本边框上边缘与图像的x轴平行,得到旋转后的书本边框上边缘,其具体实施步骤如下:
1)构建初始扇形区域,以图像左上角为顶点,以书本图像的x轴为角平分线,构建圆心角为2θ的扇形区域;
2)构建扇形区域内的扫描直线,以扇形的顶点为起点,以与图像x轴的夹角α为直线倾角,构建一条扫描直线,夹角α以沿图像x轴逆时针旋转方向为正,顺时针为负,夹角范围为α∈[-θ,θ];
需要说明的是,本发明实施例中,夹角范围可以为α∈[-15°,15°];
3)在扇形区域内通过直线扫描获得具有最长连通线段的扫描直线,首先,以与x轴夹角α=-θ的直线为初始扫描直线,从左至右进行扫描,获得该扫描直线上的最长连通线段;其次,在扇形区域内以Δθ为步长沿逆时针方向构建一条新的扫描直线,直至α=θ为止,对于每一条扫描直线,重复上述扫描过程,获得每一条扫描直线内的最长连通线段;最后,通过比较得到此扇形区域内具有最长连通线段的扫描直线;
4)通过平移扇形区域获得书本边框上边缘所在的扫描直线,首先将初始扇形区域以Δh为步长沿着图像y轴方向平行下移,直至下移至图像宽度H的γ倍,其中γ∈(0,1),当扇形区域每下移一个位置时,重复步骤3);最后,通过比较得到上述所有扇形区域中具有最长连通线段的扫描直线,即书本上边缘包含在该扫描直线中;
5)旋转原图像并计算图像旋转后的书本边框上边缘,首先,利用步骤4)得到书本边框上边缘所在的扫描直线,根据该直线与图像x轴夹角α,利用仿射变换原理将图像反向旋转α,使书本边框上边缘与图像坐标的x轴平行;然后,根据旋转图像间y坐标的映射关系计算出旋转后图像上边缘的y轴坐标值yu,即为图像旋转后书本边框上边缘;
需要说明的是,具体y坐标映射关系公式如下所示:
Figure BDA0001240930570000071
式中,α为旋转角度,W′和H′分别为旋转前图像的宽度和高度,H为旋转后图像的高度,y′u和yu分别为旋转前和旋转后书本上边缘的y坐标值。
3、书本边框上边缘左右端点粗定位
根据步骤2获得的书本边框上边缘y=yu,利用垂直扫描法,在上边缘的邻域扫描,得到有向距离信息;然后,通过计算平均值和方差特征,根据特征值删选直线端点点集,完成书本边框上边缘左右端点粗定位,具体实施过程如下:
1)创建矩形扫描区域,以步骤2得到的书本边框上边缘为矩形水平中位线,以2Δh′为矩形的高,以旋转后图像的宽为矩形的宽,创建矩形扫描区域;
2)在矩形扫描区域内,利用扫描法得到以矩形区域水平中位线为基准线的有向距离集合,首先,沿矩形区域的水平方向从左至右进行扫描;其次,在每一个水平位置,沿垂直方向从上至下进行扫描,记录边缘点到水平中位线的最近距离,若边缘点在水平中位线上方,则距离为正,若在下方,则距离为负,正好在中位线上则距离为0,若没有扫描到边缘点,则距离定义为2Δh′;最后,完成整个矩形区域扫描后,得到矩形区域水平中位线的有向距离集合;
3)提取有向距离集合中的有效线段区域,首先,根据步骤2)得到的有向距离集合,去除离水平中位线较远的边缘点集;其次,去除集合中距离的绝对值小于dmin,且连续长度小于lmin的边缘点集合;再次,根据方差去除连续且波动较大的点集;最后,得到有向距离集合中的有效线段区域;
4)上边缘左右端点粗定位,根据步骤3)保留的有效线段区域,首先,将有效线段区域中具有x坐标最小值的边缘点设为书本边框上边缘的左端点;其次,将具有x轴坐标最大值的边缘点设为书本边框上边缘的右端点,从而实现了上边缘左端点Pul与右端点Pur的粗定位。
4、书本边框上边缘左右端点精定位,其具体实施步骤如下:
1)创建矩形区域,根据步骤3得到的书本边框信息,以上边缘yu为矩形的上边,以y=yu+Δh″的直线为矩形的下边,以图像宽度为矩形的宽,创建矩形扫描区域;
2)分别创建左和右矩形扫描区域,以步骤1)得到的矩形区域的垂直中位线为界,将矩形区域分为左和右矩形扫描区域;
3)得到书本边框的左右边缘点集,首先,在左矩形扫描区域内,从左至右进行扫描,得到书本边框的左边缘点集;其次,在右矩形扫描区域内,从右至左进行扫描,得到书本边框的右边缘点集;
4)计算得到书本边框的左右边缘直线方程,首先,分别根据书本左和右边框直线的特点,去除左和右边缘点集中的奇异点;其次,对剩余的左和右边缘点集,分别采用最小二乘法进行直线拟合,得到书本边框的左边缘直线方程ll和右边缘直线方程lr
ll最小二乘法直线公式如下:
假设左边缘点集有N个数据点,坐标分别为(xi,yi),其中i=0,1,L,N,采用最小二乘拟合方法可得左边缘直线ll,其方程为
y=klx+bl
其中kl和bl的计算公式分别为
Figure BDA0001240930570000091
Figure BDA0001240930570000092
同理可以计算得到右边缘直线方程lr,其方程为y=krx+br
5)上边缘左右端点精定位,首先,计算左边缘直线方程ll与边框上边缘直线y=yu的交点,即为书本上边缘左端点;其次,计算右边缘直线方程lr与边框上边缘直线y=yu的交点,即为书本上边缘右端点,实现上边缘左右端点Pul与Pur精定位。
5、书本边框下边缘寻找,其具体实施步骤如下:
1)左边缘下端点定位,根据步骤4得到的左边缘直线方程ll,以y=yu+Δh″的点为起点,从直线ll左边Δd开始水平扫描到其右边Δd处,若存在边缘点,则令y=y+1继续从直线ll的左边水平扫描到其右边,直至未扫描到边缘点止,记录上一行的y坐标,即为左边缘下端点Pdl
2)右边缘下端点定位,根据步骤4得到的右边缘直线方程lr,以y=yu+Δh″的点为起点,从直线lr右边Δd开始水平扫描到其左边Δd处,若存在边缘点,则令y=y+1继续从直线lr的右边水平扫描到其左边,直至未扫描到边缘点止,记录上一行的y坐标,即为右边缘下端点Pdr
3)书本边框下边缘定位,比较步骤1)得到左边缘下端点Pdl和步骤2)得到的右边缘下端点Pdr,两者y坐标较大的为书本边框下边缘yb

Claims (5)

1.一种书本边框的图像定位方法,其特征在于具体包括以下步骤:
1)书本图像预处理;
2)书本边框上边缘寻找,计算出旋转后图像上边缘的y轴坐标值yu,即为图像旋转后书本边框上边缘;
3)书本边框上边缘左右端点粗定位,具体包括下述步骤:
(3.a)创建矩形扫描区域,以步骤2)得到的书本边框上边缘为矩形水平中位线,以2Δh′为矩形的高,以旋转后图像的宽为矩形的宽,创建矩形扫描区域;
(3.b)在矩形扫描区域内,利用扫描法得到以矩形区域水平中位线为基准线的有向距离集合,首先,沿矩形区域的水平方向从左至右进行扫描;其次,在每一个水平位置,沿垂直方向从上至下进行扫描,记录边缘点到水平中位线的最近距离,若边缘点在水平中位线上方,则距离为正,若在下方,则距离为负,正好在中位线上则距离为0,如果没有扫描到边缘点,则距离定义为2Δh′;最后,完成整个矩形区域扫描后,得到矩形区域水平中位线的有向距离集合;
(3.c)提取有向距离集合中的有效线段区域,首先,根据步骤(3.b)得到的有向距离集合,去除离水平中位线较远的边缘点集;其次,去除较短且连续的边缘点集合;再次,根据方差去除连续且波动较大的点集;最后,得到有向距离集合中的有效线段区域;
(3.d)上边缘左右端点粗定位,根据步骤(3.c)保留的有效线段区域,首先,将有效线段区域中具有x坐标最小值的边缘点设为书本边框上边缘的左端点,其次,将有效线段区域中具有x轴坐标最大值的边缘点设为书本边框上边缘的右端点,从而实现了上边缘左右端点粗定位;
4)书本边框上边缘左右端点精定位;
5)书本边框下边缘寻找。
2.根据权利要求1所述的一种书本边框的图像定位方法,其特征在于:步骤1)书本图像预处理具体包括以下步骤:
(a)首先将书本彩色图像按R、G和B三色分成三张单通道图像,然后利用Canny算子分别对三张单通道图像进行边缘提取,得到二值化图像;
(b)对步骤(a)得到的三张二值化图像依次进行或运算,得到边缘轮廓图像。
3.根据权利要求1所述的一种书本边框的图像定位方法,其特征在于:步骤2)书本边框上边缘寻找具体包括下述步骤:
(a)构建初始扇形区域,以图像左上角为顶点,以书本图像的x轴为角平分线,构建圆心角为2θ的扇形区域;
(b)构建扇形区域内的扫描直线,以扇形的顶点为起点,以与图像x轴的夹角α为直线倾角,构建一条扫描直线,夹角α以沿图像x轴逆时针旋转方向为正,顺时针为负,夹角范围为α∈[-θ,θ];
(c)在扇形区域内通过直线扫描获得具有最长连通线段的扫描直线,首先,以与x轴夹角α=-θ的直线为初始扫描直线,从左至右进行扫描,获得该扫描直线上的最长连通线段;其次,在扇形区域内以Δθ为步长沿逆时针方向构建一条新的扫描直线,直至α=θ为止,对于每一条扫描直线,重复上述扫描过程,获得每一条扫描直线内的最长连通线段;最后,通过比较得到此扇形区域内具有最长连通线段的扫描直线;
(d)通过平移扇形区域获得书本边框上边缘所在的扫描直线,先将初始扇形区域以Δh为步长沿着图像y轴方向平行下移,直至下移至图像高度的γ倍,其中γ∈(0,1),当扇形区域每下移一个位置时,重复步骤(c);再通过比较得到所有扇形区域中具有最长连通线段的扫描直线,即书本上边缘包含在该扫描直线中;
(e)旋转原图像并计算图像旋转后的书本边框上边缘,首先,利用步骤(d)得到书本边框上边缘所在的扫描直线,根据该直线与图像x轴夹角α,利用仿射变换原理将图像反向旋转α,使书本边框上边缘与图像坐标的x轴平行;然后,根据旋转图像间y坐标的映射关系计算出旋转后图像上边缘的y轴坐标值yu,即为图像旋转后书本边框上边缘。
4.根据权利要求1所述的一种书本边框的图像定位方法,其特征在于:步骤4)书本边框上边缘左右端点精定位具体包括下述步骤:
(a)创建矩形区域,以书本上边缘yu为矩形的上边,以y=yu+Δh″的直线为矩形的下边,以图像宽度为矩形的宽,创建矩形扫描区域;
(b)分别创建左和右矩形扫描区域,以步骤(a)得到的矩形区域的垂直中位线为界,将矩形区域分为左和右矩形扫描区域;
(c)得到书本边框的左右边缘点集,首先,在左矩形扫描区域内,从左至右进行扫描,记录边缘点,得到书本边框的左边缘点集;其次,在右矩形扫描区域内,从右至左进行扫描,记录边缘点,得到书本边框的右边缘点集;
(d)计算得到书本边框的左右边缘直线方程,首先,分别根据书本左和右边框直线的特点,去除左和右边缘点集中的奇异点;其次,对剩余的左和右边缘点集,分别采用最小二乘法进行直线拟合,得到书本边框的左边缘直线方程ll和右边缘直线方程lr
(e)上边缘左右端点精定位,首先,计算左边缘直线方程ll与边框上边缘直线y=yu的交点,即为书本上边缘左端点;其次,计算右边缘直线方程lr与边框上边缘直线y=yu的交点,即为书本上边缘右端点,实现上边缘左右端点精定位。
5.根据权利要求1或4所述的一种书本边框的图像定位方法,其特征在于:步骤5)书本边框下边缘寻找具体包括下述步骤:
(a)左边缘下端点定位,根据权利要求4第(d)步得到的左边缘直线方程ll,以y=yu+Δh″的点为起点,从直线ll左边Δd开始水平扫描到其右边Δd处,若存在边缘点,则令y=y+1继续从直线ll的左边水平扫描到其右边,直至未扫描到边缘点止,记录上一行的y坐标,即为左边缘下端点;
(b)右边缘下端点定位,根据权利要求4第(d)步得到的右边缘直线方程lr,以y=yu+Δh″的点为起点,从直线lr右边Δd开始水平扫描到其左边Δd处,若存在边缘点,则令y=y+1继续从直线lr的右边水平扫描到其左边,直至未扫描到边缘点止,记录上一行的y坐标,即为右边缘下端点;
(c)书本边框下边缘定位,比较步骤(a)得到左边缘下端点和步骤(b)得到的右边缘下端点,两者y坐标较大的为书本边框下边缘yb
CN201710135203.5A 2017-03-08 2017-03-08 一种书本边框的图像定位方法 Active CN106960184B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710135203.5A CN106960184B (zh) 2017-03-08 2017-03-08 一种书本边框的图像定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710135203.5A CN106960184B (zh) 2017-03-08 2017-03-08 一种书本边框的图像定位方法

Publications (2)

Publication Number Publication Date
CN106960184A CN106960184A (zh) 2017-07-18
CN106960184B true CN106960184B (zh) 2020-03-31

Family

ID=59470570

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710135203.5A Active CN106960184B (zh) 2017-03-08 2017-03-08 一种书本边框的图像定位方法

Country Status (1)

Country Link
CN (1) CN106960184B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111104940A (zh) * 2018-10-26 2020-05-05 深圳怡化电脑股份有限公司 图像旋转校正方法、装置、电子设备及存储介质
CN112257598A (zh) * 2020-10-22 2021-01-22 北京字跳网络技术有限公司 图像中四边形的识别方法、装置、可读介质和电子设备
CN113012060A (zh) * 2021-02-07 2021-06-22 深圳柔果信息科技有限公司 一种图像处理方法、图像处理系统及电子设备
CN117252889B (zh) * 2023-10-08 2024-03-08 南京未来脑科技有限公司 一种书本纸张边界识别裁切方法及设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101334837A (zh) * 2008-07-31 2008-12-31 重庆大学 一种多方法融合的车牌图像定位方法
CN103426157A (zh) * 2012-05-17 2013-12-04 成都方程式电子有限公司 图像有效区域的扫描方法及装置
CN103679638A (zh) * 2013-12-25 2014-03-26 广州广电运通金融电子股份有限公司 残缺或变形的四边形图像的校正方法
CN104161531A (zh) * 2014-05-04 2014-11-26 上海联影医疗科技有限公司 限束器边缘的获取方法及装置、x射线摄影设备
CN105354570A (zh) * 2015-10-15 2016-02-24 深圳市捷顺科技实业股份有限公司 一种车牌左右边界精确定位的方法及系统
CN105404874A (zh) * 2015-11-27 2016-03-16 成都神州数码索贝科技有限公司 一种基于投影和hough直线检测的车窗识别系统
CN106127211A (zh) * 2016-06-22 2016-11-16 北京小米移动软件有限公司 白板检测方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW510121B (en) * 2001-04-27 2002-11-11 Avision Inc Image scanner capable of positioning the starting point of scanning

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101334837A (zh) * 2008-07-31 2008-12-31 重庆大学 一种多方法融合的车牌图像定位方法
CN103426157A (zh) * 2012-05-17 2013-12-04 成都方程式电子有限公司 图像有效区域的扫描方法及装置
CN103679638A (zh) * 2013-12-25 2014-03-26 广州广电运通金融电子股份有限公司 残缺或变形的四边形图像的校正方法
CN104161531A (zh) * 2014-05-04 2014-11-26 上海联影医疗科技有限公司 限束器边缘的获取方法及装置、x射线摄影设备
CN105354570A (zh) * 2015-10-15 2016-02-24 深圳市捷顺科技实业股份有限公司 一种车牌左右边界精确定位的方法及系统
CN105404874A (zh) * 2015-11-27 2016-03-16 成都神州数码索贝科技有限公司 一种基于投影和hough直线检测的车窗识别系统
CN106127211A (zh) * 2016-06-22 2016-11-16 北京小米移动软件有限公司 白板检测方法和装置

Also Published As

Publication number Publication date
CN106960184A (zh) 2017-07-18

Similar Documents

Publication Publication Date Title
CN111243032B (zh) 一种棋盘格角点全自动检测方法
CN106960184B (zh) 一种书本边框的图像定位方法
CN104376548B (zh) 一种基于改进型surf算法的图像快速拼接方法
WO2022007431A1 (zh) 一种Micro QR二维码的定位方法
JP5699788B2 (ja) スクリーン領域検知方法及びシステム
CN105654421B (zh) 基于变换不变低秩纹理的投影变换图像匹配方法
CN108597009B (zh) 一种基于方向角信息进行三维目标检测的方法
CN107895375B (zh) 基于视觉多特征的复杂道路线提取方法
CN109858325B (zh) 一种表格检测方法和装置
CN107452030B (zh) 基于轮廓检测和特征匹配的图像配准方法
CN107192716A (zh) 一种基于轮廓特征的工件缺陷快速检测方法
CN110021029B (zh) 一种适用于rgbd-slam的实时动态配准方法及存储介质
CN104008542A (zh) 一种针对特定平面图形的快速角点匹配方法
CN112233116B (zh) 基于邻域决策与灰度共生矩阵描述的凹凸痕视觉检测方法
CN103632137A (zh) 一种人眼虹膜图像分割方法
CN106296587B (zh) 轮胎模具图像的拼接方法
CN109784297A (zh) 一种基于深度学习的三维目标识别与最优抓取方法
Chen et al. Image stitching algorithm research based on OpenCV
CN115511966B (zh) 基于角点检测的元件识别定位方法及系统、存储介质
CN111178210A (zh) 一种十字标记的图像识别及对准方法
CN113689365B (zh) 一种基于Azure Kinect的目标跟踪定位方法
CN108416346B (zh) 车牌字符的定位方法及装置
KR101766787B1 (ko) Gpu장치를 기반으로 하는 딥러닝 분석을 이용한 영상 보정 방법
Huang et al. An automatic detection and recognition method for pointer-type meters in natural gas stations
CN110136193B (zh) 基于深度图像的矩体箱体三维尺寸测量方法及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant