CN106778789A - 一种多视点图像中的快速目标提取方法 - Google Patents

一种多视点图像中的快速目标提取方法 Download PDF

Info

Publication number
CN106778789A
CN106778789A CN201710034879.5A CN201710034879A CN106778789A CN 106778789 A CN106778789 A CN 106778789A CN 201710034879 A CN201710034879 A CN 201710034879A CN 106778789 A CN106778789 A CN 106778789A
Authority
CN
China
Prior art keywords
image
target
pixel
gray level
extracting method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710034879.5A
Other languages
English (en)
Other versions
CN106778789B (zh
Inventor
向北海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Youxiang Technology Co Ltd
Original Assignee
Hunan Youxiang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Youxiang Technology Co Ltd filed Critical Hunan Youxiang Technology Co Ltd
Priority to CN201710034879.5A priority Critical patent/CN106778789B/zh
Publication of CN106778789A publication Critical patent/CN106778789A/zh
Application granted granted Critical
Publication of CN106778789B publication Critical patent/CN106778789B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种多视点图像中的快速目标提取方法,首先通过彩色图像的低频和高频信息,对图像进行一个增强处理,突出图像中的主体目标,并削弱目标周围场景对于目标的影响,然后对增强灰度图像进行二值化,采用全局阈值和局部阈值相结合的方法对每个像素进行判断,最后通过形态学方法找到目标所在的连通区域,也即完成对目标的提取过程。本发明提出的方法简单实用,算法复杂度小,可以实时处理各类图像,拥有很好的实用价值。

Description

一种多视点图像中的快速目标提取方法
技术领域
本发明属于数字图像处理和计算机视觉技术领域,特指一种多视点图像中的快速目标提取方法。
背景技术
近年来随着计算机性能的大幅提高、网络带宽的不断扩展和相机传感器的普遍应用,交互式多媒体越来越受到用户的喜爱。其中对于某一场景或目标,可以从不同的时刻或角度得到关于它的一组观测图像,这些图像的整体就叫做多视点图像。人们借助交互式多媒体和图像处理技术可以对多视点图像进行编辑,根据自己的喜好去选择和操作目标。
在多视点图像处理中,目标提取是其中一个关键技术。目标提取的过程实际上就是图像分割的过程,从图像中将感兴趣的运动目标与背景进行分割,即提取出感兴趣的目标。目标提取是计算机视觉领域低层次视觉中最为基础和重要的领域之一。目标提取的效果对于后续中高层次图像处理(如目标分类、身份识别和行为理解等)非常重要。
目标提取在近几十年里受到国内外学者的广泛关注,提出了大量的目标提取方法。目前比较受关注的目标提取方法可以归纳为两类:基于阈值分割的方法和基于图割优化模型的方法。基于阈值分割的方法有:双峰法、最大类间方差法、模糊阈值分割法等。这类方法计算简单、效率较高,但受获取图像的自然环境影响最大,提取的准确率较低。基于图割优化模型的方法是近年来发展起来的一种基于图论的目标提取方法,将目标提取转换成为一个求能量函数最优化的问题。这类方法可以根据情况构造各种能量函数,且可以得到能量函数的全局最优解,因此具有鲁棒性强、分割效果较好等特点。但求解能量函数需要进行迭代计算,算法复杂度较高、需要的时间较长,很难达到实时处理。
发明内容
为了解决现有技术的不足,本发明的目的在于提出一种多视点图像中的快速目标提取方法,通过对通过彩色图像的低频和高频信息,对图像进行一个增强处理,突出图像中的主体目标,并削弱目标周围场景对于目标的影响,然后对增强灰度图像进行二值化,采用全局阈值和局部阈值相结合的方法对每个像素进行判断,最后通过形态学方法找到目标所在的连通区域,也即完成对目标的提取过程。本发明提出的方法简单实用,算法复杂度小,可以实时处理各类图像,拥有很好的实用价值。
为实现上述技术目的,本发明的技术方案是,
一种多视点图像中的快速目标提取方法,包括以下步骤:
S1.任取一副多视点彩色图像,图像格式为RGB,将该彩色图像记为P(x,y,z),对该图像进行增强处理,突出图像中的主体目标,并削弱目标周围场景对于目标的影响,获得增强灰度图像;
本发明中S1通过以下方法实现:
S11对彩色图像P(x,y,z)做高斯低通滤波,获得P(x,y,z)的低频分量Q(x,y,z),公式如下:
其中表示做卷积运算,Gσ是标准差为σ的二维高斯核
S12计算彩色图像P(x,y,z)在RGB颜色空间上的3个均值,公式如下:
其中z∈{1,2,3}是RGB颜色通道的序号,N是图像的像素总数,{μi|i=1,2,3}即为3个均值。
S13使用S11中得到的低频分量Q(x,y,z)和S12中得到的均值信息,对目标进行增强,得到增强灰度图像D(x,y),具体计算公式如下:
说明:低频分量Q(x,y,z),z∈{1,2,3}是一个RGB图像,所以Q(x,y,1)就是z取1时的值,Q(x,y,2)就是z取2时的值,Q(x,y,3)就是z取3时的值。
S2.对增强灰度图像进行二值化,采用全局阈值和局部阈值相结合的方法对每个像素进行判断,得到二值化图像;
本发明中S2通过以下方法实现:
S21通过最大类间方差Otsu对灰度图像D(x,y)计算,求得初始阈值Ψ0
最大类间方差Otsu是经典的二值化方法,该方法是本领域的公知常识,所以这里没有写计算过程。
S22利用初始阈值Ψ0对灰度图像D(x,y)的每个像素(x,y)进行判断,将其分成3个类别:前景区域、背景区域、待定区域;
其中f(x,y)表示像素的标签,1表示前景区域,-1表示背景区域,0表示待定区域,α表示控制参数,这里取值0.15。
S23对于待定区域也即f(x,y)为0的每个像素,再通过领域信息计算一个新的局部阈值,并根据新的局部阈值对该像素进行二次判断,得到二值化图像,方法如下:
任取待定区域的一个像素,记为(x0,y0),在灰度图像D(x,y)中以其为中心,选择一个大小为9×9的图像块d(x,y),计算此图像块d(x,y)的均值μd和方差ωd
其中Nd表示图像块d(x,y)的像素总数也即81。
根据此图像块d(x,y)的均值μd和方差ωd,对像素(x0,y0)进行二次判断:
其中β表示控制参数,这里取值0.1。
根据上述方法,可以对灰度图像D(x,y)的所有像素进行判断,也即二值化处理,记得到的二值化图像为F(x,y)。
S3.对二值化图像进行形态学处理,得到最大的连通区域也即目标区域,完成目标提取。
由于复杂的自然光照条件,不可避免的存在某些目标区域的像素存在少量误判的情况。这里本发明对二值化图像F(x,y)进行数学形态学上的膨胀操作,令B表示水平结构像素集合,用B对二值图像集合F(x,y)的膨胀表示为:
其中表示膨胀算子,φ表示空集合,B(x)表示表示对结构像素集合B先做原点映射然后做平移x的运算;记膨胀后的二值化图像为FB(x,y)。这样做的目的是把一些断裂的边缘连接起来,使获得的边界更加完整。
最后对二值化图像FB(x,y),做连通区域分析,其中面积最大的连通区域就是目标所在区域,也即获得目标提取的结果。
本发明的有益效果是:
本发明提出了一种多视点图像中的快速目标提取方法,通过对通过彩色图像的低频和高频信息,对图像进行一个增强处理,突出图像中的主体目标,并削弱目标周围场景对于目标的影响,然后对增强灰度图像进行二值化,采用全局阈值和局部阈值相结合的方法对每个像素进行判断,最后通过形态学方法找到目标所在的连通区域,也即完成对目标的提取过程。本发明提出的方法简单实用,算法复杂度小,可以实时处理各类图像,拥有很好的实用价值。
附图说明
图1本发明的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
参照图1,本发明提出了一种多视点图像中的快速目标提取方法,具体步骤如下:
S1.任取一副多视点彩色图像,图像格式为RGB,将该彩色图像记为P(x,y,z)。由于图像的获取会受到各种自然环境的影响,因此本发明首先对该图像进行增强处理,突出图像中的主体目标,并削弱目标周围场景对于目标的影响,获得增强灰度图像;具体步骤如下:
S11对彩色图像P(x,y,z)做高斯低通滤波,获得P(x,y,z)的低频分量Q(x,y,z),公式如下:
其中表示做卷积运算,Gσ是标准差为σ的二维高斯核
S12计算彩色图像P(x,y,z)在RGB颜色空间上的3个均值,公式如下:
其中z∈{1,2,3}是RGB颜色通道的序号,N是图像的像素总数,{μi|i=1,2,3}即为3个均值。
S13使用S11中得到的低频分量Q(x,y,z)和S12中得到的均值信息,对目标进行增强,得到增强灰度图像D(x,y),具体计算公式如下:
经过S1中的这种图像处理方法,首先通过低频信息突出目标主体,然后利用部分高频信息(均值)对图像进行进一步的增强,最终得到一个突出目标,并削弱了目标周围场景对于目标影响的灰度图像。
由于灰度图像D(x,y)是经过特殊处理得到的,因此不再需要如图割优化等复杂的算法进行目标提取。接下来本发明提出一个改进的二值化方法对目标像素进行判断提取,能够在有限的几次迭代计算下,得到稳定高效的目标像素区域。
S2.对增强灰度图像进行二值化,采用全局阈值和局部阈值相结合的方法对每个像素进行判断,得到二值化图像;
S21通过经典的二值化方法最大类间方差Otsu对灰度图像D(x,y)计算,求得初始阈值Ψ0
S22利用初始阈值Ψ0对灰度图像D(x,y)的每个像素(x,y)进行判断,将其分成3个类别:前景区域、背景区域、待定区域;
其中f(x,y)表示像素的标签,1表示前景区域,-1表示背景区域,0表示待定区域,α表示控制参数,这里取值0.15。
S23对于待定区域也即f(x,y)为0的每个像素,再通过领域信息计算一个新的局部阈值,并根据新的局部阈值对该像素进行二次判断,得到二值化图像,方法如下:
任取待定区域的一个像素,记为(x0,y0),在灰度图像D(x,y)中以其为中心,选择一个大小为9×9的图像块d(x,y),计算此图像块d(x,y)的均值μd和方差ωd
其中Nd表示图像块d(x,y)的的像素总数也即81。
根据此图像块d(x,y)的均值μd和方差ωd,对像素(x0,y0)进行二次判断:
其中β表示控制参数,这里取值0.1。
根据上述方法,可以对灰度图像D(x,y)的所有像素进行判断,也即二值化处理,记得到的二值化图像为F(x,y)。
由于复杂的自然光照条件,不可避免的存在某些目标区域的像素存在少量误判的情况。接下来本发明对获得二值化图像进一步处理。
S3.对二值化图像进行形态学处理,得到最大的连通区域也即目标区域,完成目标提取。
由于复杂的自然光照条件,不可避免的存在某些目标区域的像素存在少量误判的情况。这里本发明对二值化图像F(x,y)进行数学形态学上的膨胀操作,令B表示水平结构像素集合,用B对二值图像集合F(x,y)的膨胀表示为:
其中表示膨胀算子,φ表示空集合,B(x)表示表示对结构像素集合B先做原点映射然后做平移x的运算;记膨胀后的二值化图像为FB(x,y)。这样做的目的是把一些断裂的边缘连接起来,使获得的边界更加完整。
最后对二值化图像FB(x,y),做连通区域分析,其中面积最大的连通区域就是目标所在区域,也即获得目标提取的结果。
以上包含了本发明优选实施例的说明,这是为了详细说明本发明的技术特征,并不是想要将发明内容限制在实施例所描述的具体形式中,依据本发明内容主旨进行的其他修改和变型也受本专利保护。本发明内容的主旨是由权利要求书所界定,而非由实施例的具体描述所界定。

Claims (7)

1.一种多视点图像中的快速目标提取方法,其特征在于,包括以下步骤:
S1.任取一副多视点彩色图像,图像格式为RGB,将该彩色图像记为P(x,y,z),对该图像进行增强处理,突出图像中的主体目标,并削弱目标周围场景对于目标的影响,获得增强灰度图像;
S2.对增强灰度图像进行二值化,采用全局阈值和局部阈值相结合的方法对每个像素进行判断,得到二值化图像;
S3.对二值化图像进行形态学处理,得到最大的连通区域也即目标区域,完成目标提取。
2.根据权利要求1所述的多视点图像中的快速目标提取方法,其特征在于:步骤S1通过以下方法实现:
S11对彩色图像P(x,y,z)做高斯低通滤波,获得P(x,y,z)的低频分量Q(x,y,z),公式如下:
Q ( x , y , z ) = P ( x , y , z ) ⊗ G σ
其中表示做卷积运算,Gσ是标准差为σ的二维高斯核
S12计算彩色图像P(x,y,z)在RGB颜色空间上的3个均值,公式如下:
μ i = 1 N Σ x , y P ( x , y , z )
其中z∈{1,2,3}是RGB颜色通道的序号,N是图像的像素总数,{μi|i=1,2,3}即为3个均值;
S13使用S11中得到的低频分量Q(x,y,z)和S12中得到的均值信息,对目标进行增强,得到增强灰度图像D(x,y),计算公式如下:
D ( x , y ) = [ 0.299 , 0.587 , 0.114 ] × ( Q ( x , y , 1 ) - μ 1 ) 2 ( Q ( x , y , 2 ) - μ 2 ) 2 ( Q ( x , y , 3 ) - μ 3 ) 2 .
3.根据权利要求2所述的多视点图像中的快速目标提取方法,其特征在于:步骤S2通过以下方法实现:
S21通过最大类间方差Otsu对灰度图像D(x,y)计算,求得初始阈值Ψ0
S22利用初始阈值Ψ0对灰度图像D(x,y)的每个像素(x,y)进行判断,将其分成3个类别:前景区域、背景区域、待定区域;
f ( x , y ) = 1 , D ( x , y ) ≥ ( 1 + α ) × Ψ 0 - 1 , D ( x , y ) ≤ ( 1 - α ) × Ψ 0 0 , e l s e
其中f(x,y)表示像素的标签,1表示前景区域,-1表示背景区域,0表示待定区域,α表示控制参数;
S23对于待定区域也即f(x,y)为0的每个像素,再通过领域信息计算一个新的局部阈值,并根据新的局部阈值对该像素进行二次判断,得到二值化图像。
4.根据权利要求3所述的多视点图像中的快速目标提取方法,其特征在于:步骤S22中,α取值0.15。
5.根据权利要求3所述的多视点图像中的快速目标提取方法,其特征在于:步骤S23通过以下方法实现:
任取待定区域的一个像素,记为(x0,y0),在灰度图像D(x,y)中以其为中心,选择一个大小为9×9的图像块d(x,y),计算此图像块d(x,y)的均值μd和方差ωd
μ d = 1 N d Σ x , y d ( x , y )
ω d = 1 N d Σ x , y [ d ( x , y ) - μ d ] 2
其中Nd表示图像块d(x,y)的像素总数也即81;
根据此图像块d(x,y)的均值μd和方差ωd,对像素(x0,y0)进行二次判断:
f ( x , y ) = 1 , D ( x , y ) &GreaterEqual; &mu; d + &beta; &times; &omega; d - 1 , D ( x , y ) < &mu; d + &beta; &times; &omega; d
其中β表示控制参数;
根据上述方法,可以对灰度图像D(x,y)的所有像素进行判断,也即二值化处理,记得到的二值化图像为F(x,y)。
6.根据权利要求5所述的多视点图像中的快速目标提取方法,其特征在于:步骤S23中,β取值0.1。
7.根据权利要求3、4、5或6所述的多视点图像中的快速目标提取方法,其特征在于:步骤S3通过以下方法实现:
对二值化图像F(x,y)进行数学形态学上的膨胀操作,令B表示水平结构像素集合,用B对二值图像集合F(x,y)的膨胀表示为:
F ( x , y ) &CirclePlus; B = { x | B ( x ) &cap; F ( x , y ) &NotEqual; &phi; } ,
其中表示膨胀算子,φ表示空集合,B(x)表示表示对结构像素集合B先做原点映射然后做平移x的运算;记膨胀后的二值化图像为FB(x,y);
最后对二值化图像FB(x,y),做连通区域分析,其中面积最大的连通区域就是目标所在区域,也即获得目标提取的结果。
CN201710034879.5A 2017-01-17 2017-01-17 一种多视点图像中的快速目标提取方法 Active CN106778789B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710034879.5A CN106778789B (zh) 2017-01-17 2017-01-17 一种多视点图像中的快速目标提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710034879.5A CN106778789B (zh) 2017-01-17 2017-01-17 一种多视点图像中的快速目标提取方法

Publications (2)

Publication Number Publication Date
CN106778789A true CN106778789A (zh) 2017-05-31
CN106778789B CN106778789B (zh) 2019-06-07

Family

ID=58947189

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710034879.5A Active CN106778789B (zh) 2017-01-17 2017-01-17 一种多视点图像中的快速目标提取方法

Country Status (1)

Country Link
CN (1) CN106778789B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110672474A (zh) * 2019-08-26 2020-01-10 苏州感知线智能科技有限公司 Acf导电粒子压合自动检测方法及装置
CN112890736A (zh) * 2019-12-03 2021-06-04 精微视达医疗科技(武汉)有限公司 一种内窥成像系统视场掩模的获得方法及装置
CN114332108A (zh) * 2021-12-09 2022-04-12 拓尔思信息技术股份有限公司 一种图片中的虚实线局部区域的提取方法
CN114841896A (zh) * 2022-05-31 2022-08-02 歌尔股份有限公司 图像处理方法、设备以及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101877074A (zh) * 2009-11-23 2010-11-03 常州达奇信息科技有限公司 基于多元特征的结核杆菌目标识别计数算法
CN102436656A (zh) * 2011-09-05 2012-05-02 同济大学 基于计算机视觉的动物多样性监测方法
CN105976352A (zh) * 2016-04-14 2016-09-28 北京工业大学 一种基于灰度图像形态学的焊缝表面缺陷特征提取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101877074A (zh) * 2009-11-23 2010-11-03 常州达奇信息科技有限公司 基于多元特征的结核杆菌目标识别计数算法
CN102436656A (zh) * 2011-09-05 2012-05-02 同济大学 基于计算机视觉的动物多样性监测方法
CN105976352A (zh) * 2016-04-14 2016-09-28 北京工业大学 一种基于灰度图像形态学的焊缝表面缺陷特征提取方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110672474A (zh) * 2019-08-26 2020-01-10 苏州感知线智能科技有限公司 Acf导电粒子压合自动检测方法及装置
CN112890736A (zh) * 2019-12-03 2021-06-04 精微视达医疗科技(武汉)有限公司 一种内窥成像系统视场掩模的获得方法及装置
CN112890736B (zh) * 2019-12-03 2023-06-09 精微视达医疗科技(武汉)有限公司 一种内窥成像系统视场掩模的获得方法及装置
CN114332108A (zh) * 2021-12-09 2022-04-12 拓尔思信息技术股份有限公司 一种图片中的虚实线局部区域的提取方法
CN114332108B (zh) * 2021-12-09 2024-06-04 拓尔思信息技术股份有限公司 一种图片中的虚实线局部区域的提取方法
CN114841896A (zh) * 2022-05-31 2022-08-02 歌尔股份有限公司 图像处理方法、设备以及计算机可读存储介质

Also Published As

Publication number Publication date
CN106778789B (zh) 2019-06-07

Similar Documents

Publication Publication Date Title
CN109829443B (zh) 基于图像增强与3d卷积神经网络的视频行为识别方法
CN108230264B (zh) 一种基于ResNet神经网络的单幅图像去雾方法
CN111274921B (zh) 一种利用姿态掩模进行人体行为识别的方法
WO2017084204A1 (zh) 一种二维视频流中的人体骨骼点追踪方法及系统
CN102360421B (zh) 一种基于视频流的人脸识别方法及系统
CN111797712B (zh) 基于多尺度特征融合网络的遥感影像云与云阴影检测方法
CN107895376A (zh) 基于改进Canny算子和轮廓面积阈值的太阳能电池板识别方法
CN106778789A (zh) 一种多视点图像中的快速目标提取方法
CN106372648A (zh) 基于多特征融合卷积神经网络的浮游生物图像分类方法
CN109558806A (zh) 高分遥感图像变化的检测方法和系统
CN107133929A (zh) 基于背景估计和能量最小化的低质量文档图像二值化方法
CN104408733B (zh) 基于对象随机游走的遥感图像视觉显著性检测方法及系统
CN112837344A (zh) 一种基于条件对抗生成孪生网络的目标跟踪方法
CN104463242B (zh) 基于特征变换和词典学习的多特征动作识别方法
CN111062329B (zh) 基于增广网络的无监督行人重识别方法
CN111274905A (zh) 一种AlexNet和SVM相结合的卫星遥感影像土地利用变化检测方法
CN111507334A (zh) 一种基于关键点的实例分割方法
CN110458797B (zh) 一种基于深度图过滤器的显著性物体检测方法
CN111652233A (zh) 一种针对复杂背景的文本验证码自动识别方法
CN106780450A (zh) 一种基于低秩多尺度融合的图像显著性检测方法
CN105718885A (zh) 一种人脸特征点跟踪方法
CN110084136A (zh) 基于超像素crf模型的上下文优化室内场景语义标注方法
CN113569772A (zh) 遥感影像耕地实例掩膜提取方法及系统、设备、存储介质
CN108009549A (zh) 一种迭代协同显著性检测方法
CN111598790A (zh) 基于对偶深度神经网络的高光谱遥感图像去噪方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant