CN104980622A - 图像处理装置及图像处理方法 - Google Patents

图像处理装置及图像处理方法 Download PDF

Info

Publication number
CN104980622A
CN104980622A CN201510146165.4A CN201510146165A CN104980622A CN 104980622 A CN104980622 A CN 104980622A CN 201510146165 A CN201510146165 A CN 201510146165A CN 104980622 A CN104980622 A CN 104980622A
Authority
CN
China
Prior art keywords
pixel
region
image processing
feature
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510146165.4A
Other languages
English (en)
Other versions
CN104980622B (zh
Inventor
东条洋
矢野光太郎
图安·光·范
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN104980622A publication Critical patent/CN104980622A/zh
Application granted granted Critical
Publication of CN104980622B publication Critical patent/CN104980622B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/254Analysis of motion involving subtraction of images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30232Surveillance

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种图像处理装置及图像处理方法。所述图像处理装置包括:视频输入单元;区域分割单元,其被构造为将所述视频输入单元获取的图像分割为各自包括相似属性的像素的多个区域;特征提取单元,其被构造为从各个分割区域提取特征;背景模型存储单元,其被构造为预先存储由背景的特征生成的背景模型;以及特征比较单元,其被构造为将所提取的特征与所述背景模型中的特征进行比较,并且针对所述多个区域中的各个区域确定所述区域是否为背景。

Description

图像处理装置及图像处理方法
技术领域
本发明涉及图像处理装置及图像处理方法,具体地,涉及从运动图像中检测物体的技术。
背景技术
作为从照相机拍摄的图像中检测物体的技术,公开了背景差分法。在背景差分法中,固定的照相机来预先拍摄不具有任何被摄体的背景图像,并且将该图像的特征存储为背景模型。之后,获得背景模型中的特征与从照相机输入的图像中的特征之间的差分,并且不同的区域被检测为前景(物体)。
例如,在专利文献1(特许第2950267号)中,使用像素值作为特征生成背景模型,并且以像素单位计算差分,从而检测物体。当以像素单位生成背景模型时,存储器消耗和处理成本随着分辨率上升而增加。为了防止这种情况,在专利文献2(特许第4653155号)中,输入图像被分割为8×8像素块,并且作为DCT(离散余弦变换)的编码结果的DCT系数被用作特征。
然而,在背景差分法中,因为假定照相机要被固定,所以在照相机由于振动等而移动的情况下出现以下问题。即,在即使在图像中没有任何物体,照相机的运动也使输入图像偏移的情况下,同一坐标处的图像内容在专利文献1的方法中时间上连续的输入图像之间改变。例如,在红门与蓝墙之间的边界附近的像素中,像素值从红色突然地改变为蓝色。另外,在专利文献2的方法中,在包括红门与蓝墙之间的边界的块中,块中包括的红色像素与蓝色像素的比率改变。结果,在专利文献1的方法和专利文献2的方法两者中,在背景中包括强边缘的边界附近发生检测错误。
在专利文献1的方法中,因为仅同一像素值的像素的坐标偏移,所以能够通过向比较对象添加邻近像素来防止检测错误。然而,这种方法无法解决存储器容量和处理成本的问题。专利文献2的方法能够抑制存储器容量和处理成本。然而,因为块的特征本身改变,所以无法解决检测错误的问题。因此,在不增加存储器消耗和处理成本的情况下,传统技术无法避免由于照相机的运动引起输入图像的偏移而产生的检测错误。
发明内容
鉴于上述问题作出了本发明,本发明提供了用于在不增加存储器消耗和处理成本的情况下实现避免由于摄像设备的运动引起输入图像的偏移而发生的检测错误的技术。
根据本发明的第一方面,提供一种图像处理装置,所述图像处理装置包括:视频输入单元;区域分割单元,其被构造为将所述视频输入单元获取的图像分割为各自包括相似属性的像素的多个区域;特征提取单元,其被构造为从所述区域分割单元分割的各个区域中提取特征;背景模型存储单元,其被构造为预先存储由背景的特征生成的背景模型;以及特征比较单元,其被构造为将所述特征提取单元提取的特征与所述背景模型中的特征进行比较,并且针对所述多个区域中的各个区域确定所述区域是否为背景。
根据本发明的第二方面,提供一种图像处理装置进行的图像处理方法,所述图像处理方法包括:区域分割步骤,将获取的图像分割为各自包括相似属性的像素的多个区域;特征提取步骤,从在所述区域分割步骤中分割的各个区域中提取特征;以及特征比较步骤,将在所述特征提取步骤中提取的特征与由背景的特征生成的背景模型中的特征进行比较,并且针对所述多个区域中的各个区域确定所述区域是否为背景。
根据以下(参照附图)对示例性实施例的描述,本发明的其他特征将变得清楚。
附图说明
图1是示出计算机的硬件结构的示例的框图;
图2是示出图像处理装置的功能结构的示例的框图;
图3是图像处理装置进行的处理的流程图;
图4是示出选择邻近区域的处理的详情的流程图;以及
图5A至图5C是用于说明根据稳定性获得阈值的方法以及根据稳定性获得阈值的意义的图。
具体实施方式
现在将参照附图描述本发明的实施例。注意,以下要描述的实施例是本发明的具体实施方式的示例或者是所附权利要求中描述的结构的具体示例。
[第一实施例]
在本实施例中,将描述依次获得运动图像的各帧的图像并从所所获取的图像中检测包括物体的区域的图像处理装置的模式。首先,将参照图2的框图说明根据本实施例的图像处理装置的功能结构的示例。注意,图2中所示的结构仅为示例,可以采用实现等于或大于图2中的功能的任何其他结构。
视频输入单元201依次获取运动图像的各帧的图像(帧图像),并且将所获取的帧图像发送到后段的区域分割单元202。可以从摄像机依次发送各帧的图像,或者通过诸如流的技术从外部装置依次传送各帧的图像。
区域分割单元202将从视频输入单元201接收到的各帧图像分割为相似图像特征(属性)的区域。特征提取单元203进行从区域分割单元202分割的各区域提取图像特征的处理。邻近区域选择单元205从背景模型存储单元204中存储的区域的信息中,读出区域分割单元202分割的各区域的邻近区域的信息,并且将读出信息发送到特征比较单元206。
针对区域分割单元202分割的各区域,特征比较单元206将从该区域提取的图像特征,与邻近区域选择单元205从背景模型存储单元204读出的关于该区域的信息,进行比较。
根据特征比较单元206的比较结果,物体区域输出单元207在针对帧图像分割的区域当中指定包括物体的区域,并且输出关于所指定的区域的信息。
特征更新单元208和稳定性计算单元209更新背景模型存储单元204中存储的背景模型。
接下来,将参照示出了根据本实施例的图像处理装置进行的从帧图像提取包括物体的区域的处理的流程图的图3描述该处理。
在步骤S301中,视频输入单元201获取与一帧相对应的帧图像,并且将所获取的帧图像发送到后段的区域分割单元202。
在步骤S302中,区域分割单元202将从视频输入单元201接收到的帧图像分割为相似图像特征的区域。近年来,提出了将图像分割为子区域(称为超像素(Superpixel))的方法,各子区域由具有相似图像特征(诸如亮度或颜色)的像素组形成(例如,参照非专利文献1(RadhakrishnaAchanta,Appu Shaji,Kevin Smith,Aurelien Lucchi,Pascal Fua,and SabineSusstrunk,"SLIC Superpixels",EPFL Technical Report 149300,June 2010)和非特许文献2(Felzenszwalb,P.,Huttenlocher,D.,"Efficient graph-basedimage segmentation",International Journal of Computer Vision,2004))。
虽然超像素的大小几乎恒定(非专利文献1)或者主要依据图像的内容而改变(非专利文献2),但是图像分割方法具有以下共同特性。即,在超像素分割中,由于具有相似亮度或颜色的像素被放在一起,因此图像在亮度或颜色大改变的强边缘部分被分割。在图像中包括的物体的边界处观察到强边缘。因此,物体的边界附近的超像素的边界与物体的边界匹配。在本实施例中,使用这种超像素的特性。
在将帧图像分割为相似图像特征的区域(即,超像素)之后,区域分割单元202将像素所属的超像素固有的标签编号分配给帧图像的各像素,并且将该区域在帧图像中的重心位置登记在图像处理装置管理的存储器中。
在步骤S303中,特征提取单元203从区域分割单元202分割的各超像素中提取图像特征。当以超像素为单位提取图像特征时,即使当伴随用于拍摄运动图像的摄像设备的运动,帧图像中发生偏移时,图像特征也不改变。在上述红门与蓝墙之间的边界的示例中,即使当帧图像中发生偏移时,超像素的边界也总存在于红门与蓝墙之间的边界处。为此,不从红色和蓝色混合的超像素中提取图像特征。因此,可以提取甚至在物体边界附近的帧图像之间的恒定特征。
在本实施例中,作为要从超像素提取的图像特征,使用作为超像素中的各像素的颜色分量的平均像素值(例如,针对R、G和B分量中的各个分量的平均像素值)的颜色特征。可以以颜色分量为单位分割RGB颜色空间等,并且可以生成超像素中的各像素的颜色值的直方图。颜色空间并非特别限定于RGB颜色空间,可以使用YCbCr或CIE LAB颜色空间。当然,一些其他值也可以用作颜色特征。
在本实施例中,作为要从超像素提取的图像特征,也使用作为定义超像素的形状的信息的形状特征。“定义超像素的形状的信息”可以是例如超像素的边界上的像素的像素位置、超像素中的各像素的像素位置、或者超像素中的像素数(超像素的面积)。
作为另选方案,可以使用在具有预定边缘强度以上的区域边界上的像素数与周长的比率,作为图像特征。如稍后所述,由强边缘包围的超像素被认为是稳定的,因此,该边缘可以被视为具有超像素的形状的特征。当各像素的像素位置被表达为(x,y)时的x坐标的二次矩和y坐标的二次矩为xy矩,或者可以使用边界线的傅里叶描述子。
使用分配给帧图像的各像素的标签编号,特征提取单元203指定分配了同一标签编号的像素组的区域,即超像素,并且从所指定的超像素中提取图像特征(颜色特征和形状特征)。针对帧图像的各超像素,特征提取单元203将从超像素中提取的n(n是整数,n≥2)个图像特征登记在上述存储器中,作为n维特征向量(在以上示例中,由超像素中的各像素的颜色分量的平均像素值形成的4维向量和定义超像素的形状的信息(在这种情况下为面积))。
在步骤S304的处理的说明之前,将描述背景模型存储单元204保持的信息。在背景模型存储单元204中,各超像素的图像特征的时间统计(包括稳定性)与超像素的标签编号和重心位置一起被登记作为背景模型。
“稳定性”是表示超像素在时间上的稳定性的程度的量。在运动图像中,照明、白平衡、噪声等改变。因此,即使位于帧图像之间的同一位置处的像素也具有不同的亮度和颜色。当运动图像的各帧图像被分割为超像素时,各超像素如下。如上所述,由于具有强边缘的物体边界与超像素的边界匹配,因此在帧图像之间,即使当超像素的颜色特征改变时,形状特征也几乎不改变。然而,在没有亮度或颜色适度变化的强边缘的区域(例如,不均匀照明的地毯地板)中,在帧图像之间,超像素的形状特征容易改变。这是因为各像素的亮度或颜色的轻微变化也影响超像素分割结果。结果,超像素中包括的颜色的比率也改变。即,当超像素变得不稳定,容易生成图像特征之间的差异,并且由于照明的变化可能发生检测错误。因此,稳定性由当暂时观察到超像素的图像特征时的变化程度表示。在本实施例中,将描述通过高斯模型近似计算与特定区域相对应的超像素中的图像特征的各元素的概率分布的方法,作为稳定性的获得方法。注意,为了便于描述,这里将关注一个超像素(超像素X),并且以同样的方式处理所有超像素。令Ft(n维)为第t帧的超像素X的特征向量,则概率密度函数η由下式给出。
η ( F t , μ t , Σ t ) 1 ( 2 π ) n 2 | Σ t | 1 2 e - 1 2 ( F t - μ t ) T Σ t - 1 ( F t - μ t ) . . . ( 1 )
注意,n是特征向量的维数,μt是直到第t帧的帧中的超像素X的特征向量的平均向量(n维),Σt是平均向量的协方差矩阵(n×n维)。下标t表示第t帧。如稍后所述,以帧为单位更新μt和Σt。注意,在本实施例中,由四维元素(即,超像素中作为颜色特征的RGB各分量的平均值和作为形状特征的面积)构成特征向量Ft。为了便于操作,假定特征向量Ft的各维数互相独立,颜色特征取同一值σc,t作为所有分量中的标准偏差,并且形状特征的标准偏差为σs,t
Σ t = σ c , t 2 0 0 0 0 σ c , t 2 0 0 0 0 σ c , t 2 0 0 0 0 σ s , t 2 . . . ( 2 )
σc,t和σs,t越小,超像素越稳定。因此,这些值被用作稳定性。在本实施例中,假定各超像素的背景模型包括超像素的平均向量μt、超像素中的图像特征的标准偏差σc,t和σs,t(稳定性)、以及超像素的标签编号和重心坐标。
将参照图4的流程图描述基于上述假定由邻近区域选择单元205进行的邻近区域的选择处理。注意,图4的流程图示出了帧图像中的一个超像素(关注超像素)的处理。实际上,针对帧图像中的各超像素执行根据图4的流程图的处理。
在步骤S401中,读出尚未从背景模型存储单元204中读出的超像素的重心位置。如上所述,各超像素的重心位置被登记在背景模型存储单元204中。因此,在该步骤中,读出尚未读出的重心位置。在图4的流程图中,每次执行步骤S401的处理时,例如以标签编号的升序读出一个相应的重心位置。
在步骤S402中,获得关注超像素与步骤S401中读出的重心位置之间的距离。这里,获得重心位置之间的欧几里得(Euclidean)距离。然而,例如,可以获得两个超像素的交叠面积与该两个超像素中的一个的面积的比率。
在步骤S403中,从背景模型存储单元204读出与在与步骤S401中读出的重心位置相同的背景模型中包括的稳定性。例如,当在步骤S401中读出具有标签编号=1的超像素的重心位置时,在步骤S403中读出具有标签编号=1的超像素的稳定性。
在步骤S404中,根据在步骤S403中读出的稳定性获得阈值。注意,稍后将描述根据稳定性获得阈值的方法和根据稳定性获得阈值的意义。
在步骤S405中,将在步骤S402中获得的距离与在步骤S404中获得的阈值进行比较。作为比较的结果,如果在步骤S402中获得的距离小于在步骤S404中获得的阈值,则处理前进到步骤S406。如果在步骤S402中获得的距离大于在步骤S404中获得的阈值,则处理前进到步骤S407。
在步骤S406中,将与在步骤S401中读出的重心位置相同的背景模型中包括的标签编号登记在图像处理装置的存储器(未示出)中。例如,当在步骤S401中读出具有标签编号=1的超像素的重心位置时,在步骤S406中将标签编号=1登记在存储器中。
这里,将参照图5A至图5C描述根据稳定性获得阈值的方法和根据稳定性获得阈值的意义。如果阈值与稳定性无关是固定的,则发生以下问题。假定具有重心位置503的超像素501和具有重心位置504的超像素502位于如图5A所示。超像素501在水平方向上具有非常短的宽度。假定在从图5A所示的状态偏移的摄像位置和方向处拍摄的帧图像是图5B所示的帧图像。此时,超像素501改变为超像素505,重心位置507从重心位置503稍微偏移。此外,超像素502改变为超像素506,重心位置508从重心位置504稍微偏移。
图5C示出了图5A和图5B交叠的状态。如果阈值固定,则能够设置具有重心位置503作为圆心和阈值作为半径的圆509以及具有重心位置504作为圆心和阈值作为半径的圆510。当选择超像素505作为关注超像素时,重心位置507位于圆510中,即位于距重心位置504阈值的距离以内。此时,在步骤S406中,将超像素502的标签编号登记在存储器中,作为接近于超像素505的超像素的标签编号。然而,将超像素501的标签编号登记在存储器中是原本正确的。如上所述,针对具有比阈值小的宽度的超像素,可能无法选择正确的超像素。
为了应付这种情况,使阈值变大,从更宽范围中选择与关注超像素相对应的超像素。然而,如果超像素不稳定,则与背景模型不对应的超像素可能偶然具有相似形状,从而导致检测错误。因此,使用形状特征的稳定性(标准偏差)σs,t,通过下式决定阈值T1。
T 1 = S + α · 1 σ s , t 2 . . . ( 3 )
这里,S为重心位置的平均间隔,α为预定阈值。令N为图像的总像素数,K为从一个图像分割的超像素数,通过S=√(N/K)能够获得S。超像素的形状越稳定,所提取的特征量越稳定。为此,即使当选择超像素时,特征比较单元206和物体区域输出单元207也能够进行正确确定。因此,稳定性越高,能够进行选择的范围越宽。在式(3)中形状越稳定,σs,t越小。为此,阈值变大,能够将更宽范围处理为邻近。然而,根据稳定性获得阈值的方法不限于以上方法,只要能够获得具有这种特性的阈值即可。
返回参照图4,在步骤S407中,确定背景模型存储单元204中存储的所有超像素的背景模型是否经历了步骤S401至步骤S406的处理。在确定在背景模型存储单元204中存储的所有超像素的背景模型经历了步骤S401至步骤S406的处理时,处理前进到步骤S305。另一方面,如果尚未经历步骤S401至步骤S406的处理的背景模型保留在背景模型存储单元204中存储的所有超像素的背景模型中,则处理返回到步骤S401。
当执行根据图4的流程图的处理时,能够将背景模型存储单元204中存储的超像素的背景模型当中的、位于关注超像素的邻近的超像素的背景模型中的标签编号登记在存储器中。
返回参照图3,接下来,在步骤S305中,特征比较单元206将从帧图像的各超像素获取的特征向量与和关于超像素的存储器中登记的标签编号相同的背景模型中包括的平均向量进行比较。
具体而言,如果针对帧图像中的关注超像素,同时满足以下式(4)和式(5),则确定关注超像素为背景。
对于颜色特征(i=1到3),
|Ft,it,i|<k·σc,t    ...(4)
对于形状特征(i=4),
|Ft,it,i|<l·σs,t    ...(5)
在不等式(4)和(5)中,Ft是帧图像的关注超像素的特征向量,μt是与关于关注超像素的存储器中登记的标签编号相同的背景模型中包括的平均向量。另外,i表示n维向量的第i维,k和l是预定常数。
如上所述,超像素越不稳定(σc,t和σs,t越大),越容易生成特征之间的差分。因此,如不等式(4)和(5)所示,根据σc,t和σs,t来获得阈值,以使得允许大的差分。这能够防止不稳定超像素引起的检测错误。
在本实施例中,将颜色特征和形状特征两者用作特征。如果仅使用颜色特征,并且具有类似于要检测的物体的超像素的颜色的超像素存在于背景上,则发生检测错误。例如,如果穿红色衬衫的人在红色花瓶的前面经过,则尽管形状明显不同,但是具有相似颜色的超像素被确定为背景。各超像素的形状反映物体的形状。因此,能够通过使用形状特征防止检测错误。注意,关于关注超像素,如果在存储器中登记了多个标签编号,则在多个标签编号当中,采用相同的背景模型中包括的标签编号,被作为距关注超像素的重心位置最小距离的重心位置。
当针对帧图像中的各超像素进行这种处理时,能够确定超像素是否为背景。
在步骤S306中,物体区域输出单元207生成并输出表示在帧图像的超像素中未被确定为背景的超像素的信息,即,被确定为包括物体的超像素。例如,针对帧图像的各像素,如果像素属于被确定为背景的超像素,则分配值“0”。如果像素属于未被确定为背景的超像素,则分配值“1”。根据分配给帧图像的像素的值形成的图像被输出作为掩模图像。在该掩模图像中,由分配了值“1”的像素形成的区域是尚未被确定为背景的超像素,即,被确定为包括物体的区域的超像素。
在步骤S307中,在背景模型存储单元204中登记的超像素的平均向量μt当中,特征更新单元208更新用于与帧图像中的被确定为背景的超像素的特征向量进行比较的平均向量μt。根据下式进行该更新。
μt=(1-ρ)μt-1+ρFt    ...(6)
式(1)的计算结果η的值用作ρ。例如,假定,关于被确定为帧图像的背景的超像素A,在步骤S304中,超像素P和超像素Q的标签编号被登记在存储器中,并且与超像素P的重心位置相比,超像素Q的重心位置更接近于超像素A的重心位置。在这种情况下,使用超像素A的特征向量来更新超像素Q的平均向量。注意,作为μt的初始值μt,从第一次输入的帧图像获取的特征向量被直接用作μt
在步骤S308中,稳定性计算单元209以超像素为单位计算表示图像特征相对于时间轴是否稳定的值作为稳定性。稳定性被计算作为以高斯模型表达的标准偏差σ,如上所述。在启动时赋予稳定性适当的初始值,并且根据下式(7)和(8)更新各帧的稳定性。
针对颜色特征(i=1到3),
σ c , t 2 = ( 1 - ρ ) σ c , t - 1 2 + ρ ( F t - μ t ) T ( F t - μ t ) . . . ( 7 )
针对形状特征(i=4),
σ s , t 2 = ( 1 - ρ ) σ s , t - 1 2 + ρ ( F t - μ t ) T ( F t - μ t ) . . . ( 8 )
注意,通过式(6)的更新结果用作μt。在第t帧中特征向量Ft与平均向量μt之间的差分(Ftt)是表示特征向量的稳定性的程度的量。即,如果小的差分继续,则特征向量被视为稳定。这反映在根据直到第(t-1)帧的特征向量计算出的σt-1上,从而获得在时间方向上表示特征向量的稳定性的σc,t和σs,t。式(1)的计算结果用作ρ。注意,σc,t和σs,t的初始值被设置为σc,t=0和σs,t=0。
如上所述,在本实施例中,视频输入获取的图像被分割为各自包括相似属性的像素的多个子区域(区域分割)。基于该属性从各分割的子区域提取特征(特征提取)。另一方面,预先存储根据所提取的特征形成的背景模型(背景模型存储)。将通过特征提取提取的特征与背景模型中的特征进行比较,从而针对各子区域确定所述子区域是否为背景(特征比较)。
利用这种结构,能够解决传统技术中由照相机的运动引起的问题。分割图像以抑制存储器消耗和处理成本。进行这种分割使得不是形状或颜色而是诸如包括的像素的颜色的属性在分割区域中为均一的(超像素分割)。因为基于同一属性提取特征量,即使发生画面偏移,物体边界附近的特征也不改变,所以能够避免检测错误。
另外,使用超像素边界处的形状特征,从而即使当超像素中的颜色特征在背景模型与输入图像之间相似时,也能够防止检测错误。通过引入超像素的稳定性并且根据稳定性在特征量比较时改变阈值或者改变邻近区域选择的范围,也能够解决由超像素的不稳定性引起的问题。
[第二实施例]
图2所示的功能单元可以被容纳在一个图像处理装置中。然而,一个或更多个功能单元也可以被包括在外部设备中。在这种情况下,图像处理装置需要经由网络连接到外部设备以可进行数据通信。当然,图2所示的功能单元可以被一起放在一个芯片上。
另外,如果图2所示的结构为包括用作背景模型存储单元204的存储器和处理器、以及能够执行使得处理器执行图2中的背景模型存储单元204以外的功能单元的功能的计算机程序的处理器的计算机,则其能够被用作具有图2所示的结构的图像处理装置。将参照图1的框图描述这种计算机的硬件结构的示例。注意,图1所示的结构仅为适用于第一实施例中描述的图像处理装置的计算机的示例,可以采用实施等于或大于第一实施例中描述的图像形成装置的功能的功能的任何其他结构。
CPU 101使用ROM 102或RAM 103中存储的计算机程序和数据,执行各种处理,从而控制计算机的操作。CPU 101还执行被说明作为第一实施例中描述的图像处理装置要执行的处理的各处理。
ROM 102存储计算机的设置数据、引导程序等。RAM 103包括存储从二次存储设备104加载的计算机程序和数据、从图像输入设备105输入的各帧的图像、以及经由网络I/F(接口)108从外部接收到的数据的区域。RAM 103还包括CPU 101用来执行各种处理的工作区域。即,RAM103能够适当地提供各种区域。
二次存储设备104是以硬盘驱动器为代表的大容量信息存储设备。二次存储设备104存储OS(操作系统)、计算机程序和数据,该计算机程序和数据被构造为使CPU 101实现图2中的背景模型存储单元204以外的功能单元的功能。该数据还包括在以上描述中被处理作为已知信息的信息。在CPU 101的控制下,二次存储设备104中存储的计算机程序和数据被适当地加载到RAM 103并且由CPU 101处理。注意,诸如在第一实施例中被描述为存储器的背景模型存储单元204的单元能够由RAM103或二次存储设备104构成。
图像输入设备105是被构造为将运动图像的各帧的图像输入到计算机的设备(例如,摄影机)。
输入设备106由键盘或鼠标构成,并且能够在计算机的用户操作时向CPU 101输入各种指令。
显示设备107由CRT或液晶画面构成,并且能够显示CPU 101的处理结果(例如图像或字符)。例如,能够显示图像输入设备105向计算机输入的各帧的图像或图像中的物体检测的结果。
网络I/F 108用于将计算机连接到诸如LAN或因特网的网络。计算机能够经由网络I/F 108与外部设备进行数据通信。当然,可以通过诸如流的技术从外部设备向计算机发送被说明作为图像输入设备105输入的图像的各帧的图像。在这种情况下,经由网络I/F 108将各帧的图像输入到计算机。所有上述单元连接到总线109。
其他实施例
本发明的实施例还可以通过读出并执行记录在存储介质(还可以全称为“非暂时性计算机可读存储介质”)上的用于执行一个或更多个上述实施例的功能的计算机可执行指令(例如,一个或更多个程序)、和/或包括用于执行一个或更多个上述实施例的功能的一个或更多个电路(例如,专用集成电路(ASIC))的系统或装置的计算机来实现,以及通过由系统或装置的计算机通过例如从存储介质读出并执行用于执行一个或更多个上述实施例的功能的计算机可执行指令、和/或控制一个或更多个电路来执行一个或更多个上述实施例的功能来执行的方法来实现。计算机可以包括一个或更多个处理器(例如,中央处理单元(CPU)、微处理单元(MPU)),并且可以包括读出并执行计算机可执行指令的独立的计算机或独立的计算机处理器的网络。计算机可执行指令可以例如从网络或存储介质被提供给计算机。存储介质可以包括例如硬盘、随机存取存储器(RAM)、只读存储器(ROM)、分布式计算系统的存储器、光盘(诸如压缩光盘(CD)、数字通用光盘(DVD)或蓝光光盘(BD)TM)、闪存设备、存储卡等中的一个或更多个。
本发明的实施例还可以通过如下的方法来实现,即,通过网络或者各种存储介质将执行上述实施例的功能的软件(程序)提供给系统或装置,该系统或装置的计算机或是中央处理单元(CPU)、微处理单元(MPU)读出并执行程序的方法。
虽然参照示例性实施例已经对本发明进行了描述,但是应当理解,本发明不限于所公开的示例性实施例。应当对所附权利要求的范围给予最宽的解释,以使其涵盖所有这些变型例以及等同的结构和功能。

Claims (11)

1.一种图像处理装置,所述图像处理装置包括:
视频输入单元;
区域分割单元,其被构造为将所述视频输入单元获取的图像分割为各自包括相似属性的像素的多个区域;
特征提取单元,其被构造为从所述区域分割单元分割的各个区域中提取特征;
背景模型存储单元,其被构造为预先存储由背景的特征生成的背景模型;以及
特征比较单元,其被构造为将所述特征提取单元提取的特征与所述背景模型中的特征进行比较,并且针对所述多个区域中的各个区域确定所述区域是否为背景。
2.根据权利要求1所述的图像处理装置,其中,所述属性包括颜色和亮度中的至少一者。
3.根据权利要求1所述的图像处理装置,其中,所述特征提取单元提取的特征包括所述区域的形状特征。
4.根据权利要求3所述的图像处理装置,其中,所述形状特征为具有不小于预定值的边缘强度的区域边界的长度与所述区域的边界的周长的比率。
5.根据权利要求3所述的图像处理装置,其中,所述形状特征包括所述区域的边界上的像素的像素位置、所述区域中的各个像素的像素位置、所述区域中的像素数以及所述区域的面积中的至少一者。
6.根据权利要求1所述的图像处理装置,其中,所述背景模型包括所述特征提取单元从背景的区域提取的特征的时间统计。
7.根据权利要求6所述的图像处理装置,所述图像处理装置还包括:
稳定性计算单元,其被构造为计算表示从所述区域提取的特征在时间上稳定的稳定性,
其中,所述背景模型的时间统计包括所述稳定性,并且
所述特征比较单元基于所述稳定性确定所述区域是否为物体区域。
8.根据权利要求7所述的图像处理装置,所述图像处理装置还包括:
选择单元,其被构造为基于所述稳定性,从所述视频输入单元获取的图像的区域的邻近,选择所述特征比较单元要比较的、所述背景模型中的区域。
9.根据权利要求8所述的图像处理装置,其中,所述选择单元基于所述稳定性设置所获取的图像的区域的邻近。
10.根据权利要求1所述的图像处理装置,所述图像处理装置还包括:
输出单元,其被构造为基于所述特征比较单元的确定结果输出物体区域。
11.一种图像处理装置进行的图像处理方法,所述图像处理方法包括:
区域分割步骤,将获取的图像分割为各自包括相似属性的像素的多个区域;
特征提取步骤,从在所述区域分割步骤中分割的各个区域中提取特征;以及
特征比较步骤,将在所述特征提取步骤中提取的特征与由背景的特征生成的背景模型中的特征进行比较,并且针对所述多个区域中的各个区域确定所述区域是否为背景。
CN201510146165.4A 2014-04-01 2015-03-30 图像处理装置及图像处理方法 Active CN104980622B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014-075716 2014-04-01
JP2014075716A JP6445775B2 (ja) 2014-04-01 2014-04-01 画像処理装置、画像処理方法

Publications (2)

Publication Number Publication Date
CN104980622A true CN104980622A (zh) 2015-10-14
CN104980622B CN104980622B (zh) 2019-01-18

Family

ID=52814773

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510146165.4A Active CN104980622B (zh) 2014-04-01 2015-03-30 图像处理装置及图像处理方法

Country Status (5)

Country Link
US (2) US9691155B2 (zh)
EP (1) EP2927873B1 (zh)
JP (1) JP6445775B2 (zh)
KR (1) KR101802146B1 (zh)
CN (1) CN104980622B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897965A (zh) * 2015-12-14 2017-06-27 国基电子(上海)有限公司 彩色图像处理系统及彩色图像处理方法

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7953277B2 (en) * 2006-09-05 2011-05-31 Williams Robert C Background separated images for print and on-line use
CN104346801B (zh) * 2013-08-02 2018-07-20 佳能株式会社 图像构图评估装置、信息处理装置及其方法
US10042048B1 (en) 2014-02-20 2018-08-07 National Technology & Engineering Solutions Of Sandia, Llc Superpixels for improved structure and terrain classification using multiple synthetic aperture radar image products
JP6445775B2 (ja) * 2014-04-01 2018-12-26 キヤノン株式会社 画像処理装置、画像処理方法
JP2016134803A (ja) 2015-01-20 2016-07-25 キヤノン株式会社 画像処理装置及び画像処理方法
US9389311B1 (en) * 2015-02-19 2016-07-12 Sandia Corporation Superpixel edges for boundary detection
JP6555906B2 (ja) 2015-03-05 2019-08-07 キヤノン株式会社 情報処理装置、情報処理方法、およびプログラム
WO2016181550A1 (ja) * 2015-05-14 2016-11-17 オリンパス株式会社 画像処理装置
JP6736270B2 (ja) * 2015-07-13 2020-08-05 キヤノン株式会社 画像処理装置及び画像処理装置の作動方法
JP6624877B2 (ja) 2015-10-15 2019-12-25 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
TWI599905B (zh) * 2016-05-23 2017-09-21 緯創資通股份有限公司 惡意碼的防護方法、系統及監控裝置
JP6508134B2 (ja) * 2016-06-14 2019-05-08 トヨタ自動車株式会社 物体判別装置
CN106373126B (zh) * 2016-09-04 2018-09-18 河北工业大学 基于融合类测地线和边界对比的图像显著性检测方法
JP6851163B2 (ja) 2016-09-23 2021-03-31 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
GB2565775A (en) * 2017-08-21 2019-02-27 Nokia Technologies Oy A Method, an apparatus and a computer program product for object detection
CN109598276A (zh) * 2017-09-30 2019-04-09 佳能株式会社 图像处理装置和方法及监控系统
CN109598741A (zh) * 2017-09-30 2019-04-09 佳能株式会社 图像处理装置和方法及监控系统
US11095814B2 (en) 2018-05-25 2021-08-17 Canon Kabushiki Kaisha Image processing apparatus and image processing method
JP7130488B2 (ja) * 2018-07-31 2022-09-05 グローリー株式会社 画像処理装置、画像処理方法、および、画像処理プログラム
CN109271538A (zh) * 2018-08-20 2019-01-25 深圳和而泰智能控制股份有限公司 一种图片存储方法及相关设备
US10733742B2 (en) * 2018-09-26 2020-08-04 International Business Machines Corporation Image labeling
CN109859236B (zh) * 2019-01-02 2021-04-23 广州大学 运动物体检测方法、系统、计算设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102637253A (zh) * 2011-12-30 2012-08-15 清华大学 基于视觉显著性和超像素分割的视频前景目标提取方法
US20120251003A1 (en) * 2011-03-23 2012-10-04 Kabushiki Kaisha Toshiba Image processing system and method
CN102722891A (zh) * 2012-06-12 2012-10-10 大连理工大学 一种图像显著度检测的方法
CN103413316A (zh) * 2013-08-24 2013-11-27 西安电子科技大学 基于超像素和优化策略的sar图像分割方法
CN103578119A (zh) * 2013-10-31 2014-02-12 苏州大学 基于超像素的Codebook动态场景中目标检测方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2950267B2 (ja) 1996-12-24 1999-09-20 日本電気株式会社 背景画像生成方法および背景画像生成装置
JP3504874B2 (ja) * 1998-12-22 2004-03-08 日本電信電話株式会社 文字領域判定方法および装置および記録媒体
AU2006252252B2 (en) 2006-12-22 2009-10-01 Canon Kabushiki Kaisha Image processing method and apparatus
JP4792069B2 (ja) * 2008-09-03 2011-10-12 株式会社日立製作所 画像認識装置
JP5036084B2 (ja) * 2010-10-14 2012-09-26 シャープ株式会社 映像処理装置、映像処理方法、及びプログラム
JP6445775B2 (ja) * 2014-04-01 2018-12-26 キヤノン株式会社 画像処理装置、画像処理方法
JP6482195B2 (ja) 2014-07-02 2019-03-13 キヤノン株式会社 画像認識装置、画像認識方法及びプログラム
JP2016134803A (ja) 2015-01-20 2016-07-25 キヤノン株式会社 画像処理装置及び画像処理方法
JP6525635B2 (ja) 2015-02-25 2019-06-05 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP6555906B2 (ja) 2015-03-05 2019-08-07 キヤノン株式会社 情報処理装置、情報処理方法、およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120251003A1 (en) * 2011-03-23 2012-10-04 Kabushiki Kaisha Toshiba Image processing system and method
CN102637253A (zh) * 2011-12-30 2012-08-15 清华大学 基于视觉显著性和超像素分割的视频前景目标提取方法
CN102722891A (zh) * 2012-06-12 2012-10-10 大连理工大学 一种图像显著度检测的方法
CN103413316A (zh) * 2013-08-24 2013-11-27 西安电子科技大学 基于超像素和优化策略的sar图像分割方法
CN103578119A (zh) * 2013-10-31 2014-02-12 苏州大学 基于超像素的Codebook动态场景中目标检测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897965A (zh) * 2015-12-14 2017-06-27 国基电子(上海)有限公司 彩色图像处理系统及彩色图像处理方法
CN106897965B (zh) * 2015-12-14 2020-04-28 国基电子(上海)有限公司 彩色图像处理系统及彩色图像处理方法

Also Published As

Publication number Publication date
EP2927873B1 (en) 2019-05-08
CN104980622B (zh) 2019-01-18
US10438361B2 (en) 2019-10-08
US9691155B2 (en) 2017-06-27
US20150279049A1 (en) 2015-10-01
JP2015197816A (ja) 2015-11-09
KR101802146B1 (ko) 2017-11-28
JP6445775B2 (ja) 2018-12-26
US20170263008A1 (en) 2017-09-14
KR20150114437A (ko) 2015-10-12
EP2927873A1 (en) 2015-10-07

Similar Documents

Publication Publication Date Title
CN104980622A (zh) 图像处理装置及图像处理方法
US9483835B2 (en) Depth value restoration method and system
US9646202B2 (en) Image processing system for cluttered scenes and method of operation thereof
JP5652436B2 (ja) 画像識別子抽出装置
US8805077B2 (en) Subject region detecting apparatus
US10089527B2 (en) Image-processing device, image-capturing device, and image-processing method
WO2013073167A1 (ja) 画像処理装置、撮像装置および画像処理方法
CN104408429A (zh) 一种视频代表帧提取方法及装置
CN109903265B (zh) 一种图像变化区域侦测阀值设定方法、系统及其电子装置
US20150071532A1 (en) Image processing device, computer-readable recording medium, and image processing method
CN110807110B (zh) 结合局部和全局特征的图片搜索方法、装置及电子设备
CN108875474A (zh) 评估人脸识别算法的方法、装置及计算机存储介质
US10089764B2 (en) Variable patch shape synthesis
CN105608673B (zh) 图像颜色量化与抖动方法和系统
JP5914046B2 (ja) 画像処理装置および画像処理方法
US8934710B2 (en) Image processing apparatus, image processing method, and computer-readable medium
JP5598487B2 (ja) 画像識別子抽出装置
JP6546385B2 (ja) 画像処理装置及びその制御方法、プログラム
JP2016081472A (ja) 画像処理装置、画像処理方法及びプログラム
US11301962B2 (en) Image processing method, image processing apparatus, and medium
JP2007257470A (ja) 類似判別装置および方法並びにプログラム
US20190057278A1 (en) Image processing device, image processing method, and computer program product
CN115965848B (zh) 一种图像处理方法和相关装置
JP2016115226A (ja) 特徴量抽出装置、認識装置、情報処理システム、特徴量抽出方法およびプログラム
JP2007257469A (ja) 類似判別装置および方法並びにプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant