CN104980622B - 图像处理装置及图像处理方法 - Google Patents

图像处理装置及图像处理方法 Download PDF

Info

Publication number
CN104980622B
CN104980622B CN201510146165.4A CN201510146165A CN104980622B CN 104980622 B CN104980622 B CN 104980622B CN 201510146165 A CN201510146165 A CN 201510146165A CN 104980622 B CN104980622 B CN 104980622B
Authority
CN
China
Prior art keywords
region
pixel
feature
unit
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510146165.4A
Other languages
English (en)
Other versions
CN104980622A (zh
Inventor
东条洋
矢野光太郎
图安·光·范
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN104980622A publication Critical patent/CN104980622A/zh
Application granted granted Critical
Publication of CN104980622B publication Critical patent/CN104980622B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/254Analysis of motion involving subtraction of images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30232Surveillance

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种图像处理装置及图像处理方法。所述图像处理装置包括:视频输入单元;区域分割单元,其被构造为将所述视频输入单元获取的图像分割为各自包括相似属性的像素的多个区域;特征提取单元,其被构造为从各个分割区域提取特征;背景模型存储单元,其被构造为预先存储由背景的特征生成的背景模型;以及特征比较单元,其被构造为将所提取的特征与所述背景模型中的特征进行比较,并且针对所述多个区域中的各个区域确定所述区域是否为背景。

Description

图像处理装置及图像处理方法
技术领域
本发明涉及图像处理装置及图像处理方法,具体地,涉及从运动图 像中检测物体的技术。
背景技术
作为从照相机拍摄的图像中检测物体的技术,公开了背景差分法。 在背景差分法中,固定的照相机来预先拍摄不具有任何被摄体的背景图 像,并且将该图像的特征存储为背景模型。之后,获得背景模型中的特 征与从照相机输入的图像中的特征之间的差分,并且不同的区域被检测 为前景(物体)。
例如,在专利文献1(特许第2950267号)中,使用像素值作为特征 生成背景模型,并且以像素单位计算差分,从而检测物体。当以像素单 位生成背景模型时,存储器消耗和处理成本随着分辨率上升而增加。为 了防止这种情况,在专利文献2(特许第4653155号)中,输入图像被分 割为8×8像素块,并且作为DCT(离散余弦变换)的编码结果的DCT 系数被用作特征。
然而,在背景差分法中,因为假定照相机要被固定,所以在照相机 由于振动等而移动的情况下出现以下问题。即,在即使在图像中没有任 何物体,照相机的运动也使输入图像偏移的情况下,同一坐标处的图像 内容在专利文献1的方法中时间上连续的输入图像之间改变。例如,在 红门与蓝墙之间的边界附近的像素中,像素值从红色突然地改变为蓝色。 另外,在专利文献2的方法中,在包括红门与蓝墙之间的边界的块中, 块中包括的红色像素与蓝色像素的比率改变。结果,在专利文献1的方 法和专利文献2的方法两者中,在背景中包括强边缘的边界附近发生检 测错误。
在专利文献1的方法中,因为仅同一像素值的像素的坐标偏移,所
发明内容
鉴于上述问题作出了本发明,本发明提供了用于在不增加存储器消 耗和处理成本的情况下实现避免由于摄像设备的运动引起输入图像的偏 移而发生的检测错误的技术。
根据本发明的第一方面,提供一种图像处理装置,所述图像处理装 置包括:视频输入单元;区域分割单元,其被构造为将所述视频输入单 元获取的图像分割为各自包括相似属性的像素的多个区域;特征提取单 元,其被构造为从所述区域分割单元分割的各个区域中提取特征;背景 模型存储单元,其被构造为预先存储由背景的特征生成的背景模型;以 及特征比较单元,其被构造为将所述特征提取单元提取的特征与所述背 景模型中的特征进行比较,并且针对所述多个区域中的各个区域确定所 述区域是否为背景。
根据本发明的第二方面,提供一种图像处理装置进行的图像处理方 法,所述图像处理方法包括:区域分割步骤,将获取的图像分割为各自 包括相似属性的像素的多个区域;特征提取步骤,从在所述区域分割步 骤中分割的各个区域中提取特征;以及特征比较步骤,将在所述特征提 取步骤中提取的特征与由背景的特征生成的背景模型中的特征进行比 较,并且针对所述多个区域中的各个区域确定所述区域是否为背景。
根据以下(参照附图)对示例性实施例的描述,本发明的其他特征 将变得清楚。
附图说明
图1是示出计算机的硬件结构的示例的框图;
图2是示出图像处理装置的功能结构的示例的框图;
图3是图像处理装置进行的处理的流程图;
图4是示出选择邻近区域的处理的详情的流程图;以及
图5A至图5C是用于说明根据稳定性获得阈值的方法以及根据稳定 性获得阈值的意义的图。
具体实施方式
现在将参照附图描述本发明的实施例。注意,以下要描述的实施例 是本发明的具体实施方式的示例或者是所附权利要求中描述的结构的具 体示例。
[第一实施例]
在本实施例中,将描述依次获得运动图像的各帧的图像并从所所获 取的图像中检测包括物体的区域的图像处理装置的模式。首先,将参照 图2的框图说明根据本实施例的图像处理装置的功能结构的示例。注意, 图2中所示的结构仅为示例,可以采用实现等于或大于图2中的功能的 任何其他结构。
视频输入单元201依次获取运动图像的各帧的图像(帧图像),并且 将所获取的帧图像发送到后段的区域分割单元202。可以从摄像机依次发 送各帧的图像,或者通过诸如流的技术从外部装置依次传送各帧的图像。
区域分割单元202将从视频输入单元201接收到的各帧图像分割为 相似图像特征(属性)的区域。特征提取单元203进行从区域分割单元 202分割的各区域提取图像特征的处理。邻近区域选择单元205从背景模 型存储单元204中存储的区域的信息中,读出区域分割单元202分割的 各区域的邻近区域的信息,并且将读出信息发送到特征比较单元206。
针对区域分割单元202分割的各区域,特征比较单元206将从该区 域提取的图像特征,与邻近区域选择单元205从背景模型存储单元204 读出的关于该区域的信息,进行比较。
根据特征比较单元206的比较结果,物体区域输出单元207在针对 帧图像分割的区域当中指定包括物体的区域,并且输出关于所指定的区 域的信息。
特征更新单元208和稳定性计算单元209更新背景模型存储单元204 中存储的背景模型。
接下来,将参照示出了根据本实施例的图像处理装置进行的从帧图 像提取包括物体的区域的处理的流程图的图3描述该处理。
在步骤S301中,视频输入单元201获取与一帧相对应的帧图像,并 且将所获取的帧图像发送到后段的区域分割单元202。
在步骤S302中,区域分割单元202将从视频输入单元201接收到的 帧图像分割为相似图像特征的区域。近年来,提出了将图像分割为子区 域(称为超像素(Superpixel))的方法,各子区域由具有相似图像特征(诸 如亮度或颜色)的像素组形成(例如,参照非专利文献1(Radhakrishna Achanta,Appu Shaji,Kevin Smith,Aurelien Lucchi,Pascal Fua,and Sabine Susstrunk,"SLIC Superpixels",EPFL Technical Report 149300,June2010) 和非特许文献2(Felzenszwalb,P.,Huttenlocher,D.,"Efficient graph-basedimage segmentation",International Journal of Computer Vision,2004))。
虽然超像素的大小几乎恒定(非专利文献1)或者主要依据图像的内 容而改变(非专利文献2),但是图像分割方法具有以下共同特性。即, 在超像素分割中,由于具有相似亮度或颜色的像素被放在一起,因此图 像在亮度或颜色大改变的强边缘部分被分割。在图像中包括的物体的边 界处观察到强边缘。因此,物体的边界附近的超像素的边界与物体的边界匹配。在本实施例中,使用这种超像素的特性。
在将帧图像分割为相似图像特征的区域(即,超像素)之后,区域 分割单元202将像素所属的超像素固有的标签编号分配给帧图像的各像 素,并且将该区域在帧图像中的重心位置登记在图像处理装置管理的存 储器中。
在步骤S303中,特征提取单元203从区域分割单元202分割的各超 像素中提取图像特征。当以超像素为单位提取图像特征时,即使当伴随 用于拍摄运动图像的摄像设备的运动,帧图像中发生偏移时,图像特征 也不改变。在上述红门与蓝墙之间的边界的示例中,即使当帧图像中发 生偏移时,超像素的边界也总存在于红门与蓝墙之间的边界处。为此,不从红色和蓝色混合的超像素中提取图像特征。因此,可以提取甚至在 物体边界附近的帧图像之间的恒定特征。
在本实施例中,作为要从超像素提取的图像特征,使用作为超像素 中的各像素的颜色分量的平均像素值(例如,针对R、G和B分量中的 各个分量的平均像素值)的颜色特征。可以以颜色分量为单位分割RGB 颜色空间等,并且可以生成超像素中的各像素的颜色值的直方图。颜色 空间并非特别限定于RGB颜色空间,可以使用YCbCr或CIE LAB颜色 空间。当然,一些其他值也可以用作颜色特征。
在本实施例中,作为要从超像素提取的图像特征,也使用作为定义 超像素的形状的信息的形状特征。“定义超像素的形状的信息”可以是例 如超像素的边界上的像素的像素位置、超像素中的各像素的像素位置、 或者超像素中的像素数(超像素的面积)。
作为另选方案,可以使用在具有预定边缘强度以上的区域边界上的 像素数与周长的比率,作为图像特征。如稍后所述,由强边缘包围的超 像素被认为是稳定的,因此,该边缘可以被视为具有超像素的形状的特 征。当各像素的像素位置被表达为(x,y)时的x坐标的二次矩和y坐 标的二次矩为xy矩,或者可以使用边界线的傅里叶描述子。
使用分配给帧图像的各像素的标签编号,特征提取单元203指定分 配了同一标签编号的像素组的区域,即超像素,并且从所指定的超像素 中提取图像特征(颜色特征和形状特征)。针对帧图像的各超像素,特征 提取单元203将从超像素中提取的n(n是整数,n≥2)个图像特征登记 在上述存储器中,作为n维特征向量(在以上示例中,由超像素中的各像素的颜色分量的平均像素值形成的4维向量和定义超像素的形状的信 息(在这种情况下为面积))。
在步骤S304的处理的说明之前,将描述背景模型存储单元204保持 的信息。在背景模型存储单元204中,各超像素的图像特征的时间统计 (包括稳定性)与超像素的标签编号和重心位置一起被登记作为背景模 型。
“稳定性”是表示超像素在时间上的稳定性的程度的量。在运动图 像中,照明、白平衡、噪声等改变。因此,即使位于帧图像之间的同一 位置处的像素也具有不同的亮度和颜色。当运动图像的各帧图像被分割 为超像素时,各超像素如下。如上所述,由于具有强边缘的物体边界与 超像素的边界匹配,因此在帧图像之间,即使当超像素的颜色特征改变时,形状特征也几乎不改变。然而,在没有亮度或颜色适度变化的强边 缘的区域(例如,不均匀照明的地毯地板)中,在帧图像之间,超像素 的形状特征容易改变。这是因为各像素的亮度或颜色的轻微变化也影响 超像素分割结果。结果,超像素中包括的颜色的比率也改变。即,当超 像素变得不稳定,容易生成图像特征之间的差异,并且由于照明的变化 可能发生检测错误。因此,稳定性由当暂时观察到超像素的图像特征时 的变化程度表示。在本实施例中,将描述通过高斯模型近似计算与特定 区域相对应的超像素中的图像特征的各元素的概率分布的方法,作为稳 定性的获得方法。注意,为了便于描述,这里将关注一个超像素(超像 素X),并且以同样的方式处理所有超像素。令Ft(n维)为第t帧的超 像素X的特征向量,则概率密度函数η由下式给出。
注意,n是特征向量的维数,μt是直到第t帧的帧中的超像素X的特 征向量的平均向量(n维),Σt是平均向量的协方差矩阵(n×n维)。 下标t表示第t帧。如稍后所述,以帧为单位更新μt和Σt。注意,在本实 施例中,由四维元素(即,超像素中作为颜色特征的RGB各分量的平均 值和作为形状特征的面积)构成特征向量Ft。为了便于操作,假定特征 向量Ft的各维数互相独立,颜色特征取同一值σc,t作为所有分量中的标准 偏差,并且形状特征的标准偏差为σs,t
σc,t和σs,t越小,超像素越稳定。因此,这些值被用作稳定性。在本实 施例中,假定各超像素的背景模型包括超像素的平均向量μt、超像素中的 图像特征的标准偏差σc,t和σs,t(稳定性)、以及超像素的标签编号和重心 坐标。
将参照图4的流程图描述基于上述假定由邻近区域选择单元205进 行的邻近区域的选择处理。注意,图4的流程图示出了帧图像中的一个 超像素(关注超像素)的处理。实际上,针对帧图像中的各超像素执行 根据图4的流程图的处理。
在步骤S401中,读出尚未从背景模型存储单元204中读出的超像素 的重心位置。如上所述,各超像素的重心位置被登记在背景模型存储单 元204中。因此,在该步骤中,读出尚未读出的重心位置。在图4的流 程图中,每次执行步骤S401的处理时,例如以标签编号的升序读出一个 相应的重心位置。
在步骤S402中,获得关注超像素的重心位置与步骤S401中 读出的重心位置之间的距离。这里,获得重心位置之间的欧几里得 (Euclidean)距离。然而,例如,可以获得两个超像素的交叠面积与该 两个超像素中的一个的面积的比率。
在步骤S403中,从背景模型存储单元204读出与在与步骤S401中 读出的重心位置相同的背景模型中包括的稳定性。例如,当在步骤S401 中读出具有标签编号=1的超像素的重心位置时,在步骤S403中读出具 有标签编号=1的超像素的稳定性。
在步骤S404中,根据在步骤S403中读出的稳定性获得阈值。注意, 稍后将描述根据稳定性获得阈值的方法和根据稳定性获得阈值的意义。
在步骤S405中,将在步骤S402中获得的距离与在步骤S404中获得 的阈值进行比较。作为比较的结果,如果在步骤S402中获得的距离小于 在步骤S404中获得的阈值,则处理前进到步骤S406。如果在步骤S402 中获得的距离大于在步骤S404中获得的阈值,则处理前进到步骤S407。
在步骤S406中,将与在步骤S401中读出的重心位置相同的背景模 型中包括的标签编号登记在图像处理装置的存储器(未示出)中。例如, 当在步骤S401中读出具有标签编号=1的超像素的重心位置时,在步骤 S406中将标签编号=1登记在存储器中。
这里,将参照图5A至图5C描述根据稳定性获得阈值的方法和根据 稳定性获得阈值的意义。如果阈值与稳定性无关是固定的,则发生以下 问题。假定具有重心位置503的超像素501和具有重心位置504的超像 素502位于如图5A所示。超像素501在水平方向上具有非常短的宽度。 假定在从图5A所示的状态偏移的摄像位置和方向处拍摄的帧图像是图 5B所示的帧图像。此时,超像素501改变为超像素505,重心位置507 从重心位置503稍微偏移。此外,超像素502改变为超像素506,重心位 置508从重心位置504稍微偏移。
图5C示出了图5A和图5B交叠的状态。如果阈值固定,则能够设 置具有重心位置503作为圆心和阈值作为半径的圆509以及具有重心位 置504作为圆心和阈值作为半径的圆510。当选择超像素505作为关注超 像素时,重心位置507位于圆510中,即位于距重心位置504阈值的距 离以内。此时,在步骤S406中,将超像素502的标签编号登记在存储器 中,作为接近于超像素505的超像素的标签编号。然而,将超像素501 的标签编号登记在存储器中是原本正确的。如上所述,针对具有比阈值 小的宽度的超像素,可能无法选择正确的超像素。
为了应付这种情况,使阈值变大,从更宽范围中选择与关注超像素 相对应的超像素。然而,如果超像素不稳定,则与背景模型不对应的超 像素可能偶然具有相似形状,从而导致检测错误。因此,使用形状特征 的稳定性(标准偏差)σs,t,通过下式决定阈值T1。
这里,S为重心位置的平均间隔,α为预定阈值。令N为图像的总 像素数,K为从一个图像分割的超像素数,通过S=√(N/K)能够获得S。 超像素的形状越稳定,所提取的特征量越稳定。为此,即使当选择超像 素时,特征比较单元206和物体区域输出单元207也能够进行正确确定。 因此,稳定性越高,能够进行选择的范围越宽。在式(3)中形状越稳定, σs,t越小。为此,阈值变大,能够将更宽范围处理为邻近。然而,根据稳 定性获得阈值的方法不限于以上方法,只要能够获得具有这种特性的阈 值即可。
返回参照图4,在步骤S407中,确定背景模型存储单元204中存储 的所有超像素的背景模型是否经历了步骤S401至步骤S406的处理。在 确定在背景模型存储单元204中存储的所有超像素的背景模型经历了步 骤S401至步骤S406的处理时,处理前进到步骤S305。另一方面,如果 尚未经历步骤S401至步骤S406的处理的背景模型保留在背景模型存储 单元204中存储的所有超像素的背景模型中,则处理返回到步骤S401。
当执行根据图4的流程图的处理时,能够将背景模型存储单元204 中存储的超像素的背景模型当中的、位于关注超像素的邻近的超像素的 背景模型中的标签编号登记在存储器中。
返回参照图3,接下来,在步骤S305中,特征比较单元206将从帧 图像的各超像素获取的特征向量与和关于超像素的存储器中登记的标签 编号相同的背景模型中包括的平均向量进行比较。
具体而言,如果针对帧图像中的关注超像素,同时满足以下式(4) 和式(5),则确定关注超像素为背景。
对于颜色特征(i=1到3),
|Ft,it,i|<k·σc,t ...(4)
对于形状特征(i=4),
|Ft,it,i|<l·σs,t ...(5)
在不等式(4)和(5)中,Ft是帧图像的关注超像素的特征向量,μt是与 关于关注超像素的存储器中登记的标签编号相同的背景模型中包括的平 均向量。另外,i表示n维向量的第i维,k和l是预定常数。
如上所述,超像素越不稳定(σc,t和σs,t越大),越容易生成特征之间 的差分。因此,如不等式(4)和(5)所示,根据σc,t和σs,t来获得阈值, 以使得允许大的差分。这能够防止不稳定超像素引起的检测错误。
在本实施例中,将颜色特征和形状特征两者用作特征。如果仅使用 颜色特征,并且具有类似于要检测的物体的超像素的颜色的超像素存在 于背景上,则发生检测错误。例如,如果穿红色衬衫的人在红色花瓶的 前面经过,则尽管形状明显不同,但是具有相似颜色的超像素被确定为 背景。各超像素的形状反映物体的形状。因此,能够通过使用形状特征 防止检测错误。注意,关于关注超像素,如果在存储器中登记了多个标 签编号,则在多个标签编号当中,采用相同的背景模型中包括的标签编 号,被作为距关注超像素的重心位置最小距离的重心位置。
当针对帧图像中的各超像素进行这种处理时,能够确定超像素是否 为背景。
在步骤S306中,物体区域输出单元207生成并输出表示在帧图像的 超像素中未被确定为背景的超像素的信息,即,被确定为包括物体的超 像素。例如,针对帧图像的各像素,如果像素属于被确定为背景的超像 素,则分配值“0”。如果像素属于未被确定为背景的超像素,则分配值 “1”。根据分配给帧图像的像素的值形成的图像被输出作为掩模图像。在该掩模图像中,由分配了值“1”的像素形成的区域是尚未被确定为背 景的超像素,即,被确定为包括物体的区域的超像素。
在步骤S307中,在背景模型存储单元204中登记的超像素的平均向 量μt当中,特征更新单元208更新用于与帧图像中的被确定为背景的超 像素的特征向量进行比较的平均向量μt。根据下式进行该更新。
μt=(1-ρ)μt-1+ρFt ...(6)
式(1)的计算结果η的值用作ρ。例如,假定,关于被确定为帧图像 的背景的超像素A,在步骤S304中,超像素P和超像素Q的标签编号被 登记在存储器中,并且与超像素P的重心位置相比,超像素Q的重心位 置更接近于超像素A的重心位置。在这种情况下,使用超像素A的特征 向量来更新超像素Q的平均向量。注意,作为μt的初始值μt,从第一次 输入的帧图像获取的特征向量被直接用作μt
在步骤S308中,稳定性计算单元209以超像素为单位计算表示图像 特征相对于时间轴是否稳定的值作为稳定性。稳定性被计算作为以高斯 模型表达的标准偏差σ,如上所述。在启动时赋予稳定性适当的初始值, 并且根据下式(7)和(8)更新各帧的稳定性。
针对颜色特征(i=1到3),
针对形状特征(i=4),
注意,通过式(6)的更新结果用作μt。在第t帧中特征向量Ft与平 均向量μt之间的差分(Ftt)是表示特征向量的稳定性的程度的量。即, 如果小的差分继续,则特征向量被视为稳定。这反映在根据直到第(t-1) 帧的特征向量计算出的σt-1上,从而获得在时间方向上表示特征向量的稳 定性的σc,t和σs,t。式(1)的计算结果用作ρ。注意,σc,t和σs,t的初始值被 设置为σc,t=0和σs,t=0。
如上所述,在本实施例中,视频输入获取的图像被分割为各自包括 相似属性的像素的多个子区域(区域分割)。基于该属性从各分割的子区 域提取特征(特征提取)。另一方面,预先存储根据所提取的特征形成的 背景模型(背景模型存储)。将通过特征提取提取的特征与背景模型中的 特征进行比较,从而针对各子区域确定所述子区域是否为背景(特征比 较)。
利用这种结构,能够解决传统技术中由照相机的运动引起的 问题。分割图像以抑制存储器消耗和处理成本。进行这种分割使得不是 形状或大小而是诸如包括的像素的颜色的属性在分割区域中为均一的 (超像素分割)。因为基于同一属性提取特征量,即使发生画面偏移,物 体边界附近的特征也不改变,所以能够避免检测错误。
另外,使用超像素边界处的形状特征,从而即使当超像素中的颜色 特征在背景模型与输入图像之间相似时,也能够防止检测错误。通过引 入超像素的稳定性并且根据稳定性在特征量比较时改变阈值或者改变邻 近区域选择的范围,也能够解决由超像素的不稳定性引起的问题。
[第二实施例]
图2所示的功能单元可以被容纳在一个图像处理装置中。然而,一 个或更多个功能单元也可以被包括在外部设备中。在这种情况下,图像 处理装置需要经由网络连接到外部设备以可进行数据通信。当然,图2 所示的功能单元可以被一起放在一个芯片上。
另外,如果图2所示的结构为包括用作背景模型存储单元204的存 储器和处理器、以及能够执行使得处理器执行图2中的背景模型存储单 元204以外的功能单元的功能的计算机程序的处理器的计算机,则其能 够被用作具有图2所示的结构的图像处理装置。将参照图1的框图描述 这种计算机的硬件结构的示例。注意,图1所示的结构仅为适用于第一实施例中描述的图像处理装置的计算机的示例,可以采用实施等于或大 于第一实施例中描述的图像形成装置的功能的功能的任何其他结构。
CPU 101使用ROM 102或RAM 103中存储的计算机程序和数据, 执行各种处理,从而控制计算机的操作。CPU 101还执行被说明作为第 一实施例中描述的图像处理装置要执行的处理的各处理。
ROM 102存储计算机的设置数据、引导程序等。RAM 103包括存储 从二次存储设备104加载的计算机程序和数据、从图像输入设备105输 入的各帧的图像、以及经由网络I/F(接口)108从外部接收到的数据的 区域。RAM 103还包括CPU 101用来执行各种处理的工作区域。即,RAM 103能够适当地提供各种区域。
二次存储设备104是以硬盘驱动器为代表的大容量信息存储设备。 二次存储设备104存储OS(操作系统)、计算机程序和数据,该计算机 程序和数据被构造为使CPU 101实现图2中的背景模型存储单元204以 外的功能单元的功能。该数据还包括在以上描述中被处理作为已知信息 的信息。在CPU 101的控制下,二次存储设备104中存储的计算机程序 和数据被适当地加载到RAM 103并且由CPU 101处理。注意,诸如在第 一实施例中被描述为存储器的背景模型存储单元204的单元能够由RAM 103或二次存储设备104构成。
图像输入设备105是被构造为将运动图像的各帧的图像输入到计算 机的设备(例如,摄影机)。
输入设备106由键盘或鼠标构成,并且能够在计算机的用户操作时 向CPU 101输入各种指令。
显示设备107由CRT或液晶画面构成,并且能够显示CPU 101的处 理结果(例如图像或字符)。例如,能够显示图像输入设备105向计算机 输入的各帧的图像或图像中的物体检测的结果。
网络I/F 108用于将计算机连接到诸如LAN或因特网的网络。计算 机能够经由网络I/F 108与外部设备进行数据通信。当然,可以通过诸如 流的技术从外部设备向计算机发送被说明作为图像输入设备105输入的 图像的各帧的图像。在这种情况下,经由网络I/F108将各帧的图像输入 到计算机。所有上述单元连接到总线109。
其他实施例
本发明的实施例还可以通过读出并执行记录在存储介质(还可以全 称为“非暂时性计算机可读存储介质”)上的用于执行一个或更多个上述 实施例的功能的计算机可执行指令(例如,一个或更多个程序)、和/或包 括用于执行一个或更多个上述实施例的功能的一个或更多个电路(例如, 专用集成电路(ASIC))的系统或装置的计算机来实现,以及通过由系统 或装置的计算机通过例如从存储介质读出并执行用于执行一个或更多个 上述实施例的功能的计算机可执行指令、和/或控制一个或更多个电路来 执行一个或更多个上述实施例的功能来执行的方法来实现。计算机可以 包括一个或更多个处理器(例如,中央处理单元(CPU)、微处理单元 (MPU)),并且可以包括读出并执行计算机可执行指令的独立的计算机 或独立的计算机处理器的网络。计算机可执行指令可以例如从网络或存 储介质被提供给计算机。存储介质可以包括例如硬盘、随机存取存储器 (RAM)、只读存储器(ROM)、分布式计算系统的存储器、光盘(诸如 压缩光盘(CD)、数字通用光盘(DVD)或蓝光光盘(BD)TM)、闪存 设备、存储卡等中的一个或更多个。
本发明的实施例还可以通过如下的方法来实现,即,通过网络或者 各种存储介质将执行上述实施例的功能的软件(程序)提供给系统或装 置,该系统或装置的计算机或是中央处理单元(CPU)、微处理单元(MPU) 读出并执行程序的方法。
虽然参照示例性实施例已经对本发明进行了描述,但是应当理解, 本发明不限于所公开的示例性实施例。应当对所附权利要求的范围给予 最宽的解释,以使其涵盖所有这些变型例以及等同的结构和功能。

Claims (9)

1.一种图像处理装置,所述图像处理装置包括:
视频输入单元;
区域分割单元,其被构造为将所述视频输入单元获取的图像分割为各自包括相似属性的像素的多个区域;
特征提取单元,其被构造为从所述区域分割单元分割的各个区域中提取特征;
背景模型存储单元,其被构造为预先存储由背景的特征生成的背景模型,其中,所述背景模型包括表示从所述区域提取的特征在时间上稳定的稳定性;
选择单元,其被构造为基于所述稳定性,从所述视频输入单元获取的图像的区域的邻近,选择所述背景模型中的区域;以及
特征比较单元,其被构造为将所述特征提取单元提取的特征与所述背景模型中的所选择的区域的特征进行比较,并且针对所述多个区域中的各个区域确定所述区域是否为背景。
2.根据权利要求1所述的图像处理装置,其中,所述属性包括颜色和亮度中的至少一者。
3.根据权利要求1所述的图像处理装置,其中,所述特征提取单元提取的特征包括所述区域的形状特征。
4.根据权利要求3所述的图像处理装置,其中,所述形状特征为具有不小于预定值的边缘强度的区域边界的长度与所述区域的边界的周长的比率。
5.根据权利要求3所述的图像处理装置,其中,所述形状特征包括所述区域的边界上的像素的像素位置、所述区域中的各个像素的像素位置、所述区域中的像素数以及所述区域的面积中的至少一者。
6.根据权利要求1所述的图像处理装置,所述图像处理装置还包括:
稳定性计算单元,其被构造为计算表示从所述区域提取的特征在时间上稳定的稳定性,并且
所述背景模型存储单元基于所计算出的稳定性更新所述背景模型。
7.根据权利要求6所述的图像处理装置,其中,所述选择单元基于所述稳定性设置所获取的图像的区域的邻近。
8.根据权利要求1所述的图像处理装置,所述图像处理装置还包括:
输出单元,其被构造为基于所述特征比较单元的确定结果输出物体区域。
9.一种图像处理装置进行的图像处理方法,所述图像处理方法包括:
将获取的图像分割为各自包括相似属性的像素的多个区域;
从在所述分割中分割的各个区域中提取特征;
预先存储由背景的特征生成的背景模型,其中,所述背景模型包括表示从所述区域提取的特征在时间上稳定的稳定性;
基于所述稳定性,从所述获取的图像的区域的邻近,选择所述背景模型中的区域;以及
将在所述提取中提取的特征与由背景的特征生成的背景模型中的所选择的区域的特征进行比较,并且针对所述多个区域中的各个区域确定所述区域是否为背景。
CN201510146165.4A 2014-04-01 2015-03-30 图像处理装置及图像处理方法 Active CN104980622B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014-075716 2014-04-01
JP2014075716A JP6445775B2 (ja) 2014-04-01 2014-04-01 画像処理装置、画像処理方法

Publications (2)

Publication Number Publication Date
CN104980622A CN104980622A (zh) 2015-10-14
CN104980622B true CN104980622B (zh) 2019-01-18

Family

ID=52814773

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510146165.4A Active CN104980622B (zh) 2014-04-01 2015-03-30 图像处理装置及图像处理方法

Country Status (5)

Country Link
US (2) US9691155B2 (zh)
EP (1) EP2927873B1 (zh)
JP (1) JP6445775B2 (zh)
KR (1) KR101802146B1 (zh)
CN (1) CN104980622B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7953277B2 (en) * 2006-09-05 2011-05-31 Williams Robert C Background separated images for print and on-line use
CN104346801B (zh) * 2013-08-02 2018-07-20 佳能株式会社 图像构图评估装置、信息处理装置及其方法
US10042048B1 (en) 2014-02-20 2018-08-07 National Technology & Engineering Solutions Of Sandia, Llc Superpixels for improved structure and terrain classification using multiple synthetic aperture radar image products
JP6445775B2 (ja) * 2014-04-01 2018-12-26 キヤノン株式会社 画像処理装置、画像処理方法
JP2016134803A (ja) 2015-01-20 2016-07-25 キヤノン株式会社 画像処理装置及び画像処理方法
US9389311B1 (en) * 2015-02-19 2016-07-12 Sandia Corporation Superpixel edges for boundary detection
JP6555906B2 (ja) 2015-03-05 2019-08-07 キヤノン株式会社 情報処理装置、情報処理方法、およびプログラム
WO2016181550A1 (ja) * 2015-05-14 2016-11-17 オリンパス株式会社 画像処理装置
JP6736270B2 (ja) * 2015-07-13 2020-08-05 キヤノン株式会社 画像処理装置及び画像処理装置の作動方法
JP6624877B2 (ja) 2015-10-15 2019-12-25 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
CN106897965B (zh) * 2015-12-14 2020-04-28 国基电子(上海)有限公司 彩色图像处理系统及彩色图像处理方法
TWI599905B (zh) * 2016-05-23 2017-09-21 緯創資通股份有限公司 惡意碼的防護方法、系統及監控裝置
JP6508134B2 (ja) * 2016-06-14 2019-05-08 トヨタ自動車株式会社 物体判別装置
CN106373126B (zh) * 2016-09-04 2018-09-18 河北工业大学 基于融合类测地线和边界对比的图像显著性检测方法
JP6851163B2 (ja) 2016-09-23 2021-03-31 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
GB2565775A (en) * 2017-08-21 2019-02-27 Nokia Technologies Oy A Method, an apparatus and a computer program product for object detection
CN109598276A (zh) * 2017-09-30 2019-04-09 佳能株式会社 图像处理装置和方法及监控系统
CN109598741A (zh) * 2017-09-30 2019-04-09 佳能株式会社 图像处理装置和方法及监控系统
US11095814B2 (en) 2018-05-25 2021-08-17 Canon Kabushiki Kaisha Image processing apparatus and image processing method
JP7130488B2 (ja) * 2018-07-31 2022-09-05 グローリー株式会社 画像処理装置、画像処理方法、および、画像処理プログラム
CN109271538A (zh) * 2018-08-20 2019-01-25 深圳和而泰智能控制股份有限公司 一种图片存储方法及相关设备
US10733742B2 (en) * 2018-09-26 2020-08-04 International Business Machines Corporation Image labeling
CN109859236B (zh) * 2019-01-02 2021-04-23 广州大学 运动物体检测方法、系统、计算设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102637253A (zh) * 2011-12-30 2012-08-15 清华大学 基于视觉显著性和超像素分割的视频前景目标提取方法
CN102722891A (zh) * 2012-06-12 2012-10-10 大连理工大学 一种图像显著度检测的方法
CN103413316A (zh) * 2013-08-24 2013-11-27 西安电子科技大学 基于超像素和优化策略的sar图像分割方法
CN103578119A (zh) * 2013-10-31 2014-02-12 苏州大学 基于超像素的Codebook动态场景中目标检测方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2950267B2 (ja) 1996-12-24 1999-09-20 日本電気株式会社 背景画像生成方法および背景画像生成装置
JP3504874B2 (ja) * 1998-12-22 2004-03-08 日本電信電話株式会社 文字領域判定方法および装置および記録媒体
AU2006252252B2 (en) 2006-12-22 2009-10-01 Canon Kabushiki Kaisha Image processing method and apparatus
JP4792069B2 (ja) * 2008-09-03 2011-10-12 株式会社日立製作所 画像認識装置
JP5036084B2 (ja) * 2010-10-14 2012-09-26 シャープ株式会社 映像処理装置、映像処理方法、及びプログラム
GB2489272B (en) * 2011-03-23 2013-03-13 Toshiba Res Europ Ltd An image processing system and method
JP6445775B2 (ja) * 2014-04-01 2018-12-26 キヤノン株式会社 画像処理装置、画像処理方法
JP6482195B2 (ja) 2014-07-02 2019-03-13 キヤノン株式会社 画像認識装置、画像認識方法及びプログラム
JP2016134803A (ja) 2015-01-20 2016-07-25 キヤノン株式会社 画像処理装置及び画像処理方法
JP6525635B2 (ja) 2015-02-25 2019-06-05 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP6555906B2 (ja) 2015-03-05 2019-08-07 キヤノン株式会社 情報処理装置、情報処理方法、およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102637253A (zh) * 2011-12-30 2012-08-15 清华大学 基于视觉显著性和超像素分割的视频前景目标提取方法
CN102722891A (zh) * 2012-06-12 2012-10-10 大连理工大学 一种图像显著度检测的方法
CN103413316A (zh) * 2013-08-24 2013-11-27 西安电子科技大学 基于超像素和优化策略的sar图像分割方法
CN103578119A (zh) * 2013-10-31 2014-02-12 苏州大学 基于超像素的Codebook动态场景中目标检测方法

Also Published As

Publication number Publication date
EP2927873B1 (en) 2019-05-08
US10438361B2 (en) 2019-10-08
US9691155B2 (en) 2017-06-27
US20150279049A1 (en) 2015-10-01
JP2015197816A (ja) 2015-11-09
KR101802146B1 (ko) 2017-11-28
CN104980622A (zh) 2015-10-14
JP6445775B2 (ja) 2018-12-26
US20170263008A1 (en) 2017-09-14
KR20150114437A (ko) 2015-10-12
EP2927873A1 (en) 2015-10-07

Similar Documents

Publication Publication Date Title
CN104980622B (zh) 图像处理装置及图像处理方法
US9727775B2 (en) Method and system of curved object recognition using image matching for image processing
US8983200B2 (en) Object segmentation at a self-checkout
JP5923713B2 (ja) 画像処理装置、撮像装置および画像処理方法
US10089527B2 (en) Image-processing device, image-capturing device, and image-processing method
US20140010439A1 (en) Method for detecting a predefined set of characteristic points of a face
Gallo et al. Locally non-rigid registration for mobile HDR photography
CN102428497B (zh) 判定三维形状一致的方法以及装置
US9401027B2 (en) Method and apparatus for scene segmentation from focal stack images
EP1971967A1 (en) Average calculation in color space, particularly for segmentation of video sequences
CN113902641B (zh) 一种基于红外图像的数据中心热区判别方法及系统
CN108647264A (zh) 一种基于支持向量机的图像自动标注方法及装置
CN108965646A (zh) 图像处理装置、图像处理方法和存储介质
Suryawibawa et al. Herbs recognition based on android using opencv
JP7014005B2 (ja) 画像処理装置及び方法、電子機器
JP5914046B2 (ja) 画像処理装置および画像処理方法
JP2020017276A (ja) 適応的三次元空間生成方法及びそのシステム
CN110533673A (zh) 一种信息获取方法、装置、终端及介质
JP2018022416A (ja) 顔方向推定装置及びそのプログラム
CN108062741B (zh) 双目图像处理方法、成像装置和电子设备
Gibson et al. Hazy image modeling using color ellipsoids
Veeravasarapu et al. Fast and fully automated video colorization
CN110599517A (zh) 一种基于局部特征和全局hsv特征组合的目标特征描述方法
CN107193816B (zh) 一种图像搜索方法、虚拟人物图像获取方法及装置
Ivanov et al. Methods of distinguishing contours and describing key points when comparing color images

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant