CN101960490A - 图像处理方法和图像处理设备 - Google Patents

图像处理方法和图像处理设备 Download PDF

Info

Publication number
CN101960490A
CN101960490A CN2008801275678A CN200880127567A CN101960490A CN 101960490 A CN101960490 A CN 101960490A CN 2008801275678 A CN2008801275678 A CN 2008801275678A CN 200880127567 A CN200880127567 A CN 200880127567A CN 101960490 A CN101960490 A CN 101960490A
Authority
CN
China
Prior art keywords
motion
distance
image
block
mrow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2008801275678A
Other languages
English (en)
Other versions
CN101960490B (zh
Inventor
岩崎正宏
A·塔亚南坦
R·奇波拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN101960490A publication Critical patent/CN101960490A/zh
Application granted granted Critical
Publication of CN101960490B publication Critical patent/CN101960490B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/215Motion-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

提供了一种对包括具有变形的诸如移动的人的对象的图像鲁棒地执行分割的图像处理设备。所述图像处理设备包括:图像输入单元(101),其接收时间上连续的图像;运动分析单元(102),其使用至少两个时间上不同的图像计算块的运动,并基于所述块的所述运动,计算所述时间上连续的图像中的所述块的时间运动轨迹;距离计算单元(103),其使用由所述运动分析单元计算的块i的时间运动轨迹和不同于所述块i的块的时间运动轨迹计算表示所述块的所述运动的相似性的距离;以及非线性空间处理单元(104),其将所述距离计算单元计算的所述距离投影到非线性空间并对所述非线性空间的所述投影的结果执行分割。

Description

图像处理方法和图像处理设备
技术领域
本发明涉及图像处理设备,并且具体地,涉及基于图像中的块运动来对包括具有变形的诸如移动的人的对象的图像执行分割以探测对象的设备,每个块由一个或多个像素构成。
背景技术
通过组合一种用于从图像提取物理对象的候选区域的方法和一种用于将预先准备的物理对象模型应用于物理对象的提取的候选区域的方法,存在一种可用的方法,用于提取物理对象的候选区域的方法是用于探测具有变形的诸如移动的人的对象并对包括对象的图像执行分割的技术。例如,专利文献1公开了用于从图像提取诸如人的物理对象的轮廓图像作为物理对象的候选区域并将用于物理对象的模型应用于所提取的轮廓图像,该物理对象的区域被基于有关物理对象的知识预先参数化。以此方式,因为参数化的模型能够被施加于具有变形的诸如移动的人的对象,所以探测对象并对对象的区域执行分割变得可能。
此外,非专利文献1公开了一种方法,该方法用于利用其中从多个角度捕获了固定对象的图像作为输入来计算每个图像中的像素值数据和其它图像中的像素值数据之间的距离,并利用距离作为输入执行非线性维数缩减以容许从类似角度捕获的图像被投影,使得它们在二维空间中相隔短的距离。这里,与诸如常规主成分分析(PCA)的线性维数缩减方法相比,其表明缩减至更低的维数是可能的,并且处理非线性分布的数据也是可能的。
专利文献1:日本特许公开NO.8-214289。
非专利文献1:Joshua Tenenbaum,Vin de Silva,John Langford,“A Global Geometric Framework for Nonlinear Dimensionality Reduction”,Science,VOL290,PP.2319-2322,2000年12月22日。
然而,对于上述专利文献1的技术,存在如下问题:在诸如人的对象来来往往的场景中,特别是在街上等,鲁棒地探测对象并对对象执行分割是不可能的。如上述,上述专利文献1描绘的图像处理方法要求从图像提取每个物理对象的候选区域。当不能正确地提取物理对象的候选区域时,精确地施加其中物理对象被参数化的模型至物理对象的候选区域变得不可能。特别是,难以正确地提取拥挤场景中物理对象的候选区域。此外,甚至在能够正确地提取物理对象的候选区域时,也存在如下问题。在特别是诸如人的有关节的对象是物理对象的情况下,因为物理对象的各种姿势引起的图像上的外观的变化非常大,所以参数化物理对象模型需要大量参数。这不仅引起计算量的增加,而且也会引起应用模型中的错误。从而,难以鲁棒地探测对象并对对象执行分割。
另一方面,非专利文献1描绘的图像处理方法,以像素之间的距离作为输入执行非线性处理,以便将图像数据投影到有效地缩减的低维数空间中。以此方式,预期具有抗噪性(noise resistance)。然而,非专利文献1的主要目的是将图像投影到低维数空间中,以便可视化图像之间的相似性,而没有公开用于鲁棒地探测对象并对应于具有变形的诸如人的具有关节的对象的各种姿势变化对对象执行分割的方法。
从而,本发明的目的是提供能够鲁棒地对包括具有其变形的诸如移动的人的对象的图像执行分割的图像处理方法和图像处理设备。
发明内容
为了解决以上问题,本发明的特征在于一种图像处理方法,所述方法用于基于图像中的块的运动来对包括形状发生变化的对象的图像执行分割,每个所述块由一个或多个像素构成,所述方法包括:图像接收步骤,接收时间上连续的图像;运动分析步骤,使用至少两个时间上不同的图像计算所述块的所述运动,并基于所述块的所述运动,计算所述时间上连续的图像中的所述块的时间运动轨迹;距离计算步骤,使用在所述运动分析步骤中计算的块i的时间运动轨迹和不同于所述块i的块的时间运动轨迹计算表示所述块的所述运动的相似性的距离;以及非线性空间处理步骤,将在所述距离计算步骤中计算的所述距离投影到非线性空间并在所述非线性空间对所述投影的结果执行所述分割。
应当注意,本发明不仅能够实现为上述图像处理方法,而且能够实现为包括上述每一步的图像处理设备、使得计算机执行上述每一步的程序、存储了该程序的诸如CD-ROM的计算机可读记录介质等。
上述方法和设备能够探测具有变形的诸如移动的人的对象并能够对区域执行分割。此外,使用探测和分割的结果来预测对象的运动等也是可能的。
附图说明
附图中:
图1是示出根据本发明的第一实施例的图像处理设备的基本结构的图示;
图2是示出根据本发明的第一实施例的图像处理设备的基本操作的流程图;
图3是示出根据本发明的第一实施例的运动分析单元的处理范例的图示;
图4是示出根据本发明的第一实施例的非线性空间处理单元的效果的概念图示;
图5是示出根据本发明的第一实施例的非线性空间处理单元的效果的范例的图示;
图6是示出根据本发明的第一实施例的非线性空间处理单元执行的维数缩减的范例的图示;
图7是示出根据本发明的第一实施例的非线性空间处理单元执行的探测和分割的范例的图示;
图8是示出根据本发明的第一实施例的第一修改例的非线性空间处理单元执行的探测和分割的范例的图示;
图9是示出根据本发明的第一实施例的第二修改例的图像处理设备的基本操作的流程图;
图10是示出根据本发明的第一实施例的第二修改例的非线性空间处理单元执行的探测和分割的范例的图示;
图11是示出根据本发明的第一实施例的第三修改例的图像处理设备的结构范例的图示;
图12是示出根据本发明的第一实施例的第四修改例的图像处理设备的结构范例的图示;
图13是示出根据本发明的第二实施例的图像处理设备的结构范例的图示;
图14是示出根据本发明的第二实施例的图像处理设备的基本操作的流程图;
图15是示出根据本发明的第三实施例的图像处理设备的结构的图示;
图16是示出根据本发明的第三实施例的图像处理设备的基本操作的流程图;
图17是示出根据本发明的第三实施例的运动预测的范例的图示。
101图像输入单元
102运动分析单元
103、103a距离计算单元
104、104a非线性空间处理单元
1001图像显示单元
1101分割区域记录和传输单元
1201对象运动预测单元
具体实施方式
本发明的一个实施例是一种图像处理方法,所述方法用于基于图像中的块的运动来对包括形状发生变化的对象的图像执行分割,每个所述块由一个或多个像素构成,所述方法包括:图像接收步骤,接收时间上连续的图像;运动分析步骤,使用至少两个时间上不同的图像计算所述块的所述运动,并基于所述块的所述运动,计算所述时间上连续的图像中的所述块的时间运动轨迹;距离计算步骤,使用在所述运动分析步骤中计算的块i的时间运动轨迹和不同于所述块i的块的时间运动轨迹计算表示所述块的所述运动的相似性的距离;以及非线性空间处理步骤,将在所述距离计算步骤中计算的所述距离投影到非线性空间并在所述非线性空间对所述投影的结果执行所述分割。基于所述块的所述运动,对具有变形的诸如移动的人的对象执行所述分割,这使得确保探测到图像中的所述对象。
本发明的更优选的实施例是,在所述距离计算步骤中,使用至少两个距离函数针对所述距离函数的每一个计算两个或更多距离,将所述距离的每一个投影到分别不同的非线性空间,并且通过整合所述投影的结果来执行所述分割。使用距离函数和非线性空间容许对图像进行更高精度的分割。
本发明的更优选的实施例是,在所述距离计算步骤中,针对包括在所述图像中的块计算距离,每个所述距离都表示两个块的运动的相似性,以及在所述非线性空间处理步骤中,将分别的距离非线性化,对所非线性化的距离进行维数缩减,以便将其投影到非线性空间,且通过获得具有关于投影到所述非线性空间的所述距离的相似性的一个或多个分割区域来执行所述分割。这样,鲁棒地探测具有变形的诸如特别是移动的人的对象并同时对对象执行分割是可能的。
本发明的更优选的实施例是,在所述非线性空间处理步骤中,通过将欧几里德距离转换成测地距离来执行所述非线性化。这样,鲁棒地探测具有变形的诸如特别是移动的人的对象并同时对对象执行分割是可能的。
本发明的更优选的实施例是,在所述非线性空间处理步骤中,通过计算所非线性化的距离的本征向量来执行所述维数缩减。容许像素运动的评估的错误使得能够鲁棒地探测具有变形的诸如移动的人的对象并同时对对象执行分割。
本发明的更优选的实施例是,在所述非线性空间处理步骤中,在通过将除最靠近所述块i的N个距离外的距离无限化来执行所述非线性化后,执行所述维数缩减。因为所选择的距离和未选择的距离成非线性关系,所以高效和高精度地缩减诸如人的具有关节的对象的运动变得可能。
本发明的更优选的实施例是,在所述非线性空间处理步骤中,在通过将至所述块i的距离中大于阈值的距离无限化来执行所述非线性化后,执行所述维数缩减。因为所选择的距离和未选择的距离成非线性关系,所以高效和高精度地缩减诸如人的具有关节的对象的运动变得可能。
本发明的更优选的实施例是,在所述非线性空间处理步骤中,在通过将至所述块i的距离乘以包括非线性函数的指数函数来执行所述非线性化后,执行所述维数缩减。因为所选择的距离和未选择的距离是成线性关系,所以高效和高精度地缩减诸如人的具有关节的对象的运动变得可能。
本发明的更优选的实施例是,在所述运动分析步骤中,计算二维运动向量和仿射参数之一作为所述块的所述运动。利用运动向量或仿射参数分析块的运动使得能够计算块的时间运动轨迹。
本发明的更优选的实施例是,在所述距离计算步骤中,除所述块的所述运动的所述相似性外,还计算包括所述图像上的块之间的距离和所述图像上的块之间的角度的至少之一的距离。这样,有效地捕获形状随绕接合处旋转的旋转运动发生变化的诸如人的移动物体的运动是可能的。
本发明的一个实施例是,所述图像处理方法包括图像显示步骤,在所述图像接收步骤中接收的所述图像上显示在所述非线性空间执行的所述分割的结果。图像上的被执行了分割的显示区域能够应用于运动中的式样改革、康复中的行走校正等。
本发明的一个实施例是,在所述非线性空间处理步骤中,基于在所述非线性空间执行的所述分割的结果来探测在所述图像接收步骤中接收的所述图像中包括的至少两个不同的移动物体。非线性空间中的探测容许鲁棒地探测移动物体。
本发明的一个实施例是,所述图像处理方法还包括对象运动预测步骤,基于在所述非线性空间执行的所述分割的结果,根据通过所述分割获得的每个分割中包括的块的时间运动轨迹计算典型轨迹,并根据所述典型轨迹来预测对象的运动。通过使用块的时间运动轨迹中的典型轨迹来预测对象的运动,高抗噪性的运动预测变得可能。
本发明的一个实施例是,所述图像处理方法还包括记录和传输步骤,基于在所述非线性空间执行的所述分割的结果来识别在所述图像接收步骤中接收的所述图像上的分割,以及记录或传输对应于所识别的分割的结果。单独保持包括在图像中的探测的对象的分别的分割使得能够从分割中选择所需的分割、使得所需的分割被记录、并输出至外部。结果,有效地记录和输出分割作为图形元件变得可能。因此,在将分割记录于并传输至诸如移动电话的具有有限处理能力的装置的情况下,其能够有效地操作。
以下参照附图描述本发明的实施例。
(第一实施例)
图1是示出根据本发明的第一实施例的图像处理设备的结构的图示。图1中所示的图像处理设备是能够基于图像中的块的运动对包括具有变形的诸如移动的人的对象的图像鲁棒地执行分割以确切地探测图像中的对象的图像处理设备,其中每个块由一个或多个像素构成,所述图像处理设备包括:图像输入单元101;运动分析单元102;距离计算单元103;以及非线性空间处理单元104。
图像输入单元101是接收时间上连续的图像并且例如为摄像机或连接至摄像机的通信接口的处理单元。
运动分析单元102是使用从图像输入单元101接收的图像中选出的至少两个时间上不同的图像来计算块的运动,并基于计算的时间上连续的图像中块的运动来追踪块的运动的处理单元。
距离计算单元103是使用运动分析单元102计算的块i的时间运动轨迹(temporal motion trajectory)和块i以外的块的时间运动轨迹来计算包括块的运动的相似性的距离,以捕获移动对象的变形的处理单元。例如,在使用N个块的时间运动轨迹的情况下,待计算的距离为N×N的距离矩阵。这里,通过计算距离而将其运动改变块之间的距离的对象表述为距离矩阵是可能的,该运动尤其是具有变形的如具有关节的对象的诸如移动的人的对象的运动,每一距离都评估块的运动的相似性。如上述,本说明书中的“距离”不仅是二维空间中两点之间的距离,而且包括多维数据之间的数学距离,且为单个值或一组值(距离矩阵)。
非线性空间处理单元104为首先对距离计算单元103计算的距离矩阵执行非线性处理,然后将距离计算单元103计算的距离矩阵投影到缩减的空间中(即,非线性空间),并在缩减的非线性空间执行探测和分割的处理单元。特别是,因为通过非线性处理和维数缩减的效果,非线性空间处理单元104能够更正确地将具有变形的如具有关节的对象的移动物体的形状信息缩减至低维数空间,所以非线性处理单元104能够探测图像中的对象并以低的计算量鲁棒地对图像执行分割。
应当注意到,可以通过诸如在计算机中执行的程序的软件或诸如电路的硬件来实现包括在图像处理设备中的每个部件(图像输入单元101、运动分析单元102、距离计算单元103、以及非线性空间处理单元104),该计算机具有CPU、RAM、ROM、通信接口、I/O端口、硬盘、显示器等。以下,这同样适应于根据其它实施例的图像处理设备。
关于本发明的图像处理方法,以下使用图2中所示的流程图详细描述探测对象并对对象执行分割的范例。
首先,第一步骤S201中,图像输入单元101接收输入图像。
接下来,步骤S202中,运动分析单元102使用至少两个输入图像计算块的运动。应当注意到,这里作为计算块的运动的范例,计算像素的运动。以下,在本实施例中,作为逐块处理的范例,将描述逐像素处理。在执行其中块由像素构成的逐块处理的情况下,通过将对应于多个块的像素的数据求和或通过计算多个块的平均值来获得对应于块的数据(典型值),并且可以以与逐像素处理中相同的方式使用获得的典型值来执行处理。
首先,将描述通过光流(optical flow)计算来计算像素的运动的范例。非专利文献2或非专利文献3能够用于根据光流计算来计算运动向量。
非专利文献2:P.Anandan,“A Computational Framework and an Algorithm for the Measurement of Visual Motion”,International Journal of Computer Vision,Vol.2,PP.283-310,1989。
非专利文献3:Vladimir Kolmogorov and Ramin Zabih,“Computing Visual Correspondence With Occlusions Via Graph Cuts”,International Conference on Computer Vision,2001。
例如,当假定在步骤S201中输入T个图像,使用在时间t和时间t+1输入的图像估计像素i的运动向量
Figure BPA00001211555100081
这里,输入的图像不必是时间上连续的,并且例如,可以使用在时间t和时间t+1输入的图像计算像素的运动。注意n是等于或大于1的整数。此外,除运动向量外,仿射参数可以估计为像素的运动。此时,可以获得关于所有像素的运动信息。此外,在期望以较高速度执行处理的情况下,将图像划分成网格并且仅可以获得网格上的具有规则间隔的像素的运动信息,或者如上述,将图像划分成块,并且可以以逐块为基础获得运动信息。此外,在使用非专利文献2计算运动向量的情况下,因为能够计算其可靠程度,所以仅可以使用具有高可靠程度的运动信息的像素。此外,在使用非专利文献3计算运动向量的情况下,能够估计遮挡(occlusion)。从而,仅可以使用未被遮挡的像素的运动信息。
此外,替代基于块的平移移动的假设来计算运动向量的方法,可以使用基于块的仿射变换的假设来计算运动向量的方法作为计算像素的运动的方法。非专利文献4能够用于基于仿射变换的假设来计算运动向量的方法。
非专利文献4:Jianbo Shi和Carlo Tomosi,“Good Features to Track”,IEEE Conference on Computer Vision and Pattern Recognition,PP.593-600,1994。
以上方法估计仿射参数A’,其相当于与分别在时间t和时间t+1输入的图像的像素i相邻的运动。关于像素i,时间t和时间t+1的图像上的像素位置
Figure BPA00001211555100091
Figure BPA00001211555100092
具有如下关系:
x t + 1 i = A t i x t i 等式1
以上方法能够针对特别是旋转对象以比使用基于平移移动的假设来计算运动向量的方法的情况更高的精度估计像素i的运动。
接下来,在步骤S203中,运动分析单元102使用在步骤S202中计算的运动信息,针对时间上连续的图像,根据像素i的运动来计算像素i的时间运动轨迹。如图3中所示,使用在步骤S202中根据时间t的输入图像301的像素i 303的运动计算的运动信息302来追踪像素i的运动。使用像素i通过时的时间t时图像上的像素位置
Figure BPA00001211555100094
按以下等式来计算像素i的时间运动轨迹:
x i = ( x 1 i , y 1 i , . . . , x t i , y t i , . . . , x T i , y T i ) 等式2
其中,T是用于计算时间运动轨迹的图像的数目。
接下来,在步骤S204中,距离计算单元103使用按等式2计算的像素i的时间运动轨迹来计算包括像素的运动的相似性的距离矩阵。能够按以下等式来计算像素i和像素j之间的线性距离f(i,j):
f ( i , j ) = mean ij + w · var ij 等式3
其中,w是加权因子且是设计者设定的参数。此外,如下表述meanij和varij
mean ij = 1 T Σ t = 1 T d ij t 等式4
var ij = 1 T Σ t = 1 T ( d ij t - mean ij ) 2 等式5
其中
d ij t = ( x t i - x t j ) 2 + ( y t i - y t j ) 2 等式6
如上述,如等式3所示,除等式4所示的像素之间的距离的时间平均值外,使等式5所示的像素之间的距离的时间波动成分为线性距离f(i,j)的要素。特别是,等式5所示的像素之间的距离的波动成分指示像素的运动的相似性,并且这使得不仅能够捕获其中像素之间的距离关系不变的刚性体,而且能够捕获由具有关节的对象等引起的变形。
接下来,在步骤S205中,非线性空间处理单元104对按等式2计算的线性距离f(i,j)执行如下非线性处理:
Figure BPA00001211555100103
等式7
其中,在注意力集中于像素i时,根据至像素i的线性距离按升序选择K个像素j,至所选择的像素j的距离不发生改变,而至未选择的像素j的距离改变为无穷大。这里,虽然按升序选择线性距离,但是也可以按以下关系设定阈值TH:
Figure BPA00001211555100104
等式8
此外,可以使用指数函数按以下等式将线性距离非线性化:
g ( i , j ) = exp ( - f ( i , j ) σ ) 等式9
其中,σ由设计者给定。
接下来,在以下等式中使用非线性化距离g(i,j)将距离更新。
关于距离的非线性化,其不限于以上函数,且能够对像素i和像素j之间的距离执行非线性转换的任何情况都是可接受的。
接下来,如下计算测地距离:
gnew(i,j)=min(g(i,j),g(i,k)+g(k,j))      等式10
注意min(x,y)是返回值x和值y之间的较小值的函数。
这里,将参照图4(a)-(c)的概念图示描述等式7至10所示的非线性处理。虽然于此描述了等式8,但是能够预期执行其它非线性处理带来相同效果。首先,图4的左图示(a)示出了二维数据分布。这里分别的数据点相当于等式3所示的像素i的时间运动轨迹。在不执行等式7至10所示的非线性处理的情况下,如图4的中心图(b)中所示,数据点i和数据点j之间的距离变得比数据点i和数据点k之间的距离小。然而,如图4的右图(c)中所示,例如,当执行等式8和10所示的处理时,数据点i和数据点j之间的距离不是欧几里德距离而是称作测地距离的距离,遍及该距离,箭头追踪数据点。结果,与使用欧几里德距离的情况不同,并且数据点i和数据点j之间的距离变得比数据点i和数据点k之间的距离大。
接下来,将参照图5(a)和(b)所示的概念图示描述执行等式7至10所示的非线性处理的有效性。这里,为了描述清楚地描述线性距离f(i,j)和非线性距离gnew(i,j)之间的差异,如等式6所示,使用时间t时像素之间的距离作为范例。实际上,除像素之间的距离外,如等式3所示,在使用像素之间的距离的波动成分作为像素的运动的相似性时,不仅能够捕获具有关节的对象等的形状,而且能够捕获其变形。图5(a)示出了不执行等式7至10所示的处理的范例。例如,头的像素i 402和手的像素j 403之间的距离是线性距离401所示的距离。另一方面,当执行等式7至10所示的非线性处理时,如图5(b)中所示,头的像素i 402和手的像素j 403之间的距离是经由像素k 404至像素j追踪的箭头所示的线性和。因此,诸如人的具有关节的对象的形状不能以线性距离401表述,而相反,其使得可以将关节的形状表述为距离。应当注意,计算测地距离的方法不限于等式10。
接下来,在步骤S206中,非线性空间处理单元104对步骤S205中计算的非线性化距离矩阵执行维数缩减。通过在执行Young-Householder变换后获得本征系统,能够实现维数缩减。这是将多维空间中分布的数据有效地投影到低维空间中的方法,并且能够针对输入数据噪声表述鲁棒的数据(这里,相当于在使用等式2计算像素i的时间运动轨迹时,像素i的运动信息中包括误差的情况)。
换句话说,非线性距离矩阵表述为:
G={gnew(i,j)}    等式11
且如下执行Young-Householder变换,其中,等式11中的G被中心矩阵H在两边相乘。距离矩阵包括点之间的距离,而相反,这是变换至具有重力中心作为原点的距离矩阵。
τ ( G ) = HG ( 2 ) H 2 等式12
注意H是中心矩阵,且如下表述:
Hij=(I-1/N)            等式13
i是单位矩阵,且N是等式2所示的像素i的时间运动轨迹的数目。
此外,
G(2)={gnew(i,j)2}     等式14
接下来,为执行维数缩减,计算对应于τ(G)的p个本征向量ep和对应于τ(G)的本征值λp
以此方式,基于等式10,当进行如下等式15的假设时,将
Figure BPA00001211555100122
投影到维数缩减空间的结果能够按如下等式16表述为数据
Figure BPA00001211555100123
g new i = ( g new ( i , 0 ) , g new ( i , 1 ) , . . . , g hew ( i , N ) ) 等式15
z p i = λ p e p i 等式16
注意为
Figure BPA00001211555100126
为第p个本征向量ep的第i个元。p为本征向量的数目,其可以根据待使用的场景来实验地确定,或在根据本征值λp如下计算贡献比ap后基于贡献比来确定:
a p = Σ p = 1 p λ p Σ p = 1 N λ p 等式17
p是待使用的本征向量的数目,即缩减的空间的维数的数目。N是所有本征向量的数目。从而,在贡献比ap等于或大于恒定值时,p可以是本征向量的数目。
如上述,利用等式2至16所示的处理,能够将等式2所示的像素i的时间运动轨迹与通过本征向量ep维数缩减为非线性的空间中的数据关联。
图6示出了其中人正在行走的图像被输入的情况下,将被维数待缩减为非线性的像素i的时间运动轨迹投影到空间中的结果。水平轴为本征向量e1,且竖直轴为本征向量e2。二维投影的点
Figure BPA00001211555100131
Figure BPA00001211555100132
投影。这里,因为非线性空间中的数据
Figure BPA00001211555100133
和像素i的时间运动轨迹xi为一一对应关系,所以能够认为对应于像素i的时间运动轨迹xi。应当注意,虽然非线性空间的维数数目为二维以可视化结果,如上述,但是其不必是二维的,并且以更多数目的维数以更高精度投影数据是可能的。
接下来,在步骤S207中,非线性空间处理单元104探测对象并通过将在步骤S206中投影到缩减的非线性空间中的数据进行群集来对对象执行分割,如图6中所示。
首先,分割区域表述为:
θ={θ1,...,θm...,θM}      等式18
其中,M是分割区域的数目并根据待使用的场景经验地确定。
每个分割区域θm由参数
Figure BPA00001211555100135
Zm表述。这里,是缩减的非线性空间中的属于分割θm的数据的坐标的平均值,且Zm是关于属于分割θm的数据的坐标的方差矩阵。
Figure BPA00001211555100137
的初始值可以随机确定,或者可以将通过将缩减的非线性空间划分成网格而获得的交点的坐标设定为初始值。
注意
Figure BPA00001211555100138
Zm能够如下表述:
z m ‾ = z 1 m ‾ · · · z p m ‾ 等式19
Z m = 1 C m Σ c m = 1 C m z 1 c m - z 1 m ‾ · · · z p c m - z p m ‾ z 1 c m - z 1 m ‾ · · · z p c m - z p m ‾ 等式20
其中,Cm是缩减的非线性空间中属于分割区域θm的数据的数目。
以下描述具体计算方法。首先,使用以下距离函数获得缩减的非线性空间中的数据zi所属的分割区域θm
Figure BPA00001211555100141
等式21
其中,ψm(zi)示出了非线性空间中对应于像素i的时间运动轨迹和每个分割θm的数据zi之间的距离。每个数据属于分割区域θm,其中ψm(zi)是最小值。注意
Figure BPA00001211555100142
是Mahalanobis距离,且:
Figure BPA00001211555100143
等式22
此外,可以用于代替ψm(zi)。
此外,p(ωm)可以是恒定值,且在对诸如人的常规对象执行分割的情况下,可以基于躯体区域的形状、面积比等对其进行设定。ωm是用于分割区域θm的加权因子。
接下来,基于等式21计算的结果,使用属于分割区域θm的数据zi如下更新分割区域θm的参数
Figure BPA00001211555100145
Zm
z m ‾ = Σ c m = 1 C M ω c m z c m Σ c m = 1 C m ω c m 等式23
Z m = Σ c mk = 1 C m ω c m 2 ( z c m - z m ‾ ) ( z c m - z m ‾ ) t Σ c m = 1 C m ω c m 2 等式24
其中是属于缩减的非线性空间中的分割区域θm的数据。此外,可以接受ω=1或者可以依赖于与输入数据的平均值的偏离调整ω。如上述,将使用等式21至24进行距离计算和参数更新重复固定次数,容许获得非线性空间中的每个数据所属的分割区域θm。应当注意,除以上外,可以使用诸如k-mean法和竞争学习法的其它群集方法。图7(a)和(b)示出了对非线性空间中的数据执行分割的范例,其中,假定M=9,且使用其中人正在走动的图像作为输入。当在图像上看到缩减的非线性空间中的分割区域θ1至θ9的分别的对应关系时,θ1对应于人的头,θ2对应于上躯干,θ3对应于手臂,θ4对应于下躯干,θ5和θ7对应于大腿,以及θ6和θ8对应于小腿。注意θ9对应于背景的部分。
这里,如图7(b)中的箭头所示,对应于缩减的非线性空间中的分割区域的不仅是一个图像上的区域,而且是在时间上连续的图像上对像素进行追踪的结果。即,执行缩减的非线性空间中的分割,容许探测图像中的对象(对象的区域)和包括对象的图像的分割作为时间上追踪在图像中移动的物体的区域的结果。此外,因为不必设定人的候选区域作为预处理,不存在由探测人的候选区域时的错误引起的分割中的失败。如上述,无需拟合大量参数,非线性空间中的群集容许对包括具有变形的移动的人的图像的分割,使得能够鲁棒地探测图像中的对象。
(第一实施例的第一修改例)
接下来,将描述一个范例作为第一实施例的第一修改例,其中根据第一实施例执行非线性空间中的分割以探测对象。在第一实施例中,描述了用于对图像中的人的区域执行分割的方法,其中图像中的人正在走动。如图1中所示,本图像处理设备包括图像输入单元101、运动分析单元102、距离计算单元103、以及非线性空间处理单元104。因为其结构与第一实施例中的相同,因此这里不对其结构进行描述。在第一修改例中,将描述通过与第一实施例中相同的方法改变参数来探测对象的方法。具体地,将使用等式7时的k值或使用等式8时的TH值设定为比在使用等式7或等式8来对区域执行分割时的值大。
图8示出了缩减的非线性空间中的分割的结果的范例,其中,假定M=2,且使用其中人正在走动且自行车正运行的图像作为输入。将描述缩减的非线性空间中分割区域θ1和θ2的对应关系。分割区域θ1对应于图像上自行车的运动,且分割区域θ2对应于图像上人的走动。如上述,在低维缩减空间执行分割容许简单并鲁棒地单独探测(即分割)自行车的运动和人的运动。
应当注意,如等式2所示,因为这里不使用无运动像素的时间运动轨迹作为输入,仅两个移动的具有关节的实体,即走动的人和自行车,被投影到非线性空间中。理所当然,无运动像素的时间运动轨迹可以用作输入。这里,对应于如第一实施例中的缩减的非线性空间中的分割区域的不仅是一个图像上的区域,而且是在时间上连续的图像上对像素进行追踪的结果。即,执行缩减的非线性空间中的分割,容许探测每个物体作为时间上追踪在图像中移动的物体的区域的结果。此外,因为不必设定人的候选区域作为预处理,不存在由探测人的候选区域时的错误引起的分割中的失败。如上述,部分改变参数容许移动对象的鲁棒的探测和分割。
(第一实施例的第二修改例)
接下来,将描述在不同于第一实施例的非线性空间中实现分割的方法作为第一实施例的第二修改例。如图1中所示,本图像处理设备包括图像输入单元101、运动分析单元102、距离计算单元103、以及非线性空间处理单元104。因为其结构与第一实施例中的相同,所以这里不对其结构进行描述。在第二修改例中,非线性空间处理单元104以不同于第一实施例的方法执行非线性空间中的分割。这里将描述一种方法,利用该方法,非线性空间处理单元基于非专利文献5中公开的方法执行非线性空间中的处理。
非专利文献5:Arik Azran,Zoubin Ghahramani,“A new Approach to Data Driven Clustering”,International Conference on Machine Learning,2006。
图9是示出根据本发明的第一实施例的第二修改例的处理的流程图。因为步骤S201至S206与第一实施例中相同,所以这里不对它们进行描述。
在步骤S801中,非线性空间处理单元104对非线性化距离g(i,j)执行以下归一化(normalization)处理,其中,已经对该非线性化距离执行了等式7至10所示的任何处理。
G ij = g ( i , j ) Σ j = 1 N g ( i , j ) 等式25
其中,N是等式2所示的像素i的时间运动轨迹的数目。且其中G描绘数据之间的相似性。接下来,对归一化G执行以下计算:
Ω=Gt                   等式26
作为执行此计算的结果,在Gij是小值的情况下,即数据之间的相似性小,其变为更小的值,而在Gij为大值的情况下,其变为更大值。换句话说,具有高相似性的数据之间的距离变得占主要地位。这容许鲁棒地执行以下处理。
关于t,例如,准备矩阵Ωr,诸如Ω1=Gt1、...Ωr=Gtr...ΩR=GtR(注意t1<tr<tR),并且期望从步骤S802至步骤S803单独执行每个Ωr的计算。此外,因为非专利文献4中描述了高速执行等式26的计算的方法,所以可以使用该方法。
接下来,在步骤S802中,非线性空间处理单元104设定群集Qm的初始值以执行用于执行分割的群集。这里群集数目为M。这里群集数目M设定为使得,R设定得越大,则值M变得越小。
首先,如下确定第一群集的初始值:
Q 1 = 1 N Σ i = 1 N Ω i 等式27
其中,Ωi是矩阵Ω中的第i行向量。这里如等式15中,Ωi对应于等式2所示的像素i的时间运动轨迹。接下来,如等式28所示,从用于N个Ωi的每一个的群集Q1至Qm-1中选择最小距离的群集,于是选择群集为最小距离时为Ωi中的最大距离的Ωarg max_min,且如下地将第一群集后的群集的初始值设定为新群集的初始值。对从m=2至M重复此操作。
Qm=Ωarg max_max           等式28
此处理是设定为属于群集的数据中的最大距离的数据作为新群集的初始值的处理,并容许群集的初始值更广泛地分布,使得能够防止归因于群集在一个点的集中而不能正确执行群集数据分布的问题。
注意,使用KL散度如下计算群集Qm和Ωi之间的距离,该距离用于计算群集Q1至Qm-1中的最小距离。
Jmn=KL(Ωn‖Qm)             等式29
如上述,能够确定群集Q1至Qm的初始值。
接下来,在步骤S803中,非线性空间处理单元104对N个Ωi的每一个执行群集,使用如等式29中的KL散度确定N个Ωi所属的群集Q1至Qm。这里,在KL散度为最小值时,每Ωi个属于群集Qm
接下来,非线性空间处理单元104使用对N个Ωi进行群集的结果按以下等式更新群集Qm
Q m new = 1 C m Σ c m = 1 C m Ω c m 等式30
其中,
Figure BPA00001211555100182
是属于群集Qm的Ωi,且Cm是属于群集Qm的Ωi的数目。将步骤S803重复固定次数,以确定Ωi属于哪个群集Qm。应当注意Ωi和像素i的时间运轨迹xi是一一对应关系。也就是说,因为在确定Ωi所属的群集Qm时,Ωi对应于等式2所示的像素i的时间运动轨迹,所以应当对像素i的时间运轨迹xi执行分割。
将参照图10(a)至(c)描述范例,其中,假定群集号M=9、M=5、以及M=2,在非线性空间中分别针对r=t1、t2、t3(注意t1<t2<t3)产生Ωr和对的数据Ωi执行分割。在r=t3且M=2的情况下分割的结果是数据被分割成人的不包括一边的手臂区域的区域和其它区域。此外,在r=t2且M=5的情况下,数据被分割成作为一个区域的头区域和躯干区域以及分别的腿区。此外,在r=t3且M=9的情况下,获得了与图7(a)和(b)中相同的探测和分割结果。以此方式,本修改例的优点是以复数准备Ωr容许在不同水平执行分割。
应当注意,数据没有分割到一边的手臂区域中的原因是,由于追踪像素时发生了遮挡,包括在手臂区域中的像素i的时间运动轨迹(等式2)没有用作输入。此外,对应于如第一实施例中的每个分割区域的不仅是一个图像上的区域而且是在时间上连续的图像上对像素追踪的结果。也就是说,作为对在图像中移动的具有关节的实体的区域时间上追踪的结果,在缩减的非线性空间执行分割容许进行探测和分割。此外,因为不必设定人的候选区域作为预处理,不存在探测人的候选区域时的错误引起的分割中的失败。
此外,虽然与第一实施例不同,在本实施例中,由维数缩减引起的加速的效果小,但是因为相同方法能够用于如图10(a)至(c)中所示的粗分割和细分割,所以存在的优点是,能够如第一实施例和第一实施例的第一修改例所示,同时执行对人的探测和对人的区域的分割。如上述,探测具有变形的诸如移动的人的对象并对区域执行分割是可能的。
(第一实施例的第三修改例)
接下来,将描述根据本发明的第一实施例的第三修改例的图像处理设备。这里,将描述范例,其中,增加了用于显示第一实施例中探测对象并对区域执行分割的结果作为图像的功能。如图11中所示,将图像显示单元1001增加至根据第三修改例的该图像处理设备,该图像处理设备包括图像输入单元101、运动分析单元102、以及非线性空间处理单元104,并且因此,图像处理设备能够在监视器等上显示分割的区域作为图像。
如图7(b)中所示,图像显示单元1001通过色彩将图像上的对应于分割区域θm的分割区域分开,容许分别区别分割的区域,并在监视器等上显示它们。理所当然,可以不同地显示每个区域。这里,等式2所示的像素i的时间运动轨迹对应于任何分割区域θm。因此,在基于属于分割区域θm的像素i的时间运动轨迹选择图像上的像素并基于分割区域数目m执行色彩编码时,容易显示图像上的分割区域。
(第一实施例的第四修改例)
接下来,将描述根据本发明的第一实施例的第四修改例的图像处理设备。这里,将描述范例,其中,增加了用于针对每个分割区域记录和传输第一实施例中探测对象并对区域执行分割的结果的功能。如图12中所示,通过增加分割区域记录和传输单元1101,能够实现根据第四修改例的该图像处理设备,该图像处理设备包括图像输入单元101、运动分析单元102、以及非线性空间处理单元104。
类似于图像显示的情况,作为分割的结果,分割区域记录和传输单元1101根据分割区域数目m单独记录并传输图像。此外,通过如下对属于每个分割的运动信息进行平均能够缩减运动信息。虽然,通常有必要给每个像素保存运动信息,但是当执行以下处理时,仅需要给一个分割保存一条运动信息。例如,当像素的运动向量
Figure BPA00001211555100191
用作运动信息时,能够如下计算对每个分割进行了平均的运动信息。
u t m = 1 C m Σ c m = 1 C m u t c m 等式31
v t m = 1 C m Σ c m = 1 C m v t c m 等式32
其中,Cm是属于分割区域θm的像素的数目或像素的时间运动轨迹的数目。
Figure BPA00001211555100201
Figure BPA00001211555100202
分别是属于分割区域θm的像素的运动向量。
应当注意,在使用仿射运动缩减运动信息的情况下,代替等式31和32,可以计算像素位置的平均值,其中,基于仿射运动将像素移动至该像素位置。如上述,记录并传输分割区域同时缩减像素的运动信息是可能的。
(第二实施例)
接下来,将描述使用两个或更多距离函数实现更高精度的探测和分割的方法作为第二实施例。如图13中所示,图像处理设备包括图像输入单元101、运动分析单元102、距离计算单元103a、以及非线性空间处理单元104a。图像输入单元101和运动分析单元102与第一实施例中的相同,这里不对它们进行描述。
虽然距离计算单元103a和非线性空间处理单元104a各基本与第一实施例的距离计算单元103和非线性空间处理单元104具有相同功能,但是有一点与第一实施例不同,即距离计算单元103a和非线性空间处理单元104a使用了附加参数以执行更高精度的处理。以下主要描述与第一实施例不同的点。
距离计算单元103a使用用于图像上的像素间的距离和距离波动的距离函数和用于像素间的角度和角度波动的距离函数来计算每个距离函数的距离矩阵。
在将距离计算单元103a计算的两个距离矩阵投影到分别不同的非线性空间后,非线性空间处理单元104a通过整合(integrating)该两个不同的非线性空间来执行群集。
这里,按图14中所示的处理的流程图进行描述。首先,因为步骤S201至S203与第一实施例中相同,所以这里不对它们进行描述。
接下来,在步骤S204,距离计算单元103a使用按等式2计算的像素i的时间运动轨迹来计算包括像素的运动的相似性的距离矩阵。这里,除等式3所示的距离f(i,j)外,将描述范例,其中,基于像素i和像素j之间的角度的距离f2(i,j)用作第二距离函数。
f 2 ( i , j ) = a _ mean ij + w a · a _ var ij 等式33
其中,wa是加权因子和设计者设定的参数。此外,a_meanij和a_varij如下表述:
a _ mean ij = 1 T Σ t = 1 T a ij t 等式34
a _ var ij = 1 T Σ t = 1 T ( a ij t - a _ mean ij ) 2 等式35
其中,
a ij = arctan ( y t i - y t j x t i - x t j ) 等式36
如上述,使用像素i和像素j之间的角度及角度的波动成分能够表述像素的运动的相似性。这不仅容许捕获刚体而且容许捕获具有关节的对象等的变形,特别是包括旋转运动。
应当注意,只要f2(i,j)是容许评估像素的运动的相似性的距离值,则任何值都能够用于f2(i,j),且例如可以以使用等式1的仿射参数的等式37或等式38来代替等式34至39。等式37能够使用像素i和像素j的运动向量之间的角度差和角度差的波动成分来表述像素的运动的相似性。这容许捕获包括旋转的运动改变。等式38能够使用像素i和像素j的相邻块的仿射参数的差和该差的波动成分来表述像素的运动的相似性。这容许捕获包括旋转、平移移动、以及阶梯跃迁(scale transition)的运动改变。
f 2 ( i , j ) = a _ mean ij + w a · a _ var ij 等式37
a _ mean ij = 1 T - 1 Σ t = 1 T - 1 a ij t
a _ var ij = 1 T - 1 Σ t = 1 t - 1 ( a ij t - a _ mean ij ) 2
a ij t = arctan ( y t + 1 i - y t i x t + 1 i - x t i ) - arctan ( y t + 1 j - y t j x t + 1 j - x t j )
f 2 ( i , j ) = a _ mean ij + w a · a _ var ij 等式38
a _ mean ij = 1 T - 1 Σ t = 1 T - 1 a ij t
a _ var ij = 1 T - 1 Σ t = 1 T - 1 ( a ij t - a _ mean ij ) 2
a ij t = | | A t i - A t j | |
接下来,在步骤S205a中,非线性空间处理单元104a使用等式7至10所示的处理计算对应于等式3的距离f(i,j)的gnew(i,j)。此外,除以上计算外,计算对应于基于像素i和像素j之间的角度的距离f2(i,j)的g2_new(i,j)。也就是说,单独计算两个非线性化距离。虽然于此描述了像素之间的距离和像素之间的角度,但是可以使用表述其它像素的运动的相似性的距离来计算三个或更多个距离。
接下来,在步骤S206a中,非线性空间处理单元104a以与等式11相同的方式根据单独非线性化的距离g2_new(i,j)来生成G2。此外,类似地对G2执行等式12至16所示的处理,G2被投影到维数缩减空间,如等式16,且计算
Figure BPA00001211555100224
接下来,在步骤S207中,非线性空间处理单元104a对
Figure BPA00001211555100225
和按等式16计算的
Figure BPA00001211555100226
进行整合,并执行群集,以探测对象并同时对对象执行分割。具体地,通过如下重写等式19和20能够将其实现。
z m ‾ = z 1 m ‾ · · · z P m ‾ z 2 _ 1 m ‾ · · · z 2 _ P m ‾ 等式39
Z m = 1 C m Σ c m = 1 C mk z 1 c m - z 1 m ‾ · · · z P c m - z P m ‾ z 2 _ 1 c m - z 2 _ 1 m ‾ · · · z 2 _ P c m - z 2 _ P m ‾ z 1 c m - z 1 m ‾ · · · z P c m - z P m ‾ z 2 _ 1 c m - z 2 _ 1 m ‾ · · · z 2 _ P c m - z 2 _ P m ‾ 等式40
以下,在步骤S207a中,等式21至24与以前的相同,不对它们进行描述。
如上述,根据本实施例的图像处理设备使用针对图像上的像素间的距离与距离的波动的距离函数和针对像素间的角度与角度的波动的距离函数来计算每个距离函数的距离矩阵、将两个不同的非线性空间进行整合、并在将每个距离矩阵投影到分别的非线性空间后执行群集,以便以更高精度探测并执行分割作为时间上追踪图像中移动的物体的区域的结果。此外,使用图像上像素间的角度和角度的波动作为距离函数容许更正确地捕获旋转运动,特别是由结合点运动引起的旋转运动。此外,因为不必设定人的候选区域作为预处理,不存在探测人的候选区域时的错误引起的分割中的失败。如上述,探测具有变形的诸如移动的人的对象并以更高精度对区域执行分割是可能的。
(第三实施例)
在本实施例中,将描述图像处理设备,其中,增加了用于基于使用第一实施例中所述的图像处理方法对对象进行探测并执行分割的结果来预测对象的运动的功能。如图15中所示,对象运动预测单元1201增加至图像处理设备,该图像处理设备包括图像输入单元101、运动分析单元102、距离计算单元103、以及非线性空间处理单元104,并且因此,图像处理设备具有用于预测对象的运动的功能。
对象运动预测单元1201基于分割的结果根据每个分割中包括的像素的时间运动轨迹来计算典型轨迹,并根据典型轨迹来预测对象的运动。图16示出了根据第三实施例的处理的流程图。因为步骤S201至S206与第一实施例中相同,这里不对它们进行描述。
接下来,在步骤S1301中,对象运动预测单元1201使用步骤S207中执行的分割的结果如下获得群集的典型点和典型轨迹。
这里,对应于非线性空间中的属于图7(a)和(b)以及图8中所示的分割区域θm的数据
Figure BPA00001211555100241
的像素的时间运动轨迹表述为
Figure BPA00001211555100242
如前述,因为非线性空间中的数据和像素i的时间运动轨迹xi是一一对应关系,所以当选择属于群集区域θm的数据
Figure BPA00001211555100244
时,自动确定对应于像素的时间运动轨迹此外,如以下等式,对每个群集区域θm获得典型时间运动轨迹。虽然这里的范例计算平均时间运动轨迹作为典型时间运动轨迹,但是可以执行对像素的时间运动轨迹
Figure BPA00001211555100246
的每一个的加权等,或者可以将对应于图像上群集的重力中心的像素的时间运动轨迹用作典型时间运动轨迹。
x m ‾ = 1 C m Σ c = 1 C m x c m 等式41
图17示出了一个范例,其中,基于等式41对每个群集θm获得了典型时间运动轨迹。应当注意,考虑到可视性,仅示出了关于对应于头的群集区域θ1的和关于对应于小腿的群集区域θ8的典型时间运动轨迹。图中的十字形是分别对应于时间t的
Figure BPA00001211555100248
的元并且每一个表示像素位子。此外,如等式3和33所示,因为考虑像素的运动的相似性来执行非线性空间中通过群集进行的分割,所以仅使用具有相似运动的像素的时间运动轨迹来进行计算是可能的。因此,与用于简单地获得相邻像素的运动轨迹的平均的方法相比,能够以更高精度获得典型时间运动轨迹。以此方式,给每个群集获得典型运动轨迹容许精确并容易地表述每个区域的运动。
接下来,在步骤S1302中,对象运动预测单元1201基于步骤S1301中计算的典型时间运动轨迹来预测时间T后的时间处对象的位置。首先,将描述范例,其中,根据典型时间运动轨迹计算加速度,并预测T+1后对象的位置。在输入三个或更多个时间系列图像的情况下,能够对每个典型时间运动轨迹获得加速度向量sm,如以下等式:
s t + 1 m = { u t + 1 m 1 - u t m } - { u t m - u t - 1 n } 等式42
其中,
Figure BPA000012115551002411
是运动向量,并能够按以下等式表述:
u t m = ( u t m , v t m ) 等式43
如图17中的虚箭头和圆所示,能够使用等式43的加速度向量针对对象的每个区域如下预测时间T+t’时对象的区域的位置posm(T+t′)。虽然这里将对象的区域用作范例,但是预测诸如图8中所述的自行车和步行者的每个对象的位置是可能的。
pos m ( T + t ′ ) = pos m ( T ) + t ′ u t m + 1 2 t ′ 2 s t m 等式44
这容许考虑加速度的预测。在运动突然变得迅速或突然停止的情况下,利用该加速度预测对象的位置是可能的。此外,可以使用仿射参数代替运动向量。仿射参数能够表述包括旋转运动的运动并适于表述手臂和腿的旋转运动。
此外,代替上述运动向量和加速度,直接拟合N次函数为典型时间运动轨迹xm是可能的。在输入T时间系列图像的情况下,拟合N次函数为包括在T图像上的
Figure BPA00001211555100253
中的位置信息是可能的。以此方式,能够评估时间(T+t′)时图像上的位置posm(T+t′),使得其符合被执行了拟合的函数的值。具体地,因为利用函数拟合容许表述较平滑的运动,所以更高精度的预测变得可能。理所当然,对这些图像上的位置的预测能够用于时间插值。
如上述,根据本实施例,因为能够作为相同群集计算具有相似运动的像素的时间运动轨迹,所以能够高精度地获得典型时间运动轨迹。能够表述特别是具有关节的对象等的每个区域的运动,并且高精度地预测对象的区域的位置,而无需设定人的候选区域作为预处理是可能的。
虽然已经基于实施例和修改例描述了根据本发明的图像处理方法和图像处理设备,但是本发明不限于这些实施例和修改例。本发明包括通过在本发明的要旨的范围内给每个实施例施加本领域技术人员可设想的各种修改而实现的实施例。
此外,本发明包括通过任意组合每个实施例的特征部件而实现的实施例。
本发明能够用于图像处理设备,该图像处理设备基于图像中具有一个或多个像素的块的运动来执行对包括具有变形的诸如移动的人的对象的图像的分割,以便探测对象,例如,可以是包括在运动分析装置、监控装置、以及诸如摄像机和TV的AV装备中的图像处理设备。

Claims (16)

1.一种图像处理方法,所述方法用于基于图像中的块的运动来对包括形状发生变化的对象的图像执行分割,每个所述块由一个或多个像素构成,所述方法包括:
图像接收步骤,接收时间上连续的图像;
运动分析步骤,使用至少两个时间上不同的图像计算所述块的所述运动,并基于所述块的所述运动,计算所述时间上连续的图像中的所述块的时间运动轨迹;
距离计算步骤,使用在所述运动分析步骤中计算的块i的时间运动轨迹和不同于所述块i的块的时间运动轨迹计算表示所述块的所述运动的相似性的距离;以及
非线性空间处理步骤,将在所述距离计算步骤中计算的所述距离投影到非线性空间并在所述非线性空间对所述投影的结果执行所述分割。
2.如权利要求1所述的图像处理方法,
其中,在所述距离计算步骤中,使用至少两个距离函数针对所述距离函数的每一个计算两个或更多距离,将所述距离的每一个投影到分别不同的非线性空间,并且通过整合所述投影的结果来执行所述分割。
3.如权利要求1所述的图像处理方法,
其中,在所述距离计算步骤中,针对包括在所述图像中的块计算距离,每个所述距离都表示两个块的运动的相似性,以及
在所述非线性空间处理步骤中,将分别的距离非线性化,对所非线性化的距离进行维数缩减,以便将其投影到非线性空间,且通过获得具有关于投影到所述非线性空间的所述距离的相似性的一个或多个分割区域来执行所述分割。
4.如权利要求3所述的图像处理方法,
其中,在所述非线性空间处理步骤中,通过将欧几里德距离转换成测地距离来执行所述非线性化。
5.如权利要求3所述的图像处理方法,
其中,在所述非线性空间处理步骤中,通过计算所非线性化的距离的本征向量来执行所述维数缩减。
6.如权利要求3所述的图像处理方法,
其中,在所述非线性空间处理步骤中,在通过将除最靠近所述块i的N个距离外的距离无限化来执行所述非线性化后,执行所述维数缩减。
7.如权利要求3所述的图像处理方法,
其中,在所述非线性空间处理步骤中,在通过将至所述块i的距离中大于阈值的距离无限化来执行所述非线性化后,执行所述维数缩减。
8.如权利要求3所述的图像处理方法,
其中,在所述非线性空间处理步骤中,在通过将至所述块i的距离乘以包括非线性函数的指数函数来执行所述非线性化后,执行所述维数缩减。
9.如权利要求1所述的图像处理方法,
其中,在所述运动分析步骤中,计算二维运动向量和仿射参数之一作为所述块的所述运动。
10.如权利要求1所述的图像处理方法,
其中,在所述距离计算步骤中,除所述块的所述运动的所述相似性外,还计算包括所述图像上的块之间的距离和所述图像上的块之间的角度的至少之一的距离。
11.如权利要求1所述的图像处理方法,还包括
图像显示步骤,在所述图像接收步骤中接收的所述图像上显示在所述非线性空间执行的所述分割的结果。
12.如权利要求1所述的图像处理方法,
其中,在所述非线性空间处理步骤中,基于在所述非线性空间执行的所述分割的结果来探测在所述图像接收步骤中接收的所述图像中包括的至少两个不同的移动物体。
13.如权利要求1所述的图像处理方法,还包括
对象运动预测步骤,基于在所述非线性空间执行的所述分割的结果,根据通过所述分割获得的每个分割中包括的块的时间运动轨迹计算典型轨迹,并根据所述典型轨迹来预测对象的运动。
14.如权利要求1所述的图像处理方法,还包括
记录和传输步骤,基于在所述非线性空间执行的所述分割的结果来识别在所述图像接收步骤中接收的所述图像上的分割,以及记录或传输对应于所识别的分割的结果。
15.一种图像处理设备,用于基于图像中的块的运动来对包括形状发生变化的对象的图像执行分割,每个所述块由一个或多个像素构成,所述设备包括:
图像接收单元,用于接收时间上连续的图像;
运动分析单元,用于使用至少两个时间上不同的图像计算所述块的所述运动,并基于所述块的所述运动,计算所述时间上连续的图像中的所述块的时间运动轨迹;
距离计算单元,用于使用由所述运动分析单元计算的块i的时间运动轨迹和不同于所述块i的块的时间运动轨迹计算表示所述块的所述运动的相似性的距离;以及
非线性空间处理单元,用于将所述距离计算单元计算的所述距离投影到非线性空间并在所述非线性空间对所述投影的结果执行所述分割。
16.一种用于图像处理设备的程序,所述程序使得计算机执行:
图像接收步骤,接收时间上连续的图像;
运动分析步骤,使用至少两个时间上不同的图像计算所述块的所述运动,并基于所述块的所述运动,计算所述时间上连续的图像中的所述块的时间运动轨迹;
距离计算步骤,使用在所述运动分析步骤中计算的块i的时间运动轨迹和不同于所述块i的块的时间运动轨迹计算表示所述块的所述运动的相似性的距离;以及
非线性空间处理步骤,将在所述距离计算步骤中计算的所述距离投影到非线性空间并在所述非线性空间对所述投影的结果执行所述分割。
CN2008801275678A 2008-03-14 2008-03-14 图像处理方法和图像处理设备 Active CN101960490B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/GB2008/000918 WO2009112790A1 (en) 2008-03-14 2008-03-14 Image processing method and image processing apparatus

Publications (2)

Publication Number Publication Date
CN101960490A true CN101960490A (zh) 2011-01-26
CN101960490B CN101960490B (zh) 2013-07-17

Family

ID=40028900

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008801275678A Active CN101960490B (zh) 2008-03-14 2008-03-14 图像处理方法和图像处理设备

Country Status (6)

Country Link
US (1) US8437549B2 (zh)
EP (2) EP2418622B1 (zh)
JP (1) JP5054206B2 (zh)
CN (1) CN101960490B (zh)
AT (1) ATE538453T1 (zh)
WO (1) WO2009112790A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103189898A (zh) * 2011-03-22 2013-07-03 松下电器产业株式会社 移动体检测装置以及移动体检测方法
CN103259962A (zh) * 2013-04-17 2013-08-21 深圳市捷顺科技实业股份有限公司 一种目标追踪方法和相关装置
CN106095104A (zh) * 2016-06-20 2016-11-09 电子科技大学 基于目标模型信息的连续手势轨迹分割方法及系统
CN110751056A (zh) * 2019-09-27 2020-02-04 湖北工业大学 基于改进自顶向下法多人姿态检测的行人运动预测方法

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4782901B2 (ja) 2009-12-28 2011-09-28 パナソニック株式会社 移動体検出装置および移動体検出方法
CN102378992B (zh) * 2009-12-28 2014-12-24 松下电器产业株式会社 关节状区域检测装置及其方法
JP5404918B2 (ja) 2010-03-15 2014-02-05 パナソニック株式会社 移動軌跡算出方法およびその装置、ならびに領域分割方法
CN102741884B (zh) * 2010-07-27 2016-06-08 松下知识产权经营株式会社 移动体检测装置及移动体检测方法
US8855361B2 (en) * 2010-12-30 2014-10-07 Pelco, Inc. Scene activity analysis using statistical and semantic features learnt from object trajectory data
JP2012151796A (ja) * 2011-01-21 2012-08-09 Sony Corp 画像処理装置と画像処理方法およびプログラム
JP5919665B2 (ja) * 2011-07-19 2016-05-18 日本電気株式会社 情報処理装置、物体追跡方法および情報処理プログラム
PL2753581T3 (pl) * 2011-09-07 2017-08-31 Unilever N.V. Układ oczyszczania wody
KR101901958B1 (ko) * 2012-03-26 2018-11-08 한국전자통신연구원 휴리스틱 함수의 학습을 이용한 고속 경로를 탐색을 위한 장치 및 그 방법
US9070004B2 (en) 2012-05-03 2015-06-30 General Electric Company Automatic segmentation and characterization of cellular motion
US9336302B1 (en) 2012-07-20 2016-05-10 Zuci Realty Llc Insight and algorithmic clustering for automated synthesis
EP2790152B1 (en) * 2013-04-12 2015-12-02 Alcatel Lucent Method and device for automatic detection and tracking of one or multiple objects of interest in a video
US9213901B2 (en) * 2013-09-04 2015-12-15 Xerox Corporation Robust and computationally efficient video-based object tracking in regularized motion environments
US9070023B2 (en) 2013-09-23 2015-06-30 Toyota Motor Engineering & Manufacturing North America, Inc. System and method of alerting a driver that visual perception of pedestrian may be difficult
MA41117A (fr) 2014-12-05 2017-10-10 Myfiziq Ltd Imagerie d'un corps
JP6241447B2 (ja) * 2015-04-28 2017-12-06 マツダ株式会社 歩行者移動推定方法および推定装置
CN105025198B (zh) * 2015-07-22 2019-01-01 东方网力科技股份有限公司 一种基于时空因素的视频运动目标的分组方法
JP6493877B2 (ja) 2015-08-25 2019-04-03 富士フイルム株式会社 基準点評価装置、方法およびプログラム、並びに位置合せ装置、方法およびプログラム
US10264996B2 (en) * 2015-10-19 2019-04-23 Sayfe Kiaei Method and apparatus for wirelessly monitoring repetitive bodily movements
CN105931429B (zh) * 2016-07-18 2019-01-29 四川君逸数码科技股份有限公司 一种智慧金睛识别夜间接近报警方法和装置
CN106128022B (zh) * 2016-07-18 2018-12-11 四川君逸数码科技股份有限公司 一种智慧金睛识别暴力动作报警方法
US10419558B2 (en) * 2016-08-24 2019-09-17 The Directv Group, Inc. Methods and systems for provisioning a user profile on a media processor
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
CN109344685B (zh) * 2018-08-03 2021-03-09 广东工业大学 一种智慧托盘及其智能定位追踪方法
CN109741242B (zh) * 2018-12-25 2023-11-14 努比亚技术有限公司 光绘处理方法、终端和计算机可读存储介质
CN110543539B (zh) * 2019-08-29 2022-09-16 河海大学 一种分布式的路网环境下移动对象轨迹相似性查询方法
JP7369783B2 (ja) * 2019-09-26 2023-10-26 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 情報処理方法、プログラム及び情報処理装置
CN111161312B (zh) * 2019-12-16 2022-03-22 重庆邮电大学 一种基于计算机视觉的物体轨迹追踪识别装置及系统
JP2021176347A (ja) * 2020-05-07 2021-11-11 コニカミノルタ株式会社 動作情報表示装置
CN113838120B (zh) * 2021-09-30 2024-01-30 重庆大学 一种基于数字图像相关的大转角运动位移测量方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5016173A (en) * 1989-04-13 1991-05-14 Vanguard Imaging Ltd. Apparatus and method for monitoring visually accessible surfaces of the body
JP3780017B2 (ja) 1994-12-06 2006-05-31 オリンパス株式会社 時系列画像解析装置及びその解析方法
JPH1166319A (ja) * 1997-08-21 1999-03-09 Omron Corp 移動体検出方法及び装置並びに移動体認識方法及び装置並びに人間検出方法及び装置
JP2000222584A (ja) * 1999-01-29 2000-08-11 Toshiba Corp 映像情報記述方法、映像検索方法及び映像検索装置
US6859554B2 (en) 2001-04-04 2005-02-22 Mitsubishi Electric Research Laboratories, Inc. Method for segmenting multi-resolution video objects
US20030123704A1 (en) * 2001-05-30 2003-07-03 Eaton Corporation Motion-based image segmentor for occupant tracking
KR100927143B1 (ko) * 2002-11-27 2009-11-18 삼성전자주식회사 움직임 검출장치 및 방법
US8614741B2 (en) * 2003-03-31 2013-12-24 Alcatel Lucent Method and apparatus for intelligent and automatic sensor control using multimedia database system
US7142602B2 (en) * 2003-05-21 2006-11-28 Mitsubishi Electric Research Laboratories, Inc. Method for segmenting 3D objects from compressed videos
JP4506409B2 (ja) * 2004-10-27 2010-07-21 株式会社デンソー 領域分割方法及び装置、画像認識処理装置、プログラム、記録媒体
US7647214B2 (en) * 2004-12-27 2010-01-12 Seoul National University Industry Foundation Method for simulating stable but non-dissipative water
JP2007199864A (ja) * 2006-01-24 2007-08-09 Matsushita Electric Ind Co Ltd 画像列生成方法および画像列生成装置
JP4148281B2 (ja) * 2006-06-19 2008-09-10 ソニー株式会社 モーションキャプチャ装置及びモーションキャプチャ方法、並びにモーションキャプチャプログラム
DE102007063635A1 (de) * 2007-03-22 2009-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur zeitlichen Segmentierung eines Videos in Videobildfolgen und zur Auswahl von Keyframes für das Auffinden von Bildinhalten unter Einbeziehung einer Subshot-Detektion
JP4893471B2 (ja) * 2007-05-24 2012-03-07 カシオ計算機株式会社 画像処理装置及びプログラム
WO2010079556A1 (ja) * 2009-01-09 2010-07-15 パナソニック株式会社 移動体検出方法および移動体検出装置
US8559763B2 (en) * 2010-12-14 2013-10-15 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for motion-compensated interpolation (MCI) with conservative motion model

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103189898A (zh) * 2011-03-22 2013-07-03 松下电器产业株式会社 移动体检测装置以及移动体检测方法
CN103189898B (zh) * 2011-03-22 2016-01-20 松下电器产业株式会社 移动体检测装置以及移动体检测方法
CN103259962A (zh) * 2013-04-17 2013-08-21 深圳市捷顺科技实业股份有限公司 一种目标追踪方法和相关装置
CN103259962B (zh) * 2013-04-17 2016-02-17 深圳市捷顺科技实业股份有限公司 一种目标追踪方法和相关装置
CN106095104A (zh) * 2016-06-20 2016-11-09 电子科技大学 基于目标模型信息的连续手势轨迹分割方法及系统
CN110751056A (zh) * 2019-09-27 2020-02-04 湖北工业大学 基于改进自顶向下法多人姿态检测的行人运动预测方法

Also Published As

Publication number Publication date
US8437549B2 (en) 2013-05-07
ATE538453T1 (de) 2012-01-15
EP2250624A1 (en) 2010-11-17
JP5054206B2 (ja) 2012-10-24
EP2418622A3 (en) 2012-05-09
US20110013840A1 (en) 2011-01-20
JP2011513868A (ja) 2011-04-28
EP2418622A2 (en) 2012-02-15
CN101960490B (zh) 2013-07-17
WO2009112790A1 (en) 2009-09-17
EP2250624B1 (en) 2011-12-21
EP2418622B1 (en) 2015-12-02

Similar Documents

Publication Publication Date Title
CN101960490B (zh) 图像处理方法和图像处理设备
EP2461292B1 (en) Mobile body detection apparatus and mobile body detection method
US8340357B2 (en) Moving object detection method and moving object detection apparatus
EP2521093B1 (en) Moving object detection device and moving object detection method
US8948448B2 (en) Method and apparatus for trajectory estimation, and method for segmentation
CN102077250B (zh) 移动体检测方法及移动体检测装置
CN102227749B (zh) 移动体检测方法及移动体检测装置
KR102465960B1 (ko) 변화점 검출을 활용한 다중클래스 다중물체 추적 방법
EP2061009B1 (en) Iterative motion segmentation
Savitha et al. Motion detection in video surviellance: A systematic survey

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant