CN1799066A - 使用概率框架的基于块的分析的计算机视觉方法及系统 - Google Patents

使用概率框架的基于块的分析的计算机视觉方法及系统 Download PDF

Info

Publication number
CN1799066A
CN1799066A CNA028125975A CN02812597A CN1799066A CN 1799066 A CN1799066 A CN 1799066A CN A028125975 A CNA028125975 A CN A028125975A CN 02812597 A CN02812597 A CN 02812597A CN 1799066 A CN1799066 A CN 1799066A
Authority
CN
China
Prior art keywords
troop
trooping
pixel
parameter
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA028125975A
Other languages
English (en)
Inventor
A·科梅纳雷滋
S·V·R·古特塔
T·布罗德斯基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1799066A publication Critical patent/CN1799066A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/457Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by analysing connectivity, e.g. edge linking, connected component analysis or slices

Abstract

一般而言,公开了用于分析前景分割图像的技术。这些技术允许从前景分割图像来确定群集。可以增加新群集、移除旧群集并且跟踪当前群集。一种概率框架用于本发明的分析。公开了一种方法,该方法估计从包括分割区域的图像来确定的一个或多个群集的群集参数,并且评估该群集或多个群集以确定是否修改该群集或多个群集。一般执行这些步骤直到满足一个或多个收敛准则。另外,在该过程期间,可以增加、移除或分离群集。在本发明的另一方面,在一系列图像期间跟踪群集,并且预测群集的移动。

Description

使用概率框架的基于块的分析的计算机视觉方法及系统
技术领域
本发明涉及计算机视觉和分析,更具体地说,涉及使用概率框架的基于块的分析的计算机视觉方法及系统。
背景技术
一种通常的计算机视觉方法称作“背景-前景分割”,或更简单地称作“前景分割”。在前景分割中,前景对象以某种方式来确定和突出。一种用于执行前景分割的方法是“背景扣除”。在该方案中,摄像机查看背景寻找预定数目的图像,这样,计算机视觉系统可以“学习”背景。一旦学习了背景,那么计算机视觉系统可以通过将新图像与背景图像的表示进行比较来确定场景的变化。两幅图像之间的差异表示前景对象。在A.Elgammal、D.Harwood和L.Davis的“背景扣除的非参数模型”(计算机科学讲义1843卷751-767(2000))中收录了背景扣除的方法,由此通过引用将其公开内容结合。
前景对象可以以多种方式来描述。一般而言,二值方法用来描述前景对象。在该方法中,分配给背景的像素被标记为黑,而分配给前景的像素被标记为白,反之亦然。也可以使用灰度图像,彩色图像也可以。不考虑该方法的本质,标记前景对象使得它们区别于背景。当照这样标记时,前景对象趋向于看上去像“块(blob)”,从某种意义上说难以确定前景对象是什么。
不过,可以进一步分析这些前景分割图像。一种用于这些类型图像的分析工具称为连通分量标注。该工具扫描图像以确定“连通的”像素区,该区是共用相同亮度值集合的相邻像素区。这些工具采用多种过程来确定像素应该如何分组在一起。例如,在D.Vernon的“机器视觉”(Prentice-Hall,34-36(1991))和E.Davies的“机器视觉:理论、算法和实用性”(Academic Press,Chap.6(1990))中讨论了这些工具,由此通过引用将其公开内容结合。例如,可以使用这些和相似的工具来跟踪正在移入、移出或通过摄像机视野的对象。
尽管连通分量方法和其它基于块的方法是切实可行且有用的,然而,这些方法存在一些问题。通常,这些方法(1)在出现噪声时失效,(2)独立处理场景的各个部分,以及(3)不提供自动为场景中出现的块的数目计数的方法。因此,需要克服这些问题同时提供对前景分割图像进行适当分析的方法。
发明内容
一般而言,公开了用于分析前景分割图像的方法。该方法允许从前景分割图像来确定群集。可以增加新群集、移除旧群集并且跟踪当前群集。一种概率框架用于本发明的分析。
在本发明的一个方面,公开了一种方法,该方法估计从包括分割区域的图像来确定的一个或多个群集的群集参数,并且评估该群集或多个群集以确定是否修改该群集或多个群集。一般执行这些步骤直到满足一个或多个收敛准则。另外,在该过程期间,可以增加、移除或分离群集。
在本发明的另一方面,在例如来自摄像机的一系列图像期间跟踪群集。在本发明的又一方面,预测群集移动。
在本发明另外的方面,公开了一种系统,该系统分析输入的图像并通过输入的图像来创建块信息。块信息可以包括每个块的跟踪信息、位置信息和大小信息,并且还可以包括出现的块的数目。
附图说明
通过参考下列的详细描述和附图,将更完整地理解本发明以及本发明另外的特征和优点。
图1说明了根据本发明优选实施例操作的示范性计算机视觉系统;
图2是说明本发明的群集检测方法的示范性图像序列;
图3是描述根据本发明优选实施例的初始群集检测的示范性方法的流程图;
图4是描述根据本发明优选实施例的一般群集跟踪的示范性方法的流程图;
图5是描述根据本发明优选实施例的例如用于查看房间的头顶摄像机的特定群集跟踪的示范性方法的流程图。
具体实施方式
本发明公开了一种基于块的分析的方法及系统。在此公开的方法使用了概率框架和迭代过程来确定图像中块的数目、位置和大小。块是许多在图像中突出的像素。一般而言,突出是通过背景-前景分割、在此称作“前景分割”来产生的。分组是聚合在一起的像素,其中,分组是由被确定为适合特定像素组的形状来定义的。在此,术语“群集”被用来既指被确定为适合特定像素组的形状又指像素本身。应该注意的是,如关于图2更详细示出的那样,一个块可以分配给多个群集,而多个块可以分配给一个群集。
本发明还可以增加、移除和删除群集。另外,可以独立跟踪群集,并且可以输出跟踪信息。
现在参考图1,示出的计算机视觉系统100与输入的图像110、网络和数字通用盘(DVD)180交互,并且在该示例中产生块信息170。计算机视觉系统100包括处理器120和存储器130。存储器130包括前景分割过程140、分割图像150和基于块的分析的过程160。
输入的图像110一般是来自数字摄像机或其它数字视频输入设备的一系列图像。另外,可以使用连接到数字帧捕获器的模拟摄像机。前景分割过程140将输入的图像110分割成分割图像150。分割图像150是图像110的表示并且包含被分割的区域。有多种用于图像前景分割的方法对于本领域的技术人员而言是众所周知的。如上所述,一种这样的方法是背景扣除。同样如上所述,在“背景扣除的非参数模型”中公开了一种背景扣除的方法,上面通过引用将其公开内容结合。可以使用的另一方法是检查肤色的图像。人类皮肤可以通过各种方法来发现,例如,在Forsyth和Fleck的“识别裸体图像”(1996年12月2日到4日第三届IEEE研讨会论文集、计算机视觉应用,103-108),由此通过引用将其公开内容结合。
一旦发现应该分割的区域,分割区域不同于图像的其它区域地被标记。例如,一种用于表示分割图像的方法是通过二值图像,其中,前景像素标记为白而背景像素标记为黑,反之亦然。其它表示包括灰度图像,并且甚至有使用彩色的表示。无论什么表示,重要的是存在某一界限来指示图像的分割区。
一旦确定了分割图像150,那么基于块的分析的过程160用来分析分割图像150。基于块的分析的过程160使用所有或一些在图3到图5中公开的方法来分析分割图像150。基于块的分析的过程160检查输入的图像110并可以创建块信息170。块信息170提供例如块的跟踪信息、块的位置、块的大小以及块的数目。还应该注意的是,基于块的分析的过程160不需要输出块信息170。替代地,基于块的分析的过程160可以输出报警信号,例如,在有人走入受限区域时。
计算机视觉系统100可以实现为任何计算设备,例如,个人计算机或工作站,包含:例如中央处理单元(CPU)的处理器120,以及例如随机存取存储器(RAM)和只读存储器(ROM)的存储器130。在备选实施例中,在此公开的计算机视觉系统100可以实现为专用集成电路(ASIC),例如,作为视频处理系统的一部分。
如本领域已知的,在此讨论的方法和装置可以作为制造品来发布,其本身包括计算机可读介质,在计算机可读介质上体现了计算机可读代码单元。计算机可读程序代码单元是可和计算机系统一起操作的,以进行所有或一些步骤来执行方法或创建在此讨论的装置。计算机可读介质可以是可记录介质(例如,软盘、硬盘驱动器,例如DVD 180的光盘或存储卡),或可以是传输介质(例如,包括光纤的网络、万维网、电缆、或使用时分多址、码分多址的无线信道或其它射频信道)。可以使用任何已知的或开发的可以存储适合和计算机系统一起使用的信息的介质。计算机可读代码单元是用于允许计算机读取指令和数据的任何机制,例如磁介质上的磁变化或例如DVD 180的光盘表面上的高度变化。
存储器130将配置处理器120以实现在此公开的方法、步骤和功能。存储器130可以是分布式的或本机的,而处理器120可以是分布式的或单一的。存储器130可以实现为电,磁或光存储器,或这些的任何组合或其它类型的存储设备。术语“存储器”应该被广泛地理解,足以包括任何能够从地址读取或写入地址的信息,该地址在处理器120存取的可寻址空间中。使用该定义,网络上的信息仍在计算机视觉系统100的存储器130之内,因为处理器120可以从网络检索信息。
图2是说明本发明群集检测方法的示范性图像序列。在图2中,示出四幅图像表示201、205、235和255。每个图像表示说明本发明如何在静止图像203中创建群集。图像203是一个来自数字摄像机的图像。注意,为简单起见,使用的是静止图像。本发明的一个好处是本发明可以轻松地跟踪图像中的对象。然而,静止图像更易于描述。还应该注意的是,关于图2描述的过程基本上是图3的方法。在图3之前描述图2是因为图2更直观且更易于理解。
在图像203中,有两个块205和210,如图像表示201所示。在图像表示201中,可以看出,基于块的分析的过程,例如,基于块的分析的过程160,向图像表示205增加坐标系。该坐标系包括X轴215和Y轴220。坐标系用于确定群集和包含在其中的块的位置,并且还用来提供另外的信息,例如跟踪信息。另外,所有块都用椭圆230环绕,椭圆230有它自己的中心231和轴232及233。椭圆230是像素群集的表示并且也是群集。
通过估计椭圆230的群集参数和评估群集230的步骤,本发明将图像表示细化为图像表示235。在该表示中,两个椭圆被选择来表示块205和210。椭圆240,其具有中心241和轴242及243,表示块205。同时,椭圆250,其具有中心251和轴252及253,表示块210。
在另一迭代之后,本发明可以确定,图像表示255是图像203的最佳表示。在图像表示255中,块210还由椭圆260表示,其具有中心261和轴262及263。块210由椭圆270和280表示,其分别具有中心271、281和轴272、282及273、283。
因此,本发明在图2的示例中已经确定有三个群集。然而,这些群集可能实际上表示也可能实际上不表示三个单独实体,例如个体。如果本发明用于跟踪群集,将可能需要附加的步骤来观察块如何在一系列图像上移动。
在描述本发明的方法前,描述分割图像如何可以通过概率框架来建模也是有帮助的。图3到图5描述的算法使用参数概率模型来表示前景观察。基本的假设是,具有数目减少的参数的这些观察的表示有助于分析和理解图像中获取的信息。另外,所观察数据的统计分析的本质提供了对出现在实际数据中的误差和噪声的合理健壮性。
在该概率框架中,有益的是使用与位置相关联的二维(2D)随机过程:x=(x,y)25∈、R2,在这些位置中,前景像素被期望在前景分割图像上观察。结果,包含在二值图像的像素集合上的信息则可以由相应的随机过程的概率分布的参数来获取。例如,描述了图像中对象的轮廓的区可以由获取对象位置和形状的参数集合来表示。
二值图像,它们是二值像素值的二维阵列,可以通过下列等式用非零值(即,在许多前景分割方法情况下的前景)的像素集来表示:
Image={XkI(Xi)≠0}.                               (1)
该像素集可以解释为从具有某一参数化概率分布P(X|θ)的二维随机过程中获得的观察采样。
在该表示下,随机过程可用来为在场景中观察的前景对象以及这些观察中的不确定性(例如噪声和形状变形)建模。例如,球的图像可以表示为二维高斯分布描述的像素群集,P(X|θ)=N(X;X0,Σ),其中,均值X0提供了其中心的位置,而协方差∑获取关于其大小和形状的信息。
复对象可以用多个群集表示,它们可以或者也可以不相互连接。这些复随机过程可以写为:
p ( X ) = Σ k = 1 M p ( X | θ k ) p ( θ k ) .
注意,给定前景像素的概率分布,通过将非零值赋予所有具有大于某一阈值的概率的像素位置并将零值赋予其余像素,可以重建图像的近似。然而,最大相关问题是分析图像以获得概率模型的问题。
对输入图像的分析然后转化成通过使模型适合于由图像给出的观察采样值来估计模型参数的问题。也就是说,给定二值分割图像,算法确定群集的数目及最佳描述图像中非零值像素的每个群集的参数,非零像素是前景对象。
本发明的方法以下列方式描述:(1)图3描述初始群集检测方法,其从图像来确定群集;(2)图4描述一般群集跟踪方法,其用于跟踪若干或许多图像上的对象,以及(3)图5描述专门的群集跟踪方法,适用于例如包括从摄像机向下指向房间内的观察点跟踪对象和对对象进行计数的情况。
初始群集检测:
图3是描述根据本发明优选实施例的初始群集检测的示范性方法300的流程图。方法300由基于块的分析的过程用来确定块信息,并且方法300接受分割图像用于分析。
方法300基本上包括三个主要的步骤:初始化305、估计群集参数310和评估群集参数330。
方法300在步骤305开始,这时方法初始化。对于方法300,该步骤需要以覆盖整幅图像的单个椭圆开始,如图2的图像表示205所示。
在步骤310,估计群集参数。步骤310是期望最大化(EM)算法的一种版本,这在A.Dempster、N.Laird和D.Rubin的“经由EM算法的不完全数据的极大似然”(J.Roy.Statist.Soc.B39:1-38(1977)),由此通过引用将其公开内容结合。在步骤315,属于图像的前景分割部分的像素分配给当前群集。为简洁,“属于图像的前景分割部分的像素”在此称为“前景像素”。起初,这意味着所有前景像素分配给一个群集。
在步骤315,每个前景像素分配给最近的椭圆。因此,像素X分配给椭圆θk,这样,P(X|θk)最大化。
在步骤320,基于分配给每个群集的像素来重新估计群集像素。该步骤估计每个θk的参数,以最适合分配给该群集θk的前景像素。
在步骤325,执行收敛测试。如果收敛(步骤325=是(YES)),步骤325结束。否则(步骤325=否(NO)),方法300再在步骤315开始。
为测试收敛,执行下列步骤。对于每个群集θk,测量群集在最后一次迭代时变化了多少。为测量变化,可以使用在位置、大小、和取向的变化。如果变化不大、低于预定值,群集标记为收敛。当所有群集标记为收敛时,实现总收敛。
应该注意的是,步骤325还可以对最大的迭代次数进行测试。如果达到最大的迭代次数,方法300继续到步骤330。
在步骤330,评估群集。在该步骤中,如果满足某些条件,可以分离或删除群集。在步骤335,选择特定的群集。在步骤340,确定是否应该删除所选择的群集。如果没有或几乎没有像素分配给群集,那么删除群集(步骤340=是(YES)和步骤345)。因此,如果少于预定数目的像素被分配给群集,那么删除该群集(步骤340=是(YES)和步骤345)。如果删除群集,方法继续到步骤360,否则,方法继续到步骤350。
在步骤350,确定是否应该分离所选择的群集。如果满足分离条件,那么分离群集(步骤350=是(YES)和步骤355)。为评估分离条件,方法300考虑所有分配给群集的像素。对于每个像素,评估距离(X-X0)T-1(X-X0),其中,均值X0提供椭圆中心的位置,并且协方差∑获取关于其大小和形状的信息。椭圆的轮廓是距离为D0的点,通常,D0=3*3=9。“内点”是例如距离小于0.25*D0的像素,而“外点”是例如距离大于0.75*D0的像素。计算内点数除以外点数的比率。如果该比率大于阈值,分离椭圆(步骤355)。
在步骤360,确定是否还有群集。如果有附加的群集(步骤360=是(YES)),那么方法300再选择另一群集(步骤335)。如果再没有群集,方法300继续到步骤370。
步骤370执行一个或多个对收敛的测试。首先,在步骤370,确定方法是否收敛。对收敛的测试与步骤325所用的相同,如下。对于每个群集θk,测量群集在最后一次迭代时变化了多少。为了测量变化,可以使用位置、大小和取向的变化。如果变化不大、低于预定值,群集标记为收敛。当所有群集标记为收敛时,实现总收敛。
如果没有收敛(步骤370=否(NO)),那么方法300再继续步骤315。应该注意的是,步骤370还可以确定是否达到最大的迭代次数。如果达到最大的迭代次数,方法300继续到步骤380。
如果有收敛(步骤370=是(YES)),或者可选地,达到最大的迭代次数(步骤370=是(YES)),那么在步骤380输出块信息。块信息可以包含例如所有块的位置、大小和取向以及块的数目。备选地,如在前面讨论的,不需要输出块信息。替代地,可以输出诸如警告和报警的信息。例如,如果有人进入受限区域,那么方法300可以在步骤380输出报警信号。
应该注意的是,方法300可以确定没有适合跟踪的群集。例如,尽管在上面没有讨论,可以指定群集的最小尺寸。如果没有群集满足该尺寸,那么可认为图像没有群集。如果图像没有前景分割区域,情况也是这样。
因此,方法300提供了用于确定图像中群集的方法。因为使用了概率框架,本发明增加了系统对前景分割算法中的噪声和误差的健壮性。
一般群集跟踪:
一般群集跟踪由图4的示范性方法400执行。该算法假定一序列图像并使用每帧的解来初始化下一帧的估计过程。在通常的跟踪应用中,方法400以来自第一帧的初始群集检测开始,而后继续随后帧的群集跟踪。方法400中的许多步骤与方法300中的步骤相同。因此,将在此只描述不同之处。
在步骤410,方法通过在前一图像帧得到的解来初始化。这向方法400的当前迭代提供方法400前一迭代的结果。
在步骤310估计群集的参数,如上所讨论的。该步骤一般修改群集以跟踪图象之间的块移动。
评估群集的步骤(即步骤430)基本上保持相同。例如,方法400可以删除群集(步骤340和345)并且分离群集(步骤350和355),正如在先前的算法300中的一样。然而,对于未被初始解描述的数据可以增加新群集。在步骤425,确定是否应该增加新群集。如果应该增加新群集(步骤425=是(YES)),创建新群集并且将未分配给现有群集的所有像素分配给新群集(步骤428)。然后,随后的迭代将细化和分离(如果必需的话)该新增加的群集。附加的群集通常出现在新对象进入场景的时候。
专门的群集跟踪:
图5是描述例如用于查看房间的头顶摄像机上的特定群集跟踪的示范性方法500的流程图。在该部分说明示范性具体的修改,这些修改用于头顸摄像机跟踪和人员计数。总方案与上述的相同,所以在此将只描述不同之处。
在步骤410,系统由通过前一图像帧确定的解来初始化。然而,对于每个椭圆,椭圆的前一动作用于预测它在当前迭代中的位置。这发生在步骤510。预测的椭圆的大小和取向保持相同,尽管需要的话可以预测椭圆大小和取向的变化。基于先前的中心位置来预测中心位置。对于该预测,可以使用卡尔曼(Kalman)滤波器。描述卡尔曼滤波的参考文献是Arthur Gelb(Ed.)的“应用优化估计”(MITPress,Chapter 4.2(1974)),由此通过引用将其公开内容结合。预测还可通过简单的线形预测来执行,如下:
p x 0 ( t + 1 ) = X 0 ( t ) + ( X 0 ( t ) - X 0 ( t - 1 ) ) , - - - ( 3 )
其中Px0(t+1)是在时间t+1预测的中心,而X0(t)和X0(t-1)分别是在时间t和t-1的中心。
估计群集参数的步骤(即步骤310)基本保持相同。对于以例如每秒10帧的帧速率的实时视频处理,只执行每个循环的一次或两次迭代是可能的,因为跟踪的对象变化缓慢。
评估群集的步骤(530)基奉上保持不变。然而,在方法500修改新群集的增加(图4的步骤425)。具体地,如果确定需要增加新群集(步骤425=是(YES)),检查所有未分配给当前群集的前景像素。然而,不是分配所有那些像素给单个新群集,而是对未分配的像素上执行连通分量算法(步骤528),并且对于每个连通分量创建一个或多个新群集(步骤528)。这在多个对象同时出现在图像的不同部分时是有利的,因为连通分量算法将在概率意义上来确定是否块是连通的。例如在D.Vernon的“机器视觉”(Prentice-Hall,34-36(1991)和E.Davies的“机器视觉:理论、算法和实用性”(AcademicPress,Chap.6(1990))中描述了连通分量算法,通过引用已经将公开其内容结合。
本发明至少具有以下优点:(1)本发明通过使用来自所有块的全局信息以帮助每个单独块的参数估计来改善性能;(2)本发明增加了系统对前景分割算法中的噪声和误差的健壮性;以及(3)本发明自动确定场景中块的数目。
尽管已经示出椭圆为群集,然而可以使用其它形状。
应该理解,在此示出和描述的实施例和变体只是说明本发明原理的,.并且在不脱离本发明的范围和精神的前提下,本领域的技术人员可以实现各种修改。另外,权利要求中的“由此”从句应该被认为是非限制的并且只是用于解释的目的。

Claims (16)

1.一种方法,包括:
-从包括至少一个分割区域(205、210)的图像来确定至少一个群集;
-估计所述至少一个群集(例如,230)的群集参数(例如,231、232、233);以及
-评估所述至少一个群集(例如,230),由此执行评估步骤以确定是否修改所述至少一个群集(例如,230)。
2.如权利要求1所述的方法,其中:
-估计群集参数(例如,231、232、233)的步骤还包括以下步骤:估计每个所述至少一个群集(例如,230)的群集参数(例如,231、232、233)直到满足至少一个第一收敛准则;以及
-评估群集参数(例如,231、232、233)的步骤还包括以下步骤:评估每个所述至少一个群集(例如,230)的群集参数(例如,231、232、233)直到满足至少一个第二收敛准则,并且在所述至少一个第二收敛准则未得到满足时执行估计步骤。
3.如权利要求1所述的方法,其中:
-估计群集参数(例如,231、232、233)的步骤还包括如下步骤:
-将来自所述分割区域(205、210)中所选择的一个的像素分配给所述群集(例如,230)之一,执行分配步骤直到来自所述分割区域(205、210)中所选择的一个的每个像素分配给了群集(例如,230)。
-重新估计每个所述群集(例如,230)的群集参数(例如,231、232、233);以及
-确定是否满足至少一个收敛准则。
4.如权利要求1所述的方法,其中,评估群集参数(例如,231、232、233)的步骤还包括如下步骤:
-确定是否应该删除选择的群集(例如,230);
-当确定应该删除所选择的群集(例如,230)时,删除所选择的群集(例如,230)。
5.如权利要求4所述的方法,其中,确定是否应该删除选择的群集(例如,230)的步骤包括如下步骤:
-确定所选择的群集(例如,230)是否包括预定数目的来自分割区域(205、210)的像素;以及
-当所选择的群集(230)不包括所述预定数目的来自分割区域(205、210)的像素时,确定应该删除所选择的群集(例如,230)。
6.如权利要求1所述的方法,其中,评估群集参数(例如,231、232、233)的步骤还包括如下步骤:
-确定是否应该分离选择的群集(例如,230);
-当确定应该分离所选择的群集(例如,230)时,将所选择的群集(例如,230)分离成至少两个群集(例如,230)。
7.如权利要求6所述的方法,其中,确定是否应该分离选择的群集(例如,230)的步骤包括如下步骤:
-确定有多少来自分割区域(205、210)的第一像素在所述群集(例如,230)中的第一区之内;
-确定有多少来自分割区域(205、210)的第二像素在所述群集(例如,230)中的第二区之内;
-当所述第二像素与所述第一像素的比率满足预定数时,确定应该分离所选择的群集(例如,230)。
8.如权利要求1所述的方法,其中:
-确定步骤还包括确定前一帧的群集参数(例如,231、232、233)的步骤;
-评估群集(例如,230)的步骤还包括如下步骤:
*通过确定所述图像中有多少像素未分配给群集(例如,230)来确定是否应该增加新群集(例如,230);以及
*当未分配给群集(例如,230)的像素的数目满足预定值时,增加未分配的像素给新群集(例如,230)。
9.如权利要求1所述的方法,其中:
-确定步骤还包括确定前一帧的群集参数(例如,231、232、233)的步骤;
-评估群集(例如,230)的步骤还包括如下步骤:
*通过确定所述图像中有多少像素未分配给群集(例如,230)来确定是否应该增加新群集(例如,230);以及
*对未分配的像素执行连通分量算法以增加至少一个新群集(例如,230)。
10.如权利要求1所述的方法,其中,评估所述至少一个群集(例如,230)的步骤包括:增加新群集(例如,230)、删除当前群集或分离当前群集(例如,230)。
11.如权利要求1所述的方法,其中,分割区域(205、210)是通过背景-前景分割来确定的。
12.如权利要求11所述的方法,其中,所述背景-前景分割包括背景扣除。
13.如权利要求11所述的方法,其中,所述分割区域(205、210)被标记,其中,所述标记通过二值标记来执行,由此背景像素被标记为一种颜色而前景像素被标记为不同颜色。
14.如权利要求1所述的方法,其中,
-每个所述群集(例如,230)是椭圆(例如,230)θk
-属于分割区域(205、210)的每个像素是前景像素;以及
-估计群集参数(例如,231、232、233)的步骤包括如下步骤:
*分配每个前景像素X给每个所述椭圆(例如,230),这样像素属于选择的椭圆(例如,230)的概率P(X|θk)最大化;以及
*估计每个椭圆(例如,230)θk的参数使得分配给选择的椭圆θk的像素在预定误差内。
15.一种系统,包括:
-存储器(130),其存储计算机可读代码;以及
-可操作耦合到所述存储器(130)的处理器(120),所述处理器(120)配置成执行所述计算机可读代码,所述计算机可读代码配置成:
-从包括至少一个分割区域(205、210)的图像来确定至少一个群集(例如,230);
-估计所述至少一个群集的群集参数(例如,231、232、233);以及
-评估所述至少一个群集(例如,230),由此执行评估步骤以确定是否修改所述至少一个群集(例如,230)。
16.一种制造品,包括:
-在其上体现计算机可读代码单元的计算机可读介质,所述计算机可读程序代码单元包括:
-从包括至少一个分割区域(205、210)的图像来确定至少一个群集(例如,230)的步骤;
-估计所述至少一个群集(例如,230)的群集参数(例如,231、232、233)的步骤;以及
-评估所述至少一个群集(例如,230)的步骤,由此执行评估步骤以确定是否修改所述至少一个群集(例如,230)。
CNA028125975A 2001-11-19 2002-10-28 使用概率框架的基于块的分析的计算机视觉方法及系统 Pending CN1799066A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/988,946 US20030095707A1 (en) 2001-11-19 2001-11-19 Computer vision method and system for blob-based analysis using a probabilistic pramework
US09/988,946 2001-11-19

Publications (1)

Publication Number Publication Date
CN1799066A true CN1799066A (zh) 2006-07-05

Family

ID=25534622

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA028125975A Pending CN1799066A (zh) 2001-11-19 2002-10-28 使用概率框架的基于块的分析的计算机视觉方法及系统

Country Status (7)

Country Link
US (1) US20030095707A1 (zh)
EP (1) EP1449167A1 (zh)
JP (1) JP2005509983A (zh)
KR (1) KR20040053337A (zh)
CN (1) CN1799066A (zh)
AU (1) AU2002339653A1 (zh)
WO (1) WO2003044737A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101657840A (zh) * 2007-02-05 2010-02-24 西门子医疗保健诊断公司 用于以显微术进行细胞分析的系统和方法
CN101282461B (zh) * 2007-04-02 2010-06-02 财团法人工业技术研究院 图像处理方法

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7257592B2 (en) * 2003-06-26 2007-08-14 International Business Machines Corporation Replicating the blob data from the source field to the target field based on the source coded character set identifier and the target coded character set identifier, wherein the replicating further comprises converting the blob data from the source coded character set identifier to the target coded character set identifier
US7660463B2 (en) * 2004-06-03 2010-02-09 Microsoft Corporation Foreground extraction using iterated graph cuts
CN1313964C (zh) * 2004-07-05 2007-05-02 南京大学 基于聚类学习器集成的数字图像分割方法
US7409076B2 (en) * 2005-05-27 2008-08-05 International Business Machines Corporation Methods and apparatus for automatically tracking moving entities entering and exiting a specified region
US20080049993A1 (en) * 2006-08-25 2008-02-28 Restoration Robotics, Inc. System and method for counting follicular units
US8027513B2 (en) * 2007-03-23 2011-09-27 Technion Research And Development Foundation Ltd. Bitmap tracker for visual tracking under very general conditions
US8498444B2 (en) 2010-12-13 2013-07-30 Texas Instruments Incorporated Blob representation in video processing
CN102043957B (zh) * 2011-01-11 2016-07-20 北京邮电大学 基于图像凹点的车辆分割方法
US8945150B2 (en) 2011-05-18 2015-02-03 Restoration Robotics, Inc. Systems and methods for selecting a desired quantity of follicular units
US8972061B2 (en) * 2012-11-02 2015-03-03 Irobot Corporation Autonomous coverage robot
US8983157B2 (en) 2013-03-13 2015-03-17 Restoration Robotics, Inc. System and method for determining the position of a hair tail on a body surface
US9202276B2 (en) 2013-03-13 2015-12-01 Restoration Robotics, Inc. Methods and systems for hair transplantation using time constrained image processing
MX2018003323A (es) * 2015-09-16 2018-08-16 Merck Patent Gmbh Metodo para la deteccion e identificacion temprana de colonias microbianas, aparato para llevar a cabo el metodo y programa de computadora.
US10229503B2 (en) 2017-03-03 2019-03-12 Qualcomm Incorporated Methods and systems for splitting merged objects in detected blobs for video analytics
GB2576574B (en) * 2018-08-24 2023-01-11 Cmr Surgical Ltd Image correction of a surgical endoscope video stream
CN109784328B (zh) * 2018-12-19 2022-11-08 新大陆数字技术股份有限公司 定位条码的方法、终端及计算机可读存储介质
US11042969B2 (en) * 2019-05-23 2021-06-22 Adobe Inc. Automatic synthesis of a content-aware sampling region for a content-aware fill
CN110348521A (zh) * 2019-07-12 2019-10-18 创新奇智(重庆)科技有限公司 图像处理聚类方法及其系统、电子设备
CN114827711B (zh) * 2022-06-24 2022-09-20 如你所视(北京)科技有限公司 图像信息显示方法和装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4945478A (en) * 1987-11-06 1990-07-31 Center For Innovative Technology Noninvasive medical imaging system and method for the identification and 3-D display of atherosclerosis and the like
US5548661A (en) * 1991-07-12 1996-08-20 Price; Jeffrey H. Operator independent image cytometer
JP2894113B2 (ja) * 1992-11-04 1999-05-24 松下電器産業株式会社 画像クラスタリング装置
JP3679426B2 (ja) * 1993-03-15 2005-08-03 マサチューセッツ・インスティチュート・オブ・テクノロジー 画像データを符号化して夫々がコヒーレントな動きの領域を表わす複数の層とそれら層に付随する動きパラメータとにするシステム
US5585944A (en) * 1994-05-10 1996-12-17 Kaleida Labs, Inc. Method for compressing and decompressing images by subdividing pixel color distributions
US6184926B1 (en) * 1996-11-26 2001-02-06 Ncr Corporation System and method for detecting a human face in uncontrolled environments
US6263088B1 (en) * 1997-06-19 2001-07-17 Ncr Corporation System and method for tracking movement of objects in a scene
US6272250B1 (en) * 1999-01-20 2001-08-07 University Of Washington Color clustering for scene change detection and object tracking in video sequences
JP4531897B2 (ja) * 1999-12-27 2010-08-25 パナソニック株式会社 人物追跡装置、人物追跡方法及びそのプログラムを記録した記録媒体
US6771818B1 (en) * 2000-04-04 2004-08-03 Microsoft Corporation System and process for identifying and locating people or objects in a scene by selectively clustering three-dimensional regions
US6792134B2 (en) * 2000-12-19 2004-09-14 Eastman Kodak Company Multi-mode digital image processing method for detecting eyes
US6782126B2 (en) * 2001-02-20 2004-08-24 International Business Machines Corporation Method for combining feature distance with spatial distance for segmentation

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101657840A (zh) * 2007-02-05 2010-02-24 西门子医疗保健诊断公司 用于以显微术进行细胞分析的系统和方法
CN101282461B (zh) * 2007-04-02 2010-06-02 财团法人工业技术研究院 图像处理方法

Also Published As

Publication number Publication date
KR20040053337A (ko) 2004-06-23
JP2005509983A (ja) 2005-04-14
EP1449167A1 (en) 2004-08-25
US20030095707A1 (en) 2003-05-22
WO2003044737A1 (en) 2003-05-30
AU2002339653A1 (en) 2003-06-10

Similar Documents

Publication Publication Date Title
CN1799066A (zh) 使用概率框架的基于块的分析的计算机视觉方法及系统
CN109344736B (zh) 一种基于联合学习的静态图像人群计数方法
CN107784663B (zh) 基于深度信息的相关滤波跟踪方法及装置
CN108764085B (zh) 基于生成对抗网络的人群计数方法
Bansal et al. People counting in high density crowds from still images
EP2956891B1 (en) Segmenting objects in multimedia data
JP7026826B2 (ja) 画像処理方法、電子機器および記憶媒体
WO2023083059A1 (zh) 一种路面缺陷检测方法、装置、电子设备和可读存储介质
CN112084901A (zh) 基于gcam的高分辨率sar图像机场跑道区自动检测方法及系统
WO2015153691A2 (en) Computer-implemented methods, computer-readable media, and systems for tracking a plurality of spermatozoa
CN114241548A (zh) 一种基于改进YOLOv5的小目标检测算法
Santos et al. Multiple camera people detection and tracking using support integration
CN111723693A (zh) 一种基于小样本学习的人群计数方法
CN109685045A (zh) 一种运动目标视频跟踪方法及系统
JP2023517309A (ja) 多重免疫蛍光イメージングを使用する組織特性の決定
CN111383244A (zh) 一种目标检测跟踪方法
CN115239644B (zh) 混凝土缺陷识别方法、装置、计算机设备和存储介质
CN111833353B (zh) 一种基于图像分割的高光谱目标检测方法
CN111738164B (zh) 一种基于深度学习的行人检测方法
TWI729587B (zh) 物件定位系統及方法
Lee et al. Model architecture and tile size selection for convolutional neural network training for non-small cell lung cancer detection on whole slide images
Alashban et al. Single convolutional neural network with three layers model for crowd density estimation
CN113096080A (zh) 图像分析方法及系统
CN107832732A (zh) 基于三叉树遍历的车道线检测方法
CN111027482A (zh) 基于运动向量分段分析的行为分析方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication