CN110136150B - 物体图像自动抠取方法和系统 - Google Patents

物体图像自动抠取方法和系统 Download PDF

Info

Publication number
CN110136150B
CN110136150B CN201810128368.4A CN201810128368A CN110136150B CN 110136150 B CN110136150 B CN 110136150B CN 201810128368 A CN201810128368 A CN 201810128368A CN 110136150 B CN110136150 B CN 110136150B
Authority
CN
China
Prior art keywords
block chain
images
image
statistical model
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810128368.4A
Other languages
English (en)
Other versions
CN110136150A (zh
Inventor
刘峡壁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Deep Ai Intelligent Technology Co ltd
Original Assignee
Beijing Deep Ai Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Deep Ai Intelligent Technology Co ltd filed Critical Beijing Deep Ai Intelligent Technology Co ltd
Priority to CN201810128368.4A priority Critical patent/CN110136150B/zh
Publication of CN110136150A publication Critical patent/CN110136150A/zh
Application granted granted Critical
Publication of CN110136150B publication Critical patent/CN110136150B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • G06T5/70
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • G06T7/44Analysis of texture based on statistical description of texture using image operators, e.g. filters, edge density metrics or local histograms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image

Abstract

本发明公开了一种物体图像自动抠取方法,包括:取得物体的不同角度的多个图像,并将图像划分成多个区块;将图像中位置相对应的区块形成区块链,并计算区块链特征值;根据图像从边缘向内的一定区域内的所有区块链的区块链特征值拟合得到第一统计模型,并将所有的区块链分为物体区块链和背景区块链;将图像中所有属于物体区块链的区块组合成物体的大致区域;根据图像中所有不属于大致区域的像素的像素特征值拟合得到第二统计模型,并计算大致区域中的每个像素属于背景的概率;以及将概率大于指定阈值的每个像素作为背景像素,并将每幅图像中背景像素之外的其他像素作为该物体的精确区域。本发明还公开了一种物体图像自动抠取系统,可实现前述方法。

Description

物体图像自动抠取方法和系统
技术领域
本发明涉及图像技术领域,并且特别涉及一种物体图像自动抠取方法和系统。
背景技术
图像中物体抠取(或称为图像语义分割、图像背景去除,以下简称物体图像抠取)技术,用来将图像中的物体区域与背景区域区分开,进而将图像中的背景部分去除、保留用户所要的目标物体部分。
现有的物体图像抠取技术主要分为两类:有人工交互的物体图像抠取和无人工交互的物体图像抠取。前者通过人工在图像上对物体信息(和/或背景信息)进行标记,基于物体区域在特征上的一致性(和/或物体与背景区域在特征上的差异性)进行物体图像抠取,后者在抠取过程中没有人工参与,自动通过与物体区域和背景区域对应的先验知识进行物体图像抠取。
现有的有人工交互的物体图像抠取技术在抠取过程中需要人工参与,而且通常难以保证一次交互即可得到理想的物体图像抠取结果、而往往需要经过多次交互,这使得用户在使用上很不便利、且物体图像抠取的效率很低。相对地,现有的无人工交互的物体图像抠取技术对于物体(和/或背景区域)的先验知识的利用尚不够充分,导致抠取的效果不理想,尤其可靠度不高、稳定性不够,不能保证得到理想的物体图像抠取结果。
发明内容
本发明提出了一种物体图像自动抠取方法和系统,充分利用了不同角度的多张图像中的物体区域与背景区域之间的相关性以及同一图像中物体区域与背景区域之间的差异性等先验知识,从而实现完全自动且高效、高可靠度的物体图像抠取。
在一个方面,提出了一种物体图像自动抠取方法,其包括:取得物体的不同角度的多个图像,并将该些图像分别划分成多个区块;将该些图像中位置相对应的该区块形成区块链,并计算各个该区块链的区块链特征值;根据该些图像从边缘向内的一定区域内的所有区块链的该区块链特征值拟合得到第一统计模型,并基于该第一统计模型将所有的该区块链分为物体区块链和背景区块链;将每幅该些图像中所有属于该物体区块链的该区块组合成该物体的大致区域;根据每幅该些图像中所有不属于该大致区域的像素的像素特征值拟合得到第二统计模型,并根据该第二统计模型计算该大致区域中的每个像素属于背景的概率;以及将该概率大于指定阈值的每个像素作为背景像素,并将每幅该些图像中该背景像素之外的其他像素作为该物体的精确区域。
在一些具体实施例中,将该些图像中位置相对应的该区块形成该区块链,并计算各个该区块链的该区块链特征值的步骤包括:取得各个该区块的特征值;以及将该些图像中位置相对应的该区块依照该些图像的先后顺序形成该区块链,计算该区块链中前后相邻的该些区块的该特征值的差值,并将该差值作为各个该区块链的该区块链特征值。
在一些具体实施例中,根据该些图像从边缘向内的该一定区域内的所有区块链的该区块链特征值拟合得到该第一统计模型,并基于该第一统计模型将所有的该区块链分为该物体区块链和该背景区块链的步骤包括:根据该些图像从边缘向内的多个像素以内的所有该区块链的该区块链特征值拟合得到该第一统计模型;以及根据该第一统计模型计算每个该区块链的概率密度值,当该概率密度值大于第一阈值时将该区块链作为背景区块链,否则作为物体区块链。
在一些具体实施例中,该第一统计模型和该第二统计模型为高斯混合模型。
在一些具体实施例中,将该概率大于该指定阈值的每个像素作为该背景像素,并将每幅该些图像中该背景像素之外的该其他像素作为该物体的该精确区域的步骤包括:将该概率进行平滑处理;将该概率大于该指定阈值的每个像素作为该背景像素,并将每幅该些图像中该背景像素之外的该其他像素作为该物体的该精确区域;以及将该精确区域的边缘进行平滑处理。
在另一个方面,提出了一种物体图像自动抠取系统,其包括处理器和存储器,该存储器中存储有物体图像抠取单元。该物体图像抠取单元用于:取得物体的不同角度的多个图像,并将该些图像分别划分成多个区块;将该些图像中位置相对应的该区块形成区块链,并计算各个该区块链的区块链特征值;根据该些图像从边缘向内的一定区域内的所有区块链的该区块链特征值拟合得到第一统计模型,并基于该第一统计模型将所有的该区块链分为物体区块链和背景区块链;将每幅该些图像中所有属于该物体区块链的该区块组合成该物体的大致区域;根据每幅该些图像中所有不属于该大致区域的像素的像素特征值拟合得到第二统计模型,并根据该第二统计模型计算该大致区域中的每个像素属于背景的概率;以及将该概率大于指定阈值的每个像素作为背景像素,并将每幅该些图像中该背景像素之外的其他像素作为该物体的精确区域。
在一些具体实施例中,该物体图像抠取单元将该些图像中位置相对应的该区块形成该区块链,并计算各个该区块链的该区块链特征值包括:取得各个该区块的特征值;以及将该些图像中位置相对应的该区块依照该些图像的先后顺序形成该区块链,计算该区块链中前后相邻的该些区块的该特征值的差值,并将该差值作为各个该区块链的该区块链特征值。
在一些具体实施例中,该物体图像抠取单元根据该些图像从边缘向内的该一定区域内的所有区块链的该区块链特征值拟合得到该第一统计模型,并基于该第一统计模型将所有的该区块链分为该物体区块链和该背景区块链包括:根据该些图像从边缘向内的多个像素以内的所有该区块链的该区块链特征值拟合得到该第一统计模型;以及根据该第一统计模型计算每个该区块链的概率密度值,当该概率密度值大于第一阈值时将该区块链作为背景区块链,否则作为物体区块链。
在一些具体实施例中,其中该第一统计模型和该第二统计模型为高斯混合模型。
在一些具体实施例中,该物体图像抠取单元将该概率大于该指定阈值的每个像素作为该背景像素,并将每幅该些图像中该背景像素之外的该其他像素作为该物体的该精确区域包括:将该概率进行平滑处理;将该概率大于该指定阈值的每个像素作为该背景像素,并将每幅该些图像中该背景像素之外的该其他像素作为该物体的该精确区域;以及将该精确区域的边缘进行平滑处理。
在另一个方面,提出了一种计算机可读存储介质,其上存储有一或多个计算机程序,其特征在于,该一或多个计算机程序被计算机处理器执行时实现以下步骤:取得物体的不同角度的多个图像,并将该些图像分别划分成多个区块;将该些图像中位置相对应的该区块形成区块链,并计算各个该区块链的区块链特征值;根据该些图像从边缘向内的一定区域内的所有区块链的该区块链特征值拟合得到第一统计模型,并基于该第一统计模型将所有的该区块链分为物体区块链和背景区块链;将每幅该些图像中所有属于该物体区块链的该区块组合成该物体的大致区域;根据每幅该些图像中所有不属于该大致区域的像素的像素特征值拟合得到第二统计模型,并根据该第二统计模型计算该大致区域中的每个像素属于背景的概率;以及将该概率大于指定阈值的每个像素作为背景像素,并将每幅该些图像中该背景像素之外的其他像素作为该物体的精确区域。
在一些具体实施例中,将该些图像中位置相对应的该区块形成该区块链,并计算各个该区块链的该区块链特征值的步骤包括:取得各个该区块的特征值;以及将该些图像中位置相对应的该区块依照该些图像的先后顺序形成该区块链,计算该区块链中前后相邻的该些区块的该特征值的差值,并将该差值作为各个该区块链的该区块链特征值。
在一些具体实施例中,根据该些图像从边缘向内的该一定区域内的所有区块链的该区块链特征值拟合得到该第一统计模型,并基于该第一统计模型将所有的该区块链分为该物体区块链和该背景区块链的步骤包括:根据该些图像从边缘向内的多个像素以内的所有该区块链的该区块链特征值拟合得到该第一统计模型;以及根据该第一统计模型计算每个该区块链的概率密度值,当该概率密度值大于第一阈值时将该区块链作为背景区块链,否则作为物体区块链。
在一些具体实施例中,其中该第一统计模型和该第二统计模型为高斯混合模型。
在一些具体实施例中,将该概率大于该指定阈值的每个像素作为该背景像素,并将每幅该些图像中该背景像素之外的该其他像素作为该物体的该精确区域的步骤包括:将该概率进行平滑处理;将该概率大于该指定阈值的每个像素作为该背景像素,并将每幅该些图像中该背景像素之外的该其他像素作为该物体的该精确区域;以及将该精确区域的边缘进行平滑处理。
本发明通过先利用物体的不同角度的多张图像中物体区域与背景区域之间的相关性来获得该物体的大致区域,而后利用大致区域所反映出的同一个图像中物体区域与背景区域之间的差异性来获得该物体的精确区域,进而实现物体图像抠取,充分利用了不同角度的多张图像中的物体区域与背景区域之间的相关性以及同一图像中物体区域与背景区域之间的差异性等先验知识,从而实现完全自动且高效、高可靠度的物体图像抠取。
附图说明
包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本发明的原理。将容易认识到其它实施例和实施例的很多预期优点,因为通过引用以下详细描述,它们变得被更好地理解。附图的元件不一定是相互按照比例的。同样的附图标记指代对应的类似部件。
图1是根据本发明的一个实施例的物体图像自动抠取方法的流程图;以及
图2是根据本发明的一个实施例的物体图像自动抠取系统的示意图。
具体实施方式
在以下详细描述中,参考附图,该附图形成详细描述的一部分,并且通过其中可实践本发明的说明性具体实施例来示出。应当理解的是,可以利用其他实施例或可以做出逻辑改变,而不背离本发明的范围。因此以下详细描述不应当在限制的意义上被采用,并且本发明的范围由所附权利要求来限定。
图1示出了根据本发明的一个实施例的物体图像自动抠取方法的流程图。在一实施例中,该物体图像自动抠取方法由图2所示的物体图像自动抠取系统实现。如图1所示,该物体图像自动抠取方法包括以下步骤:
S10:取得物体O(图未示)的不同角度的图像I0~IN(图未示),并将图像I1~IN分别划分成多个区块B0~Bn(图未示)。
物体O可以是商品、模型、待测物品等各种类型的物体。图像I0~IN具有相同的大小和分辨率,每个图像I0~IN对应于物体O的一个视角,例如I0对应于物体O的0度视角(即物体O的正面)、I18对应于物体O的180度视角(即物体O的背面)。每个图像I0~IN都以同样的方式被分成多个区块B0~Bn,使得不同图像中对应编号的区块在相对应的位置(区块大小也相同),例如图像I0的区块B0与图像I1的区块B0分别在图像I0与图像I1的同一个位置。可以视实际需求而选择区块B1~Bn的数量,例如要求较高的精细度时,可以划分较多的数量(此时n的值较大)。
在一实施例中,可以控制图像记录装置111(见图2,例如照相机)使图像记录装置111拍摄物体O的不同角度的图像I1~IN(例如控制云台112(见图2)进行360度旋转,并控制图像记录装置111在旋转过程中拍摄云台112上的物体O),而后从该图像记录装置111取得物体O的不同角度的图像I0~IN(例如18张图像I0~I17)。
S20:将图像I0~IN中位置相对应的区块B0~Bn形成区块链L0~Ln(图未示),并计算各个区块链L0~Ln的区块链特征值C0~Cn(图未示)。
在一实施例中,可以先取得区块B0~Bn中的每一个的特征值V0~Vn(图未示)(例如采用每个区块的颜色均值作为特征值)(每个区块对应一个特征值,例如B0对应于V0、Bn对应于Vn),再将图像I0~IN中位置相对应的区块B0~Bn依照图像I0~IN的先后顺序(链接起来)形成区块链L0~Ln(例如将图像I0、I1、…、In-1到In中的区块B0链接形成区块链L0,以及将图像I0、I1、…、In-1到In中的区块Bn链接形成区块链Ln),而后计算区块链L0~Ln中前后相邻的区块(例如L0中图像I0的B0与图像I1的B0、Ln中图像I n-1的Bn与图像In的Bn)的特征值的差值D0~Dn(图未示,例如D0是L0中图像Ii的B0的特征值V0与图像Ii+1的B0的特征值V0的差值,Dn是Ln中图像Ii的Bn的特征值Vn与图像Ii+1的Bn的特征值Vn的差值,其中i=0~n-1),最后将差值D0~Dn作为各个区块链L0~Ln的区块链特征值C0~Cn(图未示,例如C0等于D0、Cn等于Dn)。
S30:根据图像I0~IN从边缘向内的一定区域内的所有区块链的区块链特征值拟合得到第一统计模型M1(图未示)(例如拟合得到高斯混合模型),并基于第一统计模型M1将所有的区块链L0~LN分为物体区块链LO(图未示)和背景区块链LB(图未示)。
第一统计模型M1可以为高斯混合模型(Gaussian mixture model,GMM)或其他的统计模型。
在一实施例中,根据图像I0~IN从边缘向内(缩进)的多个像素以内的所有区块链的区块链特征值(例如根据图像I0~IN从边缘向内缩进的20个像素以内的区块链L0~L5的区块链特征值C0~C5)拟合得到第一统计模型M1,并根据第一统计模型M1计算每个区块链L0~Ln的概率密度值D0~Dn(图未示),当概率密度值大于第一阈值T1(图未示)时将对应的区块链作为背景区块链LB(例如D0大于第一阈值T1时,将区块链L0分类为背景区块链LB),否则分类为物体区块链LO
S40:将每幅图像I0~IN中所有属于物体区块链LO的区块组合成物体O的大致区域RR(图未示)。
例如当区块链L6~I10属于物体区块链LO时,将区块链L6~I10中的所有区块B6~B10组合成物体O的大致区域RR
S50:根据每幅图像I0~IN中所有不属于大致区域RR的像素的像素特征值(例如Lab特征值)拟合得到第二统计模型M2(图未示)(例如拟合得到高斯混合模型),并根据第二统计模型M2计算大致区域R中的每个像素属于背景B(图未示)的概率P(图未示)(例如计算每个像素到高斯混合模型中各个高斯成分均值的最短距离,然后利用指数函数将距离值转换为概率P)。
第二统计模型M2可以为高斯混合模型或其他的统计模型。
S60:将概率P大于指定阈值Ts(图未示)的每个像素作为背景像素,并将每幅图像I0~IN中背景像素之外的其他像素作为物体O的精确区域RA(图未示)。
在一实施例中,可以先将概率P进行平滑处理,再将概率P大于指定阈值Ts的每个像素作为背景像素,而后将每幅图像I0~IN中背景像素之外的其他像素作为物体O的精确区域RA,最后将精确区域RA的边缘进行平滑处理,从而完成物体图像抠取。
图2示出了根据本发明的一个实施例的物体图像自动抠取系统的示意图。如图2所示,物体图像自动抠取系统100包括图像记录单元110和物体图像抠取单元120。
物体图像自动抠取系统100是一种计算设备(例如服务器、电脑和移动智能终端),包括处理器和存储器。该处理器是一种集成电路芯片,例如微处理器(central processingunit,CPU)、数字信号处理器(digital signal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现成可编程门阵列(field-programmable gate array,FPGA)或其他可编程逻辑器件,用来执行该存储器中所存储的计算机程序。该存储器中存储有物体图像抠取单元120,物体图像抠取单元120包括用来实现图1所示的该物体图像自动抠取方法的计算机程序。
在一实施例中,图像记录单元110包括图像记录装置111(例如照相机)和云台112。物体图像自动抠取系统100控制图像记录单元110使图像记录装置111拍摄物体O的不同角度的图像I1~IN(例如控制图像记录单元110的云台112进行360度旋转,并控制图像记录单元110的图像记录装置111在旋转过程中拍摄云台112上的物体O),而后使物体图像抠取单元120从图像记录单元110的图像记录装置111取得物体O的不同角度的图像I0~IN。在其他实施例中,图像记录单元110和物体图像抠取单元120可以是独立的计算设备,包括各自的处理器和存储器,图像记录单元110和物体图像抠取单元120之间通过网络等渠道进行通信,使得物体图像抠取单元120可以要求图像记录单元110拍摄物体O的不同角度的图像I1~IN,而后从图像记录单元110取得物体O的图像I0~IN
物体图像抠取单元120(中的计算机程序)取得物体O的不同角度的图像I0~IN,并将图像I1~IN分别划分成多个区块B0~Bn;将图像I0~IN中位置相对应的区块B0~Bn形成区块链L0~Ln,并计算各个区块链L0~Ln的区块链特征值C0~Cn;根据图像I0~IN从边缘向内的一定区域A内的所有区块链的区块链特征值拟合得到第一统计模型M1,并基于第一统计模型M1将所有的区块链L0~LN分为物体区块链LO和背景区块链LB;将每幅图像I0~IN中所有属于物体区块链LO的区块组合成物体O的大致区域RR;根据每幅图像I0~IN中所有不属于大致区域RR的像素的像素特征值拟合得到第二统计模型M2,并根据第二统计模型M2计算大致区域R中的每个像素属于背景B的概率P;将概率P大于指定阈值Ts的每个像素作为背景像素,并将每幅图像I0~IN中背景像素之外的其他像素作为物体O的精确区域RA。其中第一统计模型M1和第二统计模型M2可以为高斯混合模型或其他统计模型。
在一实施例中,物体图像抠取单元120可以先取得区块B0~Bn中的每一个的特征值V0~Vn,再将图像I0~IN中位置相对应的区块B0~Bn依照图像I0~IN的先后顺序形成区块链L0~Ln,而后计算区块链L0~Ln中前后相邻的区块的特征值的差值D0~Dn,最后将差值D0~Dn作为各个区块链L0~Ln的区块链特征值C0~Cn
此外,在一实施例中,物体图像抠取单元120可以根据图像I0~IN从边缘向内的多个像素以内的所有区块链的区块链特征值拟合得到第一统计模型M1,并根据第一统计模型M1计算每个区块链L0~Ln的概率密度值D0~Dn,当概率密度值大于第一阈值T1时将对应的区块链作为背景区块链LB,否则作为物体区块链LO
再者,在一实施例中,物体图像抠取单元120可以先将概率P进行平滑处理,再将概率P大于指定阈值Ts的每个像素作为背景像素,而后将每幅图像I0~IN中背景像素之外的其他像素作为物体O的精确区域RA,最后将精确区域RA的边缘进行平滑处理,从而完成物体图像抠取。
本发明通过先利用物体的不同角度的多张图像中物体区域与背景区域之间的相关性来获得该物体的大致区域,而后利用大致区域所反映出的同一个图像中物体区域与背景区域之间的差异性来获得该物体的精确区域,进而实现物体图像抠取,充分利用了不同角度的多张图像中的物体区域与背景区域之间的相关性以及同一图像中物体区域与背景区域之间的差异性等先验知识,从而实现完全自动且高效、高可靠度的物体图像抠取。通过本发明,可以快速、高精度、高可靠、全自动地从固定背景下的多幅图像中去除背景,从而获得仅包含物体的图像。本发明可以应用在商品三维成像等领域中。实测数据表明,通过使用本发明的物体图像自动抠取方法或系统,对于各种类型的商品,其图像背景去除的精确度平均达95%以上,且其在当前主流计算机上处理每幅图像的平均时间<=1秒。
显然,本领域技术人员在不偏离本发明的精神和范围的情况下可以作出对本发明的实施例的各种修改和改变。以该方式,如果这些修改和改变处于本发明的权利要求及其等同形式的范围内,则本发明还旨在涵盖这些修改和改变。词语“包括”不排除未在权利要求中列出的其它元件或步骤的存在。某些措施记载在相互不同的从属权利要求中的简单事实不表明这些措施的组合不能被用于获利。权利要求中的任何附图标记不应当被认为限制范围。

Claims (15)

1.一种物体图像自动抠取方法,其特征在于,包括:
取得物体的不同角度的多个图像,并将该些图像分别划分成多个区块,不同角度的图像具有相同的大小和分辨率,每个图像对应于物体的一个视角,每个图像都以同样的方式被分成多个区块,使得不同图像中对应编号的区块在相对应的位置,区块大小也相同;
将该些图像中位置相对应的该区块形成区块链,并计算各个该区块链的区块链特征值;
根据该些图像从边缘向内的一定区域内的所有区块链的该区块链特征值拟合得到第一统计模型,并基于该第一统计模型将所有的该区块链分为物体区块链和背景区块链;
将每幅该些图像中所有属于该物体区块链的该区块组合成该物体的大致区域;
根据每幅该些图像中所有不属于该大致区域的像素的像素特征值拟合得到第二统计模型,并根据该第二统计模型计算该大致区域中的每个像素属于背景的概率;以及将该概率大于指定阈值的每个像素作为背景像素,并将每幅该些图像中该背景像素之外的其他像素作为该物体的精确区域。
2.根据权利要求1所述的方法,其特征在于,将该些图像中位置相对应的该区块形成该区块链,并计算各个该区块链的该区块链特征值的步骤包括:
取得各个该区块的特征值;以及将该些图像中位置相对应的该区块依照该些图像的先后顺序形成该区块链,计算该区块链中前后相邻的该些区块的该特征值的差值,并将该差值作为各个该区块链的该区块链特征值。
3.根据权利要求1所述的方法,其特征在于,根据该些图像从边缘向内的该一定区域内的所有区块链的该区块链特征值拟合得到该第一统计模型,并基于该第一统计模型将所有的该区块链分为该物体区块链和该背景区块链的步骤包括:
根据该些图像从边缘向内的多个像素以内的所有该区块链的该区块链特征值拟合得到该第一统计模型;以及根据该第一统计模型计算每个该区块链的概率密度值,当该概率密度值大于第一阈值时将该区块链作为背景区块链,否则作为物体区块链。
4.根据权利要求1所述的方法,其特征在于,其中该第一统计模型和该第二统计模型为高斯混合模型。
5.根据权利要求1所述的方法,其特征在于,将该概率大于该指定阈值的每个像素作为该背景像素,并将每幅该些图像中该背景像素之外的该其他像素作为该物体的该精确区域的步骤包括:
将该概率进行平滑处理;
将进行平滑处理之后得到的概率大于该指定阈值的每个像素作为该背景像素,并将每幅该些图像中该背景像素之外的该其他像素作为该物体的该精确区域;以及将该精确区域的边缘进行平滑处理。
6.一种物体图像自动抠取系统,包括处理器和存储器,该存储器中存储有物体图像抠取单元,其特征在于,该物体图像抠取单元用于:
取得物体的不同角度的多个图像,并将该些图像分别划分成多个区块,不同角度的图像具有相同的大小和分辨率,每个图像对应于物体的一个视角,每个图像都以同样的方式被分成多个区块,使得不同图像中对应编号的区块在相对应的位置,区块大小也相同;
将该些图像中位置相对应的该区块形成区块链,并计算各个该区块链的区块链特征值;
根据该些图像从边缘向内的一定区域内的所有区块链的该区块链特征值拟合得到第一统计模型,并基于该第一统计模型将所有的该区块链分为物体区块链和背景区块链;
将每幅该些图像中所有属于该物体区块链的该区块组合成该物体的大致区域;
根据每幅该些图像中所有不属于该大致区域的像素的像素特征值拟合得到第二统计模型,并根据该第二统计模型计算该大致区域中的每个像素属于背景的概率;以及将该概率大于指定阈值的每个像素作为背景像素,并将每幅该些图像中该背景像素之外的其他像素作为该物体的精确区域。
7.根据权利要求6所述的系统,其特征在于,该物体图像抠取单元将该些图像中位置相对应的该区块形成该区块链,并计算各个该区块链的该区块链特征值包括:
取得各个该区块的特征值;以及将该些图像中位置相对应的该区块依照该些图像的先后顺序形成该区块链,计算该区块链中前后相邻的该些区块的该特征值的差值,并将该差值作为各个该区块链的该区块链特征值。
8.根据权利要求6所述的系统,其特征在于,该物体图像抠取单元根据该些图像从边缘向内的该一定区域内的所有区块链的该区块链特征值拟合得到该第一统计模型,并基于该第一统计模型将所有的该区块链分为该物体区块链和该背景区块链包括:
根据该些图像从边缘向内的多个像素以内的所有该区块链的该区块链特征值拟合得到该第一统计模型;以及根据该第一统计模型计算每个该区块链的概率密度值,当该概率密度值大于第一阈值时将该区块链作为背景区块链,否则作为物体区块链。
9.根据权利要求6所述的系统,其特征在于,其中该第一统计模型和该第二统计模型为高斯混合模型。
10.根据权利要求6所述的系统,其特征在于,该物体图像抠取单元将该概率大于该指定阈值的每个像素作为该背景像素,并将每幅该些图像中该背景像素之外的该其他像素作为该物体的该精确区域包括:
将该概率进行平滑处理;
将进行平滑处理之后得到的概率大于该指定阈值的每个像素作为该背景像素,并将每幅该些图像中该背景像素之外的该其他像素作为该物体的该精确区域;以及将该精确区域的边缘进行平滑处理。
11.一种计算机可读存储介质,其上存储有一或多个计算机程序,其特征在于,该一或多个计算机程序被计算机处理器执行时实现以下步骤:
取得物体的不同角度的多个图像,并将该些图像分别划分成多个区块,不同角度的图像具有相同的大小和分辨率,每个图像对应于物体的一个视角,每个图像都以同样的方式被分成多个区块,使得不同图像中对应编号的区块在相对应的位置(区块大小也相同);
将该些图像中位置相对应的该区块形成区块链,并计算各个该区块链的区块链特征值;
根据该些图像从边缘向内的一定区域内的所有区块链的该区块链特征值拟合得到第一统计模型,并基于该第一统计模型将所有的该区块链分为物体区块链和背景区块链;
将每幅该些图像中所有属于该物体区块链的该区块组合成该物体的大致区域;
根据每幅该些图像中所有不属于该大致区域的像素的像素特征值拟合得到第二统计模型,并根据该第二统计模型计算该大致区域中的每个像素属于背景的概率;以及将该概率大于指定阈值的每个像素作为背景像素,并将每幅该些图像中该背景像素之外的其他像素作为该物体的精确区域。
12.根据权利要求11所述的计算机可读存储介质,其特征在于,将该些图像中位置相对应的该区块形成该区块链,并计算各个该区块链的该区块链特征值的步骤包括:
取得各个该区块的特征值;以及将该些图像中位置相对应的该区块依照该些图像的先后顺序形成该区块链,计算该区块链中前后相邻的该些区块的该特征值的差值,并将该差值作为各个该区块链的该区块链特征值。
13.根据权利要求11所述的计算机可读存储介质,其特征在于,根据该些图像从边缘向内的该一定区域内的所有区块链的该区块链特征值拟合得到该第一统计模型,并基于该第一统计模型将所有的该区块链分为该物体区块链和该背景区块链的步骤包括:
根据该些图像从边缘向内的多个像素以内的所有该区块链的该区块链特征值拟合得到该第一统计模型;以及根据该第一统计模型计算每个该区块链的概率密度值,当该概率密度值大于第一阈值时将该区块链作为背景区块链,否则作为物体区块链。
14.根据权利要求11所述的计算机可读存储介质,其特征在于,其中该第一统计模型和该第二统计模型为高斯混合模型。
15.根据权利要求11所述的计算机可读存储介质,其特征在于,将该概率大于该指定阈值的每个像素作为该背景像素,并将每幅该些图像中该背景像素之外的该其他像素作为该物体的该精确区域的步骤包括:
将该概率进行平滑处理;
将进行平滑处理之后得到的概率大于该指定阈值的每个像素作为该背景像素,并将每幅该些图像中该背景像素之外的该其他像素作为该物体的该精确区域;以及将该精确区域的边缘进行平滑处理。
CN201810128368.4A 2018-02-08 2018-02-08 物体图像自动抠取方法和系统 Active CN110136150B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810128368.4A CN110136150B (zh) 2018-02-08 2018-02-08 物体图像自动抠取方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810128368.4A CN110136150B (zh) 2018-02-08 2018-02-08 物体图像自动抠取方法和系统

Publications (2)

Publication Number Publication Date
CN110136150A CN110136150A (zh) 2019-08-16
CN110136150B true CN110136150B (zh) 2021-03-16

Family

ID=67567338

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810128368.4A Active CN110136150B (zh) 2018-02-08 2018-02-08 物体图像自动抠取方法和系统

Country Status (1)

Country Link
CN (1) CN110136150B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101017573A (zh) * 2007-02-09 2007-08-15 南京大学 一种基于视频监控的运动目标检测与识别方法
KR20070117432A (ko) * 2006-06-08 2007-12-12 경희대학교 산학협력단 다시점 비디오 코딩에서의 움직임 벡터 예측 방법 및 이를이용한 다시점 영상의 부호화/복호화 방법 및 장치
KR20090002412A (ko) * 2007-06-28 2009-01-09 광주과학기술원 매크로블록 단위의 변이 예측을 이용한 움직임 정보 공유방법 및 장치 및 그리고 이를 이용한 다시점 비디오 영상부호화/복호화 방법 및 장치
CN101491096A (zh) * 2006-07-12 2009-07-22 Lg电子株式会社 信号处理方法及其装置
CN101833760A (zh) * 2010-03-29 2010-09-15 中山大学 一种基于图像块的背景建模方法及背景建模装置
KR20120071226A (ko) * 2010-12-22 2012-07-02 한국전자통신연구원 객체 추출 방법 및 그 장치
CN102611829A (zh) * 2012-02-03 2012-07-25 安徽云森物联网科技有限公司 一种基于块分割的图像去交织方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070117432A (ko) * 2006-06-08 2007-12-12 경희대학교 산학협력단 다시점 비디오 코딩에서의 움직임 벡터 예측 방법 및 이를이용한 다시점 영상의 부호화/복호화 방법 및 장치
CN101491096A (zh) * 2006-07-12 2009-07-22 Lg电子株式会社 信号处理方法及其装置
CN101017573A (zh) * 2007-02-09 2007-08-15 南京大学 一种基于视频监控的运动目标检测与识别方法
KR20090002412A (ko) * 2007-06-28 2009-01-09 광주과학기술원 매크로블록 단위의 변이 예측을 이용한 움직임 정보 공유방법 및 장치 및 그리고 이를 이용한 다시점 비디오 영상부호화/복호화 방법 및 장치
CN101833760A (zh) * 2010-03-29 2010-09-15 中山大学 一种基于图像块的背景建模方法及背景建模装置
KR20120071226A (ko) * 2010-12-22 2012-07-02 한국전자통신연구원 객체 추출 방법 및 그 장치
CN102611829A (zh) * 2012-02-03 2012-07-25 安徽云森物联网科技有限公司 一种基于块分割的图像去交织方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于像素与子块的背景建模级联算法;解文华 等;《通信学报》;20130430;第34卷(第4期);第194-200页 *

Also Published As

Publication number Publication date
CN110136150A (zh) 2019-08-16

Similar Documents

Publication Publication Date Title
CN108765278B (zh) 一种图像处理方法、移动终端及计算机可读存储介质
US9521391B2 (en) Settings of a digital camera for depth map refinement
US9773302B2 (en) Three-dimensional object model tagging
CN110378945B (zh) 深度图处理方法、装置和电子设备
US9646370B2 (en) Automatic detection method for defects of a display panel
CN114520894B (zh) 投影区域确定方法、装置、投影设备及可读存储介质
CN109145931A (zh) 物体检测方法、装置及存储介质
US10742852B2 (en) Image processing apparatus, object shape estimation method, and storage medium
CN114359412B (zh) 一种面向建筑数字孪生的相机外参自动标定方法及系统
CN107221005B (zh) 物体检测方法及装置
CN111220235B (zh) 水位监测方法及装置
US20180101979A1 (en) Image processing apparatus and image processing method
CN114520895B (zh) 投影控制方法、装置、投影光机及可读存储介质
CN110766731A (zh) 一种全景影像与点云自动配准的方法、装置及存储介质
CN106360941A (zh) 一种指甲定位方法及美甲设备
CN110136150B (zh) 物体图像自动抠取方法和系统
WO2021195873A1 (zh) 识别sfr测试卡图像中感兴趣区域的方法及装置、介质
CN108353143B (zh) 在不规则形状显示表面上投射图像
CN116051736A (zh) 一种三维重建方法、装置、边缘设备和存储介质
CN115761270A (zh) 色卡的检测方法、装置、电子设备及存储介质
JP2011113177A (ja) 被写体3次元モデルを構築する方法およびプログラム
CN113469171A (zh) 识别sfr测试卡图像中感兴趣区域的方法及装置、介质
CN112184808A (zh) 一种高尔夫球置顶式检测方法、系统及存储介质
CN108965867A (zh) 一种相机图像参数计算方法及装置
EP4171015A1 (en) Handling blur in multi-view imaging

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant