CN106650777B - 结合字典群的目标分割方法 - Google Patents

结合字典群的目标分割方法 Download PDF

Info

Publication number
CN106650777B
CN106650777B CN201610898208.9A CN201610898208A CN106650777B CN 106650777 B CN106650777 B CN 106650777B CN 201610898208 A CN201610898208 A CN 201610898208A CN 106650777 B CN106650777 B CN 106650777B
Authority
CN
China
Prior art keywords
shape
dictionary
log
polar
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610898208.9A
Other languages
English (en)
Other versions
CN106650777A (zh
Inventor
姚劲草
于慧敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201610898208.9A priority Critical patent/CN106650777B/zh
Publication of CN106650777A publication Critical patent/CN106650777A/zh
Application granted granted Critical
Publication of CN106650777B publication Critical patent/CN106650777B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种结合字典群的目标分割方法。该方法首先对训练形状集进行对数极坐标变换和模糊对数极坐标分解;利用分解获得的子形状集和原始训练集的对数极坐标变换组成形状集群;基于形状集群构造字典群;结合字典群构造字典群约束主项和辅项;结合底层概率形状函数构造统一分割模型;初始化稀疏系数和底层概率形状,利用标准梯度下降法和软阈值法进行函数最优化求解;通过判断优化是否收敛决定迭代或输出目标分割结果;本发明克服了小样本训练集背景下,目标存在局部形变时,现有稀疏形状表示方法无法充分利用训练集样本的局部信息重建目标形状的问题;同时也大幅提高了稀疏形状表示在目标与训练形状存在较大整体差异情况下的目标的表达能力。

Description

结合字典群的目标分割方法
技术领域
本发明涉及基于先验形状的图像目标分割领域,尤其涉及一种结合字典群的目标分割方法。
背景技术
利用计算机模拟人眼的功能准确分割图像中的目标,对于计算机视觉和图像处理至关重要。由于实际图像中的目标可能存在噪声、遮挡、缺损或背景粘连等因素的影响,仅依赖图像本身信息对目标进行分割往往效果不佳。结合先验形状生成形状字典,并利用稀疏形状表示指导目标分割可以较好的改善分割效果,因此近期基于字典和稀疏形状表示的目标分割技术成为了研究热点。
虽然基于形状字典和稀疏形状表示的目标分割方法研究已经取得了一定进展,现有的方法主要是基于全局形状结构的稀疏组合进行约束,这种约束方法的优点是有利于确保形状先验的整体刚性,而刚性的特点是可以较好的恢复目标因损坏、粘连或遮挡而缺失的原始形状。但同时这也带来两个弊端,首先它要求训练集中的形状近邻和目标原始形状具有较高的全局相似度。众所周知,在很多目标分割的应用场合,我们常常只能获得有限的训练样本,而在小样本的情况下训练集很难符合上述标准。其次,基于形状整体刚性的稀疏表示,一定程度上削弱了形状先验的模型的局部形变能力。当目标存在局部形变时,稀疏表形状示由于受全局刚性的影响,很难针对目标的局部形变重建一个较好的稀疏形状组合来准确表达目标原始形状。
如何在保持一定刚性的前提下,充分挖掘训练集中蕴含的形状信息,同时允许模型对目标形状的局部形变进行相应调整是完善现有稀疏形状表示的一个重要课题。针对这些问题,本发明提出了一种既能保持重建稀疏形状组合的刚性特点,同时也考虑目标存在局部形变的结合字典群的目标分割模型。该模型克服了小样本训练集背景下,目标存在局部形变时,现有稀疏形状表示方法无法充分利用训练集样本的局部信息重建目标形状的问题;同时也大幅提高了目标与训练形状存在较大整体差异情况下的目标的表达能力。
发明内容
本发明要解决的技术问题是提供一种涉及字典群的目标分割方法,该方法克服了现有分割模型抗几何形变能力弱,有噪声情况下形状表示能力差,分割效果不佳的问题。
本发明通过以下技术方案来解决上述技术问题:
一种结合字典群的目标分割方法,包括以下步骤:
S1:对原始训练形状集进行对数极坐标变换得到训练集对数极坐标形状,并对原始训练形状集进行模糊对数极坐标分解获得子形状集,利用所述子形状集和训练集对数极坐标形状组成形状集群;
S2:基于所述形状集群构造字典群,并结合所述字典群构造字典群约束主项和辅项;
S3:使用所述字典群约束主项和辅项结合底层概率形状函数构造统一分割模型;
S4:初始化基于字典群的稀疏系数和所述底层概率形状函数;
S5:由所述底层概率形状函数得到底层概率形状,并将所述底层概率形状嵌入所述字典群约束主项;
S6:利用标准梯度下降法和软阈值法对所述统一分割模型的能量函数进行最优化求解;
S7:判断优化结果是否收敛;若不收敛,则返回步骤S5继续执行直至收敛。
进一步的,步骤S2中,所述字典群约束主项和辅项的表达式为:
其中,等式右侧第一项为主项,第二项为辅项;s为稀疏系数;ti为第i个局部约束系数;A为主字典;Di为第i个子字典;qL为输入对数极坐标形状;Gi(·)为第i个模糊对数极坐标变换子;ωi为第i个权重系数;n为子字典个数;A和Di构成过完备字典群。
进一步的,步骤S3中,所述统一分割模型的表达式为:
其中,s为稀疏系数;ti为第i个局部约束系数;M为映射空间变换矩阵;为A主字典;Di为第i个子字典;为训练集对数极坐标平均形状;Gi(·)为第i个模糊对数极坐标变换子;ωi为第i个权重系数;n为子字典个数;A和Di构成过完备字典群;φL为输入对数极坐标概率形状;φ为原始概率形状;ro是目标概率分布,rb是背景概率分布。
与现有技术相比,本发明有如下优点:
本发明提供了一种结合字典群的目标分割方法,涉及过完备字典群和稀疏形状表示,包括对训练形状集进行对数极坐标变换和模糊对数极坐标分解;利用分解获得的子形状集和原始训练集的对数极坐标变换组成形状集群;基于形状集群构造字典群;结合字典群构造字典群约束主项和辅项;结合底层概率形状函数构造统一分割模型;初始化稀疏系数和底层概率形状,利用标准梯度下降法和软阈值法进行函数最优化求解;通过判断优化是否收敛决定迭代或输出目标分割结果。
本发明的目标分割方法克服了现有方法利用全局形状结构作为约束导致的局部形变能力不足的问题。具体来说,本发明的目标分割方法克服了小样本训练集背景下,目标存在局部形变时,现有方法无法充分利用训练集样本的局部信息重建目标形状的问题;同时也大幅提高了分割模型在目标与训练形状存在较大整体差异情况下的目标的表达能力。
附图说明
图1为本发明的结合过完备字典群的目标分割方法的总体流程图。
图2为本发明的模糊对数极坐标分解中的隶属度函数。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及具体实施方式对本发明作进一步的详细描述。
实施例
如图1所示,本实施例提供一种结合过完备字典群的目标分割方法,包括以下步骤:
A1:对训练形状集进行对数极坐标变换和模糊对数极坐标分解;
A2:利用分解获得的子形状集和原始训练集对数极坐标变换组成形状集群;
A3:基于形状集群构造字典群;
A4:结合字典群构造字典群约束主项和辅项;
A5:结合底层概率形状函数构造统一分割模型;
A6:初始化稀疏系数和概率形状函数;
A7:将底层概率形状嵌入字典群约束主项;
A8:利用标准梯度下降法和软阈值法进行函数最优化求解;
A9:判断优化结果是否收敛;若不收敛,则返回A7继续执行直至收敛。
进一步,所述步骤A1假设存在训练形状集包含N个形状样本,其图像坐标定义在笛卡尔坐标系下;则对数极坐标坐标系下的坐标点定义为:y=[y1,y2]∈R2,其中y1表示对数对数半径,y2表示角度。对于任意笛卡尔坐标系下的点x=[x1,x2]∈R2与对数极坐标系下相应点的转换公式为
分解边缘采用模糊隶属度函数进行定义可以解决形状分解产生的块效应。本实施方案采用如图2所示梯形模糊隶属度函数G1到G4,将对数极坐标形状分解为4个子形状。
进一步,所述步骤A2将原始训练形状的对数极坐标形状作为主形状集;将所有G1分解所得的形状列为子形状集1;以此类推,G2到G4对应子形状集2到4。
进一步,所述A3基于形状集群构造字典群,这里采用主成分分析的方法。假设qi是训练集的一个元素,其基于主成分分析的重建表达式为其中ai,j重建系数,ai=[ai,1,ai,2,…,ai,n]T,表示任意一组稀疏系数。则主形状集对应的主字典为同理可获得子形状集相应子字典D1到D4;则由主字典A和子字典D1到D4可构成字典群。
进一步,所述A4中结合底层概率形状函数的统一分割模型表达式为:
其中,s为稀疏系数;ti为第i个局部约束系数;M为主成分分析映射空间变换矩阵;为A主字典;Di为第i个子字典;为训练集对数极坐标平均形状;Gi(·)为第i个模糊对数极坐标变换子;ωi为第i个权重系数;n为子字典个数;A和Di构成过完备字典群;φL为输入对数极坐标概率形状;φ为原始概率形状;ro是目标概率分布,rb是背景概率分布。
进一步,所述A6初始化方法为令初始概率形状函数为圆,其半径为图像宽度三分一,令稀疏系数和约束参数为
其中,N为训练集样本个数;n=4为分解个数。
进一步,所述A7所述嵌入方法为为将原始概率形状φ变换为对数极坐标概率形状φL并嵌入字典群约束主项。
进一步,所述A9误差函数定义为
可以根据具体应用设置e(s,φ)阈值,确定何时结束算法迭代。
以上实施例仅为本发明的一种实施方式,其描述较为具体和详细,但不能因此而理解为对本发明专利范围的限制。其具体结构和参数可根据实际需要进行相应的调整。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (1)

1.一种结合字典群的目标分割方法,其特征在于,包括以下步骤:
S1:对原始训练形状集进行对数极坐标变换得到训练集对数极坐标形状,并对原始训练形状集进行模糊对数极坐标分解获得子形状集,利用所述子形状集和训练集对数极坐标形状组成形状集群;
S2:基于所述形状集群构造字典群,并结合所述字典群构造字典群约束主项和辅项,所述字典群约束主项和辅项的表达式为:
其中,等式右侧第一项为主项,第二项为辅项;s为稀疏系数;ti为第i个局部约束系数;A为主字典;Di为第i个子字典;qL为输入对数极坐标形状;Gi(·)为第i个模糊对数极坐标变换子;ωi为第i个权重系数;n为子字典个数;A和Di构成过完备字典群;
S3:使用所述字典群约束主项和辅项结合底层概率形状函数构造统一分割模型,所述统一分割模型的表达式为:
其中,s为稀疏系数;ti为第i个局部约束系数;M为映射空间变换矩阵;A 为主字典;Di为第i个子字典;为训练集对数极坐标平均形状;Gi(·)为第i个模糊对数极坐标变换子;ωi为第i个权重系数;n为子字典个数;A和Di构成过完备字典群;φL为输入对数极坐标概率形状;φ为原始概率形状;ro是目标概率分布,rb是背景概率分布;
S4:初始化基于字典群的稀疏系数和所述底层概率形状函数;
S5:由所述底层概率形状函数得到底层概率形状,并将所述底层概率形状嵌入所述字典群约束主项;
S6:利用标准梯度下降法和软阈值法对所述统一分割模型的能量函数进行最优化求解;
S7:判断优化结果是否收敛;若不收敛,则返回步骤S5继续执行直至收敛。
CN201610898208.9A 2016-10-14 2016-10-14 结合字典群的目标分割方法 Expired - Fee Related CN106650777B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610898208.9A CN106650777B (zh) 2016-10-14 2016-10-14 结合字典群的目标分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610898208.9A CN106650777B (zh) 2016-10-14 2016-10-14 结合字典群的目标分割方法

Publications (2)

Publication Number Publication Date
CN106650777A CN106650777A (zh) 2017-05-10
CN106650777B true CN106650777B (zh) 2019-07-05

Family

ID=58855191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610898208.9A Expired - Fee Related CN106650777B (zh) 2016-10-14 2016-10-14 结合字典群的目标分割方法

Country Status (1)

Country Link
CN (1) CN106650777B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113365298B (zh) * 2021-04-22 2022-08-02 山东师范大学 基于高阶模糊认知图的mr网络信号强度预测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101609553A (zh) * 2009-07-20 2009-12-23 浙江大学 基于隐含形状表示和边缘信息融合的非刚体图像配准算法
CN102096819A (zh) * 2011-03-11 2011-06-15 西安电子科技大学 利用稀疏表示与字典学习进行图像分割的方法
CN104376538A (zh) * 2014-11-26 2015-02-25 清华大学深圳研究生院 一种图像的稀疏去噪方法
CN105046714A (zh) * 2015-08-18 2015-11-11 浙江大学 一种非监督的基于超像素和目标发现机制的图像分割方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101609553A (zh) * 2009-07-20 2009-12-23 浙江大学 基于隐含形状表示和边缘信息融合的非刚体图像配准算法
CN102096819A (zh) * 2011-03-11 2011-06-15 西安电子科技大学 利用稀疏表示与字典学习进行图像分割的方法
CN104376538A (zh) * 2014-11-26 2015-02-25 清华大学深圳研究生院 一种图像的稀疏去噪方法
CN105046714A (zh) * 2015-08-18 2015-11-11 浙江大学 一种非监督的基于超像素和目标发现机制的图像分割方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A new sparse representation-based object segmentation framework;Jincao Yao等;《journal of the visual computer》;20151230;第33卷(第2期);第3节-第5节,图1、图3
Shape Sparse Representation for Joint Object Classification and Segmentation;Fei Chen等;《IEEE TRANSACTIONS ON IMAGE PROCESSING》;20121022;第22卷(第3期);第992-1004页
Unsupervised images segmentation via incremental dictionary learning based sparse representation;Shuyuan Yang等;《Information Sciences》;20140124;第269卷;摘要、第1节、第2.3节

Also Published As

Publication number Publication date
CN106650777A (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
US11514947B1 (en) Method for real-time video processing involving changing features of an object in the video
CN111598998B (zh) 三维虚拟模型重建方法、装置、计算机设备和存储介质
CN108961272B (zh) 一种基于深度卷积对抗生成网络的皮肤病图像的生成方法
CN110459317B (zh) 基于动态脑网络图核的阿尔茨海默病辅助诊断系统及方法
CN107633522A (zh) 基于局部相似性活动轮廓模型的脑部图像分割方法和系统
CN104217406B (zh) 一种基于剪切波系数处理的sar图像降噪方法
CN105389821B (zh) 一种基于云模型和图割相结合的医学图像分割方法
CN109712161A (zh) 一种图像分割方法、装置、设备及存储介质
Kitrungrotsakul et al. Liver segmentation using superpixel-based graph cuts and restricted regions of shape constrains
CN106295639A (zh) 一种虚拟现实终端以及目标图像的提取方法和装置
US20230289402A1 (en) Joint perception model training method, joint perception method, device, and storage medium
CN109948575A (zh) 超声图像中眼球区域分割方法
Bhatt et al. Take a walk, grow a tree
CN108305268A (zh) 一种图像分割方法及装置
CN117454495B (zh) 一种基于建筑草图轮廓序列的cad矢量模型生成方法及装置
CN109961129A (zh) 一种基于改进粒子群的海上静止目标搜寻方案生成方法
CN106650777B (zh) 结合字典群的目标分割方法
CN109376651A (zh) 一种基于cuda架构的gpu加速锋电位分类的系统
CN111652329B (zh) 一种图像分类方法、装置、存储介质和电子设备
CN105894519A (zh) 一种基于低秩恢复的鲁棒性图像分割算法
CN116703992A (zh) 一种三维点云数据精确配准方法、装置、设备及存储介质
CN102129700A (zh) 一种海洋背景下的红外仿真图像平台及其图像生成方法
CN110176021B (zh) 结合亮度校正的显著性信息的水平集图像分割方法及系统
Qin et al. Virtual reality video image classification based on texture features
CN107492101B (zh) 基于自适应构造最优图的多模态鼻咽肿瘤分割算法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190705

Termination date: 20211014

CF01 Termination of patent right due to non-payment of annual fee