CN110163865A - 一种针对模型拟合中不平衡数据的采样方法 - Google Patents

一种针对模型拟合中不平衡数据的采样方法 Download PDF

Info

Publication number
CN110163865A
CN110163865A CN201910451911.9A CN201910451911A CN110163865A CN 110163865 A CN110163865 A CN 110163865A CN 201910451911 A CN201910451911 A CN 201910451911A CN 110163865 A CN110163865 A CN 110163865A
Authority
CN
China
Prior art keywords
sampling
subset
data
model
model hypothesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910451911.9A
Other languages
English (en)
Other versions
CN110163865B (zh
Inventor
肖国宝
汪涛
徐海平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou Weipu Software Technology Co.,Ltd.
Original Assignee
Minjiang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minjiang University filed Critical Minjiang University
Priority to CN201910451911.9A priority Critical patent/CN110163865B/zh
Publication of CN110163865A publication Critical patent/CN110163865A/zh
Application granted granted Critical
Publication of CN110163865B publication Critical patent/CN110163865B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种针对模型拟合中不平衡数据的采样方法,包括以下步骤:步骤S1:提取图像特征数据,并构成数据集;步骤S2:从数据集中随机采样一个最小子集,作为代表性子集,并初始化采样集合;步骤S3:从数据集中随机采样一个最小子集,作为采样子集;步骤S4:根据代表性采样子集和采样子集更新采样集合;步骤S5:循环步骤S3至步骤S4,直至满足预设终止条件;步骤S6:去除多余的模型假设,得到最终采样集合;步骤S7:将最终采样集合作为模型拟合的输入数据,以完成最后的参数估计和图像分割。本发明采样方法能够有效地提高参数估计和图像分割的性能。

Description

一种针对模型拟合中不平衡数据的采样方法
技术领域
本发明涉及计算机视觉技术领域,涉及一种针对模型拟合中不平衡数据的采样方法。
背景技术
随着越来越多的计算机视觉产品出现在我们现实生活中,模型拟合作为计算机视觉的一项重要的基础研究越来越重要。而如何有效地采样子集是模型拟合重要的一个步骤。
当前的采样方法可以分为随机采样和指导性采样。随机采样方法中,比较有代表性的有Random Sample Consensus(RANSAC)(M.A.Fischler and R.C.Bolles.Randomsample consensus:a paradigm for model fitting with applications to imageanalysis and automated cartography.Comm.ACM,24(6):381–395,1981)。指导性采样有Proximity(Y.Kanazawa,H.Kawakami,Detection of planar regions with uncalibratedstereo using distributions of feature points.,in:Proc.Bri.Mach.Vis.Conf.,2004,pp.247-256);MultiGS(T.-J.Chin,J.Yu,D.Suter,Accelerated hypothesisgeneration for multistructure data via preference analysis,IEEE Trans.PatternAnal.Mach.Intell.34(4):625-638,2012);SDF(G.Xiao,H.Wang,Y.Yan,and D.Suter,Superpixel-guided two-view deterministic geometric model ftting,Int.J.Comput.Vis.,127(4),323-339,2019).
当前的采样方法在正常情况下能够有效地采样高质量的模型假设。然而,当数据出现不平衡时(即属于不同模型实例的内点数量存在较大的不平衡),当前的采样方法很难采样到对应小结构的模型假设。而不平衡数据在现实生活中比较普通,因此,研究不平衡数据的采样方法具有很大的意义。
发明内容
有鉴于此,本发明的目的在于提供一种针对模型拟合中不平衡数据的采样方法,能够有效地提高图片分割和参数估计的性能。
为实现上述目的,本发明采用如下技术方案:
一种针对模型拟合中不平衡数据的采样方法,包括以下步骤:
步骤S1:提取图像特征数据,并构成数据集;
步骤S2:从数据集中随机采样一个最小子集,作为代表性子集,并初始化采样集合;
步骤S3:从数据集中随机采样一个最小子集,作为采样子集;
步骤S4:根据代表性采样子集和采样子集更新采样集合;
步骤S5:循环步骤S3至步骤S4,直至满足预设终止条件;
步骤S6:去除多余的模型假设,得到最终采样集合;
步骤S7:将最终采样集合作为模型拟合的输入数据,以完成最后的参数估计和图像分割。
进一步的,所述步骤S2具体为:
步骤S21:从数据集中随机采样一个最小子集;
步骤S22:评估最小子集的模型假设参数θ1,并计算该模型假设θ1的权重,权重公式如下:
式中,s(θ1)表示模型假设θ1的内点尺度,表示模型假设θ1和数据点xt之间的距离,为核函数,b(θ1)为宽度;X={xt}为数据集,N为数据总数;
步骤S23:将采样的第一个模型假设θ1作为采样集合的第一个成员,并作为一个代表性采样子集其中j表示代表性子集的第j个成员,此处j=1。
进一步的,所述步骤S3具体为:
步骤S31:从数据集中随机采样一个最小子集;
步骤S22:评估最小子集的模型假设参数θi,其中i表示第i次采样,并计算该模型假设θi的权重,权重公式如下:
式中,s(θi)表示模型假设θi的内点尺度,表示模型假设θi和数据点xt之间的距离,为核函数,b(θi)为宽度。
进一步的,所述步骤S4具体为:
步骤S41:计算θi与采样集合中的每个代表性采样子集的关系,计算公式如下:
其中Inlier(θi)和表示相应模型假设的内点集合,
分别表示两个集合的交集和并集,|·|表示集合的成员个数;如果认为它们对应同一个模型实例;
步骤S42:若θi与采样集合中一个代表性子集对应同一个模型实例,那么进一步对比它们的权重,以更新采样集合;如果那么θi加入到采样集合中,并取代作为一个代表性子集;反之,将θi抛弃,不作为采样集合的成员;
步骤S43:如果采样集合中没有找到θi对应同一个模型实例的代表性子集,那么将θi加入到采样集合中,并作为代表性子集的一个新成员。
进一步的,所述步骤S5具体为:判定采样个数是否达到预设阈值,如果达到则终止循环,并得到采样集合的模型假设θ={θ12,…,θm};反之回到步骤步骤S3,做下一步采样。
进一步的,所述步骤S6具体为:
步骤S61:对于采样集合中的所有模型假设θ={θ12,…,θm},它们相应的权重为W={w1,w2,…,wm};
步骤S62:设定每个模型假设的权重wi与最大权重的跨度:ψi=max(W)-wi,计算其相应的概率:
步骤S63:计算该权重集合的熵作为阈值衡量模型假设的质量:
步骤S64:通过熵选择模型假设:θ′={θ′i|-logp(ψi)>L},得到的θ′作为最终的采样集合。
本发明与现有技术相比具有以下有益效果:
本发明能够有效地提高图片分割和参数估计的性能,提高图片处理质量。
附图说明
图1是本发明方法流程图;
图2是本发明一实施例中与经典采样算法RANSAC在五个图片数据集上针对基础矩阵估计所生成的采样子集对不同模型实例的比例对比;
图3是本发明实施例得到的采样集合在图片数据集上的分割效果。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
请参照图1,本发明提供一种针对模型拟合中不平衡数据的采样方法,包括以下步骤:
步骤S1:提取图像特征数据,并构成数据集,得到X={xt},t=1,2,...,N,N为数据总数,N为自然数;
步骤S2:从数据集中随机采样一个最小子集,作为代表性子集,并初始化采样集合;所述步骤S2具体为:
步骤S21:从数据集中随机采样一个最小子集;
步骤S22:评估最小子集的模型假设参数θ1,并计算该模型假设θ1的权重,权重公式如下:
式中,s(θ1)表示模型假设θ1的内点尺度,表示模型假设θ1和数据点xt之间的距离,为核函数,b(θ1)为宽度;X={xt}为数据集,N为数据总数;
步骤S23:将采样的第一个模型假设θ1作为采样集合的第一个成员,并作为一个代表性采样子集其中j表示代表性子集的第j个成员,此处j=1。
步骤S3:从数据集中随机采样一个最小子集,作为采样子集;
步骤S31:从数据集中随机采样一个最小子集;
步骤S22:评估最小子集的模型假设参数θi,其中i表示第i次采样,并计算该模型假设θi的权重,权重公式如下:
式中,s(θi)表示模型假设θi的内点尺度,表示模型假设θi和数据点xt之间的距离,为核函数,b(θi)为宽度。
步骤S4:根据代表性采样子集和采样子集更新采样集合;
所述步骤S4具体为:
步骤S41:计算θi与采样集合中的每个代表性采样子集的关系,计算公式如下:
其中Inlier(θi)和表示相应模型假设的内点集合,分别表示两个集合的交集和并集,|·|表示集合的成员个数;如果认为它们对应同一个模型实例;
步骤S42:若θi与采样集合中一个代表性子集对应同一个模型实例,那么进一步对比它们的权重,以更新采样集合;如果那么θi加入到采样集合中,并取代作为一个代表性子集;反之,将θi抛弃,不作为采样集合的成员;
步骤S43:如果采样集合中没有找到θi对应同一个模型实例的代表性子集,那么将θi加入到采样集合中,并作为代表性子集的一个新成员。
步骤S5:循环步骤S3至步骤S4,直至满足预设终止条件;判定采样个数是否达到预设阈值,本实施例中为10000,如果达到则终止循环,并得到采样集合的模型假设θ={θ12,…,θm};反之回到步骤步骤S3,做下一步采样。
步骤S6:去除多余的模型假设,得到最终采样集合;所述步骤S6具体为:
步骤S61:对于采样集合中的所有模型假设θ={θ12,…,θm},它们相应的权重为W={w1,w2,…,wm};
步骤S62:设定每个模型假设的权重wi与最大权重的跨度:ψi=max(W)-wi,计算其相应的概率:
步骤S63:计算该权重集合的熵作为阈值衡量模型假设的质量:
步骤S64:通过熵选择模型假设:θ′={θ′i|-logp(ψi)>L},得到的θ′作为最终的采样集合。
步骤S7:将最终采样集合作为模型拟合的输入数据,以完成最后的参数估计和图像分割。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (6)

1.一种针对模型拟合中不平衡数据的采样方法,其特征在于,包括以下步骤:
步骤S1:提取图像特征数据,并构成数据集;
步骤S2:从数据集中随机采样一个最小子集,作为代表性子集,并初始化采样集合;
步骤S3:从数据集中随机采样一个最小子集,作为采样子集;
步骤S4:根据代表性采样子集和采样子集更新采样集合;
步骤S5:循环步骤S3至步骤S4,直至满足预设终止条件;
步骤S6:去除多余的模型假设,得到最终采样集合;
步骤S7:将最终采样集合作为模型拟合的输入数据,以完成最后的参数估计和图像分割。
2.根据权利要求1所述的一种针对模型拟合中不平衡数据的采样方法,其特征在于,所述步骤S2具体为:
步骤S21:从数据集中随机采样一个最小子集;
步骤S22:评估最小子集的模型假设参数θ1,并计算该模型假设θ1的权重,权重公式如下:
式中,s(θ1)表示模型假设θ1的内点尺度,表示模型假设θ1和数据点xt之间的距离,为核函数,b(θ1)为宽度;X={xt}为数据集,N为数据总数;
步骤S23:将采样的第一个模型假设θ1作为采样集合的第一个成员,并作为一个代表性采样子集其中j表示代表性子集的第j个成员,此处j=1。
3.根据权利要求1所述的一种针对模型拟合中不平衡数据的采样方法,其特征在于,所述步骤S3具体为:
步骤S31:从数据集中随机采样一个最小子集;
步骤S22:评估最小子集的模型假设参数θi,其中i表示第i次采样,并计算该模型假设θi的权重,权重公式如下:
式中,s(θi)表示模型假设θi的内点尺度,表示模型假设θi和数据点xt之间的距离,为核函数,b(θi)为宽度。
4.根据权利要求3所述的一种针对模型拟合中不平衡数据的采样方法,其特征在于,所述步骤S4具体为:
步骤S41:计算θi与采样集合中的每个代表性采样子集的关系,计算公式如下:
其中Inlier(θi)和表示相应模型假设的内点集合,分别表示两个集合的交集和并集,|·|表示集合的成员个数;如果认为它们对应同一个模型实例;
步骤S42:若θi与采样集合中一个代表性子集对应同一个模型实例,那么进一步对比它们的权重,以更新采样集合;如果那么θi加入到采样集合中,并取代作为一个代表性子集;反之,将θi抛弃,不作为采样集合的成员;
步骤S43:如果采样集合中没有找到θi对应同一个模型实例的代表性子集,那么将θi加入到采样集合中,并作为代表性子集的一个新成员。
5.根据权利要求3所述的一种针对模型拟合中不平衡数据的采样方法,其特征在于,所述步骤S5具体为:判定采样个数是否达到预设阈值,如果达到则终止循环,并得到采样集合的模型假设θ={θ12,…,θm};反之回到步骤步骤S3,做下一步采样。
6.根据权利要求3所述的一种针对模型拟合中不平衡数据的采样方法,其特征在于,所述步骤S6具体为:
步骤S61:对于采样集合中的所有模型假设θ={θ12,…,θm},它们相应的权重为W={w1,w2,…,wm};
步骤S62:设定每个模型假设的权重wi与最大权重的跨度:ψi=max(W)-wi,计算其相应的概率:
步骤S63:计算该权重集合的熵作为阈值衡量模型假设的质量:
步骤S64:通过熵选择模型假设:θ′={θ′i|-logp(ψi)>L},得到的θ′作为最终的采样集合。
CN201910451911.9A 2019-05-28 2019-05-28 一种针对模型拟合中不平衡数据的采样方法 Active CN110163865B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910451911.9A CN110163865B (zh) 2019-05-28 2019-05-28 一种针对模型拟合中不平衡数据的采样方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910451911.9A CN110163865B (zh) 2019-05-28 2019-05-28 一种针对模型拟合中不平衡数据的采样方法

Publications (2)

Publication Number Publication Date
CN110163865A true CN110163865A (zh) 2019-08-23
CN110163865B CN110163865B (zh) 2021-06-01

Family

ID=67629614

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910451911.9A Active CN110163865B (zh) 2019-05-28 2019-05-28 一种针对模型拟合中不平衡数据的采样方法

Country Status (1)

Country Link
CN (1) CN110163865B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021248932A1 (zh) * 2020-06-11 2021-12-16 广东浪潮智慧计算技术有限公司 一种图像数据处理方法、装置、设备及可读存储介质
CN118115767A (zh) * 2024-04-30 2024-05-31 厦门理工学院 一种基于二阶邻近引导的图像数据采样方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100092026A1 (en) * 2008-10-14 2010-04-15 Lixin Fan Method, apparatus and computer program product for providing pattern detection with unknown noise levels
US20140355821A1 (en) * 2013-06-04 2014-12-04 Apple Inc. Object Landmark Detection in Images
CN104835174A (zh) * 2015-05-25 2015-08-12 厦门大学 基于超图模式搜索的鲁棒模型拟合方法
CN106296747A (zh) * 2016-07-26 2017-01-04 厦门大学 基于结构决策图的鲁棒多模型拟合方法
CN107123119A (zh) * 2017-04-27 2017-09-01 厦门大学 一种针对多结构数据的指导性采样方法
CN107229934A (zh) * 2017-04-24 2017-10-03 东北大学 基于最小匹配距离与随机采样一致性的错误匹配去除方法
CN105913423B (zh) * 2016-04-08 2018-08-07 厦门大学 一种基于超像素的确定性模型拟合方法
CN108710761A (zh) * 2018-05-22 2018-10-26 泉州装备制造研究所 一种基于谱聚类去除离群点的鲁棒模型拟合方法
CN108921871A (zh) * 2018-07-27 2018-11-30 福建农林大学 一种基于全局贪婪搜索的鲁棒模型拟合方法
CN108960296A (zh) * 2018-06-14 2018-12-07 厦门大学 一种基于连续潜在语义分析的模型拟合方法
CN109614933A (zh) * 2018-12-11 2019-04-12 闽江学院 一种基于确定性拟合的运动分割方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100092026A1 (en) * 2008-10-14 2010-04-15 Lixin Fan Method, apparatus and computer program product for providing pattern detection with unknown noise levels
US20140355821A1 (en) * 2013-06-04 2014-12-04 Apple Inc. Object Landmark Detection in Images
CN104835174A (zh) * 2015-05-25 2015-08-12 厦门大学 基于超图模式搜索的鲁棒模型拟合方法
CN105913423B (zh) * 2016-04-08 2018-08-07 厦门大学 一种基于超像素的确定性模型拟合方法
CN106296747A (zh) * 2016-07-26 2017-01-04 厦门大学 基于结构决策图的鲁棒多模型拟合方法
CN107229934A (zh) * 2017-04-24 2017-10-03 东北大学 基于最小匹配距离与随机采样一致性的错误匹配去除方法
CN107123119A (zh) * 2017-04-27 2017-09-01 厦门大学 一种针对多结构数据的指导性采样方法
CN108710761A (zh) * 2018-05-22 2018-10-26 泉州装备制造研究所 一种基于谱聚类去除离群点的鲁棒模型拟合方法
CN108960296A (zh) * 2018-06-14 2018-12-07 厦门大学 一种基于连续潜在语义分析的模型拟合方法
CN108921871A (zh) * 2018-07-27 2018-11-30 福建农林大学 一种基于全局贪婪搜索的鲁棒模型拟合方法
CN109614933A (zh) * 2018-12-11 2019-04-12 闽江学院 一种基于确定性拟合的运动分割方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GUOBAO XIAO ET AL.: "Superpixel-Guided Two-View Deterministic Geometric Model Fitting", 《INTERNATIONAL JOURNAL OF COMPUTER VISION》 *
程欣宇: "RANSAC类方法先入为主的缺陷和避免方法", 《电子科技大学》 *
肖国宝: "基于数据关系的鲁棒几何模型拟合方法", 《万方数据》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021248932A1 (zh) * 2020-06-11 2021-12-16 广东浪潮智慧计算技术有限公司 一种图像数据处理方法、装置、设备及可读存储介质
CN118115767A (zh) * 2024-04-30 2024-05-31 厦门理工学院 一种基于二阶邻近引导的图像数据采样方法
CN118115767B (zh) * 2024-04-30 2024-07-19 厦门理工学院 一种基于二阶邻近引导的图像数据采样方法

Also Published As

Publication number Publication date
CN110163865B (zh) 2021-06-01

Similar Documents

Publication Publication Date Title
CN105044662B (zh) 一种基于wifi信号强度的指纹聚类多点联合室内定位方法
CN109614935B (zh) 车辆定损方法及装置、存储介质及电子设备
Lei et al. Identification of dynamic protein complexes based on fruit fly optimization algorithm
CN107948930A (zh) 基于位置指纹算法的室内定位优化方法
CN106503656A (zh) 一种图像分类方法、装置和计算设备
JP2011521355A (ja) 勾配ヒストグラムを用いた指紋表現
CN112328715B (zh) 视觉定位方法及相关模型的训练方法及相关装置、设备
CN112381862B (zh) 一种cad模型与三角网格全自动配准方法和装置
CN113190757A (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
CN108627798B (zh) 基于线性判别分析和梯度提升树的wlan室内定位算法
Su et al. Uncertainty guided multi-view stereo network for depth estimation
Lund et al. Models for point processes observed with noise
CN113436223B (zh) 点云数据的分割方法、装置、计算机设备和存储介质
CN110163865A (zh) 一种针对模型拟合中不平衡数据的采样方法
CN104835174B (zh) 基于超图模式搜索的鲁棒模型拟合方法
Wu et al. Evolutionary multitasking with solution space cutting for point cloud registration
CN105389821A (zh) 一种基于云模型和图割相结合的医学图像分割方法
Krithikaa et al. Differential evolution with an ensemble of low-quality surrogates for expensive optimization problems
CN106658538B (zh) 一种基于泰森多边形的手机基站信号覆盖范围模拟方法
Zhang et al. WOA-DBSCAN: application of whale optimization algorithm in DBSCAN parameter adaption
CN114185651A (zh) 一种融合多模态信息的移动群智感知任务推荐方法
CN117788810A (zh) 一种无监督语义分割的学习系统
CN117241239A (zh) 一种基于一维卷积神经网络的位置指纹室内定位方法和系统
CN108924196B (zh) 工业互联网绿色能源管理系统
CN108614889B (zh) 基于混合高斯模型的移动对象连续k近邻查询方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20221108

Address after: 5F-2, Building 1 #, No. 1, Majiang Road, Mawei Town, Mawei District, Fuzhou City, Fujian Province, 350,015 (within the Free Trade Zone)

Patentee after: Fuzhou Weipu Software Technology Co.,Ltd.

Address before: 200 xiyuangong Road, Shangjie Town, Minhou County, Fuzhou City, Fujian Province

Patentee before: MINJIANG University

TR01 Transfer of patent right