CN110689087B - 一种基于概率似然的图像样本生成方法 - Google Patents

一种基于概率似然的图像样本生成方法 Download PDF

Info

Publication number
CN110689087B
CN110689087B CN201910957276.1A CN201910957276A CN110689087B CN 110689087 B CN110689087 B CN 110689087B CN 201910957276 A CN201910957276 A CN 201910957276A CN 110689087 B CN110689087 B CN 110689087B
Authority
CN
China
Prior art keywords
data
principal component
neighborhood
radius
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910957276.1A
Other languages
English (en)
Other versions
CN110689087A (zh
Inventor
赵书朵
韩旭
袁杰敏
阎翔
冯冠钦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Petroleum University
Original Assignee
Southwest Petroleum University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Petroleum University filed Critical Southwest Petroleum University
Priority to CN201910957276.1A priority Critical patent/CN110689087B/zh
Publication of CN110689087A publication Critical patent/CN110689087A/zh
Application granted granted Critical
Publication of CN110689087B publication Critical patent/CN110689087B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于概率似然的图像样本生成方法,包括以下步骤:按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;对这些类别的图像数据按照定制的标准进行对齐处理;对对齐后的每一类数据进行主成分分析;再对每一个主成分与原数据按照概率似然求解交叉数据,即得该定制标准下的规则样本数据。本发明提供的方法,用来得到质量更好,更具有代表性的图像样本数据,从而提高算法落地可能性。

Description

一种基于概率似然的图像样本生成方法
技术领域
本发明涉及一种样本生成方法,具体说是一种基于概率似然的图像样本生成方法,属于图像处理技术领域。
背景技术
随着大数据云计算技术的兴起,各种数据的大量建立,造成数据之间的标准不一致,有效数据的评价不一致,导致数据质量参差不齐。
现有技术一般依赖业界开源的标准库,对算法的适应性检测较为粗糙,普遍地标准库上算法效果好,实际场景中效果不如人意。比如在人脸图像处理的技术落地方面,通用标准库一般让采集的角度,光照条件,表情变化等趋向一致,而实际情况是角度多变,光照条件多变,表情更是随机。
通常对于一个算法,往往需要大量的人脸图像数据来训练。而大量样本的收集费时费力,还需要人工标注,更重要的是人工标注的好坏将直接影响算法的训练。
对于一些特殊应用,比如单人脸实时识别,高速移动物体的实时识别等,这些对象的图像采集本身就非常困难,样本数量更加有限。
因此需要设计一种方法,能根据有限的样本生成更加标准的样本,再对生成的样本根据现有的样本繁殖技术(例如AAM模型)进行样本繁殖,以生成更多的可用的高质量样本。
发明内容
本发明提供一种基于概率似然的图像样本生成方法,用来得到质量更好,更具有代表性的图像样本数据,从而提高算法落地可能性。
具体的技术方案为:
一种基于概率似然的图像样本生成方法,包括以下步骤:按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;对这些类别的图像数据按照定制的标准进行对齐处理;对对齐后的每一类数据进行主成分分析;再对每一个主成分与原数据按照概率似然求解交叉数据,即得该定制标准下的规则样本数据。
进一步的,具体的步骤为:
(1)按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;
(2)对这些类别的图像数据按照定制的标准进行对齐处理;
(3)对对齐后的每一类数据进行主成分分析,将主成分所在向量视为数据点,则向量附近的点构成点云数据,从某主成分向量的轴向看这些对应的点云数据,这些数据可以概括为以该主成分向量所在的轴为圆心,半径为可选参数的圆。
(4)假设取邻域半径
Figure BDA0002227758930000021
Figure BDA0002227758930000022
为有限值,这些点分布在
Figure BDA0002227758930000023
的邻域半径范围内。按照概率分布
Figure BDA0002227758930000024
来分布数据,其中ri为邻域半径取值,
Figure BDA0002227758930000025
为最大半径取值,假设g=0.5,则ri=arg(g=0.5)=r1。得到以
Figure BDA0002227758930000026
为轴心,r1为邻域半径内的属于
Figure BDA0002227758930000027
的概率为g=0.5的属性点。
(5)假设存在另一个主成分
Figure BDA0002227758930000028
以此类推,得到以
Figure BDA0002227758930000029
为轴心,r2为邻域半径内的属于
Figure BDA00022277589300000210
的概率为g=0.5的属性点。假设最终相交邻域内的点在椭圆内。
假设最终相交邻域内的点,即这些“相交”的点集,可以唯一地表示某原数据集中某类特征最集中的特征数据。
本发明按照需求可以灵活设置概率值以获取最优的规则数据。
本发明可以获取多组“相交”点集,并加权求和得到所选的规则样本数据。
本发明提供的方法,通过这些数据生成较为整齐的、符合当前设置标准的、质量较高的数据。
附图说明
图1为实施例以人脸图像为例的原理流程示意图;
图2为实施例对原数据进行主成分分析的原理示意图,示意某一个主成分u1。
图3为实施例点云数据分布示意图。
图4为实施例根据概率似然求解“交叉”数据示意图。
具体实施方式
本发明提供一种基于概率似然的图像样本生成方法,用来得到质量更好,更具有代表性的图像样本数据,从而提高算法落地可能性。
为方便说明本发明实施例,以人脸图像样本数据为例。进一步地,对于其他研究对象的图像样本数据,本发明实施例提供的技术方案同样适用。
下面结合附图对本发明提供的技术方案进行说明。
本发明实施例设计了一种基于概率似然的图像样本生成方法,参见图1,首先按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;
对这些类别的图像数据按照定制的标准进行对齐处理;
对对齐后的每一类数据进行主成分分析,假设对某类数据Φ(θ1,…,θn)进行分析,其中θi(i=1,…,n)为本类中的第i个样本;
主成分(PCA)是一种数据集简化手段。将数据按照方差的特性进行排列,主成分即为特征向量,方差大的主成分,对应的特征值就越大,所占权重就相应的更大。对Φ(θ1,…,θn)主成分分析,得到n个主成分Γ(f1,…,fn)。如图2,假设得到u1主成分向量。
u1向量附近的点构成点云数据,从u1主成分向量的轴向看这些点云数据,这些数据可以概括为以u1轴为圆心,半径为可选参数(r1,r2,r3)的圆,参见图3。
假设取邻域半径
Figure BDA0002227758930000031
Figure BDA0002227758930000032
为有限值,这些点分布在
Figure BDA0002227758930000033
的邻域半径范围内。按照概率分布
Figure BDA0002227758930000034
来分布数据,其中ri为邻域半径取值,
Figure BDA0002227758930000035
为最大半径取值,假设g=0.5,则ri=arg(g=0.5)=r1。得到以
Figure BDA0002227758930000036
为轴心,r1为邻域半径内的属于
Figure BDA0002227758930000037
的概率为g=0.5的属性点。
然后,假设存在另一个主成分
Figure BDA0002227758930000038
以此类推,得到以
Figure BDA0002227758930000039
为轴心,r2为邻域半径内的属于
Figure BDA00022277589300000310
的概率为g=0.5的属性点。如图4所示,假设最终相交邻域内的点在图中所示椭圆内。
基于概率似然的概率取值以及取值次数可以根据样本数据特征分布和定制要求来灵活变化。只要不脱离主成分分析和概率似然思想的范围,则本发明也意图包含这些变动和变型在内。

Claims (1)

1.一种基于概率似然的图像样本生成方法,其特征在于,包括以下步骤:
(1)按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;
(2)对这些类别的图像数据按照定制的标准进行对齐处理;
(3)对对齐后的每一类数据进行主成分分析,将主成分所在向量视为数据点,则向量附近的点构成点云数据,从某主成分向量的轴向看这些对应的点云数据,这些数据可以概括为以该主成分向量所在的轴为圆心,半径为可选参数的圆;
(4)假设取邻域半径
Figure FDA0003558346600000011
Figure FDA0003558346600000012
为有限值,这些点分布在
Figure FDA0003558346600000013
的邻域半径范围内;按照概率分布
Figure FDA0003558346600000014
来分布数据,其中ri为邻域半径取值,
Figure FDA0003558346600000015
为最大半径取值,假设g=0.5,则ri=arg(g=0.5)=r1;得到以
Figure FDA0003558346600000016
为轴心,r1为邻域半径内的属于
Figure FDA0003558346600000017
的概率为g=0.5的属性点;
(5)假设存在另一个主成分
Figure FDA0003558346600000018
以此类推,得到以
Figure FDA0003558346600000019
为轴心,r2为邻域半径内的属于
Figure FDA00035583466000000110
的概率为g=0.5的属性点;假设最终相交邻域内的点在椭圆内;
假设最终相交邻域内的点,即这些“相交”的点集,可以唯一地表示某原数据集中某类特征最集中的特征数据。
CN201910957276.1A 2019-10-10 2019-10-10 一种基于概率似然的图像样本生成方法 Expired - Fee Related CN110689087B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910957276.1A CN110689087B (zh) 2019-10-10 2019-10-10 一种基于概率似然的图像样本生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910957276.1A CN110689087B (zh) 2019-10-10 2019-10-10 一种基于概率似然的图像样本生成方法

Publications (2)

Publication Number Publication Date
CN110689087A CN110689087A (zh) 2020-01-14
CN110689087B true CN110689087B (zh) 2023-04-18

Family

ID=69111974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910957276.1A Expired - Fee Related CN110689087B (zh) 2019-10-10 2019-10-10 一种基于概率似然的图像样本生成方法

Country Status (1)

Country Link
CN (1) CN110689087B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7256596B1 (en) * 2005-11-01 2007-08-14 Russell Robert J Method and apparatus for adapting a standard flying prober system for reliable testing of printed circuit assemblies
CN102103695A (zh) * 2009-12-21 2011-06-22 北京中星微电子有限公司 一种图像样本生成方法及装置
CN105654056A (zh) * 2015-12-31 2016-06-08 中国科学院深圳先进技术研究院 人脸识别的方法及装置
CN106778804A (zh) * 2016-11-18 2017-05-31 天津大学 基于类别属性迁移学习的零样本图像分类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101640077B1 (ko) * 2009-06-05 2016-07-15 삼성전자주식회사 인체 동작 및 얼굴 표정 모델링 및 인식을 위한 비디오 센서 기반의 장치 및 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7256596B1 (en) * 2005-11-01 2007-08-14 Russell Robert J Method and apparatus for adapting a standard flying prober system for reliable testing of printed circuit assemblies
CN102103695A (zh) * 2009-12-21 2011-06-22 北京中星微电子有限公司 一种图像样本生成方法及装置
CN105654056A (zh) * 2015-12-31 2016-06-08 中国科学院深圳先进技术研究院 人脸识别的方法及装置
CN106778804A (zh) * 2016-11-18 2017-05-31 天津大学 基于类别属性迁移学习的零样本图像分类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Shape Model Fitting Algorithm without point correspondence;Claudia Arellano 等;《EUSIPCO》;20121018;第934-938页 *
Synthesis and Recognition of facial expression in virtual 3D views;L.Zalewski 等;《Sixth IEEE International Conference on Automatic Face and Gesture Recognition,2004.Proceedings》;20040607;第1-6页 *
一种基于Gabor描述的概率子空间人脸识别方法;龙飞 等;《电子与信息学报》;20070331;第29卷(第3期);第626-630页 *
人脸表情识别研究的新进展;刘晓旻 等;《中国图象图形学报》;20061031;第11卷(第10期);第1359-1368页 *

Also Published As

Publication number Publication date
CN110689087A (zh) 2020-01-14

Similar Documents

Publication Publication Date Title
Yang et al. Development of image recognition software based on artificial intelligence algorithm for the efficient sorting of apple fruit
CN111192284A (zh) 一种车载激光点云分割方法及系统
TWI464604B (zh) 資料分群方法與裝置、資料處理裝置及影像處理裝置
CN108830312B (zh) 一种基于样本自适应扩充的集成学习方法
CN105760889A (zh) 一种高效的不均衡数据集分类方法
Li et al. Robust vehicle detection in high-resolution aerial images with imbalanced data
CN103617435A (zh) 一种主动学习图像分类方法和系统
Kan et al. Dynamic network monitoring and control of in situ image profiles from ultraprecision machining and biomanufacturing processes
CN109461458B (zh) 一种基于生成对抗网络的音频异常检测方法
CN102073867B (zh) 一种遥感图像分类方法及装置
CN103390170A (zh) 一种基于多光谱遥感图像纹理元的地物类型纹理分类方法
CN106033613B (zh) 目标跟踪方法及装置
CN108615006A (zh) 用于输出信息的方法和装置
CN117495891B (zh) 点云边缘检测方法、装置和电子设备
CN106610977A (zh) 一种数据聚类方法和装置
CN106355588A (zh) 一种基于核方法的高光谱图像分割方法
CN107705299B (zh) 基于多属性特征的图像质量分类方法
CN110689087B (zh) 一种基于概率似然的图像样本生成方法
Guo et al. Unsupervised clustering and analysis of WISE spiral galaxies
Gunawan et al. Fuzzy Region Merging Using Fuzzy Similarity Measurement on Image Segmentation
Uchida et al. Character image patterns as big data
CN108021935B (zh) 一种基于大数据技术的维度约简方法及装置
CN102903104A (zh) 一种基于减法聚类的快速图像分割方法
CN110717453B (zh) 一种基于余弦距离的图像样本生成方法
Pereira et al. Assessing active learning strategies to improve the quality control of the soybean seed vigor

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20230418