CN110689087B - 一种基于概率似然的图像样本生成方法 - Google Patents
一种基于概率似然的图像样本生成方法 Download PDFInfo
- Publication number
- CN110689087B CN110689087B CN201910957276.1A CN201910957276A CN110689087B CN 110689087 B CN110689087 B CN 110689087B CN 201910957276 A CN201910957276 A CN 201910957276A CN 110689087 B CN110689087 B CN 110689087B
- Authority
- CN
- China
- Prior art keywords
- data
- principal component
- neighborhood
- radius
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 15
- 238000000513 principal component analysis Methods 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 12
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于概率似然的图像样本生成方法,包括以下步骤:按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;对这些类别的图像数据按照定制的标准进行对齐处理;对对齐后的每一类数据进行主成分分析;再对每一个主成分与原数据按照概率似然求解交叉数据,即得该定制标准下的规则样本数据。本发明提供的方法,用来得到质量更好,更具有代表性的图像样本数据,从而提高算法落地可能性。
Description
技术领域
本发明涉及一种样本生成方法,具体说是一种基于概率似然的图像样本生成方法,属于图像处理技术领域。
背景技术
随着大数据云计算技术的兴起,各种数据的大量建立,造成数据之间的标准不一致,有效数据的评价不一致,导致数据质量参差不齐。
现有技术一般依赖业界开源的标准库,对算法的适应性检测较为粗糙,普遍地标准库上算法效果好,实际场景中效果不如人意。比如在人脸图像处理的技术落地方面,通用标准库一般让采集的角度,光照条件,表情变化等趋向一致,而实际情况是角度多变,光照条件多变,表情更是随机。
通常对于一个算法,往往需要大量的人脸图像数据来训练。而大量样本的收集费时费力,还需要人工标注,更重要的是人工标注的好坏将直接影响算法的训练。
对于一些特殊应用,比如单人脸实时识别,高速移动物体的实时识别等,这些对象的图像采集本身就非常困难,样本数量更加有限。
因此需要设计一种方法,能根据有限的样本生成更加标准的样本,再对生成的样本根据现有的样本繁殖技术(例如AAM模型)进行样本繁殖,以生成更多的可用的高质量样本。
发明内容
本发明提供一种基于概率似然的图像样本生成方法,用来得到质量更好,更具有代表性的图像样本数据,从而提高算法落地可能性。
具体的技术方案为:
一种基于概率似然的图像样本生成方法,包括以下步骤:按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;对这些类别的图像数据按照定制的标准进行对齐处理;对对齐后的每一类数据进行主成分分析;再对每一个主成分与原数据按照概率似然求解交叉数据,即得该定制标准下的规则样本数据。
进一步的,具体的步骤为:
(1)按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;
(2)对这些类别的图像数据按照定制的标准进行对齐处理;
(3)对对齐后的每一类数据进行主成分分析,将主成分所在向量视为数据点,则向量附近的点构成点云数据,从某主成分向量的轴向看这些对应的点云数据,这些数据可以概括为以该主成分向量所在的轴为圆心,半径为可选参数的圆。
(4)假设取邻域半径 为有限值,这些点分布在的邻域半径范围内。按照概率分布来分布数据,其中ri为邻域半径取值,为最大半径取值,假设g=0.5,则ri=arg(g=0.5)=r1。得到以为轴心,r1为邻域半径内的属于的概率为g=0.5的属性点。
假设最终相交邻域内的点,即这些“相交”的点集,可以唯一地表示某原数据集中某类特征最集中的特征数据。
本发明按照需求可以灵活设置概率值以获取最优的规则数据。
本发明可以获取多组“相交”点集,并加权求和得到所选的规则样本数据。
本发明提供的方法,通过这些数据生成较为整齐的、符合当前设置标准的、质量较高的数据。
附图说明
图1为实施例以人脸图像为例的原理流程示意图;
图2为实施例对原数据进行主成分分析的原理示意图,示意某一个主成分u1。
图3为实施例点云数据分布示意图。
图4为实施例根据概率似然求解“交叉”数据示意图。
具体实施方式
本发明提供一种基于概率似然的图像样本生成方法,用来得到质量更好,更具有代表性的图像样本数据,从而提高算法落地可能性。
为方便说明本发明实施例,以人脸图像样本数据为例。进一步地,对于其他研究对象的图像样本数据,本发明实施例提供的技术方案同样适用。
下面结合附图对本发明提供的技术方案进行说明。
本发明实施例设计了一种基于概率似然的图像样本生成方法,参见图1,首先按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;
对这些类别的图像数据按照定制的标准进行对齐处理;
对对齐后的每一类数据进行主成分分析,假设对某类数据Φ(θ1,…,θn)进行分析,其中θi(i=1,…,n)为本类中的第i个样本;
主成分(PCA)是一种数据集简化手段。将数据按照方差的特性进行排列,主成分即为特征向量,方差大的主成分,对应的特征值就越大,所占权重就相应的更大。对Φ(θ1,…,θn)主成分分析,得到n个主成分Γ(f1,…,fn)。如图2,假设得到u1主成分向量。
u1向量附近的点构成点云数据,从u1主成分向量的轴向看这些点云数据,这些数据可以概括为以u1轴为圆心,半径为可选参数(r1,r2,r3)的圆,参见图3。
假设取邻域半径 为有限值,这些点分布在的邻域半径范围内。按照概率分布来分布数据,其中ri为邻域半径取值,为最大半径取值,假设g=0.5,则ri=arg(g=0.5)=r1。得到以为轴心,r1为邻域半径内的属于的概率为g=0.5的属性点。
基于概率似然的概率取值以及取值次数可以根据样本数据特征分布和定制要求来灵活变化。只要不脱离主成分分析和概率似然思想的范围,则本发明也意图包含这些变动和变型在内。
Claims (1)
1.一种基于概率似然的图像样本生成方法,其特征在于,包括以下步骤:
(1)按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;
(2)对这些类别的图像数据按照定制的标准进行对齐处理;
(3)对对齐后的每一类数据进行主成分分析,将主成分所在向量视为数据点,则向量附近的点构成点云数据,从某主成分向量的轴向看这些对应的点云数据,这些数据可以概括为以该主成分向量所在的轴为圆心,半径为可选参数的圆;
(4)假设取邻域半径 为有限值,这些点分布在的邻域半径范围内;按照概率分布来分布数据,其中ri为邻域半径取值,为最大半径取值,假设g=0.5,则ri=arg(g=0.5)=r1;得到以为轴心,r1为邻域半径内的属于的概率为g=0.5的属性点;
假设最终相交邻域内的点,即这些“相交”的点集,可以唯一地表示某原数据集中某类特征最集中的特征数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910957276.1A CN110689087B (zh) | 2019-10-10 | 2019-10-10 | 一种基于概率似然的图像样本生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910957276.1A CN110689087B (zh) | 2019-10-10 | 2019-10-10 | 一种基于概率似然的图像样本生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110689087A CN110689087A (zh) | 2020-01-14 |
CN110689087B true CN110689087B (zh) | 2023-04-18 |
Family
ID=69111974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910957276.1A Expired - Fee Related CN110689087B (zh) | 2019-10-10 | 2019-10-10 | 一种基于概率似然的图像样本生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110689087B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7256596B1 (en) * | 2005-11-01 | 2007-08-14 | Russell Robert J | Method and apparatus for adapting a standard flying prober system for reliable testing of printed circuit assemblies |
CN102103695A (zh) * | 2009-12-21 | 2011-06-22 | 北京中星微电子有限公司 | 一种图像样本生成方法及装置 |
CN105654056A (zh) * | 2015-12-31 | 2016-06-08 | 中国科学院深圳先进技术研究院 | 人脸识别的方法及装置 |
CN106778804A (zh) * | 2016-11-18 | 2017-05-31 | 天津大学 | 基于类别属性迁移学习的零样本图像分类方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101640077B1 (ko) * | 2009-06-05 | 2016-07-15 | 삼성전자주식회사 | 인체 동작 및 얼굴 표정 모델링 및 인식을 위한 비디오 센서 기반의 장치 및 방법 |
-
2019
- 2019-10-10 CN CN201910957276.1A patent/CN110689087B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7256596B1 (en) * | 2005-11-01 | 2007-08-14 | Russell Robert J | Method and apparatus for adapting a standard flying prober system for reliable testing of printed circuit assemblies |
CN102103695A (zh) * | 2009-12-21 | 2011-06-22 | 北京中星微电子有限公司 | 一种图像样本生成方法及装置 |
CN105654056A (zh) * | 2015-12-31 | 2016-06-08 | 中国科学院深圳先进技术研究院 | 人脸识别的方法及装置 |
CN106778804A (zh) * | 2016-11-18 | 2017-05-31 | 天津大学 | 基于类别属性迁移学习的零样本图像分类方法 |
Non-Patent Citations (4)
Title |
---|
Shape Model Fitting Algorithm without point correspondence;Claudia Arellano 等;《EUSIPCO》;20121018;第934-938页 * |
Synthesis and Recognition of facial expression in virtual 3D views;L.Zalewski 等;《Sixth IEEE International Conference on Automatic Face and Gesture Recognition,2004.Proceedings》;20040607;第1-6页 * |
一种基于Gabor描述的概率子空间人脸识别方法;龙飞 等;《电子与信息学报》;20070331;第29卷(第3期);第626-630页 * |
人脸表情识别研究的新进展;刘晓旻 等;《中国图象图形学报》;20061031;第11卷(第10期);第1359-1368页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110689087A (zh) | 2020-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yang et al. | Development of image recognition software based on artificial intelligence algorithm for the efficient sorting of apple fruit | |
CN111192284A (zh) | 一种车载激光点云分割方法及系统 | |
TWI464604B (zh) | 資料分群方法與裝置、資料處理裝置及影像處理裝置 | |
CN108830312B (zh) | 一种基于样本自适应扩充的集成学习方法 | |
CN105760889A (zh) | 一种高效的不均衡数据集分类方法 | |
Li et al. | Robust vehicle detection in high-resolution aerial images with imbalanced data | |
CN103617435A (zh) | 一种主动学习图像分类方法和系统 | |
Kan et al. | Dynamic network monitoring and control of in situ image profiles from ultraprecision machining and biomanufacturing processes | |
CN109461458B (zh) | 一种基于生成对抗网络的音频异常检测方法 | |
CN102073867B (zh) | 一种遥感图像分类方法及装置 | |
CN103390170A (zh) | 一种基于多光谱遥感图像纹理元的地物类型纹理分类方法 | |
CN106033613B (zh) | 目标跟踪方法及装置 | |
CN108615006A (zh) | 用于输出信息的方法和装置 | |
CN117495891B (zh) | 点云边缘检测方法、装置和电子设备 | |
CN106610977A (zh) | 一种数据聚类方法和装置 | |
CN106355588A (zh) | 一种基于核方法的高光谱图像分割方法 | |
CN107705299B (zh) | 基于多属性特征的图像质量分类方法 | |
CN110689087B (zh) | 一种基于概率似然的图像样本生成方法 | |
Guo et al. | Unsupervised clustering and analysis of WISE spiral galaxies | |
Gunawan et al. | Fuzzy Region Merging Using Fuzzy Similarity Measurement on Image Segmentation | |
Uchida et al. | Character image patterns as big data | |
CN108021935B (zh) | 一种基于大数据技术的维度约简方法及装置 | |
CN102903104A (zh) | 一种基于减法聚类的快速图像分割方法 | |
CN110717453B (zh) | 一种基于余弦距离的图像样本生成方法 | |
Pereira et al. | Assessing active learning strategies to improve the quality control of the soybean seed vigor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20230418 |