CN110659700A - 一种基于knn的图像样本生成方法 - Google Patents
一种基于knn的图像样本生成方法 Download PDFInfo
- Publication number
- CN110659700A CN110659700A CN201910957405.7A CN201910957405A CN110659700A CN 110659700 A CN110659700 A CN 110659700A CN 201910957405 A CN201910957405 A CN 201910957405A CN 110659700 A CN110659700 A CN 110659700A
- Authority
- CN
- China
- Prior art keywords
- data
- knn
- principal component
- generation method
- image sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于KNN的图像样本生成方法,包括以下步骤:(1)按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;(2)对这些类别的图像数据按照定制的标准进行对齐处理;(3)对对齐后的每一类数据进行主成分分析;再对每一个主成分与原数据用KNN求解m维最近距离,其中m的取值范围为(1,n),n为主成分个数;(4)取最小的m维最近距离对应的m个原数据,并对这m个数据进行加权求和,即得该定制标准下的规则样本数据。本发明可以得到本类质量更好、更具代表性,针对性的图像样本数据,提高了图像样本数据分类器的精度,从而满足算法等其他应用需要。
Description
技术领域
本发明涉及一种样本生成方法,具体说是一种基于KNN的图像样本生成方法,属于图像处理技术领域。
背景技术
随着大数据云计算技术的兴起,各种数据的大量建立,造成数据之间的标准不一致,有效数据的评价不一致,导致数据质量参差不齐。现有技术一般依赖业界开源的标准库,对算法的适应性检测较为粗糙,普遍地标准库上算法效果好,实际场景中效果不如人意。比如在人脸图像处理的技术落地方面,通用标准库一般让采集的角度,光照条件,表情变化等趋向一致,而实际情况是角度多变,光照条件多变,表情更是随机。
通常对于一个算法,往往需要大量的人脸图像数据来训练。而大量样本的收集费时费力,还需要人工标注,更重要的是人工标注的好坏将直接影响算法的训练。
对于一些特殊应用,比如单人脸实时识别,高速移动物体的实时识别等,这些对象的图像采集本身就非常困难,样本数量更加有限。
因此需要设计一种方法,能根据有限的样本生成更加标准的样本,再对生成的样本根据现有的样本繁殖技术(例如AAM模型)进行样本繁殖,以生成更多的可用的高质量样本。
发明内容
本发明设计了一种图像样本生成方法,具体说是一种基于KNN的图像样本生成方法,用来得到质量更好,更具有代表性的图像样本数据,从而提高算法落地可能性。
本发明提供的一种样本生成方法,具体说是一种基于KNN的图像样本生成方法,包括以下步骤:
(1)按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;
(2)对这些类别的图像数据按照定制的标准进行对齐处理;
(3)对对齐后的每一类数据进行主成分分析;再对每一个主成分与原数据用KNN求解m维最近距离,其中m的取值范围为(1,n),n为主成分个数;
(4)取最小的m维最近距离对应的m个原数据,并对这m个数据进行加权求和,即得该定制标准下的规则样本数据。可以根据该规则样本数据进行样本繁殖。
最近距离的维数m取值以及加权求和可为根据实际需要调整,只要不脱离主成分分析和KNN求解最近距离样本的范围。
其中K的取值范围为(1,n),n为主成分个数。
一般地,KNN中的K既不能取太小值,也不能取太大值。取太小,则结果依赖所取的个别样本,误差影响较大;取太大,则运算量非常大。合适范围的取值视提取任务的量和工程师的经验而定。
本发明提供的一种基于KNN的图像样本生成方法,按照已知的类别,对采集到的图像样本数据进行分类,得到多个类别的样本数据集合;对每个类的数据按照定制要求进行对齐;分别对每类数据进行主成分分析,得到多个主成分组;再对每个组求解m维最近距离,并取最小距离值对应的m个原数据,得到这m个数据的加权和,即为该定制要求下的规则样本数据;最后可以利用AAM等模型来对该类的规则样本数据进行样本繁殖,从而可以得到本类质量更好、更具代表性,针对性的图像样本数据,提高图像样本数据分类器的精度,从而满足算法等其他应用需要。
附图说明
图1为实施例以人脸图像为例的原理流程示意图;
图2为实施例用KNN对原数据和主成分求解m维最近距离的数据,图例中m=2。
具体实施方式
本发明提供了一种图像样本生成方法,具体说是一种基于KNN的图像样本生成方法,用来得到质量更好,更具有代表性的图像样本数据,从而提高算法落地可能性。
为方便说明本发明实施例,以人脸图像样本数据为例。进一步地,对于其他研究对象的图像样本数据,本发明实施例提供的技术方案同样适用。
下面结合附图对本发明提供的技术方案进行说明。
本发明实施例设计了一种基于KNN的图像样本生成方法,参见图1,首先按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;
对这些类别的图像数据按照定制的标准进行对齐处理;
对对齐后的每一类数据进行主成分分析,假设对某类数据Φ(θ1,…,θn)进行分析,其中θi(i=1,…,n)为本类中的第i个样本;
主成分(PCA)是一种数据集简化手段。将数据按照方差的特性进行排列,主成分即为特征向量,方差大的主成分,对应的特征值就越大,所占权重就相应的更大。对Φ(θ1,…,θn)主成分分析,得到n个主成分Γ(f1,…,fn)。
如图2,假设原数据为3维,通过主成分分析可以得到v1,v2,v3这3个主成分向量。
对主成分v1与整个本类的原数据集(这里是x1x2x3O坐标系下的数据)用KNN算法来计算最近距离所对应的原数据(样本),K取值为1;其他主成分以此类推,示例中m取2,则得到2维最近距离对应的2个原数据。
然后按照样本繁殖技术(比如AAM)对S进行繁殖,得到符合定制要求且质量较高的数据。
定制要求包括但不限于本文所述;样本繁殖技术包括但不限于本文所述;
所述m维数的取值以及加权求和的设计方法可以根据实际需要来调整,不必限于本发明的举例。只要不脱离主成分分析和KNN求解最近距离样本的范围,则本发明也意图包含这些变动和变型在内。
Claims (2)
1.一种基于KNN的图像样本生成方法,其特征在于,包括以下步骤:
(1)按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;
(2)对这些类别的图像数据按照定制的标准进行对齐处理;
(3)对对齐后的每一类数据进行主成分分析;再对每一个主成分与原数据用KNN求解m维最近距离,其中m的取值范围为(1,n),n为主成分个数;
(4)取最小的m维最近距离对应的m个原数据,并对这m个数据进行加权求和,即得该定制标准下的规则样本数据。
2.根据权利要求1所述的一种基于KNN的图像样本生成方法,其特征是:最近距离的维数m取值以及加权求和根据实际需要调整,只要不脱离主成分分析和KNN求解最近距离样本的范围。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910957405.7A CN110659700B (zh) | 2019-10-10 | 2019-10-10 | 一种基于knn的图像样本生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910957405.7A CN110659700B (zh) | 2019-10-10 | 2019-10-10 | 一种基于knn的图像样本生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110659700A true CN110659700A (zh) | 2020-01-07 |
CN110659700B CN110659700B (zh) | 2022-10-11 |
Family
ID=69040296
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910957405.7A Active CN110659700B (zh) | 2019-10-10 | 2019-10-10 | 一种基于knn的图像样本生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110659700B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7062073B1 (en) * | 1999-01-19 | 2006-06-13 | Tumey David M | Animated toy utilizing artificial intelligence and facial image recognition |
CN101777131A (zh) * | 2010-02-05 | 2010-07-14 | 西安电子科技大学 | 双模人脸识别方法及装置 |
KR20100096686A (ko) * | 2009-02-25 | 2010-09-02 | 오리엔탈종합전자(주) | 조명분리 고유얼굴에 기반한 조명에 강인한 얼굴 인식 |
CN102982322A (zh) * | 2012-12-07 | 2013-03-20 | 大连大学 | 基于pca图像重构和lda的人脸识别方法 |
CN103577815A (zh) * | 2013-11-29 | 2014-02-12 | 中国科学院计算技术研究所 | 一种人脸对齐方法和系统 |
CN105675785A (zh) * | 2016-01-27 | 2016-06-15 | 云南中烟工业有限责任公司 | 一种用于招标的快速气相色谱鉴别烟用香精香料品质方法 |
CN106599801A (zh) * | 2016-11-26 | 2017-04-26 | 施志刚 | 类内平均值最大相似性协作表示人脸识别方法 |
CN107481196A (zh) * | 2017-09-12 | 2017-12-15 | 河南大学 | 基于最近特征线的特征转换人脸超分辨率重建方法 |
-
2019
- 2019-10-10 CN CN201910957405.7A patent/CN110659700B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7062073B1 (en) * | 1999-01-19 | 2006-06-13 | Tumey David M | Animated toy utilizing artificial intelligence and facial image recognition |
KR20100096686A (ko) * | 2009-02-25 | 2010-09-02 | 오리엔탈종합전자(주) | 조명분리 고유얼굴에 기반한 조명에 강인한 얼굴 인식 |
CN101777131A (zh) * | 2010-02-05 | 2010-07-14 | 西安电子科技大学 | 双模人脸识别方法及装置 |
CN102982322A (zh) * | 2012-12-07 | 2013-03-20 | 大连大学 | 基于pca图像重构和lda的人脸识别方法 |
CN103577815A (zh) * | 2013-11-29 | 2014-02-12 | 中国科学院计算技术研究所 | 一种人脸对齐方法和系统 |
CN105675785A (zh) * | 2016-01-27 | 2016-06-15 | 云南中烟工业有限责任公司 | 一种用于招标的快速气相色谱鉴别烟用香精香料品质方法 |
CN106599801A (zh) * | 2016-11-26 | 2017-04-26 | 施志刚 | 类内平均值最大相似性协作表示人脸识别方法 |
CN107481196A (zh) * | 2017-09-12 | 2017-12-15 | 河南大学 | 基于最近特征线的特征转换人脸超分辨率重建方法 |
Non-Patent Citations (7)
Title |
---|
HUILING ZHOU 等: "Shape-Appearance-Correlated Active Appearance Model", 《PATTERN RECOGNITION》 * |
何国辉 等: "PCA类内平均脸法在人脸识别中的应用研究", 《计算机应用研究》 * |
李姗姗: "基于PCA的实时人脸识别系统的设计与实现", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
王健等: "主成分分析在人脸识别中的应用", 《科技视界》 * |
胡振兴: "一种基于PCA类内平均脸法和支持向量机模型的人脸识别算法", 《软件导刊》 * |
贝宗钧等: "基于类内均值的双投影2DPCA人脸识别方法", 《计算机仿真》 * |
赵深茂 等: "基于加权平均脸的最近邻算法", 《数字通信》 * |
Also Published As
Publication number | Publication date |
---|---|
CN110659700B (zh) | 2022-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107657279B (zh) | 一种基于少量样本的遥感目标检测方法 | |
US10424065B2 (en) | Systems and methods for performing three-dimensional semantic parsing of indoor spaces | |
WO2020119661A1 (zh) | 一种目标检测方法、装置以及行人检测方法、系统 | |
WO2019025945A1 (en) | SYSTEM AND METHOD FOR INCREMENTAL ANNOTATION OF DATA SETS | |
US10970313B2 (en) | Clustering device, clustering method, and computer program product | |
CN110781920B (zh) | 一种室内场景点云部件语义信息的识别方法 | |
CN112819019B (zh) | 分类模型生成装置及其分类模型生成方法 | |
CN103886335B (zh) | 基于模糊粒子群和散射熵的极化sar图像分类方法 | |
US10163000B2 (en) | Method and apparatus for determining type of movement of object in video | |
CN114358279A (zh) | 图像识别网络模型剪枝方法、装置、设备及存储介质 | |
Guo et al. | Substation equipment 3D identification based on KNN classification of subspace feature vector | |
CN110717453B (zh) | 一种基于余弦距离的图像样本生成方法 | |
CN110659700B (zh) | 一种基于knn的图像样本生成方法 | |
JP6598480B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN114049502B (zh) | 神经网络的训练、特征提取、数据处理方法和设备 | |
Liu et al. | Spatiotemporal image-based flight trajectory clustering model with deep convolutional autoencoder network | |
CN115546554A (zh) | 敏感图像的识别方法、装置、设备和计算机可读存储介质 | |
CN109359694B (zh) | 一种基于混合协同表示的分类器的图像分类方法和装置 | |
Zhang et al. | Edge Detection from RGB‐D Image Based on Structured Forests | |
Shi et al. | A scalable convolutional neural network for task-specified scenarios via knowledge distillation | |
CN110689087B (zh) | 一种基于概率似然的图像样本生成方法 | |
Mohamed Yassin et al. | An emotion and gender detection using hybridized convolutional 2D and batch norm residual network learning | |
CN113723468B (zh) | 一种三维点云的物体检测方法 | |
Fan et al. | Moving Target Detection and Tracking Technology Based on Genetic Algorithm | |
Wang et al. | Conceptual space based gross outlier removal for geometric model fitting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |