CN110659700A - 一种基于knn的图像样本生成方法 - Google Patents

一种基于knn的图像样本生成方法 Download PDF

Info

Publication number
CN110659700A
CN110659700A CN201910957405.7A CN201910957405A CN110659700A CN 110659700 A CN110659700 A CN 110659700A CN 201910957405 A CN201910957405 A CN 201910957405A CN 110659700 A CN110659700 A CN 110659700A
Authority
CN
China
Prior art keywords
data
knn
principal component
generation method
image sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910957405.7A
Other languages
English (en)
Other versions
CN110659700B (zh
Inventor
赵书朵
韩旭
冯冠钦
周文豪
马晨鑫
董双慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Petroleum University
Original Assignee
Southwest Petroleum University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Petroleum University filed Critical Southwest Petroleum University
Priority to CN201910957405.7A priority Critical patent/CN110659700B/zh
Publication of CN110659700A publication Critical patent/CN110659700A/zh
Application granted granted Critical
Publication of CN110659700B publication Critical patent/CN110659700B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于KNN的图像样本生成方法,包括以下步骤:(1)按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;(2)对这些类别的图像数据按照定制的标准进行对齐处理;(3)对对齐后的每一类数据进行主成分分析;再对每一个主成分与原数据用KNN求解m维最近距离,其中m的取值范围为(1,n),n为主成分个数;(4)取最小的m维最近距离对应的m个原数据,并对这m个数据进行加权求和,即得该定制标准下的规则样本数据。本发明可以得到本类质量更好、更具代表性,针对性的图像样本数据,提高了图像样本数据分类器的精度,从而满足算法等其他应用需要。

Description

一种基于KNN的图像样本生成方法
技术领域
本发明涉及一种样本生成方法,具体说是一种基于KNN的图像样本生成方法,属于图像处理技术领域。
背景技术
随着大数据云计算技术的兴起,各种数据的大量建立,造成数据之间的标准不一致,有效数据的评价不一致,导致数据质量参差不齐。现有技术一般依赖业界开源的标准库,对算法的适应性检测较为粗糙,普遍地标准库上算法效果好,实际场景中效果不如人意。比如在人脸图像处理的技术落地方面,通用标准库一般让采集的角度,光照条件,表情变化等趋向一致,而实际情况是角度多变,光照条件多变,表情更是随机。
通常对于一个算法,往往需要大量的人脸图像数据来训练。而大量样本的收集费时费力,还需要人工标注,更重要的是人工标注的好坏将直接影响算法的训练。
对于一些特殊应用,比如单人脸实时识别,高速移动物体的实时识别等,这些对象的图像采集本身就非常困难,样本数量更加有限。
因此需要设计一种方法,能根据有限的样本生成更加标准的样本,再对生成的样本根据现有的样本繁殖技术(例如AAM模型)进行样本繁殖,以生成更多的可用的高质量样本。
发明内容
本发明设计了一种图像样本生成方法,具体说是一种基于KNN的图像样本生成方法,用来得到质量更好,更具有代表性的图像样本数据,从而提高算法落地可能性。
本发明提供的一种样本生成方法,具体说是一种基于KNN的图像样本生成方法,包括以下步骤:
(1)按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;
(2)对这些类别的图像数据按照定制的标准进行对齐处理;
(3)对对齐后的每一类数据进行主成分分析;再对每一个主成分与原数据用KNN求解m维最近距离,其中m的取值范围为(1,n),n为主成分个数;
(4)取最小的m维最近距离对应的m个原数据,并对这m个数据进行加权求和,即得该定制标准下的规则样本数据。可以根据该规则样本数据进行样本繁殖。
最近距离的维数m取值以及加权求和可为根据实际需要调整,只要不脱离主成分分析和KNN求解最近距离样本的范围。
其中K的取值范围为(1,n),n为主成分个数。
一般地,KNN中的K既不能取太小值,也不能取太大值。取太小,则结果依赖所取的个别样本,误差影响较大;取太大,则运算量非常大。合适范围的取值视提取任务的量和工程师的经验而定。
本发明提供的一种基于KNN的图像样本生成方法,按照已知的类别,对采集到的图像样本数据进行分类,得到多个类别的样本数据集合;对每个类的数据按照定制要求进行对齐;分别对每类数据进行主成分分析,得到多个主成分组;再对每个组求解m维最近距离,并取最小距离值对应的m个原数据,得到这m个数据的加权和,即为该定制要求下的规则样本数据;最后可以利用AAM等模型来对该类的规则样本数据进行样本繁殖,从而可以得到本类质量更好、更具代表性,针对性的图像样本数据,提高图像样本数据分类器的精度,从而满足算法等其他应用需要。
附图说明
图1为实施例以人脸图像为例的原理流程示意图;
图2为实施例用KNN对原数据和主成分求解m维最近距离的数据,图例中m=2。
具体实施方式
本发明提供了一种图像样本生成方法,具体说是一种基于KNN的图像样本生成方法,用来得到质量更好,更具有代表性的图像样本数据,从而提高算法落地可能性。
为方便说明本发明实施例,以人脸图像样本数据为例。进一步地,对于其他研究对象的图像样本数据,本发明实施例提供的技术方案同样适用。
下面结合附图对本发明提供的技术方案进行说明。
本发明实施例设计了一种基于KNN的图像样本生成方法,参见图1,首先按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;
对这些类别的图像数据按照定制的标准进行对齐处理;
对对齐后的每一类数据进行主成分分析,假设对某类数据Φ(θ1,…,θn)进行分析,其中θi(i=1,…,n)为本类中的第i个样本;
主成分(PCA)是一种数据集简化手段。将数据按照方差的特性进行排列,主成分即为特征向量,方差大的主成分,对应的特征值就越大,所占权重就相应的更大。对Φ(θ1,…,θn)主成分分析,得到n个主成分Γ(f1,…,fn)。
如图2,假设原数据为3维,通过主成分分析可以得到v1,v2,v3这3个主成分向量。
对主成分v1与整个本类的原数据集(这里是x1x2x3O坐标系下的数据)用KNN算法来计算最近距离所对应的原数据(样本),K取值为1;其他主成分以此类推,示例中m取2,则得到2维最近距离对应的2个原数据。
计算规则样本数据
Figure BDA0002227795500000021
为方便描述,这里的加权求和简化为求平均。如图2,示例中
Figure BDA0002227795500000031
即认为S是本类样本数据在该定制要求下的规则数据。
然后按照样本繁殖技术(比如AAM)对S进行繁殖,得到符合定制要求且质量较高的数据。
定制要求包括但不限于本文所述;样本繁殖技术包括但不限于本文所述;
所述m维数的取值以及加权求和的设计方法可以根据实际需要来调整,不必限于本发明的举例。只要不脱离主成分分析和KNN求解最近距离样本的范围,则本发明也意图包含这些变动和变型在内。

Claims (2)

1.一种基于KNN的图像样本生成方法,其特征在于,包括以下步骤:
(1)按照已知的类别,对采集到的图像数据进行归类,得到不同类别的图像数据集合;
(2)对这些类别的图像数据按照定制的标准进行对齐处理;
(3)对对齐后的每一类数据进行主成分分析;再对每一个主成分与原数据用KNN求解m维最近距离,其中m的取值范围为(1,n),n为主成分个数;
(4)取最小的m维最近距离对应的m个原数据,并对这m个数据进行加权求和,即得该定制标准下的规则样本数据。
2.根据权利要求1所述的一种基于KNN的图像样本生成方法,其特征是:最近距离的维数m取值以及加权求和根据实际需要调整,只要不脱离主成分分析和KNN求解最近距离样本的范围。
CN201910957405.7A 2019-10-10 2019-10-10 一种基于knn的图像样本生成方法 Active CN110659700B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910957405.7A CN110659700B (zh) 2019-10-10 2019-10-10 一种基于knn的图像样本生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910957405.7A CN110659700B (zh) 2019-10-10 2019-10-10 一种基于knn的图像样本生成方法

Publications (2)

Publication Number Publication Date
CN110659700A true CN110659700A (zh) 2020-01-07
CN110659700B CN110659700B (zh) 2022-10-11

Family

ID=69040296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910957405.7A Active CN110659700B (zh) 2019-10-10 2019-10-10 一种基于knn的图像样本生成方法

Country Status (1)

Country Link
CN (1) CN110659700B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7062073B1 (en) * 1999-01-19 2006-06-13 Tumey David M Animated toy utilizing artificial intelligence and facial image recognition
CN101777131A (zh) * 2010-02-05 2010-07-14 西安电子科技大学 双模人脸识别方法及装置
KR20100096686A (ko) * 2009-02-25 2010-09-02 오리엔탈종합전자(주) 조명분리 고유얼굴에 기반한 조명에 강인한 얼굴 인식
CN102982322A (zh) * 2012-12-07 2013-03-20 大连大学 基于pca图像重构和lda的人脸识别方法
CN103577815A (zh) * 2013-11-29 2014-02-12 中国科学院计算技术研究所 一种人脸对齐方法和系统
CN105675785A (zh) * 2016-01-27 2016-06-15 云南中烟工业有限责任公司 一种用于招标的快速气相色谱鉴别烟用香精香料品质方法
CN106599801A (zh) * 2016-11-26 2017-04-26 施志刚 类内平均值最大相似性协作表示人脸识别方法
CN107481196A (zh) * 2017-09-12 2017-12-15 河南大学 基于最近特征线的特征转换人脸超分辨率重建方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7062073B1 (en) * 1999-01-19 2006-06-13 Tumey David M Animated toy utilizing artificial intelligence and facial image recognition
KR20100096686A (ko) * 2009-02-25 2010-09-02 오리엔탈종합전자(주) 조명분리 고유얼굴에 기반한 조명에 강인한 얼굴 인식
CN101777131A (zh) * 2010-02-05 2010-07-14 西安电子科技大学 双模人脸识别方法及装置
CN102982322A (zh) * 2012-12-07 2013-03-20 大连大学 基于pca图像重构和lda的人脸识别方法
CN103577815A (zh) * 2013-11-29 2014-02-12 中国科学院计算技术研究所 一种人脸对齐方法和系统
CN105675785A (zh) * 2016-01-27 2016-06-15 云南中烟工业有限责任公司 一种用于招标的快速气相色谱鉴别烟用香精香料品质方法
CN106599801A (zh) * 2016-11-26 2017-04-26 施志刚 类内平均值最大相似性协作表示人脸识别方法
CN107481196A (zh) * 2017-09-12 2017-12-15 河南大学 基于最近特征线的特征转换人脸超分辨率重建方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
HUILING ZHOU 等: "Shape-Appearance-Correlated Active Appearance Model", 《PATTERN RECOGNITION》 *
何国辉 等: "PCA类内平均脸法在人脸识别中的应用研究", 《计算机应用研究》 *
李姗姗: "基于PCA的实时人脸识别系统的设计与实现", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *
王健等: "主成分分析在人脸识别中的应用", 《科技视界》 *
胡振兴: "一种基于PCA类内平均脸法和支持向量机模型的人脸识别算法", 《软件导刊》 *
贝宗钧等: "基于类内均值的双投影2DPCA人脸识别方法", 《计算机仿真》 *
赵深茂 等: "基于加权平均脸的最近邻算法", 《数字通信》 *

Also Published As

Publication number Publication date
CN110659700B (zh) 2022-10-11

Similar Documents

Publication Publication Date Title
CN107657279B (zh) 一种基于少量样本的遥感目标检测方法
US10424065B2 (en) Systems and methods for performing three-dimensional semantic parsing of indoor spaces
WO2020119661A1 (zh) 一种目标检测方法、装置以及行人检测方法、系统
WO2019025945A1 (en) SYSTEM AND METHOD FOR INCREMENTAL ANNOTATION OF DATA SETS
US10970313B2 (en) Clustering device, clustering method, and computer program product
CN110781920B (zh) 一种室内场景点云部件语义信息的识别方法
CN112819019B (zh) 分类模型生成装置及其分类模型生成方法
CN103886335B (zh) 基于模糊粒子群和散射熵的极化sar图像分类方法
US10163000B2 (en) Method and apparatus for determining type of movement of object in video
CN114358279A (zh) 图像识别网络模型剪枝方法、装置、设备及存储介质
Guo et al. Substation equipment 3D identification based on KNN classification of subspace feature vector
CN110717453B (zh) 一种基于余弦距离的图像样本生成方法
CN110659700B (zh) 一种基于knn的图像样本生成方法
JP6598480B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN114049502B (zh) 神经网络的训练、特征提取、数据处理方法和设备
Liu et al. Spatiotemporal image-based flight trajectory clustering model with deep convolutional autoencoder network
CN115546554A (zh) 敏感图像的识别方法、装置、设备和计算机可读存储介质
CN109359694B (zh) 一种基于混合协同表示的分类器的图像分类方法和装置
Zhang et al. Edge Detection from RGB‐D Image Based on Structured Forests
Shi et al. A scalable convolutional neural network for task-specified scenarios via knowledge distillation
CN110689087B (zh) 一种基于概率似然的图像样本生成方法
Mohamed Yassin et al. An emotion and gender detection using hybridized convolutional 2D and batch norm residual network learning
CN113723468B (zh) 一种三维点云的物体检测方法
Fan et al. Moving Target Detection and Tracking Technology Based on Genetic Algorithm
Wang et al. Conceptual space based gross outlier removal for geometric model fitting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant