CN110942087B - 一种基于分离求解的矩阵型图像数据分类方法 - Google Patents
一种基于分离求解的矩阵型图像数据分类方法 Download PDFInfo
- Publication number
- CN110942087B CN110942087B CN201911062320.9A CN201911062320A CN110942087B CN 110942087 B CN110942087 B CN 110942087B CN 201911062320 A CN201911062320 A CN 201911062320A CN 110942087 B CN110942087 B CN 110942087B
- Authority
- CN
- China
- Prior art keywords
- data
- matrix
- vector
- class
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 62
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000000926 separation method Methods 0.000 title claims abstract description 10
- 239000013598 vector Substances 0.000 claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 39
- 230000002146 bilateral effect Effects 0.000 claims abstract description 23
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000012360 testing method Methods 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000013400 design of experiment Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于分离求解的矩阵型图像数据分类方法,包括将输入的矩阵型图像数据,根据输入的矩阵型数据所属类别两两划分为多对二分类图像数据,对二分类数据中多数类样本与少数类样本的比例设计的权重对角矩阵,利用双边向量控制矩阵数据输出,以及最小化解向量二范数,设计基于矩阵型图像数据分类方法目标函数。通过分离双边向量求解过程,提高求解速度。将测试数据转换成与训练数据相同的矩阵形式,根据求解的得到的双边向量,计算测试样本的输出,断别测试样本在而分类数据中所属类别,并投票。最后根据所有二分类数据投票结果,得到待判别样本最终所属类别。
Description
技术领域
本发明涉及数据分类领域,尤其设计了一种对图像数据进行处理的矩阵型图像数据分类方法。
背景技术
在数据分类领域,需要处理经典问题之一是对二维数据,即使用矩阵型数据,最典型的就是图像数据。在实际应用中,矩阵表示的数据常见于图像识别问题,例如人脸识别,指纹识别,或光谱识别。利用矩阵型数据,设计可以针对矩阵型数据分类的方法,并设计快速有效的求解方式,可以更好地对数据进行分类。
传统的模式分类方法通常只能处理向量型数据,如支持向量机(Support VectorMachine)和逻辑回归(Logistic Regression)等方法,必须要将矩阵型数据转化为向量型数据,才能处理数据。对于高维数据,则会面对维数灾难的问题。将矩阵型数据如图像,转换为向量型数据,则会损失象素间的结构信息。
传统的模式分类方法在处理不平衡问题时,通常将多有数据一视同仁,导致决策时更偏向于多数类,然后在不平衡问题中,少数类更值得关注。为了解决不平衡问题,当前方法可以分为三类:第一类是基于采样的方法,使不同类别的数据量趋向平衡。第二类是基于代价敏感的方法,通过增加少数类样本的权重,使得在分类中将少数类的错误分类代价提高,从而纠正传统分类器决策时偏向于多数类的情况。第三类是集成方法,通过设计识别能力弱的分类器,并集成弱分类器获得强分类结果。
对于矩阵型数据,通过双边向量控制数据的输出。但是双边向量为求解带来了困难。在迭代过程中,存在两个未知向量,需要双边向量交替求解。由于需要考虑两个向量,双边向量之间的关系难以确定,很难保证双边向量是否往最优解方向前进,此外各自的学习步长的调整,求解所需要的训练时间,都需要考虑。
针对上述问题,若能设计出基于矩阵型数据的分类方法,且该方法具有分类性能好,少数类识别率高,同时又兼顾学习效率的求解算法,将会进一步提高矩阵型数据的处理能力。
发明内容
矩阵型数据广泛存在于数据分类领域,如图像数据就是典型的矩阵型数据。但是,传统的模式分类方法,必须将矩阵型数据转化为向量形式,再进行处理,这就破坏了矩阵型数据的结构信息。对于高维数据,其向量形式会面对位数灾难问题,通过将向量型数据转换为矩阵型数据,可以极大地减少解向量的维度,从而避免了高维所带来的问题。值得注意的是,不同类别的数据数量上也存在明显的差异,存在分布不平衡性,其不平衡性也对分类带来了困难。针对现有的代价敏感学习方法中,对原始分类算法分类性能的要求,合适的少数类样本错误分类代价,以及少数类样本和多数类样本各自的准确率。此外,对于矩阵型数据,由于需要双边向量控制其输出,相应地也需要快速稳定的方法求解双边向量。本发明提供了一种基于分离求解的矩阵型数据分类方法。
本发明解决其技术问题所采用的技术方案,将输入的图像数据转,根据其描述转换为其对应的矩阵形式,再根据其类别信息,通过两两划分为多对二分类数据。对于输入的每一对数据通过计算数据的不平衡率,得到了对应训练数据的权重矩阵。利用双边向量控制矩阵型数据的输出,并利用权重对角矩阵,设计基于训练数据的误差函数。通过最小化双边向量二范数的输出值,提高解向量的稀疏性以及泛化性能。通过将基于训练数据的误差函数与双边向量二范数的输出值相加,设计矩阵型数据分类方法的目标函数。利用分离双边向量,固定双边向量中的一个,求解另一个向量的方法,最后求解目标函数下的双边向量。测试过程中,将待判别数据转变为训练数据的矩阵形式,然后使用双边向量控制待判别数据,输出判别结果。
本发明解决其技术问题所采用的技术方案还可以进一步完善。对于输入的图像数据,不仅限于其自身本来的矩阵形式,利用特征组合的方式,寻找二维图像信息中像素点之间关联信息,从而更好地利用其矩阵形式。此外,本发明直接利用不同类别数据量的比例设计数据权重,虽然快速简单,但是没有充分开率每一个样本个题的情况,其数据权重可以针对每一个样本进行设计。虽然利用分离求解方式解双边向量高效,可以在训练过程中可以进行筛选样本,每次迭代过程中,不需要全部训练数据参与,从而进一步提高训练速度。
本发明有益的效果是:这届处理图像数据的分类方法,利用双边向量控制矩阵型样本输出,利用不同类别数据量的比例平衡数据误分代价,利用双边向量二范数最小化提高泛化性能,再利用分离求解的方法高效地求得双边向量的解,设计出基于分离求解的矩阵型数据分类方法。该方法针对矩阵型数据,利用矩阵学习拓展了适用范围,并且具有良好分类结果,并保证了数据不平衡分布时,少数类与多数类数据的误差代价。此外,通过分离求解双边向量,快速求解出双边向量具体的值。
附图说明
图1是本发明应用于矩阵型图像数据分类问题的系统框架;
图2是本发明在测试步骤的流程图;
具体实施方式
下面结合附图和实施例对本发明作进一步介绍
对于输入的每一对二分类图像数据为,其中xi代表输入的第i个训练数据,yi∈{-1,+1}为第二个样本的类标记,yi=+1代表少数类样本,yi=-1代表多数类样本。N为输入的训练数据的数量,前N+个数据为少数类样本,后N-个数据为多数类样本。
利用输入的训练数据中,少数类和多数类样本的数量,计算所输入的训练数据的不平衡率:
根据不平衡率设计权重对角矩阵,所设计计权重对角矩阵中对角线上前N+个元素值为IR,后N-个元素值为1。所设计的权重对角矩阵其表示为:
再将阈值信息补充入矩阵型数据A,得到,
并将转换后的数据作为训练数据。
并出初始化每一个训练数据的阈值bi为10-6。
利用训练数据的误差函数,与u和v的二范数值相加,矩阵型数据分类方法的目标函数表示为
其中Di为对角矩阵D的第i各元素,c为控制正则函数的在目标函数L中的作用大小。
固定v为值全为1的向量,将所有训练数据右乘v,将矩阵型数据分类方法的目标函数表示;
minL(u)=(Xuu-1N×1-b)TD(Xuu-1N×1-b)+cuTS1u
其中Xu=[y1A1v,y2A2v,...,yNANv]T,1N×1=[1,...,1]N×1,
b=[b1,b2,...,bN]T其中b中所有值初始化为10-6。
设最大迭代次数iterations,迭代终止值ξ,以及学习率ρ,当前迭代次数k=1。
计算第k次迭代中的解向量u=Pinvu(1N×1+b)
计算误差e=Xuu-1N×1-b
计算b'=b+ρ(e+|e|)
如果||b'-b||2≤ξ并且k≤iterations,将b赋值为b',计算u=Pinvu(1N×1+b),计算k=k+1,然后跳转到步骤[0026]。
解得到u的解向量后,固定u,将所有训练数据左乘u,将矩阵型数据分类方法的目标函数表示;
minL(v)=(Xvv-1N×1-b)TD(Xvv-1N×1-b)+cvTS2v
其中Xv=[(y1uTA1)T,(y2uTA2)T,...,(yNuTAN)T]T,
b=[b1,b2,...,bN]T,其中b中所有值初始化为10-6。
当前迭代次数k=1。
计算第k次迭代中的解向量v=Pinvv(1N×1+b)
计算误差e=Xvv-1N×1-b
计算b'=b+ρ(e+|e|)
如果||b'-b||2≤ξ并且k≤iterations,将b赋值为b',计算v=Pinvv(1N×1+b),计算k=k+1,然后跳转到步骤[0032]。
对于待判断别数据x',将待判别样本转化为与训练数据相同的矩阵形式A',再利用求解得到的双边向量u和v,输出A的判定值为uTA'v。
如果uTA'v大于等于0,则待判断别数据类标为+1,否则待判断别数据类标为-1。对当前二分类数据所属的类别进行投票。
最后,根据待判断别样本每一类别的投票数,将待判断别样本判定为得到投票数最多的类别。
实验设计
实验数据集选取:该实验选择了UCI标准数据集中Yale和JAFFE人脸图像数据集,其类数目、样本维度和样本总数如下表所示。
所有使用的数据集均采用五折交叉方式处理,即将数据集分为大致均匀的五份,每一次选择其中一份作为测试数据,另外四份为训练数据。不重复选取测试数据五次。
对比算法:发明所使用的核心算法,即基于分离求解的矩阵型数据分类方法,简称为EMatMHKS。另外,我们选择MHKS、SVM、Adaboost、Random Forest为基准算法。每个算法的参数描述及值域设置如下表:
性能度量方法:实验统一使用少数类准确率与多数类准确率的算术平均(AAcc),来记录不同方法对各数据集的分类结果。结果均为对应算法在该数据集上使用最优参数配置时获得的结果,即最优结果。AAcc的计算公式为:
其中c为数据的类别数,Acci为第i类数据的准确率。
实验结果
首先是EMatMHKS与基准算法进行对比,在实验中每个对比算法的结果都是其最有参数对应的最佳结果,为了突出显示。每个数据集的最好结果标记为粗体。结果如下表:
如表可知,EMatMHKS在图像数据集上取得最高AAcc值,即最优结果。
Claims (7)
1.一种基于分离求解的矩阵型图像数据分类方法,所述方法包括以下步骤:
1)根据输入的图像数据,不同类别间两两匹配,得到多对二分类图像数据;对每一对二分类图像数据,得到多数类样本数量与少数类样本数量,利用多数类样本数量与少数类样本数量,得到权重对角矩阵;
2)对输入的每一对二分类图像数据问题描述,将输入的数据转化为成矩阵形式,作为训练数据;
3)利用双边向量控制矩阵型数据的输出,并利用权重对角矩阵,设计基于输二分类图像数据的误差函数;
4)利用最小化双边向量二范数,以及基于输入数据的误差函数,设计矩阵型数据分类方法的目标函数;
5)利用分离求解,将双边向量的一个向量固定,求解另一个向量,再固定求解得到的向量,求解另一个向量;
6)对于待判断别数据,将待判别样本转化为与训练样数据相同的矩阵形式,再利用求解得到双边向量,对待判断别样本进行分类。
6.如权利要求书1所述的方法,其特征在于,步骤5)还包括:固定v为值全为1的向量,将所有训练数据右乘v,将矩阵型数据分类方法的目标函数表示;
min L(u)=(Xuu-1Nx1-b)TD(Xuu-1N×1-b)+cuTS1u
其中Xu=[y1A1v,y2A2v,...,yNANv]T,1N×1=[1,...,1]N×1,
b=[b1,b2,...,bN]T
求解得到u的解向量后,固定u,将所有训练数据左乘u,将矩阵型数据分类方法的目标函数表示;
min L(v)=(Xvv-1N×1-b)TD(Xvv-1N×1-b)+cvTS2v
其中Xv=[(y1uTA1)T,(y2uTA2)T,...,(yNuTAN)T]T,求解得到v向量。
7.如权利要求书1所述的方法,其特征在于,步骤6)还包括:对于待判断别数据x’,将待判别样本转化为与训练图像数据相同的矩阵形式A’,再利用求解得到的双边向量u和v,输出A的判定值为uTA'v,如果uTA'v大于等于0,则待判断别数据类标为+1,否则待判断别数据类标为-1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911062320.9A CN110942087B (zh) | 2019-11-02 | 2019-11-02 | 一种基于分离求解的矩阵型图像数据分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911062320.9A CN110942087B (zh) | 2019-11-02 | 2019-11-02 | 一种基于分离求解的矩阵型图像数据分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110942087A CN110942087A (zh) | 2020-03-31 |
CN110942087B true CN110942087B (zh) | 2023-05-02 |
Family
ID=69907177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911062320.9A Active CN110942087B (zh) | 2019-11-02 | 2019-11-02 | 一种基于分离求解的矩阵型图像数据分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110942087B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113030197B (zh) * | 2021-03-26 | 2022-11-04 | 哈尔滨工业大学 | 一种气体传感器漂移补偿方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109308436B (zh) * | 2017-07-28 | 2021-09-28 | 西南科技大学 | 一种基于主动红外视频的活体人脸识别方法 |
US10872412B2 (en) * | 2018-04-02 | 2020-12-22 | Pearson Education, Inc. | Automatic graph scoring for neuropsychological assessments |
CN108921021A (zh) * | 2018-05-30 | 2018-11-30 | 华东理工大学 | 一种多视角的熵判别集成模型 |
-
2019
- 2019-11-02 CN CN201911062320.9A patent/CN110942087B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110942087A (zh) | 2020-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111814584A (zh) | 基于多中心度量损失的多视角环境下车辆重识别方法 | |
US9330332B2 (en) | Fast computation of kernel descriptors | |
CN114492768B (zh) | 一种基于小样本学习的孪生胶囊网络入侵检测方法 | |
CN105631519A (zh) | 一种基于预决策的卷积神经网络加速方法及系统 | |
Tang et al. | Classification for overlapping classes using optimized overlapping region detection and soft decision | |
CN103177265B (zh) | 基于核函数与稀疏编码的高清图像分类方法 | |
CN107169500A (zh) | 一种基于邻域粗糙集约减的谱聚类方法及系统 | |
Tavallali et al. | An efficient training procedure for viola-jones face detector | |
WO2015146113A1 (ja) | 識別辞書学習システム、識別辞書学習方法および記録媒体 | |
CN102184422B (zh) | 一种平均错分代价最小化的分类器集成方法 | |
CN108664653A (zh) | 一种基于K-means的医疗消费客户自动分类方法 | |
CN115294378A (zh) | 一种图像聚类方法及系统 | |
CN110942087B (zh) | 一种基于分离求解的矩阵型图像数据分类方法 | |
CN102609718B (zh) | 一种结合不同聚类算法生成视觉字典集体的方法 | |
CN108229507A (zh) | 数据分类方法以及装置 | |
US9076081B2 (en) | Multi-class discriminating device | |
WO2015070314A1 (en) | Supervised credit classifier with accounting ratios | |
CN115170843A (zh) | 基于嵌入特征提取的多视图一致性图像聚类方法及系统 | |
CN109345318B (zh) | 一种基于dtw-lasso-谱聚类的消费者聚类方法 | |
CN114565831A (zh) | 一种考虑深度学习模型健壮性的水下目标分类的方法 | |
CN108764106B (zh) | 基于级联结构的多尺度彩色图像人脸比对方法 | |
CN102609731B (zh) | 一种结合不同大小视觉词汇本的图像分类方法 | |
CN106933805B (zh) | 一种大数据集中生物事件触发词的识别方法 | |
Upadhyay et al. | An un-supervised image segmentation technique based on multi-objective Gravitational search algorithm (MOGSA) | |
CN105844296B (zh) | 基于cdcp局部描述子的遥感图像场景分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |