CN113537315B - 一种基于聚类信息熵的易区分图像选择方法 - Google Patents
一种基于聚类信息熵的易区分图像选择方法 Download PDFInfo
- Publication number
- CN113537315B CN113537315B CN202110740586.5A CN202110740586A CN113537315B CN 113537315 B CN113537315 B CN 113537315B CN 202110740586 A CN202110740586 A CN 202110740586A CN 113537315 B CN113537315 B CN 113537315B
- Authority
- CN
- China
- Prior art keywords
- entropy
- image
- clustering
- probability distribution
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010187 selection method Methods 0.000 title abstract description 6
- 238000000605 extraction Methods 0.000 claims abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 22
- 239000011159 matrix material Substances 0.000 claims description 21
- 238000005070 sampling Methods 0.000 claims description 14
- 238000012795 verification Methods 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 9
- 210000002569 neuron Anatomy 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 abstract description 9
- 230000035772 mutation Effects 0.000 abstract description 3
- 238000013135 deep learning Methods 0.000 abstract description 2
- 238000013145 classification model Methods 0.000 abstract 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及深度学习和图像处理领域,具体是一种基于聚类信息熵的易区分图像选择方法,包括如下步骤:首先,利用已有成熟网络提取图片特征;其次,对特征聚类并向产生低熵特征的方向优化特征提取网络;最后,利用函数拟合寻找熵值突变点,选择熵值小于突变点之下的图像。在聚类过程中,当图像的熵值越低,意味着图像中所包含的内容越单一,质量越高,利用上述方法在训练分类模型或聚类模型之前提取易训练的图像样本,可以解决数据噪声大、质量差的问题。
Description
技术领域
本发明涉及深度学习和图像处理领域,具体是指一种基于聚类信息熵的易区分图像选择方法。
背景技术
随着智能手机和社交媒体的普及,图像数据的产生速度越来越快,每天都有海量的图像数据被上传到公开网络上;对这些数据进行分析可以获得大量的有效信息,比如人们的饮食喜好,旅游喜好等等,具有重要的商用价值;但网络上的数据往往质量较差,内容杂乱,数据分析模型往往难以抓住重点,更可能导致模型训练过程中的崩溃;因此,在对海量数据进行分析之前,往往需要进行数据预处理;数据预处理的第一步就是筛出掉不合格的数据,选择质量好的数据往往是预处理的第一步。
图像搜索,数据匹配等操作都以数据的分类或聚类为基础操作,因此,选择出好的,适用于分类与聚类的图像样本是训练一个好的神经网络的必要操作。
发明内容
基于以上问题,本发明提供了一种基于聚类信息熵的易区分图像选择方法,实现了对数据进行分类或聚类操作前,排除掉噪声大、质量差的数据样本。
为解决以上技术问题,本发明采用的技术方案如下:
一种基于聚类信息熵的易区分图像选择方法,包括如下步骤:
步骤一、构建图像数据集,将图像数据集划分为训练集和验证集,并对图像进行预处理;
步骤二、构建特征提取网络,特征提取网络包含特征提取部分以及特征提取部分之后连接一个全连接层和聚类层;
步骤三、将训练集输入构建好的特征提取网络中进行训练并输出每个样本属于各个类的概率分布矩阵P;
步骤四、根据概率分布矩阵P计算目标概率分布矩阵Q;
步骤五、计算概率分布矩阵P和目标概率分布矩阵Q的指数损失的变化率,若指数损失的变化率小于阈值,则停止网络训练保存模型,并进入步骤六,若指数损失的变化率大于阈值,则开始新一轮的网络训练,并进入步骤三;
步骤六、模型收敛后进行多项式函数拟合每一个类中样本的熵值分布,计算拟合函数导数,并设置导数突增点,输出导数突增点以下的样本集形成低熵样本集;
步骤七、利用低熵样本集训练一个分类或聚类模型,并用验证集对分类或聚类模型进行验证。
进一步,所述步骤一中,图像数据集为OFFICE-Home,该图像数据集按照9:1的比例将所有图像划分为训练集和验证集。
进一步,所述步骤一中,图像预处理过程包括对图像进行上采样和下采样操作,其中,上采样采用三次内插法,下采样根据采用目标尺寸以及原有尺寸隔行隔列采样,图像经过上采样和下采样处理后尺寸统一为299*299*3。
进一步,所述步骤二中,特征提取网络使用ResNet50的第一层至倒数第二层作为特征提取部分对图像的特征表示进行提取,初始化参数选择AlexNet参数,参数不冻结,所述全连接层的输出维度和图片类别数量相同,每个神经元均代表一个类,其输出为图像属于该类的可能性,所述聚类层的输出输入维度均为图像类别数量,用于将上一层所输出的样本类别概率做归一化并使其符合高斯分布。
进一步,所述全连接层的神经元数量为31。
进一步,所述聚类层使用K-means算法对提取的特征表示进行聚类,并用得到的类中心初始化聚类层,其中,采用不同的质心初始化值运行算法的次数为20。
进一步,所述步骤四中,目标概率分布矩阵Q的计算公式为:
其中,pij表示样本i属于类别j的概率,qij是pij的目标分布,用于计算神经网络参数更新值,共有n个样本和m个类,l表示分布向低熵分布的步幅大小且l=3。
进一步,所述步骤六中,所述多项式函数中最高次项设置为10。
进一步,所述步骤六中,所述导数突增点设置为10。
与现有技术相比,本发明的有益效果是:其通过优化数据样本在聚类过程中,其类别可能性的熵的分布,使可信度较高的样本拥有更小的熵值,可信度低的样本拥有更大的熵值,后续通过使用多项式函数拟合各个簇中样本熵的分布,选择熵值突变点以下的样本提供给后续工作,排除了噪声大、质量差的数据样本。
附图说明
图1为本实施例1的流程图。
具体实施方式
下面结合附图对本发明作进一步的说明。本发明的实施方式包括但不限于下列实施例。
如图1所示的一种基于聚类信息熵的易区分图像选择方法,包括如下步骤:
步骤一、构建图像数据集,将图像数据集划分为训练集和验证集,并对图像进行预处理。
该步骤中,按照90%训练集,10%验证集将图像数据集分为训练集和验证集,同时,本实施例图像数据集为OFFICE-Home。
该步骤中,图像预处理包括对图像进行上采样和下采样操作,其中,上采样采用三次内插法,下采样根据采用目标尺寸以及原有尺寸隔行隔列采样,图像经过上采样和下采样处理后尺寸统一为299*299*3以适配ResNet50网络的输入标准。
步骤二、构建特征提取网络。
该步骤中,特征提取网络包含特征提取部分以及特征提取部分之后连接一个全连接层和聚类层。
该步骤中,特征提取网络使用ResNet50的第一层至倒数第二层作为特征提取部分对图像的特征表示进行提取,初始化参数选择AlexNet参数,参数不冻结。
该步骤中,全连接层的输出维度和图片类别数量相同,每个神经元均代表一个类,其输出为图像属于该类的可能性,同时,本实施例中,全连接层的神经元数量为31。
该步骤中,聚类层的输出输入维度均为图像类别数量,用于将上一层所输出的样本类别概率做归一化并使其符合高斯分布,同时,本实施例中,聚类层使用K-means算法对提取的特征表示进行聚类,并用得到的类中心初始化聚类层,其中,采用不同的质心初始化值运行算法的次数为20。
步骤三、将训练集输入构建好的特征提取网络中进行训练并输出每个样本属于各个类的概率分布矩阵P。
步骤四、根据概率分布矩阵P计算目标概率分布矩阵Q。
该步骤中,目标概率分布矩阵Q的计算公式为:
其中,pij表示样本i属于类别j的概率,qij是pij的目标分布,用于计算神经网络参数更新值,共有n个样本和m个类,l表示分布向低熵分布的步幅大小且l=3。
步骤五、计算概率分布矩阵P和目标概率分布矩阵Q的指数损失的变化率,若指数损失的变化率小于阈值,则停止网络训练保存模型,并进入步骤六,若指数损失的变化率大于阈值,则开始新一轮的网络训练,并进入步骤三。
该步骤中,先计算概率分布矩阵P和目标概率分布矩阵Q的指数损失loss,并返回损失函数值,按照反向传播规则优化模型的参数,同时计算本次训练的损失和上一轮训练的损失的变化率,从而得到概率分布矩阵P和目标概率分布矩阵Q的指数损失的变化率 的公式为:
其中,losspre表示上一轮训练的指数损失。
步骤六、模型收敛后进行多项式函数拟合每一个类中样本的熵值分布,计算拟合函数导数,并设置导数突增点,输出导数突增点以下的样本集形成低熵样本集;
该步骤中,多项式函数中最高次项设置为10。
该步骤中,导数突增点设置为10,即选择小于导数突增点为10以下的样本集形成低熵样本集。
步骤七、利用低熵样本集训练一个分类或聚类模型,并用验证集对分类或聚类模型进行验证。
如上即为本发明的实施例。上述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。
Claims (8)
1.一种基于聚类信息熵的易区分图像选择方法,其特征在于,包括如下步骤:
步骤一、构建图像数据集,将图像数据集划分为训练集和验证集,并对图像进行预处理;
步骤二、构建特征提取网络,特征提取网络包含特征提取部分以及特征提取部分之后连接一个全连接层和聚类层;
步骤六、模型收敛后进行多项式函数拟合每一个类中样本的熵值分布,计算拟合函数导数,并设置导数突增点,输出导数突增点以下的样本集形成低熵样本集;
步骤七、利用低熵样本集训练一个分类或聚类模型,并用验证集对分类或聚类模型进行验证;
所述步骤五中,先计算概率分布矩阵和目标概率分布矩阵/>的指数损失/>,并返回损失函数值,按照反向传播规则优化模型的参数,同时计算本次训练的损失和上一轮训练的损失的变化率,从而得到概率分布矩阵/>和目标概率分布矩阵/>的指数损失的变化率/>,/>的公式为:
2.根据权利要求1所述的一种基于聚类信息熵的易区分图像选择方法,其特征在于,所述步骤一中,图像数据集为OFFICE-Home,该图像数据集按照9:1的比例将所有图像划分为训练集和验证集。
3.根据权利要求2所述的一种基于聚类信息熵的易区分图像选择方法,其特征在于,所述步骤一中,图像预处理过程包括对图像进行上采样和下采样操作,其中,上采样采用三次内插法,下采样根据采用目标尺寸以及原有尺寸隔行隔列采样,图像经过上采样和下采样处理后尺寸统一为299*299*3。
4.根据权利要求1所述的一种基于聚类信息熵的易区分图像选择方法,其特征在于,所述步骤二中,特征提取网络使用ResNet50的第一层至倒数第二层作为特征提取部分对图像的特征表示进行提取,初始化参数选择AlexNet参数,参数不冻结,所述全连接层的输出维度和图片类别数量相同,每个神经元均代表一个类,其输出为图像属于该类的可能性,所述聚类层的输出输入维度均为图像类别数量,用于将上一层所输出的样本类别概率做归一化并使其符合高斯分布。
5.根据权利要求4所述的一种基于聚类信息熵的易区分图像选择方法,其特征在于,所述全连接层的神经元数量为31。
6.根据权利要求4所述的一种基于聚类信息熵的易区分图像选择方法,其特征在于,所述聚类层使用K-means算法对提取的特征表示进行聚类,并用得到的类中心初始化聚类层,其中,采用不同的质心初始化值运行算法的次数为20。
7.根据权利要求1所述的一种基于聚类信息熵的易区分图像选择方法,其特征在于,所述步骤六中,所述多项式函数中最高次项设置为10。
8.根据权利要求1所述的一种基于聚类信息熵的易区分图像选择方法,其特征在于,所述步骤六中,所述导数突增点设置为10。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110740586.5A CN113537315B (zh) | 2021-06-30 | 2021-06-30 | 一种基于聚类信息熵的易区分图像选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110740586.5A CN113537315B (zh) | 2021-06-30 | 2021-06-30 | 一种基于聚类信息熵的易区分图像选择方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113537315A CN113537315A (zh) | 2021-10-22 |
CN113537315B true CN113537315B (zh) | 2023-06-06 |
Family
ID=78126425
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110740586.5A Active CN113537315B (zh) | 2021-06-30 | 2021-06-30 | 一种基于聚类信息熵的易区分图像选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113537315B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101334893A (zh) * | 2008-08-01 | 2008-12-31 | 天津大学 | 基于模糊神经网络的融合图像质量综合评价方法 |
WO2018157381A1 (zh) * | 2017-03-03 | 2018-09-07 | 深圳大学 | 病理切片图像智能分类方法及装置 |
CN108563663A (zh) * | 2018-01-04 | 2018-09-21 | 出门问问信息科技有限公司 | 图片推荐方法、装置、设备及存储介质 |
CN109887023A (zh) * | 2019-01-11 | 2019-06-14 | 杭州电子科技大学 | 一种基于加权梯度幅度的双目融合立体图像质量评价方法 |
CN110059796A (zh) * | 2018-01-19 | 2019-07-26 | 杭州海康威视数字技术股份有限公司 | 卷积神经网络的生成方法及装置 |
CN110322416A (zh) * | 2019-07-09 | 2019-10-11 | 腾讯科技(深圳)有限公司 | 图像数据处理方法、装置以及计算机可读存储介质 |
CN110490239A (zh) * | 2019-08-06 | 2019-11-22 | 腾讯医疗健康(深圳)有限公司 | 图像质控网络的训练方法、质量分类方法、装置及设备 |
CN110750665A (zh) * | 2019-10-12 | 2020-02-04 | 南京邮电大学 | 基于熵最小化的开集域适应方法及系统 |
CN112069310A (zh) * | 2020-06-18 | 2020-12-11 | 中国科学院计算技术研究所 | 基于主动学习策略的文本分类方法及系统 |
CN112767504A (zh) * | 2020-01-22 | 2021-05-07 | 上海联影智能医疗科技有限公司 | 用于图像重建的系统和方法 |
-
2021
- 2021-06-30 CN CN202110740586.5A patent/CN113537315B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101334893A (zh) * | 2008-08-01 | 2008-12-31 | 天津大学 | 基于模糊神经网络的融合图像质量综合评价方法 |
WO2018157381A1 (zh) * | 2017-03-03 | 2018-09-07 | 深圳大学 | 病理切片图像智能分类方法及装置 |
CN108563663A (zh) * | 2018-01-04 | 2018-09-21 | 出门问问信息科技有限公司 | 图片推荐方法、装置、设备及存储介质 |
CN110059796A (zh) * | 2018-01-19 | 2019-07-26 | 杭州海康威视数字技术股份有限公司 | 卷积神经网络的生成方法及装置 |
CN109887023A (zh) * | 2019-01-11 | 2019-06-14 | 杭州电子科技大学 | 一种基于加权梯度幅度的双目融合立体图像质量评价方法 |
CN110322416A (zh) * | 2019-07-09 | 2019-10-11 | 腾讯科技(深圳)有限公司 | 图像数据处理方法、装置以及计算机可读存储介质 |
CN110490239A (zh) * | 2019-08-06 | 2019-11-22 | 腾讯医疗健康(深圳)有限公司 | 图像质控网络的训练方法、质量分类方法、装置及设备 |
CN110750665A (zh) * | 2019-10-12 | 2020-02-04 | 南京邮电大学 | 基于熵最小化的开集域适应方法及系统 |
CN112767504A (zh) * | 2020-01-22 | 2021-05-07 | 上海联影智能医疗科技有限公司 | 用于图像重建的系统和方法 |
CN112069310A (zh) * | 2020-06-18 | 2020-12-11 | 中国科学院计算技术研究所 | 基于主动学习策略的文本分类方法及系统 |
Non-Patent Citations (4)
Title |
---|
Kede Ma等.dipIQ: Blind Image Quality Assessment by Learning-to-Rank Discriminable Image Pairs.IEEE Transactions on Image Processing.2017,第26卷3951 - 3964. * |
Matan Ben-Yosef等.Gaussian Mixture Generative Adversarial Networks for Diverse Datasets, and the Unsupervised Clustering of Images.https://arxiv.org/abs/1808.10356.2018,1-20. * |
贺海.基于样本筛选的无监督领域自适应的图像分类研究.中国优秀硕士学位论文全文数据库 信息科技辑.2021,I138-501. * |
赵航.基于特征重构和样本筛选的迁移学习算法研究.中国优秀硕士学位论文全文数据库 信息科技辑.2020,I140-67. * |
Also Published As
Publication number | Publication date |
---|---|
CN113537315A (zh) | 2021-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111126386B (zh) | 场景文本识别中基于对抗学习的序列领域适应方法 | |
CN110162593B (zh) | 一种搜索结果处理、相似度模型训练方法及装置 | |
CN108228915B (zh) | 一种基于深度学习的视频检索方法 | |
CN110717332B (zh) | 基于非对称孪生网络的新闻与案件相似度计算方法 | |
Kadam et al. | Detection and localization of multiple image splicing using MobileNet V1 | |
CN110415071B (zh) | 一种基于观点挖掘分析的汽车竞品对比方法 | |
CN114817613B (zh) | 基于注意力增强模块和多尺度特征融合的图像检索方法 | |
CN108846047A (zh) | 一种基于卷积特征的图片检索方法及系统 | |
CN107958067A (zh) | 一种基于无标注自动特征提取的大规模电商图片检索系统 | |
CN109710804B (zh) | 一种教学视频图像知识点降维分析方法 | |
CN111475622A (zh) | 一种文本分类方法、装置、终端及存储介质 | |
CN110413825B (zh) | 面向时尚电商的街拍推荐系统 | |
CN116030396B (zh) | 一种用于视频结构化提取的精确分割方法 | |
CN111079514A (zh) | 一种基于clbp和卷积神经网络的人脸识别方法 | |
CN112036511B (zh) | 基于注意力机制图卷积神经网络的图像检索方法 | |
CN117611932A (zh) | 基于双重伪标签细化和样本重加权的图像分类方法及系统 | |
CN114926725A (zh) | 一种基于图像分析的线上金融团伙欺诈识别方法 | |
CN111008570B (zh) | 一种基于压缩-激励伪三维网络的视频理解方法 | |
CN109657082A (zh) | 基于全卷积神经网络的遥感图像多标签检索方法及系统 | |
Wang et al. | Prototype-based intent perception | |
CN105956604B (zh) | 一种基于两层时空邻域特征的动作识别方法 | |
Yao | [Retracted] Application of Higher Education Management in Colleges and Universities by Deep Learning | |
CN110866547A (zh) | 基于多特征和随机森林的中药饮片自动分类系统及方法 | |
CN114037886A (zh) | 图像识别方法、装置、电子设备和可读存储介质 | |
CN114529894A (zh) | 一种融合空洞卷积的快速场景文本检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |