CN117809140A - 基于图像识别的图像预处理系统及其方法 - Google Patents

基于图像识别的图像预处理系统及其方法 Download PDF

Info

Publication number
CN117809140A
CN117809140A CN202410233059.9A CN202410233059A CN117809140A CN 117809140 A CN117809140 A CN 117809140A CN 202410233059 A CN202410233059 A CN 202410233059A CN 117809140 A CN117809140 A CN 117809140A
Authority
CN
China
Prior art keywords
image
contrast
distribution
sample
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410233059.9A
Other languages
English (en)
Other versions
CN117809140B (zh
Inventor
肖豪
陈沙沙
李渊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yulin Tuofeng Da'an Network Technology Co ltd
Original Assignee
Yulin Tuofeng Da'an Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yulin Tuofeng Da'an Network Technology Co ltd filed Critical Yulin Tuofeng Da'an Network Technology Co ltd
Priority to CN202410233059.9A priority Critical patent/CN117809140B/zh
Publication of CN117809140A publication Critical patent/CN117809140A/zh
Application granted granted Critical
Publication of CN117809140B publication Critical patent/CN117809140B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了基于图像识别的图像预处理系统及其方法,具体涉及图像数据处理领域,是通过使用纹理特征提取方法对图像数据集进行领域划分,使用AUC值验证预训练卷积神经网络性能以确保模型稳定。计算特征分布对比度考虑不同领域间差异,得整体领域内分布对比度。引入样本区分能力指数,剥离其对对比度的影响,更准确反映模型在样本层面的性能。将整体对比度与警示阈值比较,生成信号,综合考虑了模型性能、领域分布对比度和样本区分能力,提高了对数据集特性的综合把握。引入样本区分能力指数更全面地考量了模型的全局性能和局部性能,使得信号生成更具实际意义和泛化性。同时有助于识别数据集中可能存在的领域差异,为模型训练提供更准确的指导。

Description

基于图像识别的图像预处理系统及其方法
技术领域
本发明涉及图像数据处理领域,更具体地说,本发明涉及基于图像识别的图像预处理系统及其方法。
背景技术
许多图像预处理模型在设计和训练时通常倾向于使用标准图像数据集,如ImageNet。这些数据集可能存在特定的特征偏见,导致模型在实际应用中对某些特定类型的图像更为敏感,而对其他类型的图像表现较差。
标准图像数据集可能更倾向于包含某些类别的图像,而对其他类别的覆盖较少。这样的样本偏见容易导致模型在处理更广泛和多样化的图像时表现不佳。
预处理方法在设计时可能过度适应标准数据集中的场景和特征,导致在其他实际应用场景中的泛化性能下降,因此有必要对数据集进行提前预分析,避免在后期误导或干扰模型精度和质量。
为了解决上述问题,现提供一种技术方案。
发明内容
为了克服现有技术的上述缺陷,本发明的实施例提供基于图像识别的图像预处理系统及其方法,首先,通过使用纹理特征提取方法对图像数据集进行领域划分,随后使用AUC值验证预训练卷积神经网络的性能,以确保模型的稳定性。接着,通过计算特征分布的对比度,综合考虑不同领域间的差异,得到整体领域内分布对比度。为提高评估的全面性,引入样本区分能力指数,剥离其对整体领域内分布对比度的影响,从而更准确地反映模型在样本层面的性能。最后,将整体领域内分布对比度与警示阈值进行比较,生成相应信号,指导模型训练的进行与否。进而充分综合了模型性能、领域内分布对比度和样本区分能力,提高了对数据集特性的综合把握。通过引入样本区分能力指数,更全面地考量了模型的全局性能和局部性能,使得最终的信号生成更具实际意义和泛化性。这种方法不仅可以提高模型在各个领域的性能一致性,同时也有助于识别数据集中可能存在的领域差异,为模型的训练提供更准确的指导,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:S1.使用纹理特征提取方法,对图像数据集进行划分;
S2.使用样本区分能力指数评估合格的卷积神经网络进行图像的抽象语义信息提取,获得高维空间中的特征向量;
S3.使用分布距离度量方法,计算每一对领域之间特征分布的对比度,对所有领域对的对比度进行平均;
S4.引入样本区分能力指数的影响,获得综合整体领域内分布对比度,并和对应阈值的比较结果给出对应的信号。
在一个优选的实施方式中,S1具体包括以下内容:
S1-1.对于数据集中的每张图像,使用纹理特征提取方法,得到每张图像的纹理特征向量,处理过程如下:
将每个像素的彩色通道进行加权平均,使得彩色图像转换为灰度图像;
将灰度图像划分为若干个图像块;
对于每个图像块中的中心像素,与其周围的像素进行比较,按照以下规则生成二进制编码:
将周围像素的灰度值与中心像素的灰度值进行比较,大于或等于中心像素的记为1,小于中心像素的记为0;
按照顺时针或逆时针方向对比,生成一个二进制编码;
对于每个图像块,将中心像素的LBP二进制编码作为该图像块的一个像素,形成LBP图像,如此,每个图像块都被一个LBP编码替代;
对整个LBP图像进行直方图统计,统计每个LBP编码出现的次数,得到一个直方图;
将直方图中的各个LBP编码的出现次数作为特征向量的元素,得到最终的LBP特征向量。
在一个优选的实施方式中,S1-2.假设和/>分别是图像/>和图像/>的纹理特征向量,则相似性度量为:/>
式中,表示纹理特征向量/>和/>之间的相似性度量,通过相似性度量方法得到;/>表示图像/>和图像/>之间的相似性度量,是基于图像的纹理特征向量计算得到的;
S1-3.构建相似性矩阵,计算公式如下:
式中,表示图像/>和图像/>之间的纹理相似性;
S1-4.将相似性矩阵中相似性大于相似阈值的图像判定为同一领域,形成领域划分。
在一个优选的实施方式中,S2包括以下内容:
对卷积神经网络进行验证,过程如下:
使用预训练的卷积神经网络对官方提供用于标准测试的每个样本进行预测,并获取模型对于正例的概率值;
根据不同的概率阈值,计算真正例率和假正例率,使用不同的概率阈值计算得到一系列的点,连接这些点绘制ROC曲线;
通过对ROC曲线下的面积进行积分来计算得到样本区分能力指数,计算公式如下:
其中,表示在真正例率相等的条件下,找到对应的最小假正例率,AUC表示样本区分能力指数;
将样本区分能力指数和区分能力阈值区间进行比较;
若样本区分能力指数大于区分能力阈值区间的最大值,生成优异信号;
若样本区分能力指数属于区分能力阈值区间,生成影响信号;
若样本区分能力指数小于区分能力阈值区间的最小值,生成不参与使用信号。
在一个优选的实施方式中,在确定卷积神经网络未生成不参与使用信号后,则使用卷积神经网络从每个领域中提取图像特征,包括以下内容:
对于领域内的每张图片,得到的特征表示形成一个特征向量;对领域内所有图片的特征向量进行汇总,得到一个特征矩阵,其中每行代表一张图片的特征向量;
对于每个特征向量的维度,计算相应维度上所有图片的均值,得到领域的平均特征向量;
将领域的平均特征向量建模成一个特征分布。
在一个优选的实施方式中,S3包括以下内容:
对于每一对领域,计算其特征分布的对比度;定义对比度公式如下:
其中,和/>分别是两个领域的特征分布;
表示/>到/>的KL散度,用来度量当/>作为参考分布时,使用/>来表示的信息增益;
则表示从/>到/>的KL散度,同样是度量信息的差异,但是方向相反;
将所有领域对的对比度进行平均或加权平均,得到整体领域内分布对比度,定义整体对比度公式如下:
其中,N是领域对的总数,和/>分别表示第K对领域的特征分布。
在一个优选的实施方式中,S3包括以下内容:
在获得影响信号的情况下,则引入样本区分能力指数对整体领域内分布对比度进行校对,计算过程如下:
其中,表示综合整体领域内分布对比度,/>表示修正因子,/>表示区分能力阈值区间,H1和H2分别表示区分能力阈值区间的最小值和最大值。
在一个优选的实施方式中,将综合整体领域内分布对比度和警示阈值进行比较,若综合整体领域内分布对比度大于或等于警示阈值,生成不合格信号;反之,若综合整体领域内分布对比度小于警示阈值,生成合格信号。
基于图像识别的图像预处理系统,包括领域划分模块、样本区分能力评估模块、特征分布对比度计算模块和整体领域内分布对比度综合模块;
领域划分模块对图像数据集纹理特征提取,将相似的图像分组为不同的领域,形成领域划分,将划分好的结果发送至样本区分能力评估模块;
样本区分能力评估模块使用合格的卷积神经网络对图像进行抽象语义信息提取,并计算样本区分能力指数,将提取的结果和样本区分能力指数一并发送至特征分布对比度计算模块;
特征分布对比度计算模块使用分布距离度量方法,计算每一对领域之间特征分布的对比度,然后对所有领域对的对比度进行平均,将计算结果发送至整体领域内分布对比度综合模块;
整体领域内分布对比度综合模块引入样本区分能力指数的影响,综合计算整体领域内分布对比度,并与设定的阈值进行比较,生成相应的信号。
本发明基于图像识别的图像预处理系统及其方法的技术效果和优点:
本发明,首先,通过使用纹理特征提取方法对图像数据集进行领域划分,随后使用AUC值验证预训练卷积神经网络的性能,以确保模型的稳定性。接着,通过计算特征分布的对比度,综合考虑不同领域间的差异,得到整体领域内分布对比度。为提高评估的全面性,引入样本区分能力指数,剥离其对整体领域内分布对比度的影响,从而更准确地反映模型在样本层面的性能。最后,将整体领域内分布对比度与警示阈值进行比较,生成相应信号,指导模型训练的进行与否。进而充分综合了模型性能、领域内分布对比度和样本区分能力,提高了对数据集特性的综合把握。通过引入样本区分能力指数,更全面地考量了模型的全局性能和局部性能,使得最终的信号生成更具实际意义和泛化性。这种方法不仅可以提高模型在各个领域的性能一致性,同时也有助于识别数据集中可能存在的领域差异,为模型的训练提供更准确的指导。
附图说明
图1为本发明基于图像识别的图像预处理方法的流程示意图;
图2为本发明基于图像识别的图像预处理系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
图1给出了本发明基于图像识别的图像预处理方法,其特征在于:
S1.使用纹理特征提取方法,对图像数据集进行划分;
S2.使用样本区分能力指数评估合格的卷积神经网络进行图像的抽象语义信息提取,获得高维空间中的特征向量;
S3.使用分布距离度量方法,计算每一对领域之间特征分布的对比度,对所有领域对的对比度进行平均;
S4.引入样本区分能力指数的影响,获得综合整体领域内分布对比度,并和对应阈值的比较结果给出对应的信号。
S1具体包括以下内容:
S1-1.对于数据集中的每张图像,使用纹理特征提取方法,得到每张图像的纹理特征向量,处理过程如下:
数据集是指要参与图像预处理系统内的相关模型训练的标准数据集。
将每个像素的彩色通道进行加权平均,使得彩色图像转换为灰度图像;
将灰度图像划分为若干个图像块。每个图像块包含3×3、5×5或其他尺寸的像素;
对于每个图像块中的中心像素,与其周围的像素进行比较,按照以下规则生成二进制编码:
将周围像素的灰度值与中心像素的灰度值进行比较,大于或等于中心像素的记为1,小于中心像素的记为0。
按照顺时针或逆时针方向对比,生成一个二进制编码。例如,11001001。
对于每个图像块,将中心像素的LBP二进制编码作为该图像块的一个像素,形成LBP图像。如此,每个图像块都被一个LBP编码替代。
对整个LBP图像进行直方图统计。统计每个LBP编码出现的次数,得到一个直方图。
将直方图中的各个LBP编码的出现次数作为特征向量的元素,得到最终的LBP特征向量。
整个过程可以用以下公式概括:
其中:
是中心像素的坐标;
是中心像素的灰度值;
是周围像素的灰度值;
P是周围像素的数量;
是阶跃函数,当x≥0时为1,否则为0。
阶跃函数的作用是对灰度差异进行二值化,捕捉局部纹理信息。
通过LBP特征提取,可以捕捉图像中局部纹理的变化,用于图像分类、检索和分割等任务。
S1-2.假设和/>分别是图像/>和图像/>的纹理特征向量,则相似性度量为:
式中,表示纹理特征向量/>和/>之间的相似性度量,通过相似性度量方法(例如欧式距离、余弦相似度等)得到;/>表示图像/>和图像之间的相似性度量,是基于图像的纹理特征向量计算得到的。
通过对图像的纹理特征向量进行相似性度量来判断图像和图像/>之间的相似性。如果相似性度量越大,则图像越相似。
S1-3.构建相似性矩阵,计算公式如下:
式中,表示图像/>和图像/>之间的纹理相似性。
S1-4.将相似性矩阵中相似性大于相似阈值的图像判定为同一领域,形成领域划分。
相似性矩阵中的元素反映了图像之间的相似性程度,而设定一个相似性阈值能够使得在领域划分时具有灵活性。通过设定合适的相似阈值,可以调控领域的划分精度,确保判定为同一领域的图像在纹理特征上足够相似,提高划分的准确性。有助于在图像数据集中发现具有相似纹理特征的子集,为进一步的分析和应用提供基础。
根据相似性阈值进行领域标识,将属于同一领域的图像标记为相同的领域标识。
S2包括以下内容:
使用预训练的卷积神经网络提取每个领域内图像抽象语义信息,获得高维空间中的特征向量;
在使用预训练的卷积神经网络提取每个领域内图像的抽象语义信息时,考虑到预训练模型的具体结构和训练细节。预训练模型是在大规模图像数据集上进行训练的,例如ImageNet。常用的预训练模型包括VGG、ResNet、Inception等。模型的结构包括卷积层、池化层和全连接层,其中卷积层用于提取图像特征,全连接层用于分类任务。在使用预训练模型时,保持模型的卷积层不变,只训练顶部的全连接层以适应特定任务。训练过程中使用交叉熵损失函数,并采用随机梯度下降等优化算法进行参数更新。迭代次数和收敛标准根据训练数据的大小和模型的性能来确定,通过监控验证集上的性能来判断是否收敛。综合考虑模型结构、损失函数、迭代次数和收敛标准等因素,可以有效地提取每个领域内图像的抽象语义信息,并获得高维空间中的特征向量。
假设使用的是一个图像分类任务,并且预训练模型是ResNet。在微调(fine-tuning)过程中,选择交叉熵损失函数作为模型的损失函数。交叉熵损失函数可以量化模型预测与真实标签之间的差异,是图像分类任务中常用的损失函数之一。
假设数据集较大,包含10万张图片,每张图片有1000个类别,使用的预训练模型是VGG16。在微调过程中,可以选择迭代次数为10个epoch。每个epoch表示对整个数据集进行一次完整的训练迭代。通过10个epoch的迭代,模型可以充分地学习数据集的特征,并逐步优化损失函数;
收敛标准根据模型在验证集上的性能进行判断。假设设置的收敛标准是验证集上的准确率达到95%。在每个epoch结束时,可以评估模型在验证集上的准确率,如果准确率达到了95%以上,认为模型已经收敛。这时可以停止训练,否则继续训练直到达到收敛标准。
为保障预训练的卷积神经网络的提取质量,首先对卷积神经网络进行验证,过程如下:
使用预训练的卷积神经网络对官方提供用于标准测试的每个样本进行预测,并获取模型对于正例的概率值;
根据不同的概率阈值,计算真正例率(TPR)和假正例率(FPR)。真正例率表示被正确预测为正例的样本占所有真正例的比例,假正例率表示被错误预测为正例的样本占所有真负例的比例。
使用不同的概率阈值计算得到一系列的(FPR,TPR)点,连接这些点绘制ROC曲线;
通过对ROC曲线下的面积进行积分来计算得到样本区分能力指数,计算公式如下:
其中,表示在真正例率相等的条件下,找到对应的最小假正例率,AUC表示样本区分能力指数,取值范围在0到1之间,越接近1表示模型性能越好。
最小假正例率是在给定真正例率(TPR)等于某一特定值(t)的条件下计算得到的。假设我们有真正例率t需要找到对应的最小假正例率。这可以通过查找FPR曲线上与给定真正例率最接近的点来实现。
具体而言,假设我们有一组真正例率(TPR)和对应的假正例率(FPR),可以通过以下步骤找到对应的最小假正例率:
找到真正例率等于t的点对应的假正例率值。
如果找到了精确匹配的真正例率等于t的点,则该点的假正例率即为所求的最小假正例率。
如果未找到精确匹配的点,则可以采用插值方法,根据最接近的两个真正例率点,进行线性插值计算,以估计真正例率等于t时的假正例率。
最小假正例率的计算公式可以表示为:
其中,和/>分别是最接近给定真正例率t的两个假正例率点,/>和/>是对应的真正例率点,t是给定的真正例率值,/>是插值函数,用于计算给定真正例率t时的假正例率。
的构架思想如下:
ROC曲线的横轴是FPR,纵轴是TPR。在ROC空间中,假正例率FPR作为自变量,真正例率TPR作为因变量。ROC曲线描述了在不同阈值下,分类器对正例和负例的分类性能。AUC表示ROC曲线下的面积,即模型将正例排在负例前面的概率。该公式的思想是在FPR的取值范围[0,1]上,通过对TPR关于FPR的函数关系进行积分来计算ROC曲线下的面积。
TPR和FPR的计算公式:
真正例率(TPR):
假正例率(FPR):
其中,TP是实际为正例且模型也预测为正例的样本数,FN是实际为正例但模型预测为负例的样本数,TN是实际为负例且模型也预测为负例的样本数,FP是实际为负例但模型预测为正例的样本数。
这两个公式分别表示了被正确预测为正例的样本占所有真正例的比例,以及被错误预测为正例的样本占所有真负例的比例。
在积分过程中,首先,表示在真正例率相等的条件下,找到对应的最小假正例率。也就是说,给定一个真正例率t,/>表示在该真正例率下对应的最小假正例率。
然后,表示对于找到的最小假正例率,计算其对应的真正例率。换句话说,对于每个真正例率相等的条件下找到的最小假正例率,计算其对应的真正例率。
最后,对所有找到的真正例率计算其积分,即从0到1对进行积分,表示了在整个真正例率范围内对真正例率关于最小假正例率的反函数的积分。
积分过程对真正例率在假正例率范围内的取值进行了积分,以计算ROC曲线下的面积。
通过对TPR和FPR的计算,并在ROC空间中对它们进行积分,可以得到ROC曲线下的面积,即AUC值。AUC值越接近1,表示模型的性能越好。
将样本区分能力指数和区分能力阈值区间进行比较;
若样本区分能力指数大于区分能力阈值区间的最大值,表示模型在样本区分能力上表现非常好,意味着模型能够高度区分不同类别的样本,具有良好的分类性能,生成优异信号;
若样本区分能力指数属于区分能力阈值区间,表示模型在样本区分能力上表现在预期的范围内,意味着模型能够区分不同类别的样本,但是有一定的波动和局限性,在使用该模型时需要引入模型的样本区分能力指数带来的影响,生成影响信号;
若样本区分能力指数小于区分能力阈值区间的最小值,表示模型在样本区分能力上表现较差,暗示模型的分类性能较弱,需要进一步优化或者考虑其他模型,生成不参与使用信号,发出预警提示,需要重新对模型进行训练,直到样本区分能力指数不小于区分能力阈值区间的最小值。
在确定卷积神经网络未生成不参与使用信号后,则使用卷积神经网络从每个领域中提取图像特征,包括以下内容:
对于领域内的每张图片,得到的特征表示形成一个特征向量。对领域内所有图片的特征向量进行汇总,得到一个特征矩阵,其中每行代表一张图片的特征向量。
在领域内的每张图片中,特征表示通常是通过卷积神经网络提取的高层次特征。这些特征向量包含了图像在卷积神经网络中各个层次提取的抽象特征,例如边缘、纹理、形状等。具体来说,卷积神经网络的每一层都可以看作是对图像不同程度的抽象表示,低层次的特征更接近于图像的局部信息,而高层次的特征则更加抽象和语义化。因此,得到的特征向量实际上是对图像在这些抽象特征空间中的表达,能够反映出图像的各种视觉特征。
对于每个特征向量的维度,计算相应维度上所有图片的均值,得到领域的平均特征向量。这可以看作是对领域内所有图片的整体特征表示。
将领域的平均特征向量建模成一个特征分布。通过使用概率密度估计方法来完成。
在使用概率密度估计方法对领域的平均特征向量建模时,包括核密度估计。核密度估计通过在特征空间中放置核函数,以估计特征分布的概率密度。常用的核函数包括高斯核函数。
本发明首先,通过使用预训练的卷积神经网络对官方提供用于标准测试的每个样本进行验证,计算真正例率(TPR)和假正例率(FPR),绘制ROC曲线,并计算样本区分能力指数。该指数反映了模型在样本区分能力上的性能,其值越接近1表示模型性能越好。接着,将样本区分能力指数与设定的区分能力阈值区间进行比较,生成相应信号。若样本区分能力指数大于最大阈值,表示模型表现极佳,生成优异信号;若在阈值区间内,表示在预期范围内有一定波动和局限性,生成影响信号;若小于最小阈值,表示模型表现较差,生成不参与使用信号并发出预警提示,需要重新训练模型。在确保卷积神经网络具有良好验证结果后,从每个领域中提取图像特征,包括计算领域内所有图片的平均特征向量,并建模成特征分布,通过概率密度估计方法完成。有助于确保模型的性能,提高特征提取的质量,确保所得特征对后续任务具有良好的表达能力,以支持后续的图像处理任务。
S3包括以下内容:
对于每一对领域,计算其特征分布的对比度。定义对比度公式如下:
其中,和/>分别是两个领域的特征分布;
表示/>到/>的KL散度,用来度量当/>作为参考分布时,使用/>来表示的信息增益。衡量了从/>到/>的信息差异;
则表示从/>到/>的KL散度,同样是度量信息的差异,但是方向相反。
将这两个KL散度相加得到对比度,可以综合考虑两个分布之间的双向信息差异。对比度的值越大,表示两个分布之间的差异越显著。
将所有领域对的对比度进行平均或加权平均,得到整体领域内分布对比度。定义整体对比度公式如下:
其中,N是领域对的总数,和/>分别表示第K对领域的特征分布。
整体领域内分布对比度用于表示不同领域之间特征分布的差异性。衡量了在整个数据集内,不同领域的特征分布有多么相似或不同。
整体领域内分布对比度越大表示不同领域之间的特征分布差异较大。这可能意味着在数据集中的某些方面,不同领域之间存在较大的差异,特征在这些领域中呈现出较大的变化;
整体领域内分布对比度越小表示不同领域之间的特征分布相对相似。这可能表明在整个数据集内,各个领域之间的特征在某些方面比较一致,差异性相对较小。
引入样本区分能力指数对最终获得的整体领域内分布对比度的影响是为了综合考虑模型在样本区分上的性能。样本区分能力指数通过对预训练卷积神经网络在标准测试样本上的预测性能进行评估,量化了模型对不同样本的区分度。这个指数的引入在整体领域内分布对比度的计算中,可以影响信号的生成和预警提示的发出。如果样本区分能力指数大于预设的阈值范围,表示模型在样本区分上表现良好,有望获得整体领域内分布对比度的更准确信息,生成优异信号。如果在阈值范围内,表示模型在样本区分上表现一致,将生成影响信号。而若样本区分能力指数小于阈值范围的最小值,将发出预警提示,提示模型在样本区分能力上表现较差,可能需要进一步优化或考虑其他模型。通过引入样本区分能力指数,整合了模型性能评估和领域内分布对比度计算,使得最终生成的信号更具综合性和实际意义。
S3包括以下内容:
在获得影响信号的情况下,则引入样本区分能力指数对整体领域内分布对比度进行校对,计算过程如下:
其中,表示综合整体领域内分布对比度,/>表示修正因子,/>表示区分能力阈值区间,H1和H2分别表示区分能力阈值区间的最小值和最大值。
引入样本区分能力指数是为了剥离其对最终获取的整体领域内分布对比度的影响。目的在于考虑模型在样本层面的性能表现,从而调整对整体领域内分布对比度的评估。样本区分能力指数通过对卷积神经网络在标准测试样本上的预测性能进行度量,量化了模型对不同样本的区分度。将这一指数引入整体领域内分布对比度的计算中,使得最终的评估更全面,考虑了模型在样本层面的表现。
益处在于提高对整体领域内分布对比度评估的准确性。模型在不同样本上的表现可能会影响其对整体领域内分布的捕捉能力。通过引入样本区分能力指数,可以在计算整体领域内分布对比度时,更准确地反映模型在样本区分上的能力。这有助于综合考虑模型的全局性能和局部性能,提高对领域内分布差异的敏感性,使得最终的分析更具实际意义和泛化性。
将综合整体领域内分布对比度和警示阈值进行比较,若综合整体领域内分布对比度大于或等于警示阈值,表示不同领域之间的特征分布差异较大。若该图片数据集参与到图片预处理系统中的模型训练,容易导致模型在各个领域中的性能存在显著差异,导致在某些领域中表现良好,而在其他领域中表现较差。致使模型在训练时过度依赖于某个领域的特定特征,而在其他领域中泛化能力较差,生成不合格信号,并发出预警提示,说明数据集不适用作为模型的训练的样本。
反之,若综合整体领域内分布对比度小于警示阈值,表示不同领域之间的特征分布相对一致。在这种情况下,图片数据集在各个领域中的特征分布差异相对较小,有助于模型在训练时更均衡地学习各个领域的特征。这可能导致模型在各个领域中具有更为一致的性能,提高了模型的泛化能力。相比于存在领域内分布差异较大的情况,整体领域内分布对比度较小的数据集更有可能在不同领域上实现更为一致的性能,减少了模型对某个领域特定特征的依赖,有助于提高模型的鲁棒性。在这种情况下,生成合格信号,因为领域内分布的一致性可以被视为正常情况,适用于模型的训练。
本发明,首先,通过使用纹理特征提取方法对图像数据集进行领域划分,随后使用AUC值验证预训练卷积神经网络的性能,以确保模型的稳定性。接着,通过计算特征分布的对比度,综合考虑不同领域间的差异,得到整体领域内分布对比度。为提高评估的全面性,引入样本区分能力指数,剥离其对整体领域内分布对比度的影响,从而更准确地反映模型在样本层面的性能。最后,将整体领域内分布对比度与警示阈值进行比较,生成相应信号,指导模型训练的进行与否。进而充分综合了模型性能、领域内分布对比度和样本区分能力,提高了对数据集特性的综合把握。通过引入样本区分能力指数,更全面地考量了模型的全局性能和局部性能,使得最终的信号生成更具实际意义和泛化性。这种方法不仅可以提高模型在各个领域的性能一致性,同时也有助于识别数据集中可能存在的领域差异,为模型的训练提供更准确的指导。
实施例2
图2给出了本发明基于图像识别的图像预处理系统,包括领域划分模块、样本区分能力评估模块、特征分布对比度计算模块和整体领域内分布对比度综合模块;
领域划分模块对图像数据集纹理特征提取,将相似的图像分组为不同的领域,形成领域划分,将划分好的结果发送至样本区分能力评估模块;
样本区分能力评估模块使用合格的卷积神经网络对图像进行抽象语义信息提取,并计算样本区分能力指数,将提取的结果和样本区分能力指数一并发送至特征分布对比度计算模块;
特征分布对比度计算模块使用分布距离度量方法,计算每一对领域之间特征分布的对比度,然后对所有领域对的对比度进行平均,将计算结果发送至整体领域内分布对比度综合模块;
整体领域内分布对比度综合模块引入样本区分能力指数的影响,综合计算整体领域内分布对比度,并与设定的阈值进行比较,生成相应的信号。
上述公式均是去量纲取其数值计算,公式是由采集大量数据进行软件模拟得到最近真实情况的一个公式,公式中的预设参数以及阈值选取由本领域的技术人员根据实际情况进行设置。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络,或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD),或者半导体介质。半导体介质可以是固态硬盘。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件,或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统和装置,可以通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其他的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术作出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-onlymemory,ROM)、随机存取存储器(randomaccessmemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.基于图像识别的图像预处理方法,其特征在于:
S1.使用纹理特征提取方法,对图像数据集进行划分;
S2.使用样本区分能力指数评估合格的卷积神经网络进行图像的抽象语义信息提取,获得高维空间中的特征向量;
S3.使用分布距离度量方法,计算每一对领域之间特征分布的对比度,对所有领域对的对比度进行平均;
S4.引入样本区分能力指数的影响,获得综合整体领域内分布对比度,并和对应阈值的比较结果给出对应的信号;
S1具体包括以下内容:
S1-1.对于数据集中的每张图像,使用纹理特征提取方法,得到每张图像的纹理特征向量,处理过程如下:
将每个像素的彩色通道进行加权平均,使得彩色图像转换为灰度图像;
将灰度图像划分为若干个图像块;
对于每个图像块中的中心像素,与其周围的像素进行比较,按照以下规则生成二进制编码:
将周围像素的灰度值与中心像素的灰度值进行比较,大于或等于中心像素的记为1,小于中心像素的记为0;
按照顺时针或逆时针方向对比,生成一个二进制编码;
对于每个图像块,将中心像素的LBP二进制编码作为该图像块的一个像素,形成LBP图像,如此,每个图像块都被一个LBP编码替代;
对整个LBP图像进行直方图统计,统计每个LBP编码出现的次数,得到一个直方图;
将直方图中的各个LBP编码的出现次数作为特征向量的元素,得到最终的LBP特征向量;
S1-2.假设 和/>分别是图像/>和图像/>的纹理特征向量,则相似性度量为:
式中,表示纹理特征向量/>和/>之间的相似性度量,通过相似性度量方法得到;/>表示图像/>和图像/>之间的相似性度量,是基于图像的纹理特征向量计算得到的;
S1-3.构建相似性矩阵,计算公式如下:
式中,表示图像/>和图像/>之间的纹理相似性;
S1-4.将相似性矩阵中相似性大于相似阈值的图像判定为同一领域,形成领域划分;
S2包括以下内容:
对卷积神经网络进行验证,过程如下:
使用预训练的卷积神经网络对官方提供用于标准测试的每个样本进行预测,并获取模型对于正例的概率值;
根据不同的概率阈值,计算真正例率和假正例率,使用不同的概率阈值计算得到一系列的点,连接这些点绘制ROC曲线;
通过对ROC曲线下的面积进行积分来计算得到样本区分能力指数,计算公式如下:
其中,表示在真正例率相等的条件下,找到对应的最小假正例率,AUC表示样本区分能力指数;
将样本区分能力指数和区分能力阈值区间进行比较;
若样本区分能力指数大于区分能力阈值区间的最大值,生成优异信号;
若样本区分能力指数属于区分能力阈值区间,生成影响信号;
若样本区分能力指数小于区分能力阈值区间的最小值,生成不参与使用信号;
在确定卷积神经网络未生成不参与使用信号后,则使用卷积神经网络从每个领域中提取图像特征,包括以下内容:
对于领域内的每张图片,得到的特征表示形成一个特征向量;对领域内所有图片的特征向量进行汇总,得到一个特征矩阵,其中每行代表一张图片的特征向量;
对于每个特征向量的维度,计算相应维度上所有图片的均值,得到领域的平均特征向量;
将领域的平均特征向量建模成一个特征分布;
S3包括以下内容:
对于每一对领域,计算其特征分布的对比度;定义对比度公式如下:
其中,和/>分别是两个领域的特征分布;
表示/>到/>的KL散度,用来度量当/>作为参考分布时,使用/>来表示的信息增益;
则表示从/>到/>的KL散度,同样是度量信息的差异,但是方向相反;
将所有领域对的对比度进行平均或加权平均,得到整体领域内分布对比度,定义整体对比度公式如下:
其中,N是领域对的总数,和/>分别表示第K对领域的特征分布;
S3包括以下内容:
在获得影响信号的情况下,则引入样本区分能力指数对整体领域内分布对比度进行校对,计算过程如下:
其中,表示综合整体领域内分布对比度,/>表示修正因子,/>表示区分能力阈值区间,H1和H2分别表示区分能力阈值区间的最小值和最大值。
2.根据权利要求1所述的基于图像识别的图像预处理方法,其特征在于:
将综合整体领域内分布对比度和警示阈值进行比较,若综合整体领域内分布对比度大于或等于警示阈值,生成不合格信号;反之,若综合整体领域内分布对比度小于警示阈值,生成合格信号。
3.基于图像识别的图像预处理系统,用于实现权利要求1-2任一项所述的图像预处理方法,包括领域划分模块、样本区分能力评估模块、特征分布对比度计算模块和整体领域内分布对比度综合模块;
领域划分模块对图像数据集纹理特征提取,将相似的图像分组为不同的领域,形成领域划分,将划分好的结果发送至样本区分能力评估模块;
样本区分能力评估模块使用合格的卷积神经网络对图像进行抽象语义信息提取,并计算样本区分能力指数,将提取的结果和样本区分能力指数一并发送至特征分布对比度计算模块;
特征分布对比度计算模块使用分布距离度量方法,计算每一对领域之间特征分布的对比度,然后对所有领域对的对比度进行平均,将计算结果发送至整体领域内分布对比度综合模块;
整体领域内分布对比度综合模块引入样本区分能力指数的影响,综合计算整体领域内分布对比度,并与设定的阈值进行比较,生成相应的信号。
CN202410233059.9A 2024-03-01 2024-03-01 基于图像识别的图像预处理系统及其方法 Active CN117809140B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410233059.9A CN117809140B (zh) 2024-03-01 2024-03-01 基于图像识别的图像预处理系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410233059.9A CN117809140B (zh) 2024-03-01 2024-03-01 基于图像识别的图像预处理系统及其方法

Publications (2)

Publication Number Publication Date
CN117809140A true CN117809140A (zh) 2024-04-02
CN117809140B CN117809140B (zh) 2024-05-28

Family

ID=90422032

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410233059.9A Active CN117809140B (zh) 2024-03-01 2024-03-01 基于图像识别的图像预处理系统及其方法

Country Status (1)

Country Link
CN (1) CN117809140B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810467A (zh) * 2013-11-01 2014-05-21 中南民族大学 基于自相似数编码的异常区域检测方法
CN109800754A (zh) * 2018-12-06 2019-05-24 杭州电子科技大学 一种基于卷积神经网络的古字体分类方法
US20200020092A1 (en) * 2018-07-13 2020-01-16 Asml Netherlands B.V. Pattern grouping method based on machine learning
CN110717450A (zh) * 2019-10-09 2020-01-21 深圳大学 自动识别原始文档的翻拍图像的训练方法和检测方法
CN111310666A (zh) * 2020-02-18 2020-06-19 浙江工业大学 一种基于纹理特征的高分辨率影像地物识别与分割方法
WO2021068142A1 (zh) * 2019-10-09 2021-04-15 深圳大学 自动识别原始文档的翻拍图像的训练方法和检测方法
CN114612476A (zh) * 2022-05-13 2022-06-10 南京信息工程大学 一种基于全分辨率混合注意力机制的图像篡改检测方法
CN117315380A (zh) * 2023-11-30 2023-12-29 深圳市健怡康医疗器械科技有限公司 一种基于深度学习的肺炎ct图像分类方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810467A (zh) * 2013-11-01 2014-05-21 中南民族大学 基于自相似数编码的异常区域检测方法
US20200020092A1 (en) * 2018-07-13 2020-01-16 Asml Netherlands B.V. Pattern grouping method based on machine learning
CN109800754A (zh) * 2018-12-06 2019-05-24 杭州电子科技大学 一种基于卷积神经网络的古字体分类方法
CN110717450A (zh) * 2019-10-09 2020-01-21 深圳大学 自动识别原始文档的翻拍图像的训练方法和检测方法
WO2021068142A1 (zh) * 2019-10-09 2021-04-15 深圳大学 自动识别原始文档的翻拍图像的训练方法和检测方法
CN111310666A (zh) * 2020-02-18 2020-06-19 浙江工业大学 一种基于纹理特征的高分辨率影像地物识别与分割方法
CN114612476A (zh) * 2022-05-13 2022-06-10 南京信息工程大学 一种基于全分辨率混合注意力机制的图像篡改检测方法
CN117315380A (zh) * 2023-11-30 2023-12-29 深圳市健怡康医疗器械科技有限公司 一种基于深度学习的肺炎ct图像分类方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
NESLIHAN BAYRAMOGLU: "Machine learning based texture analysis of patella from X-rays for detecting patellofemoral osteoarthritis", 《ARXIV》, 4 June 2021 (2021-06-04) *
刘坤竺: "样本不平衡下接触网定位线夹缺陷检测", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》, no. 2, 15 February 2024 (2024-02-15) *
寇旗旗 等: "融合CLBP和局部几何特征的纹理目标分类", 《光电工程》, vol. 46, no. 11, 15 November 2019 (2019-11-15) *
李晓艳 等: "一种基于KL散度和类分离策略的特征选择算法", 《计算机科学》, vol. 39, no. 12, 15 December 2012 (2012-12-15) *

Also Published As

Publication number Publication date
CN117809140B (zh) 2024-05-28

Similar Documents

Publication Publication Date Title
CN111783532B (zh) 一种基于在线学习的跨年龄人脸识别方法
CN111709313B (zh) 基于局部和通道组合特征的行人重识别方法
CN114332578A (zh) 图像异常检测模型训练方法、图像异常检测方法和装置
CN111311595B (zh) 图像质量的无参考质量评价方法及计算机可读存储介质
CN116453438B (zh) 一种显示屏参数检测方法、装置、设备及存储介质
CN112802108B (zh) 目标对象定位方法、装置、电子设备及可读存储介质
CN111738319B (zh) 一种基于大规模样本的聚类结果评价方法及装置
CN115439708A (zh) 一种图像数据处理方法和装置
CN117115567B (zh) 基于特征调整的域泛化图像分类方法、系统、终端及介质
CN113762151A (zh) 一种故障数据处理方法、系统及故障预测方法
CN117809140B (zh) 基于图像识别的图像预处理系统及其方法
CN111401440A (zh) 目标分类识别方法、装置、计算机设备及存储介质
CN116956171A (zh) 基于ai模型的分类方法、装置、设备及存储介质
CN114445716B (zh) 关键点检测方法、装置、计算机设备、介质及程序产品
CN115690514A (zh) 图像识别方法及相关设备
Promsuk et al. Numerical Reader System for Digital Measurement Instruments Embedded Industrial Internet of Things.
CN111931670B (zh) 基于卷积神经网的深度图像头部检测与定位方法及系统
CN111209567B (zh) 提高检测模型鲁棒性的可知性判断方法及装置
CN115482500A (zh) 基于置信概率的人群统计方法及装置
CN113688708A (zh) 一种基于概率特征的人脸识别方法、系统及存储介质
CN112183336A (zh) 表情识别模型训练方法、装置、终端设备及存储介质
CN110555338A (zh) 对象识别方法和装置、神经网络生成方法和装置
CN114943344B (zh) 联合svm和hmm的导航场景感知通用模型构建方法
CN110728615B (zh) 基于序贯假设检验的隐写分析方法、终端设备及存储介质
CN113408556B (zh) 身份识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant