CN115035389A - 基于可靠性评估和迭代学习的细粒度图像识别方法和装置 - Google Patents
基于可靠性评估和迭代学习的细粒度图像识别方法和装置 Download PDFInfo
- Publication number
- CN115035389A CN115035389A CN202210953125.0A CN202210953125A CN115035389A CN 115035389 A CN115035389 A CN 115035389A CN 202210953125 A CN202210953125 A CN 202210953125A CN 115035389 A CN115035389 A CN 115035389A
- Authority
- CN
- China
- Prior art keywords
- tensor
- iteration
- image
- image data
- stage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000011156 evaluation Methods 0.000 title claims description 13
- 238000012549 training Methods 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 13
- 230000004913 activation Effects 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims abstract description 7
- 230000004927 fusion Effects 0.000 claims abstract description 4
- 238000004364 calculation method Methods 0.000 claims description 19
- 230000014509 gene expression Effects 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 9
- 238000013459 approach Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 238000013461 design Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 7
- 238000005192 partition Methods 0.000 description 6
- 230000001902 propagating effect Effects 0.000 description 4
- 241000607479 Yersinia pestis Species 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
Description
技术领域
本发明涉及一种基于可靠性评估和迭代学习的细粒度图像识别方法和装置,属细粒度图像识别技术领域。
背景技术
细粒度图像识别也称细粒度图像分类,旨在识别同属于一种大类中不同的子类。如不同种类的鸟、不同品牌的汽车、不同科目的害虫等,其在现实生活中有着大量的应用场景,如在生态系统保护中对于生物进行监测;在智能交通中对于车辆品牌和型号进行细致统计,这可以为城市状况提供有力的数据支撑;在智慧农业中对于害虫进行识别,以便针对性用药防止其他害虫出现耐药性。由于其蕴含极大的应用价值,使得该任务成为计算机视觉和模式识别领域一个热门的研究方向。而精确又可靠的识别结果能够在实际工业和生活应用中带来极大的便利性。
细粒度图像识别的量化不确定性也是十分必要的,例如,军用无人机在自动定位敌军目标时,如果只是依靠无人机本身的识别结果去打击目标,则容易误射,误射主要是因为误判,误判就是因为识别结果是不确定的,但传统模型无法把它对于当前识别结果的不确定性告诉人,如果能告诉,则可以在不确定性大的时候请求人为介入,避免误判。
近年来,随着Transformer模型在自然语言处理领域的大规模应用,自注意力机制的特点也在逐渐被引入计算机视觉领域,已经有一些专门为视觉任务设计的Transformer模型并取得了极大的成功,如ViT、Swin Transformer等,但是现有模型和方法都只是给出最终的概率分布,却无法对当前识别结果的可靠程度进行评估,也就是说,模型只能告诉我们当前是什么,不能告诉我们有多大把握认为它识别正确。而在现实场景中,模型的识别准确性固然重要,但评估识别结果的可靠性也是非常必要的,当模型对于当前的识别结果给出可靠性评估后,再考虑需不需要人为介入,这更加符合工业应用期望。
发明内容
本发明的目的是,为了解决现有细粒度模型无法对识别结果进行可靠性评估,以及识别精准度不高的问题,提出一种基于可靠性评估和迭代学习的细粒度图像识别方法和装置。
实现本发明的技术方案如下,基于可靠性评估和迭代学习的细粒度图像识别方法,所述方法收集细粒度图像并给定标签,构建细粒度图像数据集,并基于SwinTransformer模型,改进设计得到PST模型;将图像数据张量输入到PST模型中进行前向传播,进行迭代学习训练,并反向传播更新PST模型参数;将加载模型推理所用到的图像,对其进行大小改变、中心裁剪、像素归一化操作,转换成图像数据张量;将图像数据张量和标签张量输入到PST模型中进行前向传播,从第二Stage模块、第三Stage模块、第四Stage模块后经对应MLP层分别得到第一轮迭代、第二轮迭代、第三轮迭代的输出;经过SoftPLUS层处理得到证据;再将三轮迭代的输出经处理得到的三种证据进行相加融合得到融合证据:
所述PST模型包括Patch Embedding模块和自注意力计算模块;自注意力计算模块由四个阶段模块组成,其中相同的Stage模块中包含相同配置的若干个block,每个block由两个连续的自注意力计算单元组成;四个阶段中的后三个阶段第二Stage模块、第三Stage模块、第四Stage模块分别接上MLP层,得到PST模型。
所述Swin Transformer模型由Images图像模块Images、补丁模块PatchPartition、Patch Embedding模块和四个阶段模块第一Stage模块、第二Stage模块、第三Stage模块、第四Stage模块组成;Images图像模块连接补丁模块Patch Partition,补丁模块Patch Partition连接Patch Embedding模块,再依次连接四个阶段模块第一Stage模块、第二Stage模块、第三Stage模块、第四Stage模块。
Images为输入进模型的图像;Patch Partition为切片划分模块,用于视觉任务的Transformer模型所必要的操作,Transformer模型输入要求的是序列,Patch Partition模块就是将图像转换为序列;Patch Embedding为切片嵌入模块,将切片映射为特定的维度,方便后续的自注意力计算;SoftPLUS是一种激活函数。
所述细粒度图像数据集D的表达式如下:
所述迭代学习训练步骤如下:
其中,表示数据集某一批次中第m张图像;表示数据集某一批次中第m张图像的标签;下标m表示某一批次中图像的索引号,B表示批次图像数量,的上标1表示为第一轮迭代;并将标签转换成张量,其中为一个1×C的向量,其中C为类别数。
然后通过损失值计算当前梯度,反向传播更新PST模型参数,至此第一轮迭代完毕;
其中,表示数据集某一批次中第m张图像;表示数据集某一批次中第m张图像的标签;下标m表示某一批次中图像的索引号,B表示批次图像数量;的上标2表示为第2轮迭代,并将标签转换成张量,为一个1×C的向量,C为类别数。
然后,通过损失值计算当前梯度,反向传播更新PST模型参数,至此第二轮迭代完毕。
其中,表示数据集某一批次中第m张图像;表示数据集某一批次中第m张图像的标签;下标m表示某一批次中图像的索引号,B表示批次图像数量;的上标3表示为第3轮迭代,并将标签转换成张量,为一个1×C的向量,C为类别数。
然后通过损失值计算当前梯度,反向传播更新PST模型参数,至此第三轮迭代完毕;
所述进行大小改变、随机裁剪、像素归一化操作,指神经网络训练中对图像处理的常规操作;所述大小改变是为了将图像设定为固定大小,以便让神经网络输出维度统一;所述随机裁剪是为了防止训练出现过拟合;所述像素归一化是为了让图像特征值在一个特定的小范围,利于网络优化。
迭代学习作为一种思想,主要应用在样本生成任务中,在图像识别等领域应用很少;常规的迭代方法一般会往模型添加网络层,而本发明的迭代方法是通过控制网络参数更新范围来实现迭代学习。
本发明的有益效果是,本发明在通过设计迭代学习策略,保证了模型的精度,同时规避了现有两大类模型(基于定位再识别的方法的模型和基于高阶特征编码方法的模型)所存在的缺点,通过迭代学习,网络可以更容易优化,辅以设计的网络可以保证模型的准确性;引入迭代学习也对模型的要求进一步降低,可以设计出更利于端到端部署的模型,有利于更快更容易应用到现实场景。
通过量化识别结果的不确定性,能够保证模型的可靠性,在应用中可以考虑到是否需要人为介入,保证了安全性,达到了评估识别可靠性的目的,适用于智慧农业、智能交通、生态系统保护等领域。
本发明可以用于生物多样性保护等领域,例如野外有很多鸟类监测设备,目的是发现和监测鸟类,如果一些鸟类是稀有保护动物,一般设备内集成的识别模型很容易把它们当成是普通鸟类,现有模型不管对错(没有量化不确定性),都会强行给出一个识别结果,无法给出当前判断的一个把握,本发明就能较好的解决这一问题。
附图说明
图1为PST模型图;
图2为PST模型训练流程图;
图3为PST模型推理流程图;
图4为PST模型装置云端部署图。
具体实施方式
本发明的具体实施方式如下。
本实施例一种基于可靠性评估和迭代学习的细粒度图像识别方法,步骤如下:
2、基于Swin Transformer模型,保留Patch Embedding模块(简称PE),然后将第二Stage模块、第三Stage模块、第四Stage模块分别接上MLP层,改进得到PST模型。
其中,表示数据集某一批次中第m张图像;表示数据集某一批次中第m张图像的标签;下标m表示某一批次中图像的索引号,B表示批次图像数量;的上标1表示为第1轮迭代,并将标签转换成张量,为一个1×C的向量,C为类别数。
然后通过损失值计算当前梯度,反向传播更新PST模型参数,至此第一轮迭代完毕。
其中,表示数据集一批次中第m张图像;表示数据集某一批次中第m张图像的标签;下标m表示某一批次中图像的索引号,B表示批次图像数量;的上标2表示为第2轮迭代,并将标签转换成张量,为一个1×C的向量,C为类别数。
然后通过损失值计算当前梯度,反向传播更新PST模型参数,至此第二轮迭代完毕。
其中,表示数据集某一批次中第m张图像;表示数据集某一批次中第m张图像的标签;下标m表示某一批次中图像的索引号,B表示批次图像数量;的上标3表示为第3轮迭代,并将标签转换成张量,为一个1×C的向量,C为类别数。
然后通过损失值计算当前梯度,反向传播更新PST模型参数,至此第三轮迭代完毕。
14、将图像数据张量和标签张量输入到PST模型中进行前向传播,从第二Stage模块、第三Stage模块、第四Stage模块后经对应MLP层,得到第一轮迭代、第二轮迭代、第三轮迭代的输出、、,其公式为:
19、输出识别结果和不确定性。
本实施例一种实现基于可靠性评估和迭代学习的细粒度图像识别方法的装置,所述装置为一种计算机设备,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现基于可靠性评估和迭代学习的细粒度图像识别方法的步骤1-19所有程序。
图1为PST模型图,改进自Swin Transformer(一种基于Transformer用于特征提取的网络),网络部分包括切片嵌入模块(作用是将图像分块和编码)、自注意力计算模块由4个Stage模块组成,其中相同Stage模块中包含相同配置的若干个block,每个block由两个连续的自注意力计算单元组成、MLP为多层感知器层,其作用是对不同Stage所得到的特征进行处理并输出结果;PST模型各部分输入输出维度以一张三通道彩色图所示:
第三,第一Stage模块中的block接受切片嵌入模块得到的向量,然后根据流程进行自注意力计算,重复这个block两次,输出的向量维度为,这个向量就作为第一Stage模块的输出,也作为第二Stage模块的输入。
第四,第二Stage模块首先接受第一Stage模块输出的向量,然后进行下采样(具体操作为从上至下,从左至右每隔一个块进行合并)得到维向量,然后根据流程进行自注意力计算,重复这个block两次,输出的向量维度为,这个向量就作为第二Stage模块的输出,也作为第三Stage模块的输入,并且将第二Stage模块的输出输入进该阶段的MLP层,得到一个的向量(此部分详细描述见技术方案中步骤4)。
第五,第三Stage模块跟第二Stage模块除了输入输出维度不一样,block重复次数由两次变为6次,其余都跟第三步一致不再重复赘述。
第六,第四Stage模块跟第二Stage模块除了输入输出维度不一样,其余都一致不再重复赘述。
图2为PST模型训练流程图,图2展示了该模型的训练流程,以一个批次的训练数据为例,首先第一步,图像会经过切片嵌入模块经过第一Stage模块、第二Stage模块、MLP层之后,使用输出结果和标签计算损失,进行反向传播。第二步,图像会经过切片嵌入模块经过第一Stage模块、第二Stage模块、第三Stage模块、MLP层之后,使用输出结果和标签计算损失,进行反向传播。第三步,图像会经过切片嵌入模块经过第一Stage模块、第二Stage模块、第三Stage模块、第四Stage模块、MLP层之后,使用输出结果和标签计算损失,进行反向传播。然后重复第一步到第三步直到数据集中所有批次图像训练完成(这种训练方法称为迭代学习训练法),然后再进行多轮训练。
图3所示为PST模型的推理流程,以一个批次的推理数据为例,首先,图像经过切片嵌入模块、第一Stage模块、第二Stage模块、第三Stage模块,第四Stage模块、三个MLP层之后得到三个输出结果,将三个输出结果使用SoftPLUS激活函数处理。
图4所示为PST模型装置云端部署图,PST模型的输入为图像,输出为识别结果和不确定性。将PST模型部署至可访问的云端并开放接口,然后用户可以通过手机或电脑等联网设备向云端传输图像数据,云端会返回识别结果以及不确定性值。
Claims (3)
1.一种基于可靠性评估和迭代学习的细粒度图像识别方法,其特征在于,所述方法收集细粒度图像并给定标签,构建细粒度图像数据集,并基于Swin Transformer网络模型,改进设计得到PST模型;将图像数据张量输入到PST模型中进行前向传播,进行迭代学习训练,并反向传播更新PST模型参数;将加载模型推理所用到的图像,对其进行大小改变、中心裁剪、像素归一化操作,转换成图像数据张量;将图像数据张量和标签张量输入到PST模型中进行前向传播,从第二Stage模块、第三Stage模块、第四Stage模块后经对应MLP层分别得到第一轮迭代、第二轮迭代、第三轮迭代的输出;经过SoftPLUS层处理得到证据;再将三轮迭代的输出经处理得到的三种证据进行相加融合得到融合证据:计算融合证据下的不确定性;通过计算融合证据下的不确定性,实现量化识别结果的不确定性;遍历向量找出概率分配最大值索引,得到识别结果。
2.根据权利要求1所述的基于可靠性评估和迭代学习的细粒度图像识别方法,其特征在于,方法步骤如下:
S2、基于Swin Transformer模型,保留Patch Embedding模块,然后将第二Stage模块、第三Stage模块和第四Stage模块分别接上MLP层,改进设计得到PST模型;
其中,表示数据集某一批次中第m张图像;表示数据集某一批次中第m张图像的标签;下标m表示某一批次中图像的索引号,B表示批次图像数量;的上标1表示为第1轮迭代,并将标签转换成张量,为一个1×C的向量,C为类别数;
然后通过损失值计算当前梯度,反向传播更新PST模型参数,至此第一轮迭代完毕;
其中,表示数据集某一批次中第m张图像;表示数据集某一批次中第m张图像的标签;下标m表示某一批次中图像的索引号,B表示批次图像数量;的上标2表示为第2轮迭代,并将标签转换成张量,为一个1×C的向量,C为类别数;
然后通过损失值计算当前梯度,反向传播更新PST模型参数,至此第二轮迭代完毕;
其中,表示数据集某一批次中第m张图像;表示数据集某一批次中第m张图像的标签;下标m表示某一批次中图像的索引号,B表示批次图像数量;的上标3表示为第3轮迭代,并将标签转换成张量,为一个1×C的向量,C为类别数;
然后通过损失值计算当前梯度,反向传播更新PST模型参数,至此第三轮迭代完毕;
S14、将图像数据张量和标签张量输入到PST模型中进行前向传播,从第二Stage模块、第三Stage模块、第四Stage模块经对应MLP层,得到第一轮迭代的输出、第二轮迭代的输出和第三轮迭代的输出,其表达式分别为:
S19、输出识别结果和不确定性。
3.一种实现如权利要求1-2任一项所述基于可靠性评估和迭代学习的细粒度图像识别方法的装置,所述装置为一种计算机设备,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时,实现如权利要 求1和2任一项所述基于可靠性评估和迭代学习的细粒度图像识别的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210953125.0A CN115035389B (zh) | 2022-08-10 | 2022-08-10 | 基于可靠性评估和迭代学习的细粒度图像识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210953125.0A CN115035389B (zh) | 2022-08-10 | 2022-08-10 | 基于可靠性评估和迭代学习的细粒度图像识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115035389A true CN115035389A (zh) | 2022-09-09 |
CN115035389B CN115035389B (zh) | 2022-10-25 |
Family
ID=83131286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210953125.0A Active CN115035389B (zh) | 2022-08-10 | 2022-08-10 | 基于可靠性评估和迭代学习的细粒度图像识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115035389B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115830402A (zh) * | 2023-02-21 | 2023-03-21 | 华东交通大学 | 一种细粒度图像识别分类模型训练方法、装置及设备 |
CN117853875A (zh) * | 2024-03-04 | 2024-04-09 | 华东交通大学 | 一种细粒度图像识别方法及系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160132750A1 (en) * | 2014-11-07 | 2016-05-12 | Adobe Systems Incorporated | Local feature representation for image recognition |
CN110929802A (zh) * | 2019-12-03 | 2020-03-27 | 北京迈格威科技有限公司 | 基于信息熵的细分类识别模型训练、图像识别方法及装置 |
CN111985572A (zh) * | 2020-08-27 | 2020-11-24 | 中国科学院自动化研究所 | 基于特征比较的通道注意力机制的细粒度图像识别方法 |
CN113128593A (zh) * | 2021-04-20 | 2021-07-16 | 南京林业大学 | 一种基于双线性卷积神经网络的植物细粒度识别方法 |
CN113159067A (zh) * | 2021-04-13 | 2021-07-23 | 北京工商大学 | 一种基于多粒度局部特征软关联聚合的细粒度图像辨识方法及装置 |
CN114119979A (zh) * | 2021-12-06 | 2022-03-01 | 西安电子科技大学 | 基于分割掩码和自注意神经网络的细粒度图像分类方法 |
CN114299343A (zh) * | 2021-12-31 | 2022-04-08 | 中山大学 | 一种多粒度信息融合细粒度图像分类方法及系统 |
CN114417048A (zh) * | 2022-01-17 | 2022-04-29 | 中国计量大学 | 基于图像语义引导的缺少定位设备的无人机定位方法 |
CN114463676A (zh) * | 2022-01-19 | 2022-05-10 | 北京工业大学 | 一种基于隐式表达的安全帽配戴检测方法 |
CN114626476A (zh) * | 2022-03-21 | 2022-06-14 | 北京信息科技大学 | 基于Transformer与部件特征融合的鸟类细粒度图像识别方法及装置 |
CN114648667A (zh) * | 2022-03-31 | 2022-06-21 | 北京工业大学 | 一种基于轻量化双线性cnn模型的鸟类图像细粒度识别方法 |
-
2022
- 2022-08-10 CN CN202210953125.0A patent/CN115035389B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160132750A1 (en) * | 2014-11-07 | 2016-05-12 | Adobe Systems Incorporated | Local feature representation for image recognition |
CN110929802A (zh) * | 2019-12-03 | 2020-03-27 | 北京迈格威科技有限公司 | 基于信息熵的细分类识别模型训练、图像识别方法及装置 |
CN111985572A (zh) * | 2020-08-27 | 2020-11-24 | 中国科学院自动化研究所 | 基于特征比较的通道注意力机制的细粒度图像识别方法 |
CN113159067A (zh) * | 2021-04-13 | 2021-07-23 | 北京工商大学 | 一种基于多粒度局部特征软关联聚合的细粒度图像辨识方法及装置 |
CN113128593A (zh) * | 2021-04-20 | 2021-07-16 | 南京林业大学 | 一种基于双线性卷积神经网络的植物细粒度识别方法 |
CN114119979A (zh) * | 2021-12-06 | 2022-03-01 | 西安电子科技大学 | 基于分割掩码和自注意神经网络的细粒度图像分类方法 |
CN114299343A (zh) * | 2021-12-31 | 2022-04-08 | 中山大学 | 一种多粒度信息融合细粒度图像分类方法及系统 |
CN114417048A (zh) * | 2022-01-17 | 2022-04-29 | 中国计量大学 | 基于图像语义引导的缺少定位设备的无人机定位方法 |
CN114463676A (zh) * | 2022-01-19 | 2022-05-10 | 北京工业大学 | 一种基于隐式表达的安全帽配戴检测方法 |
CN114626476A (zh) * | 2022-03-21 | 2022-06-14 | 北京信息科技大学 | 基于Transformer与部件特征融合的鸟类细粒度图像识别方法及装置 |
CN114648667A (zh) * | 2022-03-31 | 2022-06-21 | 北京工业大学 | 一种基于轻量化双线性cnn模型的鸟类图像细粒度识别方法 |
Non-Patent Citations (3)
Title |
---|
JIANQIU CHEN 等: "Weakly Supervised Leaming of Discriminative Features for Fine-Grained Visual Categorization", 《2020 INTERNATIONAL CONFERENCE ON BIG DATA, ARTIFICIAL INTELLIGENCE AND INTERNET OF THINGS ENGINEERING (ICBAIE)》 * |
余鹰 等: "基于改进卷积神经网络的多标记分类算法", 《智能系统学报》 * |
贺南南 等: "多层次细粒度特征三分支网络行人重识别方法", 《太原科技大学学报》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115830402A (zh) * | 2023-02-21 | 2023-03-21 | 华东交通大学 | 一种细粒度图像识别分类模型训练方法、装置及设备 |
CN115830402B (zh) * | 2023-02-21 | 2023-09-12 | 华东交通大学 | 一种细粒度图像识别分类模型训练方法、装置及设备 |
CN117853875A (zh) * | 2024-03-04 | 2024-04-09 | 华东交通大学 | 一种细粒度图像识别方法及系统 |
CN117853875B (zh) * | 2024-03-04 | 2024-05-14 | 华东交通大学 | 一种细粒度图像识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115035389B (zh) | 2022-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115035389B (zh) | 基于可靠性评估和迭代学习的细粒度图像识别方法和装置 | |
CN111291183B (zh) | 利用文本分类模型进行分类预测的方法及装置 | |
CN109117781B (zh) | 多属性识别模型的建立方法、装置及多属性识别方法 | |
CN112183577A (zh) | 一种半监督学习模型的训练方法、图像处理方法及设备 | |
CN110210515B (zh) | 一种图像数据多标签分类方法 | |
CN111507378A (zh) | 训练图像处理模型的方法和装置 | |
CN112446476A (zh) | 神经网络模型压缩的方法、装置、存储介质和芯片 | |
CN111476806B (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
CN113011575A (zh) | 神经网络模型更新方法、图像处理方法及装置 | |
US9798972B2 (en) | Feature extraction using a neurosynaptic system for object classification | |
CN113570029A (zh) | 获取神经网络模型的方法、图像处理方法及装置 | |
CN105447569A (zh) | 一种基于深度学习的乳腺癌细胞特征分析系统 | |
CN112561027A (zh) | 神经网络架构搜索方法、图像处理方法、装置和存储介质 | |
CN113569672B (zh) | 轻量级目标检测与故障识别方法、装置及系统 | |
CN111783713B (zh) | 基于关系原型网络的弱监督时序行为定位方法及装置 | |
CN111738436A (zh) | 一种模型蒸馏方法、装置、电子设备及存储介质 | |
CN110222718B (zh) | 图像处理的方法及装置 | |
CN111797970B (zh) | 训练神经网络的方法和装置 | |
CN112215332A (zh) | 神经网络结构的搜索方法、图像处理方法和装置 | |
CN114419351B (zh) | 图文预训练模型训练、图文预测模型训练方法和装置 | |
KR101942173B1 (ko) | 랜덤한 트리 cnn에 기반한 영상 분석 방법 및 포레스트 cnn에 기반한 영상 분석 방법 | |
CN113537462A (zh) | 数据处理方法、神经网络的量化方法及相关装置 | |
US20230401717A1 (en) | Transformer for efficient image segmentation | |
CN110837570A (zh) | 对图像数据进行无偏见分类的方法 | |
CN114565856A (zh) | 基于多重融合深度神经网络的目标识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |