CN113657486B - 基于电梯图片数据的多标签多属性分类模型建立方法 - Google Patents
基于电梯图片数据的多标签多属性分类模型建立方法 Download PDFInfo
- Publication number
- CN113657486B CN113657486B CN202110935216.7A CN202110935216A CN113657486B CN 113657486 B CN113657486 B CN 113657486B CN 202110935216 A CN202110935216 A CN 202110935216A CN 113657486 B CN113657486 B CN 113657486B
- Authority
- CN
- China
- Prior art keywords
- network
- sub
- training
- data set
- classification model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013145 classification model Methods 0.000 title claims abstract description 24
- 238000000034 method Methods 0.000 title claims abstract description 16
- 238000012549 training Methods 0.000 claims abstract description 35
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 238000011176 pooling Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 230000015654 memory Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 2
- 238000002372 labelling Methods 0.000 abstract description 5
- 230000001537 neural effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/2163—Partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于电梯图片数据的多标签多属性分类模型建立方法,包括以下步骤:a、采集电梯轿厢内的图片并上传至云端;b、对所述图片进行预处理,分割出对象;c、利用分割出的对象训练所述分类模型的主干网络;d、基于所述主干网络完成所述分类模型的分支网络的训练。本发明可以降低标注的工作量,并能在保证模型准确率的情况下降低参数量。
Description
技术领域
本发明涉及一种基于电梯图片数据的多标签多属性分类模型建立方法。
背景技术
深度卷积神经网络已成为大规模图像分类的主流结构,卷积神经网络在单一标签的图片分类中已经证明了可以达到很好的效果,对于多标签的分类,往往会采取迁移学习的方式,即对所有的标签用共同的模型提取特征,然后基于这些共同提取的特征,每个标签训练自身的分支结构,整体网络结构类似树状。但是树状网络结构是为静态数据集设计的,静态数据即数据集标签数量不会发生改变,如果数据集标签数量增加,不仅需要为新的标签采集数据,还需要对原来的数据集全部重新标注,以判断原来的图片是否属于新的标签。如果不断有新的标签加入,标注的工作量将是巨大的,从而耗费大量的时间成本。同时,样本的不平衡也是机器学习中的一个重要问题,模型倾向于将样本识别为数量更多的那一类,导致预测效果变差。因为这些问题的存在,使得在标签动态变化的数据上应用迁移学习成本巨大。
发明内容
本发明的目的在于提供一种基于电梯图片数据的多标签多属性分类模型建立方法。
为实现上述发明目的,本发明提供一种基于电梯图片数据的多标签多属性分类模型建立方法,包括以下步骤:
a、采集电梯轿厢内的图片并上传至云端;
b、对所述图片进行预处理,分割出对象;
c、利用分割出的对象训练所述分类模型的主干网络;
d、基于所述主干网络完成所述分类模型的分支网络的训练。
根据本发明的一个方面,在所述步骤(a)中,当电梯开始运行、开关门时采集所述图片。
根据本发明的一个方面,在所述步骤(b)中,采用YOLACT的实例分隔方法将对象从所述图片中单独分割出来。
根据本发明的一个方面,所述步骤(b)中分割出的对象为人体。
根据本发明的一个方面,在所述步骤(c)中,所述分类模型采用嫁接网络,所用标签为多个二分类,将训练数据集分为多个子数据集,每个子数据集上具有对应的标签,且具有一个独有的取值为0,1,……T的索引;
所述分类模型的主干网络采用Inception V3模型,每个子数据集都用InceptionV3作为共有的主干网络,同时每个子数据集对应不同的全连接层;
每一轮训练时,随机选取一个子数据集的图片送入Inception V3模型中提取特征,然后将提取的特征送入该数据集对应的全连接层预测分类,训练的损失函数Loss为:
其中,t表示所述子数据集的索引;T为所有属性类别;εt∈{0,1}表示输入数据是否属于该属性数据的子集;Lt表示属性t的损失;w0表示Inception V3主干网络的参数,wt表示子数据集对应全连接层的参数,Gw0,wt表示特定属性的网络预测结果,yt表示子数据集的标签;
训练完成后,只保留Inception主干网络的训练结果,将全连接层的训练结果舍弃。
根据本发明的一个方面,Inception V3网络结构包含11个模块,每个模块都包括卷积层、激活层。
根据本发明的一个方面,在所述步骤(d)中,在训练所述分支网络时,固定主干网络的前八个模块,所有的子数据集分支网络共用前八个模块以提取低层共有的特征,所述前八个模块的输出作为每个分支网络的输入。
根据本发明的一个方面,每个子数据集对应的分支网络采用神经结构搜索寻找最优网络结构来训练;
所述分支网络的神经网络结构搜索的搜索空间包括每一层神经网络的结构从3*3卷积核、5*5卷积核、平均池化层、全局池化层和激活层中做选择以及对这些不同层之间的连接关系做选择。
根据本发明的一个方面,采用长短期记忆网络作为控制网络来构建和训练神经网络的采样器和训练器,训练长短期记忆网络控制器的参数和共用参数的子模型,且每一轮交替训练;
根据在测试集的准确率,从搜索空间中寻找到最佳的网络结构,并根据最佳的网络结构构建和训练自身的分支网络,最终构建完成分支网络的结构。
根据本发明的一个方案,通过使用嫁接网络这种网络结构来检测电梯图片中的任务属性,从而可以降低标注的工作量,以解决标签数量动态变化时数据量标注成本太高的问题。
根据本发明的一个方案,采用高效的神经结构搜索(ENAS)寻找最优网络结构来训练分支结构,ENAS在保证模型准确率的情况下,能够大大降低参数量,从而减少训练成本。
附图说明
图1示意性表示本发明的一种实施方式的用于人体属性检测的嫁接网络的网络结构图;
图2示意性表示本发明的一种实施方式的采用ENAS搜索出的最优分支结构图;
图3示意性表示本发明的一种实施方式的嫁接网络推理图片的流程图;
图4示意性表示本发明的一种实施方式的嫁接网络在各个分支的ROC曲线图。
具体实施方式
为了更清楚地说明本发明实施方式或现有技术中的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
下面结合附图和具体实施方式对本发明作详细地描述,实施方式不能在此一一赘述,但本发明的实施方式并不因此限定于以下实施方式。
本发明基于电梯图片数据的多标签多属性分类模型建立方法,首先,采集电梯轿厢内的图片并上传至云端,对图片进行预处理,分割出对象,利用分割出的对象训练分类模型的主干网络,基于主干网络完成分类模型的分支网络的训练。本发明中,当电梯开始运行、开关门时(即电梯状态发生改变时)采集摄像头拍摄的图片。
本发明的分类模型主要用于识别电梯乘客(人体)属性,因此,图片中除了人体以外的其他部分是计算机视觉模型不需要用到的,而且若保留这些无用部分有可能给模型带来干扰。因此,本发明设置了预处理步骤,从而在检测人体属性的模型中采用YOLACT的实例分隔方法将人体(即上述对象)单独分割出来。由此,预处理的步骤也可以理解为特征提取,即将电梯中的人体提取出来。这样,预处理所分割出的人体即可用来训练分类模型(即人体属性检测模型)来检测电梯中乘客的相关属性,比如年龄段、性别、穿衣风格等。
参见图1,根据上述可知,本发明的分类模型主要用于人体属性检测,其采用嫁接网络,针对于电梯人体属性而言,电梯人体属性的标签是多个二分类,包括是否是小孩、是否是老年人、男女性别和是否是运动风格的穿衣。如此,将训练数据集分为多个子数据集,每个子数据集上只具有自身对应的标签。同时,本发明赋予每个子数据集一个独有的索引,索引取值为0,1,……T。分类模型的主干网络(即嫁接网络的主干部分)采用Inception V3模型,每个子数据集都用Inception V3作为共有的主干网络,同时每个子数据集对应不同的全连接层。每一轮训练时,将随机选取一个子数据集的图片送入Inception V3模型中提取特征,然后将提取的特征送入该数据集对应的全连接层预测分类。训练的损失函数Loss如下:
其中,t表示所述子数据集的索引;T为所有属性类别;εt∈{0,1}表示输入数据是否属于该属性数据的子集;Lt表示属性t的损失;w0表示Inception V3主干网络的参数,wt表示子数据集对应全连接层的参数,Gw0,wt表示特定属性的网络预测结果,yt表示子数据集的标签。
训练完成后,只保留Inception主干网络的训练结果,将全连接层的训练结果舍弃。
随后即可基于主干网络,训练每个子数据集的分支网络。Inception V3网络结构包含11个模块,每个模块都包括若干卷积层、激活层等。在训练每个子数据集的分支网络时,固定主干网络的前八个模块,即所有的子数据集分支网络共用前八个模块以提取低层共有的一些特征,例如形状、纹理等,这前八个模块的输出作为每个分支网络的输入。
每个子数据集对应的分支网络采用高效的神经结构搜索(ENAS)寻找最优网络结构来训练。本发明中,首先定义ENAS的搜索空间,具体的,分支网络的神经网络结构搜索的搜索空间包括每一层神经网络的结构从3*3卷积核、5*5卷积核、平均池化层、全局池化层和激活层等中做选择以及对这些不同层之间的连接关系做选择。
本发明采用长短期记忆网络(LSTM)作为控制网络来构建和训练神经网络的采样器和训练器。如此,需要训练两部分参数,即训练长短期记忆网络控制器的参数和共用参数的子模型,每一轮交替训练这两组参数。最终根据在测试集的准确率,从搜索空间中寻找到最佳的网络结构,如图2所示。最后,在寻找到最佳的网络结构后,根据最佳的网络结构构建和训练自身的分支网络,最终构建完成分支网络的结构。
当嫁接网络训练完成后,先将图片中的人像分割出来,然后再送入嫁接网络中判断图片类型,具体可参见图3示出的图片在嫁接网络中推断过程。如图4所示的嫁接网络在测试集上测试的结果(即各个分支的ROC曲线)可知,嫁接网络对于每个分类的预测都达到了较高的准确率。
综上所述,本发明通过使用嫁接网络这种网络结构可以解决标签数量动态变化时数据量标注成本太高的问题,同时采用了神经结构搜索,从而在保证准确性的前提下降低了参数量,以减少训练成本。
以上所述仅为本发明的一个实施方式而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (6)
1.一种基于电梯图片数据的多标签多属性分类模型建立方法,包括以下步骤:
a、采集电梯轿厢内的图片并上传至云端;
b、对所述图片进行预处理,分割出对象;
c、利用分割出的对象训练所述分类模型的主干网络;
d、基于所述主干网络完成所述分类模型的分支网络的训练;
在所述步骤(c)中,所述分类模型采用嫁接网络,所用标签为多个二分类,将训练数据集分为多个子数据集,每个子数据集上具有对应的标签,且具有一个独有的取值为0,1,……T的索引;
所述分类模型的主干网络采用Inception V3模型,每个子数据集都用Inception V3作为共有的主干网络,同时每个子数据集对应不同的全连接层;
每一轮训练时,随机选取一个子数据集的图片送入Inception V3模型中提取特征,然后将提取的特征送入该数据集对应的全连接层预测分类,训练的损失函数Loss为:
其中,t表示所述子数据集的索引;T为所有属性类别;εt∈{0,1}表示输入数据是否属于该属性数据的子集;Lt表示属性t的损失;w0表示Inception V3主干网络的参数,wt表示子数据集对应全连接层的参数,Gw0,wt表示特定属性的网络预测结果,yt表示子数据集的标签;
训练完成后,只保留Inception主干网络的训练结果,将全连接层的训练结果舍弃;
每个子数据集对应的分支网络采用神经网络结构搜索寻找最优网络结构来训练;
所述分支网络的神经网络结构搜索的搜索空间包括每一层神经网络的结构从3*3卷积核、5*5卷积核、平均池化层、全局池化层和激活层中做选择以及对这些不同层之间的连接关系做选择;
采用长短期记忆网络作为控制网络来构建和训练神经网络的采样器和训练器,训练长短期记忆网络控制器的参数和共用参数的子模型,且每一轮交替训练;
根据在测试集的准确率,从搜索空间中寻找到最佳的网络结构,并根据最佳的网络结构构建和训练自身的分支网络,最终构建完成分支网络的结构。
2.根据权利要求1所述的方法,其特征在于,在所述步骤(a)中,当电梯开始运行、开关门时采集所述图片。
3.根据权利要求1所述的方法,其特征在于,在所述步骤(b)中,采用YOLACT的实例分隔方法将对象从所述图片中单独分割出来。
4.根据权利要求1所述的方法,其特征在于,所述步骤(b)中分割出的对象为人体。
5.根据权利要求1所述的方法,其特征在于,Inception V3网络结构包含11个模块,每个模块都包括卷积层、激活层。
6.根据权利要求1所述的方法,其特征在于,在所述步骤(d)中,在训练所述分支网络时,固定主干网络的前八个模块,所有的子数据集分支网络共用前八个模块以提取低层共有的特征,所述前八个模块的输出作为每个分支网络的输入。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110935216.7A CN113657486B (zh) | 2021-08-16 | 2021-08-16 | 基于电梯图片数据的多标签多属性分类模型建立方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110935216.7A CN113657486B (zh) | 2021-08-16 | 2021-08-16 | 基于电梯图片数据的多标签多属性分类模型建立方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113657486A CN113657486A (zh) | 2021-11-16 |
CN113657486B true CN113657486B (zh) | 2023-11-07 |
Family
ID=78479152
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110935216.7A Active CN113657486B (zh) | 2021-08-16 | 2021-08-16 | 基于电梯图片数据的多标签多属性分类模型建立方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113657486B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114038044A (zh) * | 2021-11-23 | 2022-02-11 | 携程旅游信息技术(上海)有限公司 | 人脸性别年龄识别方法、装置、电子设备和存储介质 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107205624A (zh) * | 2014-10-29 | 2017-09-26 | 光谱Md公司 | 用于组织分类的反射式多光谱时间分辨光学成像方法和装备 |
CN108647741A (zh) * | 2018-05-18 | 2018-10-12 | 湖北工业大学 | 一种基于迁移学习的图像分类方法和系统 |
CN109060001A (zh) * | 2018-05-29 | 2018-12-21 | 浙江工业大学 | 一种基于特征迁移学习的多工况过程软测量建模方法 |
CN109325443A (zh) * | 2018-09-19 | 2019-02-12 | 南京航空航天大学 | 一种基于多实例多标签深度迁移学习的人脸属性识别方法 |
CN109376769A (zh) * | 2018-09-21 | 2019-02-22 | 广东技术师范学院 | 基于生成式对抗神经网络用于多任务分类的信息迁移方法 |
CN109902809A (zh) * | 2019-03-01 | 2019-06-18 | 成都康乔电子有限责任公司 | 一种利用生成对抗网络辅助语义分割模型 |
WO2020001082A1 (zh) * | 2018-06-30 | 2020-01-02 | 东南大学 | 一种基于迁移学习的人脸属性分析方法 |
CN111506755A (zh) * | 2020-04-22 | 2020-08-07 | 广东博智林机器人有限公司 | 图片集的分类方法和装置 |
WO2020200030A1 (zh) * | 2019-04-02 | 2020-10-08 | 京东方科技集团股份有限公司 | 神经网络的训练方法、图像处理方法、图像处理装置和存储介质 |
WO2020244653A1 (zh) * | 2019-06-06 | 2020-12-10 | 华为技术有限公司 | 物体识别方法及装置 |
WO2021016131A1 (en) * | 2019-07-19 | 2021-01-28 | The Jackson Laboratory | Convolutional neural networks for classification of cancer histological images |
CN112446340A (zh) * | 2020-12-07 | 2021-03-05 | 深圳市信义科技有限公司 | 结合行人局部特征和服饰属性分类的行人搜索方法、系统及存储介质 |
CN112488160A (zh) * | 2020-11-16 | 2021-03-12 | 浙江新再灵科技股份有限公司 | 图像分类任务的模型训练方法 |
AU2021101300A4 (en) * | 2021-03-12 | 2021-05-06 | Pabitha, C. MS | A hybrid system for skin burn image classification and severity grading and its method thereof |
AU2021101613A4 (en) * | 2021-03-29 | 2021-05-20 | Nanjing University Of Information Science And Technology | Multi-modal feature fusion–based fingerprint liveness detection method |
WO2021155713A1 (zh) * | 2020-09-08 | 2021-08-12 | 平安科技(深圳)有限公司 | 基于权重嫁接的模型融合的人脸识别方法及相关设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8781218B2 (en) * | 2011-11-02 | 2014-07-15 | Nec Laboratories America, Inc. | Receptive field learning for pooled image features |
CN108428229B (zh) * | 2018-03-14 | 2020-06-16 | 大连理工大学 | 一种基于深度神经网络提取表观和几何特征的肺部纹理识别方法 |
CN111291604A (zh) * | 2018-12-07 | 2020-06-16 | 深圳光启空间技术有限公司 | 面部属性识别方法、装置、存储介质及处理器 |
CN113657933A (zh) * | 2021-08-16 | 2021-11-16 | 浙江新再灵科技股份有限公司 | 电梯广告推荐数据准备方法 |
-
2021
- 2021-08-16 CN CN202110935216.7A patent/CN113657486B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107205624A (zh) * | 2014-10-29 | 2017-09-26 | 光谱Md公司 | 用于组织分类的反射式多光谱时间分辨光学成像方法和装备 |
CN108647741A (zh) * | 2018-05-18 | 2018-10-12 | 湖北工业大学 | 一种基于迁移学习的图像分类方法和系统 |
CN109060001A (zh) * | 2018-05-29 | 2018-12-21 | 浙江工业大学 | 一种基于特征迁移学习的多工况过程软测量建模方法 |
WO2020001082A1 (zh) * | 2018-06-30 | 2020-01-02 | 东南大学 | 一种基于迁移学习的人脸属性分析方法 |
CN109325443A (zh) * | 2018-09-19 | 2019-02-12 | 南京航空航天大学 | 一种基于多实例多标签深度迁移学习的人脸属性识别方法 |
CN109376769A (zh) * | 2018-09-21 | 2019-02-22 | 广东技术师范学院 | 基于生成式对抗神经网络用于多任务分类的信息迁移方法 |
CN109902809A (zh) * | 2019-03-01 | 2019-06-18 | 成都康乔电子有限责任公司 | 一种利用生成对抗网络辅助语义分割模型 |
WO2020200030A1 (zh) * | 2019-04-02 | 2020-10-08 | 京东方科技集团股份有限公司 | 神经网络的训练方法、图像处理方法、图像处理装置和存储介质 |
WO2020244653A1 (zh) * | 2019-06-06 | 2020-12-10 | 华为技术有限公司 | 物体识别方法及装置 |
WO2021016131A1 (en) * | 2019-07-19 | 2021-01-28 | The Jackson Laboratory | Convolutional neural networks for classification of cancer histological images |
CN111506755A (zh) * | 2020-04-22 | 2020-08-07 | 广东博智林机器人有限公司 | 图片集的分类方法和装置 |
WO2021155713A1 (zh) * | 2020-09-08 | 2021-08-12 | 平安科技(深圳)有限公司 | 基于权重嫁接的模型融合的人脸识别方法及相关设备 |
CN112488160A (zh) * | 2020-11-16 | 2021-03-12 | 浙江新再灵科技股份有限公司 | 图像分类任务的模型训练方法 |
CN112446340A (zh) * | 2020-12-07 | 2021-03-05 | 深圳市信义科技有限公司 | 结合行人局部特征和服饰属性分类的行人搜索方法、系统及存储介质 |
AU2021101300A4 (en) * | 2021-03-12 | 2021-05-06 | Pabitha, C. MS | A hybrid system for skin burn image classification and severity grading and its method thereof |
AU2021101613A4 (en) * | 2021-03-29 | 2021-05-20 | Nanjing University Of Information Science And Technology | Multi-modal feature fusion–based fingerprint liveness detection method |
Non-Patent Citations (6)
Title |
---|
Attribute annotation on large-scale image database by active knowledge transfer;Jiang, HJ 等;《IMAGE AND VISION COMPUTING》;第78卷;1-13 * |
Geometry-Aware GAN for Face Attribute Transfer;Danlan Huang 等;《2019 IEEE International Conference on Image Processing (ICIP)》;729-733 * |
Unsupervised Visual Attribute Transfer with Reconfigurable Generative Adversarial Networks;Taeksoo Kim 等;《arXiv》;1-11 * |
基于同质区和迁移学习的高光谱图像半监督分类;赵婵娟 等;《地理信息世界》;第26卷(第5期);45-52 * |
基于多视觉目标融合的图像情感分类方法研究;李楠;《中国优秀硕士学位论文全文数据库信息科技辑》(第1期);I138-2631 * |
基于迁移学习的人脸识别方法研究;姜慧;《中国优秀硕士学位论文全文数据库信息科技辑》(第10期);I138-666 * |
Also Published As
Publication number | Publication date |
---|---|
CN113657486A (zh) | 2021-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110414368B (zh) | 一种基于知识蒸馏的无监督行人重识别方法 | |
CN112131978B (zh) | 一种视频分类方法、装置、电子设备和存储介质 | |
Lee et al. | Learning the easy things first: Self-paced visual category discovery | |
CN112734775B (zh) | 图像标注、图像语义分割、模型训练方法及装置 | |
CN109671102B (zh) | 一种基于深度特征融合卷积神经网络的综合式目标跟踪方法 | |
CN109993102B (zh) | 相似人脸检索方法、装置及存储介质 | |
CN108509978A (zh) | 基于cnn的多级特征融合的多类目标检测方法及模型 | |
CN109993100B (zh) | 基于深层特征聚类的人脸表情识别的实现方法 | |
CN106919920A (zh) | 基于卷积特征和空间视觉词袋模型的场景识别方法 | |
CN108427740B (zh) | 一种基于深度度量学习的图像情感分类与检索算法 | |
CN110647938B (zh) | 图像处理方法及相关装置 | |
CN110765960B (zh) | 一种自适应多任务深度学习的行人再识别方法 | |
CN106971145A (zh) | 一种基于极限学习机的多视角动作识别方法及装置 | |
CN110110724A (zh) | 基于指数型挤压函数驱动胶囊神经网络的文本验证码识别方法 | |
CN112669343A (zh) | 一种基于深度学习的壮族少数民族服饰分割方法 | |
CN107577994A (zh) | 一种基于深度学习的行人、车辆附属品识别及检索方法 | |
CN113657486B (zh) | 基于电梯图片数据的多标签多属性分类模型建立方法 | |
CN114461804A (zh) | 一种基于关键信息与动态路由的文本分类方法、分类器及系统 | |
CN112836755B (zh) | 基于深度学习的样本图像生成方法及其系统 | |
CN115188031A (zh) | 指纹识别方法、计算机程序产品、存储介质及电子设备 | |
CN111310820A (zh) | 基于交叉验证深度cnn特征集成的地基气象云图分类方法 | |
CN105809200B (zh) | 一种生物启发式自主抽取图像语义信息的方法及装置 | |
CN114782979A (zh) | 一种行人重识别模型的训练方法、装置、存储介质及终端 | |
CN109002808B (zh) | 一种人体行为识别方法及系统 | |
CN112085540A (zh) | 基于人工智能技术的广告智能推送系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |