CN107967484B - 一种基于多分辨率的图像分类方法 - Google Patents
一种基于多分辨率的图像分类方法 Download PDFInfo
- Publication number
- CN107967484B CN107967484B CN201711120584.6A CN201711120584A CN107967484B CN 107967484 B CN107967484 B CN 107967484B CN 201711120584 A CN201711120584 A CN 201711120584A CN 107967484 B CN107967484 B CN 107967484B
- Authority
- CN
- China
- Prior art keywords
- layer
- picture
- neural network
- resolution
- different
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Library & Information Science (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于多分辨率的图像分类方法,其目的在于利用不同的深度神经网络结构解决多分辨率输入问题,利用深度学习技术实现从分类标签集合中找出一个分类标签并把分类标签分配给输入图像的效果。其技术关键在于(1)采用跳过部分池化层的方法来实现多分辨率图像分类;(2)采用指定位置输入的方法来实现多分辨率图像分类。(3)根据卷积网络不同层得到的特征特点不同,对不同层的特征采用不同的利用方式。本发明输入任意一张测试图片到训练好的神经网络模型中,神经网络的输出即为该图片的类别。本发明在不统一输入图片大小的前提下,保持了原图片质量,不增加任何噪声,有效地实现了多分辨率的图像分类。
Description
技术领域
本发明属于图像处理领域,尤其涉及到一种基于多分辨率的图像分类方法。
背景技术
图像的分类作为计算机视觉领域的重要组成部分,能够有效地对图像的内容进行分析,获取图像中的关键信息,并给出正确的判断。图像分类看似是最简单的问题,却又是一个核心问题,其重要性还体现在其它的一些计算机视觉问题,如物体定位和识别、图像内容分割等,对现实的工作生活及社会的发展具有重要的意义。
图像分类关注于全局统计信息,而且对于图像数据,深度学习具有优秀的建模和特征提取能力,已被广泛应用于图像物体分类的理论分析和实际应用。Kong提出基于深度置信网络构建模型,利用方向梯度直方图(Histogram of Oriented Gradient,HOG)算子和特征很好地区分了真实交通场景图像数据中的行人、车辆等,并且模型在光照、姿势、分辨率上都具有非常好的鲁棒性。Bo Yu等通过引入多任务训练机制来提升深度模型性能,明显改善了人脸分类识别效果。Sun Y等基于CNN设计出一个DeepID人脸识别系统在人脸识别挑战带标签的数据库LFW(Labeled Faces in the Wild)上取得99.15%的识别率,首次超越同样数据集上人眼97.5%的识别率,最终通过模型的进一步完善,使DeepID系统拥有非常好的遮挡鲁棒性,这一成果极大地推动了具有巨大实用价值的人脸识别领域的发展。
在大规模视觉识别挑战赛(ILSVRC)2012比赛中,来自多伦多大学的AlexKrizhevsky团队设计出卷积神经网络AlexNet,将测试的top-5error下降到15.3%,而采取传统方法做分类的第二名top-5error为26.2%,深度学习方法明显优于传统方法。此后,不断有更加高效、准确的模型出现,如牛津大学的VGG,谷歌研究院的GoogLe Net等。近年来的优秀模型甚至突破了人眼识别的平均错误率,展示了卷积神经网络在图像分类上的强大优势。
深度卷积神经网络用于图片分类效果明显,但仍存在以下问题:
(1)对于一些不容易分类的需要提取更抽象的图片特征的分类任务而言,如人脸识别、人脸属性识别等,一般的网络结构效果比较差。
(2)目前的趋势是网络越深,卷积神经网络的测试效果越好。但是随着网络的加深,过拟合和网络退化问题显得更加严重。
发明内容
本发明的目的在于针对上述技术的不足,提出一种基于多分辨率的图像分类方法,设计深度卷积神经网络结构,利用深度学习技术实现从分类标签集合中找出一个分类标签并把分类标签分配给输入图像的效果。
本发明采用的技术方案是:
一种基于多分辨率的图像分类方法,包括以下步骤:
步骤2:制作图片标签。标签表示为l(l∈(1,N)),表示属于第几类。在训练集中,同一类别的图片标签保持一致,不同类别的标签不能相同。
步骤3:构建图片数据库。在深度卷积神经网络训练时需要输入训练数据,利用准备好的数据集和标签将图片数据转换为lmdb格式。所述lmdb为内存映射数据库,读取的效率更高,而且支持不同程序同时读取。
步骤4:设计网络结构。本发明针对多分辨率输入设计了两种网络结构,确定深度神经网络输入层节点数、输出层节点数、隐藏层数和隐藏层节点数,随机初始化各层的连接权值W和偏置b,给定学习速率η,选定激活函数RELU,选定损失函数Loss。所述激活函数的作用是能够给神经网络加入一些非线性因素,使得神经网络可以更好地解决较为复杂的问题,进一步地,RELU的数学表达式为:
(4a)第一种深度神经网络结构。采用跳过部分池化层的方法,所述池化层在卷积层后面,通过池化层来降低卷积层输出的特征向量。本发明结构一中跳过池化层的个数取决于输入图片的分辨率大小和最小分辨率的图片大小。
进一步地,跳过的个数为:
在特征图大小统一前,不同分辨率图片共同作用卷积层和激活层,单独作用池化层,在特征图大小统一后共同作用卷积层、激活层和池化层。
(4b)第二种深度神经网络结构。采用指定位置输入的方法,本发明结构二中不减少池化层个数,利用池化层能够降低特征图大小的的性能以2M倍采样特征图。将不同分辨率的图片与不同大小的特征图相匹配,将输入图片定位到大小匹配一致的特征图前一层。所述输入图片在与特征图结合前经过卷积激活处理。
(4c)选定损失函数Loss。本发明根据卷积网络不同层得到的特征特点不同,对不同层的特征采用不同的利用方式。利用低层细节更加清楚的特点进行小目标分类,利用高层包含信息更多的特点进行大目标分类。所述小目标与大目标为某一类物体所占图片像素的大小,一张图片中占大部分像素的物体为大目标,反之为小目标。将不同层提取的特征连接得到一个既包含细节又包含总体信息的特征向量。
进一步地,该向量可用具体公式表示为:
其中RELUj表示深度神经网络的第j个池化层输出,RELUlast表示深度神经网络的最后一个池化层输出。
该向量经过全连接层后输入到softmax层进行类别判断。所述softmax函数是一个归一化的指数函数,可以用于解决多分类问题。
进一步地,softmax函数定义如下:
yi=ezi/∑nezi i=1,2,3,...,n (4)
其中yi为概率,i为特征向量z中的第i个元素。
式子中的分母起正则项的作用,∑nezi=1。所述正则项为保留一些更为重要的特征变量,舍弃不需要的变量。在本发明提出的图像分类方法中需要判断输入图片的类别,重点考虑输入图片可能的类别,不考虑概率小的类别。
根据最大化似然函数就是最小化它的负对数的似然函数可得,本发明的损失函数为:
Loss=-log(ezi/∑nezi) (5)
步骤5:训练深度神经网络直到神经网络输出层误差达到精度要求或训练次数达到最大迭代次数,结束训练。保存网络结构和参数,得到训练好的神经网络模型。
步骤6:输入任意一张测试图片到训练好的神经网络模型中,神经网络的输出即为该图片的类别。
附图说明
以下结合附图,对本发明的具体实施方式做进一步的详细描述。
图1为本发明一种基于多分辨率的图像分类方法一的原理示意图。
图2为本发明一种基于多分辨率的图像分类方法二的原理示意图。
具体实施方式
如图1和图2所示,本发明公开了一种基于多分辨率的图像分类方法,下面结合附图对本发明的具体实施方式做详细说明。
步骤1:数据集准备。选取包含10个种类的数据集,每类图片含3种分辨率,分别是64×64,128×128,256×256。每种分辨率的图片数量相近。将图片分成训练集和测试集两个部分。
步骤2:制作图片标签。由于分了10个类别,所以标签有10类,表示为l(l∈(1,10)),在训练集中,同一类别的图片标签保持一致,不同类别的标签不能相同。
步骤3:构建图片数据库。在深度卷积神经网络训练时需要输入训练数据,利用准备好的数据集和标签将图片数据转换为lmdb格式。所述lmdb为内存映射数据库,读取的效率更高,而且支持不同程序同时读取。
步骤4:设计网络结构。本发明针对多分辨率输入设计了两种网络结构,确定深度神经网络输入层节点数、输出层节点数、隐藏层数和隐藏层节点数,随机初始化各层的连接权值W和偏置b,给定学习速率η,选定激活函数RELU,选定损失函数Loss。所述激活函数的作用是能够给神经网络加入一些非线性因素,使得神经网络可以更好地解决较为复杂的问题,进一步地RELU的数学表达式为:
(4a)第一种深度神经网络结构。采用跳过部分池化层的方法,所述池化层在卷积层后面,通过池化来降低卷积层输出的特征向量。本发明结构一中跳过池化层的个数取决于输入图片的分辨率大小和最小分辨率的图片大小。
进一步地,跳过的个数为:
在特征图大小统一前,不同分辨率图片共同作用卷积层和激活层,单独作用池化层,在特征图大小统一后共同作用卷积层、激活层和池化层。
(4b)第二种深度神经网络结构。采用指定位置输入的方法,本发明结构二中不减少池化层个数,利用池化层能够降低特征图大小的的性能以2M倍采样特征图。将不同分辨率的图片与不同大小的特征图相匹配,将输入图片定位到大小匹配一致的特征图前一层。将分辨率为64×64的图片在深度神经网络经过2个池化层后输入;将分辨率为128×128的图片在深度神经网络经过1个池化层后输入;将分辨率为256×256的图片在深度神经网络不经过池化层前输入。所述输入图片在与特征图结合前经过卷积激活处理。
(4c)选定损失函数Loss。本发明根据卷积网络不同层得到的特征特点不同,对不同层的特征采用不同的利用方式。利用低层细节更加清楚的特点进行小目标分类,利用高层包含信息更多的特点进行大目标分类。所述小目标与大目标为某一类物体所占图片像素的大小,一张图片中占大部分像素的物体为大目标,反之为小目标。将不同层提取的特征连接得到一个既包含细节又包含总体信息的特征向量,该向量经过全连接层后输入到softmax层进行类别判断。所述softmax函数是一个归一化的指数函数,可以用于解决多分类问题。
进一步地,该向量可用具体公式表示为:
其中RELUj表示深度神经网络的第j个池化层输出,RELUlast表示深度神经网络的最后一个池化层输出。
进一步地,softmax函数定义如下:
yi=ezi/∑nezi i=1,2,3,...,n (8)
其中yi为概率,i为特征向量z中的第i个元素。
式子中的分母起正则项的作用,∑nezi=1。所述正则项为保留一些更为重要的特征变量,舍弃不需要的变量。在本发明提出的图像分类方法中需要判断输入图片的类别,重点考虑输入图片可能的类别,不考虑概率小的类别。
根据最大化似然函数就是最小化它的负对数的似然函数可得,本发明的损失函数为:
Loss=-log(ezi/∑nezi) (9)
步骤5:训练深度神经网络,直到神经网络输出层误差达到精度要求或训练次数达到最大迭代次数,结束训练。保存网络结构和参数,得到训练好的神经网络模型。
步骤6:输入任意一张测试图片到训练好的神经网络模型中,神经网络的输出即为该图片的类别。
Claims (3)
1.一种基于多分辨率的图像分类方法,其特征在于:
步骤2:制作图片标签,标签表示为l(l∈(1,N)),表示属于第几类,在训练集中,同一类别的图片标签保持一致,不同类别的标签不能相同;
步骤3:构建图片数据库,在深度卷积神经网络训练时需要输入训练数据,利用准备好的数据集和标签将图片数据转换为lmdb格式,所述lmdb为内存映射数据库,读取的效率更高,而且支持不同程序同时读取;
步骤4:针对多分辨率输入设计了两种网络结构,确定深度神经网络输入层节点数、输出层节点数、隐藏层数和隐藏层节点数,随机初始化各层的连接权值W和偏置b,给定学习速率η,选定激活函数RELU,选定损失函数Loss,所述激活函数的作用是能够给神经网络加入一些非线性因素,使得神经网络可以更好地解决较为复杂的问题,RELU的数学表达式为:
步骤5:训练深度神经网络直到神经网络输出层误差达到精度要求或训练次数达到最大迭代次数,结束训练,保存网络结构和参数,得到训练好的神经网络模型;
步骤6:输入任意一张测试图片到训练好的神经网络模型中,神经网络的输出即为该图片的类别;
所述步骤4中,第一种深度神经网络结构,采用跳过部分池化层的方法,所述池化层在卷积层后面,通过池化层来降低卷积层输出的特征向量,结构一中跳过池化层的个数取决于输入图片的分辨率大小和最小分辨率的图片大小;
跳过的个数为:
在特征图大小统一前,不同分辨率图片共同作用卷积层和激活层,单独作用池化层,在特征图大小统一后共同作用卷积层、激活层和池化层。
2.根据权利要求1的基于多分辨率的图像分类方法,其特征在于:所述步骤4中,第二种深度神经网络结构,采用指定位置输入的方法,结构二中不跳过池化层,利用池化层能够降低特征图大小的的性能以2M倍采样特征图,将不同分辨率的图片与不同大小的特征图相匹配,将输入图片定位到大小匹配一致的特征图前一层,所述输入图片在与特征图结合前经过卷积激活处理。
3.根据权利要求1的基于多分辨率的图像分类方法,其特征在于:所述步骤4中,根据卷积网络不同层得到的特征特点不同,对不同层的特征采用不同的利用方式,利用低层细节更加清楚的特点进行小目标分类,利用高层包含信息更多的特点进行大目标分类,所述小目标与大目标为某一类物体所占图片像素的大小,一张图片中占大部分像素的物体为大目标,反之为小目标,将不同层提取的特征连接得到一个既包含细节又包含总体信息的特征向量;
该向量可用具体公式表示为:
其中RELUj表示深度神经网络的第j个池化层输出,RELUlast表示深度神经网络的最后一个池化层输出;
该向量经过全连接层后输入到softmax层进行类别判断,所述softmax函数是一个归一化的指数函数,可以用于解决多分类问题;
softmax函数定义如下:
yi=ezi/∑nezi i=1,2,3,...,n (4)
其中yi为概率,zi为特征向量z中的第i个元素;
式子中的分母起正则项的作用,∑nezi=1,所述正则项为保留一些更为重要的特征变量,舍弃不需要的变量,该图像分类方法中需要判断输入图片的类别,重点考虑输入图片可能的类别,不考虑概率小的类别;
根据最大化似然函数就是最小化它的负对数的似然函数可得,损失函数为:
Loss=-log(ezi/∑nezi) (5)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711120584.6A CN107967484B (zh) | 2017-11-14 | 2017-11-14 | 一种基于多分辨率的图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711120584.6A CN107967484B (zh) | 2017-11-14 | 2017-11-14 | 一种基于多分辨率的图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107967484A CN107967484A (zh) | 2018-04-27 |
CN107967484B true CN107967484B (zh) | 2021-03-16 |
Family
ID=62001058
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711120584.6A Active CN107967484B (zh) | 2017-11-14 | 2017-11-14 | 一种基于多分辨率的图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107967484B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109065165B (zh) * | 2018-07-25 | 2021-08-17 | 东北大学 | 一种基于重建气道树图像的慢性阻塞性肺病预测方法 |
DE102018213056A1 (de) * | 2018-08-03 | 2020-02-06 | Robert Bosch Gmbh | Verfahren und Vorrichtung zum Ermitteln einer Erklärungskarte |
CN109063139B (zh) * | 2018-08-03 | 2021-08-03 | 天津大学 | 基于全景图及多通道cnn的三维模型分类和检索方法 |
US10474713B1 (en) * | 2018-10-26 | 2019-11-12 | StradVision, Inc. | Learning method and learning device using multiple labeled databases with different label sets and testing method and testing device using the same |
CN109376786A (zh) * | 2018-10-31 | 2019-02-22 | 中国科学院深圳先进技术研究院 | 一种图像分类方法、装置、终端设备及可读存储介质 |
CN109993050B (zh) * | 2018-11-28 | 2019-12-27 | 中国人民解放军国防科技大学 | 一种合成孔径雷达图像识别方法 |
CN110222716B (zh) * | 2019-05-08 | 2023-07-25 | 天津大学 | 基于全分辨率深度卷积神经网络的图像分类方法 |
CN110222741A (zh) * | 2019-05-23 | 2019-09-10 | 上海联影智能医疗科技有限公司 | 医学图像的预测方法、模型、装置、设备和存储介质 |
CN110648322B (zh) * | 2019-09-25 | 2023-08-15 | 杭州智团信息技术有限公司 | 一种子宫颈异常细胞检测方法及系统 |
CN110751271B (zh) * | 2019-10-28 | 2023-05-26 | 西安烽火软件科技有限公司 | 一种基于深度神经网络的图像溯源特征表征方法 |
CN111652285A (zh) * | 2020-05-09 | 2020-09-11 | 济南浪潮高新科技投资发展有限公司 | 一种茶饼类别识别方法、设备及介质 |
KR20230022843A (ko) * | 2020-06-15 | 2023-02-16 | 인텔 코포레이션 | 적응적 런타임 효율적 이미지 분류를 위한 입력 이미지 크기 전환 가능 네트워크 |
CN112380392A (zh) * | 2020-11-17 | 2021-02-19 | 北京百度网讯科技有限公司 | 用于分类视频的方法、装置、电子设备及可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103761705A (zh) * | 2014-01-10 | 2014-04-30 | 北京东方惠尔图像技术有限公司 | 超声图像放大方法及装置 |
CN105095870A (zh) * | 2015-07-27 | 2015-11-25 | 中国计量学院 | 基于迁移学习的行人重识别方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107004142B (zh) * | 2014-12-10 | 2018-04-17 | 北京市商汤科技开发有限公司 | 用于图像分类的方法和系统 |
US20170228616A1 (en) * | 2015-02-05 | 2017-08-10 | Tolga Tasdizen | Systems and methods for image classification |
US20180082153A1 (en) * | 2015-03-11 | 2018-03-22 | Siemens Aktiengesellschaft | Systems and methods for deconvolutional network based classification of cellular images and videos |
US9786036B2 (en) * | 2015-04-28 | 2017-10-10 | Qualcomm Incorporated | Reducing image resolution in deep convolutional networks |
CN107292333B (zh) * | 2017-06-05 | 2019-11-29 | 浙江工业大学 | 一种基于深度学习的快速图像分类方法 |
CN107341518A (zh) * | 2017-07-07 | 2017-11-10 | 东华理工大学 | 一种基于卷积神经网络的图像分类方法 |
-
2017
- 2017-11-14 CN CN201711120584.6A patent/CN107967484B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103761705A (zh) * | 2014-01-10 | 2014-04-30 | 北京东方惠尔图像技术有限公司 | 超声图像放大方法及装置 |
CN105095870A (zh) * | 2015-07-27 | 2015-11-25 | 中国计量学院 | 基于迁移学习的行人重识别方法 |
Non-Patent Citations (2)
Title |
---|
"Single face image super-resolution using local training networks";Peiqing Ni等;《2017 4th International Conference on Systems and Informatics (ICSAI)》;20171113;摘要 * |
Yuki, D 等.Development of A Supporting System for Visual Inspection of IGBT Device Based on Statistical Feature and Complex Multi-Resolution Analysis.《15th International Conference on Control, Automation and Systems (ICCAS)》.2015,第1-4页. * |
Also Published As
Publication number | Publication date |
---|---|
CN107967484A (zh) | 2018-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107967484B (zh) | 一种基于多分辨率的图像分类方法 | |
US20220092351A1 (en) | Image classification method, neural network training method, and apparatus | |
US11195051B2 (en) | Method for person re-identification based on deep model with multi-loss fusion training strategy | |
CN111210443B (zh) | 基于嵌入平衡的可变形卷积混合任务级联语义分割方法 | |
WO2021043168A1 (zh) | 行人再识别网络的训练方法、行人再识别方法和装置 | |
CN109241317B (zh) | 基于深度学习网络中度量损失的行人哈希检索方法 | |
US20220148291A1 (en) | Image classification method and apparatus, and image classification model training method and apparatus | |
CN110909820A (zh) | 基于自监督学习的图像分类方法及系统 | |
CN109670405B (zh) | 一种基于深度学习的复杂背景行人检测方法 | |
Jiang et al. | Cascaded subpatch networks for effective CNNs | |
CN109508675B (zh) | 一种针对复杂场景的行人检测方法 | |
Geng et al. | Using deep learning in infrared images to enable human gesture recognition for autonomous vehicles | |
CN113034545A (zh) | 一种基于CenterNet多目标跟踪算法的车辆跟踪方法 | |
Yang et al. | Facial expression recognition based on dual-feature fusion and improved random forest classifier | |
CN113011288A (zh) | 一种基于Mask RCNN算法的遥感建筑物检测方法 | |
CN112132145B (zh) | 一种基于模型扩展卷积神经网络的图像分类方法及系统 | |
US20230326173A1 (en) | Image processing method and apparatus, and computer-readable storage medium | |
WO2021238586A1 (zh) | 一种训练方法、装置、设备以及计算机可读存储介质 | |
CN111553438A (zh) | 一种基于卷积神经网络的图像识别方法 | |
CN113032613B (zh) | 一种基于交互注意力卷积神经网络的三维模型检索方法 | |
Zhang et al. | Deep salient object detection by integrating multi-level cues | |
CN112528845A (zh) | 一种基于深度学习的物理电路图识别方法及其应用 | |
CN115393666A (zh) | 图像分类中基于原型补全的小样本扩充方法及系统 | |
US20230072445A1 (en) | Self-supervised video representation learning by exploring spatiotemporal continuity | |
Shi et al. | A new multiface target detection algorithm for students in class based on bayesian optimized YOLOv3 model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 310018 126 Guangming Road, Simen Town, Yuyao City, Ningbo, Zhejiang Applicant after: CHINA JILIANG UNIVERSITY Address before: 310018 No. 258, Xue Yuan Street, Xiasha Higher Education Park, Hangzhou, Zhejiang Applicant before: CHINA JILIANG UNIVERSITY |
|
GR01 | Patent grant | ||
GR01 | Patent grant |