CN111382685B - 一种基于深度学习的场景识别方法和系统 - Google Patents

一种基于深度学习的场景识别方法和系统 Download PDF

Info

Publication number
CN111382685B
CN111382685B CN202010142745.7A CN202010142745A CN111382685B CN 111382685 B CN111382685 B CN 111382685B CN 202010142745 A CN202010142745 A CN 202010142745A CN 111382685 B CN111382685 B CN 111382685B
Authority
CN
China
Prior art keywords
scale
image
resolution
scene
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010142745.7A
Other languages
English (en)
Other versions
CN111382685A (zh
Inventor
赵亦为
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202010142745.7A priority Critical patent/CN111382685B/zh
Publication of CN111382685A publication Critical patent/CN111382685A/zh
Application granted granted Critical
Publication of CN111382685B publication Critical patent/CN111382685B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习的场景识别方法和系统,采用多尺度卷积神经网络,所述多尺度卷积神经网络包括对输入的场景图像进行多尺度化处理的多尺度层,所述方法包括:设置分辨率级别,所述分辨率级别将分辨率范围与图像处理参数进行关联,所述图像处理参数包括场景图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值;获取所述场景图像的图像分辨率;根据图像分辨率对应的分辨率范围,按照所述图像处理参数对所述场景图像进行后续处理。本发明将场景图像的分辨率作为其对多尺度卷积神经网络进行训练的影响权值,也就是说,越清晰的场景图像可以使得多尺度卷积神经网络训练后的准确率更高。

Description

一种基于深度学习的场景识别方法和系统
技术领域
本发明涉及,尤其涉及一种基于深度学习的场景识别方法和系统。
背景技术
深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。深度学习在搜索技术,数据挖掘,机器学习,机器翻译,自然语言处理,多媒体学习,语音,推荐和个性化技术,以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。
场景识别(place recognition)是一类很常见的图像处理任务。给定一张图片,要求识别出这张图片中出现的场景。识别的结果既可以是具体的地理位置,也可以是该场景的名称,还可以是数据库中的某个同样的场景。
孙昊于2017年5月提出了一种《基于深度卷积神经网络的场景分类研究》,其公开了一种端到端的多尺度卷积神经网络(Multi-scaleConvolutionalNeuralNetwork,MSCNN),旨在充分发掘各尺度内特征的性能以及深入挖掘不同尺度之间特征的互补性。其中多尺度卷积神经网络框架,由多尺度层,卷积模块,尺度内特征融合模块和尺度间特征融合模块组成。其中多尺度层用来对输入场景图像进行多尺度化处理;卷积模块用来提取各场景块的卷积特征;尺度内(Intra-scale)特征融合模块用来融合同尺度内的不同场景块之间的特征;尺度间(Inter-scale)特征融合模块用来对不同尺度间的特征进行融合,得到多尺度的场景特征。但是在现有技术中,对于相同场景的场景图像会采用不同方式采集,例如低精度摄像头、中精度智能设备、高精度相机;如果对所有精度的图片均进行相同权级的输入多尺度卷积神经网络,会使得训练效果不如预期。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于深度学习的场景识别方法和系统,解决现有技术对所有精度的图片均进行相同权级的输入卷积神经网络对于多尺度卷积神经网络训练效果不如预期的问题。
本发明的目的是通过以下技术方案来实现的:
本发明的第一方面,提供一种基于深度学习的场景识别方法,采用多尺度卷积神经网络,所述多尺度卷积神经网络包括对输入的场景图像进行多尺度化处理的多尺度层,所述方法包括:
设置分辨率级别,所述分辨率级别将分辨率范围与图像处理参数进行关联,所述图像处理参数包括场景图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值;
获取所述场景图像的图像分辨率;
根据图像分辨率对应的分辨率范围,按照所述图像处理参数对所述场景图像进行后续处理。
进一步地,所述分辨率级别将分辨率范围与图像处理参数进行关联,所述图像处理参数包括图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值L,包括:
所述分辨率范围越低,所述图像处理参数的数值越小;所述分辨率范围越高,所述图像处理参数的数值越大。
进一步地,所述设置分辨率级别包括:
根据场景复杂度,设置所述分辨率级别。
进一步地,所述的分辨率级别为三级,分别为低级、中级和高级。
进一步地,所述多尺度化处理的最大尺度值为三层,所述场景图像输入所述多尺度卷积神经网络的最大次数为三;当分辨率级别为低级时,多尺度化处理的尺度值为一层,场景图像输入所述多尺度卷积神经网络的次数为一;当分辨率级别为中级时,多尺度化处理的尺度值为二层,场景图像输入所述多尺度卷积神经网络的次数为二;当分辨率级别为高级时,多尺度化处理的尺度值为三层,场景图像输入所述多尺度卷积神经网络的次数为三。
本发明的第二方面,提供一种基于深度学习的场景识别系统,包括多尺度卷积神经网络,所述多尺度卷积神经网络包括对输入的场景图像进行多尺度化处理的多尺度处理模块,所述系统还包括:
分辨率设置模块:用于设置分辨率级别,所述分辨率级别将分辨率范围与图像处理参数进行关联,所述图像处理参数包括场景图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值;
场景图像分辨率获取模块:用于获取所述场景图像的图像分辨率;
匹配与处理模块:用于根据图像分辨率对应的分辨率范围,按照所述图像处理参数对所述场景图像进行后续处理。
进一步地,所述分辨率级别将分辨率范围与图像处理参数进行关联,所述图像处理参数包括图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值L,包括:
所述分辨率范围越低,所述图像处理参数的数值越小;所述分辨率范围越高,所述图像处理参数的数值越大。
进一步地,所述设置分辨率级别包括:
根据场景复杂度,设置所述分辨率级别。
进一步地,所述的分辨率级别由低至高分为三级,所述多尺度化处理的最大尺度值为三层;当分辨率级别为低级时,多尺度化处理的尺度值为一层,当分辨率级别为中级时,多尺度化处理的尺度值为二层;当分辨率级别为高级时,多尺度化处理的尺度值为三层。
进一步地,所述多尺度化处理的最大尺度值为三层,所述场景图像输入所述多尺度卷积神经网络的最大次数为三;当分辨率级别为低级时,多尺度化处理的尺度值为一层,场景图像输入所述多尺度卷积神经网络的次数为一;当分辨率级别为中级时,多尺度化处理的尺度值为二层,场景图像输入所述多尺度卷积神经网络的次数为二;当分辨率级别为高级时,多尺度化处理的尺度值为三层,场景图像输入所述多尺度卷积神经网络的次数为三。
本发明的有益效果是:本发明的方法示例性实施例,将场景图像的分辨率作为其对多尺度卷积神经网络进行训练的影响权值,包括场景图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值,也就是说,越清晰的场景图像可以使得多尺度卷积神经网络训练后的准确率更高。本发明的系统示例性实施例具有相同的优点。
附图说明
图1为本发明一示例性实施例公开的方法流程图。
具体实施方式
下面结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,属于“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方向或位置关系为基于附图所述的方向或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,属于“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,属于“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
参见图1,在本发明的一示例性实施例中,提供一种基于深度学习的场景识别方法,采用多尺度卷积神经网络,所述多尺度卷积神经网络包括对输入的场景图像进行多尺度化处理的多尺度层,所述方法包括:
设置分辨率级别,所述分辨率级别将分辨率范围与图像处理参数进行关联,所述图像处理参数包括场景图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值;
获取所述场景图像的图像分辨率;
根据图像分辨率对应的分辨率范围,按照所述图像处理参数对所述场景图像进行后续处理。
具体地,在该示例性实施例中,将场景图像的分辨率作为其对多尺度卷积神经网络进行训练的影响权值,也就是说,越清晰的场景图像可以使得多尺度卷积神经网络训练后的准确率更高。(在该示例性实施例中,未考虑其他影响因素)
因此,基于多尺度卷积神经网络,本示例性实施例将分辨率进行分级,对具有不同级别分辨率的场景图像进行不同处理:一是设置该场景图像输入所述多尺度卷积神经网络的次数,当次数越多从而可以更能影响多尺度卷积神经网络。二是设置多尺度化处理的尺度值,即对图像的分割次数,当尺度值为一时即把图像不分割直接输入至第一层卷积网络;当尺度值为二时,分别把图像不分割直接输入第一层卷积网络,并把图像进行M次分割后输入第二层卷积网络;当尺度值为三时,分别把图像不分割直接输入第一层卷积网络,把图像进行M次分割后输入第二层卷积网络,把图像进行N次分割后输入第二层卷积网络,其中M小于N,且M次分割的图像大小大于N次分割的图像大小;以此类推。也就是说,当图像分辨率越低,越不适合被分割的次数大。
因此,在设置好上述规则好,就按照获取到的场景图象的图像分辨率进行后续处理,包括输入次数和多尺度化处理的尺度值。同时,对于其他后续包括尺度内融合/尺度间融合等步骤属于现有技术,在此不进行赘述。
更优地,在又一示例性实施例中,所述分辨率级别将分辨率范围与图像处理参数进行关联,所述图像处理参数包括图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值L,包括:
所述分辨率范围越低,所述图像处理参数的数值越小;所述分辨率范围越高,所述图像处理参数的数值越大。
具体地,在该示例性实施例中,分辨率越低图像处理参数越小表示场景图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值更低,反之亦同。
更优地,在又一示例性实施例中,所述设置分辨率级别包括:
根据场景复杂度,设置所述分辨率级别。
具体地,在该示例性实施例中,场景复杂度主要表现为是否有较多影响场景变化的出现,例如是否会有很多人。在一示例性实施例中,当场景复杂度越高,设置分辨率级别的分辨率范围跨度越小。
更优地,在又一示例性实施例中,所述的分辨率级别为三级,分别为低级、中级和高级。即分辨率级别对应的范围分别是(0,a)、(a,b)、(b,正无穷)。
更优地,在又一示例性实施例中,所述多尺度化处理的最大尺度值为三层,所述场景图像输入所述多尺度卷积神经网络的最大次数为三;当分辨率级别为低级时,多尺度化处理的尺度值为一层,场景图像输入所述多尺度卷积神经网络的次数为一;当分辨率级别为中级时,多尺度化处理的尺度值为二层,场景图像输入所述多尺度卷积神经网络的次数为二;当分辨率级别为高级时,多尺度化处理的尺度值为三层,场景图像输入所述多尺度卷积神经网络的次数为三。
本发明的又一示例性实施例提供一种基于深度学习的场景识别系统,具有与上述示例性实施例相同的技术启示,包括多尺度卷积神经网络,所述多尺度卷积神经网络包括对输入的场景图像进行多尺度化处理的多尺度处理模块,所述系统还包括:
分辨率设置模块:用于设置分辨率级别,所述分辨率级别将分辨率范围与图像处理参数进行关联,所述图像处理参数包括场景图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值;
场景图像分辨率获取模块:用于获取所述场景图像的图像分辨率;
匹配与处理模块:用于根据图像分辨率对应的分辨率范围,按照所述图像处理参数对所述场景图像进行后续处理。
更优地,在又一示例性实施例中,所述分辨率级别将分辨率范围与图像处理参数进行关联,所述图像处理参数包括图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值L,包括:
所述分辨率范围越低,所述图像处理参数的数值越小;所述分辨率范围越高,所述图像处理参数的数值越大。
更优地,在又一示例性实施例中,所述设置分辨率级别包括:
根据场景复杂度,设置所述分辨率级别。
更优地,在又一示例性实施例中,所述的分辨率级别由低至高分为三级,所述多尺度化处理的最大尺度值为三层;当分辨率级别为低级时,多尺度化处理的尺度值为一层,当分辨率级别为中级时,多尺度化处理的尺度值为二层;当分辨率级别为高级时,多尺度化处理的尺度值为三层。
更优地,在又一示例性实施例中,所述多尺度化处理的最大尺度值为三层,所述场景图像输入所述多尺度卷积神经网络的最大次数为三;当分辨率级别为低级时,多尺度化处理的尺度值为一层,场景图像输入所述多尺度卷积神经网络的次数为一;当分辨率级别为中级时,多尺度化处理的尺度值为二层,场景图像输入所述多尺度卷积神经网络的次数为二;当分辨率级别为高级时,多尺度化处理的尺度值为三层,场景图像输入所述多尺度卷积神经网络的次数为三。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定,对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其他不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (6)

1.一种基于深度学习的场景识别方法,采用多尺度卷积神经网络,所述多尺度卷积神经网络包括对输入的场景图像进行多尺度化处理的多尺度层,其特征在于:所述方法包括:
设置分辨率级别,所述分辨率级别将分辨率范围与图像处理参数进行关联,所述图像处理参数包括场景图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值;
获取所述场景图像的图像分辨率;
根据图像分辨率对应的分辨率范围,按照所述图像处理参数对所述场景图像进行后续处理;
所述的分辨率级别为三级,分别为低级、中级和高级;所述多尺度化处理的最大尺度值为三层,所述场景图像输入所述多尺度卷积神经网络的最大次数为三;当分辨率级别为低级时,多尺度化处理的尺度值为一层,场景图像输入所述多尺度卷积神经网络的次数为一;当分辨率级别为中级时,多尺度化处理的尺度值为二层,场景图像输入所述多尺度卷积神经网络的次数为二;当分辨率级别为高级时,多尺度化处理的尺度值为三层,场景图像输入所述多尺度卷积神经网络的次数为三;
设置多尺度化处理的尺度值即对图像的分割次数,当尺度值为一时即把图像不分割直接输入至第一层卷积网络;当尺度值为二时,分别把图像不分割直接输入第一层卷积网络,并把图像进行M次分割后输入第二层卷积网络;当尺度值为三时,分别把图像不分割直接输入第一层卷积网络,把图像进行M次分割后输入第二层卷积网络,把图像进行N次分割后输入第三层卷积网络,其中M小于N,且M次分割的图像大小大于N次分割的图像大小。
2.根据权利要求1所述的一种基于深度学习的场景识别方法,其特征在于:所述分辨率级别将分辨率范围与图像处理参数进行关联,所述图像处理参数包括图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值L,包括:
所述分辨率范围越低,所述图像处理参数的数值越小;所述分辨率范围越高,所述图像处理参数的数值越大。
3.根据权利要求1所述的一种基于深度学习的场景识别方法,其特征在于:所述设置分辨率级别包括:
根据场景复杂度,设置所述分辨率级别。
4.一种基于深度学习的场景识别系统,包括多尺度卷积神经网络,所述多尺度卷积神经网络包括对输入的场景图像进行多尺度化处理的多尺度处理模块,其特征在于:所述系统还包括:
分辨率设置模块:用于设置分辨率级别,所述分辨率级别将分辨率范围与图像处理参数进行关联,所述图像处理参数包括场景图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值;
场景图像分辨率获取模块:用于获取所述场景图像的图像分辨率;
匹配与处理模块:用于根据图像分辨率对应的分辨率范围,按照所述图像处理参数对所述场景图像进行后续处理;
所述的分辨率级别由低至高分为三级,所述多尺度化处理的最大尺度值为三层;当分辨率级别为低级时,多尺度化处理的尺度值为一层,当分辨率级别为中级时,多尺度化处理的尺度值为二层;当分辨率级别为高级时,多尺度化处理的尺度值为三层;
所述多尺度化处理的最大尺度值为三层,所述场景图像输入所述多尺度卷积神经网络的最大次数为三;当分辨率级别为低级时,多尺度化处理的尺度值为一层,场景图像输入所述多尺度卷积神经网络的次数为一;当分辨率级别为中级时,多尺度化处理的尺度值为二层,场景图像输入所述多尺度卷积神经网络的次数为二;当分辨率级别为高级时,多尺度化处理的尺度值为三层,场景图像输入所述多尺度卷积神经网络的次数为三;
设置多尺度化处理的尺度值即对图像的分割次数,当尺度值为一时即把图像不分割直接输入至第一层卷积网络;当尺度值为二时,分别把图像不分割直接输入第一层卷积网络,并把图像进行M次分割后输入第二层卷积网络;当尺度值为三时,分别把图像不分割直接输入第一层卷积网络,把图像进行M次分割后输入第二层卷积网络,把图像进行N次分割后输入第三层卷积网络,其中M小于N,且M次分割的图像大小大于N次分割的图像大小。
5.根据权利要求4所述的一种基于深度学习的场景识别系统,其特征在于:所述分辨率级别将分辨率范围与图像处理参数进行关联,所述图像处理参数包括图像输入所述多尺度卷积神经网络的次数和多尺度化处理的尺度值L,包括:
所述分辨率范围越低,所述图像处理参数的数值越小;所述分辨率范围越高,所述图像处理参数的数值越大。
6.根据权利要求5所述的一种基于深度学习的场景识别系统,其特征在于:所述设置分辨率级别包括:
根据场景复杂度,设置所述分辨率级别。
CN202010142745.7A 2020-03-04 2020-03-04 一种基于深度学习的场景识别方法和系统 Active CN111382685B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010142745.7A CN111382685B (zh) 2020-03-04 2020-03-04 一种基于深度学习的场景识别方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010142745.7A CN111382685B (zh) 2020-03-04 2020-03-04 一种基于深度学习的场景识别方法和系统

Publications (2)

Publication Number Publication Date
CN111382685A CN111382685A (zh) 2020-07-07
CN111382685B true CN111382685B (zh) 2023-03-28

Family

ID=71218591

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010142745.7A Active CN111382685B (zh) 2020-03-04 2020-03-04 一种基于深度学习的场景识别方法和系统

Country Status (1)

Country Link
CN (1) CN111382685B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113873532B (zh) * 2021-09-02 2024-04-19 中通服咨询设计研究院有限公司 一种智慧园区5g网络规划方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956532B (zh) * 2016-04-25 2019-05-21 大连理工大学 一种基于多尺度卷积神经网络的交通场景分类方法
DE102017127592A1 (de) * 2017-11-22 2019-05-23 Connaught Electronics Ltd. Verfahren zum Klassifizieren von Bildszenen in einem Fahrunterstützungssystem
CN108447062B (zh) * 2018-02-01 2021-04-20 浙江大学 一种基于多尺度混合分割模型的病理切片非常规细胞的分割方法
CN108491856B (zh) * 2018-02-08 2022-02-18 西安电子科技大学 一种基于多尺度特征卷积神经网络的图像场景分类方法
CN109086705B (zh) * 2018-07-23 2021-11-16 北京旷视科技有限公司 图像处理方法、装置、电子设备及储存介质
CN109598269A (zh) * 2018-11-14 2019-04-09 天津大学 一种基于多分辨率输入与金字塔膨胀卷积的语义分割方法
CN109784283B (zh) * 2019-01-21 2021-02-09 陕西师范大学 基于场景识别任务下的遥感图像目标提取方法
CN109872326B (zh) * 2019-01-25 2022-04-05 广西科技大学 基于深度强化网络跳跃连接的轮廓检测方法
CN110415170B (zh) * 2019-06-24 2022-12-16 武汉大学 一种基于多尺度注意力卷积神经网络的图像超分辨率方法
CN110348531B (zh) * 2019-07-17 2022-12-30 沈阳亚视深蓝智能科技有限公司 具有分辨率适应性的深度卷积神经网络构建方法及应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Scene Recognition by Manifold Regularized Deep Learning Architecture";Y.Yuan等;《IEEE Transactions on Neural Networks and Learning Systems》;20151031;第26卷(第10期);第2222-2233页 *
"基于深度卷积神经网络的图像语义分割";马骁;《中国优秀硕士学位论文全文数据库信息科技辑》;20181015(第2018-10期);第I138-797页 *

Also Published As

Publication number Publication date
CN111382685A (zh) 2020-07-07

Similar Documents

Publication Publication Date Title
CN108830855B (zh) 一种基于多尺度低层特征融合的全卷积网络语义分割方法
US10565684B2 (en) Super-resolution method and system, server, user device and method therefor
CN108090472B (zh) 基于多通道一致性特征的行人重识别方法及其系统
CN105808610B (zh) 一种互联网图片过滤方法及装置
CN106548169B (zh) 基于深度神经网络的模糊文字增强方法及装置
US20090254537A1 (en) Image search apparatus and image search method
CN112950780B (zh) 一种基于遥感影像的网络地图智能生成方法及系统
CN111161244B (zh) 基于FCN+FC-WXGBoost的工业产品表面缺陷检测方法
CN112836625A (zh) 人脸活体检测方法、装置、电子设备
CN114820579A (zh) 一种基于语义分割的图像复合缺陷的检测方法及系统
CN111666852A (zh) 一种基于卷积神经网络的微表情双流网络识别方法
CN111652171B (zh) 一种基于双分支网络的面部表情识别模型的构建方法
CN116091946A (zh) 一种基于YOLOv5的无人机航拍图像目标检测方法
CN111382685B (zh) 一种基于深度学习的场景识别方法和系统
CN111401193A (zh) 获取表情识别模型的方法及装置、表情识别方法及装置
CN110751271A (zh) 一种基于深度神经网络的图像溯源特征表征方法
CN113158856B (zh) 一种提取遥感图像中目标区域的处理方法和装置
CN116958729A (zh) 对象分类模型的训练、对象分类方法、装置及存储介质
CN111460901A (zh) 一种基于Wi-Fi信号和迁移学习的活动分类模型构建方法及系统
CN110598716A (zh) 一种人员属性识别方法、装置及系统
CN116012709A (zh) 一种高分辨率遥感影像建筑物提取方法及系统
CN115719428A (zh) 基于分类模型的人脸图像聚类方法、装置、设备及介质
CN115115552A (zh) 图像矫正模型训练及图像矫正方法、装置和计算机设备
CN112990213B (zh) 一种基于深度学习的数字万用表字符识别系统和方法
CN116171462A (zh) 对象序列的识别方法、网络训练方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant