CN107977677A - 一种应用于大规模城区重建中的多标签像素分类方法 - Google Patents

一种应用于大规模城区重建中的多标签像素分类方法 Download PDF

Info

Publication number
CN107977677A
CN107977677A CN201711205176.0A CN201711205176A CN107977677A CN 107977677 A CN107977677 A CN 107977677A CN 201711205176 A CN201711205176 A CN 201711205176A CN 107977677 A CN107977677 A CN 107977677A
Authority
CN
China
Prior art keywords
mrow
pixel
size
label
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201711205176.0A
Other languages
English (en)
Inventor
夏春秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Vision Technology Co Ltd
Original Assignee
Shenzhen Vision Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Vision Technology Co Ltd filed Critical Shenzhen Vision Technology Co Ltd
Priority to CN201711205176.0A priority Critical patent/CN107977677A/zh
Publication of CN107977677A publication Critical patent/CN107977677A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes

Abstract

本发明中提出的一种应用于大规模城区重建中的多标签像素分类方法,其主要内容包括:数据集、网络结构、训练方法,其过程为,首先使用数据集进行对应特征图的生成,再构建一个基于卷积神经网络的有监督的深度学习框架,对输入的图像进行标签归类以及特征提取,然后再将提取到的特征输入到线性分类器支持向量机中进行多分类任务,从而区分出待分类像素的从属关系。本发明可以处理高清图像中除了边界像素以外的每个像素点的分类,提供一个在训练过程中保持图像尺度不变的方法,同时提高了在大规模城区地表图中进行物体分类的精确率。

Description

一种应用于大规模城区重建中的多标签像素分类方法
技术领域
本发明涉及物体分类领域,尤其是涉及了一种应用于大规模城区重建中的多标签像素分类方法。
背景技术
物体分类是计算机视觉中的一个重要研究课题,近年来得到了广泛的关注,其发展可包括安防领域的人脸识别、行人检测、智能视频分析、行人跟踪等,交通领域的交通场景物体识别、车辆计数、逆行检测、车牌检测等与个体生活息息相关的方面,同时,在大尺寸大规模图像的分类任务中,例如测绘领域中的海洋测绘、森林测绘等也具有重要应用。如今,在经济发展的作用下,城镇化、城区一体化建设频率正在加快,因此在大规模的城区重建中,如果能成功自动识别物体并归类,将大大加快假设效率并减少人力物力的虚耗。
在像素级别的物体分类与检测是视觉研究中的常见问题,也是一个非常具有挑战性的问题。由于任务中涉及的实际操作如尺度、光照、视角和形变遮挡;类别操作如类内差异、类间模糊等复杂的时空关系,给小颗粒像素的分类带来困难。特别在语义层次,计算机的算法在学习人类对待同一类事物中使用不同的表达方法这一过程,仍然显得能力不足,因此整体上看,像素级别的物体分类与检测仍然是处于较为困难的研究领域。
本发明提出了一种基于有监督的深度学习网络进行特征提取的新框架,先使用数据集进行对应特征图的生成,再构建一个基于卷积神经网络的有监督的深度学习框架,对输入的图像进行标签归类以及特征提取,然后再将提取到的特征输入到线性分类器支持向量机中进行多分类任务,从而区分出待分类像素的从属关系。本发明可以处理高清图像中除了边界像素以外的每个像素点的分类,提供一个在训练过程中保持图像尺度不变的方法,同时提高了在大规模城区地表图中进行物体分类的精确率。
发明内容
针对解决在大规模图像中进行像素级别分类的问题,本发明的目的在于提供一种应用于大规模城区重建中的多标签像素分类方法,先使用数据集进行对应特征图的生成,再构建一个基于卷积神经网络的有监督的深度学习框架,对输入的图像进行标签归类以及特征提取,然后再将提取到的特征输入到线性分类器支持向量机中进行多分类任务,从而区分出待分类像素的从属关系。
为解决上述问题,本发明提供一种应用于大规模城区重建中的多标签像素分类方法,其主要内容包括:
(一)数据集;
(二)网络结构;
(三)训练方法。
其中,所述的数据集,使用分辨率大于或等于6000×6000的图像作为训练与测试图像,每张图像分别有三个对应的特征图:深度图、标签图以及彩色图像;每张图像中的每个像素会被分成以下6个类别的其中一个:建筑物、树木、道路、自然地表、人造地表和汽车,其中人造地表涵括了所有既不属于道路又同时覆盖有某种材料的区域。
所述的网络结构,使用一个总共具有13层的卷积神经网络以及一个线性分类器(支持向量机)构建深度神经网络,其中包括:网络初始化、卷积模块设置和网络输出三部分。
所述的网络初始化,包括网络输入的尺寸设定和网络滤窗的大小设定,具体为:
1)将输入源图像分割成连续不重叠的块(大小为N×N),本方法中N=100;
2)卷积核大小设置为k,本方法中k=5。
所述的卷积模块设置,使用不同的功能层对图像或中间数据进行处理并得到中间结果,具体为:
1)输入层:尺寸为[100×100];
2)卷积层:卷积核大小为5×5,特征图个数为6,得到中间结果尺寸为[96×96];
3)池化层:均值核大小为3×3,得到中间结果尺寸为[48×48];
4)卷积层:卷积核大小为5×5,特征图个数为12,得到中间结果尺寸为[44×44];
5)池化层:极值核大小为3×3,得到中间结果尺寸为[21×21];
6)合并层:将5)得到的12个尺寸为21×21的特征图横向连接成为向量,尺寸为[1×5292];
7)全连接层:共2层,各层神经元的个数分别为120和6;
8)激活函数:在2)和4)这两个卷积层后,都是用非线性激活函数进行值域的映射;
综上,卷积模块的设置如公式(1)所示:
其中,p表示一个像素点,Φp表示是与六个标签相对应的值的六元组,X表示网络输入,Ψ表示卷积网络操作,Γ(·)表示全连接层操作,∏max和∏avg分别表示最大值池化和均值池化操作,ReLU(·)表示非线性激活函数。
所述的网络输出,对于输入中的每个像素p,其对应的输出6元数组定义为:
同时,定义一个正态概率分布6元数组:
其中,每个独立的∧取值范围为[0,1];
每个像素都会产生5个集合的正态概率分布6元数组再与该像素所属图像所对应的原始标签特征图(分辨率都为6000×6000)输入到支持向量机中进行训练,学习映射函数,最终得到6种分类结果。
所述的训练方法,包括参数设置、标签优化和评价标准。
所述的参数设置,对数据集进行训练、测试两部分集合的划分,其二者比例为4比1;训练迭代回合数设置为300;总共训练的总样本数为400000;支持向量机的训练策略为“一对多”。
所述的标签优化,在分类中对于出现的结果,进行相应标签的回归,从而寻找最优的标签f(p),基于此,提出一个能量函数,通过最小化该能量函数来寻找:
E(f)=Eunary(f)+Epairwise(f) (4)
其中,Eunary(f)估量某像素的结果标签f(pi)与原始标签lpi的兼容程度:
其中,Epairwise(f)估量某像素的结果标签pi和近邻像素的结果标签pj的兼容程度:
该能量函数通过分步求导的方法得到最小值。
所述的评价标准,设立三个指标进行标签分类结果的评价,分别为精确率P、召回率R和F1分数,具体为:
其中,tp是指真阳性,fp是指假阳性,fn是指假阴性。
附图说明
图1是本发明一种应用于大规模城区重建中的多标签像素分类方法的系统框架图。
图2是本发明一种应用于大规模城区重建中的多标签像素分类方法的网络结构图。
图3是本发明一种应用于大规模城区重建中的多标签像素分类方法的分类示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本发明作进一步详细说明。
图1是本发明一种应用于大规模城区重建中的多标签像素分类方法的系统框架图。主要包括数据集;网络结构;训练方法。
其中,数据集,使用分辨率大于或等于6000×6000的图像作为训练与测试图像,每张图像分别有三个对应的特征图:深度图、标签图以及彩色图像;每张图像中的每个像素会被分成以下6个类别的其中一个:建筑物、树木、道路、自然地表、人造地表和汽车,其中人造地表涵括了所有既不属于道路又同时覆盖有某种材料的区域。
网络结构,使用一个总共具有13层的卷积神经网络以及一个线性分类器(支持向量机)构建深度神经网络,其中包括:网络初始化、卷积模块设置和网络输出三部分。
网络初始化,包括网络输入的尺寸设定和网络滤窗的大小设定,具体为:
1)将输入源图像分割成连续不重叠的块(大小为N×N),本方法中N=100;
2)卷积核大小设置为k,本方法中k=5。
卷积模块设置,使用不同的功能层对图像或中间数据进行处理并得到中间结果,具体为:
1)输入层:尺寸为[100×100];
2)卷积层:卷积核大小为5×5,特征图个数为6,得到中间结果尺寸为[96×96];
3)池化层:均值核大小为3×3,得到中间结果尺寸为[48×48];
4)卷积层:卷积核大小为5×5,特征图个数为12,得到中间结果尺寸为[44×44];
5)池化层:极值核大小为3×3,得到中间结果尺寸为[21×21];
6)合并层:将5)得到的12个尺寸为21×21的特征图横向连接成为向量,尺寸为[1×5292];
7)全连接层:共2层,各层神经元的个数分别为120和6;
8)激活函数:在2)和4)这两个卷积层后,都是用非线性激活函数进行值域的映射;
综上,卷积模块的设置如公式(1)所示:
其中,p表示一个像素点,Φp表示是与六个标签相对应的值的六元组,X表示网络输入,Ψ表示卷积网络操作,Γ(·)表示全连接层操作,∏max和∏avg分别表示最大值池化和均值池化操作,ReLU(·)表示非线性激活函数。
网络输出,对于输入中的每个像素p,其对应的输出6元数组定义为:
同时,定义一个正态概率分布6元数组:
其中,每个独立的∧取值范围为[0,1];
每个像素都会产生5个集合的正态概率分布6元数组再与该像素所属图像所对应的原始标签特征图(分辨率都为6000×6000)输入到支持向量机中进行训练,学习映射函数,最终得到6种分类结果。
训练方法,包括参数设置、标签优化和评价标准。
参数设置,对数据集进行训练、测试两部分集合的划分,其二者比例为4比1;训练迭代回合数设置为300;总共训练的总样本数为400000;支持向量机的训练策略为“一对多”。
标签优化,在分类中对于出现的结果,进行相应标签的回归,从而寻找最优的标签f(p),基于此,提出一个能量函数,通过最小化该能量函数来寻找:
E(f)=Eunary(f)+Epairwise(f) (4)
其中,Eunary(f)估量某像素的结果标签f(pi)与原始标签lpi的兼容程度:
其中,Epairwise(f)估量某像素的结果标签pi和近邻像素的结果标签pj的兼容程度:
该能量函数通过分步求导的方法得到最小值。
评价标准,设立三个指标进行标签分类结果的评价,分别为精确率P、召回率R和F1分数,具体为:
其中,tp是指真阳性,fp是指假阳性,fn是指假阴性。
图2是本发明本发明一种应用于大规模城区重建中的多标签像素分类方法的网络结构图,如图所示,通过组合输入层、卷积层、池化层、全连接层和输出层,该网络结构实现对输入图像的像素点进行从属关系的区分与归类。
图3是本发明本发明一种应用于大规模城区重建中的多标签像素分类方法的分类示意图。如图所示,通过对图像进行缩放后得到的样本图像进行本发明方法的训练后,在图上标记出该区域所从属的6类之中的一类,该方法对自主规划路线等具有便捷、准确的优势。
对于本领域技术人员,本发明不限制于上述实施例的细节,在不背离本发明的精神和范围的情况下,能够以其他具体形式实现本发明。此外,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围,这些改进和变型也应视为本发明的保护范围。因此,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

Claims (10)

1.一种应用于大规模城区重建中的多标签像素分类方法,其特征在于,主要包括数据集(一);网络结构(二);训练方法(三)。
2.基于权利要求书1所述的数据集(一),其特征在于,使用分辨率大于或等于6000×6000的图像作为训练与测试图像,每张图像分别有三个对应的特征图:深度图、标签图以及彩色图像;每张图像中的每个像素会被分成以下6个类别的其中一个:建筑物、树木、道路、自然地表、人造地表和汽车,其中人造地表涵括了所有既不属于道路又同时覆盖有某种材料的区域。
3.基于权利要求书2所述的网络结构(二),其特征在于,使用一个总共具有13层的卷积神经网络以及一个线性分类器(支持向量机)构建深度神经网络,其中包括:网络初始化、卷积模块设置和网络输出三部分。
4.基于权利要求书3所述的网络初始化,其特征在于,包括网络输入的尺寸设定和网络滤窗的大小设定,具体为:
1)将输入源图像分割成连续不重叠的块(大小为N×N),本方法中N=100;
2)卷积核大小设置为k,本方法中k=5。
5.基于权利要求书3所述的卷积模块设置,其特征在于,使用不同的功能层对图像或中间数据进行处理并得到中间结果,具体为:
1)输入层:尺寸为[100×100];
2)卷积层:卷积核大小为5×5,特征图个数为6,得到中间结果尺寸为[96×96];
3)池化层:均值核大小为3×3,得到中间结果尺寸为[48×48];
4)卷积层:卷积核大小为5×5,特征图个数为12,得到中间结果尺寸为[44×44];
5)池化层:极值核大小为3×3,得到中间结果尺寸为[21×21];
6)合并层:将5)得到的12个尺寸为21×21的特征图横向连接成为向量,尺寸为
[1×5292];
7)全连接层:共2层,各层神经元的个数分别为120和6;
8)激活函数:在2)和4)这两个卷积层后,都是用非线性激活函数进行值域的映射;
综上,卷积模块的设置如公式(1)所示:
其中,p表示一个像素点,Φp表示是与六个标签相对应的值的六元组,X表示网络输入,Ψ表示卷积网络操作,Γ(·)表示全连接层操作,Πmax和Πavg分别表示最大值池化和均值池化操作,ReLU(·)表示非线性激活函数。
6.基于权利要求书3所述的网络输出,其特征在于,对于输入中的每个像素p,其对应的输出6元数组定义为:
<mrow> <msup> <mi>&amp;Phi;</mi> <mi>p</mi> </msup> <mo>=</mo> <mrow> <mo>(</mo> <msubsup> <mi>&amp;phi;</mi> <mn>1</mn> <mi>p</mi> </msubsup> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msubsup> <mi>&amp;phi;</mi> <mn>6</mn> <mi>p</mi> </msubsup> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>
同时,定义一个正态概率分布6元数组:
其中,每个独立的∧取值范围为[0,1];
每个像素都会产生5个集合的正态概率分布6元数组再与该像素所属图像所对应的原始标签特征图(分辨率都为6000×6000)输入到支持向量机中进行训练,学习映射函数,最终得到6种分类结果。
7.基于权利要求书1所述的训练方法(三),其特征在于,包括参数设置、标签优化和评价标准。
8.基于权利要求书7所述的参数设置,其特征在于,对数据集进行训练、测试两部分集合的划分,其二者比例为4比1;训练迭代回合数设置为300;总共训练的总样本数为400000;支持向量机的训练策略为“一对多”。
9.基于权利要求书7所述的标签优化,其特征在于,在分类中对于出现的结果,进行相应标签的回归,从而寻找最优的标签f(p),基于此,提出一个能量函数,通过最小化该能量函数来寻找:
E(f)=Eunary(f)+Epairwise(f) (4)
其中,Eunary(f)估量某像素的结果标签f(pi)与原始标签的兼容程度:
其中,Epairwise(f)估量某像素的结果标签pj和近邻像素的结果标签pj的兼容程度:
该能量函数通过分步求导的方法得到最小值。
10.基于权利要求书7所述的评价标准,其特征在于,设立三个指标进行标签分类结果的评价,分别为精确率P、召回率R和F1分数,具体为:
<mrow> <mi>P</mi> <mo>=</mo> <mfrac> <mrow> <mi>t</mi> <mi>p</mi> </mrow> <mrow> <mi>t</mi> <mi>p</mi> <mo>+</mo> <mi>f</mi> <mi>p</mi> </mrow> </mfrac> <mo>,</mo> <mi>R</mi> <mo>=</mo> <mfrac> <mrow> <mi>t</mi> <mi>p</mi> </mrow> <mrow> <mi>t</mi> <mi>p</mi> <mo>+</mo> <mi>f</mi> <mi>n</mi> </mrow> </mfrac> <mo>,</mo> <mi>F</mi> <mn>1</mn> <mo>=</mo> <mn>2</mn> <mo>&amp;times;</mo> <mfrac> <mrow> <mi>P</mi> <mo>&amp;times;</mo> <mi>R</mi> </mrow> <mrow> <mi>P</mi> <mo>+</mo> <mi>R</mi> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>
其中,tp是指真阳性,fp是指假阳性,fn是指假阴性。
CN201711205176.0A 2017-11-27 2017-11-27 一种应用于大规模城区重建中的多标签像素分类方法 Withdrawn CN107977677A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711205176.0A CN107977677A (zh) 2017-11-27 2017-11-27 一种应用于大规模城区重建中的多标签像素分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711205176.0A CN107977677A (zh) 2017-11-27 2017-11-27 一种应用于大规模城区重建中的多标签像素分类方法

Publications (1)

Publication Number Publication Date
CN107977677A true CN107977677A (zh) 2018-05-01

Family

ID=62011893

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711205176.0A Withdrawn CN107977677A (zh) 2017-11-27 2017-11-27 一种应用于大规模城区重建中的多标签像素分类方法

Country Status (1)

Country Link
CN (1) CN107977677A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109102018A (zh) * 2018-08-10 2018-12-28 深圳市瑞图生物技术有限公司 妇科分泌物图像的多标签分类方法
CN109116312A (zh) * 2018-07-20 2019-01-01 电子科技大学 基于qmfb与卷积神经网络的雷达信号分类方法
CN109816009A (zh) * 2019-01-18 2019-05-28 南京旷云科技有限公司 基于图卷积的多标签图像分类方法、装置及设备
CN110188606A (zh) * 2019-04-23 2019-08-30 合刃科技(深圳)有限公司 基于高光谱成像的车道识别方法、装置及电子设备
CN110287317A (zh) * 2019-06-06 2019-09-27 昆明理工大学 一种基于cnn-dbn的层次多标签医疗问题分类方法
CN110348404A (zh) * 2019-07-16 2019-10-18 湖南人文科技学院 一种农村道路景观视觉评价分析方法
CN111723227A (zh) * 2020-06-14 2020-09-29 黄雨勤 基于人工智能和互联网的数据分析方法及云计算服务平台
CN111723226A (zh) * 2020-06-14 2020-09-29 黄雨勤 基于大数据和互联网的信息管理方法及人工智能云服务器
CN112308115A (zh) * 2020-09-25 2021-02-02 安徽工业大学 一种多标签图像深度学习分类方法及设备
CN114913475A (zh) * 2022-04-16 2022-08-16 北京网汇智城科技有限公司 基于gis和机器视觉的城市网格化管理方法及系统
CN116594627A (zh) * 2023-05-18 2023-08-15 湖北大学 一种基于多标签学习的群体软件开发中服务匹配方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106203283A (zh) * 2016-06-30 2016-12-07 重庆理工大学 基于三维卷积深度神经网络和深度视频的动作识别方法
CN107292256A (zh) * 2017-06-14 2017-10-24 西安电子科技大学 基于辅任务的深度卷积小波神经网络表情识别方法
CN107316004A (zh) * 2017-06-06 2017-11-03 西北工业大学 基于深度学习的空间目标识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106203283A (zh) * 2016-06-30 2016-12-07 重庆理工大学 基于三维卷积深度神经网络和深度视频的动作识别方法
CN107316004A (zh) * 2017-06-06 2017-11-03 西北工业大学 基于深度学习的空间目标识别方法
CN107292256A (zh) * 2017-06-14 2017-10-24 西安电子科技大学 基于辅任务的深度卷积小波神经网络表情识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YUANLIE HE ET AL.: "Multi-label Pixelwise Classification for Reconstruction of Large-scale Urban Areas", 《ARXIV》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109116312A (zh) * 2018-07-20 2019-01-01 电子科技大学 基于qmfb与卷积神经网络的雷达信号分类方法
CN109102018B (zh) * 2018-08-10 2019-11-29 深圳大学 妇科分泌物图像的多标签分类方法
CN109102018A (zh) * 2018-08-10 2018-12-28 深圳市瑞图生物技术有限公司 妇科分泌物图像的多标签分类方法
CN109816009A (zh) * 2019-01-18 2019-05-28 南京旷云科技有限公司 基于图卷积的多标签图像分类方法、装置及设备
CN110188606A (zh) * 2019-04-23 2019-08-30 合刃科技(深圳)有限公司 基于高光谱成像的车道识别方法、装置及电子设备
CN110287317A (zh) * 2019-06-06 2019-09-27 昆明理工大学 一种基于cnn-dbn的层次多标签医疗问题分类方法
CN110348404A (zh) * 2019-07-16 2019-10-18 湖南人文科技学院 一种农村道路景观视觉评价分析方法
CN110348404B (zh) * 2019-07-16 2023-05-02 湖州学院 一种农村道路景观视觉评价分析方法
CN111723227A (zh) * 2020-06-14 2020-09-29 黄雨勤 基于人工智能和互联网的数据分析方法及云计算服务平台
CN111723226A (zh) * 2020-06-14 2020-09-29 黄雨勤 基于大数据和互联网的信息管理方法及人工智能云服务器
CN112308115A (zh) * 2020-09-25 2021-02-02 安徽工业大学 一种多标签图像深度学习分类方法及设备
CN112308115B (zh) * 2020-09-25 2023-05-26 安徽工业大学 一种多标签图像深度学习分类方法及设备
CN114913475A (zh) * 2022-04-16 2022-08-16 北京网汇智城科技有限公司 基于gis和机器视觉的城市网格化管理方法及系统
CN116594627A (zh) * 2023-05-18 2023-08-15 湖北大学 一种基于多标签学习的群体软件开发中服务匹配方法
CN116594627B (zh) * 2023-05-18 2023-12-12 湖北大学 一种基于多标签学习的群体软件开发中服务匹配方法

Similar Documents

Publication Publication Date Title
CN107977677A (zh) 一种应用于大规模城区重建中的多标签像素分类方法
Huang et al. Urban land-use mapping using a deep convolutional neural network with high spatial resolution multispectral remote sensing imagery
Fan et al. Research on black spot identification of safety in urban traffic accidents based on machine learning method
CN108985194B (zh) 一种基于图像语义分割的智能车辆可行驶区域的识别方法
Chen et al. Deep integration: A multi-label architecture for road scene recognition
CN108537117B (zh) 一种基于深度学习的乘客检测方法和系统
CN104809187B (zh) 一种基于rgb‑d数据的室内场景语义标注方法
CN110210635A (zh) 一种能识别废弃物的智能分类回收系统
CN101944174B (zh) 车牌字符的识别方法
CN108830188A (zh) 基于深度学习的车辆检测方法
CN109800736A (zh) 一种基于遥感影像和深度学习的道路提取方法
CN108764228A (zh) 一种图像中文字目标检测方法
CN111259936B (zh) 一种基于单一像素标注的图像语义分割方法及系统
CN106250812A (zh) 一种基于快速r‑cnn深度神经网络的车型识别方法
CN109145900A (zh) 一种基于深度学习的车牌识别方法
CN109740603A (zh) 基于cnn卷积神经网络下的车辆字符识别方法
CN106127749A (zh) 基于视觉注意机制的目标零件识别方法
CN107169556A (zh) 基于深度学习的干细胞自动计数方法
CN105740906A (zh) 一种基于深度学习的车辆多属性联合分析方法
CN109977994A (zh) 一种基于多示例主动学习的代表性图像选取方法
CN109871789A (zh) 一种基于轻量化神经网络的复杂环境下车辆检测方法
CN107506765A (zh) 一种基于神经网络的车牌倾斜校正的方法
CN107545571A (zh) 一种图像检测方法及装置
CN112861931B (zh) 一种基于差异注意力神经网络的多级别变化检测方法、系统、介质及电子设备
CN109492596A (zh) 一种基于K-means聚类和区域推荐网络的行人检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20180501

WW01 Invention patent application withdrawn after publication