CN113781404A - 基于自监督预训练的道路病害检测方法和系统 - Google Patents
基于自监督预训练的道路病害检测方法和系统 Download PDFInfo
- Publication number
- CN113781404A CN113781404A CN202110956313.4A CN202110956313A CN113781404A CN 113781404 A CN113781404 A CN 113781404A CN 202110956313 A CN202110956313 A CN 202110956313A CN 113781404 A CN113781404 A CN 113781404A
- Authority
- CN
- China
- Prior art keywords
- training
- self
- disease
- supervision
- classifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 64
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 64
- 238000012549 training Methods 0.000 title claims abstract description 58
- 238000001514 detection method Methods 0.000 title claims abstract description 30
- 238000013501 data transformation Methods 0.000 claims abstract description 10
- 238000000034 method Methods 0.000 claims abstract description 9
- 230000009466 transformation Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 2
- 230000006870 function Effects 0.000 description 11
- 238000012795 verification Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
- G06T2207/30132—Masonry; Concrete
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30181—Earth observation
- G06T2207/30184—Infrastructure
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于自监督预训练的道路病害检测方法,其中,方法包括:充分利用所有数据,根据其数据变换的方式形成伪标签,利用伪标签对特征提取器进行预训练,然后将特征提取器参数迁移到有监督模型中,利用带真实标注的病害数据对模型的参数进行更新,最后用于道路病害分类。该方法可以根据不同的场景使用不同的特征提取器和分类器。本发明还包括实施一种基于自监督预训练的道路病害检测方法的系统。本发明将自监督预训练的框架引入到交通道路检测领域,解决了道路病害样本稀缺带来的监督信息不足问题,从而能够提升病害检测准确率。
Description
技术领域
本发明涉及交通病害检测领域,具体涉及一种基于自监督预训练的道路病害检测方法和系统。
背景技术
随着道路交通的高速发展,大量的道路在使用过程中会受到各种自然环境的影响,例如雨雪,高温,冰冻等等影响;同时也存在道路的超载以及未进行定期维护的问题,导致道路经常出现各种病害,例如在路表出现横裂,龟裂。为了保障道路车辆的安全运行以及延长道路的使用寿命,道路病害检测与识别技术起到了十分重要的作用。而基于人工判别的病害检测非常依赖于个人的经验水平,同时无法长时间保持较高的分类准确率,另外也无法做到实时性。
随着目前深度学习的发展,采用基于深度学习算法的自动检测手段最近都开始逐步应用到道路病害检测领域当中。深度学习方法其优异的性能非常依赖于大量带标注的样本进行训练,但在交通领域,由于存在数据采集困难,标注成本较高的问题,使得可用的标记数据少。因此面对交通领域常见的标注数据不足,深度学习模型中的大量参数由于得到不充分的监督信息,非常容易对小样本数据产生的过拟合现象,使在进行病害预测时性能严重下降。
发明内容
本发明针对上述交通小样本带来的监督信息缺乏而导致深度学习模型表现不足的问题,提出的一种基于自监督预训练的道路病害检测方法和系统。
本发明通过设计自监督任务来充分利用所有数据(无论是否带有人工标注),学习所有交通样本本身中更多的有用特征,包括语义信息。再将自监督任务训练的特征提取器参数迁移到有监督模型中,利用带标注的交通数据进行模型的微调,最终可以提高小样本情景下交通病害预测的性能。
本发明所采用的技术方案如下:
基于自监督预训练的道路病害检测方法,包括如下步骤:
1、构造自监督辅助任务:给定所有的样本集合为{X},在一系列的数据变换操作集合中选取Cself种变换,记为{T}。将选取的数据变换操作应用于所有的样本,得到了变换操作后的样本集合{X'},其中X'=Ti(X),i={0,1,2,…,(Cself-1)}。同时将根据变换操作的类型设置样本集合{X'}对应的伪标签{Y'},其中某一个样本对应的伪标签yj'=i,i={0,1,2,…,(Cself-1)};
2、预训练模型:利用步骤1中得到的数据集对给定的特征提取器和分类器进行训练,使用如下的目标函数来更新其中的参数:
其中,F(xj;θ)表示特征提取器,xj为数据变换后的样本,Gself(w)表示使用的分类器,loss()表示损失函数,yj'为样本使用的数据变换方式,即伪标签。
3、参数保存:保存步骤(2)中得到的预训练参数;
4、训练有监督模型:直接加载步骤(3)中保存的参数,对于按照病害类别分类的原始数据集进行特征提取,根据真实病害标注对特征提取器参数进行训练,使用如下的目标函数来更新其中的参数:
5、预测病害:利用上述训练好的模型对病害样本进行分类,通过如下的公式预测病害类别:
可选地,步骤(1)中的数据变换包括但不限于旋转、翻转、裁剪、亮度对比度变换等操作;
可选地,步骤(2)、(4)中,使用的分类器包括但不限于全连接分类器,原型网络分类器和余弦相似度分类器。
可选地,步骤(2)、(4)中,使用的特征提取器是相同的,分类器可以进行更换。
可选地,步骤(2)、(4)中,使用的损失函数包括但不限于交叉熵损失。
可选地,步骤(2)、(4)中,进行梯度反向传播,对特征提取器和分类器中可学习参数进行更新。
可选地,步骤(4)中,在训练结束后如有新的标注样本,能继续进行训练,更新参数。
实施本发明的一种基于自监督预训练的道路病害检测方法的系统,其特征在于:包括依次连接的自监督辅助任务构造模块、模型预训练模块、参数保存模块、有监督模型训练模块、病害预测模块。
本发明的有益效果是,相比使用原始数据集直接训练,本发明提出的基于自监督预训练的道路病害检测方法的系统能够在标注样本缺乏情况下,补充监督信息,从而提升病害检测准确率。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是本发明实施例所提供的基于自监督预训练的道路病害检测方法的流程图。
图2是本发明实施例所提供的基于自监督预训练的道路病害检测方法的总体框架图。
图3是本发明实施例所提供的基于自监督预训练的道路病害检测方法在有监督训练阶段验证数据集上的分类准确率对比折线图。
具体实施方式
下面详细描述本发明的实施案例,所述实施例的示例在附图中示出。参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
图1为根据本发明一个实施例的总体流程图;
如图1所示,该基于自监督预训练的道路病害检测方法包括以下步骤:
S110:对于使用的整个无标注的表观病害数据集,对每个样本分别进行数据变换操作:旋转0°,90°,180°和270°,根据旋转角度不同,形成相应的伪标签,得到分为四类的新数据集。按照比例划分数据集,其中训练集占90%,验证集占10%;
S120:利用S110中得到的新数据集对特征提取器和分类器进行训练,使用全连接层作为分类器,预测验证集样本的旋转角度,根据预测结果,更新参数。分别使用不同的特征提取器,包括但不限于:GoogLeNet,ResNet,DenseNet;
具体来说,以上自监督预训练阶段,包括:
若给定一个特征提取器F(θ),其中θ是该特征提取器参数,则自监督预训练的任务即是训练特征提取器F(θ)来预测样本数据变换的方式。假设经过特征提取后,其使用的分类器记为Gself(w),其中w是该分类器参数。自监督通过优化如下的目标函数来对特征提取器F(θ)进行预训练:
式中,F(xj;θ)表示特征提取器,其中θ为该特征提取器参数,xj为数据变换后的样本,Gself(w)表示使用的分类器,其中w是该分类器参数,loss()表示损失函数,yj'为样本使用的数据变换方式,即伪标签。
S130:保存S120中在验证集上效果最好模型的参数,得到的预训练参数;
S140:对于有病害类别标注的表观病害数据集,将按照比例划分数据集,其中训练集占90%,验证集占10%,同时加载在S130中保存的特征提取器参数,利用训练集上真实的病害标签对特征提取器和分类器参数进行更新,保存其在验证集上效果最好的参数;
S150:分别使用不同的分类器,包括但不限于:原型网络,余弦距离和全连接层,对于S140中得到的参数对于未知样本进行分类,预测其病害类别。
具体来说,以上有监督微调阶段,包括:
将在自监督预训练得到的特征提取器参数θ进行迁移,同时由于自监督分类与有监督分类的类别经常会存在着不同,使用新的分类器Gsup(w)代替原来的分类器Gself(w)。若给定带标记的样本集合为{xL},其对应的真实病害标签为{YL},则有监督训练过该优化如下的目标函数来对特征提取器F(θ)进行微调:
对于给定某输入样本为xj,通过特征提取器F(θ)得到了一个特征向量为:xj=F(xj;θ)∈Rd×1,d为输出维度,表示通过分类器预测出的标签。经过特征提取器提取病害特征后,使用的分类器G(w)包括但不限于以下的分类器:
对于全连接分类器,有:
式中,W∈RC×d表示全连接分类器中的可学习参数,C为需要预测的类别数。
对于原型网络分类器,有:
对于余弦相似度分类器,有:
式中,wi∈W={w0,w1,…,wC}∈RC×d表示余弦相似度分类器中的可学习参数,cos(,)表示余弦相似度。
在设定好特征提取器F(θ)后和分类器G后,可以得到预测的病害类别:
在训练过程中,设定好损失函数后,进行梯度反向传播,对特征提取器和分类器中可学习参数进行更新。例如采用交叉熵作为损失,其具体计算如下:
本发明可以根据不同的场景使用不同的特征提取器和分类器。本发明将自监督预训练的框架引入到交通道路检测领域,解决了道路病害样本稀缺带来的监督信息不足问题,从而能够提升病害检测准确率。
实施本发明的一种基于自监督预训练的道路病害检测方法和系统,包括依次连接的自监督辅助任务构造模块、模型预训练模块、参数保存模块、有监督模型训练模块、病害预测模块,上述5个模块分别对应步骤S110~S150的内容。
以上所述的实施例只是本发明的一种较佳的方案,并非对本发明作任何形式上的限制,在不超出权利要求所记载的技术方案的前提下还有其它的变体及改型。例如使用其他的数据变换方式、特征提取器、分类器、损失函数等等。
Claims (8)
1.一种基于自监督预训练的道路病害检测方法,其特征在于,在进行公路表观病害图像识别过程中,依次含有以下步骤:
步骤(1)、构造自监督辅助任务:给定所有的样本集合为{X},在一系列的数据变换操作集合中选取Cself种变换,记为{T};将选取的数据变换操作应用于所有的样本,得到了变换操作后的样本集合{X'},其中X'=Ti(X),i={0,1,2,…,(Cself-1)};同时将根据变换操作的类型设置样本集合{X'}对应的伪标签{Y'},其中某一个样本对应的伪标签y′j=i,i={0,1,2,…,(Cself-1)};
步骤(2)、预训练模型:利用步骤(1)中得到的数据集对给定的特征提取器和分类器进行训练,使用如下的目标函数来更新其中的参数:
其中,F(xj;θ)表示特征提取器,xj为数据变换后的样本,Gself(w)表示使用的分类器,loss()表示损失函数,y′j为样本使用的数据变换方式,即伪标签;
步骤(3)、参数保存:保存步骤(2)中得到的预训练参数;
步骤(4)、训练有监督模型:直接加载步骤(3)中保存的参数,对于按照病害类别分类的原始数据集进行特征提取,根据真实病害标注对特征提取器参数进行训练,使用如下的目标函数来更新其中的参数:
步骤(5)、预测病害:利用上述训练好的模型对病害样本进行分类,通过如下的公式预测病害类别:
2.根据权利要求1所述的基于自监督预训练的道路病害检测方法,其特征在于,步骤(1)中的数据变换包括旋转、翻转、裁剪、亮度和对比度变换操作。
3.根据权利要求1所述的基于自监督预训练的小样本道路病害检测方法,其特征在于,步骤(2)、步骤(4)中,使用的分类器包括全连接分类器,原型网络分类器和余弦相似度分类器。
4.根据权利要求1所述的基于自监督预训练的小样本道路病害检测方法,其特征在于,步骤(2)、步骤(4)中,使用的特征提取器是相同的。
5.根据权利要求1所述的基于自监督预训练的小样本道路病害检测方法,其特征在于,步骤(2)、步骤(4)中,损失函数使用交叉熵损失。
6.根据权利要求1所述的基于自监督预训练的小样本道路病害检测方法,其特征在于,步骤(2)、步骤(4)中,进行梯度反向传播,对特征提取器和分类器中可学习参数进行更新。
7.根据权利要求1所述的基于自监督预训练的小样本道路病害检测方法,其特征在于,步骤(4)中,在训练结束后如有新的标注样本,能继续进行训练,更新其中的参数。
8.实施如权利要求1所述的一种基于自监督预训练的道路病害检测方法的系统,其特征在于:包括依次连接的自监督辅助任务构造模块、模型预训练模块、参数保存模块、有监督模型训练模块、病害预测模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110956313.4A CN113781404B (zh) | 2021-08-19 | 2021-08-19 | 基于自监督预训练的道路病害检测方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110956313.4A CN113781404B (zh) | 2021-08-19 | 2021-08-19 | 基于自监督预训练的道路病害检测方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113781404A true CN113781404A (zh) | 2021-12-10 |
CN113781404B CN113781404B (zh) | 2023-12-01 |
Family
ID=78838618
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110956313.4A Active CN113781404B (zh) | 2021-08-19 | 2021-08-19 | 基于自监督预训练的道路病害检测方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113781404B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114549473A (zh) * | 2022-02-23 | 2022-05-27 | 中国民用航空总局第二研究所 | 具备自主学习快速适应能力的道面检测方法及系统 |
CN115311844A (zh) * | 2022-06-22 | 2022-11-08 | 东南大学 | 基于自监督学习支持向量机的高速公路交通状态估计方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110309868A (zh) * | 2019-06-24 | 2019-10-08 | 西北工业大学 | 结合无监督学习的高光谱图像分类方法 |
CN112069921A (zh) * | 2020-08-18 | 2020-12-11 | 浙江大学 | 一种基于自监督知识迁移的小样本视觉目标识别方法 |
CN112200245A (zh) * | 2020-10-10 | 2021-01-08 | 深圳市华付信息技术有限公司 | 一种基于半监督的图像分类方法 |
CN112232416A (zh) * | 2020-10-16 | 2021-01-15 | 浙江大学 | 一种基于伪标签加权的半监督学习方法 |
US20210241041A1 (en) * | 2020-01-31 | 2021-08-05 | Element Ai Inc. | Method of and system for joint data augmentation and classification learning |
-
2021
- 2021-08-19 CN CN202110956313.4A patent/CN113781404B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110309868A (zh) * | 2019-06-24 | 2019-10-08 | 西北工业大学 | 结合无监督学习的高光谱图像分类方法 |
US20210241041A1 (en) * | 2020-01-31 | 2021-08-05 | Element Ai Inc. | Method of and system for joint data augmentation and classification learning |
CN112069921A (zh) * | 2020-08-18 | 2020-12-11 | 浙江大学 | 一种基于自监督知识迁移的小样本视觉目标识别方法 |
CN112200245A (zh) * | 2020-10-10 | 2021-01-08 | 深圳市华付信息技术有限公司 | 一种基于半监督的图像分类方法 |
CN112232416A (zh) * | 2020-10-16 | 2021-01-15 | 浙江大学 | 一种基于伪标签加权的半监督学习方法 |
Non-Patent Citations (1)
Title |
---|
杨灿;: "一种结合GAN和伪标签的深度半监督模型研究", 中国科技信息, no. 17, pages 79 - 83 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114549473A (zh) * | 2022-02-23 | 2022-05-27 | 中国民用航空总局第二研究所 | 具备自主学习快速适应能力的道面检测方法及系统 |
CN114549473B (zh) * | 2022-02-23 | 2024-04-19 | 中国民用航空总局第二研究所 | 具备自主学习快速适应能力的道面检测方法及系统 |
CN115311844A (zh) * | 2022-06-22 | 2022-11-08 | 东南大学 | 基于自监督学习支持向量机的高速公路交通状态估计方法 |
CN115311844B (zh) * | 2022-06-22 | 2023-05-16 | 东南大学 | 基于自监督学习支持向量机的高速公路交通状态估计方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113781404B (zh) | 2023-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109657584B (zh) | 辅助驾驶的改进LeNet-5融合网络交通标志识别方法 | |
CN111652293B (zh) | 一种多任务联合判别学习的车辆重识别方法 | |
CN110717526A (zh) | 一种基于图卷积网络的无监督迁移学习方法 | |
Huo et al. | Vehicle type classification and attribute prediction using multi-task RCNN | |
CN113781404A (zh) | 基于自监督预训练的道路病害检测方法和系统 | |
CN112131961A (zh) | 一种基于单样本的半监督行人重识别方法 | |
Saleh et al. | Traffic signs recognition and distance estimation using a monocular camera | |
CN113327248B (zh) | 一种基于视频的隧道车流量统计方法 | |
CN117152503A (zh) | 一种基于伪标签不确定性感知的遥感图像跨域小样本分类方法 | |
Zhang et al. | An open set domain adaptation network based on adversarial learning for remote sensing image scene classification | |
CN116910571B (zh) | 一种基于原型对比学习的开集域适应方法及系统 | |
Huang et al. | A weakly supervised method for mud detection in ores based on deep active learning | |
CN110378384B (zh) | 一种结合特权信息和排序支持向量机的图像分类方法 | |
CN117349786A (zh) | 基于数据均衡的证据融合变压器故障诊断方法 | |
CN111832463A (zh) | 一种基于深度学习的交通标志检测方法 | |
CN114792114B (zh) | 一种基于黑盒多源域通用场景下的无监督域适应方法 | |
CN116229510A (zh) | 一种无监督跨模态行人重识别方法 | |
CN116229512A (zh) | 基于跨摄像头自蒸馏的行人重识别模型建立方法及其应用 | |
US20230084761A1 (en) | Automated identification of training data candidates for perception systems | |
Nasehi et al. | Vehicle Type, Color and Speed Detection Implementation by Integrating VGG Neural Network and YOLO algorithm utilizing Raspberry Pi Hardware | |
CN114510610A (zh) | 面向多模态知识图谱构建的识别视觉概念的方法 | |
Liu et al. | Multi-view moving objects classification via transfer learning | |
CN111144454A (zh) | 一种基于图像标记特定特征的延迟多标记学习方法 | |
Egbueze et al. | Weather Recognition Based on Still Images Using Deep Learning Neural Network with Resnet-15 | |
Liang et al. | A comparative study of vision-based road surface classification methods for dataset from different cities |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |