CN110414620A - 一种语义分割模型训练方法、计算机设备及存储介质 - Google Patents

一种语义分割模型训练方法、计算机设备及存储介质 Download PDF

Info

Publication number
CN110414620A
CN110414620A CN201910719475.9A CN201910719475A CN110414620A CN 110414620 A CN110414620 A CN 110414620A CN 201910719475 A CN201910719475 A CN 201910719475A CN 110414620 A CN110414620 A CN 110414620A
Authority
CN
China
Prior art keywords
training
storage medium
cycle
semantic segmentation
computer equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910719475.9A
Other languages
English (en)
Other versions
CN110414620B (zh
Inventor
周联昱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen University
Original Assignee
Xiamen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen University filed Critical Xiamen University
Priority to CN201910719475.9A priority Critical patent/CN110414620B/zh
Publication of CN110414620A publication Critical patent/CN110414620A/zh
Application granted granted Critical
Publication of CN110414620B publication Critical patent/CN110414620B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种语义分割模型训练方法,其损失函数为:式中,P为预测向量,T为one‑hot编码的标签向量;a及b为权重,a随着训练周期的增加而增大,b随着训练周期的增加而减小,且a+b=1;α为调节因子,其取值范围位于本发明定义了一种函数,并将其与Dice系数结合,获得新的损失函数,其不易在反向传播过程中出现梯度爆炸或消失的问题,同时,又对单个像素点分类是否正确敏感,对整体分类是否正确敏感,避免了单独使用Dice系数作损失函数时出现的梯度不稳定,又能防止类别不均衡问题。

Description

一种语义分割模型训练方法、计算机设备及存储介质
技术领域
本发明涉及图像处理领域,尤其涉及一种语义分割模型训练方法、计算机设备及存储介质。
背景技术
在深度学习语义分割任务中,Dice系数是一种常用的评估分割结果的度量方法。其衍生的损失函数Dice_loss直接以优化交并比为目标,不易受到类比不平衡的影响,在网络训练中广为运用。但Dice_loss在网络训练中有时存在梯度变化剧烈,导致网络训练不稳定的现象,因此,本申请对其出现原因进行分析,以提出改进方案。
对于二分类任务,记预测向量为P,one-hot编码的标签向量为T,Dice_loss可表述为如下形式:
反向传播过程中,损失函数L对Pu导数为:
对于Tuv,正样本值为1,负样本值为0,于是:
从上式可以发现,对于输出层任意元素Puv,若其标签相同,则损失函数对其的导数相同,且数值主要取决网络整体预测情况,而不取决于Pu与Tu是否吻合。但在网络训练的开始阶段,大多数预测值都是不准确的,于是在更新网络权重时常常发生较大的变化,导致变化较大。如果中间层的卷积核初始值过大,反向传播过程中就会放大这种变化,造成网络训练不稳定,曲线波动严重。
发明内容
本发明的目的在于提供一种语义分割模型训练方法、计算机设备及存储介质,以解决现有技术中使用Dice_loss导致的网络训练不稳定问题。
根据本发明的一个方面,本发明提高了一种语义分割模型训练方法,其损失函数为:
式中,P为预测向量,T为one-hot编码的标签向量;a及b为权重,a随着训练周期的增加而增大,b随着训练周期的增加而减小,且a+b=1;α为调节因子,其取值范围位于
优选地,式中,S为当前训练周期,E为网络总训练周期,则损失函数变为
根据本发明的又一方面,本发明提供了一种计算机设备,包括处理器及存储介质,所述存储介质中存储有计算机可读指令,所述计算机可读指令被配置为由所述处理器执行时,使所述处理器执行如前述的方法。
根据本发明的又一方面,本发明提供了一种存储介质,其存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如前述的方法。
采用上述技术方案后,本发明与背景技术相比,具有如下优点:本发明定义了一种函数,并将其与Dice系数结合,获得新的损失函数,其不易在反向传播过程中出现梯度爆炸或消失的问题,同时,又对单个像素点分类是否正确敏感,对整体分类是否正确敏感,避免了单独使用Dice系数作损失函数时出现的梯度不稳定,又能防止类别不均衡问题。
附图说明
图1为本发明实施例提供的语义分割的模型训练流程图。
图2为本发明实施例提供的计算机设备的基本结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
如图1所示的是语义分割的模型训练流程图。模型的参数可以用来计算预测值和目标值之间的偏差程度,基于这些参数就可以构成损失函数。本发明主要在训练分割模型中(即S2中),定义并优化损失函数,更新模型参数,最终使模型收敛。
定义Rb×Rn→R上的函数其中α称为调节因子,其取值范围位于可以证明(Rn,D)构成距离空间,并用于反向传播算法。
首先,证明函数D(P,T)是Rn上的距离:
显然,对存在D(P,T)=D(T,P),D(P,T)≥0,且仅当P=T时取得等号。
接着,证明对均存在D(P,T)≤D(P,Z)+D(Z,T)。
注意到D(P,T)后一部分符合高斯核函数定义则对存在φ:χ→H使得K(X,Y)=φ(X)Tφ(Y),
于是,
同理:
向量的二范数满足:
||φ(P)-φ(T)||2≤||φ(P)-φ(Z)||2+||φ(Z)-φ(T)||2
所以,证得:
D(P,T)≤D(P,Z)+D(Z,T)。
根据以上的分析,可以用于度量预测向量P与标签向量T之间的差异。
最后,论证作为损失函数用于反向传播的可行性。
将D对Pu求偏导,则有:
上式中,2α,(Pu-Tu)及的取值范围都位于[0,1],不易在反向传播过程中出现梯度爆炸或消失的问题。项(Pu-Tu)使梯度对单个像素点分类是否正确敏感,加速网络对每个像素点预测值的训练,避免了梯度不稳定问题。而项又使其对整体分类是否正确敏感,克服类别不平衡问题。
因此,本发明在语义分割模型中结合D(P,T)函数与Dice系数,在网络训练初始阶段,Dice_loss具有梯度不稳定的特定,此时减少其训练权重,以函数D(P,T)函数指导整个网络训练,加快收敛速度并获得稳定的损失函数曲线。随着迭代次数的增加,Dice_loss的梯度趋于稳定,逐步增加其权重,则损失函数为:
式中,P为预测向量,T为one-hot编码的标签向量;a及b为权重,a随着训练周期的增加而增大,b随着训练周期的增加而减小,且a+b=1;α为调节因子,其取值范围位于
更优选地,本实施例中,式中,S为当前训练周期,E为网络总训练周期,则最终的损失函数变为
如图2所示,本发明还提供了一种计算机设备,其包括通过系统总线连接的处理器、存储介质和网络接口。其中,所述存储介质为非易失性存储介质、其存储有操作系统及计算机可读指令。所述处理器用于提供计算和控制能力,支撑整个计算机设备的运行。所述网络接口用于与终端连接通信。当所述计算机可读指令被配置为处理器执行时,可使得处理器实现一种语义分割模型的训练方法。
本领域技术人员可以理解,图2中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本发明还提供了一种存储介质,其存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如前述的方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (4)

1.一种语义分割模型训练方法,其特征在于,其损失函数为:
式中,P为预测向量,T为one-hot编码的标签向量;a及b为权重,a随着训练周期的增加而增大,b随着训练周期的增加而减小,且a+b=1;α为调节因子,其取值范围位于
2.如权利要求1所述的一种语义分割模型训练方法,其特征在于: 式中,S为当前训练周期,E为网络总训练周期,则损失函数为
3.一种计算机设备,包括处理器及存储介质,其特征在于:所述存储介质中存储有计算机可读指令,所述计算机可读指令被配置为由所述处理器执行时,使所述处理器执行如权利要求1-2任意一项所述的方法。
4.一种存储介质,存储有计算机设备可读指令,其特征在于:所述计算机设备可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1-2任意一项所述的方法。
CN201910719475.9A 2019-08-06 2019-08-06 一种语义分割模型训练方法、计算机设备及存储介质 Active CN110414620B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910719475.9A CN110414620B (zh) 2019-08-06 2019-08-06 一种语义分割模型训练方法、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910719475.9A CN110414620B (zh) 2019-08-06 2019-08-06 一种语义分割模型训练方法、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN110414620A true CN110414620A (zh) 2019-11-05
CN110414620B CN110414620B (zh) 2021-08-31

Family

ID=68365864

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910719475.9A Active CN110414620B (zh) 2019-08-06 2019-08-06 一种语义分割模型训练方法、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN110414620B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112635001A (zh) * 2020-12-21 2021-04-09 山东众阳健康科技集团有限公司 一种icd编码数据处理方法、系统、存储介质及设备
CN112749801A (zh) * 2021-01-22 2021-05-04 上海商汤智能科技有限公司 神经网络训练和图像处理方法及装置
CN117593596A (zh) * 2024-01-19 2024-02-23 四川封面传媒科技有限责任公司 一种敏感信息检测方法、系统、电子设备及介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106683181A (zh) * 2017-01-06 2017-05-17 厦门大学 一种三维人体稠密表面运动场重建方法
US20170196196A1 (en) * 2016-01-08 2017-07-13 Leo Trottier Animal interaction devices, systems and methods
CN107220604A (zh) * 2017-05-18 2017-09-29 清华大学深圳研究生院 一种基于视频的跌倒检测方法
CN107704862A (zh) * 2017-11-06 2018-02-16 深圳市唯特视科技有限公司 一种基于语义实例分割算法的视频对象分割方法
CN109166126A (zh) * 2018-08-13 2019-01-08 苏州比格威医疗科技有限公司 一种基于条件生成式对抗网络在icga图像上分割漆裂纹的方法
CN109255790A (zh) * 2018-07-27 2019-01-22 北京工业大学 一种弱监督语义分割的自动图像标注方法
CN109446951A (zh) * 2018-10-16 2019-03-08 腾讯科技(深圳)有限公司 三维图像的语义分割方法、装置、设备及存储介质
MX2018008910A (es) * 2016-01-21 2019-03-28 The State Of Israel Ministry Of Agriculture & Rural Development Agricultural Res Organization Aro Vo Plantas partenocarpicas y procedimientos de produccion de las mismas.
CN109685072A (zh) * 2018-12-22 2019-04-26 北京工业大学 一种基于生成对抗网络的复合降质图像高质量重建方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170196196A1 (en) * 2016-01-08 2017-07-13 Leo Trottier Animal interaction devices, systems and methods
MX2018008910A (es) * 2016-01-21 2019-03-28 The State Of Israel Ministry Of Agriculture & Rural Development Agricultural Res Organization Aro Vo Plantas partenocarpicas y procedimientos de produccion de las mismas.
CN106683181A (zh) * 2017-01-06 2017-05-17 厦门大学 一种三维人体稠密表面运动场重建方法
CN107220604A (zh) * 2017-05-18 2017-09-29 清华大学深圳研究生院 一种基于视频的跌倒检测方法
CN107704862A (zh) * 2017-11-06 2018-02-16 深圳市唯特视科技有限公司 一种基于语义实例分割算法的视频对象分割方法
CN109255790A (zh) * 2018-07-27 2019-01-22 北京工业大学 一种弱监督语义分割的自动图像标注方法
CN109166126A (zh) * 2018-08-13 2019-01-08 苏州比格威医疗科技有限公司 一种基于条件生成式对抗网络在icga图像上分割漆裂纹的方法
CN109446951A (zh) * 2018-10-16 2019-03-08 腾讯科技(深圳)有限公司 三维图像的语义分割方法、装置、设备及存储介质
CN109685072A (zh) * 2018-12-22 2019-04-26 北京工业大学 一种基于生成对抗网络的复合降质图像高质量重建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SHAOYU WANG ET AL: "Edge-aware Fully Convolutional Network with CRFRNN Layer for Hippocampus Segmentation", 《2019 IEEE 8TH JOINT INTERNATIONAL INFORMATION TECHNOLOGY AND ARTIFICIAL INTELLIGENCE CONFERENCE》 *
蒲勇飞: "基于卷积神经网络的遥感图像分类和分割方法研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112635001A (zh) * 2020-12-21 2021-04-09 山东众阳健康科技集团有限公司 一种icd编码数据处理方法、系统、存储介质及设备
CN112635001B (zh) * 2020-12-21 2023-04-07 山东众阳健康科技集团有限公司 一种icd编码数据处理方法、系统、存储介质及设备
CN112749801A (zh) * 2021-01-22 2021-05-04 上海商汤智能科技有限公司 神经网络训练和图像处理方法及装置
CN117593596A (zh) * 2024-01-19 2024-02-23 四川封面传媒科技有限责任公司 一种敏感信息检测方法、系统、电子设备及介质
CN117593596B (zh) * 2024-01-19 2024-04-16 四川封面传媒科技有限责任公司 一种敏感信息检测方法、系统、电子设备及介质

Also Published As

Publication number Publication date
CN110414620B (zh) 2021-08-31

Similar Documents

Publication Publication Date Title
KR102170105B1 (ko) 신경 네트워크 구조의 생성 방법 및 장치, 전자 기기, 저장 매체
CN110414620A (zh) 一种语义分割模型训练方法、计算机设备及存储介质
EP3654610B1 (en) Graphical structure model-based method for prevention and control of abnormal accounts, and device
US10635975B2 (en) Method and apparatus for machine learning
CN108334910B (zh) 一种事件检测模型训练方法以及事件检测方法
JP2017037392A (ja) ニューラルネットワーク学習装置
KR102036968B1 (ko) 전문화에 기반한 신뢰성 높은 딥러닝 앙상블 방법 및 장치
US20190073587A1 (en) Learning device, information processing device, learning method, and computer program product
KR102159880B1 (ko) 메타 인지 기반 고속 환경 탐색 방법 및 장치
CN113887845B (zh) 极端事件预测方法、装置、设备和存储介质
US10635078B2 (en) Simulation system, simulation method, and simulation program
Chai et al. Passive robust fault detection using RBF neural modeling based on set membership identification
CN115204352B (zh) 信息处理装置、信息处理方法和存储介质
Naimzada et al. Dynamic behavior of product and stock markets with a varying degree of interaction
US20220343163A1 (en) Learning system, learning device, and learning method
CN108234195B (zh) 预测网络性能的方法和装置、设备、介质
WO2018135515A1 (ja) 情報処理装置、ニューラルネットワークの設計方法及び記録媒体
CN111126566B (zh) 基于gan模型的异常家具布局数据检测方法
CN110826695B (zh) 数据处理方法、装置和计算机可读存储介质
Talic et al. Multi-objective parameter identification of Euler–Bernoulli beams under axial load
CN111355247A (zh) 电网低频振荡预测方法及装置
US20220414461A1 (en) Inference method, information processing apparatus, and computer-readable recording medium
CN114049539B (zh) 基于去相关二值网络的协同目标识别方法、系统及装置
US11475371B2 (en) Learned model integration method, apparatus, program, IC chip, and system
CA3221550A1 (en) Systems and methods for operating an autonomous system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant