CN110135508A - 模型训练方法、装置、电子设备及计算机可读存储介质 - Google Patents

模型训练方法、装置、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110135508A
CN110135508A CN201910425520.XA CN201910425520A CN110135508A CN 110135508 A CN110135508 A CN 110135508A CN 201910425520 A CN201910425520 A CN 201910425520A CN 110135508 A CN110135508 A CN 110135508A
Authority
CN
China
Prior art keywords
image
uncertainty
training
sample
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910425520.XA
Other languages
English (en)
Other versions
CN110135508B (zh
Inventor
边成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910425520.XA priority Critical patent/CN110135508B/zh
Publication of CN110135508A publication Critical patent/CN110135508A/zh
Application granted granted Critical
Publication of CN110135508B publication Critical patent/CN110135508B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及深度学习技术领域,公开了一种模型训练方法、装置、电子设备及计算机可读存储介质,其中,模型训练方法包括:基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型;根据基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本;基于K个训练图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值;重复执行上述过程,直至基于不确定度约束的预定模型满足第一预定条件。

Description

模型训练方法、装置、电子设备及计算机可读存储介质
技术领域
本申请涉及深度学习技术领域,具体而言,本申请涉及一种模型训练方法、装置、电子设备及计算机可读存储介质。
背景技术
OCT(Optical Coherence Tomography,光学相干断层成像技术)作为一种非接触式、非侵入性的眼科成像诊断技术,被广泛应用于视网膜的成像,以检测和管理眼疾,例如黄斑裂孔、黄斑囊样水肿、糖尿病性视网膜病变、老年性黄斑变性和青光眼等。其中,精准且全自动分割OCT图像的视网膜层与脉络膜层,对诊断视网膜疾病来说是十分重要的。
近年来,深度学习在计算机视觉的各个领域都取得了十足的进展,这促进了其在医学图像分析与识别的发展,许多文献也表明深度学习在OCT分割任务上有着不错的表现。然而,当针对某个设备采集的若干OCT图像进行深度学习后的神经网络,被用来对其它设备采集的OCT图像进行分割时,往往存在域偏移现象,在多设备的通用性上表现较差,导致分割效果不尽人意,需要根据不同设备采集的OCT图像重新进行微调整,耗费大量的人力采集OCT图像及重新对新采集的OCT图像进行标注。因此,构建一个通用型的用于OCT分割的神经网络是十分必要的。
发明内容
本申请的目的旨在至少能解决上述的技术缺陷之一,特提出以下技术方案:
一方面,提供了一种模型训练方法,包括:
基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型;
根据基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本,T和K为正整数;
基于K个训练图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值;
重复执行基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型、根据基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本、以及基于K个训练图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值,直至基于不确定度约束的预定模型满足第一预定条件。
在一种可能的实现方式中,训练图像样本包括源域图像样本与源域图像样本的标注图像;
基于K个训练图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值,包括:
基于K个源域图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值。
在另一种可能的实现方式中,预定图像处理模块包括预定的密集特征获取模块、预定的分布编码器、预定的采样编码模块及KL散度损失。
在另一种可能的实现方式中,预定的分布编码器包括后验分布编码器和先验分布编码器,基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型,包括:
通过后验分布编码器,利用源域图像样本与源域图像样本的标注图像进行训练拟合,得到相应的后验高斯分布;
通过先验分布编码器,利用源域图像样本进行训练拟合,得到相应的先验高斯分布;
根据KL散度损失对先验高斯分布向后验高斯分布进行逼近处理,并对逼近处理后的先验高斯分布进行M次采样,得到M个先验高斯样本;
通过预定的采样编码模块,对M个先验高斯样本分别与源域图像样本的第一密集特征叠加后进行卷积处理,第一密集特征是通过预定的密集特征获取模块对源域图像样本进行相应处理得到的;
基于卷积处理结果确定预定模型的不确定度约束损失,并根据不确定度约束损失更新预定模型的相应参数,得到基于不确定度约束的预定模型。
在另一种可能的实现方式中,通过预定的采样编码模块,对M个先验高斯样本分别与源域图像样本的第一密集特征叠加后进行卷积处理,包括:
将M个先验高斯样本分别插入到第一密集特征中,得到M个第二密集特征;
通过预定的采样编码模块对M个第二密集特征分别进行卷积处理,得到M个第一图像样本。
在另一种可能的实现方式中,基于卷积处理结果确定预定模型的不确定度约束损失,包括:
计算M个第一图像样本的均值,并根据均值确定源域图像样本的源域预测结果;
计算M个第一图像样本的方差,并根据方差确定源域图像样本的源域不确定度图;
基于预定的不确定度约束损失计算方式,根据源域预测结果、源域不确定度图及源域图像样本的标注图像,确定预定模型的不确定度约束损失。
在另一种可能的实现方式中,根据基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本,包括:
通过基于不确定度约束的预定模型,对T个测试图像分别进行分析处理,得到对应的T个不确定度预测结果;
基于T个不确定度预测结果,从T个测试图像中以预定规则确定出其中的K个,并将该K个作为测试图像样本。
在另一种可能的实现方式中,基于T个不确定度预测结果,从T个测试图像中以预定规则确定出其中的K个,并将该K个作为测试图像样本,包括:
确定T个不确定度预测结果各自对应的均值,并将确定得到的T个均值作为相对应的T个测试图像的T个不确定度值;
根据预定的选取规则,从T个不确定度值中选取出其中满足第二预设条件的K个不确定度值,并将该K个不确定度值分别对应的测试图像作为测试图像样本。
在另一种可能的实现方式中,在基于T个不确定度的预测结果,从T个测试图像中确定出其中的K个,并将该K个作为测试图像样本之前,还包括:
通过将T个不确定度预测结果插入到原始不确定度学习集中,以对原始不确定度学习集进行更新,得到更新后的不确定度学习集;
根据预定的选取规则,从T个不确定度值中选取出其中满足第二预设条件的K个不确定度值,包括:
根据预定的排列顺序,对更新后的不确定度学习集中的T个不确定度预测结果,依据T个不确定度值进行排序;
根据排序结果,从T个不确定度值中选取出其中满足第二预设条件的K个不确定度值。
在另一种可能的实现方式中,基于K个源域图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值,包括:
通过基于不确定度约束的预定模型对K个源域图像样本及K个测试图像样本分别进行分析处理,得到K个源域图像样本分别对应的第一图像特征与K个测试图像样本分别对应的第二图像特征;
根据第一图像特征与第二图像特征,对预定生成对抗网络进行对抗训练以更新其权重值。
在另一种可能的实现方式中,通过基于不确定度约束的预定模型对任一源域图像样本及任一测试图像样本分别进行分析处理,得到任一源域图像样本的第一图像特征与任一测试图像样本的第二图像特征,包括:
通过预定的密集特征获取模块确定任一源域图像样本的第三密集特征,并通过预定的采样编码模块确定任一源域图像样本的第一图像样本,以及对第三密集特征与任一源域图像的第一图像样本进行连接处理,得到任一源域图像的第一图像特征;
通过预定的密集特征获取模块确定任一测试图像样本的第四密集特征,并通过预定的采样编码模块确定任一测试图像样本的第一图像样本,以及对第四密集特征与任一测试图像样本的第一图像样本进行连接处理,得到任一测试图像样本的第二图像特征。
在另一种可能的实现方式中,预定模型包括金字塔场景解析网络PSPNet模型;
预定的密集特征获取模块包括金字塔场景解析PSP密集特征获取模块;
预定生成对抗网络包括PatchGAN。
另一方面,提供了一种模型训练装置,包括:
第一训练模块,用于基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型;
确定模块,用于根据基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本,T和K为正整数;
第二训练模块,用于基于K个训练图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值;
处理模块,用于重复执行基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型、根据基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本、以及基于K个训练图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值,直至基于不确定度约束的预定模型满足第一预定条件。
在一种可能的实现方式中,训练图像样本包括源域图像样本与源域图像样本的标注图像;
第二训练模块具体用于基于K个源域图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值。
在另一种可能的实现方式中,预定图像处理模块包括预定的密集特征获取模块、预定的分布编码器、预定的采样编码模块及KL散度损失。
在另一种可能的实现方式中,预定的分布编码器包括后验分布编码器和先验分布编码器,第一训练模块包括第一分析处理子模块、第二分析处理子模块、逼近处理子模块、卷积处理子模块与不确定度确定子模块;
第一分析处理子模块,用于通过后验分布编码器利用源域图像样本与源域图像样本的标注图像进行训练拟合,得到相应的后验高斯分布;
第二分析处理子模块,用于通过先验分布编码器利用所述源域图像样本进行训练拟合,得到相应的先验高斯分布;
逼近处理子模块,用于根据KL散度损失对先验高斯分布向后验高斯分布进行逼近处理,并对逼近处理后的先验高斯分布进行M次采样,得到M个先验高斯样本;
卷积处理子模块,用于通过预定的采样编码模块,对M个先验高斯样本分别与源域图像样本的第一密集特征叠加后进行卷积处理,第一密集特征是通过预定的密集特征获取模块对源域图像样本进行相应处理得到的;
不确定度确定子模块,用于基于卷积处理结果确定预定模型的不确定度约束损失,并根据不确定度约束损失更新预定模型的相应参数,得到基于不确定度约束的预定模型。
在另一种可能的实现方式中,卷积处理子模块包括第一插入单元与卷积单元;
插入单元,用于将M个先验高斯样本分别插入到第一密集特征中,得到M个第二密集特征;
卷积单元,用于通过预定的采样编码模块对M个第二密集特征分别进行卷积处理,得到M个第一图像样本。
在另一种可能的实现方式中,不确定度确定子模块包括第一计算单元、第二计算单元与第三计算单元;
第一计算单元,用于计算M个第一图像样本的均值,并根据均值确定源域图像样本的源域预测结果;
第二计算单元,用于计算M个第一图像样本的方差,并根据方差确定源域图像样本的源域不确定度图;
第三计算单元,用于基于预定的不确定度约束损失计算方式,根据源域预测结果、源域不确定度图及源域图像样本的标注图像,确定预定模型的不确定度约束损失。
在另一种可能的实现方式中,确定模块包括第三分析处理子模块与样本确定子模块;
第三分析处理子模块,用于通过基于不确定度约束的预定模型,对T个测试图像分别进行分析处理,得到对应的T个不确定度预测结果;
样本确定子模块,用于基于T个不确定度预测结果,从T个测试图像中确定出其中的K个,并将该K个作为测试图像样本。
在另一种可能的实现方式中,样本确定子模块包括均值确定单元与选取单元;
均值确定单元,用于确定T个不确定度预测结果各自对应的均值,并将确定得到的T个均值作为相对应的T个测试图像的T个目标域不确定度值;
选取单元,用于根据预定的选取规则,从T个不确定度值中选取出其中满足第二预设条件的K个不确定度值,并将该K个不确定度值分别对应的测试图像作为测试图像样本。
在另一种可能的实现方式中,确定模块还包括更新处理子模块;
更新处理子模块,用于通过将T个不确定度预测结果插入到原始不确定度学习集中,以对原始不确定度学习集进行更新,得到更新后的不确定度学习集;
选取单元具体用于根据预定的排列顺序,对更新后的不确定度学习集中的T个不确定度预测结果,依据T个不确定度值进行排序;以及用于根据排序结果,从T个不确定度值中选取出其中满足第二预设条件的K个不确定度值。
在另一种可能的实现方式中,第二训练模块包括第四分析处理子模块与对抗训练子模块;
第四分析处理子模块,用于通过基于不确定度约束的预定模型对K个源域图像样本及K个测试图像样本分别进行分析处理,得到K个源域图像样本分别对应的第一图像特征与K个测试图像样本分别对应的第二图像特征;
对抗训练子模块,用于根据第一图像特征与第二图像特征,对预定生成对抗网络进行对抗训练以其权重值。
在另一种可能的实现方式中,第四分析处理子模块包括第一图像特征处理单元与第二图像特征处理单元;
第一图像特征处理单元,用于通过预定的密集特征获取模块确定任一源域图像的第三密集特征,并通过预定的采样编码模块确定任一源域图像样本的第一图像样本,以及对第三密集特征与任一源域图像的第一图像样本进行连接处理,得到任一源域图像的第一图像特征;
第二图像特征处理单元,用于通过预定的密集特征获取模块确定任一测试图像样本的第四密集特征,并通过预定的采样编码模块确定任一测试图像样本的第一图像样本,以及对第四密集特征与任一测试图像样本的第一图像样本进行连接处理,得到任一测试图像样本的第二图像特征。
另一方面,提供了一种基于训练后的模型识别图像的方法,包括:
获取待进行图像识别的目标图像;
基于上述的模型训练方法得到的训练后的预定模型,对目标图像进行识别处理,得到相应的图像识别结果。
另一方面,提供了一种基于训练后的模型识别图像的装置,包括:
获取模块,用于获取待进行图像识别的目标图像;
识别处理模块,用于基于上述的模型训练方法得到的训练后的预定模型,对目标图像进行识别处理,得到相应的图像识别结果。
另一方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述的模型训练方法。
另一方面,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述的模型训练方法。
另一方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述的基于训练后的模型识别图像的方法。
另一方面,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述的基于训练后的模型识别图像的方法。
本申请实施例提供的模型训练方法,通过基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型这一过程,使得可以根据不确定度约束对预定模型进行参数调整,充分考虑了不确定度约束对分割性能的影响,极大增强分割能力;通过根据基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本这一过程,以及基于K个训练图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值这一过程,使得可以对训练图像样本与测试图像样本进行充分的对抗训练,从而能够意识到训练图像样本与测试图像样本之间的差异部分,提升域对齐性能,极大降低域偏移现象的发生,通过重复执行上述三个过程,直至基于不确定度约束的预定模型满足第一预定条件,可以得到一个能够对目标域图像进行有效分割的训练后的预定模型,使得该训练后的预定模型具有良好的健壮性和通用性,可被广泛应用于不同设备的OCT图像分类、分割算法中,并给出稳定可靠的分割结果。
本申请实施例提供的基于训练后的预定模型识别图像的方法,通过获取待进行图像识别的目标图像以及基于训练后的预定模型对目标图像进行识别处理,得到解决了域偏移现象后的稳定可靠的图像识别结果,进一步证明训练后的预定模型具有良好的健壮性和通用性,可被广泛应用于不同设备的OCT图像分类及分割算法中。
本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例的模型训练方法的流程示意图;
图2为本申请实施例的PSPNet模型的示意图;
图3为本申请实施例的PSPNet模型的训练过程示意图;
图4为本申请实施例的基于训练后的预定模型识别图像的方法的流程示意图;
图5为本申请实施例的训练后的PSPNet模型识别图像的方法与现有技术中的域对齐方法的对比结果的一个示意图;
图6为本申请实施例的训练后的PSPNet模型的不确定度结果的示意图;
图7为本申请实施例的模型训练装置的基本结构示意图;
图8为本申请实施例的模型训练装置的详细结构示意图;
图9为本申请实施例的基于训练后的预定模型识别图像的装置的基本结构示意图;
图10为本申请实施例的电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请提供的模型训练方法、装置、电子设备及计算机可读存储介质,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
本申请一个实施例提供了一种模型训练方法,该方法应用于一种计算机设备,该计算机设备可以是终端或者服务器。终端可以是台式设备或者移动终端。服务器可以是独立的物理服务器、物理服务器集群或者虚拟服务器。如图1所示,该方法包括:
步骤S110,基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型。
具体地,假如当前预定生成对抗网络的权重值(或称作参数值)为P1,即将当前预定生成对抗网络的权重值固定为P1,接着训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,比如将预定模型的相应参数由原来的A1更新为A2,得到基于不确定度约束的预定模型。其中,上述固定参数的预定生成对抗网络作为监督者(用于判断对或错),监督未被固定参数的预定模型,并参与未被固定参数的预定模型的参数更新。
步骤S120,根据基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本,T和K为正整数。
具体地,在得到基于不确定度约束的预定模型之后,可以根据该基于不确定度约束的预定模型,从T个测试图像中确定出K个测试图像样本,从而为后续对预定生成对抗网络进行训练以更新其权重值奠定必要基础。
步骤S130,基于K个训练图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值。
具体地,在得到K个测试图像样本之后,为确保对预定生成对抗网络进行训练的准确性,从训练图像样本集中选取相同数量的训练图像样本,即从训练图像样本集中选取出K个训练图像样本,其中,该选取可以是随机选取,也可以是选取最前面的K张,还可以是选取最后面的K张,还可以是其它选取方式,本申请实施例不对其做限制。
进一步地,在获取到K个训练图像样本后,基于该K个训练图像样本、K个测试图像样本以及上述步骤S110得到的基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新预定生成对抗网络的权重值,假如将预定生成对抗网络的权重值由P1更新为P2,则更新后的预定生成对抗网络的权重值为P2,此时P2即为当前预定生成对抗网络的权重值。
步骤S140,重复执行基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型、根据基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本、以及基于K个训练图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值,直至基于不确定度约束的预定模型满足第一预定条件。
具体地,完成上述步骤S110、步骤S120及步骤S130后,相当于完成了第一轮训练,即第一轮训练包括上述的步骤S110、步骤S120及步骤S130。在完成第一轮训练后,可以再次执行上述步骤S110、步骤S120及步骤S130,以完成第二轮训练。
需要注意的是,假如完成第一轮训练后预定生成对抗网络的权重值由P1更新为P2,则在第二轮训练时,步骤S110中的当前预定生成对抗网络的权重值的取值为P2,换言之,无论进行多少轮训练,后一轮训练总是基于前一轮训练更新后的预定生成对抗网络的权重值进行的。
下面,通过具体示例对上述步骤S110、步骤S120及步骤S130中,相应模型的参数的更新过程进行介绍:
假如在执行上述步骤S110、步骤S120及步骤S130之前,预定模型中相应参数的取值为A1,预定生成对抗网络的权重值为P1,则:
在第一轮训练过程中,当前预定生成对抗网络的权重值为P1保持不变,此时对预定模型进行训练,并将预定模型的相应参数的取值由原来的A1更新为A2,得到基于不确定度约束的预定模型,即基于不确定度约束的预定模型的相应参数的取值为A2,接着执行步骤S120,此时基于不确定度约束的预定模型的相应参数的取值为A2,在确定出K个测试图像样本后,执行步骤S130,此时基于不确定度约束的预定模型的相应参数的取值为A2,对预定生成对抗网络进行训练并更新预定生成对抗网络的权重值,比如将预定生成对抗网络的权重值由P1更新为P2,即当前预定生成对抗网络的权重值为P2。
在第二轮训练过程中,当前预定生成对抗网络的权重值为P2保持不变,此时对预定模型进行训练,并将预定模型的相应参数的取值由原来的A2更新为A3,得到基于不确定度约束的预定模型,即基于不确定度约束的预定模型的相应参数的取值为A3,接着执行步骤S120,此时基于不确定度约束的预定模型的相应参数的取值为A3,在确定出K个测试图像样本后,执行步骤S130,此时基于不确定度约束的预定模型的相应参数的取值为A3,对预定生成对抗网络进行训练并更新预定生成对抗网络的权重值,比如将预定生成对抗网络的权重值由P2更新为P3,即当前预定生成对抗网络的权重值为P3。
在第三轮训练过程中,当前预定生成对抗网络的权重值为P3保持不变,此时对预定模型进行训练,并将预定模型的相应参数的取值由原来的A3更新为A4,得到基于不确定度约束的预定模型,即基于不确定度约束的预定模型的相应参数的取值为A4,接着执行步骤S120,此时基于不确定度约束的预定模型的相应参数的取值为A4,在确定出K个测试图像样本后,执行步骤S130,此时基于不确定度约束的预定模型的相应参数的取值为A4,对预定生成对抗网络进行训练并更新预定生成对抗网络的权重值,比如将预定生成对抗网络的权重值由P3更新为P4,即当前预定生成对抗网络的权重值为P4。
根据上述的训练流程,继续进行后续的第四轮训练、第五轮训练、…第N轮训练,直至基于不确定度约束的预定模型满足预定条件(即上述的第一预定条件)时,则停止重复执行步骤S110、步骤S120及步骤S130,即完成训练。
本申请实施例提供的模型训练方法,通过基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型这一过程,使得可以根据不确定度约束对预定模型进行参数调整,充分考虑了不确定度约束对分割性能的影响,极大增强分割能力;通过根据基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本这一过程,以及基于K个训练图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值这一过程,使得可以对训练图像样本与测试图像样本进行充分的对抗训练,从而能够意识到训练图像样本与测试图像样本之间的差异部分,提升域对齐性能,极大降低域偏移现象的发生,通过重复执行上述三个过程,直至基于不确定度约束的预定模型满足第一预定条件,可以得到一个能够对目标域图像进行有效分割的训练后的预定模型,使得该训练后的预定模型具有良好的健壮性和通用性,可被广泛应用于不同设备的OCT图像分类、分割算法中,并给出稳定可靠的分割结果。
在本申请一个实施例的一种可能的实现方式中,训练图像样本包括源域图像样本与源域图像样本的标注图像;其中:
基于K个训练图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值,包括:基于K个源域图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值。
具体地,预定图像处理模块包括预定的密集特征获取模块、预定的分布编码器、预定的采样编码模块及KL散度损失。
具体地,预定模型包括PSPNet(Pyramid Scene Parsing Network,金字塔场景解析网络)模型;预定的密集特征获取模块包括金字塔场景解析PSP密集特征获取模块;预定生成对抗网络(GAN,Generative Adversarial Networks)包括PatchGAN。当然,预定模型除了包括PSPNet模型之外,还可以是其它模型,本申请实施例不对其做限定。
具体地,预定的分布编码器包括后验分布编码器和先验分布编码器,上述步骤S110具体包括:步骤a1,通过后验分布编码器利用源域图像样本与源域图像样本的标注图像进行训练拟合,得到相应的后验高斯分布;步骤a2,通过先验分布编码器利用所述源域图像样本进行训练拟合,得到相应的先验高斯分布;步骤a3,根据KL散度损失对先验高斯分布向后验高斯分布进行逼近处理,并对逼近处理后的先验高斯分布进行M次采样,得到M个先验高斯样本;步骤a4,通过预定的采样编码模块,对M个先验高斯样本分别与源域图像样本的第一密集特征叠加后进行卷积处理,第一密集特征是通过PSP密集特征获取模块对源域图像样本进行相应处理得到的;步骤a5,基于卷积处理结果确定预定模型的不确定度约束损失,并根据不确定度约束损失更新预定模型的相应参数,得到基于不确定度约束的预定模型。
其中,PSPNet模型主要是用于自然场景语义分割,PSPNet模型首先选择一个基础卷积神经网络(CNN,Convolutional Neural Networks)提取高级特征,然后接一个金字塔池化层以提取多尺度特征,最后将多个池化层的结果连接在一起输出,如图2所示。
为便于对本申请实施例的模型训练方法进行介绍,下文均以预定模型为PSPNet模型、预定的密集特征获取模块为PSP密集特征获取模块、以及预定生成对抗网络为PatchGAN为例,进行具体说明。当预定模型为其它模型、预定的密集特征获取模块为其它密集特征获取模块、以及预定生成对抗网络为其它生成对抗网络时,其模型训练流程与预定模型为PSPNet模型、预定的密集特征获取模块为PSP密集特征获取模块、以及预定生成对抗网络为PatchGAN时的处理流程相同,在此不再赘述。
此外,上述的训练图像样本包括的源域图像样本是通过第一图像采集设备采集到的,测试图像样本是通过第二图像采集设备采集到的,即源域图像样本与测试图像样本的采集设备不同。在实际应用场景中,通常将训练图像样本称作源域训练图像样本,测试图像样本称作目标域测试图像样本,若无特殊说明,下文中的目标域测试图像样本均指测试图像样本。
当预定图像处理模块包括预定的密集特征获取模块、预定的分布编码器、预定的采样编码模块及KL散度损失,且预定模型为PSPNet模型时,上述的第一轮训练、第二轮训练、…、第N轮训练,具体可以为:
假如在执行上述步骤S110、步骤S120及步骤S130之前,PSPNet模型及预定图像处理模块(上述的PSP密集特征获取模块、预定的分布编码器及预定的采样编码模块等)中相应参数的取值为A1,PatchGAN的权重值为P1,则:
在第一轮训练过程中,当前PatchGAN的权重值为P1保持不变,此时对PSPNet模型及预定图像处理模块进行训练,并将PSPNet模型及预定图像处理模块的相应参数的取值由原来的A1更新为A2,得到基于不确定度约束的PSPNet模型,即基于不确定度约束的PSPNet模型的相应参数的取值为A2,接着执行步骤S120,此时基于不确定度约束的PSPNet模型的相应参数的取值为A2,在确定出K个目标域测试图像样本后,执行步骤S130,此时基于不确定度约束的PSPNet模型的相应参数的取值为A2,对PatchGAN进行训练并更新PatchGAN的权重值,比如将PatchGAN的权重值由P1更新为P2,即当前PatchGAN的权重值为P2。
在第二轮训练过程中,当前PatchGAN的权重值为P2保持不变,此时对PSPNet模型及预定图像处理模块进行训练,并将PSPNet模型及预定图像处理模块的相应参数的取值由原来的A2更新为A3,得到基于不确定度约束的PSPNet模型,即基于不确定度约束的PSPNet模型的相应参数的取值为A3,接着执行步骤S120,此时基于不确定度约束的PSPNet模型的相应参数的取值为A3,在确定出K个目标域测试图像样本后,执行步骤S130,此时基于不确定度约束的PSPNet模型的相应参数的取值为A3,对PatchGAN进行训练并更新PatchGAN的权重值,比如将PatchGAN的权重值由P2更新为P3,即当前PatchGAN的权重值为P3。
在第三轮训练过程中,当前PatchGAN的权重值为P3保持不变,此时对PSPNet模型及预定图像处理模块进行训练,并将PSPNet模型及预定图像处理模块的相应参数的取值由原来的A3更新为A4,得到基于不确定度约束的PSPNet模型,即基于不确定度约束的PSPNet模型的相应参数的取值为A4,接着执行步骤S120,此时基于不确定度约束的PSPNet模型的相应参数的取值为A4,在确定出K个目标域测试图像样本后,执行步骤S130,此时基于不确定度约束的PSPNet模型的相应参数的取值为A4,对PatchGAN进行训练并更新PatchGAN的权重值,比如将PatchGAN的权重值由P3更新为P4,即当前PatchGAN的权重值为P4。
根据上述的训练流程,继续进行后续的第四轮训练、第五轮训练、…第N轮训练,直至基于不确定度约束的PSPNet模型满足预定条件(即上述的第一预定条件)时,则停止重复执行步骤S110、步骤S120及步骤S130,即完成训练,此时可以将满足预定条件的基于不确定度约束的PSPNet模型作为优化后的PSPNet模型。其中,基于不确定度约束的PSPNet模型满足预定条件可以是基于不确定度约束的PSPNet模型已经收敛,也可以是基于不确定度约束的PSPNet模型的损失函数的浮动小于10-3次方,还可以是对步骤S110、步骤S120及步骤S130的训练轮数达到预定轮数,比如10000轮、20000轮、30000轮、36000轮等,当然也可以是其它条件,本申请实施例不对其做限制。
需要说明的是,由于上述在对PSPNet模型与预定图像处理模块进行训练的过程中,也会更新到patchGAN模型的参数值,所以为避免对PSPNet模型与预定图像处理模块进行训练的过程,对其它模型的参数造成影响,在对PSPNet模型与预定图像处理模块进行训练的过程中,将PSPNet模型与预定图像处理模块之外的相关模型(比如patchGAN)的参数固定住,即在对PSPNet模型与预定图像处理模块进行训练的过程中,PSPNet模型与预定图像处理模块之外的相关模型(比如patchGAN)的参数保持不变。
具体地,在执行上述步骤S110之前,预先采集一定数量的源域图像,并将该一定数量的源域图像作为源域图像样本,同时对该一定数量的源域图像样本分别进行人工标注,得到一定数量的源域图像样本的标注图像。
进一步地,在预先获取到一定数量的源域图像样本及源域图像样本的标注图像之后,在实际应用中,可以根据如下处理过程,得到基于不确定度约束的PSPNet模型:
1、通过后验分布编码器对预先获取到的源域图像样本及该源域图像样本的标注图像进行分析处理,例如对预先获取到的源域图像样本及该源域图像样本的标注图像进行估计,从而得到相应的后验分布,该后验分布服从高斯分布的,可以将该后验分布叫做后验高斯分布。
2、通过先验分布编码器对预先获取到的源域图像样本进行分析处理,例如对源域图像样本进行估计,从而得到相应的先验分布,该先验分布也是服从高斯分布的,可以将该先验分布叫做先验高斯分布。需要注意的是,获取先验高斯分布的过程,与上述获取后验高斯分布的过程,没有时间先后顺序限定。
3、在得到后验高斯分布与先验高斯分布后,可以通过KL散度损失使先验高斯分布逼近后验高斯分布,即根据KL散度损失对先验高斯分布向后验高斯分布进行逼近处理,使得先验高斯分布无限逼近于后验高斯分布。其中,在逼近处理的过程中,可以根据KL散度损失来衡量先验高斯分布与后验高斯分布之间的逼近程度,比如当逼近差值不大于预定阈值时,认为先验高斯分布已经足够逼近后验高斯分布,无需再进行逼近处理,此时可以得到一个无限逼近于后验高斯分布的先验高斯分布;又比如当逼近差值大于预定阈值时,认为先验高斯分布与后验高斯分布之间的逼近程度不符合要求,仍需要继续通过KL散度损失使先验高斯分布逼近后验高斯分布,直至逼近差值不大于预定阈值。
4、在得到无限逼近于后验高斯分布的先验高斯分布之后,可以对逼近处理后的先验高斯分布进行M次采样,由于先验高斯分布是服从高斯分布的,所以该M次采样可以称作M次高斯采样,从而得到M个先验高斯样本。其中,在进行M次采样的过程中,可以是随机采样,也可以是等间隔采样,还可以是其它采样方式,本申请实施例不对其做限制。
5、通过PSP密集特征获取模块对源域图像样本进行相应处理,比如密集特征抽取处理,得到源域图像样本的密集特征(即上述的第一密集特征)。需要说明的是,此处获取第一密集特征的过程,与上述获取先验高斯分布、后验高斯分布的过程,没有时间先后顺序限定。
6、在获取到第一密集特征之后,可以通过预定的采样编码模块,对M个先验高斯样本分别与第一密集特征叠加后进行卷积处理,得到对M个先验高斯样本与第一密集特征充分融合后的卷积处理结果。
7、在得到卷积处理结果后,可以基于该卷积处理结果确定PSPNet模型的不确定度约束损失,并根据不确定度约束损失更新PSPNet模型的相应参数,得到基于不确定度约束的PSPNet模型。在得到基于不确定度约束的PSPNet模型后,将该基于不确定度约束的PSPNet模型作为优化后的PSPNet模型。
进一步地,在对M个先验高斯样本分别与第一密集特征叠加后进行卷积处理的过程中,可以先将该M个先验高斯样本分别插入到上述第一密集特征中,从而得到M个第二密集特征。其中,该插入可以是随机插入,也可以是插入到预定位置,比如插入到第一密集特征的最前面,又比如插入到第一密集特征的最后面,本申请实施例不对其做限制。下面以将该M个先验高斯样本分别插入到上述第一密集特征的最后面为例,对该插入过程进行具体介绍:
假如该M个先验高斯样本分别为G1、G2、…、GM,第一密集特征为D1,则将该M个先验高斯样本分别插入到第一密集特征中为:将G1插入到第一密集特征D1的最后,得到对应的第二密集特征D21,接着将G2插入到第一密集特征D1的最后,得到对应的第二密集特征D22,依次进行,直至把将GM插入到第一密集特征D1的最后,得到对应的第二密集特征D2M,从而得到对应的M个第二密集特征D21、D22、…D2M。其中,为便于理解,可以与实际应用相结合,将该第二密集特征称作蒙特卡洛密集特征。
进一步地,虽然已将M个先验高斯样本分别插入到第一密集特征中,但是该M个先验高斯样本尚未与该第一密集特征有效融合在一起,因此,在得到M个第二密集特征之后,需要通过预定的采样编码模块对该M个第二密集特征分别进行卷积处理,得到M个第一图像样本,该M个第一图像样本即为上述的卷积处理结果。其中,对M个第二密集特征分别进行卷积处理,实际上相当于对M个先验高斯样本分别与第一密集特征叠加后进行卷积处理,从而将各个先验高斯样本与第一密集特征进行充分融合,得到充分融合后的M个第一图像样本。为便于理解,可以与实际应用相结合,将该第一图像样本称作蒙特卡洛样本。
进一步地,在得到M个第一图像样本这一卷积处理结果之后,可以基于该卷积处理结果确定PSPNet模型的不确定度约束损失。在实际应用中,可以根据如下过程确定PSPNet模型的不确定度约束损失:
首先,对上述的M个第一图像样本进行均值计算,并根据计算得到的均值得到源域图像样本的源域预测结果,即计算M个第一图像样本的均值,并根据均值确定源域图像样本的源域预测结果。
其次,对上述的M个第一图像样本进行方差计算,并根据计算得到的方差得到源域图像样本的源域不确定度图,即计算M个第一图像样本的方差,并根据方差确定源域图像样本的源域不确定度图。
最后基于预定的不确定度约束损失计算方式,根据上述的源域预测结果、源域不确定度图及源域图像样本的标注图像,确定PSPNet模型的不确定度约束损失。其中,预定的不确定度约束损失计算方式可以为:
其中,Ls(Xs,Ys;θg)为不确定度损失、G(xs,i;θg)是源域预测结果、ys,i,c是标注图像在i像素点位置c类位置的值、Ns是图像的像素点的个数、C是类别的个数、是源域不确定度图、Normalize是归一化函数,是对源域不确定图正则化操作,Xs是PSPNet模型的输入、Ys是标注图像、θg是PSPNet模型的参数,代表来自源域图像样本的均值,xs表示源域图像样本,~表示源域图像样本属于源域,“.”表示点乘。
需要说明的是,除了上述的不确定度约束损失计算方式之外,还可以采用其它不确定度约束损失计算公式,在此不再赘述。
进一步地,在得到不确定度约束损失之后,可以通过不确定度约束损失的负反馈或反向传播,来更新上述PSPNet模型的相应参数,例如将PSPNet模型的相应参数由原来的A1更新为A2,从而得到基于不确定度约束的PSPNet模型,使得基于不确定度约束的PSPNet模型能够更有针对性的学习不确定度区域,同时提升源域图像与目标域图像的分割性能。
在本申请一个实施例的另一种可能的实现方式中,上述步骤S120具体包括:步骤b1,根据当前patchGAN的权重值,通过基于不确定度约束的PSPNet模型对T个测试图像分别进行分析处理,得到对应的T个不确定度预测结果;步骤b2,基于T个不确定度预测结果,从T个测试图像中确定出其中的K个,并将该K个作为测试图像样本。
具体地,在执行上述步骤S120之前,可以通过不同于源域图像的采集设备(源域设备)的其它采集设备(目标设备)预先采集一定数量的目标域图像,并将该一定数量的目标域图像作为测试图像。
具体地,在得到基于不确定度约束的PSPNet模型后(即该基于不确定度约束的PSPNet模型的相应参数已经由原来的A1更新为A2),可以根据该基于不确定度约束的PSPNet模型,从T个目标域测试图像中确定出K个目标域测试图像样本。其中,该当前patchGAN的权重值与上述步骤S110中的当前PatchGAN的权重值相同,比如均为P1。
进一步地,在实际应用中,根据当前patchGAN的权重值与该基于不确定度约束的PSPNet模型,从T个目标域测试图像中确定出K个目标域测试图像样本的过程,具体可以为:
第一,根据当前patchGAN的权重值(比如P1),通过基于不确定度约束的PSPNet模型(该基于不确定度约束的PSPNet模型的相应参数已经由原来的A1更新为A2),对T个目标域测试图像分别进行分析处理,得到对应的T个目标域不确定度预测结果。
第二,在得到对应的T个目标域不确定度预测结果之后,可以将该T个目标域不确定度预测结果插入到原有的目标域不确定度学习集中,以对原始目标域不确定度学习集进行更新,得到更新后的目标域不确定度学习集。其中,在将该T个目标域不确定度预测结果插入到原有的目标域不确定度学习集之前,需要先对原有的目标域不确定度学习集进行清空处理。
第三,在将T个目标域不确定度预测结果插入到原有的目标域不确定度学习集中之后,对该T个目标域不确定度预测结果分别进行均值计算,得到T个目标域不确定度预测结果各自对应的T个均值并将计算得到的T个均值作为相对应的T个目标域测试图像的T个目标域不确定度值,在实际应用中,上述的T个均值为二维不确定度矩阵的均值。
假如T个目标域测试图像分别为I1、I2、…、IT,T个目标域不确定度预测结果分别为R1、R2、…、RT,且对R1进行均值计算得到Rm1,对R2进行均值计算得到Rm2,…,对RT进行均值计算得到RmT,则将Rm1作为I1的目标域不确定度值,将Rm2作为I2的目标域不确定度值,依次类推,将RmT作为IT的目标域不确定度值。
第四,在得到T个目标域测试图像各自对应的T个目标域不确定度值之后,可以根据预定的排列顺序,比如从大到小的排列顺序、从小到大的排序顺序等,对更新后的目标域不确定度学习集中的T个目标域不确定度预测结果,依据该T个目标域不确定度值进行排序。换言之,将目标域不确定度学习集中的T个目标域不确定度预测结果,依据该T个目标域不确定度值,进行从大到小的排序,或者进行从小到大的排序。
第五,在将目标域不确定度学习集中的T个目标域不确定度预测结果进行排序之后,可以基于预定的选取规则,根据排序结果,从T个目标域不确定度值中选取出其中满足预设条件(即上述的第二预设条件)的K个目标域不确定度值,其中,该第二预设条件可以是目标域不确定度值不小于预定阈值。比如当排列顺序为从大到小时,可以根据该排列顺序,从最前面选取满足预设条件的K个目标域不确定度值,又比如当排列顺序为从小到大时,可以根据该排列顺序,从最后面选取满足预设条件的K个目标域不确定度值。
其中,上述的预定的选取规则是指K的选取规则,在实际应用中,该K的选取规则可以为:
k=einitial+e*estep
其中,einitial为预定数值,比如取值为50,estep也为预定数值,比如取值为5,e为对上述步骤S110、步骤S120及步骤S130重复执行的次数。
第六,在选取出K个目标域不确定度值之后,可以将该K个目标域不确定度值分别对应的目标域测试图像作为目标域测试图像样本,从而基于T个目标域不确定度预测结果,从T个目标域测试图像中确定出K个标域测试图像样本。
在本申请一个实施例的另一种可能的实现方式中,上述步骤S130具体包括:步骤c1,通过基于不确定度约束的预定模型(即PSPNet模型)对K个源域图像样本及K个测试图像样本分别进行分析处理,得到K个源域图像分别对应的第一图像特征与K个测试图像样本分别对应的第二图像特征;步骤c2,根据第一图像特征与第二图像特征,对patchGAN进行对抗训练以更新所述patchGAN的权重值。
需要说明的是,由于上述在对patchGAN进行对抗训练的过程中,也会更新到基于不确定度约束的PSPNET模型的参数值,为避免在对patchGAN进行对抗训练的过程,会对其它模型的参数造成影响,所以在对patchGAN进行对抗训练的过程中,将patchGAN之外的相关模型(比如基于不确定度约束的PSPNET模型)的参数固定住,即在对patchGAN进行对抗训练的过程中,除patchGAN之外的相关模型的参数保持不变。
具体地,在确定出K个测试图像样本(即目标域测试图像样本)以后,从源域图像样本集中选取相同数量的源域图像样本,即从源域图像样本集中选取出K个源域图像样本,其中,该选取可以是随机选取,也可以是选取最前面的K张,还可以是选取最后面的K张,还可以是其它选取方式,本申请实施例不对其做限制。
进一步地,在获取到K个源域图像样本后,基于该K个源域图像样本、K个目标域测试图像样本以及上述步骤S110得到的基于不确定度约束的PSPNet模型(该基于不确定度约束的PSPNet模型的相应参数已经由原来的A1更新为A2),对PatchGAN进行训练以更新PatchGAN的权重值,比如将PatchGAN的权重值由P1更新为P2。其中,在将PatchGAN的权重值由P1更新为P2后,P2即为当前PatchGAN的权重值。
进一步地,在实际应用中,上述步骤S130具体可以为:首先,分别将K个源域图像样本与K个目标域测试图像样本,输入到基于上述步骤S110得到的基于不确定度约束的PSPNet模型(该基于不确定度约束的PSPNet模型的相应参数已经由原来的A1更新为A2)中,以通过基于不确定度约束的PSPNet模型对K个源域图像样本及K个目标域测试图像样本分别进行分析处理,得到K个源域图像分别对应的第一图像特征与K个目标域测试图像样本分别对应的第二图像特征。接着,根据第一图像特征与第二图像特征,对patchGAN进行对抗训练以更新patchGAN的权重值,比如将PatchGAN的权重值由P1更新为P2。
进一步地,在实际应用中,通过基于不确定度约束的PSPNet模型对某个源域图像样本(比如SD1)及某个目标域测试图像样本(比如TD1)分别进行分析处理,得到SD1的第一图像特征与TD1的第二图像特征的具体过程,可以为:
(1)对于某个源域图像样本SD1来说,通过PSP密集特征获取模块确定SD1的源域密集特征,并通过预定的采样编码模块确定SD1的第一图像样本,以及对该源域密集特征与该SD1的第一图像样本进行连接处理,得到SD1的第一图像特征。
(2)对于某个目标域测试图像样本TD1来说,通过PSP密集特征获取模块确定TD1的目标域密集特征,并通过预定的采样编码模块确定TD1的第一图像样本,以及对该目标域密集特征与TD1的第一图像样本进行连接处理,得到TD1的第二图像特征。
需要说明的是,上述只是以某个源域图像SD1为例,对第一图像特征的获取过程进行介绍,对于上述的K个源域图像来说,该K个源域图像均需要经过上述SD1的处理过程,来获取各自对应的第一图像特征。同样地,上述只是以某个目标域测试图像样本TD1为例,对第二图像特征的获取过程进行介绍,对于上述的K个目标域测试图像样本来说,该K个目标域测试图像样本均需要经过上述TD1的处理过程,来获取各自对应的第二图像特征。
进一步地,图3给出了本申请实施例的优化PSPNet模型的过程示意图,在图3中,填充灰度的部分为基于不确定约束的PSPNet模型,图3中下半部分为对PSP密集特征获取模块的细化过程。
本申请另一实施例提供了一种基于训练后的预定模型识别图像的方法,该方法应用于一种计算机设备,该计算机设备可以是终端或者服务器。终端可以是台式设备或者移动终端。服务器可以是独立的物理服务器、物理服务器集群或者虚拟服务器。如图4所示,该方法包括:步骤S410,获取待进行图像识别的目标图像;步骤S420,基于上述的模型训练方法得到的训练后的预定模型,对目标图像进行识别处理,得到相应的图像识别结果。
具体地,预定模型包括金字塔场景解析网络PSPNet模型,当然也可以是除PSPNet模型之外的其它模型,本申请实施例不对其做限定。
为便于对本申请实施例的方法进行介绍,下文均以预定模型为PSPNet模型为例,进行具体说明。
具体地,可以根据实际需要,获取待进行图像识别的目标图像,比如OCT图像,例如通过海德堡设备获取到的眼部的OCT图像(即源域图像样本),又例如通过optovue(美国光视)设备获取到的眼部的OCT图像(即目标域测试图像样本)。
进一步地,在获取到待进行图像识别的目标图像之后,可以将该目标图像输入到训练后的PSPNet模型,以通过该训练后的PSPNet模型对目标图像进行识别处理,得到相应的图像识别结果。
进一步地,本申请实施例对基于训练后的PSPNet模型识别图像的结果进行了相应的验证。在验证之前,先以方差为0.01、均值为0高斯分布,对训练后的PSPNet模型的各个模块的参数进行初始化,同时搭建对应的硬件环境,例如在Pytorch上实现,在Nvidia TeslaP40显卡上运行等。其中,具体验证过程及结果如下:
具体对比了本申请实施例的训练后的PSPNet模型与目前流行的域对齐方法,例如CycleGAN、AdaptSegNet等已经被证明是最优的图像识别方法,其中,具体对比结果如图5所示。在图5中,a为目标图像,该目标图像为上述的目标域图像,b为目标图像的标注图像,c为根据第一预定网络对该目标图像的识别结果,该第一预定网络是根据目标图像及目标图像的标注图像训练后的网络,d为根据第二预定网络对目标图像的识别结果,该第二预定网络是根据源域图像及源域图像的标注图像训练后的网络,e为采用CycleGAN对目标图像的识别结果,f为采用AdaptSegNet对目标图像的识别结果,g为基于本申请实施例的优化后的PSPNet模型的目标图像的识别结果。
其中,根据图5可以看出,d识别的识别效果大打折扣,只有g的识别结果无限逼近于c,即本申请实施例的优化后的PSPNet模型的识别结果无限逼近于第一预定网络的识别结果,也即与根据目标图像及目标图像的标注图像训练后的网络的识别结果最接近,效果最好,而且本申请实施例的优化后的PSPNet模型不需要对目标域图像进行标注。
另外,表1具体给出了本申请实施例的训练后的PSPNet模型与现有技术中的域对齐方法的分割性能对比结果,其中,表1的最后一列为本申请实施例的训练后的PSPNet模型的分割性能,可以看出,本申请实施例的训练后的PSPNet模型的分割性能超过了现有技术中的域对齐方法的分割性能。充分说明,本申请实施例的训练后的PSPNet模型,能够有效解决多设备的域对齐问题。此外,本申请实施例的训练后的PSPNet模型的计算不确定度的速度,比蒙特卡洛法提高了近20倍。
另外,通过对上述步骤S110、步骤S120及步骤S130的多轮训练,得到的训练后的PSPNet模型,能够极大降低图像的不确定度,如图6所示。在图6中,a为未经过上述步骤S110、步骤S120及步骤S130的训练时,得到的图像的不确定度,b为对上述步骤S110、步骤S120及步骤S130进行10000轮训练后,得到的图像的不确定度,c为对上述步骤S110、步骤S120及步骤S130进行20000轮训练后,得到的图像的不确定度,d为对上述步骤S110、步骤S120及步骤S130进行30000轮训练后,得到的图像的不确定度。
其中,根据图6可以看出,随着训练轮数的增多,本申请实施例的训练后的PSPNet模型能够显著降低图像的不确定度。
本申请实施例提供的基于训练后的预定模型的图像识别方法,通过获取待进行图像识别的目标图像以及基于训练后的预定模型对目标图像进行识别处理,可以得到解决了域偏移现象后的稳定可靠的图像识别结果,进一步证明训练后的预定模型具有良好的健壮性和通用性,可被广泛应用于不同设备的OCT图像分类及分割算法中。
图7为本申请又一实施例提供的一种模型训练装置的结构示意图,如图7所示,该装置70可以包括第一训练模块71、确定模块72、第二训练模块73与处理模块74,其中:
第一训练模块71用于基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型;
确定模块72用于用于根据基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本,T和K为正整数;
第二训练模块73用于基于K个训练图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值;
处理模块74用于重复执行基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型、根据基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本、以及基于K个训练图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值,直至基于不确定度约束的预定模型满足第一预定条件。
本申请实施例提供的装置,通过基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型这一过程,使得可以根据不确定度约束对预定模型进行参数调整,充分考虑了不确定度约束对分割性能的影响,极大增强分割能力;通过根据基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本这一过程,以及基于K个训练图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值这一过程,使得可以对训练图像样本与测试图像样本进行充分的对抗训练,从而能够意识到训练图像样本与测试图像样本之间的差异部分,提升域对齐性能,极大降低域偏移现象的发生,通过重复执行上述三个过程,直至基于不确定度约束的预定模型满足第一预定条件,可以得到一个能够对目标域图像进行有效分割的训练后的预定模型,使得该训练后的预定模型具有良好的健壮性和通用性,可被广泛应用于不同设备的OCT图像分类、分割算法中,并给出稳定可靠的分割结果。
图8为本申请又一实施例提供的一种模型训练装置的详细结构示意图,如图8所示,该装置80可以包括第一训练模块81、确定模块82、第二训练模块83与处理模块84,其中,图8中的第一训练模块81所实现的功能与图7中的第一训练模块71相同,图8中的确定模块82所实现的功能与图7中的确定模块72相同,图8中的第二训练模块83所实现的功能与图7中的第二训练模块73相同,图8中的处理模块84所实现的功能与图7中的处理模块74相同,在此不再赘述。
下面对图8所示的模型训练装置进行详细介绍:
具体地,训练图像样本包括源域图像样本与源域图像样本的标注图像;
第二训练模块具体用于基于K个源域图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值。
具体地,预定图像处理模块包括预定的密集特征获取模块、预定的分布编码器、预定的采样编码模块及KL散度损失。
具体地,预定的分布编码器包括后验分布编码器和先验分布编码器。
进一步地,第一训练模块81包括第一分析处理子模块811、第二分析处理子模块812、逼近处理子模块813、卷积处理子模块814与不确定度确定子模块815;
第一分析处理子模块811,用于通过后验分布编码器利用源域图像样本与源域图像样本的标注图像进行训练拟合,得到相应的后验高斯分布;
第二分析处理子模块812,用于通过先验分布编码器利用源域图像样本进行训练拟合,得到相应的先验高斯分布;
逼近处理子模块813,用于根据KL散度损失对先验高斯分布向后验高斯分布进行逼近处理,并对逼近处理后的先验高斯分布进行M次采样,得到M个先验高斯样本;
卷积处理子模块814,用于通过预定的采样编码模块,对M个先验高斯样本分别与源域图像样本的第一密集特征叠加后进行卷积处理,第一密集特征是通过预定的密集特征获取模块对源域图像样本进行相应处理得到的;
不确定度确定子模块815,用于基于卷积处理结果确定预定模型的不确定度约束损失,并根据不确定度约束损失更新预定模型的相应参数,得到基于不确定度约束的预定模型。
进一步地,卷积处理子模块814包括第一插入单元8141与卷积单元8142,其中:
插入单元8141,用于将M个先验高斯样本分别插入到第一密集特征中,得到M个第二密集特征;
卷积单元8142,用于通过预定的采样编码模块对M个第二密集特征分别进行卷积处理,得到M个第一图像样本。
进一步地,不确定度确定子模块815包括第一计算单元8151、第二计算单元8152与第三计算单元8153,其中:
第一计算单元8151,用于计算M个第一图像样本的均值,并根据均值确定源域图像样本的源域预测结果;
第二计算单元8152,用于计算M个第一图像样本的方差,并根据方差确定源域图像样本的源域不确定度图;
第三计算单元8153,用于基于预定的不确定度约束损失计算方式,根据源域预测结果、源域不确定度图及源域图像样本的标注图像,确定预定模型的不确定度约束损失。
具体地,确定模块82包括第三分析处理子模块821与样本确定子模块822,其中:
第三分析处理子模块821,用于根据当前预定生成对抗网络的权重值,通过基于不确定度约束的预定模型对T个测试图像分别进行分析处理,得到对应的T个不确定度预测结果;
样本确定子模块822,用于基于T个不确定度预测结果,从T个测试图像中确定出其中的K个,并将该K个作为测试图像样本。
进一步地,样本确定子模块822包括均值确定单元8221与选取单元8222,其中:
均值确定单元8221,用于确定T个不确定度预测结果各自对应的均值,并将确定得到的T个均值作为相对应的T个测试图像的T个不确定度值;
选取单元8222,用于根据预定的选取规则,从T个不确定度值中选取出其中满足第二预设条件的K个不确定度值,并将该K个不确定度值分别对应的测试图像作为测试图像样本。
进一步地,确定模块82还包括更新处理子模块823;
更新处理子模块823,用于通过将T个不确定度预测结果插入到原始不确定度学习集中,以对原始不确定度学习集进行更新,得到更新后的不确定度学习集;
选取单元8222具体用于根据预定的排列顺序,对更新后的不确定度学习集中的T个不确定度预测结果,依据T个不确定度值进行排序;以及用于根据排序结果,从T个不确定度值中选取出其中满足第二预设条件的K个不确定度值。
具体地,第二训练模块83包括第四分析处理子模块831与对抗训练子模块832,其中:
第四分析处理子模块831,用于通过基于不确定度约束的预定模型对K个源域图像样本及K个测试图像样本分别进行分析处理,得到K个源域图像样本分别对应的第一图像特征与K个测试图像样本分别对应的第二图像特征;
对抗训练子模块832,用于根据第一图像特征与第二图像特征,对预定生成对抗网络进行对抗训练以更新预定生成对抗网络的权重值。
进一步地,第四分析处理子模块731包括第一图像特征处理单元8311与第二图像特征处理单元8312,其中:
第一图像特征处理单元8311,用于通过预定的密集特征获取模块确定任一源域图像样本的第三密集特征,并通过预定的采样编码模块确定任一源域图像样本的第一图像样本,以及对第三密集特征与任一源域图像样本的第一图像样本进行连接处理,得到任一源域图像样本的第一图像特征;
第二图像特征处理单元8312,用于通过预定的密集特征获取模块确定任一测试图像样本的第四密集特征,并通过预定的采样编码模块确定任一测试图像样本的第一图像样本,以及对第四密集特征与任一测试图像样本的第一图像样本进行连接处理,得到任一测试图像样本的第二图像特征。
图9为本申请又一实施例提供的基于训练后的预定模型识别图像的装置的结构示意图,如图9所示,该装置90可以包括获取模块91与识别处理模块92,其中:
获取模块91,用于获取待进行图像识别的目标图像;
识别处理模块92,用于基于上述的模型训练方法得到的训练后的预定模型,对目标图像进行识别处理,得到相应的图像识别结果。
本申请实施例提供的装置,通过获取待进行图像识别的目标图像以及基于训练后的预定模型对目标图像进行识别处理,可以得到解决了域偏移现象后的稳定可靠的图像识别结果,进一步证明训练后的预定模型具有良好的健壮性和通用性,可被广泛应用于不同设备的OCT图像分类及分割算法中。
本申请另一实施例提供了一种电子设备,如图10所示,图10所示的电子设备1000包括:处理器1001和存储器1003。其中,处理器1001和存储器1003相连,如通过总线1002相连。进一步地,电子设备1000还可以包括收发器1004。需要说明的是,实际应用中收发器1004不限于一个,该电子设备1000的结构并不构成对本申请实施例的限定。
其中,处理器1001应用于本申请实施例中,可以用于实现图7与图8所示的第一训练模块、确定模块、第二训练模块及处理模块的功能,也可以用于实现图9所示的获取模块与识别处理模块的功能。
处理器1001可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器1001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线1002可包括一通路,在上述组件之间传送信息。总线1002可以是PCI总线或EISA总线等。总线1002可以分为地址总线、数据总线、控制总线等。为便于表示,图10中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器1003可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器1003用于存储执行本申请方案的应用程序代码,并由处理器1001来控制执行。处理器1001用于执行存储器1003中存储的应用程序代码,以实现图7或图8所示实施例提供的模型训练装置的动作,或者实现图9所示实施例提供的基于训练后的预定模型的图像识别装置。
本申请实施例提供的电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时,可实现如下几种情况:
情况一:通过基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型这一过程,使得可以根据不确定度约束对预定模型进行参数调整,充分考虑了不确定度约束对分割性能的影响,极大增强分割能力;通过根据基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本这一过程,以及基于K个训练图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值这一过程,使得可以对训练图像样本与测试图像样本进行充分的对抗训练,从而能够意识到训练图像样本与测试图像样本之间的差异部分,提升域对齐性能,极大降低域偏移现象的发生,通过重复执行上述三个过程,直至基于不确定度约束的预定模型满足第一预定条件,可以得到一个能够对目标域图像进行有效分割的训练后的预定模型,使得该训练后的预定模型具有良好的健壮性和通用性,可被广泛应用于不同设备的OCT图像分类、分割算法中,并给出稳定可靠的分割结果。
情况二:通过获取待进行图像识别的目标图像以及基于训练后的预定模型对目标图像进行识别处理,可以得到解决了域偏移现象后的稳定可靠的图像识别结果,进一步证明训练后的预定模型具有良好的健壮性和通用性,可被广泛应用于不同设备的OCT图像分类及分割算法中。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述任一实施例所示的方法。具体可实现如下几种情况:
情况一:通过基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型这一过程,使得可以根据不确定度约束对预定模型进行参数调整,充分考虑了不确定度约束对分割性能的影响,极大增强分割能力;通过根据基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本这一过程,以及基于K个训练图像样本、K个测试图像样本及基于不确定度约束的预定模型,对预定生成对抗网络进行训练以更新其权重值这一过程,使得可以对训练图像样本与测试图像样本进行充分的对抗训练,从而能够意识到训练图像样本与测试图像样本之间的差异部分,提升域对齐性能,极大降低域偏移现象的发生,通过重复执行上述三个过程,直至基于不确定度约束的预定模型满足第一预定条件,可以得到一个能够对目标域图像进行有效分割的训练后的预定模型,使得该训练后的预定模型具有良好的健壮性和通用性,可被广泛应用于不同设备的OCT图像分类、分割算法中,并给出稳定可靠的分割结果。
情况二:通过获取待进行图像识别的目标图像以及基于训练后的预定模型对目标图像进行识别处理,可以得到解决了域偏移现象后的稳定可靠的图像识别结果,进一步证明训练后的预定模型具有良好的健壮性和通用性,可被广泛应用于不同设备的OCT图像分类及分割算法中。
本申请实施例提供的计算机可读存储介质适用于上述方法的任一实施例。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (15)

1.一种模型训练的方法,其特征在于,包括:
基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型;
根据所述基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本,T和K为正整数;
基于K个训练图像样本、所述K个测试图像样本及所述基于不确定度约束的预定模型,对所述预定生成对抗网络进行训练以更新其权重值;
重复执行所述基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型、所述根据所述基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本、以及所述基于K个训练图像样本、所述K个测试图像样本及所述基于不确定度约束的预定模型,对所述预定生成对抗网络进行训练以更新其权重值,直至所述基于不确定度约束的预定模型满足第一预定条件。
2.根据权利要求1所述的方法,其特征在于,所述训练图像样本包括源域图像样本与所述源域图像样本的标注图像;
所述基于K个训练图像样本、所述K个测试图像样本及所述基于不确定度约束的预定模型,对所述预定生成对抗网络进行训练以更新其权重值,包括:
基于K个源域图像样本、所述K个测试图像样本及所述基于不确定度约束的预定模型,对所述预定生成对抗网络进行训练以更新其权重值。
3.根据权利要求2所述的方法,其特征在于,所述预定图像处理模块包括预定的密集特征获取模块、预定的分布编码器、预定的采样编码模块及KL散度损失。
4.根据权利要求3所述的方法,其特征在于,所述预定的分布编码器包括后验分布编码器和先验分布编码器,所述基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型,包括:
通过所述后验分布编码器,利用所述源域图像样本与所述源域图像样本的标注图像进行训练拟合,得到相应的后验高斯分布;
通过所述先验分布编码器,利用所述源域图像样本进行训练拟合,得到相应的先验高斯分布;
根据KL散度损失对所述先验高斯分布向所述后验高斯分布进行逼近处理,并对逼近处理后的先验高斯分布进行M次采样,得到M个先验高斯样本;
通过所述预定的采样编码模块,对所述M个先验高斯样本分别与所述源域图像样本的第一密集特征叠加后进行卷积处理,所述第一密集特征是通过预定的密集特征获取模块对所述源域图像样本进行相应处理得到的;
基于卷积处理结果确定所述预定模型的不确定度约束损失,并根据所述不确定度约束损失更新所述预定模型的相应参数,得到基于不确定度约束的预定模型。
5.根据权利要求4所述的方法,其特征在于,通过所述预定的采样编码模块,对所述M个先验高斯样本分别与所述源域图像样本的第一密集特征叠加后进行卷积处理,包括:
将所述M个先验高斯样本分别插入到所述第一密集特征中,得到M个第二密集特征;
通过预定的采样编码模块对所述M个第二密集特征分别进行卷积处理,得到M个第一图像样本。
6.根据权利要求5所述的方法,其特征在于,所述基于卷积处理结果确定所述预定模型的不确定度约束损失,包括:
计算所述M个第一图像样本的均值,并根据所述均值确定所述源域图像样本的源域预测结果;
计算所述M个第一图像样本的方差,并根据所述方差确定所述源域图像样本的源域不确定度图;
基于预定的不确定度约束损失计算方式,根据所述源域预测结果、所述源域不确定度图及所述源域图像样本的标注图像,确定所述预定模型的不确定度约束损失。
7.根据权利要求1所述的方法,其特征在于,所述根据所述基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本,包括:
通过所述基于不确定度约束的预定模型,对所述T个测试图像分别进行分析处理,得到对应的T个不确定度预测结果;
基于所述T个不确定度预测结果,从所述T个测试图像中以预定规则确定出其中的K个,并将该K个作为测试图像样本。
8.根据权利要求7所述的方法,其特征在于,所述基于所述T个不确定度预测结果,从所述T个测试图像中以预定规则确定出其中的K个,并将该K个作为测试图像样本,包括:
确定所述T个不确定度预测结果各自对应的均值,并将确定得到的T个均值作为相对应的T个测试图像的T个不确定度值;
根据预定的选取规则,从所述T个不确定度值中选取出其中满足第二预设条件的K个不确定度值,并将该K个不确定度值分别对应的测试图像作为测试图像样本。
9.根据权利要求8所述的方法,其特征在于,在所述基于所述T个不确定度的预测结果,从所述T个测试图像中确定出其中的K个,并将该K个作为测试图像样本之前,还包括:
通过将所述T个不确定度预测结果插入到原始不确定度学习集中,以对原始不确定度学习集进行更新,得到更新后的不确定度学习集;
所述根据预定的选取规则,从所述T个不确定度值中选取出其中满足第二预设条件的K个不确定度值,包括:
根据预定的排列顺序,对更新后的不确定度学习集中的T个不确定度预测结果,依据所述T个不确定度值进行排序;
根据排序结果,从所述T个不确定度值中选取出其中满足第二预设条件的K个不确定度值。
10.根据权利要求2所述的方法,其特征在于,基于K个源域图像样本、所述K个测试图像样本及所述基于不确定度约束的预定模型,对所述预定生成对抗网络进行训练以更新其权重值,包括:
通过所述基于不确定度约束的预定模型对所述K个源域图像样本及所述K个测试图像样本分别进行分析处理,得到K个源域图像样本分别对应的第一图像特征与所述K个测试图像样本分别对应的第二图像特征;
根据所述第一图像特征与所述第二图像特征,对所述预定生成对抗网络进行对抗训练以更新其权重值。
11.一种基于训练后的模型识别图像的方法,其特征在于,包括:
获取待进行图像识别的目标图像;
基于权利要求1-10任一项所述的方法得到的训练后的模型,对所述目标图像进行识别处理,得到相应的图像识别结果。
12.一种模型训练装置,其特征在于,包括:
第一训练模块,用于基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型;
确定模块,用于根据所述基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本,T和K为正整数;
第二训练模块,用于基于K个训练图像样本、所述K个测试图像样本及所述基于不确定度约束的预定模型,对所述预定生成对抗网络进行训练以更新其权重值;
处理模块,用于重复执行所述基于当前预定生成对抗网络的权重值,根据训练图像样本,通过预定图像处理模块,对预定模型进行训练以更新其相应参数,得到基于不确定度约束的预定模型、所述根据所述基于不确定度约束的预定模型,从T个测试图像中以预定规则确定出K个测试图像样本、以及所述基于K个训练图像样本、所述K个测试图像样本及所述基于不确定度约束的预定模型,对所述预定生成对抗网络进行训练以更新其权重值,直至所述基于不确定度约束的预定模型满足第一预定条件。
13.一种基于训练后的模型识别图像的装置,其特征在于,包括:
获取模块,用于获取待进行图像识别的目标图像;
识别处理模块,用于基于权利要求1-10任一项所述的方法得到的训练后的预定模型,对所述目标图像进行识别处理,得到相应的图像识别结果。
14.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-10任一项所述的模型训练方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现权利要求1-10任一项所述的模型训练方法。
CN201910425520.XA 2019-05-21 2019-05-21 模型训练方法、装置、电子设备及计算机可读存储介质 Active CN110135508B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910425520.XA CN110135508B (zh) 2019-05-21 2019-05-21 模型训练方法、装置、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910425520.XA CN110135508B (zh) 2019-05-21 2019-05-21 模型训练方法、装置、电子设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110135508A true CN110135508A (zh) 2019-08-16
CN110135508B CN110135508B (zh) 2022-11-29

Family

ID=67572017

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910425520.XA Active CN110135508B (zh) 2019-05-21 2019-05-21 模型训练方法、装置、电子设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110135508B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110610500A (zh) * 2019-09-06 2019-12-24 北京信息科技大学 基于动态语义特征的新闻视频自适应拆条方法
CN113205082A (zh) * 2021-06-22 2021-08-03 中国科学院自动化研究所 基于采集不确定性解耦的鲁棒虹膜识别方法
CN113850219A (zh) * 2021-09-30 2021-12-28 广州文远知行科技有限公司 一种数据收集方法、装置、交通工具及存储介质
CN114399640A (zh) * 2022-03-24 2022-04-26 之江实验室 一种不确定区域发现与模型改进的道路分割方法及装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2774158A1 (en) * 2009-09-15 2011-03-24 The University Of Sydney A method and system for multiple dataset gaussian process modeling
KR20120070660A (ko) * 2010-12-22 2012-07-02 한양대학교 산학협력단 다물체 모델링과 통계 방법론을 이용한 인체 하지부 구속력의 불확실성 추정 방법
CN105163684A (zh) * 2013-03-15 2015-12-16 圣纳普医疗(巴巴多斯)公司 手术数据的联运同步
CN106169085A (zh) * 2016-07-11 2016-11-30 天津大学 基于信息度量的特征选择方法
WO2018028255A1 (zh) * 2016-08-11 2018-02-15 深圳市未来媒体技术研究院 基于对抗网络的图像显著性检测方法
WO2018109505A1 (en) * 2016-12-15 2018-06-21 Google Llc Transforming source domain images into target domain images
CN108537801A (zh) * 2018-03-29 2018-09-14 山东大学 基于生成对抗网络的视网膜血管瘤图像分割方法
CN108765481A (zh) * 2018-05-25 2018-11-06 亮风台(上海)信息科技有限公司 一种单目视频的深度估计方法、装置、终端和存储介质
CN108921851A (zh) * 2018-06-06 2018-11-30 深圳市未来媒体技术研究院 一种基于3d对抗网络的医学ct图像分割方法
CN109299716A (zh) * 2018-08-07 2019-02-01 北京市商汤科技开发有限公司 神经网络的训练方法、图像分割方法、装置、设备及介质
CN109345515A (zh) * 2018-09-17 2019-02-15 代黎明 样本标签置信度计算方法、装置、设备及模型训练方法
CN109461495A (zh) * 2018-11-01 2019-03-12 腾讯科技(深圳)有限公司 一种医学图像的识别方法、模型训练的方法及服务器

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2774158A1 (en) * 2009-09-15 2011-03-24 The University Of Sydney A method and system for multiple dataset gaussian process modeling
KR20120070660A (ko) * 2010-12-22 2012-07-02 한양대학교 산학협력단 다물체 모델링과 통계 방법론을 이용한 인체 하지부 구속력의 불확실성 추정 방법
CN105163684A (zh) * 2013-03-15 2015-12-16 圣纳普医疗(巴巴多斯)公司 手术数据的联运同步
CN106169085A (zh) * 2016-07-11 2016-11-30 天津大学 基于信息度量的特征选择方法
WO2018028255A1 (zh) * 2016-08-11 2018-02-15 深圳市未来媒体技术研究院 基于对抗网络的图像显著性检测方法
WO2018109505A1 (en) * 2016-12-15 2018-06-21 Google Llc Transforming source domain images into target domain images
CN108537801A (zh) * 2018-03-29 2018-09-14 山东大学 基于生成对抗网络的视网膜血管瘤图像分割方法
CN108765481A (zh) * 2018-05-25 2018-11-06 亮风台(上海)信息科技有限公司 一种单目视频的深度估计方法、装置、终端和存储介质
CN108921851A (zh) * 2018-06-06 2018-11-30 深圳市未来媒体技术研究院 一种基于3d对抗网络的医学ct图像分割方法
CN109299716A (zh) * 2018-08-07 2019-02-01 北京市商汤科技开发有限公司 神经网络的训练方法、图像分割方法、装置、设备及介质
CN109345515A (zh) * 2018-09-17 2019-02-15 代黎明 样本标签置信度计算方法、装置、设备及模型训练方法
CN109461495A (zh) * 2018-11-01 2019-03-12 腾讯科技(深圳)有限公司 一种医学图像的识别方法、模型训练的方法及服务器

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
A KENDALL等: ""Bayesian segnet:Model uncertainty in deep convolutional encoder-decorder architecture for scene understanding"", 《ARXIV》 *
KITTANEH O A等: ""Average entropy:a new uncertainty measure with application to image segmentation"", 《THE AMERICAN STATISTICIAN》 *
KOHL S等: ""A probability U-net for Segmentation of ambiguous images"", 《NEURIPS》 *
ZOU Y等: ""Unsupervised domain adaptation for semantic Segmentation via class-balanced self-tranining"", 《ECCV》 *
孙汉卿等: ""一种自学习不确定度的神经网络架构"", 《光学学报》 *
李建龙等: ""水声无源材料插入损失测量时反聚焦方法"", 《声学学报》 *
蒋芸等: ""基于条件深度卷积生成对抗网络的视网膜血管分割"", 《自动化学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110610500A (zh) * 2019-09-06 2019-12-24 北京信息科技大学 基于动态语义特征的新闻视频自适应拆条方法
CN113205082A (zh) * 2021-06-22 2021-08-03 中国科学院自动化研究所 基于采集不确定性解耦的鲁棒虹膜识别方法
CN113850219A (zh) * 2021-09-30 2021-12-28 广州文远知行科技有限公司 一种数据收集方法、装置、交通工具及存储介质
CN114399640A (zh) * 2022-03-24 2022-04-26 之江实验室 一种不确定区域发现与模型改进的道路分割方法及装置
CN114399640B (zh) * 2022-03-24 2022-07-15 之江实验室 一种不确定区域发现与模型改进的道路分割方法及装置

Also Published As

Publication number Publication date
CN110135508B (zh) 2022-11-29

Similar Documents

Publication Publication Date Title
CN110135508A (zh) 模型训练方法、装置、电子设备及计算机可读存储介质
CN106920227B (zh) 基于深度学习与传统方法相结合的视网膜血管分割方法
CN110837803B (zh) 基于深度图网络的糖尿病视网膜病变分级方法
CN106934798B (zh) 基于深度学习的糖尿病视网膜病变分类分级方法
CN109862949A (zh) 用于跟踪篮球球员表现的系统和方法
CN110490802A (zh) 一种基于超分辨率的卫星影像飞机目标型号识别方法
CN106682389A (zh) 一种用于监控高血压引发的眼部病变健康管理系统
CN112686385A (zh) 面向多站点三维影像的联邦深度学习方法及系统
CN102567734B (zh) 基于比值的视网膜细小血管分割方法
CN104102899B (zh) 视网膜血管识别方法及装置
CN110516685A (zh) 基于卷积神经网络的晶状体浑浊程度检测方法
CN110188613A (zh) 图像分类方法及设备
CN109847366A (zh) 用于游戏的数据处理方法和装置
Kunanusont et al. General video game ai: Learning from screen capture
US11393085B2 (en) Image analysis using machine learning and human computation
CN112101424A (zh) 一种视网膜病变识别模型的生成方法、识别装置及设备
Chen et al. Scanpath Prediction for Visual Attention using IOR-ROI LSTM.
CN110533113A (zh) 一种数字图像中树状结构的分支点检测方法
KR20190087681A (ko) 자궁경부암에 대한 피검체의 발병 여부를 판정하는 방법
Cacioppo et al. Intention understanding over T: a neuroimaging study on shared representations and tennis return predictions
CN109727238A (zh) X光胸片的识别方法及装置
Hong et al. Deep learning model generalization with ensemble in endoscopic images
Qadri et al. Pigeons and humans use action and pose information to categorize complex human behaviors
CN110427998A (zh) 模型训练、目标检测方法及装置、电子设备、存储介质
CN110503636A (zh) 参数调整方法、病灶预测方法、参数调整装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant