CN109447149A - 一种检测模型的训练方法、装置及终端设备 - Google Patents

一种检测模型的训练方法、装置及终端设备 Download PDF

Info

Publication number
CN109447149A
CN109447149A CN201811251214.0A CN201811251214A CN109447149A CN 109447149 A CN109447149 A CN 109447149A CN 201811251214 A CN201811251214 A CN 201811251214A CN 109447149 A CN109447149 A CN 109447149A
Authority
CN
China
Prior art keywords
model
user
training
domain
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811251214.0A
Other languages
English (en)
Other versions
CN109447149B (zh
Inventor
程陈
孙钟前
陈豪
杨巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Healthcare Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201811251214.0A priority Critical patent/CN109447149B/zh
Publication of CN109447149A publication Critical patent/CN109447149A/zh
Priority to JP2020562170A priority patent/JP7382964B2/ja
Priority to PCT/CN2019/090521 priority patent/WO2020082748A1/zh
Priority to EP19877123.0A priority patent/EP3872705A4/en
Priority to US17/084,475 priority patent/US11315677B2/en
Application granted granted Critical
Publication of CN109447149B publication Critical patent/CN109447149B/zh
Priority to US17/699,801 priority patent/US11817206B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images
    • G06V2201/031Recognition of patterns in medical or anatomical images of internal organs

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Multimedia (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Pathology (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明实施例公开了一种检测模型的训练方法、装置及终端设备,应用于信息处理技术领域。训练装置会先确定初始训练模型中包括初始检测模型和自适应模型,及包括已进行病变目标信息标注的源域数据和未进行病变目标信息标注的目标域数据;然后再根据初始检测模型和自适应模型对训练样本中的数据进行处理后,分别得到检测结果和域分类结果;最后再根据检测结果和域分类结果及上述的训练样本计算相关的损失函数值,并根据损失函数值对初始训练模型中的固定参数值进行调整,以得到最终的检测模型。使得在病变目标信息标注困难的情况下,也能使用未标注病变目标信息的图像,以使得训练样本足够多,使得最终训练得到的检测模型的效果较好。

Description

一种检测模型的训练方法、装置及终端设备
技术领域
本发明涉及信息处理技术领域,特别涉及一种检测模型的训练方法、装置及终端设备。
背景技术
近年来,人工智能在医疗影像领域中的发挥着越来越大的作用。基于深度学习方法的结直肠息肉的检测系统,对上百万张金标的结直肠数据进行学习训练,辅助临床医生诊断,降低漏检率。
在一种具体的结直肠息肉的检测系统中:使用卷积神经网络对待检测图像进行特征提取,再通过支持向量机方法进行分类。在通过支持向量机方法进行分类时,先确定待检测图像中有无息肉的存在,然后对待检测图像中的息肉进行性质分类。
其中,在训练卷积神经网络和支持向量机时使用的数据是私有数据,数据量较少,这样得到的系统的检测效果不佳;且由于每个医院采用的设备不同以及不同医生之间的操作习惯不同,从不同医院采集的影像数据存在一定的差异性,例如影像的分辨率,背景噪声,这导致在不同医院推广结直肠息肉的检测系统时,检测效果会大打折扣。
通过收集更多的训练数据,涵盖更多医院的数据,这在一定程度上是可以改善这种情况,但是,训练数据中结直肠的数据需要专业的医师对训练图片进行标注,收集更多的数据将会耗费巨大的财力和时间。
发明内容
本发明实施例提供一种检测模型的训练方法、装置及终端设备,实现了根据初始检测模型和自适应模型训练最终的检测模型。
本发明实施例第一方面提供一种检测模型的训练方法,包括:
确定初始训练模型,所述初始训练模型中包括初始检测模型和自适应模型;
确定训练样本,所述训练样本中包括源域数据和目标域数据,所述源域数据中包括多个第一用户身体器官图像,各个第一用户身体器官图像中是否包括病变目标的第一标识及各个第一用户身体器官图像所属域的第二标识;所述目标域数据中包括多个第二用户身体器官图像及各个第二用户身体器官图像所属域的第三标识;
由所述初始检测模型根据各个第一用户身体器官图像的特征分别确定各个第一用户身体器官图像中是否包括病变目标,得到检测结果;及由所述自适应模型根据各个用户身体器官图像的特征分别确定所述训练样本中各个用户身体器官图像所属域,得到域分类结果;
根据所述检测结果和域分类结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值;
根据所述损失函数值调整所述初始训练模型中的固定参数值,以得到最终的检测模型。
本发明实施例第二方面还提供一种训练装置,包括:
模型确定单元,用于确定初始训练模型,所述初始训练模型中包括初始检测模型和自适应模型;
样本确定单元,用于确定训练样本,所述训练样本中包括源域数据和目标域数据,所述源域数据中包括多个第一用户身体器官图像,各个第一用户身体器官图像中是否包括病变目标的第一标识及各个第一用户身体器官图像所属域的第二标识;所述目标域数据中包括多个第二用户身体器官图像及各个第二用户身体器官图像所属域的第三标识;
模型处理单元,用于由所述初始检测模型根据各个第一用户身体器官图像的特征分别确定各个第一用户身体器官图像中是否包括病变目标,得到检测结果;及由所述自适应模型根据各个用户身体器官图像的特征分别确定所述训练样本中各个用户身体器官图像所属域,得到域分类结果;
损失函数单元,用于根据所述检测结果和域分类结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值;
调整单元,用于根据所述损失函数值调整所述初始训练模型中的固定参数值,以得到最终的检测模型。
本发明实施例第三方面提供一种存储介质,所述存储介质储存多条指令,所述指令适于由处理器加载并执行如上述本发明实施例第一方面所述的检测模型的训练方法。
本发明实施例第三方面提供一种终端设备,包括处理器和存储介质,所述处理器,用于实现各个指令;
所述存储介质用于储存多条指令,所述指令用于由处理器加载并执行如上述本发明实施例第一方面所述的检测模型的训练方法。
可见,在本实施例的方法中,训练装置在对用于检测用户身体器官图像中病变目标的检测模型进行训练时,会先确定初始训练模型中包括初始检测模型和自适应模型,及包括已进行病变目标信息标注的源域数据和未进行病变目标信息标注的目标域数据;然后再根据初始检测模型和自适应模型对训练样本中的数据进行处理后,分别得到检测结果和域分类结果;最后再根据检测结果和域分类结果及上述的训练样本计算相关的损失函数值,并根据损失函数值对初始训练模型中的固定参数值进行调整,以得到最终的检测模型。这样,在训练检测模型的过程中,一部分训练样本的数据使用已进行病变目标信息标注的源域数据,另一部分训练样本的数据未进行病变目标信息标注的目标域数据,使得在病变目标信息标注困难的情况下,也能使用未标注病变目标信息的图像作为训练样本,以使得训练样本足够多,最终训练得到的检测模型的效果较好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种检测模型的训练方法的示意图;
图2是本发明实施例提供的一种检测模型的训练方法的流程图;
图3是本发明应用实施例提供的一种检测模型的训练方法的流程图;
图4是本发明应用实施例中确定的一种初始训练模型的示意图;
图5是本发明应用实施例中确定的另一种初始训练模型的示意图;
图6是本发明实施例提供的一种训练装置的结构示意图;
图7是本发明实施例提供的一种终端设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排它的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供一种检测模型的训练方法,主要应用于训练装置中,参考图1所示,训练装置可以通过如下的步骤训练检测模型:
确定初始训练模型,所述初始训练模型中包括初始检测模型和自适应模型;确定训练样本,所述训练样本中包括源域数据和目标域数据,所述源域数据中包括多个第一用户身体器官图像,各个第一用户身体器官图像中是否包括病变目标的第一标识及各个第一用户身体器官图像所属域的第二标识;所述目标域数据中包括多个第二用户身体器官图像及各个第二用户身体器官图像所属域的第三标识;由所述初始检测模型根据各个第一用户身体器官图像的特征分别确定各个第一用户身体器官图像中是否包括病变目标,得到检测结果;及由所述自适应模型根据各个用户身体器官图像的特征分别确定所述训练样本中各个用户身体器官图像所属域,得到域分类结果;根据所述检测结果和域分类结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值;根据所述损失函数值调整所述初始训练模型中的固定参数值,以得到最终的检测模型。
这样,在训练检测模型的过程中,一部分训练样本的数据使用已进行病变目标信息标注的源域数据,另一部分训练样本的数据未进行病变目标信息标注的目标域数据,使得在病变目标信息标注困难的情况下,也能使用未标注病变目标信息的图像作为训练样本,以使得训练样本足够多,最终训练得到的检测模型的效果较好。
本发明实施例提供一种检测模型的训练方法,主要是训练装置所执行的方法,该训练装置训练得到的检测模型主要用于检测某一图像中是否包括身体的病变目标,流程图如图2所示,包括:
步骤101,确定初始训练模型,初始训练模型中包括初始检测模型和自适应模型。
可以理解,用户可以操作训练装置,使得训练装置发起本实施例中对检测模型的训练,当训练装置在确定初始训练模型时,会确定初始检测模型所包括的多层结构和各层机构中固定参数的初始值。其中,初始检测模型中的多层结构可以是如下任一种算法结构:卷积神经网络(Convolutional Neural Network,CNN),K最近邻算法(K nearestneighbors,KNN),奇异值分解(singular value decomposition,SVD)及非负矩阵分解(Non-negative Matrix Factorization,NMF)等。
具体地,训练装置确定的初始检测模型可以包括特征提取模块和检测分类模块,自适应模型包括域分类模块,其中:特征提取模块用于进行特征的提取;检测分类模块用于根据特征提取模块提取的特征进行是否有病变目标的分类;域分类模块用于根据特征提取模块提取的特征进行域分类。这样初始检测模型和自适应模型之间共用了特征提取模块提取的特征。
进一步地,训练装置还会确定初始检测模型与自适应模型中固定参数的初始值,这里,固定参数是指初始训练模型中各层结构在计算过程中所用到的固定的,不需要随时赋值的参数,比如权重,角度等参数。
在一种具体的实现中,在自适应模型中还可以包括梯度反转模块,梯度反转模块用于将特征提取模块提取的特征传递给域分类模块,且用于在调整固定参数值的过程中,对域分类模块的误差进行反转(比如将域分类模块的误差乘以一个负数),以根据反转后的误差调整特征提取模块中的固定参数值。
这样由于训练过程是不断地对初始训练模型中固定参数进行优化的过程,而在训练过程中特征提取模块与梯度反转模块这两部分形成一种对抗关系,对特征提取模块中固定参数的优化,使得域分类模块的误差上升,而通过梯度反转模块,使得域分类模块的误差下降,直到趋于平衡状态。
步骤102,确定训练样本,训练样本中包括源域数据和目标域数据,源域数据中包括多个第一用户身体器官图像,各个第一用户身体器官图像中是否包括病变目标的第一标识及各个第一用户身体器官图像所属域的第二标识;目标域数据中包括多个第二用户身体器官图像及各个第二用户身体器官图像所属域的第三标识。
进一步地,对于第一用户身体器官图像中的部分用户身体器官图像,部分用户身体器官图像中包括病变目标,在源域数据中还可以包括这部分用户身体器官图像中包括的病变目标的类型和位置。
步骤103,由初始检测模型根据各个第一用户身体器官图像的特征分别确定各个第一用户身体器官图像中是否包括病变目标,得到检测结果;及由自适应模型根据各个用户身体器官图像的特征分别确定训练样本中各个用户身体器官图像(包括第一用户身体器官图像和第二用户身体器官图像)所属域,得到域分类结果。
进一步地,如果在源域数据中包括部分用户身体器官图像中包括的病变目标的类型和位置,则还需要通过初始检测模型分别确定这部分用户身体器官图像中所包括的病变目标的类型和位置,得到目标检测结果。
步骤104,根据检测结果和域分类结果及第一标识、第二标识和第三标识,计算与初始训练模型相关的损失函数值。
这里,与初始训练模型相关的损失函数可以包括检测损失函数和自适应损失函数,而上述初始训练模型的整体损失函数可以包括检测损失函数与自适应损失函数的函数计算值,比如加权和值等。其中,检测损失函数包括:用于表示根据初始训练模型中初始检测模型确定的训练样本中第一用户身体器官图像是否包括病变目标的信息,与各个第一用户身体器官图像实际是否包括病变目标(即上述源域数据中包括的第一标识)之间的差别,即第一误差;自适应损失函数用于表示根据初始训练模型中自适应模型确定的训练样本中各个用户身体器官图像属于源域或目标域的信息,与各个用户身体器官图像实际属于某一域的信息(即上述第二标识和第三标识)之间的差别,即第二误差。
进一步地,检测损失函数还包括:用于表示初始训练模型中初始检测模型确定的训练样本中上述部分用户身体器官图像中病变目标的类型和位置,与这部分用户身体器官图像中病变目标的实际类型和实际位置(即训练样本中包括的源域数据中标注的类型和位置)之间的差别,即第三误差。这样,检测损失函数就可以包括上述第一误差与第二误差的函数计算值,比如加权和值等。
上述第一误差或第二误差或第三误差的数学表现形式通常使用交叉熵来建立损失函数,而检测模型的训练过程就是需要尽量减少上述误差的值,该训练过程是通过反向传播求导以及梯度下降等一系列数学优化手段不断的优化上述步骤102中确定的固定参数的初始值,并使得这一函数的计算值降至最低。因此,在执行本步骤104后,训练装置需要执行步骤105中的调整步骤。
步骤105,根据损失函数值调整初始训练模型中的固定参数值,以得到最终的检测模型。
具体地,如果计算的损失函数的函数值较大,比如大于预置的值,则需要改变固定参数值,比如将某个权重的权重值减小等,使得按照调整后的固定参数值计算的损失函数的函数值减小。
需要说明的是,上述步骤103到105是通过初始训练模型对训练样本中各个用户身体器官图像进行处理得到检测结果和域分类结果后,根据检测结果和域分类结果对初始训练模型中的固定参数值的一次调整,而在实际应用中,需要通过不断地循环执行上述步骤103到105,直到对固定参数值的调整满足一定的停止条件为止。
因此,训练装置在执行了上述实施例步骤101到105之后,还需要判断当前对固定参数值的调整是否满足预置的停止条件,如果满足,则结束流程;如果不满足,则针对调整固定参数值后的初始训练模型,返回执行上述步骤103到105的步骤。
其中,预置的停止条件包括但不限于如下条件中的任何一个:当前调整的固定参数值与上一次调整的固定参数值的差值小于一阈值,即调整的固定参数值达到收敛;及对固定参数值的调整次数达到预置的次数等。
进一步需要说明的是,如果训练装置确定的最终的检测模型后,在对待检测用户身体器官图像进行检测时,先确定待检测用户身体器官图像,然后可以直接根据最终的检测模型,确定待检测用户身体器官图像中是否包括病变目标,且如果包括病变目标,该病变目标的类型和位置。其中,在确定待检测用户身体器官图像时,可以先确定用户身体器官的原始图像,然后对该原始图像进行预处理,比如增强,去燥等处理后得到待检测用户身体器官图像,使得之后根据最终的检测模型对待检测用户身体器官图像的检测,不会受到图像本身缺陷的影响。
可见,在本实施例的方法中,训练装置在对用于检测用户身体器官图像中病变目标的检测模型进行训练时,会先确定初始训练模型中包括初始检测模型和自适应模型,及包括已进行病变目标信息标注的源域数据和未进行病变目标信息标注的目标域数据;然后再根据初始检测模型和自适应模型对训练样本中的数据进行处理后,分别得到检测结果和域分类结果;最后再根据检测结果和域分类结果及上述的训练样本计算相关的损失函数值,并根据损失函数值对初始训练模型中的固定参数值进行调整,以得到最终的检测模型。这样,在训练检测模型的过程中,一部分训练样本的数据使用已进行病变目标信息标注的源域数据,另一部分训练样本的数据未进行病变目标信息标注的目标域数据,使得在病变目标信息标注困难的情况下,也能使用未标注病变目标信息的图像,以使得训练样本足够多,使得最终训练得到的检测模型的效果较好。
以下以一个具体的应用实例来说明本实施例中检测模型的训练方法,本实施例的方法应用于对结直肠图像中息肉的检测,本实施例的方法可以包括如下两个部分:
(一)参考图3所示,检测模型的训练可以包括如下步骤:
步骤201,确定初始训练模型。
参考图4所示,训练装置可以先确定初始训练模型的结构包括:初始检测模型和自适应模型,其中,初始检测模型包括特征提取模块(即图3中所示的卷积神经网络)和检测分类模块,而自适应模型包括梯度反转模块(即图3中所示的梯度反转层)和域分类模块。该梯度反转模块可以连接到特征提取模块的最终特征提取模块,或是连接到特征提取模块的中间特征提取模块。
然后训练装置初始化确定的初始训练模型,即确定初始训练模型中各个固定参数的初始值。
例如,如果上述初始检测模型为CNN算法结构,则确定的初始检测模型的多层结构可以包括卷积层和池化层(即特征提取模块),及全连接层和归一化层(即检测分类模块)。其中,卷积层用于提取输入图片的全部特征;池化层用于对卷积层得到的全部特征进行采样计算,得到输入图片中的关键性特征;全连接层用于根据采样后的特征计算各个输入图片属于某一类型的分数;归一化层用于根据全连接层计算的分数输出某一输入图片属于某一类型的的概率。在本实施例中,将任意结直肠图像作为输入图片。
这种情况下,上述的池化层即为特征提取模块的最终特征提取模块,能得到输入图片的最终的关键特征,从而使得之后的计算得到简化;卷积层即为特征提取模块的中间特征提取模块,可以得到输入图片的全部特征;且初始检测模型对应的固定参数可以包括:卷积核,池化核和全连接层中的计算参数比如权重值等。
步骤202,确定训练样本,在训练样本中包括源域数据和目标域数据,源域数据中包括多个第一结直肠图像(即用户身体器官图像),各个第一结直肠图像中是否包括息肉(即病变目标)的第一标识,部分结直肠图像(包括息肉的结直肠图像)中息肉的类型和位置及各个第一结直肠图像所属域的第二标识;在目标域数据中包括多个第二结直肠图像及各个第二结直肠图像所属域的第三标识。
这样,在源域数据中对第一结直肠图像中的息肉信息进行标注,而在目标数据中未对第二结直肠图像中的息肉信息进行标注。
步骤203,对于训练样本中的源域数据,由初始检测模型分别提取各个第一结直肠图像的特征,并分别根据各个第一结直肠图像的特征,确定各个第一结直肠图像中是否包括息肉,得到检测结果;且对于包括息肉的结直肠图像,需要初始检测模型分别检测各个第一结直肠图像中息肉的类型和位置,得到目标检测结果。
对于训练样本中的目标域数据,直接由自适应模型分别根据各个第二结直肠图像确定各个第二结直肠图像所属域的信息,得到域分类结果。在具体实现时,任一第二结直肠图像经过上述初值检测模型的特征提取模块中的最终特征提取模块或中间特征提取模块,提取到该第二结直肠图像的特征后,经过梯度反转模块将第二结直肠的特征传递给域分类模块,然后由域分类模块根据第二结直肠图像的特征进行域分类,在这个过程中,梯度反转模块不会对第二结直肠的特征做任何处理。
如图4所示,在训练过程中,第一结直肠图像的走向如图中实线箭头所标示,需要经过初始检测模型,还需要经过自适应模型中的梯度反转模块和域分类模块。而第二结直肠图像的走向如图中虚线箭头所标示,经过初始检测模型中的特征提取模块和自适应模型中的梯度反转模块和域分类模块。
具体地,当训练样本中各个结直肠图像经过特征提取模块提取到相应的特征后,如果该特征来自源域数据,则该提取的特征需要分别都经过检测分类模块,及梯度反转模块和域分类模块的处理;如果该特征来自目标域数据,则该提取的特征只需经过梯度反转模块和域分类模块的处理。
这样,通过特征提取模块从不同域数据中提取出共用的特性,剔除了域相关的特性,消除了目标域数据和源域数据的差异,使得从目标域数据和源域数据中提取的特征具有域不变性,从而使得从源域数据中学习到的分类和检测能力可以直接适用到目标域数据中。
步骤204,根据上述得到的检测结果、目标检测结果和域分类结果及第一标识、第二标识和第三标识,计算与初始训练模型相关的损失函数值。
具体地,与初始训练模型相关的损失函数值包括:初始检测模型的损失函数和自适应模型的损失函数的函数计算值,其中:初始检测模型的损失函数Ldet可以包括:检测损失函数L1(即上述的第一误差)、分类损失函数Lcls和定位的回归损失函数Lbox(即上述的第三误差),这样,初始检测模型的整体损失函数值可以通过如下公式1表示,其中,λ1和λ2是用于平衡检测损失函数、分类损失函数和定位的回归损失函数的常数:
Ldet=L1+λ1*Lcls+λ2*Lbox (1)
自适应模型的损失函数(即上述的第二误差)可以通过如下公式2的交叉熵来表示,其中Di为0时表示输入的图片是源域数据,Di为1时表示输入的图片是目标域数据;pi表示域分类模块最后输出属于源域数据的概率:
Ld=∑(Dilog(pi)+(1-Di)log(1-pi)) (2)
因此,与初始训练模型相关的损失函数可以通过如下公式3来表示,其中,β用于平衡自适应模型的损失函数和初始检测模型的损失函数:
L=Ldet+·β·Ld (3)
步骤205,根据损失函数值调整初始训练模型中的固定参数值。
通过上述步骤204计算得到整体的损失函数值后,训练装置可以逐层地对初始训练模型进行固定参数的初始值(主要是权重值)进行更新。在权重值的更新过程中,主要可以包括如下两种情况:
(1)对于初始训练模型中除梯度反转模块之外的其它模块
训练装置在对除梯度反转模块之外的其它模块的权重值进行更新时,是从后向前逐层进行更新,比如先更新检测分类模块和域分类模型中的权重值,然后再更新特征提取模块中的权重值。而对某一层的权重值进行更新时,可以根据损失函数值L和权重值w的对应关系,计算一个梯度,然后往梯度的方向更新该层的权重值,以使得误差最小化。例如,梯度为dL/dw2,w2为更新前的权重值,则更新后的权重值w1=w2-learning_rate*dL/dw,其中,learning_rate即学习率,用于控制每次权重值变化的步长。
其中,如果某一层是最后一层的模块,在计算该层的梯度时可以直接用损失函数值L作为该层的误差,进行梯度的计算;如果某一层非最后一层的模块,在计算该层的梯度时,需要将前一层的误差与该层的权重值的乘积作为该层的误差,进行梯度的计算。其中,前一层到该层的顺序是指初始训练模型中从后向前的顺序。
(2)对于梯度反转模块
梯度反转模块不包括权重值等任何固定参数,训练装置会先确定梯度反转模块前一层模块(即域分类模块)的误差,然后梯度反转模块将该误差与一个负数相乘,得到一个梯度,并作为梯度反转模块之后的一层模块的误差,实现了对该梯度反转模块之后的模块,即特征提取模块的梯度的反转,以使得域分类模块的误差最大化。
这样,初始检测模型中的特征提取模块的目的是:希望域分类模块尽可能的分错,而自适应模块是尽可能的使得域分类模块分对,最后达到平衡后,这样特征提取模块提取的特征就不包含域相关的特征信息,可以消除不同域的差异,消除域偏移的现象。
需要说明的是,上述确定的初始训练模型中特征提取模块提取的特征会经过梯度反转模块,并到达域分类模块。如图5所示,在其它实施例中,确定的初始训练模型中可以不包括梯度反转模块,这样特征提取模块提取的特征不会经过梯度反转模块,在这种情况下,需要训练装置在调整了域分类模块中的权重值后,执行上述梯度反转模块所执行的方法,以实现特征提取模块的梯度的反转。
步骤206,判断对固定参数值的调整是否满足如下任一预置的条件,如果不满足,则返回执行上述步骤203,如果满足,则结束流程:对固定参数值的调整次数达到预置的次数,当前调整的固定参数值与上一次调整的固定参数值的差值小于一阈值等。
通过不断地重复上述步骤203到206,即可得到最终的检测模型。
需要说明的是,由于结直肠图像中息肉的信息需要专业的医师进行标注,费用及其昂贵其所需时间长,而不同医院由于所使用的设备不同,导致结直肠图像数据分布差异较大,这样,收集的训练数据无法涵盖所有的医院。本发明的实施例中,将自适应模型应用到结直肠图像的检测模型中,只需已有的带标注的源域数据(包括第一结直肠图像),结合新医院的图像数据即目标域数据(包括第二结直肠图像),无需对目标域数据进行息肉的标注,使得对源域数据中第一结直肠图像的检测,可以应用到对目标域数据中第二结直肠图像中息肉的检测,且检测效果与在带息肉信息标注的结直肠图像的检测效果相当,解决了结直肠息肉检测系统推广时遇到的数据的域偏移现象,利于结直肠息肉检测系统在各个医院的推广。
(二)待检测结直肠图像的检测
将待检测结直肠图像输入到最终得到的检测模型中,即可得到该待检测结直肠图像是否包括息肉,且如果包括息肉,该息肉的类型和位置。
本发明实施例还提供一种训练装置,其结构示意图如图6所示,具体可以包括:
模型确定单元10,用于确定初始训练模型,所述初始训练模型中包括初始检测模型和自适应模型。
所述模型确定单元10,具体用于确定所述初始检测模型包括特征提取模块和检测分类模块,所述自适应模型包括域分类模块,其中:所述检测分类模块用于根据所述特征提取模块提取的特征进行是否有病变目标的分类;所述域分类模块用于根据特征提取模块提取的特征进行域分类;确定所述初始检测模型与自适应模型中固定参数的初始值。
其中,所述特征提取模块包括中间特征提取模块和最终特征提取模块,则所述域分类模块用于根据所述中间特征提取模块或最终特征提取模块提取的特征进行域分类;所述域分类模块有一个或多个。
进一步地,在自适应模型中还可以包括梯度反转模块,用于将所述特征提取模块提取的特征传递给所述域分类模块,且用于在调整所述固定参数值时,对所述域分类模块的误差进行反转,以根据所述反转后的误差调整所述特征提取模块中的固定参数值。
样本确定单元11,用于确定训练样本,所述训练样本中包括源域数据和目标域数据,所述源域数据中包括多个第一用户身体器官图像,各个第一用户身体器官图像中是否包括病变目标的第一标识及各个第一用户身体器官图像所属域的第二标识;所述目标域数据中包括多个第二用户身体器官图像及各个第二用户身体器官图像所属域的第三标识。
模型处理单元12,用于由所述模型确定单元10确定初始检测模型根据各个第一用户身体器官图像的特征分别确定所述样本确定单元11确定的源域数据中各个第一用户身体器官图像中是否包括病变目标,得到检测结果;及由所述自适应模型根据各个用户身体器官图像的特征分别确定所述训练样本中各个用户身体器官图像所属域,得到域分类结果。
损失函数单元13,用于根据所述模型处理单元12得到的检测结果和域分类结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值。
具体地,所述与所述初始训练模型相关的损失函数值,具体包括:检测损失函数和自适应损失函数的函数计算值,其中:所述检测损失函数包括:用于表示根据所述初始检测模型确定的第一用户身体器官图像是否包括病变目标的信息,与所述训练样本中的第一标识之间的第一误差;及用于表示根据所述初始检测模型确定的所述部分用户身体器官图像中病变目标的类型和位置,与所述训练样本中部分用户身体器官图像中病变目标的类型和位置的之间的第三误差;所述自适应损失函数包括:用于表示根据所述自适应模型确定的训练样本中各个用户身体器官图像属于源域或目标域的信息,与所述训练样本中第二标识和第三标识之间的第二误差。
调整单元14,用于根据所述损失函数单元13得到的损失函数值调整所述初始训练模型中的固定参数值,以得到最终的检测模型。
具体地,所述样本确定单元10确定的训练样本中,对于所述第一用户身体器官图像中的部分用户身体器官图像,所述部分用户身体器官图像中包括病变目标,所述源域数据中还包括:所述部分用户身体器官图像中包括的病变目标的类型和位置;则所述模型处理单元12,还用于通过所述初始检测模型分别确定所述部分用户身体器官图像中所包括的病变目标的类型和位置,得到目标检测结果;所述损失函数单元13,用于根据所述检测结果、域分类结果和目标检测结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值。
所述调整单元14,还用于如果对所述固定参数值的调整满足如下任一停止条件,则停止对所述固定参数值的调整:对所述固定参数值的调整次数达到预置的次数,当前调整的固定参数值与上一次调整的固定参数值的差值小于一阈值。
进一步地,本实施例的训练装置还包括:检测单元15,用于确定待检测用户身体器官图像,根据所述调整单元14调整固定参数值后得到的最终的检测模型,确定所述待检测用户身体器官图像中是否包括病变目标。
可见,在本实施例的训练装置中,在对用于检测用户身体器官图像中病变目标的检测模型进行训练时,模型确定单元10和样本确定单元11会先确定初始训练模型中包括初始检测模型和自适应模型,及包括已进行病变目标信息标注的源域数据和未进行病变目标信息标注的目标域数据;然后模型处理单元剧12再根据初始检测模型和自适应模型对训练样本中的数据进行处理后,分别得到检测结果和域分类结果;最后损失函数单元13再根据检测结果和域分类结果及上述的训练样本计算相关的损失函数值,并由调整单元14根据损失函数值对初始训练模型中的固定参数值进行调整,以得到最终的检测模型。这样,在训练检测模型的过程中,一部分训练样本的数据使用已进行病变目标信息标注的源域数据,另一部分训练样本的数据未进行病变目标信息标注的目标域数据,使得在病变目标信息标注困难的情况下,也能使用未标注病变目标信息的图像作为训练样本,以使得训练样本足够多,最终训练得到的检测模型的效果较好。
本发明实施例还提供一种终端设备,其结构示意图如图7所示,该终端设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessing units,CPU)20(例如,一个或一个以上处理器)和存储器21,一个或一个以上存储应用程序221或数据222的存储介质22(例如一个或一个以上海量存储设备)。其中,存储器21和存储介质22可以是短暂存储或持久存储。存储在存储介质22的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对终端设备中的一系列指令操作。更进一步地,中央处理器20可以设置为与存储介质22通信,在终端设备上执行存储介质22中的一系列指令操作。
具体地,在存储介质22中储存的应用程序221包括检测模型训练的应用程序,且该程序可以包括上述训练装置中的模型确定单元10,样本确定单元11,模型处理单元12,损失函数单元13,调整单元14和检测单元15,在此不进行赘述。更进一步地,中央处理器20可以设置为与存储介质22通信,在终端设备上执行存储介质22中储存的检测模型训练的应用程序对应的一系列操作。
终端设备还可以包括一个或一个以上电源23,一个或一个以上有线或无线网络接口24,一个或一个以上输入输出接口25,和/或,一个或一个以上操作系统223,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述方法实施例中所述的由上述训练装置所执行的步骤可以基于该图7所示的终端设备的结构。
本发明实施例还提供一种存储介质,所述存储介质储存多条指令,所述指令适于由处理器加载并执行如上述训练装置所执行的检测模型的训练方法。
本发明实施例还提供一种终端设备,包括处理器和存储介质,所述处理器,用于实现各个指令;
所述存储介质用于储存多条指令,所述指令用于由处理器加载并执行如上述训练装置所执行的检测模型的训练方法。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM)、随机存取存储器RAM)、磁盘或光盘等。
以上对本发明实施例所提供的检测模型的训练方法、装置及终端设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (13)

1.一种检测模型的训练方法,其特征在于,包括:
确定初始训练模型,所述初始训练模型中包括初始检测模型和自适应模型;
确定训练样本,所述训练样本中包括源域数据和目标域数据,所述源域数据中包括多个第一用户身体器官图像,各个第一用户身体器官图像中是否包括病变目标的第一标识及各个第一用户身体器官图像所属域的第二标识;所述目标域数据中包括多个第二用户身体器官图像及各个第二用户身体器官图像所属域的第三标识;
由所述初始检测模型根据各个第一用户身体器官图像的特征分别确定各个第一用户身体器官图像中是否包括病变目标,得到检测结果;及由所述自适应模型根据各个用户身体器官图像的特征分别确定所述训练样本中各个用户身体器官图像所属域,得到域分类结果;
根据所述检测结果和域分类结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值;
根据所述损失函数值调整所述初始训练模型中的固定参数值,以得到最终的检测模型。
2.如权利要求1所述的方法,其特征在于,对于所述第一用户身体器官图像中的部分用户身体器官图像,所述部分用户身体器官图像中包括病变目标,所述源域数据中还包括:所述部分用户身体器官图像中包括的病变目标的类型和位置;
所述计算与所述初始训练模型相关的损失函数值之前,所述方法还包括:通过所述初始检测模型分别确定所述部分用户身体器官图像中所包括的病变目标的类型和位置,得到目标检测结果;
所述计算与所述初始训练模型相关的损失函数值,具体包括:根据所述检测结果、域分类结果和目标检测结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值。
3.如权利要求2所述的方法,其特征在于,所述与所述初始训练模型相关的损失函数值,具体包括:检测损失函数和自适应损失函数的函数计算值,其中:
所述检测损失函数包括:用于表示根据所述初始检测模型确定的第一用户身体器官图像是否包括病变目标的信息,与所述训练样本中的第一标识之间的第一误差;及用于表示根据所述初始检测模型确定的所述部分用户身体器官图像中病变目标的类型和位置,与所述训练样本中部分用户身体器官图像中病变目标的类型和位置的之间的第三误差;
所述自适应损失函数包括:用于表示根据所述自适应模型确定的训练样本中各个用户身体器官图像属于源域或目标域的信息,与所述训练样本中第二标识和第三标识之间的第二误差。
4.如权利要求1所述的方法,其特征在于,所述确定初始训练模型具体包括:
确定所述初始检测模型包括特征提取模块和检测分类模块,所述自适应模型包括域分类模块,其中:所述检测分类模块用于根据所述特征提取模块提取的特征进行是否有病变目标的分类;所述域分类模块用于根据所述特征提取模块提取的特征进行域分类;
确定所述初始检测模型与自适应模型中固定参数的初始值;
所述根据所述损失函数值调整所述初始训练模型中的固定参数值,具体包括:根据所述损失函数值调整所述固定参数的初始值。
5.如权利要求4所述的方法,其特征在于,所述自适应模型中还包括梯度反转模块;
所述梯度反转模块用于将所述特征提取模块提取的特征传递给所述域分类模块,且用于在调整所述固定参数值时,对所述域分类模块的误差进行反转,以根据所述反转后的误差调整所述特征提取模块中的固定参数值。
6.如权利要求4所述的方法,其特征在于,
所述特征提取模块包括中间特征提取模块和最终特征提取模块,则所述域分类模块用于根据所述中间特征提取模块或最终特征提取模块提取的特征进行域分类;
所述域分类模块有一个或多个。
7.如权利要求1至6任一项所述的方法,其特征在于,如果对所述固定参数值的调整满足如下任一停止条件,则停止对所述固定参数值的调整:
对所述固定参数值的调整次数达到预置的次数,当前调整的固定参数值与上一次调整的固定参数值的差值小于一阈值。
8.如权利要求1至6任一项所述的方法,其特征在于,包括:
确定待检测用户身体器官图像,根据所述最终的检测模型,确定所述待检测用户身体器官图像中是否包括病变目标。
9.一种训练装置,其特征在于,包括:
模型确定单元,用于确定初始训练模型,所述初始训练模型中包括初始检测模型和自适应模型;
样本确定单元,用于确定训练样本,所述训练样本中包括源域数据和目标域数据,所述源域数据中包括多个第一用户身体器官图像,各个第一用户身体器官图像中是否包括病变目标的第一标识及各个第一用户身体器官图像所属域的第二标识;所述目标域数据中包括多个第二用户身体器官图像及各个第二用户身体器官图像所属域的第三标识;
模型处理单元,用于由所述初始检测模型根据各个第一用户身体器官图像的特征分别确定各个第一用户身体器官图像中是否包括病变目标,得到检测结果;及由所述自适应模型根据各个用户身体器官图像的特征分别确定所述训练样本中各个用户身体器官图像所属域,得到域分类结果;
损失函数单元,用于根据所述检测结果和域分类结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值;
调整单元,用于根据所述损失函数值调整所述初始训练模型中的固定参数值,以得到最终的检测模型。
10.如权利要求9所述的装置,其特征在于,
所述样本确定单元确定的训练样本中,对于所述第一用户身体器官图像中的部分用户身体器官图像,所述部分用户身体器官图像中包括病变目标,所述源域数据中还包括:所述部分用户身体器官图像中包括的病变目标的类型和位置;
所述模型处理单元,还用于通过所述初始检测模型分别确定所述部分用户身体器官图像中所包括的病变目标的类型和位置,得到目标检测结果;
所述损失函数单元,用于根据所述检测结果、域分类结果和目标检测结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值。
11.如权利要求10所述的装置,其特征在于,所述与所述初始训练模型相关的损失函数值,具体包括:检测损失函数和自适应损失函数的函数计算值,其中:
所述检测损失函数包括:用于表示根据所述初始检测模型确定的第一用户身体器官图像是否包括病变目标的信息,与所述训练样本中的第一标识之间的第一误差;及用于表示根据所述初始检测模型确定的所述部分用户身体器官图像中病变目标的类型和位置,与所述训练样本中部分用户身体器官图像中病变目标的类型和位置的之间的第三误差;
所述自适应损失函数包括:用于表示根据所述自适应模型确定的训练样本中各个用户身体器官图像属于源域或目标域的信息,与所述训练样本中第二标识和第三标识之间的第二误差。
12.如权利要求9所述的装置,其特征在于,
所述模型确定单元,具体用于确定所述初始检测模型包括特征提取模块和检测分类模块,所述自适应模型包括域分类模块,其中:所述检测分类模块用于根据所述特征提取模块提取的特征进行是否有病变目标的分类;所述域分类模块用于根据所述特征提取模块提取的特征进行域分类;确定所述初始检测模型与自适应模型中固定参数的初始值。
13.一种终端设备,其特征在于,包括处理器和存储介质,所述处理器,用于实现各个指令;
所述存储介质用于储存多条指令,所述指令用于由处理器加载并执行如权利要求1至8任一项所述的检测模型的训练方法。
CN201811251214.0A 2018-10-25 2018-10-25 一种检测模型的训练方法、装置及终端设备 Active CN109447149B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201811251214.0A CN109447149B (zh) 2018-10-25 2018-10-25 一种检测模型的训练方法、装置及终端设备
JP2020562170A JP7382964B2 (ja) 2018-10-25 2019-06-10 検出モデルのトレーニング方法及び装置、並びに端末機器及びプログラム
PCT/CN2019/090521 WO2020082748A1 (zh) 2018-10-25 2019-06-10 一种检测模型的训练方法、装置及终端设备
EP19877123.0A EP3872705A4 (en) 2018-10-25 2019-06-10 DETECTION MODEL LEARNING PROCESS AND APPARATUS, AND TERMINAL DEVICE
US17/084,475 US11315677B2 (en) 2018-10-25 2020-10-29 Detection model training method and apparatus, and terminal device
US17/699,801 US11817206B2 (en) 2018-10-25 2022-03-21 Detection model training method and apparatus, and terminal device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811251214.0A CN109447149B (zh) 2018-10-25 2018-10-25 一种检测模型的训练方法、装置及终端设备

Publications (2)

Publication Number Publication Date
CN109447149A true CN109447149A (zh) 2019-03-08
CN109447149B CN109447149B (zh) 2021-11-02

Family

ID=65547848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811251214.0A Active CN109447149B (zh) 2018-10-25 2018-10-25 一种检测模型的训练方法、装置及终端设备

Country Status (5)

Country Link
US (2) US11315677B2 (zh)
EP (1) EP3872705A4 (zh)
JP (1) JP7382964B2 (zh)
CN (1) CN109447149B (zh)
WO (1) WO2020082748A1 (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110197183A (zh) * 2019-04-17 2019-09-03 深圳大学 一种图像盲去噪的方法、装置和计算机设备
CN110363122A (zh) * 2019-07-03 2019-10-22 昆明理工大学 一种基于多层特征对齐的跨域目标检测方法
CN110490202A (zh) * 2019-06-18 2019-11-22 腾讯科技(深圳)有限公司 检测模型训练方法、装置、计算机设备和存储介质
WO2020082748A1 (zh) * 2018-10-25 2020-04-30 腾讯科技(深圳)有限公司 一种检测模型的训练方法、装置及终端设备
CN111274973A (zh) * 2020-01-21 2020-06-12 同济大学 基于自动划分域的人群计数模型训练方法及应用
CN111353548A (zh) * 2020-03-11 2020-06-30 中国人民解放军军事科学院国防科技创新研究院 一种基于对抗空间变换网络的鲁棒特征深度学习方法
CN111582507A (zh) * 2020-06-19 2020-08-25 南京宁麒智能计算芯片研究院有限公司 一种基于simd架构的ls-svm训练机的硬件系统及训练方法
CN111611835A (zh) * 2019-12-23 2020-09-01 珠海大横琴科技发展有限公司 一种船只检测方法及装置
WO2020207377A1 (zh) * 2019-04-10 2020-10-15 腾讯科技(深圳)有限公司 一种图像识别模型训练及图像识别方法、装置及系统
CN111860316A (zh) * 2020-07-20 2020-10-30 上海汽车集团股份有限公司 一种驾驶行为的识别方法、装置及存储介质
CN112417293A (zh) * 2020-12-03 2021-02-26 京东数字科技控股股份有限公司 信息推送方法和系统、模型训练方法及相关设备
CN113077434A (zh) * 2021-03-30 2021-07-06 零氪智慧医疗科技(天津)有限公司 基于多模态信息的肺癌识别方法、装置及存储介质
CN113781056A (zh) * 2021-09-17 2021-12-10 中国银行股份有限公司 预测用户欺诈行为的方法及装置
CN114445670A (zh) * 2022-04-11 2022-05-06 腾讯科技(深圳)有限公司 图像处理模型的训练方法、装置、设备及存储介质
CN116091867A (zh) * 2023-01-12 2023-05-09 北京邮电大学 一种模型训练、图像识别方法、装置、设备及存储介质
CN116433552A (zh) * 2021-12-27 2023-07-14 深圳开立生物医疗科技股份有限公司 一种染色场景下病灶图像检测模型构建方法及相关装置

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11222210B2 (en) * 2018-11-13 2022-01-11 Nec Corporation Attention and warping based domain adaptation for videos
CN111914879B (zh) * 2020-06-16 2024-04-26 北京迈格威科技有限公司 分类参数值生成方法、图像分类方法、装置、设备及存储介质
CN113822302A (zh) * 2020-06-18 2021-12-21 北京金山数字娱乐科技有限公司 一种目标检测模型的训练方法及装置
CN112001398B (zh) * 2020-08-26 2024-04-12 科大讯飞股份有限公司 域适应方法、装置、设备、图像处理方法及存储介质
CN112541081B (zh) * 2020-12-21 2022-09-16 中国人民解放军国防科技大学 一种基于领域自适应的可迁移谣言检测方法
CN112801164B (zh) * 2021-01-22 2024-02-13 北京百度网讯科技有限公司 目标检测模型的训练方法、装置、设备及存储介质
CN113762049B (zh) * 2021-05-11 2024-03-29 腾讯科技(深圳)有限公司 内容识别方法、装置、存储介质和终端设备
CN113591736A (zh) * 2021-08-03 2021-11-02 北京百度网讯科技有限公司 特征提取网络、活体检测模型的训练方法和活体检测方法
CN114821250A (zh) * 2022-03-23 2022-07-29 支付宝(杭州)信息技术有限公司 一种跨域的模型训练方法、装置以及设备
CN114863221B (zh) * 2022-05-31 2024-05-24 商汤人工智能研究中心(深圳)有限公司 检测模型的训练方法、装置、系统、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106469560A (zh) * 2016-07-27 2017-03-01 江苏大学 一种基于无监督域适应的语音情感识别方法
CN107451616A (zh) * 2017-08-01 2017-12-08 西安电子科技大学 基于深度半监督迁移学习的多光谱遥感图像地物分类方法
CN108062753A (zh) * 2017-12-29 2018-05-22 重庆理工大学 基于深度对抗学习的无监督域自适应脑肿瘤语义分割方法
CN108460415A (zh) * 2018-02-28 2018-08-28 国信优易数据有限公司 伪标签生成模型训练方法及伪标签生成方法
US20180268244A1 (en) * 2017-03-14 2018-09-20 Samsung Electronics Co., Ltd. System and method for deep labeling

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5946394B2 (ja) * 2012-11-09 2016-07-06 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 複数種類のデータソースを用いた経路の始点・終点の統計的推測手法、コンピュータ・プログラム及びコンピュータ。
US9892361B2 (en) * 2015-01-21 2018-02-13 Siemens Healthcare Gmbh Method and system for cross-domain synthesis of medical images using contextual deep network
US10115194B2 (en) * 2015-04-06 2018-10-30 IDx, LLC Systems and methods for feature detection in retinal images
US11200483B2 (en) * 2016-08-30 2021-12-14 Lunit Inc. Machine learning method and apparatus based on weakly supervised learning
CN106803247B (zh) * 2016-12-13 2021-01-22 上海交通大学 一种基于多级筛选卷积神经网络的微血管瘤图像识别方法
JP6907563B2 (ja) * 2017-01-31 2021-07-21 株式会社ニデック 画像処理装置、および画像処理プログラム
US10140421B1 (en) * 2017-05-25 2018-11-27 Enlitic, Inc. Medical scan annotator system
CN107704926A (zh) * 2017-11-23 2018-02-16 清华大学 一种大数据跨领域分析的深度迁移学习方法
CN108009633A (zh) * 2017-12-15 2018-05-08 清华大学 一种面向跨领域智能分析的多网络对抗学习方法和系统
CN108182394B (zh) * 2017-12-22 2021-02-02 浙江大华技术股份有限公司 卷积神经网络的训练方法、人脸识别方法及装置
US10580137B2 (en) * 2018-01-30 2020-03-03 International Business Machines Corporation Systems and methods for detecting an indication of malignancy in a sequence of anatomical images
CN108399431A (zh) * 2018-02-28 2018-08-14 国信优易数据有限公司 分类模型训练方法以及分类方法
CN109447149B (zh) * 2018-10-25 2021-11-02 腾讯医疗健康(深圳)有限公司 一种检测模型的训练方法、装置及终端设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106469560A (zh) * 2016-07-27 2017-03-01 江苏大学 一种基于无监督域适应的语音情感识别方法
US20180268244A1 (en) * 2017-03-14 2018-09-20 Samsung Electronics Co., Ltd. System and method for deep labeling
CN107451616A (zh) * 2017-08-01 2017-12-08 西安电子科技大学 基于深度半监督迁移学习的多光谱遥感图像地物分类方法
CN108062753A (zh) * 2017-12-29 2018-05-22 重庆理工大学 基于深度对抗学习的无监督域自适应脑肿瘤语义分割方法
CN108460415A (zh) * 2018-02-28 2018-08-28 国信优易数据有限公司 伪标签生成模型训练方法及伪标签生成方法

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11315677B2 (en) 2018-10-25 2022-04-26 Tencent Technology (Shenzhen) Company Limited Detection model training method and apparatus, and terminal device
WO2020082748A1 (zh) * 2018-10-25 2020-04-30 腾讯科技(深圳)有限公司 一种检测模型的训练方法、装置及终端设备
US11817206B2 (en) 2018-10-25 2023-11-14 Tencent Technology (Shenzhen) Company Limited Detection model training method and apparatus, and terminal device
WO2020207377A1 (zh) * 2019-04-10 2020-10-15 腾讯科技(深圳)有限公司 一种图像识别模型训练及图像识别方法、装置及系统
US11967414B2 (en) 2019-04-10 2024-04-23 Tencent Technology (Shenzhen) Company Limited Image recognition model training method and apparatus, and image recognition method, apparatus, and system
CN110197183A (zh) * 2019-04-17 2019-09-03 深圳大学 一种图像盲去噪的方法、装置和计算机设备
CN110490202B (zh) * 2019-06-18 2021-05-25 腾讯科技(深圳)有限公司 检测模型训练方法、装置、计算机设备和存储介质
CN110490202A (zh) * 2019-06-18 2019-11-22 腾讯科技(深圳)有限公司 检测模型训练方法、装置、计算机设备和存储介质
CN110363122A (zh) * 2019-07-03 2019-10-22 昆明理工大学 一种基于多层特征对齐的跨域目标检测方法
CN110363122B (zh) * 2019-07-03 2022-10-11 昆明理工大学 一种基于多层特征对齐的跨域目标检测方法
CN111611835A (zh) * 2019-12-23 2020-09-01 珠海大横琴科技发展有限公司 一种船只检测方法及装置
CN111274973A (zh) * 2020-01-21 2020-06-12 同济大学 基于自动划分域的人群计数模型训练方法及应用
CN111353548A (zh) * 2020-03-11 2020-06-30 中国人民解放军军事科学院国防科技创新研究院 一种基于对抗空间变换网络的鲁棒特征深度学习方法
CN111582507A (zh) * 2020-06-19 2020-08-25 南京宁麒智能计算芯片研究院有限公司 一种基于simd架构的ls-svm训练机的硬件系统及训练方法
CN111860316A (zh) * 2020-07-20 2020-10-30 上海汽车集团股份有限公司 一种驾驶行为的识别方法、装置及存储介质
CN111860316B (zh) * 2020-07-20 2024-03-19 上海汽车集团股份有限公司 一种驾驶行为的识别方法、装置及存储介质
CN112417293A (zh) * 2020-12-03 2021-02-26 京东数字科技控股股份有限公司 信息推送方法和系统、模型训练方法及相关设备
CN113077434A (zh) * 2021-03-30 2021-07-06 零氪智慧医疗科技(天津)有限公司 基于多模态信息的肺癌识别方法、装置及存储介质
CN113077434B (zh) * 2021-03-30 2023-01-24 零氪智慧医疗科技(天津)有限公司 基于多模态信息的肺癌识别方法、装置及存储介质
CN113781056A (zh) * 2021-09-17 2021-12-10 中国银行股份有限公司 预测用户欺诈行为的方法及装置
CN116433552A (zh) * 2021-12-27 2023-07-14 深圳开立生物医疗科技股份有限公司 一种染色场景下病灶图像检测模型构建方法及相关装置
CN114445670A (zh) * 2022-04-11 2022-05-06 腾讯科技(深圳)有限公司 图像处理模型的训练方法、装置、设备及存储介质
CN116091867A (zh) * 2023-01-12 2023-05-09 北京邮电大学 一种模型训练、图像识别方法、装置、设备及存储介质
CN116091867B (zh) * 2023-01-12 2023-09-29 北京邮电大学 一种模型训练、图像识别方法、装置、设备及存储介质

Also Published As

Publication number Publication date
US11817206B2 (en) 2023-11-14
WO2020082748A1 (zh) 2020-04-30
US20210043306A1 (en) 2021-02-11
EP3872705A1 (en) 2021-09-01
CN109447149B (zh) 2021-11-02
JP7382964B2 (ja) 2023-11-17
US20220208357A1 (en) 2022-06-30
US11315677B2 (en) 2022-04-26
JP2021523449A (ja) 2021-09-02
EP3872705A4 (en) 2021-12-08

Similar Documents

Publication Publication Date Title
CN109447149A (zh) 一种检测模型的训练方法、装置及终端设备
CN108806792B (zh) 深度学习面诊系统
CN108596882A (zh) 病理图片的识别方法及装置
JP2021519663A (ja) 内視鏡画像の処理方法、システム、コンピュータデバイス及びコンピュータプログラム
Liu et al. TSSK-Net: Weakly supervised biomarker localization and segmentation with image-level annotation in retinal OCT images
CN112614133A (zh) 一种无锚点框的三维肺结节检测模型训练方法及装置
CN114663426A (zh) 一种基于关键骨区定位的骨龄评估方法
CN111369501A (zh) 一种基于视觉特征识别口腔鳞状细胞癌的深度学习方法
CN110930373A (zh) 一种基于神经网络的肺炎识别装置
Aina et al. Classification of cervical intraepithelial neoplasia (cin) using fine-tuned convolutional neural networks
CN111462082A (zh) 一种病灶图片识别装置、方法、设备及可读存储介质
Mohammed et al. Classification of ear imagery database using Bayesian optimization based on CNN-LSTM architecture
CN114334162A (zh) 疾病患者智能预后预测方法、装置、存储介质及设备
CN110378353A (zh) 一种舌象特征提取方法、系统和计算机可读存储介质
CN111429414B (zh) 基于人工智能的病灶影像样本确定方法和相关装置
CN116129193B (zh) 一种类器官生长预测方法、系统及设备
CN116645346A (zh) 肩袖扫描图像的处理方法、电子设备及存储介质
CN110610766A (zh) 基于症状特征权重推导疾病概率的装置和存储介质
CN108986889A (zh) 一种病变识别模型训练方法、装置及存储设备
CN116091446A (zh) 食管内窥镜图像的异常检测方法、系统、介质及设备
CN115937590A (zh) 一种并联融合CNN和Transformer的皮肤病图像分类方法
CN115035339A (zh) 一种基于人工智能的膀胱镜图像分类方法
CN115100180A (zh) 基于神经网络模型的肺炎特征识别方法、装置及电子设备
CN114145844A (zh) 一种基于深度学习算法的腹腔镜手术人工智能云辅助系统
Alianto et al. AI-Driven Farming: CNN-Based Rice Leaf Disease Identification and Classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right

Effective date of registration: 20191008

Address after: 518052 Guangdong city of Shenzhen province Qianhai Shenzhen Hong Kong cooperation zone before Bay Road No. 1 building 201 room A

Applicant after: Tencent Medical Health (Shenzhen) Co., Ltd.

Address before: 518057 Nanshan District science and technology zone, Guangdong, Zhejiang Province, science and technology in the Tencent Building on the 1st floor of the 35 layer

Applicant before: Tencent Technology (Shenzhen) Co., Ltd.

TA01 Transfer of patent application right
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant