CN109447149B - 一种检测模型的训练方法、装置及终端设备 - Google Patents
一种检测模型的训练方法、装置及终端设备 Download PDFInfo
- Publication number
- CN109447149B CN109447149B CN201811251214.0A CN201811251214A CN109447149B CN 109447149 B CN109447149 B CN 109447149B CN 201811251214 A CN201811251214 A CN 201811251214A CN 109447149 B CN109447149 B CN 109447149B
- Authority
- CN
- China
- Prior art keywords
- model
- body organ
- initial
- training
- user body
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 194
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000003902 lesion Effects 0.000 claims abstract description 82
- 210000000056 organ Anatomy 0.000 claims description 122
- 238000000605 extraction Methods 0.000 claims description 52
- 230000003044 adaptive effect Effects 0.000 claims description 39
- 238000004364 calculation method Methods 0.000 claims description 9
- 239000003550 marker Substances 0.000 claims description 3
- 238000011068 loading method Methods 0.000 claims description 2
- 238000004590 computer program Methods 0.000 claims 1
- 238000002372 labelling Methods 0.000 abstract description 21
- 230000000694 effects Effects 0.000 abstract description 9
- 230000010365 information processing Effects 0.000 abstract description 2
- 230000036285 pathological change Effects 0.000 abstract 2
- 231100000915 pathological change Toxicity 0.000 abstract 2
- 230000006870 function Effects 0.000 description 69
- 208000037062 Polyps Diseases 0.000 description 18
- 238000010586 diagram Methods 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 6
- 208000022131 polyp of large intestine Diseases 0.000 description 5
- 238000011176 pooling Methods 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/40—ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/20—ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
- G06V2201/031—Recognition of patterns in medical or anatomical images of internal organs
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Multimedia (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Radiology & Medical Imaging (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明实施例公开了一种检测模型的训练方法、装置及终端设备,应用于信息处理技术领域。训练装置会先确定初始训练模型中包括初始检测模型和自适应模型,及包括已进行病变目标信息标注的源域数据和未进行病变目标信息标注的目标域数据;然后再根据初始检测模型和自适应模型对训练样本中的数据进行处理后,分别得到检测结果和域分类结果;最后再根据检测结果和域分类结果及上述的训练样本计算相关的损失函数值,并根据损失函数值对初始训练模型中的固定参数值进行调整,以得到最终的检测模型。使得在病变目标信息标注困难的情况下,也能使用未标注病变目标信息的图像,以使得训练样本足够多,使得最终训练得到的检测模型的效果较好。
Description
技术领域
本发明涉及信息处理技术领域,特别涉及一种检测模型的训练方法、装置及终端设备。
背景技术
近年来,人工智能在医疗影像领域中的发挥着越来越大的作用。基于深度学习方法的结直肠息肉的检测系统,对上百万张金标的结直肠数据进行学习训练,辅助临床医生诊断,降低漏检率。
在一种具体的结直肠息肉的检测系统中:使用卷积神经网络对待检测图像进行特征提取,再通过支持向量机方法进行分类。在通过支持向量机方法进行分类时,先确定待检测图像中有无息肉的存在,然后对待检测图像中的息肉进行性质分类。
其中,在训练卷积神经网络和支持向量机时使用的数据是私有数据,数据量较少,这样得到的系统的检测效果不佳;且由于每个医院采用的设备不同以及不同医生之间的操作习惯不同,从不同医院采集的影像数据存在一定的差异性,例如影像的分辨率,背景噪声,这导致在不同医院推广结直肠息肉的检测系统时,检测效果会大打折扣。
通过收集更多的训练数据,涵盖更多医院的数据,这在一定程度上是可以改善这种情况,但是,训练数据中结直肠的数据需要专业的医师对训练图片进行标注,收集更多的数据将会耗费巨大的财力和时间。
发明内容
本发明实施例提供一种检测模型的训练方法、装置及终端设备,实现了根据初始检测模型和自适应模型训练最终的检测模型。
本发明实施例第一方面提供一种检测模型的训练方法,包括:
确定初始训练模型,所述初始训练模型中包括初始检测模型和自适应模型;
确定训练样本,所述训练样本中包括源域数据和目标域数据,所述源域数据中包括多个第一用户身体器官图像,各个第一用户身体器官图像中是否包括病变目标的第一标识及各个第一用户身体器官图像所属域的第二标识;所述目标域数据中包括多个第二用户身体器官图像及各个第二用户身体器官图像所属域的第三标识;
由所述初始检测模型根据各个第一用户身体器官图像的特征分别确定各个第一用户身体器官图像中是否包括病变目标,得到检测结果;及由所述自适应模型根据各个用户身体器官图像的特征分别确定所述训练样本中各个用户身体器官图像所属域,得到域分类结果;
根据所述检测结果和域分类结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值;
根据所述损失函数值调整所述初始训练模型中的固定参数值,以得到最终的检测模型。
本发明实施例第二方面还提供一种训练装置,包括:
模型确定单元,用于确定初始训练模型,所述初始训练模型中包括初始检测模型和自适应模型;
样本确定单元,用于确定训练样本,所述训练样本中包括源域数据和目标域数据,所述源域数据中包括多个第一用户身体器官图像,各个第一用户身体器官图像中是否包括病变目标的第一标识及各个第一用户身体器官图像所属域的第二标识;所述目标域数据中包括多个第二用户身体器官图像及各个第二用户身体器官图像所属域的第三标识;
模型处理单元,用于由所述初始检测模型根据各个第一用户身体器官图像的特征分别确定各个第一用户身体器官图像中是否包括病变目标,得到检测结果;及由所述自适应模型根据各个用户身体器官图像的特征分别确定所述训练样本中各个用户身体器官图像所属域,得到域分类结果;
损失函数单元,用于根据所述检测结果和域分类结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值;
调整单元,用于根据所述损失函数值调整所述初始训练模型中的固定参数值,以得到最终的检测模型。
本发明实施例第三方面提供一种存储介质,所述存储介质储存多条指令,所述指令适于由处理器加载并执行如上述本发明实施例第一方面所述的检测模型的训练方法。
本发明实施例第三方面提供一种终端设备,包括处理器和存储介质,所述处理器,用于实现各个指令;
所述存储介质用于储存多条指令,所述指令用于由处理器加载并执行如上述本发明实施例第一方面所述的检测模型的训练方法。
可见,在本实施例的方法中,训练装置在对用于检测用户身体器官图像中病变目标的检测模型进行训练时,会先确定初始训练模型中包括初始检测模型和自适应模型,及包括已进行病变目标信息标注的源域数据和未进行病变目标信息标注的目标域数据;然后再根据初始检测模型和自适应模型对训练样本中的数据进行处理后,分别得到检测结果和域分类结果;最后再根据检测结果和域分类结果及上述的训练样本计算相关的损失函数值,并根据损失函数值对初始训练模型中的固定参数值进行调整,以得到最终的检测模型。这样,在训练检测模型的过程中,一部分训练样本的数据使用已进行病变目标信息标注的源域数据,另一部分训练样本的数据未进行病变目标信息标注的目标域数据,使得在病变目标信息标注困难的情况下,也能使用未标注病变目标信息的图像作为训练样本,以使得训练样本足够多,最终训练得到的检测模型的效果较好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种检测模型的训练方法的示意图;
图2是本发明实施例提供的一种检测模型的训练方法的流程图;
图3是本发明应用实施例提供的一种检测模型的训练方法的流程图;
图4是本发明应用实施例中确定的一种初始训练模型的示意图;
图5是本发明应用实施例中确定的另一种初始训练模型的示意图;
图6是本发明实施例提供的一种训练装置的结构示意图;
图7是本发明实施例提供的一种终端设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排它的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供一种检测模型的训练方法,主要应用于训练装置中,参考图1所示,训练装置可以通过如下的步骤训练检测模型:
确定初始训练模型,所述初始训练模型中包括初始检测模型和自适应模型;确定训练样本,所述训练样本中包括源域数据和目标域数据,所述源域数据中包括多个第一用户身体器官图像,各个第一用户身体器官图像中是否包括病变目标的第一标识及各个第一用户身体器官图像所属域的第二标识;所述目标域数据中包括多个第二用户身体器官图像及各个第二用户身体器官图像所属域的第三标识;由所述初始检测模型根据各个第一用户身体器官图像的特征分别确定各个第一用户身体器官图像中是否包括病变目标,得到检测结果;及由所述自适应模型根据各个用户身体器官图像的特征分别确定所述训练样本中各个用户身体器官图像所属域,得到域分类结果;根据所述检测结果和域分类结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值;根据所述损失函数值调整所述初始训练模型中的固定参数值,以得到最终的检测模型。
这样,在训练检测模型的过程中,一部分训练样本的数据使用已进行病变目标信息标注的源域数据,另一部分训练样本的数据未进行病变目标信息标注的目标域数据,使得在病变目标信息标注困难的情况下,也能使用未标注病变目标信息的图像作为训练样本,以使得训练样本足够多,最终训练得到的检测模型的效果较好。
本发明实施例提供一种检测模型的训练方法,主要是训练装置所执行的方法,该训练装置训练得到的检测模型主要用于检测某一图像中是否包括身体的病变目标,流程图如图2所示,包括:
步骤101,确定初始训练模型,初始训练模型中包括初始检测模型和自适应模型。
可以理解,用户可以操作训练装置,使得训练装置发起本实施例中对检测模型的训练,当训练装置在确定初始训练模型时,会确定初始检测模型所包括的多层结构和各层机构中固定参数的初始值。其中,初始检测模型中的多层结构可以是如下任一种算法结构:卷积神经网络(Convolutional Neural Network,CNN),K最近邻算法(K nearestneighbors,KNN),奇异值分解(singular value decomposition,SVD)及非负矩阵分解(Non-negative Matrix Factorization,NMF)等。
具体地,训练装置确定的初始检测模型可以包括特征提取模块和检测分类模块,自适应模型包括域分类模块,其中:特征提取模块用于进行特征的提取;检测分类模块用于根据特征提取模块提取的特征进行是否有病变目标的分类;域分类模块用于根据特征提取模块提取的特征进行域分类。这样初始检测模型和自适应模型之间共用了特征提取模块提取的特征。
进一步地,训练装置还会确定初始检测模型与自适应模型中固定参数的初始值,这里,固定参数是指初始训练模型中各层结构在计算过程中所用到的固定的,不需要随时赋值的参数,比如权重,角度等参数。
在一种具体的实现中,在自适应模型中还可以包括梯度反转模块,梯度反转模块用于将特征提取模块提取的特征传递给域分类模块,且用于在调整固定参数值的过程中,对域分类模块的误差进行反转(比如将域分类模块的误差乘以一个负数),以根据反转后的误差调整特征提取模块中的固定参数值。
这样由于训练过程是不断地对初始训练模型中固定参数进行优化的过程,而在训练过程中特征提取模块与梯度反转模块这两部分形成一种对抗关系,对特征提取模块中固定参数的优化,使得域分类模块的误差上升,而通过梯度反转模块,使得域分类模块的误差下降,直到趋于平衡状态。
步骤102,确定训练样本,训练样本中包括源域数据和目标域数据,源域数据中包括多个第一用户身体器官图像,各个第一用户身体器官图像中是否包括病变目标的第一标识及各个第一用户身体器官图像所属域的第二标识;目标域数据中包括多个第二用户身体器官图像及各个第二用户身体器官图像所属域的第三标识。
进一步地,对于第一用户身体器官图像中的部分用户身体器官图像,部分用户身体器官图像中包括病变目标,在源域数据中还可以包括这部分用户身体器官图像中包括的病变目标的类型和位置。
步骤103,由初始检测模型根据各个第一用户身体器官图像的特征分别确定各个第一用户身体器官图像中是否包括病变目标,得到检测结果;及由自适应模型根据各个用户身体器官图像的特征分别确定训练样本中各个用户身体器官图像(包括第一用户身体器官图像和第二用户身体器官图像)所属域,得到域分类结果。
进一步地,如果在源域数据中包括部分用户身体器官图像中包括的病变目标的类型和位置,则还需要通过初始检测模型分别确定这部分用户身体器官图像中所包括的病变目标的类型和位置,得到目标检测结果。
步骤104,根据检测结果和域分类结果及第一标识、第二标识和第三标识,计算与初始训练模型相关的损失函数值。
这里,与初始训练模型相关的损失函数可以包括检测损失函数和自适应损失函数,而上述初始训练模型的整体损失函数可以包括检测损失函数与自适应损失函数的函数计算值,比如加权和值等。其中,检测损失函数包括:用于表示根据初始训练模型中初始检测模型确定的训练样本中第一用户身体器官图像是否包括病变目标的信息,与各个第一用户身体器官图像实际是否包括病变目标(即上述源域数据中包括的第一标识)之间的差别,即第一误差;自适应损失函数用于表示根据初始训练模型中自适应模型确定的训练样本中各个用户身体器官图像属于源域或目标域的信息,与各个用户身体器官图像实际属于某一域的信息(即上述第二标识和第三标识)之间的差别,即第二误差。
进一步地,检测损失函数还包括:用于表示初始训练模型中初始检测模型确定的训练样本中上述部分用户身体器官图像中病变目标的类型和位置,与这部分用户身体器官图像中病变目标的实际类型和实际位置(即训练样本中包括的源域数据中标注的类型和位置)之间的差别,即第三误差。这样,检测损失函数就可以包括上述第一误差与第二误差的函数计算值,比如加权和值等。
上述第一误差或第二误差或第三误差的数学表现形式通常使用交叉熵来建立损失函数,而检测模型的训练过程就是需要尽量减少上述误差的值,该训练过程是通过反向传播求导以及梯度下降等一系列数学优化手段不断的优化上述步骤102中确定的固定参数的初始值,并使得这一函数的计算值降至最低。因此,在执行本步骤104后,训练装置需要执行步骤105中的调整步骤。
步骤105,根据损失函数值调整初始训练模型中的固定参数值,以得到最终的检测模型。
具体地,如果计算的损失函数的函数值较大,比如大于预置的值,则需要改变固定参数值,比如将某个权重的权重值减小等,使得按照调整后的固定参数值计算的损失函数的函数值减小。
需要说明的是,上述步骤103到105是通过初始训练模型对训练样本中各个用户身体器官图像进行处理得到检测结果和域分类结果后,根据检测结果和域分类结果对初始训练模型中的固定参数值的一次调整,而在实际应用中,需要通过不断地循环执行上述步骤103到105,直到对固定参数值的调整满足一定的停止条件为止。
因此,训练装置在执行了上述实施例步骤101到105之后,还需要判断当前对固定参数值的调整是否满足预置的停止条件,如果满足,则结束流程;如果不满足,则针对调整固定参数值后的初始训练模型,返回执行上述步骤103到105的步骤。
其中,预置的停止条件包括但不限于如下条件中的任何一个:当前调整的固定参数值与上一次调整的固定参数值的差值小于一阈值,即调整的固定参数值达到收敛;及对固定参数值的调整次数达到预置的次数等。
进一步需要说明的是,如果训练装置确定的最终的检测模型后,在对待检测用户身体器官图像进行检测时,先确定待检测用户身体器官图像,然后可以直接根据最终的检测模型,确定待检测用户身体器官图像中是否包括病变目标,且如果包括病变目标,该病变目标的类型和位置。其中,在确定待检测用户身体器官图像时,可以先确定用户身体器官的原始图像,然后对该原始图像进行预处理,比如增强,去燥等处理后得到待检测用户身体器官图像,使得之后根据最终的检测模型对待检测用户身体器官图像的检测,不会受到图像本身缺陷的影响。
可见,在本实施例的方法中,训练装置在对用于检测用户身体器官图像中病变目标的检测模型进行训练时,会先确定初始训练模型中包括初始检测模型和自适应模型,及包括已进行病变目标信息标注的源域数据和未进行病变目标信息标注的目标域数据;然后再根据初始检测模型和自适应模型对训练样本中的数据进行处理后,分别得到检测结果和域分类结果;最后再根据检测结果和域分类结果及上述的训练样本计算相关的损失函数值,并根据损失函数值对初始训练模型中的固定参数值进行调整,以得到最终的检测模型。这样,在训练检测模型的过程中,一部分训练样本的数据使用已进行病变目标信息标注的源域数据,另一部分训练样本的数据未进行病变目标信息标注的目标域数据,使得在病变目标信息标注困难的情况下,也能使用未标注病变目标信息的图像,以使得训练样本足够多,使得最终训练得到的检测模型的效果较好。
以下以一个具体的应用实例来说明本实施例中检测模型的训练方法,本实施例的方法应用于对结直肠图像中息肉的检测,本实施例的方法可以包括如下两个部分:
(一)参考图3所示,检测模型的训练可以包括如下步骤:
步骤201,确定初始训练模型。
参考图4所示,训练装置可以先确定初始训练模型的结构包括:初始检测模型和自适应模型,其中,初始检测模型包括特征提取模块(即图3中所示的卷积神经网络)和检测分类模块,而自适应模型包括梯度反转模块(即图3中所示的梯度反转层)和域分类模块。该梯度反转模块可以连接到特征提取模块的最终特征提取模块,或是连接到特征提取模块的中间特征提取模块。
然后训练装置初始化确定的初始训练模型,即确定初始训练模型中各个固定参数的初始值。
例如,如果上述初始检测模型为CNN算法结构,则确定的初始检测模型的多层结构可以包括卷积层和池化层(即特征提取模块),及全连接层和归一化层(即检测分类模块)。其中,卷积层用于提取输入图片的全部特征;池化层用于对卷积层得到的全部特征进行采样计算,得到输入图片中的关键性特征;全连接层用于根据采样后的特征计算各个输入图片属于某一类型的分数;归一化层用于根据全连接层计算的分数输出某一输入图片属于某一类型的的概率。在本实施例中,将任意结直肠图像作为输入图片。
这种情况下,上述的池化层即为特征提取模块的最终特征提取模块,能得到输入图片的最终的关键特征,从而使得之后的计算得到简化;卷积层即为特征提取模块的中间特征提取模块,可以得到输入图片的全部特征;且初始检测模型对应的固定参数可以包括:卷积核,池化核和全连接层中的计算参数比如权重值等。
步骤202,确定训练样本,在训练样本中包括源域数据和目标域数据,源域数据中包括多个第一结直肠图像(即用户身体器官图像),各个第一结直肠图像中是否包括息肉(即病变目标)的第一标识,部分结直肠图像(包括息肉的结直肠图像)中息肉的类型和位置及各个第一结直肠图像所属域的第二标识;在目标域数据中包括多个第二结直肠图像及各个第二结直肠图像所属域的第三标识。
这样,在源域数据中对第一结直肠图像中的息肉信息进行标注,而在目标数据中未对第二结直肠图像中的息肉信息进行标注。
步骤203,对于训练样本中的源域数据,由初始检测模型分别提取各个第一结直肠图像的特征,并分别根据各个第一结直肠图像的特征,确定各个第一结直肠图像中是否包括息肉,得到检测结果;且对于包括息肉的结直肠图像,需要初始检测模型分别检测各个第一结直肠图像中息肉的类型和位置,得到目标检测结果。
对于训练样本中的目标域数据,直接由自适应模型分别根据各个第二结直肠图像确定各个第二结直肠图像所属域的信息,得到域分类结果。在具体实现时,任一第二结直肠图像经过上述初值检测模型的特征提取模块中的最终特征提取模块或中间特征提取模块,提取到该第二结直肠图像的特征后,经过梯度反转模块将第二结直肠的特征传递给域分类模块,然后由域分类模块根据第二结直肠图像的特征进行域分类,在这个过程中,梯度反转模块不会对第二结直肠的特征做任何处理。
如图4所示,在训练过程中,第一结直肠图像的走向如图中实线箭头所标示,需要经过初始检测模型,还需要经过自适应模型中的梯度反转模块和域分类模块。而第二结直肠图像的走向如图中虚线箭头所标示,经过初始检测模型中的特征提取模块和自适应模型中的梯度反转模块和域分类模块。
具体地,当训练样本中各个结直肠图像经过特征提取模块提取到相应的特征后,如果该特征来自源域数据,则该提取的特征需要分别都经过检测分类模块,及梯度反转模块和域分类模块的处理;如果该特征来自目标域数据,则该提取的特征只需经过梯度反转模块和域分类模块的处理。
这样,通过特征提取模块从不同域数据中提取出共用的特性,剔除了域相关的特性,消除了目标域数据和源域数据的差异,使得从目标域数据和源域数据中提取的特征具有域不变性,从而使得从源域数据中学习到的分类和检测能力可以直接适用到目标域数据中。
步骤204,根据上述得到的检测结果、目标检测结果和域分类结果及第一标识、第二标识和第三标识,计算与初始训练模型相关的损失函数值。
具体地,与初始训练模型相关的损失函数值包括:初始检测模型的损失函数和自适应模型的损失函数的函数计算值,其中:初始检测模型的损失函数Ldet可以包括:检测损失函数L1(即上述的第一误差)、分类损失函数Lcls和定位的回归损失函数Lbox(即上述的第三误差),这样,初始检测模型的整体损失函数值可以通过如下公式1表示,其中,λ1和λ2是用于平衡检测损失函数、分类损失函数和定位的回归损失函数的常数:
Ldet=L1+λ1*Lcls+λ2*Lbox (1)
自适应模型的损失函数(即上述的第二误差)可以通过如下公式2的交叉熵来表示,其中Di为0时表示输入的图片是源域数据,Di为1时表示输入的图片是目标域数据;pi表示域分类模块最后输出属于源域数据的概率:
Ld=∑(Dilog(pi)+(1-Di)log(1-pi)) (2)
因此,与初始训练模型相关的损失函数可以通过如下公式3来表示,其中,β用于平衡自适应模型的损失函数和初始检测模型的损失函数:
L=Ldet+·β·Ld (3)
步骤205,根据损失函数值调整初始训练模型中的固定参数值。
通过上述步骤204计算得到整体的损失函数值后,训练装置可以逐层地对初始训练模型进行固定参数的初始值(主要是权重值)进行更新。在权重值的更新过程中,主要可以包括如下两种情况:
(1)对于初始训练模型中除梯度反转模块之外的其它模块
训练装置在对除梯度反转模块之外的其它模块的权重值进行更新时,是从后向前逐层进行更新,比如先更新检测分类模块和域分类模型中的权重值,然后再更新特征提取模块中的权重值。而对某一层的权重值进行更新时,可以根据损失函数值L和权重值w的对应关系,计算一个梯度,然后往梯度的方向更新该层的权重值,以使得误差最小化。例如,梯度为dL/dw2,w2为更新前的权重值,则更新后的权重值w1=w2-learning_rate*dL/dw,其中,learning_rate即学习率,用于控制每次权重值变化的步长。
其中,如果某一层是最后一层的模块,在计算该层的梯度时可以直接用损失函数值L作为该层的误差,进行梯度的计算;如果某一层非最后一层的模块,在计算该层的梯度时,需要将前一层的误差与该层的权重值的乘积作为该层的误差,进行梯度的计算。其中,前一层到该层的顺序是指初始训练模型中从后向前的顺序。
(2)对于梯度反转模块
梯度反转模块不包括权重值等任何固定参数,训练装置会先确定梯度反转模块前一层模块(即域分类模块)的误差,然后梯度反转模块将该误差与一个负数相乘,得到一个梯度,并作为梯度反转模块之后的一层模块的误差,实现了对该梯度反转模块之后的模块,即特征提取模块的梯度的反转,以使得域分类模块的误差最大化。
这样,初始检测模型中的特征提取模块的目的是:希望域分类模块尽可能的分错,而自适应模块是尽可能的使得域分类模块分对,最后达到平衡后,这样特征提取模块提取的特征就不包含域相关的特征信息,可以消除不同域的差异,消除域偏移的现象。
需要说明的是,上述确定的初始训练模型中特征提取模块提取的特征会经过梯度反转模块,并到达域分类模块。如图5所示,在其它实施例中,确定的初始训练模型中可以不包括梯度反转模块,这样特征提取模块提取的特征不会经过梯度反转模块,在这种情况下,需要训练装置在调整了域分类模块中的权重值后,执行上述梯度反转模块所执行的方法,以实现特征提取模块的梯度的反转。
步骤206,判断对固定参数值的调整是否满足如下任一预置的条件,如果不满足,则返回执行上述步骤203,如果满足,则结束流程:对固定参数值的调整次数达到预置的次数,当前调整的固定参数值与上一次调整的固定参数值的差值小于一阈值等。
通过不断地重复上述步骤203到206,即可得到最终的检测模型。
需要说明的是,由于结直肠图像中息肉的信息需要专业的医师进行标注,费用及其昂贵其所需时间长,而不同医院由于所使用的设备不同,导致结直肠图像数据分布差异较大,这样,收集的训练数据无法涵盖所有的医院。本发明的实施例中,将自适应模型应用到结直肠图像的检测模型中,只需已有的带标注的源域数据(包括第一结直肠图像),结合新医院的图像数据即目标域数据(包括第二结直肠图像),无需对目标域数据进行息肉的标注,使得对源域数据中第一结直肠图像的检测,可以应用到对目标域数据中第二结直肠图像中息肉的检测,且检测效果与在带息肉信息标注的结直肠图像的检测效果相当,解决了结直肠息肉检测系统推广时遇到的数据的域偏移现象,利于结直肠息肉检测系统在各个医院的推广。
(二)待检测结直肠图像的检测
将待检测结直肠图像输入到最终得到的检测模型中,即可得到该待检测结直肠图像是否包括息肉,且如果包括息肉,该息肉的类型和位置。
本发明实施例还提供一种训练装置,其结构示意图如图6所示,具体可以包括:
模型确定单元10,用于确定初始训练模型,所述初始训练模型中包括初始检测模型和自适应模型。
所述模型确定单元10,具体用于确定所述初始检测模型包括特征提取模块和检测分类模块,所述自适应模型包括域分类模块,其中:所述检测分类模块用于根据所述特征提取模块提取的特征进行是否有病变目标的分类;所述域分类模块用于根据特征提取模块提取的特征进行域分类;确定所述初始检测模型与自适应模型中固定参数的初始值。
其中,所述特征提取模块包括中间特征提取模块和最终特征提取模块,则所述域分类模块用于根据所述中间特征提取模块或最终特征提取模块提取的特征进行域分类;所述域分类模块有一个或多个。
进一步地,在自适应模型中还可以包括梯度反转模块,用于将所述特征提取模块提取的特征传递给所述域分类模块,且用于在调整所述固定参数值时,对所述域分类模块的误差进行反转,以根据所述反转后的误差调整所述特征提取模块中的固定参数值。
样本确定单元11,用于确定训练样本,所述训练样本中包括源域数据和目标域数据,所述源域数据中包括多个第一用户身体器官图像,各个第一用户身体器官图像中是否包括病变目标的第一标识及各个第一用户身体器官图像所属域的第二标识;所述目标域数据中包括多个第二用户身体器官图像及各个第二用户身体器官图像所属域的第三标识。
模型处理单元12,用于由所述模型确定单元10确定初始检测模型根据各个第一用户身体器官图像的特征分别确定所述样本确定单元11确定的源域数据中各个第一用户身体器官图像中是否包括病变目标,得到检测结果;及由所述自适应模型根据各个用户身体器官图像的特征分别确定所述训练样本中各个用户身体器官图像所属域,得到域分类结果。
损失函数单元13,用于根据所述模型处理单元12得到的检测结果和域分类结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值。
具体地,所述与所述初始训练模型相关的损失函数值,具体包括:检测损失函数和自适应损失函数的函数计算值,其中:所述检测损失函数包括:用于表示根据所述初始检测模型确定的第一用户身体器官图像是否包括病变目标的信息,与所述训练样本中的第一标识之间的第一误差;及用于表示根据所述初始检测模型确定的所述部分用户身体器官图像中病变目标的类型和位置,与所述训练样本中部分用户身体器官图像中病变目标的类型和位置的之间的第三误差;所述自适应损失函数包括:用于表示根据所述自适应模型确定的训练样本中各个用户身体器官图像属于源域或目标域的信息,与所述训练样本中第二标识和第三标识之间的第二误差。
调整单元14,用于根据所述损失函数单元13得到的损失函数值调整所述初始训练模型中的固定参数值,以得到最终的检测模型。
具体地,所述样本确定单元10确定的训练样本中,对于所述第一用户身体器官图像中的部分用户身体器官图像,所述部分用户身体器官图像中包括病变目标,所述源域数据中还包括:所述部分用户身体器官图像中包括的病变目标的类型和位置;则所述模型处理单元12,还用于通过所述初始检测模型分别确定所述部分用户身体器官图像中所包括的病变目标的类型和位置,得到目标检测结果;所述损失函数单元13,用于根据所述检测结果、域分类结果和目标检测结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值。
所述调整单元14,还用于如果对所述固定参数值的调整满足如下任一停止条件,则停止对所述固定参数值的调整:对所述固定参数值的调整次数达到预置的次数,当前调整的固定参数值与上一次调整的固定参数值的差值小于一阈值。
进一步地,本实施例的训练装置还包括:检测单元15,用于确定待检测用户身体器官图像,根据所述调整单元14调整固定参数值后得到的最终的检测模型,确定所述待检测用户身体器官图像中是否包括病变目标。
可见,在本实施例的训练装置中,在对用于检测用户身体器官图像中病变目标的检测模型进行训练时,模型确定单元10和样本确定单元11会先确定初始训练模型中包括初始检测模型和自适应模型,及包括已进行病变目标信息标注的源域数据和未进行病变目标信息标注的目标域数据;然后模型处理单元剧12再根据初始检测模型和自适应模型对训练样本中的数据进行处理后,分别得到检测结果和域分类结果;最后损失函数单元13再根据检测结果和域分类结果及上述的训练样本计算相关的损失函数值,并由调整单元14根据损失函数值对初始训练模型中的固定参数值进行调整,以得到最终的检测模型。这样,在训练检测模型的过程中,一部分训练样本的数据使用已进行病变目标信息标注的源域数据,另一部分训练样本的数据未进行病变目标信息标注的目标域数据,使得在病变目标信息标注困难的情况下,也能使用未标注病变目标信息的图像作为训练样本,以使得训练样本足够多,最终训练得到的检测模型的效果较好。
本发明实施例还提供一种终端设备,其结构示意图如图7所示,该终端设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessing units,CPU)20(例如,一个或一个以上处理器)和存储器21,一个或一个以上存储应用程序221或数据222的存储介质22(例如一个或一个以上海量存储设备)。其中,存储器21和存储介质22可以是短暂存储或持久存储。存储在存储介质22的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对终端设备中的一系列指令操作。更进一步地,中央处理器20可以设置为与存储介质22通信,在终端设备上执行存储介质22中的一系列指令操作。
具体地,在存储介质22中储存的应用程序221包括检测模型训练的应用程序,且该程序可以包括上述训练装置中的模型确定单元10,样本确定单元11,模型处理单元12,损失函数单元13,调整单元14和检测单元15,在此不进行赘述。更进一步地,中央处理器20可以设置为与存储介质22通信,在终端设备上执行存储介质22中储存的检测模型训练的应用程序对应的一系列操作。
终端设备还可以包括一个或一个以上电源23,一个或一个以上有线或无线网络接口24,一个或一个以上输入输出接口25,和/或,一个或一个以上操作系统223,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述方法实施例中所述的由上述训练装置所执行的步骤可以基于该图7所示的终端设备的结构。
本发明实施例还提供一种存储介质,所述存储介质储存多条指令,所述指令适于由处理器加载并执行如上述训练装置所执行的检测模型的训练方法。
本发明实施例还提供一种终端设备,包括处理器和存储介质,所述处理器,用于实现各个指令;
所述存储介质用于储存多条指令,所述指令用于由处理器加载并执行如上述训练装置所执行的检测模型的训练方法。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM)、随机存取存储器RAM)、磁盘或光盘等。
以上对本发明实施例所提供的检测模型的训练方法、装置及终端设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (12)
1.一种检测模型的训练方法,其特征在于,包括:
确定初始训练模型,所述初始训练模型中包括初始检测模型和自适应模型;
确定训练样本,所述训练样本中包括源域数据和目标域数据,所述源域数据中包括多个第一用户身体器官图像,各个第一用户身体器官图像中是否包括病变目标的第一标识及各个第一用户身体器官图像所属域的第二标识;所述目标域数据中包括多个第二用户身体器官图像及各个第二用户身体器官图像所属域的第三标识;
由所述初始检测模型根据各个第一用户身体器官图像的特征分别确定各个第一用户身体器官图像中是否包括病变目标,得到检测结果;及由所述自适应模型根据各个用户身体器官图像的特征分别确定所述训练样本中各个用户身体器官图像所属域,得到域分类结果;
根据所述检测结果和域分类结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值;
根据所述损失函数值调整所述初始训练模型中的固定参数值,以得到最终的检测模型;所述最终的检测模型,用于确定待检测用户身体器官图像中是否包括病变目标,若包括病变目标,确定所述病变目标的类型和位置;对于所述第一用户身体器官图像中的部分用户身体器官图像,所述部分用户身体器官图像中包括病变目标,所述源域数据中还包括:所述部分用户身体器官图像中包括的病变目标的类型和位置;
所述计算与所述初始训练模型相关的损失函数值之前,所述方法还包括:通过所述初始检测模型分别确定所述部分用户身体器官图像中所包括的病变目标的类型和位置,得到目标检测结果;
所述计算与所述初始训练模型相关的损失函数值,具体包括:根据所述检测结果、域分类结果和目标检测结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值。
2.如权利要求1所述的方法,其特征在于,所述与所述初始训练模型相关的损失函数值,具体包括:检测损失函数和自适应损失函数的函数计算值,其中:
所述检测损失函数包括:用于表示根据所述初始检测模型确定的第一用户身体器官图像是否包括病变目标的信息,与所述训练样本中的第一标识之间的第一误差;及用于表示根据所述初始检测模型确定的所述部分用户身体器官图像中病变目标的类型和位置,与所述训练样本中部分用户身体器官图像中病变目标的类型和位置的之间的第三误差;
所述自适应损失函数包括:用于表示根据所述自适应模型确定的训练样本中各个用户身体器官图像属于源域或目标域的信息,与所述训练样本中第二标识和第三标识之间的第二误差。
3.如权利要求1所述的方法,其特征在于,所述确定初始训练模型具体包括:
确定所述初始检测模型包括特征提取模块和检测分类模块,所述自适应模型包括域分类模块,其中:所述检测分类模块用于根据所述特征提取模块提取的特征进行是否有病变目标的分类;所述域分类模块用于根据所述特征提取模块提取的特征进行域分类;
确定所述初始检测模型与自适应模型中固定参数的初始值;
所述根据所述损失函数值调整所述初始训练模型中的固定参数值,具体包括:根据所述损失函数值调整所述固定参数的初始值。
4.如权利要求3所述的方法,其特征在于,所述自适应模型中还包括梯度反转模块;
所述梯度反转模块用于将所述特征提取模块提取的特征传递给所述域分类模块,且用于在调整所述固定参数值时,对所述域分类模块的误差进行反转,以根据所述反转后的误差调整所述特征提取模块中的固定参数值。
5.如权利要求3所述的方法,其特征在于,
所述特征提取模块包括中间特征提取模块和最终特征提取模块,则所述域分类模块用于根据所述中间特征提取模块或最终特征提取模块提取的特征进行域分类;
所述域分类模块有一个或多个。
6.如权利要求1至5任一项所述的方法,其特征在于,如果对所述固定参数值的调整满足如下任一停止条件,则停止对所述固定参数值的调整:
对所述固定参数值的调整次数达到预置的次数,当前调整的固定参数值与上一次调整的固定参数值的差值小于一阈值。
7.如权利要求1至5任一项所述的方法,其特征在于,包括:
确定待检测用户身体器官图像,根据所述最终的检测模型,确定所述待检测用户身体器官图像中是否包括病变目标。
8.一种训练装置,其特征在于,包括:
模型确定单元,用于确定初始训练模型,所述初始训练模型中包括初始检测模型和自适应模型;
样本确定单元,用于确定训练样本,所述训练样本中包括源域数据和目标域数据,所述源域数据中包括多个第一用户身体器官图像,各个第一用户身体器官图像中是否包括病变目标的第一标识及各个第一用户身体器官图像所属域的第二标识;所述目标域数据中包括多个第二用户身体器官图像及各个第二用户身体器官图像所属域的第三标识;
模型处理单元,用于由所述初始检测模型根据各个第一用户身体器官图像的特征分别确定各个第一用户身体器官图像中是否包括病变目标,得到检测结果;及由所述自适应模型根据各个用户身体器官图像的特征分别确定所述训练样本中各个用户身体器官图像所属域,得到域分类结果;
损失函数单元,用于根据所述检测结果和域分类结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值;
调整单元,用于根据所述损失函数值调整所述初始训练模型中的固定参数值,以得到最终的检测模型;所述最终的检测模型,用于确定待检测用户身体器官图像中是否包括病变目标,若包括病变目标,确定所述病变目标的类型和位置;
所述样本确定单元确定的训练样本中,对于所述第一用户身体器官图像中的部分用户身体器官图像,所述部分用户身体器官图像中包括病变目标,所述源域数据中还包括:所述部分用户身体器官图像中包括的病变目标的类型和位置;
所述模型处理单元,还用于通过所述初始检测模型分别确定所述部分用户身体器官图像中所包括的病变目标的类型和位置,得到目标检测结果;
所述损失函数单元,用于根据所述检测结果、域分类结果和目标检测结果及所述第一标识、第二标识和第三标识,计算与所述初始训练模型相关的损失函数值。
9.如权利要求8所述的装置,其特征在于,所述与所述初始训练模型相关的损失函数值,具体包括:检测损失函数和自适应损失函数的函数计算值,其中:
所述检测损失函数包括:用于表示根据所述初始检测模型确定的第一用户身体器官图像是否包括病变目标的信息,与所述训练样本中的第一标识之间的第一误差;及用于表示根据所述初始检测模型确定的所述部分用户身体器官图像中病变目标的类型和位置,与所述训练样本中部分用户身体器官图像中病变目标的类型和位置的之间的第三误差;
所述自适应损失函数包括:用于表示根据所述自适应模型确定的训练样本中各个用户身体器官图像属于源域或目标域的信息,与所述训练样本中第二标识和第三标识之间的第二误差。
10.如权利要求8所述的装置,其特征在于,
所述模型确定单元,具体用于确定所述初始检测模型包括特征提取模块和检测分类模块,所述自适应模型包括域分类模块,其中:所述检测分类模块用于根据所述特征提取模块提取的特征进行是否有病变目标的分类;所述域分类模块用于根据所述特征提取模块提取的特征进行域分类;确定所述初始检测模型与自适应模型中固定参数的初始值。
11.一种终端设备,其特征在于,包括处理器和存储介质,所述处理器,用于实现各个指令;
所述存储介质用于储存多条指令,所述指令用于由处理器加载并执行如权利要求1至7任一项所述的检测模型的训练方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质储存多个计算机程序,所述计算机程序适于由处理器加载并执行如权利要求1至7任一项所述的检测模型的训练方法。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811251214.0A CN109447149B (zh) | 2018-10-25 | 2018-10-25 | 一种检测模型的训练方法、装置及终端设备 |
PCT/CN2019/090521 WO2020082748A1 (zh) | 2018-10-25 | 2019-06-10 | 一种检测模型的训练方法、装置及终端设备 |
EP19877123.0A EP3872705B1 (en) | 2018-10-25 | 2019-06-10 | Detection model training method and apparatus and terminal device |
JP2020562170A JP7382964B2 (ja) | 2018-10-25 | 2019-06-10 | 検出モデルのトレーニング方法及び装置、並びに端末機器及びプログラム |
US17/084,475 US11315677B2 (en) | 2018-10-25 | 2020-10-29 | Detection model training method and apparatus, and terminal device |
US17/699,801 US11817206B2 (en) | 2018-10-25 | 2022-03-21 | Detection model training method and apparatus, and terminal device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811251214.0A CN109447149B (zh) | 2018-10-25 | 2018-10-25 | 一种检测模型的训练方法、装置及终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109447149A CN109447149A (zh) | 2019-03-08 |
CN109447149B true CN109447149B (zh) | 2021-11-02 |
Family
ID=65547848
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811251214.0A Active CN109447149B (zh) | 2018-10-25 | 2018-10-25 | 一种检测模型的训练方法、装置及终端设备 |
Country Status (5)
Country | Link |
---|---|
US (2) | US11315677B2 (zh) |
EP (1) | EP3872705B1 (zh) |
JP (1) | JP7382964B2 (zh) |
CN (1) | CN109447149B (zh) |
WO (1) | WO2020082748A1 (zh) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447149B (zh) * | 2018-10-25 | 2021-11-02 | 腾讯医疗健康(深圳)有限公司 | 一种检测模型的训练方法、装置及终端设备 |
CN114158130A (zh) | 2018-10-30 | 2022-03-08 | 北京小米移动软件有限公司 | 数据传输方法、装置及可读存储介质 |
US11222210B2 (en) * | 2018-11-13 | 2022-01-11 | Nec Corporation | Attention and warping based domain adaptation for videos |
CN110473192B (zh) | 2019-04-10 | 2021-05-14 | 腾讯医疗健康(深圳)有限公司 | 消化道内镜图像识别模型训练及识别方法、装置及系统 |
CN110197183B (zh) * | 2019-04-17 | 2022-10-04 | 深圳大学 | 一种图像盲去噪的方法、装置、计算机设备和存储介质 |
CN110245662B (zh) * | 2019-06-18 | 2021-08-10 | 腾讯科技(深圳)有限公司 | 检测模型训练方法、装置、计算机设备和存储介质 |
CN110363122B (zh) * | 2019-07-03 | 2022-10-11 | 昆明理工大学 | 一种基于多层特征对齐的跨域目标检测方法 |
CN111611835A (zh) * | 2019-12-23 | 2020-09-01 | 珠海大横琴科技发展有限公司 | 一种船只检测方法及装置 |
CN111274973B (zh) * | 2020-01-21 | 2022-02-18 | 同济大学 | 基于自动划分域的人群计数模型训练方法及应用 |
CN111428874B (zh) * | 2020-02-29 | 2024-07-12 | 平安科技(深圳)有限公司 | 风控方法、电子装置及计算机可读存储介质 |
CN111353548B (zh) * | 2020-03-11 | 2020-10-20 | 中国人民解放军军事科学院国防科技创新研究院 | 一种基于对抗空间变换网络的鲁棒特征深度学习方法 |
CN111914879B (zh) * | 2020-06-16 | 2024-04-26 | 北京迈格威科技有限公司 | 分类参数值生成方法、图像分类方法、装置、设备及存储介质 |
CN113822302B (zh) * | 2020-06-18 | 2024-09-27 | 北京金山数字娱乐科技有限公司 | 一种目标检测模型的训练方法及装置 |
CN111582507A (zh) * | 2020-06-19 | 2020-08-25 | 南京宁麒智能计算芯片研究院有限公司 | 一种基于simd架构的ls-svm训练机的硬件系统及训练方法 |
CN111860316B (zh) * | 2020-07-20 | 2024-03-19 | 上海汽车集团股份有限公司 | 一种驾驶行为的识别方法、装置及存储介质 |
CN112001398B (zh) * | 2020-08-26 | 2024-04-12 | 科大讯飞股份有限公司 | 域适应方法、装置、设备、图像处理方法及存储介质 |
CN112417293B (zh) * | 2020-12-03 | 2024-06-18 | 京东科技控股股份有限公司 | 信息推送方法和系统、模型训练方法及相关设备 |
US20220190990A1 (en) * | 2020-12-16 | 2022-06-16 | Qualcomm Incorporated | Network-configured training procedure |
CN112541081B (zh) * | 2020-12-21 | 2022-09-16 | 中国人民解放军国防科技大学 | 一种基于领域自适应的可迁移谣言检测方法 |
CN112801164B (zh) * | 2021-01-22 | 2024-02-13 | 北京百度网讯科技有限公司 | 目标检测模型的训练方法、装置、设备及存储介质 |
CN113077434B (zh) * | 2021-03-30 | 2023-01-24 | 零氪智慧医疗科技(天津)有限公司 | 基于多模态信息的肺癌识别方法、装置及存储介质 |
CN113762049B (zh) * | 2021-05-11 | 2024-03-29 | 腾讯科技(深圳)有限公司 | 内容识别方法、装置、存储介质和终端设备 |
CN113591736A (zh) * | 2021-08-03 | 2021-11-02 | 北京百度网讯科技有限公司 | 特征提取网络、活体检测模型的训练方法和活体检测方法 |
CN113781056A (zh) * | 2021-09-17 | 2021-12-10 | 中国银行股份有限公司 | 预测用户欺诈行为的方法及装置 |
CN114120365A (zh) * | 2021-11-24 | 2022-03-01 | 奥比中光科技集团股份有限公司 | 一种行人检测方法、装置及电子设备 |
CN116433552A (zh) * | 2021-12-27 | 2023-07-14 | 深圳开立生物医疗科技股份有限公司 | 一种染色场景下病灶图像检测模型构建方法及相关装置 |
CN114821250A (zh) * | 2022-03-23 | 2022-07-29 | 支付宝(杭州)信息技术有限公司 | 一种跨域的模型训练方法、装置以及设备 |
CN114445670B (zh) * | 2022-04-11 | 2022-07-12 | 腾讯科技(深圳)有限公司 | 图像处理模型的训练方法、装置、设备及存储介质 |
CN114863221B (zh) * | 2022-05-31 | 2024-05-24 | 商汤人工智能研究中心(深圳)有限公司 | 检测模型的训练方法、装置、系统、设备及存储介质 |
CN116091867B (zh) * | 2023-01-12 | 2023-09-29 | 北京邮电大学 | 一种模型训练、图像识别方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106469560A (zh) * | 2016-07-27 | 2017-03-01 | 江苏大学 | 一种基于无监督域适应的语音情感识别方法 |
CN108062753A (zh) * | 2017-12-29 | 2018-05-22 | 重庆理工大学 | 基于深度对抗学习的无监督域自适应脑肿瘤语义分割方法 |
CN108460415A (zh) * | 2018-02-28 | 2018-08-28 | 国信优易数据有限公司 | 伪标签生成模型训练方法及伪标签生成方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5946394B2 (ja) * | 2012-11-09 | 2016-07-06 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 複数種類のデータソースを用いた経路の始点・終点の統計的推測手法、コンピュータ・プログラム及びコンピュータ。 |
US9892361B2 (en) * | 2015-01-21 | 2018-02-13 | Siemens Healthcare Gmbh | Method and system for cross-domain synthesis of medical images using contextual deep network |
US10115194B2 (en) * | 2015-04-06 | 2018-10-30 | IDx, LLC | Systems and methods for feature detection in retinal images |
US11200483B2 (en) * | 2016-08-30 | 2021-12-14 | Lunit Inc. | Machine learning method and apparatus based on weakly supervised learning |
CN106803247B (zh) * | 2016-12-13 | 2021-01-22 | 上海交通大学 | 一种基于多级筛选卷积神经网络的微血管瘤图像识别方法 |
JP6907563B2 (ja) * | 2017-01-31 | 2021-07-21 | 株式会社ニデック | 画像処理装置、および画像処理プログラム |
US11631236B2 (en) * | 2017-03-14 | 2023-04-18 | Samsung Electronics Co., Ltd. | System and method for deep labeling |
US11664114B2 (en) * | 2017-05-25 | 2023-05-30 | Enlitic, Inc. | Medical scan assisted review system |
CN107451616A (zh) * | 2017-08-01 | 2017-12-08 | 西安电子科技大学 | 基于深度半监督迁移学习的多光谱遥感图像地物分类方法 |
CN107704926A (zh) * | 2017-11-23 | 2018-02-16 | 清华大学 | 一种大数据跨领域分析的深度迁移学习方法 |
CN108009633A (zh) * | 2017-12-15 | 2018-05-08 | 清华大学 | 一种面向跨领域智能分析的多网络对抗学习方法和系统 |
CN108182394B (zh) * | 2017-12-22 | 2021-02-02 | 浙江大华技术股份有限公司 | 卷积神经网络的训练方法、人脸识别方法及装置 |
US10580137B2 (en) * | 2018-01-30 | 2020-03-03 | International Business Machines Corporation | Systems and methods for detecting an indication of malignancy in a sequence of anatomical images |
CN108399431A (zh) * | 2018-02-28 | 2018-08-14 | 国信优易数据有限公司 | 分类模型训练方法以及分类方法 |
CN109447149B (zh) * | 2018-10-25 | 2021-11-02 | 腾讯医疗健康(深圳)有限公司 | 一种检测模型的训练方法、装置及终端设备 |
-
2018
- 2018-10-25 CN CN201811251214.0A patent/CN109447149B/zh active Active
-
2019
- 2019-06-10 WO PCT/CN2019/090521 patent/WO2020082748A1/zh unknown
- 2019-06-10 EP EP19877123.0A patent/EP3872705B1/en active Active
- 2019-06-10 JP JP2020562170A patent/JP7382964B2/ja active Active
-
2020
- 2020-10-29 US US17/084,475 patent/US11315677B2/en active Active
-
2022
- 2022-03-21 US US17/699,801 patent/US11817206B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106469560A (zh) * | 2016-07-27 | 2017-03-01 | 江苏大学 | 一种基于无监督域适应的语音情感识别方法 |
CN108062753A (zh) * | 2017-12-29 | 2018-05-22 | 重庆理工大学 | 基于深度对抗学习的无监督域自适应脑肿瘤语义分割方法 |
CN108460415A (zh) * | 2018-02-28 | 2018-08-28 | 国信优易数据有限公司 | 伪标签生成模型训练方法及伪标签生成方法 |
Also Published As
Publication number | Publication date |
---|---|
US20220208357A1 (en) | 2022-06-30 |
CN109447149A (zh) | 2019-03-08 |
EP3872705A1 (en) | 2021-09-01 |
WO2020082748A1 (zh) | 2020-04-30 |
US11817206B2 (en) | 2023-11-14 |
EP3872705B1 (en) | 2024-09-11 |
JP7382964B2 (ja) | 2023-11-17 |
EP3872705A4 (en) | 2021-12-08 |
US11315677B2 (en) | 2022-04-26 |
JP2021523449A (ja) | 2021-09-02 |
US20210043306A1 (en) | 2021-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109447149B (zh) | 一种检测模型的训练方法、装置及终端设备 | |
CN111860573B (zh) | 模型训练方法、图像类别检测方法、装置和电子设备 | |
Wang et al. | Zoom-in-net: Deep mining lesions for diabetic retinopathy detection | |
Patravali et al. | 2D-3D fully convolutional neural networks for cardiac MR segmentation | |
JP6539901B2 (ja) | 植物病診断システム、植物病診断方法、及びプログラム | |
CN110752028A (zh) | 一种图像处理方法、装置、设备以及存储介质 | |
CN107945210B (zh) | 基于深度学习和环境自适应的目标跟踪方法 | |
CN110838108A (zh) | 基于医疗图像的预测模型构建方法、预测方法及装置 | |
CN114693624B (zh) | 一种图像检测方法、装置、设备及可读存储介质 | |
CN113344016A (zh) | 深度迁移学习方法、装置、电子设备及存储介质 | |
CN111027610B (zh) | 图像特征融合方法、设备和介质 | |
CN112200041A (zh) | 视频动作识别方法、装置、存储介质与电子设备 | |
CN109671055B (zh) | 肺结节检测方法及装置 | |
CN114818734B (zh) | 基于目标-属性-关系的对抗场景语义分析方法以及装置 | |
CN114358250A (zh) | 数据处理方法、装置、计算机设备、介质及程序产品 | |
Prasad et al. | Lung cancer detection and classification using deep neural network based on hybrid metaheuristic algorithm | |
He et al. | Evolutionary multi-objective architecture search framework: Application to covid-19 3d ct classification | |
CN113302649B (zh) | 基于医学视频数据预测病变的方法、装置和系统 | |
CN111816306A (zh) | 一种医学数据处理方法、预测模型的训练方法及装置 | |
CN115798709A (zh) | 基于多任务图同构网络的阿尔兹海默病分类装置及方法 | |
CN115908969A (zh) | 图像处理及模型训练的方法和设备 | |
CN112086174B (zh) | 一种三维知识诊断模型构建方法和系统 | |
CN114330634A (zh) | 一种神经网络的处理方法及相关设备 | |
CN112163526B (zh) | 一种基于人脸信息进行年龄识别的方法、装置及电子设备 | |
Billah et al. | Leaf disease detection using convolutional neural networks: a proposed model using tomato plant leaves |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20191008 Address after: 518052 Guangdong city of Shenzhen province Qianhai Shenzhen Hong Kong cooperation zone before Bay Road No. 1 building 201 room A Applicant after: Tencent Medical Health (Shenzhen) Co., Ltd. Address before: 518057 Nanshan District science and technology zone, Guangdong, Zhejiang Province, science and technology in the Tencent Building on the 1st floor of the 35 layer Applicant before: Tencent Technology (Shenzhen) Co., Ltd. |
|
TA01 | Transfer of patent application right | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |