CN111709485A - 医学影像处理方法、装置和计算机设备 - Google Patents
医学影像处理方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN111709485A CN111709485A CN202010566649.5A CN202010566649A CN111709485A CN 111709485 A CN111709485 A CN 111709485A CN 202010566649 A CN202010566649 A CN 202010566649A CN 111709485 A CN111709485 A CN 111709485A
- Authority
- CN
- China
- Prior art keywords
- model
- medical image
- target task
- training
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title abstract description 24
- 238000012549 training Methods 0.000 claims abstract description 206
- 238000000034 method Methods 0.000 claims abstract description 92
- 230000002159 abnormal effect Effects 0.000 claims abstract description 81
- 238000012545 processing Methods 0.000 claims abstract description 65
- 230000006870 function Effects 0.000 claims description 92
- 230000008569 process Effects 0.000 claims description 52
- 230000000694 effects Effects 0.000 claims description 32
- 230000008439 repair process Effects 0.000 claims description 28
- 230000005856 abnormality Effects 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 14
- 230000002068 genetic effect Effects 0.000 claims description 11
- 108090000623 proteins and genes Proteins 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 230000004807 localization Effects 0.000 claims description 4
- 210000004072 lung Anatomy 0.000 description 18
- 239000003814 drug Substances 0.000 description 17
- 208000020816 lung neoplasm Diseases 0.000 description 16
- 238000010801 machine learning Methods 0.000 description 16
- 238000013508 migration Methods 0.000 description 16
- 230000005012 migration Effects 0.000 description 16
- 238000011282 treatment Methods 0.000 description 16
- 229940079593 drug Drugs 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 15
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 14
- 201000005202 lung cancer Diseases 0.000 description 14
- 238000013473 artificial intelligence Methods 0.000 description 11
- 230000003902 lesion Effects 0.000 description 11
- 230000003211 malignant effect Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 210000001508 eye Anatomy 0.000 description 8
- 206010056342 Pulmonary mass Diseases 0.000 description 6
- 238000002591 computed tomography Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 230000004083 survival effect Effects 0.000 description 6
- 238000013526 transfer learning Methods 0.000 description 6
- 241000282414 Homo sapiens Species 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 210000000481 breast Anatomy 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 210000002216 heart Anatomy 0.000 description 4
- 208000037841 lung tumor Diseases 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 206010064571 Gene mutation Diseases 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000011423 initialization method Methods 0.000 description 2
- 230000009191 jumping Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000002685 pulmonary effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000011277 treatment modality Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 208000017442 Retinal disease Diseases 0.000 description 1
- 206010038923 Retinopathy Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 210000001557 animal structure Anatomy 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000010827 pathological analysis Methods 0.000 description 1
- 231100000915 pathological change Toxicity 0.000 description 1
- 230000036285 pathological change Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000010837 poor prognosis Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/20—ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种医学影像处理方法,包括:获取根据通用图像集合训练得到的通用模型;获取与目标部位对应的第一医学影像、及第一医学影像所对应的类别标签;类别标签包括表征正常类别的标签和表征异常类别的标签;通过第一医学影像和对应的类别标签,对通用模型进行再训练,得到中间模型;获取与目标部位对应的第二医学影像、及第二医学影像所对应的目标任务标签;第二医学影像是属于异常类别的医学影像;根据第二医学影像和对应的目标任务标签,对中间模型进行再训练,得到与目标任务对应的目标任务模型;目标任务模型用于对待处理的第三医学影像进行处理,得到与目标任务对应的预测结果。采用本方法能够训练得到处理结果更准确的目标任务模型。
Description
技术领域
本申请涉及机器学习技术领域,特别是涉及一种医学影像处理方法、装置和计算机设备。
背景技术
随着计算机技术的发展,出现了机器学习技术,机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论和凸分析等多门学科。现在机器学习技术已被应用到多个领域,通过机器学习算法可以训练模型以实现各种目标任务。比如,在医疗领域,可基于采用机器学习算法训练得到的机器学习模型来实现对医疗影像的分类处理等。
传统方案中,通过机器学习算法来对医学影像进行处理,以实现某个目标任务时,比如通过机器学习算法来预测患者服用药物后的康复效果,通常需要对患者异常的目标部位的医学影像进行人工特征提取,比如人工设计灰度、梯度直方图、SIFT特征(Scale-invariant feature transform,尺度不变的特征)、HOG(Histogram of OrientedGridient,方向梯度直方图)特征等,然后将所提取的特征进行尺度上的统一,并拼接成多维向量,输入到SVM(支持向量机)、随机森林等传统分类器中再进行处理。然而这种通过人工设计特征的方式,其描述能力有限,具有局限性,存在模型处理结果不够准确的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够对医学影像进行处理得到准确的预测结果的医学影像处理方法、装置、计算机设备和存储介质。
一种医学影像处理医学影像处理方法,所述方法包括:
获取根据通用图像集合训练得到的通用模型;
获取与目标部位对应的第一医学影像、及所述第一医学影像所对应的类别标签;所述类别标签包括表征正常类别的标签和表征异常类别的标签;
通过所述第一医学影像和对应的类别标签,对所述通用模型进行再训练,得到中间模型;
获取与所述目标部位对应的第二医学影像、及所述第二医学影像所对应的目标任务标签;其中,所述第二医学影像是属于异常类别的医学影像;
根据所述第二医学影像和对应的目标任务标签,对所述中间模型进行再训练,得到与目标任务对应的目标任务模型;所述目标任务模型用于对待处理的第三医学影像进行处理,得到与所述目标任务对应的预测结果。
一种医学影像处理医学影像处理装置,所述装置包括:
获取模块,用于获取根据通用图像集合训练得到的通用模型;
所述获取模块,还用于获取与目标部位对应的第一医学影像、及所述第一医学影像所对应的类别标签;所述类别标签包括表征正常类别的标签和表征异常类别的标签;
训练模块,用于通过所述第一医学影像和对应的类别标签,对所述通用模型进行再训练,得到中间模型;
所述获取模块,还用于获取与所述目标部位对应的第二医学影像、及所述第二医学影像所对应的目标任务标签;其中,所述第二医学影像是属于异常类别的医学影像;
所述训练模块,还用于根据所述第二医学影像和对应的目标任务标签,对所述中间模型进行再训练,得到与目标任务对应的目标任务模型;所述目标任务模型用于对待处理的第三医学影像进行处理,得到与所述目标任务对应的预测结果。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取根据通用图像集合训练得到的通用模型;
获取与目标部位对应的第一医学影像、及所述第一医学影像所对应的类别标签;所述类别标签包括表征正常类别的标签和表征异常类别的标签;
通过所述第一医学影像和对应的类别标签,对所述通用模型进行再训练,得到中间模型;
获取与所述目标部位对应的第二医学影像、及所述第二医学影像所对应的目标任务标签;其中,所述第二医学影像是属于异常类别的医学影像;
根据所述第二医学影像和对应的目标任务标签,对所述中间模型进行再训练,得到与目标任务对应的目标任务模型;所述目标任务模型用于对待处理的第三医学影像进行处理,得到与所述目标任务对应的预测结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取根据通用图像集合训练得到的通用模型;
获取与目标部位对应的第一医学影像、及所述第一医学影像所对应的类别标签;所述类别标签包括表征正常类别的标签和表征异常类别的标签;
通过所述第一医学影像和对应的类别标签,对所述通用模型进行再训练,得到中间模型;
获取与所述目标部位对应的第二医学影像、及所述第二医学影像所对应的目标任务标签;其中,所述第二医学影像是属于异常类别的医学影像;
根据所述第二医学影像和对应的目标任务标签,对所述中间模型进行再训练,得到与目标任务对应的目标任务模型;所述目标任务模型用于对待处理的第三医学影像进行处理,得到与所述目标任务对应的预测结果。
上述医学影像处理方法、装置、计算机设备和存储介质,首先根据通用图像集合进行模型训练,可以得到稀疏性和泛化能力良好的通用模型。再基于该通用模型对目标部位的第一医学影像图像、以及表征是否异常的类别标签来再次训练该通用模型。这样可在继承模型良好的稀疏性和泛化能力的前提下,使得模型学习到与目标部位有关的医学信息,具有识别目标部位异常的能力。进而再基于中间模型,通过属于异常类别的第二医学影像和相应的目标任务标签进行再一次的训练,就可通过少量的训练样本来重点学习与目标任务有关的信息,得到目标任务模型。这样,根据训练数据学习相应特征,突破了人工设计特征的局限性,并通过二次迁移学习的训练方式,既能提高模型的稀疏性和泛化性能,又能迁移更多的信息,使得训练得到的目标任务模型具有更好的处理性能,在通过目标任务模型对待处理的第三医学影像进行处理后,可以得到与目标任务对应的准确的预测结果。
附图说明
图1为一个实施例中医学影像处理方法的应用环境图;
图2为一个实施例中医学影像处理方法的流程示意图;
图3为一个实施例中医学影像处理方法的原理架构图;
图4为另一个实施例中获取根据通用图像集合训练得到的通用模型的步骤的流程示意图;
图5为一个实施例中通过第一医学影像和对应的类别标签,对通用模型进行再训练,得到中间模型的步骤的流程示意图;
图6为一个实施例中根据第二医学影像和对应的目标任务标签,对中间模型进行再训练,得到与目标任务对应的目标任务模型的步骤的流程示意图;
图7为一个实施例中该目标任务模型的应用步骤的流程示意图;
图8为一个实施例中医学影像处理装置的结构框图;
图9为另一个实施例中医学影像处理装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的医学影像处理方法,可以应用于如图1所示的应用环境中。其中,医学影像采集设备110和计算机设备120。医学影像采集设备110具体可以是用于医学检测的CT(Computed Tomography,电子计算机断层扫描)检测仪、核磁共振仪、或其他的带有图像采集装置的设备等。其中,图1中显示的医学影像采集设备正在对用户进行医学影像采集,该用户仅用于示例性说明该医学影像采集设备的使用方式,不用于限定该医学影像采集设备,可以理解,该医学影像采集设备还可以采集的是其他生物或非生物所对应的医学影像。计算机设备120具体可以是终端或服务器。其中,终端具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
需要说明的是,本申请各实施例所提及的医学影像处理方法,涉及到人工智能技术。人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
可以理解,本申请各实施例中的医学影像处理方法具体涉及到人工智能的机器学习技术,其中,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
本申请实施例提供的方案涉及人工智能的机器学习技术,具体通过如下实施例进行详细说明:
在一个实施例中,如图2所示,提供了一种医学影像处理方法,以该方法应用于图1中的计算机设备为例进行说明,该医学影像处理方法包括以下步骤:
步骤S202,获取根据通用图像集合训练得到的通用模型。
其中,通用图像集合用于训练具有通用的分类能力的模型。通用图像集合中包括有大量的通用图像、以及各通用图像各自对应的通用类别标签。通用图像具体可以是自然图像,比如动物图像、植物图像、或物品图像等。根据通用图像集合训练所得的通用模型也可以称为通用的机器学习模型,该通用的机器学习模型对于一般的图像都具有一定的分类能力。
具体地,计算机设备可获取待训练的初始模型,并对该初始模型的网络参数进行初始化。其中,初始化的方式有多种,比如随机赋值、置零、或高斯分布初始化等,本申请实施例对此不做限定。进而,计算机设备将通用图像和各通用图像所对应的通用类别标签作为训练数据,对该初始模型进行训练。通过不断地输入训练数据并调整模型参数直至损失函数收敛时停止,得到具有通用的分类能力的通用模型。其中,网络参数是模型的网络结构所对应的网络权值,能反应模型输出和输入的对应关系。
在其中一个实施例中,计算机设备在对初始模型进行训练以得到通用模型的训练过程中,可将初始的学习率设置为一个较大的第一学习率lA,比如lA=0.1。这样,在训练过程中就可快速地获取到合适的网络参数。
在一个实施例中,计算机设备可根据目标任务构建对应的网络结构,再通过随机/零值/高斯核等事先预定的方式(即不与特定任务相关的方式)对网络结构的权值进行初始化,得到初始模型。可以理解,本申请实施例中的目标任务具体是与医学影像相关的任务,那么相应的,对应构建的网络结构具体可以为支持图像处理的网络结构,通常具有卷积层、池化层和全连接层等。常用的网络结构比如,在U-Net(U-网)神经网络、FCN网络(FullyConvolutional Networks,全卷积神经网络)、VGG(Visual Geometry Group视觉集合组)网络、GoogleNet(谷歌网路)网络或ResNet(能效评估系统)网络等,本申请实施例对此不做限定。
在一个实施例中,通用图像集合中的第一样本量是非常大的,可用数据量超过100万,分类任务超过1000类。由于通用图像集合中的样本量巨大,通过该通用图像集合训练得到的通用模型具有良好的稀疏性,但是与目标任务相关的可迁移的知识较少。因而,计算机设备可基于该通用模型再进行再次的训练。
步骤S204,获取与目标部位对应的第一医学影像、及第一医学影像所对应的类别标签;类别标签包括表征正常类别的标签和表征异常类别的标签。
其中,医学影像是与生物医学相关的图像,比如CT图像。目标部位是目标对象的某个器官部位,比如人体的心脏、脑部、肺、肝脏、乳腺或眼睛等器官。与目标部位对应的医学影像是通过医学影像采集设备对目标对象的目标部位进行扫描得到的图像。第一医学影像中包括有正样本图像和负样本图像,其中正样本图像就是属于正常类别的医学影像;负样本图像就是属于异常类别的医学影像。
具体地,计算机设备可从本地或其他计算机设备处获取第一医学影像训练集,该第一医学影像训练集包括与目标部位对应的第一医学影像、及各第一医学影像所对应的类别标签。该第一医学影像所对应的类别标签,具体可以是专业人士对与该第一医学影像对应的目标部位的手术标本进行病理性分析得到。
在一个实施例中,与第一医学影像对应的类别标签是与中间任务对应的标签,该中间任务与目标任务不同,但有一定的相关性。可以理解,当与目标任务相关的训练数据非常少时,为了解决模型训练的过拟合问题,计算机设备可设计一个与该目标任务相关的、且具有相对较多的训练数据的中间任务,这样,通用模型就可先通过中间任务的学习,习得与目标任务有关的部分信息,得到中间模型。进而再在中间任务的基础上进行目标任务的学习,就可以在训练数据量较少的情况下,训练得到效果好的目标任务模型。
在一个实施例中,中间任务具体可以是二分类任务,主要是对正常类别和异常类别进行区分的判别任务,也称良恶性判别任务。当目标部位为人体或动物的某个器官时,相应的中间任务具体可以是对目标部位是否异常的判别任务,比如当目标部位为肺时,相应的中间任务具体可以是肺结节良恶性判别。相应的第一医学影像具体可以是肺部的CT图像,相应的类别标签具体可以是表征正常类别的标签和表征异常类别的标签。
步骤S206,通过第一医学影像和对应的类别标签,对通用模型进行再训练,得到中间模型。
具体地,计算机设备可基于通用模型的网络参数进行初始化操作,也就是将通用模型的网络参数作为该次训练的初始的网络参数。进而,计算机设备可通过第一医学影像训练集对通用模型进行迭代训练,不断的调整通用模型的网络参数直至收敛,得到中间模型。可以理解,在这个再训练的过程中,模型可以学习到与异常的目标部位相关的信息,这些信息可以帮助目标任务的学习。这样,在保障了模型的网络稀疏性的前提下,可赋予模型与目标任务更相关的可迁移的知识,可提高与目标任务对应的小样本学习能力和效果。
在一个实施例中,中间任务具体可以是在医疗领域中应用较为频繁的任务,其对应的类别标签相对于目标任务标签而言是更为容易获取的。相应的,第一医学影像训练集的第二样本量也较大,比如超过了1000份。这样,可通过样本量较大的、且训练标签相对较容易获得的第一医学影像训练集来再次训练通用模型,可以在保证网络稀疏性的前提下,赋予网络与目标任务更相关的可迁移的知识。
比如,当目标部位为肺部时,相应的中间任务具体可以是肺结节良恶性判别。相应的第一医学影像具体可以是肺部的CT图像,相应的类别标签具体可以是表征正常类别的标签和表征异常类别的标签。通过第一医学影像训练集训练得到的中间模型能够充分学习到肺结节相关知识。
在其中一个实施例中,计算机设备在对通用模型进行训练以得到中间模型的训练过程中,可将初始的学习率设置为一个较大的第二学习率lB,比如lB与lA相当,即lB≈lA。这样,在训练过程中就可快速地获取合适的网络参数。
步骤S208,获取与目标部位对应的第二医学影像、及第二医学影像所对应的目标任务标签;其中,第二医学影像是属于异常类别的医学影像。
可以理解,不同的目标任务所对应的训练数据中的目标任务标签也是不同的。比如,当目标任务为对异常的目标部位的修复效果进行预测的任务,那么相应的目标任务标签具体可以是有效修复和无效修复。当目标任务为对异常的目标部位中的异常基因位点进行定位的任务,那么相应的目标任务标签具体可以是异常基因位点的位置信息。当目标任务为对异常的目标部位的异常原因进行分类的任务时,相应的目标任务标签具体可以是异常原因的种类标签。当然,上述的目标任务和对应的目标任务标签仅作为示意性的说明,并不用于限定本申请。
具体地,计算机设备可预先收集与该目标部位对应的第二医学影像训练集,该第二医学影像训练集包括第二医学影像、及第二医学影像所对应的目标任务标签。其中,该第二医学影像是属于异常类别的医学影像。
在一个实施例中,当目标任务为对异常的目标部位的修复效果进行预测的任务,那么相应的目标任务标签具体可以是有效修复和无效修复。该目标任务标签可通过以下方式获得:对于目标部分发生病变的患者,计算机设备可采集对应的目标部位的第二医学影像。医生在对其进行临床诊治时,可提供某种治疗方式,比如服用某种特效药。那么可追踪这些患者在接受这种治疗方式后,在一段时间内的治愈情况。比如,如果患者在9个月内未复发或者患病情况未加重,则可认为该治疗方式是有效的,那么该第二医学影像所对应的目标任务标签就是有效修复;如果患者在9个月内复发或者患病情况加重,则可认为该治疗方式是无效的,那么与该第二医学影像相对应的目标任务标签就是无效修复。这样,训练出来的目标任务模型就可预测患者在接受了某种治疗后的疗效如何,对于预测为无效修复的患者,医生可采用其他的治疗手段进行多重干预,便可期望能够进一步提升患者的治疗效果。
在一个实施例中,当目标任务为对异常的目标部位中的异常基因位点进行定位的任务,那么相应的目标任务标签具体可以是异常基因位点的位置信息。该目标任务标签可通过以下方式获得:对于目标部分发生病变的患者,计算机设备可采集对应的目标部位的第二医学影像。医生可对其病变部位的手术标本进行基因检测,以定位到具体是哪个基因位点发生了突变。那么与该第二医学影像相对应的目标任务标签就是发生了突变的基因位点的具体位置信息。这样,训练出来的目标任务模型就可预测目标部位发生异常的具体的基因位点,便于医生对其进行有针对性的辅助治疗。
在一个实施例中,当目标任务为对异常的目标部位的异常原因进行分类的任务时,相应的目标任务标签具体可以是异常原因的种类标签。该目标任务标签可通过以下方式获得:对于目标部分发生病变的患者,医生可对其病变部位进行诊断,或对应的检查,以追溯到产生该目标部位的具体原因种类。比如,当目标微博具体为眼睛时,相应的医学影像为眼底图像。当眼底图像反映发生病变时,医生可对患者进行诊断,以确定是具体是哪个病种产生的这种病变,比如是由糖尿病引起的、或者是由视网膜病变引起的等。这样,训练出来的目标任务模型就可预测引起目标部位异常的具体原因,便于医生对其进行有针对性的辅助治疗。
步骤S210,根据第二医学影像和对应的目标任务标签,对中间模型进行再训练,得到与目标任务对应的目标任务模型;目标任务模型用于对待处理的第三医学影像进行处理,得到与目标任务对应的预测结果。
具体地,计算机设备可基于中间模型的网络参数进行初始化操作,也就是将中间模型的网络参数作为该次训练的初始的网络参数。进而,计算机设备可通过第二医学影像训练集对中间模型进行迭代训练,不断的调整中间模型的网络参数直至收敛,得到与目标任务对应的目标任务模型。可以理解,在这个再训练的过程中,模型可以学习到与目标任务有关的信息。这样,在保证网络稀疏性和继承异常的目标部位的相关知识的前提下,可以通过小样本训练得到目标任务模型。
在其中一个实施例中,计算机设备在对中间模型进行训练以得到目标任务模型的训练过程中,为了保证能够充分继承(不破坏)目标部位的相关知识,可将初始的学习率设置为一个较小的第三学习率lC,比如lC<0.1lB。
在一个实施例中,第二医学影像训练集的第三样本量较小,比如小于1000份。这样,通过两次迁移学习,既保障了模型的稀疏性和泛化性能,又能迁移更多的与目标任务有关的知识,从而得到性能良好的目标任务模型。通过本申请实施例所提及的目标任务训练方法进行训练时,还可大大减少由于与目标任务对应的训练数据量过小所导致的过拟合的问题。
可以理解,对于在深度学习中应用迁移学习的方法,原始任务A的可学习数据量、任务A和目标任务B之间的相似程度,可以决定任务B模型的准确率,然而在医学影像中很难找到同时兼备两个特点的任务A及其对应的数据库。具体表现在:1)自然图像的数据量远远大于医学图像,若选择自然图像训练原始任务A,虽然数据量足够,能够有效提升深度学习模型的稀疏性和泛化能力,但是自然图像和医学图像差距甚远,可迁移的知识极其有限;2)若选择医学图像训练原始任务A,虽然可迁移的知识更多,但是数据量有效,不能够有效降低深度学习模型的稀疏性和泛化能力。
而通过本申请实施例所提供的基于二次迁移的医学影像处理方法,则可克服上述缺陷,训练得到的目标任务模型具有良好的稀疏性和泛化能力,又有准确的分类性能。
在一个实施例中,当该医学影像处理好后,计算机设备可通过该目标任务模型执行对应的目标任务。可以理解,该训练好的目标任务模型可被传输至其他的计算机设备或在本地进行目标任务的执行。比如,该目标任务模型被传输至医生所使用的终端,以通过在终端上执行该目标任务模型,对患者的第三医学影像进行处理,得到与目标任务对应的预测结果。
在一个实施例中,计算机设备可获取属于异常类别的待处理的第三医学影像,并将第三医学影像输入至目标任务模型中。通过目标任务模型对第三医学影像进行特征提取,并根据提取的图像特征进行分类处理,得到对应的预测结果。具体地,目标任务模型可通过卷积层和池化层对第三医学影像进行处理,得到对应的特征图,再通过分类层对特征图进行分类处理,输出对应的预测类别。
上述医学影像处理方法,首先根据通用图像集合进行模型训练,可以得到稀疏性和泛化能力良好的通用模型。再基于该通用模型对目标部位的第一医学影像图像、以及表征是否异常的类别标签来再次训练该通用模型。这样可在继承模型良好的稀疏性和泛化能力的前提下,使得模型学习到与目标部位有关的医学信息,具有识别目标部位异常的能力。进而再基于中间模型,通过属于异常类别的第二医学影像和相应的目标任务标签进行再一次的训练,就可通过少量的训练样本来重点学习与目标任务有关的信息,得到目标任务模型。这样,根据训练数据学习相应特征,突破了人工设计特征的局限性,并通过二次迁移学习的训练方式,既能提高模型的稀疏性和泛化性能,又能迁移更多的信息,使得训练得到的目标任务模型具有更好的处理性能,在通过目标任务模型对待处理的第三医学影像进行处理后,可以得到与目标任务对应的准确的预测结果。
在一个实施例中,通用图像集合的第一样本量,大于由第一医学影像和对应的类别标签所构成的第一医学影像训练集的第二样本量;第二样本量,大于由第二医学影像和对应的目标任务标签所构成的第二医学影像训练集的第三样本量。
可以理解,通用图像集合,比如ImageNet中的第一样本量是非常大的,可称作超大样本,可用数据量超过100万,分类任务超过1000类。这样,通过该通用图像集合训练得到的通用模型具有良好的稀疏性。在进行第一医学影像训练集的第二样本量虽然也较大,但是会少于通用图像集合中的样本量,比如第二样本量超过了1000份,但还是远远小于第一样本量。通常来说,用于对医学影像进行正常和异常分类的任务所对应的训练数据,相对于目标任务而言,是更为容易获得的。因而,第二医学影像训练集的第三样本量是最少的,也就是小样本。如果单单使用第二医学影像训练集来训练目标任务模型,那么得到的模型的网络结构具有很低的泛化性和稀疏性,且容易存在过拟合的问题。
参考图3,图3为一个实施例中医学影像处理方法的原理架构图。如图3所示,在一个具体的实施例中,该通用图像集合为ImageNet训练集,相应的训练任务为通用分类任务,ImageNet训练集所对应的第一样本量n1>100万,通过该ImageNet训练集可训练得到通用模型。接下来与第一医学影像训练集对应的中间任务具体可以是肺部是否异常的判别任务,该第一医学影像训练集对应第二样本量n2>1000,通过该第一医学影像训练集训练通用模型得到中间模型,该中间模型可称作一次迁移模型。该第二医学影像训练集对应的目标任务具体可以是对异常的肺部的修复效果进行预测的任务,该第二医学影像训练集对应第三样本量n3<1000,通过该第二医学影像训练集训练中间模型得到目标任务模型,该目标任务模型可称作二次迁移模型。可以理解,上述的中间任务和目标任务仅为示意性的说明,不用于限定本申请。
上述实施例中,通过不同数量的样本,并采用两次迁移学习,既保障了模型的稀疏性和泛化性能,又能迁移更多的与目标任务有关的知识,从而得到性能良好的目标任务模型。
参考图4,在一个实施例中,步骤S202,也就是获取根据通用图像集合训练得到的通用模型的步骤,具体包括以下步骤:
步骤S402,获取待训练的初始模型和通用图像集合;通用图像集合包括通用图像和对应的通用类别标签。
在一个实施例中,计算机设备可基于目标任务,计算机设备可根据目标任务构建对应的网络结构,再通过随机/零值/高斯核等事先预定的方式(即不与特定任务相关的方式)对网络结构的权值进行初始化,得到初始模型。
在一个实施例中,计算机设备还可设计可用于实现对图像进行分类处理的网络结构,在得到中间模型后,可基于具体的目标任务,对该中间网络的网络结构进行调整,比如添加全连接层或减少某些层等,得到适用于目标任务的网络结构,再进行再训练,得到目标任务模型。
步骤S404,通过初始模型对通用图像进行处理,得到对应的第一输出结果。
具体地,计算机设备可将通用图像输入至初始模型中进行处理,初始模型可对该通用图像进行特征提取,再基于提取的图像特征进行分类处理,到对应的第一输出结果。
步骤S406,根据第一输出结果与对应的通用类别标签的差异,确定第一损失函数。该步骤S406包括步骤S4062至步骤S4066。
具体地,计算机设备可根据第一输出结果与该通用图像所对应的通用类别标签之间的差异,确定第一损失函数。在一个实施例中,计算机设备可根据第一输出结果与该通用图像所对应的通用类别标签之间的差异构建第一分类损失函数,并将该第一分类损失函数直接作为第一损失函数。在另一些实施例中,计算机设备还可添加其他的损失与第一分类损失共同构建第一损失函数,其他的损失比如网络参数的L1范数损失或网络参数的L2范数损失等,本申请实施例对此不作限定。
在一个实施例中,为保障训练得到的通用模型具有较好的稀疏性,计算机设备在构建第一损失函数时,可考虑添加网络参数的范数损失。步骤S406,也就是根据第一输出结果与对应的通用类别标签的差异,确定第一损失函数,包括:
步骤S4062,根据第一输出结果与对应的通用类别标签的差异,确定第一分类损失。
具体地,第一输出结果与对应的通用类别标签的差异具体可以用交叉熵或均方误差等方式计算得到,当然也可通过其他的计算方式,本申请实施例对此不做限定。
步骤S4064,根据初始模型的网络参数确定第一参数损失。
具体地,计算机设备可根据初始模型的网络参数的L2范数,确定为第一参数损失。其中,L2范数指网络参数与0之间的欧式距离。也就是,计算机设备可将网络参数的L2范数作为第一参数损失。当然,计算机设备还可将网络参数的L1范数或其他范数作为第一参数损失,本申请实施例对此不做限定。
步骤S4066,基于第一分类损失和第一参数损失,构建第一损失函数。
具体地,计算机设备可对第一分类损失和第一参数损失进行加权求和,或者其他的数学运算,以确定第一损失函数。比如,计算机设备可通过以下公式计算得到第一损失函数:第一损失=第一分类损失+λA‖θ‖2;其中,θ表示网络参数;λA表示第一权重。
这样,将初始网络的参数损失添加至第一损失函数中,可保障训练得到的通用模型具有较良好的稀疏性和泛化性能。
步骤S408,以第一学习率调整初始模型的网络参数,将使得第一损失函数最小化的网络参数作为当次训练得到的网络参数。
具体地,计算机设备可按照第一学习率的步长,朝第一损失函数减小的方向上,调整初始模型的网络参数,将使得第一损失函数最小化的网络参数作为当次训练得到的网络参数。
在一个实施例中,计算机设备在对初始模型进行训练以得到通用模型的训练过程中,可将初始的学习率设置为一个较大的第一学习率lA,比如lA=0.1。当然,在不断的训练过程中,计算机设备既可保持该第一学习率不变来调参,也可慢慢减小该第一学习率来调参,以加快实现函数的收敛。
步骤S410,判断是否满足第一停止条件,若不满足则返回步骤S404,若满足则跳转至步骤S412。
步骤S412,停止训练得到通用模型。
其中,停止条件是结束模型训练的条件。停止条件可以是达到预设的迭代次数,或者是调整网络参数后的模型的分类性能指标达到预设指标,还可以是第一损失函数达到收敛等。本申请实施例中的第一停止条件、第二停止条件和第三停止条件都只结束模型训练的停止条件。
具体地,当计算机设备在对初始模型进行训练的过程中,若不满足第一停止条件,则继续输入训练数据进行迭代训练,直至满足第一停止条件时停止训练,得到通用模型。
上述实施例中,通过通用图像集合中大量的训练数据来迭代训练初始模型,可以得到具有通用分类功能的通用模型,且得到的通用模型具有良好的网络稀疏性和泛化性能。
参考图5,在一个实施例中,步骤S206,也就是通过第一医学影像和对应的类别标签,对通用模型进行再训练,得到中间模型,包括:
步骤S502,通过通用模型对第一医学影像进行处理,得到第二输出结果。
具体地,计算机设备可将第一医学影像输入至通用模型中进行处理,通用模型可对该第一医学影像进行特征提取,再基于提取的图像特征进行分类处理,到对应的第二输出结果。
步骤S504,根据第二输出结果与对应的类别标签的差异,确定第二损失函数。其中,如图5所示的,该步骤S504具体包括步骤S5042至步骤S5046。
具体地,计算机设备可根据第二输出结果与该第一医学影像所对应的类别标签之间的差异,确定第二损失函数。在一个实施例中,计算机设备可根据第二输出结果与该第一医学影像所对应的类别标签之间的差异构建第二分类损失函数,并将该第二分类损失函数直接作为第二损失函数。在另一些实施例中,计算机设备还可添加其他的损失与第二分类损失共同构建第二损失函数,其他的损失比如网络参数的L1范数损失或网络参数的L2范数损失等,本申请实施例对此不作限定。
在一个实施例中,为保障训练得到的中间模型可以保持住网络稀疏性,计算机设备在构建第二损失函数时,可考虑添加网络参数的范数损失。步骤S504,也就是根据第二输出结果与对应的类别标签的差异,确定第二损失函数的步骤,具体包括:
步骤S5042,根据第二输出结果与对应的类别标签的差异,确定第二分类损失。
具体地,第二输出结果与对应的类别标签的差异具体可以用交叉熵或均方误差等方式计算得到,当然也可通过其他的计算方式,本申请实施例对此不做限定。
步骤S5044,根据通用模型的网络参数确定第二参数损失。
具体地,计算机设备可根据通用模型的网络参数的L2范数,确定为第二参数损失。当然,计算机设备还可将网络参数的L1范数或其他范数作为第二参数损失,本申请实施例对此不做限定。
步骤S5046,基于第二分类损失和第二参数损失,构建第二损失函数;其中,第二参数损失在第二损失函数中的第二权重大于第一权重,第一权重为在训练得到通用模型的训练过程中,第一损失函数中第一参数损失的权重。
具体地,计算机设备可对第二分类损失和第二参数损失进行加权求和,或者其他的数学运算,以确定第二损失函数。比如,计算机设备可通过以下公式计算得到第二损失函数:第二损失=第二分类损失+λB‖θ‖2;其中,θ表示网络参数;λB表示第二权重。
在一个实施例中,为了保证网络稀疏性不被破坏,将L2范数损失赋予更大的权重,即λB>λA。这样,将通用网络的参数损失添加至第二损失函数中,可保障训练得到的中间模型在学习到目标部位的相关信息时,还能保持较良好的稀疏性和泛化性能。
步骤S506,以第二学习率调整通用模型的网络参数,将使得第二损失函数最小化的网络参数作为当次训练得到的网络参数;第二学习率与在训练得到通用模型的训练过程中的第一学习率的差异小于第一阈值。
具体地,计算机设备可按照第二学习率的步长,朝减小第二损失的方向上,调整通用模型的网络参数,将使得第二损失函数最小化的网络参数作为当次训练得到的网络参数。
在一个实施例中,计算机设备在对通用模型进行再次训练以得到中间模型的训练过程中,可将初始的学习率设置为一个较大的第二学习率lB,比如lB与lA相当,即lB≈lA。也就是说,计算机设备可控制第二学习率lB与第一学习率lA的差异小于预设的第一阈值,第一阈值比如0.01。可以理解,在不断的训练过程中,计算机设备既可保持该第二学习率不变来调参,也可慢慢减小该第二学习率来调参,以加快实现函数的收敛。
在一个实施例中,调整通用模型的网络参数可以是局部调整通用模型的网络参数。具体可保持部分网络参数不变,对另一部分网络参数做调整。
步骤S508,判断是否满足第二停止条件,若不满足则返回步骤S502,若满足则跳转至步骤S510。
步骤S510,停止训练得到中间模型。
具体地,当计算机设备在对通用模型进行训练的过程中,若不满足第二停止条件,则跳转至步骤S602并继续输入训练数据进行迭代训练,直至满足第二停止条件时停止训练,得到中间模型。
上述实施例中,中间模型由通用模型经过迁移学习而来,因此继承了通用模型稀疏性较好的特点,具有较好的泛化性能。同时第一医学影像训练集包含了异常的目标部位的信息,因此中间模型同时具有大量与目标任务相关的可迁移知识,便于实现更好的目标任务模型。
参考图6,在一个实施例中,步骤S210,也就是根据第二医学影像和对应的目标任务标签,对中间模型进行再训练,得到与目标任务对应的目标任务模型的步骤,具体包括以下步骤:
步骤S602,通过中间模型对第二医学影像进行处理,得到第三输出结果。
具体地,计算机设备可将第二医学影像输入至中间模型中进行处理,中间模型可对该第二医学影像进行特征提取,再基于提取的图像特征进行分类处理,到对应的第三输出结果。
步骤S604,根据第三输出结果与对应的目标任务标签的差异,确定第三损失函数。其中,如图6所示的,该步骤S604具体包括步骤S6042至步骤S6046。
具体地,计算机设备可根据第三输出结果与该第二医学影像所对应的目标任务标签之间的差异,确定第三损失函数。在一个实施例中,计算机设备可根据第三输出结果与该第二医学影像所对应的目标任务标签之间的差异构建第三分类损失函数,并将该第三分类损失函数直接作为第三损失函数。在另一些实施例中,计算机设备还可添加其他的损失与第三分类损失共同构建第三损失函数,其他的损失比如网络参数的L1范数损失或网络参数的L2范数损失等,本申请实施例对此不作限定。
在一个实施例中,为保障训练得到的目标任务模型可以保持住网络稀疏性,计算机设备在构建第三损失函数时,可考虑添加网络参数的范数损失。步骤S604,也就是根据第三输出结果与对应的目标任务标签的差异,确定第三损失函数的步骤,具体包括:
步骤S6042,根据第三输出结果与对应的目标任务标签的差异,确定目标任务损失。
具体地,第三输出结果与对应的目标任务标签的差异具体可以用交叉熵或均方误差等方式计算得到,当然也可通过其他的计算方式,本申请实施例对此不做限定。
步骤S6044,根据中间模型的网络参数确定第三参数损失。
具体地,计算机设备可根据中间模型的网络参数的L2范数,确定为第三参数损失。当然,计算机设备还可将网络参数的L1范数或其他范数作为第三参数损失,本申请实施例对此不做限定。
步骤S6046,基于目标任务损失和第三参数损失,构建第三损失函数;其中,第三参数损失在第三损失函数中的第三权重大于第一权重,且与第二权重的差异小于第二阈值;第一权重为在训练得到通用模型的训练过程中,第一损失函数中第一参数损失的权重;第二权重为在训练得到中间模型的训练过程中,第二损失函数中第二参数损失的权重。
具体地,计算机设备可对第三分类损失和第三参数损失进行加权求和,或者其他的数学运算,以确定第三损失函数。比如,计算机设备可通过以下公式计算得到第三损失函数:第三损失=第三分类损失+λC‖θ‖2;其中,θ表示网络参数;λC表示第三权重。
在一个实施例中,为了保证网络稀疏性不被破坏,在保证网络稀疏性不被破坏的前提下,需要得到更准确的分类结果,因此将L2范数损失赋予与λB相当的权重,即λC≈λB>λA。也就是,第三权重大于第一权重,第三权重与第二权重的差异小于预设的第二阈值。
这样,将中间网络的参数损失添加至第三损失函数中,可保障训练得到的目标任务模型在学习到与目标任务相关的信息时,还能保持较良好的稀疏性和泛化性能。
步骤S606,以第三学习率调整中间模型的网络参数,将使得第三损失函数最小化的网络参数作为当次训练得到的网络参数;第三学习率小于第二学习率;第二学习率为在训练得到中间模型的训练过程中的学习率;
具体地,计算机设备可按照第三学习率的步长,朝减小第三损失的方向上,调整中间模型的网络参数,将使得第三损失函数最小化的网络参数作为当次训练得到的网络参数。
在一个实施例中,计算机设备在对中间模型进行再次训练以得到目标任务模型的训练过程中,为了保证能够充分继承(不破坏)目标部位的相关知识,可将初始的学习率设置为一个较小的第三学习率lC,比如lC<0.1lB。可以理解,在不断的训练过程中,计算机设备既可保持该第三学习率不变来调参,也可慢慢减小该第三学习率来调参,以加快实现函数的收敛。
可以理解,由于中间任务与目标任务较为接近,通过第一医学影像训练集训练得到的中间模型,继承了与异常的目标部位相关的知识,那么计算机设备可设置一个较小的第三学习率来调整中间模型的网络参数,也就是对中间模型的网络参数进行微调,即可得到训练好的目标任务模型。
在一个实施例中,调整中间模型的网络参数可以是局部调整中间模型的网络参数。具体可保持部分网络参数不变,对另一部分网络参数做调整。
步骤S608,判断是否满足第三停止条件,若不满足则返回步骤S602,若满足则跳转至步骤S610。
步骤S610,停止训练得到目标任务模型。
具体地,当计算机设备在对中间模型进行训练的过程中,若不满足第三停止条件,则跳转至步骤S602并继续输入训练数据进行迭代训练,直至满足第三停止条件时停止训练,得到目标任务模型。
上述实施例中,通过两次迁移学习得到目标任务模型,既继承了通用模型和中间模型网络稀疏性较好的特点,具有较好的泛化性能,又能从中间模型中继承了大量关于异常的目标部位的有关信息,能够显著提升模型的准确率。
在一个实施例中,该医学影像处理方法还包括模型应用的步骤,该步骤具体包括:获取待处理的第三医学影像;通过训练好的所述目标任务模型对所述第三医学影像进行处理,得到与所述目标任务对应的预测结果。
具体地,当该医学影像处理好后,计算机设备可通过该目标任务模型执行对应的目标任务。可以理解,该训练好的目标任务模型可被传输至其他的计算机设备进行目标任务的执行,比如,该目标任务模型被传输至医生所使用的终端,以通过在终端上执行该目标任务模型,对患者的第三医学影像进行处理,得到与目标任务对应的预测结果。
在一个具体的应用场景中,该目标任务模型具体可以是修复效果预测模型,比如,肺癌靶向药物疗效评估模型。也就说,该异常的目标部位,具体可以是癌变的肺部。对于已经明确了部分基因突变位点的肺癌患者来说,有相应的靶向药物可以用于治疗。就整个肺癌患者群体而言,靶向药物可以明显提高患者生存期,但是具体到个人,治疗效果因人而异,无进展生存期差异较大。通过本申请各实施例所提供的目标任务模型,具体比如修复效果预测模型,能够在治疗前根据肿瘤CT影像对靶向药物治疗效果进行评估,得到预测结果。对于预测效果较差的患者可以采用其他的治疗手段进行多重干预,便可期望能够进一步提升患者的无进展生存期,用于辅助医生进行更准确的判断和工作。
参考图7,在一个实施例中,该模型应用的步骤具体包括:
步骤S702,获取待处理的第三医学影像。
具体地,计算机设备在训练得到目标任务模型后,可通过训练好的目标任务模型执行相应的目标任务。医学影像采集设备扫描目标对象异常的目标部位,得到对应的第三医学影像。计算机设备可获取该第三医学影像并执行后续的步骤。
步骤S704,对第三医学影像进行转换处理,得到多于一张的转换医学影像。
其中,转换处理是对数据进行调整,以用于增加数据量的一种方式,具体包括旋转操作、平移操作和缩放操作中的至少一种。具体地,计算机设备可采用旋转、平移或缩放等方式,对第三医学影像进行多次转换,得到多于一张的转换医学影像。可以理解,该多于一张转换医学影像中可包括该第三医学影像,也可不包括,本申请实施例对此不做限定。
步骤S706,通过训练好的目标任务模型分别对多于一张的转换医学影像进行处理,得到多于一个的中间预测结果。
具体地,计算机设备可通过训练好的目标任务模型分别对多于一张的转换医学影像进行处理,得到多于一个的中间预测结果。该目标任务模型具体可对各张转换医学影像进行特征提取,进而根据提取出的图像特征进行分类处理,输出对应概率向量,该概率向量即可认为是中间预测结果。
步骤S708,根据多于一个的中间预测结果,确定与第三医学影像对应的预测结果。
具体地,计算机设备可对多于一个的中间预测结果进行处理,确定与第三医学影像对应的预测结果。在其中一个实施例中,计算机设备可从多于一个的中间预测结果中找出置信度最高的中间预测结果作为最终的预测结果。其中,置信度表示中间预测结果的准确性;置信度越高,表明该中间预测结果越准确;置信度越低表明该中间结果越不准确。比如,计算机设备可从多于一个的概率向量中,将最大概率值所对应的预测类别对位最终的预测结果。
在一个实施例中,计算机设备可根据多于一个的中间预测结果进行求平均值运算,进而将平均结果作为对该第三医学影像进行处理的预测结果。举例说明,为了增加预测结果的鲁棒性,计算机设备可对待处理的第三医学影像进行旋转或平移的方式进行增强多次,得到多张转换医学影像,比如得到N张(其中,N为大于1的正整数,比如10)转换医学影像。进而再通过目标任务模型对各个转换医学影像进行处理,得到对应的N个中间预测结果pi。计算机设备可将这N个中间预测结果求平均得到对应的预测结果其中,pi表示第i个中间预测结果。进而,计算机设备可根据该预测结果输出对应的预测类别或预测位置信息等。
上述实施例中,对待处理的第三医学影像进行转换处理,得到多张转化医学影像,从而根据多张转换医学影像的中间预测结果来确定最终的预测结果,可增加预测结果的准确性和鲁棒性。
下面通过几个具体的应用场景来详细说明本申请各实施例所提供的医学影像处理方法:
在一个具体的应用场景中,目标任务包括对异常的目标部位的修复效果进行预测的任务;目标任务标签包括有效修复和无效修复;目标任务模型包括修复效果预测模型。
可以理解,采用不同的训练数据可得到不同的目标任务模型。一个具体的应用场景中,该中间任务具体可以是对目标部位的异常与否进行判别的任务。该目标任务具体可以是对异常的目标部位的修复效果进行预测的任务,那么相应的目标任务标签包括有效修复和无效修复,最终训练得到的目标任务模型具体可以是修复效果预测模型。
通俗来说,中间任务具体可以是对目标部位进行良恶性判别的任务。比如,当目标部位是肺部时,该中间任务具体可以是肺部肿瘤的良恶性判别;目标任务具体可以是对靶向药物的治疗效果进行评估的任务。可以理解,目标部位为肺部仅为示意性的举例说明,不用于限定本申请,该目标部位具体还可以是其他的部位,比如乳腺、眼睛或心脏等,与具体的应用场景相关。
下面以目标部位为肺部,来举例说明在该场景下医学影像处理方法的具体实施方式:
需要说明的是,对于已经明确了部分基因突变位点的肺癌患者来说,有相应的靶向药物可以用于治疗。就整个肺癌患者群体而言,靶向药物可以明显提高患者生存期,但是具体到个人,治疗效果因人而异,无进展生存期差异较大。通过本申请实施例所提供的目标任务模型,比如具体的效果修复预测模型,可基于患者的肺部医学影像,预测假如患者在接受肺癌靶向药物治疗后的治疗效果,从而给临床治疗提供辅助。对于预计预后效果较差的患者可以采用其他的治疗手段进行多重干预,便可期望能够进一步提升患者的无进展生存期。
在训练得到目标任务模型的过程中,计算机设备主要是基于二次迁移的思想来进行训练的。比如将任务A开发的模型作为初始点,重新训练任务B,之后基于任务B,重新训练任务C(即目标任务:靶向药物疗效评估)。这样通过二次迁移学习,能够充分利用大数据的先验知识,同时增加网络的稀疏性降低过拟合程度,以通过小样本学习得到预测效果良好的目标任务模型。
其中,具体从下面的三个部分来详细描述模型的训练过程:
①ImageNet 1000分类任务:
通用图像集合(也可称作数据集A):具体包括自然图像,可用数据量超过100万,分类任务超过1000类。
训练目的:得到稀疏性较好的模型,网络参数L2范数较低。
训练过程:首先使用高斯核等方法进行网络参数初始化(L2范数值较高),随后使用数据集A迭代训练直至收敛,初始学习率设置较大值为lA(比如0.1)。
第一损失函数:第一损失函数由分类损失和L2范数损失加权所得,θ表示网络参数;第一损失=第一分类损失+λA‖θ‖2。
训练结果:得到通用模型MA,对应网络参数为WA。由于数据集A数据量巨大,得到的通用模型的稀疏性很好(即模型参数的L2范数值较低),但是可迁移的知识(与肺癌靶向药物疗效评估相关的信息)较少。
②肺结节良恶性判别(也就是对目标部位是否异常的判别任务)。
第一医学影像训练集(也可称作数据集B):具体包括目标部位(也就是肺部)的医学影像,可用数据量超过1千,少于1万,用于二分类任务(良性vs恶性)的判别。
训练目的:在保证网络稀疏性的前提下,赋予网络与目标任务更相关的可迁移的知识,即与肺结节相关的知识。
训练过程:首先根据通用模型MA的网络参数WA进行初始化操作,随后使用数据集B调整(学习率为lB)迭代训练网络直至收敛。为了保证能够充分学习到肺结节相关知识,可设置初始学习率lB与学习率lA相当,即lB≈lA。
第二损失函数:第二损失函数由分类损失和L2范数损失加权所得,θ表示网络参数权值,为了保证网络稀疏性不被破坏,将L2范数损失赋予更大的权重,即λB>λA。具体可通过以下公式构建第二损失:第二损失=第二分类损失+λB‖θ‖2;其中,θ表示网络参数;λB表示第二权重。
训练结果:得到中间模型MB,该中间模型MB也可称作一次迁移模型MB,对应网络参数为WB。模型MB由模型MA迁移学习而来,因此继承了模型MA稀疏性较好的特点,具有较好的泛化性能。同时数据集B包含有肺部肿瘤的信息,因此模型MB同时具有大量与肺癌靶向药物疗效评估相关的可迁移知识。
③肺癌靶向药物疗效评估(也就是对异常的目标部位的修复效果进行预测的任务)。
第二医学影像训练集(也可称作数据集C):具体包括属于异常类别的目标部位的医学影像,也就是肺癌患者的肺部医学影像,可用数据量少于1千,二分类任务(有效vs无效)。
训练目的:在保证网络稀疏性和继承肺结节相关知识的前提下,得到目标任务模型。
训练过程:首先根据一次迁移模型MB的网络参数WB进行初始化操作,随后使用数据集C微调迭代训练网络直至收敛。为了保证能够充分继承(不破坏)肺结节相关知识,初始学习率lC设置较小,比如lC<0.1lB。
训练结果:得到目标任务模型MC,对应网络参数为WC。模型MC由模型MB迁移学习而来,因此继承了模型MB稀疏性较好的特点,具有较好的泛化性能。同时也从MB中继承了大量关于肺部肿瘤的有关信息,能够显著提升模型的准确率。
第三损失函数:第三损失函数由分类损失和L2范数损失加权所得,在保证网络稀疏性不被破坏的前提下,需要得到更准确的分类结果,因此将L2范数损失赋予与λB相当的权重,即λC≈λB>λA。第三损失=第三分类损失+λC‖θ‖2;其中,θ表示网络参数;λC表示第三权重。
至此,计算机设备就可通过二次迁移学习的方式,训练得到目标任务模型,具体比如肺癌靶向药物疗效评估的模型。在模型使用的过程中,为了增加预测结果的鲁棒性,对于输入的医学影像可进行旋转平移的方式进行增强多次,再通过训练得到的二次迁移模型MC分别进行处理,得到多个个预测概率,将多个预测概率进行平均得到肺癌靶向药物疗效评估结果。通过本申请各实施例所提及的模型训练方法,能够基于肺部的医学影像,对肺癌靶向药物疗效评估进行预测,从而辅助临床决策。
在另一个具体的应用场景中,该目标任务包括对异常的目标部位中的异常基因位点进行定位的任务;目标任务标签包括异常基因位点的位置信息;目标任务模型包括异常定位模型。
可以理解,采用不同的训练数据可得到不同的目标任务模型。一个具体的应用场景中,该中间任务具体可以是对目标部位的异常与否进行判别的任务。该目标任务具体可以是对中的异常基因位点进行定位的任务,那么相应的目标任务标签包括异常基因位点的位置信息,最终训练得到的目标任务模型具体可以是异常定位模型。
通俗来说,中间任务具体可以是对目标部位进行良恶性判别的任务。比如,当目标部位是肺部时,该中间任务具体可以是肺部肿瘤的良恶性判别;目标任务具体可以是对异常基因位点进行定位的任务。可以理解,目标部位为肺部仅为示意性的举例说明,不用于限定本申请,该目标部位具体还可以是其他的部位,比如乳腺、眼睛或心脏等,与具体的应用场景相关。
下面以目标部位为肺部,来举例说明在该场景下医学影像处理方法的具体实施方式:计算机设备可通过与前面描述的①和②两个部分相同的方式,训练得到一次迁移模型MB。计算机设备可基于目标任务对一次迁移学习进行网络结构的调整,比如增加全连接层等,以与定位任务相匹配。进而通过标注有异常基因位点的肺癌患者的肺部医学影像,进行再次训练得到异常定位模型。该异常定位模型可用于预测发生突变的基因位点,从而辅助临床决策。
本申请还另外提供一种应用场景,该应用场景应用上述的医学影像处理方法。具体地,该目标任务包括对异常的目标部位的异常原因进行判别的任务;目标任务标签包括异常原因的种类标签;目标任务模型包括异常原因判别模型。
具体地,在这个应用场景中,该中间任务具体可以是对目标部位的异常与否进行判别的任务。该目标任务具体可以是对异常的目标部位的异常原因进行判别的任务,那么相应的目标任务标签包括异常原因的种类标签,最终训练得到的目标任务模型具体可以是异常原因判别模型。
通俗来说,中间任务具体可以是对目标部位进行良恶性判别的任务。比如,当目标部位是眼睛时,相应的第一医学影像可以是眼底病灶图像,该中间任务具体可以是眼睛是否病变的判别;目标任务具体可以是对引起眼底病变的原因种类的判别任务。可以理解,目标部位为眼睛仅为示意性的举例说明,不用于限定本申请,该目标部位具体还可以是其他的部位,比如乳腺或心脏等,与具体的应用场景相关。
下面以目标部位为眼睛,来举例说明在该场景下医学影像处理方法的具体实施方式:计算机设备可通过与前面描述的①部分相同的方式,训练得到通用模型MA。进而通过良好的眼底图像和眼底病变图像再次训练该通用模型MA,得到对应的中间模型。计算机设备可根据带有原因种类的标签信息的眼底病变图像来再次训练中间模型,得到异常原因判别模型,该异常原因判别模型可用于预测引起眼底异常的原因可能是哪些,从而辅助临床决策。
需要说明的是,上述示意性的具体应用场景的说明,仅用于进一步的说明本申请的原理,而不用于限定本申请的保护范围,应当可以理解,对于其他部位的其他应用场景的分类模型的训练方法,也在本申请的保护范围之内。
应该理解的是,虽然前述各流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,前述流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图8所示,提供了一种医学影像处理装置800,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:获取模块801和训练模块802,其中:
获取模块801,用于获取根据通用图像集合训练得到的通用模型。
获取模块801,还用于获取与目标部位对应的第一医学影像、及第一医学影像所对应的类别标签;类别标签包括表征正常类别的标签和表征异常类别的标签。
训练模块802,用于通过第一医学影像和对应的类别标签,对通用模型进行再训练,得到中间模型。
获取模块801,还用于获取与目标部位对应的第二医学影像、及第二医学影像所对应的目标任务标签;其中,第二医学影像是属于异常类别的医学影像。
训练模块802,还用于根据第二医学影像和对应的目标任务标签,对中间模型进行再训练,得到与目标任务对应的目标任务模型;目标任务模型用于对待处理的第三医学影像进行处理,得到与目标任务对应的预测结果。
在一个实施例中,通用图像集合的第一样本量,大于由第一医学影像和对应的类别标签所构成的第一医学影像训练集的第二样本量;第二样本量,大于由第二医学影像和对应的目标任务标签所构成的第二医学影像训练集的第三样本量。
在一个实施例中,获取模块801还用于获取待训练的初始模型和通用图像集合;通用图像集合包括通用图像和对应的通用类别标签。训练模块802还用于通过初始模型对通用图像进行处理,得到对应的第一输出结果;根据第一输出结果与对应的通用类别标签的差异,确定第一损失函数;以第一学习率调整初始模型的网络参数,将使得第一损失函数最小化的网络参数作为当次训练得到的网络参数;返回通过初始模型对通用图像进行处理,得到对应的第一输出结果的步骤并继续训练,直到满足第一停止条件时停止训练,得到通用模型。
在一个实施例中,训练模块802还用于根据第一输出结果与对应的通用类别标签的差异,确定第一分类损失;根据初始模型的网络参数确定第一参数损失;基于第一分类损失和第一参数损失,构建第一损失函数。
在一个实施例中,训练模块802还用于通过通用模型对第一医学影像进行处理,得到第二输出结果;根据第二输出结果与对应的类别标签的差异,确定第二损失函数;以第二学习率调整通用模型的网络参数,将使得第二损失函数最小化的网络参数作为当次训练得到的网络参数;第二学习率与在训练得到通用模型的训练过程中的第一学习率的差异小于第一阈值;返回通过通用模型对第一医学影像进行处理,得到第二输出结果的步骤并继续训练,直到满足第二停止条件时停止训练,得到中间模型。
在一个实施例中,训练模块802还用于根据第二输出结果与对应的类别标签的差异,确定第二分类损失;根据通用模型的网络参数确定第二参数损失;基于第二分类损失和第二参数损失,构建第二损失函数;其中,第二参数损失在第二损失函数中的第二权重大于第一权重,第一权重为在训练得到通用模型的训练过程中,第一损失函数中第一参数损失的权重。
在一个实施例中,训练模块802还用于通过中间模型对第二医学影像进行处理,得到第三输出结果;根据第三输出结果与对应的目标任务标签的差异,确定第三损失函数;以第三学习率调整中间模型的网络参数,将使得第三损失函数最小化的网络参数作为当次训练得到的网络参数;第三学习率小于第二学习率;第二学习率为在训练得到中间模型的训练过程中的学习率;返回通过中间模型对第二医学影像进行处理,得到第三输出结果的步骤并继续训练,直到满足第三停止条件时停止训练,得到目标任务模型。
在一个实施例中,训练模块802还用于根据第三输出结果与对应的目标任务标签的差异,确定目标任务损失;根据中间模型的网络参数确定第三参数损失;基于目标任务损失和第三参数损失,构建第三损失函数;其中,第三参数损失在第三损失函数中的第三权重大于第一权重,且与第二权重的差异小于第二阈值;第一权重为在训练得到通用模型的训练过程中,第一损失函数中第一参数损失的权重;第二权重为在训练得到中间模型的训练过程中,第二损失函数中第二参数损失的权重。
参考图9,在一个实施例中,该医学影像处理装置800还包括模型处理模块803,用于获取待处理的第三医学影像;通过训练好的目标任务模型对第三医学影像进行处理,得到与目标任务对应的预测结果。
在一个实施例中,该模型处理模块803还用于对第三医学影像进行转换处理,得到多于一张的转换医学影像;通过训练好的目标任务模型分别对多于一张的转换医学影像进行处理,得到多于一个的中间预测结果;根据多于一个的中间预测结果,确定与第三医学影像对应的预测结果。
在一个实施例中,目标任务包括对异常的目标部位的修复效果进行预测的任务;目标任务标签包括有效修复和无效修复;目标任务模型包括修复效果预测模型。
在一个实施例中,目标任务包括对异常的目标部位中的异常基因位点进行定位的任务;目标任务标签包括异常基因位点的位置信息;目标任务模型包括异常定位模型。
在一个实施例中,目标任务包括对异常的目标部位的异常原因进行判别的任务;目标任务标签包括异常原因的种类标签;目标任务模型包括异常原因判别模型。
上述医学影像处理装置,首先根据通用图像集合进行模型训练,可以得到稀疏性和泛化能力良好的通用模型。再基于该通用模型对目标部位的第一医学影像图像、以及表征是否异常的类别标签来再次训练该通用模型。这样可在继承模型良好的稀疏性和泛化能力的前提下,使得模型学习到与目标部位有关的医学信息,具有识别目标部位异常的能力。进而再基于中间模型,通过属于异常类别的第二医学影像和相应的目标任务标签进行再一次的训练,就可通过少量的训练样本来重点学习与目标任务有关的信息,得到目标任务模型。这样,根据训练数据学习相应特征,突破了人工设计特征的局限性,并通过二次迁移学习的训练方式,既能提高模型的稀疏性和泛化性能,又能迁移更多的信息,使得训练得到的目标任务模型具有更好的处理性能,在通过目标任务模型对待处理的第三医学影像进行处理后,可以得到与目标任务对应的准确的预测结果。
关于医学影像处理装置的具体限定可以参见上文中对于医学影像处理方法的限定,在此不再赘述。上述医学影像处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端或服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种医学影像处理方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (15)
1.一种医学影像处理方法,其特征在于,所述方法包括:
获取根据通用图像集合训练得到的通用模型;
获取与目标部位对应的第一医学影像、及所述第一医学影像所对应的类别标签;所述类别标签包括表征正常类别的标签和表征异常类别的标签;
通过所述第一医学影像和对应的类别标签,对所述通用模型进行再训练,得到中间模型;
获取与所述目标部位对应的第二医学影像、及所述第二医学影像所对应的目标任务标签;其中,所述第二医学影像是属于异常类别的医学影像;
根据所述第二医学影像和对应的目标任务标签,对所述中间模型进行再训练,得到与目标任务对应的目标任务模型;所述目标任务模型用于对待处理的第三医学影像进行处理,得到与所述目标任务对应的预测结果。
2.根据权利要求1所述的方法,其特征在于,所述通用图像集合的第一样本量,大于由所述第一医学影像和对应的类别标签所构成的第一医学影像训练集的第二样本量;所述第二样本量,大于由所述第二医学影像和对应的目标任务标签所构成的第二医学影像训练集的第三样本量。
3.根据权利要求1所述的方法,其特征在于,所述获取根据通用图像集合训练得到的通用模型,包括:
获取待训练的初始模型和通用图像集合;所述通用图像集合包括通用图像和对应的通用类别标签;
通过所述初始模型对所述通用图像进行处理,得到对应的第一输出结果;
根据所述第一输出结果与对应的通用类别标签的差异,确定第一损失函数;
以第一学习率调整所述初始模型的网络参数,将使得所述第一损失函数最小化的网络参数作为当次训练得到的网络参数;
返回所述通过所述初始模型对所述通用图像进行处理,得到对应的第一输出结果的步骤并继续训练,直到满足第一停止条件时停止训练,得到通用模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一输出结果与对应的通用类别标签的差异,确定第一损失函数,包括:
根据所述第一输出结果与对应的通用类别标签的差异,确定第一分类损失;
根据所述初始模型的网络参数确定第一参数损失;
基于所述第一分类损失和所述第一参数损失,构建第一损失函数。
5.根据权利要求1所述的方法,其特征在于,所述通过所述第一医学影像和对应的类别标签,对所述通用模型进行再训练,得到中间模型,包括:
通过所述通用模型对所述第一医学影像进行处理,得到第二输出结果;
根据所述第二输出结果与对应的类别标签的差异,确定第二损失函数;
以第二学习率调整所述通用模型的网络参数,将使得所述第二损失函数最小化的网络参数作为当次训练得到的网络参数;所述第二学习率与在训练得到通用模型的训练过程中的第一学习率的差异小于第一阈值;
返回所述通过所述通用模型对所述第一医学影像进行处理,得到第二输出结果的步骤并继续训练,直到满足第二停止条件时停止训练,得到中间模型。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第二输出结果与对应的类别标签的差异,确定第二损失函数,包括:
根据所述第二输出结果与对应的类别标签的差异,确定第二分类损失;
根据所述通用模型的网络参数确定第二参数损失;
基于所述第二分类损失和所述第二参数损失,构建第二损失函数;其中,所述第二参数损失在所述第二损失函数中的第二权重大于第一权重,所述第一权重为在训练得到通用模型的训练过程中,第一损失函数中第一参数损失的权重。
7.根据权利要求1所述的方法,其特征在于,所述根据所述第二医学影像和对应的目标任务标签,对所述中间模型进行再训练,得到与目标任务对应的目标任务模型,包括:
通过所述中间模型对所述第二医学影像进行处理,得到第三输出结果;
根据所述第三输出结果与对应的目标任务标签的差异,确定第三损失函数;
以第三学习率调整所述中间模型的网络参数,将使得所述第三损失函数最小化的网络参数作为当次训练得到的网络参数;所述第三学习率小于第二学习率;所述第二学习率为在训练得到中间模型的训练过程中的学习率;
返回所述通过所述中间模型对所述第二医学影像进行处理,得到第三输出结果的步骤并继续训练,直到满足第三停止条件时停止训练,得到目标任务模型。
8.根据权利要求7所述的方法,其特征在于,所述根据所述第三输出结果与对应的目标任务标签的差异,确定第三损失函数,包括:
根据所述第三输出结果与对应的目标任务标签的差异,确定目标任务损失;
根据所述中间模型的网络参数确定第三参数损失;
基于所述目标任务损失和所述第三参数损失,构建第三损失函数;其中,所述第三参数损失在所述第三损失函数中的第三权重大于第一权重,且与第二权重的差异小于第二阈值;所述第一权重为在训练得到通用模型的训练过程中,第一损失函数中第一参数损失的权重;所述第二权重为在训练得到中间模型的训练过程中,第二损失函数中第二参数损失的权重。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取待处理的第三医学影像;
通过训练好的所述目标任务模型对所述第三医学影像进行处理,得到与所述目标任务对应的预测结果。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
对所述第三医学影像进行转换处理,得到多于一张的转换医学影像;
所述通过训练好的所述目标任务模型对所述第三医学影像进行处理,得到与所述目标任务对应的预测结果,包括:
通过训练好的所述目标任务模型分别对多于一张的转换医学影像进行处理,得到多于一个的中间预测结果;
根据多于一个的中间预测结果,确定与所述第三医学影像对应的预测结果。
11.根据权利要求1-10中任一项所述的方法,其特征在于,所述目标任务包括对异常的目标部位的修复效果进行预测的任务;所述目标任务标签包括有效修复和无效修复;所述目标任务模型包括修复效果预测模型。
12.根据权利要求1-10中任一项所述的方法,其特征在于,所述目标任务包括对异常的目标部位中的异常基因位点进行定位的任务;所述目标任务标签包括异常基因位点的位置信息;所述目标任务模型包括异常定位模型。
13.根据权利要求1-10中任一项所述的方法,其特征在于,所述目标任务包括对异常的目标部位的异常原因进行判别的任务;所述目标任务标签包括异常原因的种类标签;所述目标任务模型包括异常原因判别模型。
14.一种医学影像处理装置,其特征在于,所述装置包括:
获取模块,用于获取根据通用图像集合训练得到的通用模型;
所述获取模块,还用于获取与目标部位对应的第一医学影像、及所述第一医学影像所对应的类别标签;所述类别标签包括表征正常类别的标签和表征异常类别的标签;
训练模块,用于通过所述第一医学影像和对应的类别标签,对所述通用模型进行再训练,得到中间模型;
所述获取模块,还用于获取与所述目标部位对应的第二医学影像、及所述第二医学影像所对应的目标任务标签;其中,所述第二医学影像是属于异常类别的医学影像;
所述训练模块,还用于根据所述第二医学影像和对应的目标任务标签,对所述中间模型进行再训练,得到与目标任务对应的目标任务模型;所述目标任务模型用于对待处理的第三医学影像进行处理,得到与所述目标任务对应的预测结果。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至13中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010566649.5A CN111709485B (zh) | 2020-06-19 | 2020-06-19 | 医学影像处理方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010566649.5A CN111709485B (zh) | 2020-06-19 | 2020-06-19 | 医学影像处理方法、装置和计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111709485A true CN111709485A (zh) | 2020-09-25 |
CN111709485B CN111709485B (zh) | 2023-10-31 |
Family
ID=72541165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010566649.5A Active CN111709485B (zh) | 2020-06-19 | 2020-06-19 | 医学影像处理方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111709485B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112164447A (zh) * | 2020-10-20 | 2021-01-01 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、设备及存储介质 |
CN112465042A (zh) * | 2020-12-02 | 2021-03-09 | 中国联合网络通信集团有限公司 | 一种分类网络模型的生成方法及装置 |
CN112541941A (zh) * | 2020-12-07 | 2021-03-23 | 明峰医疗系统股份有限公司 | 一种基于ct定位片的扫描流程决策方法及系统 |
CN112766314A (zh) * | 2020-12-31 | 2021-05-07 | 上海联影智能医疗科技有限公司 | 解剖结构的识别方法、电子设备及存储介质 |
CN112766333A (zh) * | 2021-01-08 | 2021-05-07 | 广东中科天机医疗装备有限公司 | 医学影像处理模型训练方法、医学影像处理方法及装置 |
CN113379687A (zh) * | 2021-05-28 | 2021-09-10 | 上海联影智能医疗科技有限公司 | 网络训练方法、图像检测方法和介质 |
TWI816078B (zh) * | 2021-01-05 | 2023-09-21 | 財團法人工業技術研究院 | 樣本分群探勘方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180121799A1 (en) * | 2016-11-03 | 2018-05-03 | Salesforce.Com, Inc. | Training a Joint Many-Task Neural Network Model using Successive Regularization |
CN108304936A (zh) * | 2017-07-12 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 机器学习模型训练方法和装置、表情图像分类方法和装置 |
CN108416379A (zh) * | 2018-03-01 | 2018-08-17 | 北京羽医甘蓝信息技术有限公司 | 用于处理宫颈细胞图像的方法和装置 |
CN109192305A (zh) * | 2018-09-12 | 2019-01-11 | 中国人民解放军陆军军医大学第二附属医院 | 一种基于深度循环神经网络的心功能自动分析方法 |
CN110490296A (zh) * | 2018-05-14 | 2019-11-22 | 三星电子株式会社 | 一种构造卷积神经网络(cnn)模型的方法和系统 |
-
2020
- 2020-06-19 CN CN202010566649.5A patent/CN111709485B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180121799A1 (en) * | 2016-11-03 | 2018-05-03 | Salesforce.Com, Inc. | Training a Joint Many-Task Neural Network Model using Successive Regularization |
CN108304936A (zh) * | 2017-07-12 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 机器学习模型训练方法和装置、表情图像分类方法和装置 |
CN108416379A (zh) * | 2018-03-01 | 2018-08-17 | 北京羽医甘蓝信息技术有限公司 | 用于处理宫颈细胞图像的方法和装置 |
CN110490296A (zh) * | 2018-05-14 | 2019-11-22 | 三星电子株式会社 | 一种构造卷积神经网络(cnn)模型的方法和系统 |
CN109192305A (zh) * | 2018-09-12 | 2019-01-11 | 中国人民解放军陆军军医大学第二附属医院 | 一种基于深度循环神经网络的心功能自动分析方法 |
Non-Patent Citations (2)
Title |
---|
彭钊 等: "一种基于Tikhonov正则化的改进多面函数拟合法", 《大地测量与地球动力学》, vol. 39, no. 3 * |
邓齐林 等: "一种自适应在线核密度估计方法", 《软件学报》, vol. 31, no. 4 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112164447A (zh) * | 2020-10-20 | 2021-01-01 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、设备及存储介质 |
CN112465042A (zh) * | 2020-12-02 | 2021-03-09 | 中国联合网络通信集团有限公司 | 一种分类网络模型的生成方法及装置 |
CN112465042B (zh) * | 2020-12-02 | 2023-10-24 | 中国联合网络通信集团有限公司 | 一种分类网络模型的生成方法及装置 |
CN112541941A (zh) * | 2020-12-07 | 2021-03-23 | 明峰医疗系统股份有限公司 | 一种基于ct定位片的扫描流程决策方法及系统 |
CN112541941B (zh) * | 2020-12-07 | 2023-12-15 | 明峰医疗系统股份有限公司 | 一种基于ct定位片的扫描流程决策方法及系统 |
CN112766314A (zh) * | 2020-12-31 | 2021-05-07 | 上海联影智能医疗科技有限公司 | 解剖结构的识别方法、电子设备及存储介质 |
CN112766314B (zh) * | 2020-12-31 | 2024-05-28 | 上海联影智能医疗科技有限公司 | 解剖结构的识别方法、电子设备及存储介质 |
TWI816078B (zh) * | 2021-01-05 | 2023-09-21 | 財團法人工業技術研究院 | 樣本分群探勘方法 |
CN112766333A (zh) * | 2021-01-08 | 2021-05-07 | 广东中科天机医疗装备有限公司 | 医学影像处理模型训练方法、医学影像处理方法及装置 |
CN113379687A (zh) * | 2021-05-28 | 2021-09-10 | 上海联影智能医疗科技有限公司 | 网络训练方法、图像检测方法和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111709485B (zh) | 2023-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111709485B (zh) | 医学影像处理方法、装置和计算机设备 | |
Yousef et al. | A holistic overview of deep learning approach in medical imaging | |
Gao et al. | Prostate segmentation by sparse representation based classification | |
Wu et al. | Classification of lung nodules based on deep residual networks and migration learning | |
CN112365980B (zh) | 脑肿瘤多靶点辅助诊断与前瞻性治疗演化可视化方法及系统 | |
Wang et al. | Residual feedback network for breast lesion segmentation in ultrasound image | |
CN112149717A (zh) | 基于置信度加权的图神经网络训练方法及装置 | |
CN111192660B (zh) | 一种影像报告分析方法、设备及计算机存储介质 | |
CN111882538A (zh) | 一种区分肺结核与肿瘤信息的处理系统及信息处理方法 | |
Tao et al. | NSCR‐Based DenseNet for Lung Tumor Recognition Using Chest CT Image | |
Amorim et al. | Interpreting deep machine learning models: an easy guide for oncologists | |
Liu et al. | AHU-MultiNet: adaptive loss balancing based on homoscedastic uncertainty in multi-task medical image segmentation network | |
Zhang et al. | Deep belief network for lung nodules diagnosed in CT imaging | |
Henderson et al. | Automatic identification of segmentation errors for radiotherapy using geometric learning | |
Jiang et al. | Construction of pancreatic cancer classifier based on SVM optimized by improved FOA | |
Wang et al. | Segment medical image using U-Net combining recurrent residuals and attention | |
Jeya Sundari et al. | Factorization‐based active contour segmentation and pelican optimization‐based modified bidirectional long short‐term memory for ovarian tumor detection | |
Palanisamy et al. | Optimization-based neutrosophic set for medical image processing | |
Chanumolu et al. | Multimodal Medical Imaging Using Modern Deep Learning Approaches | |
CN115049596A (zh) | 模板影像库的生成方法、目标定位方法、装置和存储介质 | |
Ünlü et al. | Classification of skin images with respect to melanoma and nonmelanoma using the deep neural network | |
Xiong et al. | Lung field segmentation using weighted sparse shape composition with robust initialization | |
Alrahhal et al. | Deep learning-based system for detection of lung cancer using fusion of features | |
CN114724016A (zh) | 图像分类方法、计算机设备和存储介质 | |
CN114693671A (zh) | 基于深度学习的肺结节半自动分割方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40028906 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |