CN117355850A - 机器学习模型的训练方法、装置、计算机设备和存储介质 - Google Patents
机器学习模型的训练方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN117355850A CN117355850A CN202180098440.3A CN202180098440A CN117355850A CN 117355850 A CN117355850 A CN 117355850A CN 202180098440 A CN202180098440 A CN 202180098440A CN 117355850 A CN117355850 A CN 117355850A
- Authority
- CN
- China
- Prior art keywords
- machine learning
- model
- learning model
- training
- sample set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 861
- 238000012549 training Methods 0.000 title claims abstract description 767
- 238000000034 method Methods 0.000 title claims abstract description 86
- 238000004590 computer program Methods 0.000 claims description 36
- 230000006870 function Effects 0.000 claims description 14
- 230000004083 survival effect Effects 0.000 claims description 8
- 206010028980 Neoplasm Diseases 0.000 claims description 7
- 201000011510 cancer Diseases 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 9
- 238000012360 testing method Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000002591 computed tomography Methods 0.000 description 4
- 238000007408 cone-beam computed tomography Methods 0.000 description 4
- 238000011478 gradient descent method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000002604 ultrasonography Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013210 evaluation model Methods 0.000 description 2
- 238000002595 magnetic resonance imaging Methods 0.000 description 2
- 238000001959 radiotherapy Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 241001522296 Erithacus rubecula Species 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002600 positron emission tomography Methods 0.000 description 1
- 238000002601 radiography Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/40—ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种机器学习模型的训练方法、装置、计算机设备和存储介质。所述方法包括:获取第一训练样本集和第二训练样本集;所述第一训练样本集和所述第二训练样本集中的训练样本包括医学扫描设备对扫描对象进行扫描得到的医学影像;基于所述第一训练样本集进行多轮模型训练,得到第一机器学习模型;基于所述第二训练样本集进行多轮模型训练,得到第二机器学习模型;其中,所述第一机器学习模型与所述第二机器学习模型至少部分结构相同,且训练所述第一机器学习模型时至少部分利用所述第二机器学习模型的模型参数,训练所述第二机器学习模型时至少部分利用所述第一机器学习模型的模型参数。采用本方法无需共享医学影像即可提高模型准确度。
Description
本申请涉及模型训练技术领域,特别是涉及一种机器学习模型的训练方法、装置、计算机设备和存储介质。
随着医学影像设备的发展,对医学影像进行图像处理的机器学习模型得到了广泛使用。
通常情况下,训练机器学习模型需要大量的训练样本。但是,由于医学影像涉及患者隐私和数据安全,医院之间并不能共享医学影像,因此会出现机器学习模型的训练样本较少,机器学习模型的准确度较差的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种无需共享医学影像即可提高模型准确度的机器学习模型的训练方法、装置、计算机设备和存储介质。
一种机器学习模型的训练方法,该方法包括:
获取第一训练样本集和第二训练样本集;第一训练样本集和第二训练样本集中的训练样本包括医学扫描设备对扫描对象进行扫描得到的医学影像;
基于第一训练样本集进行多轮模型训练,得到第一机器学习模型;
基于第二训练样本集进行多轮模型训练,得到第二机器学习模型;
其中,第一机器学习模型与第二机器学习模型至少部分结构相同,且训练第一机器学习模型时至少部分利用第二机器学习模型的模型参数,训练第二机器学习模型时至少部分利用第一机器学习模型的模型参数。
在其中一个实施例中,上述基于第一训练样本集进行多轮模型训练,得到第一机器学习模型,包括:
基于第一初始模型参数和第一训练样本集进行第一轮模型训练,得到第一初始模型;第一初始模型的至少部分模型参数用于训练第二机器学习模型;
基于第一训练样本集和当前的第二机器学习模型的至少部分模型参数进行第N轮模型训练,得到第一机器学习模型;N为大于1的正整数;
若确定第一机器学习模型的模型指标满足第一预设指标,则结束第一机器学习模型的训练。
在其中一个实施例中,第一机器学习模型与第二机器学习模型部分结构相同,上述基于第一训练样本集和当前的第二机器学习模型的至少部分模型参数进行第N轮模型训练, 得到第一机器学习模型,包括:
基于第一训练样本集、当前的第二机器学习模型的结构相同部分的模型参数以及前一轮训练得到的第一机器学习模型的部分模型参数进行第N轮模型训练,得到第一机器学习模型。
在其中一个实施例中,第一机器学习模型与第二机器学习模型全部结构相同,上述基于第一训练样本集和当前的第二机器学习模型的至少部分模型参数进行第N轮模型训练,得到第一机器学习模型,包括:
基于第一训练样本集、当前的第二机器学习模型的全部模型参数进行第N轮模型训练,得到第一机器学习模型。
在其中一个实施例中,该方法还包括:
若确定第一机器学习模型的模型指标不满足第一预设指标,则进行第一机器学习模型的第N+1轮训练。
在其中一个实施例中,上述基于第二训练样本集进行多轮模型训练,得到第二机器学习模型,包括:
基于第二训练样本集和当前的第一机器学习模型的至少部分模型参数进行第M轮模型训练,得到第二机器学习模型;其中,M为大于0的正整数;
若第二机器学习模型的模型指标满足第二预设指标,则结束第二机器学习模型的训练。
在其中一个实施例中,第一机器学习模型与第二机器学习模型部分结构相同,上述基于第二训练样本集和当前的第一机器学习模型的至少部分模型参数进行第M轮模型训练,得到第二机器学习模型,包括:
基于第二训练样本集、第一初始模型的结构相同部分的模型参数以及第二初始模型参数进行第一轮训练,得到第二初始模型;第二初始模型的至少部分参数用于训练第一机器学习模型;
基于第二训练样本集、当前的第一机器学习模型的结构相同部分的模型参数以及前一轮训练得到的第二机器学习模型的部分模型参数继续进行模型训练,得到第二机器学习模型。
在其中一个实施例中,第一机器学习模型与第二机器学习模型全部结构相同,上述基于第二训练样本集和当前的第一机器学习模型的模型参数进行第M轮模型训练,得到第二机器学习模型,包括:
基于第二训练样本集、当前的第一机器学习模型的全部模型参数进行第M轮模型训练,得到第二机器学习模型。
在其中一个实施例中,该方法还包括:
若确定第二机器学习模型的模型指标不满足第二预设指标,则进行第二机器学习模型的第M+1轮训练。
在其中一个实施例中,模型指标包括输出结果的准确率,第一预设指标包括第一预设准确率;第二预设指标包括第二预设准确率。
在其中一个实施例中,该方法还包括:
在每一轮训练过程中,若根据预设损失函数确定机器学习模型的输出结果不符合预设收敛条件,则利用批量梯度算法确定下降梯度并继续训练,直到确定机器学习模型的输出结果符合预设收敛条件时,停止本轮训练。
在其中一个实施例中,上述获取第一训练样本集和第二训练样本集,包括:
获取第一医院的医学影像,并基于第一医院的医学影像生成第一训练样本集;
获取第二医院的医学影像,并基于第二医院的医学影像生成第二训练样本集;
其中,第一医院与第二医院为不同的医院。
在其中一个实施例中,第一机器学习模型和第二机器学习模型包括剂量预测模型、自动勾画模型、疗效评估模型、生存指标评估模型、癌症筛查模型和形变配准模型中的至少一种。
在其中一个实施例中,第一机器学习模型的模型参数和第二机器学习模型的模型参数通过网络传递;
或,第一机器学习模型的模型参数和第二机器学习模型的模型参数通过存储介质传递。
在其中一个实施例中,第一机器学习模型的训练和第二机器学习模型的训练分别在两个独立的网络进行。
在其中一个实施例中,第一机器学习模型的训练与第二机器学习模型的训练交替进行。
在其中一个实施例中,第一机器学习模型和第二机器学习模型的结构相同且应用相同。
在其中一个实施例中,第一机器学习模型和第二机器学习模型的应用不同。
在其中一个实施例中,训练第一机器学习模型和第二机器学习模型的过程中,仅传递模型参数。
在其中一个实施例中,该方法还包括:
将第一机器学习模型与第二机器学习模型进行组合处理,得到目标机器学习模型。
一种机器学习模型的训练方法,该方法包括:
获取至少两个训练样本集;训练样本集中的训练样本包括医学扫描设备对扫描对象进行扫描得到的医学影像;
基于各训练样本集进行多轮模型训练,得到各训练样本集对应的机器学习模型;
其中,至少两个机器学习模型中的每两个机器学习模型至少部分结构相同,且训练其中一个机器学习模型时,至少部分利用另一个机器学习模型的结构相同部分的模型参数。
在其中一个实施例中,基于各训练样本集进行多轮模型训练,得到各训练样本集对应 的机器学习模型,包括:
对于各机器学习模型,获取当前轮的模型参数,并基于机器学习模型对应的训练样本集和当前轮的模型参数进行模型训练,得到机器学习模型;其中,当前轮的模型参数包括初始模型参数或另一机器学习模型中结构相同部分的模型参数。
在其中一个实施例中,各机器学习模型的训练在独立的网络进行。
在其中一个实施例中,至少两个机器学习模型的结构相同且应用相同。
在其中一个实施例中,各机器学习模型的应用不同。
一种机器学习模型的训练装置,该装置包括:
样本集获取模块,用于获取第一训练样本集和第二训练样本集;第一训练样本集和第二训练样本集中的训练样本包括医学扫描设备对扫描对象进行扫描得到的医学影像;
第一训练模块,用于基于第一训练样本集进行多轮模型训练,得到第一机器学习模型;
第二训练模块,用于基于第二训练样本集进行多轮模型训练,得到第二机器学习模型;
其中,第一机器学习模型与第二机器学习模型至少部分结构相同,且训练第一机器学习模型时至少部分利用第二机器学习模型的模型参数,训练第二机器学习模型时至少部分利用第一机器学习模型的模型参数。
在其中一个实施例中,上述第一训练模块,具体用于基于第一初始模型参数和第一训练样本集进行第一轮模型训练,得到第一初始模型;第一初始模型的至少部分模型参数用于训练第二机器学习模型;基于第一训练样本集和当前的第二机器学习模型的至少部分模型参数进行第N轮模型训练,得到第一机器学习模型;N为大于1的正整数;若确定第一机器学习模型的模型指标满足第一预设指标,则结束第一机器学习模型的训练。
在其中一个实施例中,第一机器学习模型与第二机器学习模型部分结构相同,上述第一训练模块,具体用于基于第一训练样本集、当前的第二机器学习模型的结构相同部分的模型参数以及前一轮训练得到的第一机器学习模型的部分模型参数进行第N轮模型训练,得到第一机器学习模型。
在其中一个实施例中,第一机器学习模型与第二机器学习模型全部结构相同,上述第一训练模块,具体用于基于第一训练样本集、当前的第二机器学习模型的全部模型参数进行第N轮模型训练,得到第一机器学习模型。
在其中一个实施例中,上述第一训练模块,还用于若确定第一机器学习模型的模型指标不满足第一预设指标,则进行第一机器学习模型的第N+1轮训练。
在其中一个实施例中,上述第二训练模块,具体用于基于第二训练样本集和当前的第一机器学习模型的至少部分模型参数进行第M轮模型训练,得到第二机器学习模型;其中,M为大于0的正整数;若第二机器学习模型的模型指标满足第二预设指标,则结束第二机器学习模型的训练。
在其中一个实施例中,第一机器学习模型与第二机器学习模型部分结构相同,上述第二训练模块,具体用于基于第二训练样本集、第一初始模型的结构相同部分的模型参数以 及第二初始模型参数进行第一轮训练,得到第二初始模型;第二初始模型的至少部分参数用于训练第一机器学习模型;基于第二训练样本集、当前的第一机器学习模型的结构相同部分的模型参数以及前一轮训练得到的第二机器学习模型的部分模型参数继续进行模型训练,得到第二机器学习模型。
在其中一个实施例中,第一机器学习模型与第二机器学习模型全部结构相同,上述第二训练模块,具体用于基于第二训练样本集、当前的第一机器学习模型的全部模型参数进行第M轮模型训练,得到第二机器学习模型。
在其中一个实施例中,上述第二训练模块,用于若确定第二机器学习模型的模型指标不满足第二预设指标,则进行第二机器学习模型的第M+1轮训练。
在其中一个实施例中,模型指标包括输出结果的准确率,第一预设指标包括第一预设准确率;第二预设指标包括第二预设准确率。
在其中一个实施例中,该装置还包括:
梯度下降模块,用于在每一轮训练过程中,若根据预设损失函数确定机器学习模型的输出结果不符合预设收敛条件,则利用批量梯度算法确定下降梯度并继续训练,直到确定机器学习模型的输出结果符合预设收敛条件时,停止本轮训练。
在其中一个实施例中,上述样本集获取模块,具体用于获取第一医院的医学影像,并基于第一医院的医学影像生成第一训练样本集;获取第二医院的医学影像,并基于第二医院的医学影像生成第二训练样本集;其中,第一医院与第二医院为不同的医院。
在其中一个实施例中,第一机器学习模型和第二机器学习模型包括剂量预测模型、自动勾画模型、疗效评估模型、生存指标评估模型、癌症筛查模型和形变配准模型中的至少一种。
在其中一个实施例中,第一机器学习模型的模型参数和第二机器学习模型的模型参数通过网络传递;
或,第一机器学习模型的模型参数和第二机器学习模型的模型参数通过存储介质传递。
在其中一个实施例中,第一机器学习模型的训练和第二机器学习模型的训练分别在两个独立的网络进行。
在其中一个实施例中,第一机器学习模型的训练与第二机器学习模型的训练交替进行。
在其中一个实施例中,第一机器学习模型和第二机器学习模型的结构相同且应用相同。
在其中一个实施例中,第一机器学习模型和第二机器学习模型的应用不同。
在其中一个实施例中,训练第一机器学习模型和第二机器学习模型的过程中,仅传递模型参数。
在其中一个实施例中,该装置还包括:
组合处理模块,用于将第一机器学习模型与第二机器学习模型进行组合处理,得到目标机器学习模型。
一种机器学习模型的训练装置,该装置包括:
样本集获取模块,用于获取至少两个训练样本集;训练样本集中的训练样本包括医学扫描设备对扫描对象进行扫描得到的医学影像;
训练模块,用于基于各训练样本集进行多轮模型训练,得到各训练样本集对应的机器学习模型;
其中,至少两个机器学习模型中的每两个机器学习模型至少部分结构相同,且训练其中一个机器学习模型时,至少部分利用另一个机器学习模型的结构相同部分的模型参数。
在其中一个实施例中,上述训练模块,用于对于各机器学习模型,获取当前轮的模型参数,并基于机器学习模型对应的训练样本集和当前轮的模型参数进行模型训练,得到机器学习模型;其中,当前轮的模型参数包括初始模型参数或另一机器学习模型中结构相同部分的模型参数。
在其中一个实施例中,各机器学习模型的训练在独立的网络进行。
在其中一个实施例中,至少两个机器学习模型的结构相同且应用相同。
在其中一个实施例中,各机器学习模型的应用不同。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取第一训练样本集和第二训练样本集;第一训练样本集和第二训练样本集中的训练样本包括医学扫描设备对扫描对象进行扫描得到的医学影像;
基于第一训练样本集进行多轮模型训练,得到第一机器学习模型;
基于第二训练样本集进行多轮模型训练,得到第二机器学习模型;
其中,第一机器学习模型与第二机器学习模型至少部分结构相同,且训练第一机器学习模型时至少部分利用第二机器学习模型的模型参数,训练第二机器学习模型时至少部分利用第一机器学习模型的模型参数。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取第一训练样本集和第二训练样本集;第一训练样本集和第二训练样本集中的训练样本包括医学扫描设备对扫描对象进行扫描得到的医学影像;
基于第一训练样本集进行多轮模型训练,得到第一机器学习模型;
基于第二训练样本集进行多轮模型训练,得到第二机器学习模型;
其中,第一机器学习模型与第二机器学习模型至少部分结构相同,且训练第一机器学习模型时至少部分利用第二机器学习模型的模型参数,训练第二机器学习模型时至少部分利用第一机器学习模型的模型参数。
上述机器学习模型的训练方法、装置、计算机设备和存储介质,获取第一训练样本集 和第二训练样本集;基于第一训练样本集进行多轮模型训练,得到第一机器学习模型;基于第二训练样本集进行多轮模型训练,得到第二机器学习模型。由于第一机器学习模型和第二机器学习模型存在结构相同的部分,因此,结构相同的部分可以使用相同的模型参数。在训练第一机器学习模型时,至少部分利用第二机器学习模型的模型参数,在训练第二机器学习模型时,至少部分利用第一机器学习模型的模型参数。通过本公开实施例,训练第一机器学习模型没有利用第二训练样本集,训练第二机器学习模型也没有利用第一训练样本集,可以保证训练样本的数据安全;而训练第一机器学习模型利用第二机器学习模型的模型参数,训练第二机器学习模型利用第一机器学习模型的模型参数,可以提高模型训练速度以及机器学习模型的准确度。
图1为一个实施例中机器学习模型的训练方法的应用环境图;
图2为一个实施例中机器学习模型的训练方法的流程示意图;
图3a为一个实施例中第一机器学习模型的结构示意图;
图3b为一个实施例中第二机器学习模型的结构示意图;
图4为一个实施例中基于第一训练样本集进行多轮模型训练步骤的流程示意图之一;
图5为一个实施例中基于第一训练样本集进行多轮模型训练步骤的流程示意图之二;
图6为一个实施例中基于第二训练样本集进行多轮模型训练步骤的流程示意图之一;
图7为一个实施例中基于第二训练样本集进行多轮模型训练步骤的流程示意图之二;
图8为一个实施例中交替训练第一机器学习模型的训练与第二机器学习模型步骤的流程示意图;
图9为另一个实施例中机器学习模型的训练方法的流程示意图;
图10为一个实施例中机器学习模型的训练装置的结构框图;
图11为另一个实施例中机器学习模型的训练装置的结构框图;
图12为一个实施例中计算机设备的内部结构图。
具体实施例方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
首先,在具体介绍本公开实施例的技术方案之前,先对本公开实施例基于的技术背景或者技术演进脉络进行介绍。通常情况下,训练机器学习模型需要大量的训练样本。但是,由于医学影像涉及患者隐私和数据安全,医院之间并不能共享医学影像,因此会出现机器学习模型的训练样本较少,机器学习模型的准确度较差的问题。
本申请提供了机器学习模型的训练方案,包括:获取第一训练样本集和第二训练样本 集;基于第一训练样本集进行多轮模型训练,得到第一机器学习模型;基于第二训练样本集进行多轮模型训练,得到第二机器学习模型。其中,第一机器学习模型与第二机器学习模型至少部分结构相同,且训练第一机器学习模型时至少部分利用第二机器学习模型的模型参数,训练第二机器学习模型时至少部分利用第一机器学习模型的模型参数。这样,训练第一机器学习模型没有利用第二训练样本集,训练第二机器学习模型也没有利用第一训练样本集,可以保证训练样本的数据安全;而训练第一机器学习模型利用第二机器学习模型的模型参数,训练第二机器学习模型利用第一机器学习模型的模型参数,可以提高模型训练速度以及机器学习模型的准确度。可见,解决了现有技术中训练样本较少,机器学习模型的准确度较差的问题。
本申请提供的机器学习模型的训练方法,可以应用于如图1所示的应用环境中。该应用环境可以包括模型训练系统,模型训练系统包括多个模型训练端101,多个模型训练端101之间可以通过网络进行通信。其中,模型训练端101可以是与医学扫描设备102连接的终端。该终端可以但不限于是各种个人计算机、笔记本电脑机和平板电脑,上述医学扫描设备102可以为单模设备,也可以多模设备,例如可以但不限于是DR(Digital radiography,即数字化X线摄影)设备、CT(Computed Tomography,即电子计算机断层扫描)设备、CBCT(Cone Beam Computed Tomography,即锥形束电子计算机断层扫描)设备、PET(Positron Emission Computed Tomography,正电子发射型计算机断层扫描)设备、MRI(Magnetic Resonance Imaging,磁共振成像)设备、超声设备、PET-CT设备、PET-MR、RT(radiotherapy,即放射治疗)设备、CT-RT和MR-RT。模型训练端101也可以是PACS(Picture Archiving and Communication Systems,影像归档和通信系统)服务器。上述PACS服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种机器学习模型的训练方法,以该方法应用于图1中的模型训练系统为例进行说明,包括以下步骤:
步骤201,获取第一训练样本集和第二训练样本集。
其中,第一训练样本集和第二训练样本集中的训练样本包括医学扫描设备对扫描对象进行扫描得到的医学影像。该医学影像可以为二维图像,也可以为三维图像。例如CT图像、CBCT图像、PET图像、MR图像、超声图像等。训练样本集满足数据多样性、标签一致性,并且,数据结构是相同的。
在训练机器学习模型的过程中,模型训练系统可以利用同一个医院中的医学影像进行模型训练,也可以利用不同医院中的医学影像进行模型训练。
当模型训练系统利用同一个医院中的医学影像进行模型训练时,模型训练端根据多个医学影像生成第一训练样本集和第二训练样本集,其中,第一训练样本集和第二训练样本集用于不同的训练任务。
例如,模型训练端从同一CT设备获取到100张CT影像,将100张CT影像分为两个影像集合,得到第一训练样本集和第二训练样本集,其中第一训练样本集用于剂量预测模型的训练任务,第二训练样本集用于自动勾画模型的训练任务。
当模型训练系统利用不同医院中的医学影像进行模型训练时,模型训练系统中的第一模型训练端获取第一医院的医学影像,并基于第一医院的医学影像生成第一训练样本集;模型训练系统中的第二模型训练端获取第二医院的医学影像,并基于第二医院的医学影像生成第二训练样本集;其中,第一医院与第二医院为不同的医院。
例如,模型训练端A1从医院B1获取CT影像,并生成第一训练样本集;模型训练端A2从医院B2获取CT影像,并生成第二训练样本集。
本公开实施例对训练样本集的获取方式不做限定。
步骤202,基于第一训练样本集进行多轮模型训练,得到第一机器学习模型。
步骤203,基于第二训练样本集进行多轮模型训练,得到第二机器学习模型。
当模型训练系统利用同一个医院中的医学影像进行模型训练时,模型训练系统可以采用同一模型训练端进行第一机器学习模型和第二机器学习模型的训练,也可以采用不同的模型训练端进行第一机器学习模型和第二机器学习模型的训练。
当模型训练系统利用不同医院中的医学影像进行模型训练时,模型训练系统采用不同的模型训练端进行第一机器学习模型和第二机器学习模型的训练。
在其中一个实施例中,第一机器学习模型与第二机器学习模型至少部分结构相同,且训练第一机器学习模型时至少部分利用第二机器学习模型的模型参数,训练第二机器学习模型时至少部分利用第一机器学习模型的模型参数。
如图3a所示的第一机器学习模型和图3b所示的第二机器学习模型,第一机器学习模型和第二机器学习模型存在结构相同的部分,因此,结构相同的部分可以使用相同的模型参数。这样,在训练第一机器学习模型时,至少部分利用第二机器学习模型的模型参数,在训练第二机器学习模型时,至少部分利用第一机器学习模型的模型参数。
例如,模型训练系统的第一模型训练端进行一轮模型训练,得到第一机器学习模型的模型参数,然后,将第一机器学习模型的模型参数传递到模型训练系统的第二模型训练端。第二模型训练端利用第一机器学习模型的模型参数进行一轮第二机器学习模型的训练;训练结束后,将第二机器学习模型的模型参数传递到第一模型训练端。第一模型训练端利用第二机器学习模型的模型参数再进行一轮第一机器学习模型的训练;训练结束后,再将第一机器学习模型的模型参数传递到第二模型训练端。以此类推,直到第一机器学习模型和第二机器学习模型训练完毕。
其中,第一机器学习模型的模型参数和第二机器学习模型的模型参数通过网络传递;或,第一机器学习模型的模型参数和第二机器学习模型的模型参数通过存储介质传递。例如,第一模型训练端与第二模型训练端通过网络发送模型参数,或者,用户使用移动硬盘等存储介质拷贝模型参数,实现模型参数的传递。本公开实施例对此不做限定。
可以理解地,在上述模型训练过程中,训练第一机器学习模型没有利用第二训练样本集,训练第二机器学习模型也没有利用第一训练样本集,可以保证训练样本的数据安全;而训练第一机器学习模型利用第二机器学习模型的模型参数,训练第二机器学习模型利用第一机器学习模型的模型参数,可以提高模型训练速度以及机器学习模型的准确度。
在其中一个实施例中,第一机器学习模型和第二机器学习模型包括剂量预测模型、自动勾画模型、疗效评估模型、生存指标评估模型、癌症筛查模型和形变配准模型中的至少一种。
例如,第一机器学习模型为剂量预测模型,第二机器学习模型为自动勾画模型。或者,第一机器学习模型为疗效评估模型,第二机器学习模型为生存指标评估模型。本公开实施例对第一机器学习模型和第二机器学习模型的模型种类不做限定。
对于不同医院而言,训练样本有限,现有技术利用有限样本进行模型训练得到的应用模型的精度有限。而本实施例的训练方法通过重复利用有限样本对机器学习模型进行迭代训练得到的模型精度较高,其在应用的时候可以得到更好的技术效果。例如,相对现有技术中利用较少样本训练得到的自动勾画模型,采用本实施例的训练方法得到的自动勾画模型对感兴趣区域的勾画效果更好;再例如,相对现有技术中利用较少样本训练得到的剂量预测模型,采用本实施例的训练方法得到的剂量预测模型可以更准确地预测剂量。
上述机器学习模型的训练方法中,获取第一训练样本集和第二训练样本集;基于第一训练样本集进行多轮模型训练,得到第一机器学习模型;基于第二训练样本集进行多轮模型训练,得到第二机器学习模型。由于第一机器学习模型和第二机器学习模型存在结构相同的部分,因此,结构相同的部分可以使用相同的模型参数。在训练第一机器学习模型时,至少部分利用第二机器学习模型的模型参数,在训练第二机器学习模型时,至少部分利用第一机器学习模型的模型参数。通过本公开实施例,训练第一机器学习模型没有利用第二训练样本集,训练第二机器学习模型也没有利用第一训练样本集,可以保证训练样本的数据安全;而训练第一机器学习模型利用第二机器学习模型的模型参数,训练第二机器学习模型利用第一机器学习模型的模型参数,可以提高模型训练速度以及机器学习模型的准确度。
在一个实施例中,如图4所示,上述基于第一训练样本集进行多轮模型训练,得到第一机器学习模型的步骤,可以包括:
步骤301,基于第一初始模型参数和第一训练样本集进行第一轮模型训练,得到第一初始模型。
其中,第一初始模型参数可以是随机的模型参数,也可以是用户赋值的模型参数,本公开实施例对此不做限定。
模型训练端获取第一初始模型参数和第一训练样本集后,进行第一机器学习模型的第一轮模型训练,得到第一初始模型。其中,第一初始模型的至少部分模型参数用于训练所 述第二机器学习模型。
步骤302,基于第一训练样本集和当前的第二机器学习模型的至少部分模型参数进行第N轮模型训练,得到第一机器学习模型,N为大于1的正整数。
第一机器学习模型和第二机器学习模型可以交替训练,模型训练端得到第一初始模型后,利用第一初始模型的模型参数进行第二机器学习模型的第一轮训练。
接着,模型训练端进行第一机器学习模型的第N轮训练。在第一机器学习模型与第二机器学习模型部分结构相同的情况下,基于第一训练样本集和当前的第二机器学习模型的至少部分模型参数进行第N轮模型训练,得到第一机器学习模型的过程,可以包括:基于第一训练样本集、当前的第二机器学习模型的结构相同部分的模型参数以及前一轮训练得到的第一机器学习模型的部分模型参数进行第N轮模型训练,得到第一机器学习模型。
以N等于2为例,模型训练端基于第一训练样本集合、第一初始模型的部分模型参数和第一轮训练第二机器学习模型得到的结构相同部分的模型参数,进行第一机器学习模型的第二轮模型训练,得到第一机器学习模型,并执行步骤303或步骤304。以N等于3为例,模型训练端基于第一训练样本集合、第二轮训练出的第一机器学习模型和第二轮训练第二机器学习模型得到的结构相同部分的模型参数,进行第一机器学习模型的第三轮模型训练,得到第一机器学习模型,并执行步骤303或步骤304。
在第一机器学习模型与第二机器学习模型全部结构相同的情况下,基于第一训练样本集和当前的第二机器学习模型的至少部分模型参数进行第N轮模型训练,得到第一机器学习模型的过程,可以包括:基于第一训练样本集、当前的第二机器学习模型的全部模型参数进行第N轮模型训练,得到第一机器学习模型。
步骤303,若确定第一机器学习模型的模型指标满足第一预设指标,则结束第一机器学习模型的训练。
每轮训练结束后,计算第一机器学习模型的模型指标,并确定该模型指标是否满足第一预设指标;如果满足第一预设指标,则结束第一机器学习模型的训练。
在其中一个实施例,模型指标包括输出结果的准确率,第一预设指标包括第一预设准确率。
模型训练端计算第一机器学习模型输出结果的准确率,并将第一机器学习模型输出结果的准确率与第一预设准确率进行比较。如果第一机器学习模型输出结果的准确率大于第一预设准确率,则确定第一机器学习模型的模型指标满足第一预设指标;如果第一机器学习模型输出结果的准确率小于或等于第一预设准确率,则确定第一机器学习模型的模型指标不满足第一预设指标。
上述计算第一机器学习模型输出结果的准确率的过程,可以包括:将预设数量的测试样本输入到第一机器学习模型中,得到各测试样本对应的输出结果;统计与测试样本的标注一致的输出结果的数量,并计算该数量与预设数量之间的比值,得到输出结果的准确率。测试样本可以从第一训练样本集中选取,也可以采用与第一训练样本集相同的获取方式获 取,本公开实施例对此不做限定,并且,本公开实施例对预设数量也不做限定。
在其中一个实施例中,如图5所示,本公开实施例还可以包括如下步骤:
步骤304,若确定第一机器学习模型的模型指标不满足第一预设指标,则进行第一机器学习模型的第N+1轮训练。
每轮训练结束后,如果第一机器学习模型的模型指标不满足第一预设指标,则进行第一机器学习模型的下一轮训练。
以N等于2为例,如果第一机器学习模型的模型指标不满足第一预设指标,则获取第二轮训练第二机器学习模型得到的至少部分模型参数,然后基于第一训练样本集、第二轮训练出的第一机器学习模型和第二轮训练第二机器学习模型得到的至少部分模型参数,对第一机器学习模型进行第三轮训练,并执行步骤303或步骤304。
以N等于3为例,如果第一机器学习模型的模型指标不满足第一预设指标,则获取第三轮训练第二机器学习模型得到的至少部分模型参数,然后基于第一训练样本集、第三轮训练出的第一机器学习模型和第三轮训练第二机器学习模型得到的至少部分模型参数,对第一机器学习模型进行第四轮训练,并执行步骤303或步骤304。
在其中一个实施例中,在每一轮训练过程中,若根据预设损失函数确定机器学习模型的输出结果不符合预设收敛条件,则利用批量梯度算法确定下降梯度并继续训练,直到确定机器学习模型的输出结果符合预设收敛条件时,停止本轮训练。
例如,在第一轮训练过程中,如果根据预设损失函数确定第一机器学习模型的输出结果不符合预设收敛条件,则利用批量梯度下降法确定下降梯度并继续训练,直到确定第一机器学习模型的输出结果符合预设收敛条件时,停止第一轮训练。在第二轮训练过程中,同样利用预设损失函数和批量梯度下降法进行模型训练。本公开实施例对预设损失函数和预设收敛条件不做限定。
上述基于第一训练样本集进行多轮模型训练,得到第一机器学习模型的过程中,基于第一初始模型参数和第一训练样本集进行第一轮模型训练,得到第一初始模型;基于第一训练样本集和当前的第二机器学习模型的至少部分模型参数进行第N轮模型训练,得到第一机器学习模型;若确定第一机器学习模型的模型指标满足第一预设指标,则结束第一机器学习模型的训练;若确定第一机器学习模型的模型指标不满足第一预设指标,则进行第一机器学习模型的第N+1轮训练。通过本公开实施例,无需利用第二训练样本集,只需利用第二机器学习模型的至少部分模型参数即可训练出满足第一预设指标的第一机器学习模型,在这个过程中,可以保证训练样本的数据安全,也可以提高模型训练速度和模型准确度。
在一个实施例中,如图6所示,上述基于第二训练样本集进行多轮模型训练,得到第二机器学习模型的步骤,可以包括:
步骤401,基于第二训练样本集和当前的第一机器学习模型的至少部分模型参数进行 第M轮模型训练,得到第二机器学习模型;其中,M为大于0的正整数。
训练第一机器学习模型得到第一初始模型后,模型训练端基于第二训练样本集和第一初始模型的至少部分模型参数进行第二机器学习模型的第M轮训练。
在第一机器学习模型与第二机器学习模型部分结构相同的情况下,基于第二训练样本集和当前的第一机器学习模型的模型参数进行第M轮模型训练,得到第二机器学习模型的过程,可以包括:基于第二训练样本集、第一初始模型的结构相同部分的模型参数以及第二初始模型参数进行第一轮训练,得到第二初始模型;其中,第二初始模型的至少部分参数用于训练第一机器学习模型;接着,基于第二训练样本集、当前的第一机器学习模型的结构相同部分的模型参数以及前一轮训练得到的第二机器学习模型的部分模型参数继续进行模型训练,得到第二机器学习模型。
例如,第一轮训练完成后,模型训练端基于第二训练样本集合、第一轮训练得到的第二机器学习模型和第二轮训练第一机器学习模型得到的至少部分模型参数,进行第二机器学习模型的第二轮模型训练得到第二机器学习模型,然后执行步骤402或步骤403。
第二轮训练完成后,如果需要继续训练,则模型训练端基于第二训练样本集合、第二轮训练出的第二机器学习模型和第三轮训练第一机器学习模型得到的至少部分模型参数,进行第二机器学习模型的第三轮模型训练,得到第二机器学习模型,然后执行步骤402或步骤403。
在第一机器学习模型与第二机器学习模型全部结构相同的情况下,基于第二训练样本集和当前的第一机器学习模型的模型参数进行第M轮模型训练,得到第二机器学习模型的过程,可以包括:基于第二训练样本集、当前的第一机器学习模型的全部模型参数进行第M轮模型训练,得到第二机器学习模型。
步骤402,若第二机器学习模型的模型指标满足第二预设指标,则结束第二机器学习模型的训练。
每轮训练结束后,计算第二机器学习模型的模型指标,并确定该模型指标是否满足第二预设指标;如果满足第二预设指标,则结束第二机器学习模型的训练。
在其中一个实施例,模型指标包括输出结果的准确率,第二预设指标包括第二预设准确率。
在实际应用中,可以计算第二机器学习模型输出结果的准确率,并将第二机器学习模型输出结果的准确率与第二预设准确率进行比较,如果第二机器学习模型输出结果的准确率大于第二预设准确率,则确定第二机器学习模型的模型指标满足第二预设指标;如果第二机器学习模型输出结果的准确率小于或等于第二预设准确率,则确定第二机器学习模型的模型指标不满足第二预设指标。
上述计算第二机器学习模型输出结果的准确率的过程,可以包括:将预设数量的测试样本输入到第二机器学习模型中,得到各测试样本对应的输出结果;统计与测试样本的标注一致的输出结果的数量,并计算该数量与预设数量之间的比值,得到输出结果的准确率。 测试样本可以从第二训练样本集中选取,也可以采用与第二训练样本集相同的获取方式获取,本公开实施例对此不做限定,并且,本公开实施例对预设数量也不做限定。
上述第一预设指标和第二预设指标可以为相同的预设指标,也可以为不同的预设指标,本公开实施例对此不做限定。
在其中一个实施例中,如图7所示,本公开实施例还可以包括如下步骤:
步骤403,若确定第二机器学习模型的模型指标不满足第二预设指标,则进行第二机器学习模型的第M+1轮训练。
每轮训练结束后,如果第二机器学习模型的模型指标不满足第二预设指标,则进行第二机器学习模型的下一轮训练。
例如,第二轮训练结束后,如果第二机器学习模型的模型指标不满足第二预设指标,则获取第三轮训练第一机器学习模型得到的模型参数,然后基于第二训练样本集、第二轮训练出的第二机器学习模型和第三轮训练第一机器学习模型得到的模型参数,对第二机器学习模型进行第三轮训练。
第三轮训练结束后,如果第二机器学习模型的模型指标不满足第二预设指标,则获取第四轮训练第一机器学习模型得到的模型参数,然后基于第二训练样本集、第三轮训练出的第二机器学习模型和第四轮训练第一机器学习模型得到的模型参数,对第二机器学习模型进行第四轮训练。以此类推,直到第二机器学习模型的模型指标满足第二预设指标为止。
在其中一个实施例中,在每一轮训练过程中,若根据预设损失函数确定机器学习模型的输出结果不符合预设收敛条件,则利用批量梯度算法确定下降梯度并继续训练,直到确定机器学习模型输出结果符合预设收敛条件时,停止本轮训练。
例如,在第一轮训练过程中,如果根据预设损失函数确定第二机器学习模型的输出结果不符合预设收敛条件,则利用批量梯度下降法确定下降梯度并继续训练,直到确定第二机器学习模型的输出结果符合预设收敛条件时,停止第一轮训练。在第二轮训练过程中,同样利用预设损失函数和批量梯度下降法进行模型训练。
上述基于第二训练样本集进行多轮模型训练,得到第二机器学习模型的过程中,基于第二训练样本集和当前的第一机器学习模型的至少部分模型参数进行第M轮模型训练,得到第二机器学习模型;若第二机器学习模型的模型指标满足第二预设指标,则结束第二机器学习模型的训练;若确定第二机器学习模型的模型指标不满足第二预设指标,则进行第二机器学习模型的第M+1轮训练。通过本公开实施例,无需利用第一训练样本集,只需利用第一机器学习模型的模型参数即可训练出满足第二预设指标的第二机器学习模型,在这个过程中,可以保证训练样本的数据安全,也可以提高模型训练速度和模型准确度。
在一个实施例中,第一机器学习模型的训练与第二机器学习模型的训练交替进行,以第一机器学习模型和第二机器学习模型部分结构相同为例进行说明。如图8所示,可以包括如下步骤:
步骤501,基于第一初始模型参数和第一训练样本集进行第一轮模型训练,得到第一初始模型。
步骤502,基于第二训练样本集、第一初始模型的结构相同部分的模型参数以及第二初始模型参数进行第一轮训练,得到第二初始模型。
其中,结构相同包括模型层次相同、连接关系相同等。
步骤503,基于第一训练样本集、当前的第二机器学习模型的至少部分模型参数以及前一轮训练得到的第一机器学习模型的部分模型参数继续进行模型训练,得到第一机器学习模型。
步骤504,基于第二训练样本集、当前的第一机器学习模型的结构相同部分的模型参数以及前一轮训练得到的第二机器学习模型的部分模型参数继续进行模型训练,得到第二机器学习模型。
步骤505,若确定第一机器学习模型的模型指标满足第一预设指标,且第二机器学习模型的模型指标满足第二预设指标,则结束第一机器学习模型和第二机器学习模型的训练。
步骤506,若确定第一机器学习模型的模型指标不满足第一预设指标,和/或第二机器学习模型的模型指标不满足第二预设指标,则进行第一机器学习模型和第二机器学习模型的下一轮训练。
在其中一个实施例中,第一机器学习模型和第二机器学习模型的结构相同。在该情形下,在步骤503中,基于第一训练样本集和当前的第二机器学习模型的全部模型参数继续进行模型训练,得到第一机器学习模型;在步骤504中,基于第二训练样本集和当前的第一机器学习模型的全部模型参数继续进行模型训练,得到第二机器学习模型。
在其中一个实施例中,第一机器学习模型的训练和第二机器学习模型的训练分别在两个独立的网络进行。
例如,模型训练系统中的第一模型训练端与第二模型训练端处于两个独立的网络中,第一模型训练端与第二训练端并不能通过网络进行通信。在这种情况下,第一机器学习模型的模型参数和第二机器学习模型的模型参数可以通过存储介质传递。
在其中一个实施例中,训练第一机器学习模型和第二机器学习模型的过程中,仅传递模型参数。
在其中一个实施例中,第一机器学习模型和第二机器学习模型的结构相同且应用相同。
例如,第一机器学习模型是使用第一训练样本集训练出的剂量预测模型,第二机器学习模型是使用第二训练样本集训练出的剂量预测模型,第一机器学习模型和第二机器学习模型的结构相同,并且都应用于剂量预测。
在其中一个实施例中,第一机器学习模型和第二机器学习模型的应用不同。
例如,第一机器学习模型是剂量预测模型,第二机器学习模型是自动勾画模型,第一 机器学习模型和第二机器学习模型的结构可以部分相同也可以完全相同。
在其中一个实施例中,本公开实施例还可以包括:将第一机器学习模型与第二机器学习模型进行组合处理,得到目标机器学习模型。
模型训练端将第一机器学习模型与第二机器学习模型进行组合处理,得到组合后的目标机器学习模型。例如,将剂量预测模型与自动勾画模型进行组合,可以得到一个先进行剂量预测,再进行自动勾画的目标机器学习模型,使得模型功能更加强大。
上述模型训练过程中,第一机器学习模型和第二机器学习模型交替进行训练,并且,训练第一机器学习模型没有利用第二训练样本集,训练第二机器学习模型也没有利用第一训练样本集,可以保证训练样本的数据安全;而训练第一机器学习模型利用第二机器学习模型的模型参数,训练第二机器学习模型利用第一机器学习模型的模型参数,可以提高模型训练速度以及机器学习模型的准确度。
在一个实施例中,如图9所示,提供了一种机器学习模型的训练方法,以该方法应用于图1中的模型训练系统为例进行说明,包括以下步骤:
步骤601,获取至少两个训练样本集。
其中,训练样本集中的训练样本包括医学扫描设备对扫描对象进行扫描得到的医学影像。例如CT图像、CBCT图像、PET图像、MR图像、超声图像等。模型训练系统获取至少两个训练样本集,获取方式可以参照步骤201。
步骤602,基于各训练样本集进行多轮模型训练,得到各训练样本集对应的机器学习模型。
其中,至少两个机器学习模型中的每两个机器学习模型至少部分结构相同,且训练其中一个机器学习模型时,至少部分利用另一个机器学习模型的结构相同部分的模型参数。
对于各机器学习模型,获取当前轮的模型参数,并基于机器学习模型对应的训练样本集和当前轮的模型参数进行模型训练,得到机器学习模型;其中,当前轮的模型参数包括初始模型参数或另一机器学习模型中结构相同部分的模型参数。
例如,获取三个训练样本集训练三个机器学习模型,其中,第一机器学习模型和第二机器学习模型至少部分结构相同,第二机器学习模型和第三机器学习模型至少部分结构相同,第一机器学习模型和第三机器学习模型至少部分结构相同。在训练过程中,对于第一机器学习模型,获取第一轮的初始模型参数,然后基于第一训练样本集和初始模型参数进行第一轮模型训练。接着,对于第二机器学习模型,获取第一机器学习模型的至少部分模型参数,基于第二训练样本集和第一机器学习模型的至少部分模型参数进行第一轮模型训练。之后,对于第三机器学习模型,获取第二机器学习模型的至少部分模型参数,基于第三训练样本集和第二机器学习模型的至少部分模型参数进行第一轮模型训练。
第一轮结束后,对于第一机器学习模型,获取第三机器学习模型的至少部分模型参数,基于第一训练样本集和第三机器学习模型的至少部分模型参数进行第二轮模型训练。对于 第二机器学习模型,获取第一机器学习模型的至少部分模型参数,基于第二训练样本集和第一机器学习模型的至少部分模型参数进行第二轮模型训练。对于第三机器学习模型,获取第二机器学习模型的至少部分模型参数,基于第三训练样本集和第二机器学习模型的至少部分模型参数进行第二轮模型训练。以此类推,依次进行训练。
在训练过程中,至少两个机器学习模型之间按照预设顺序传递模型参数。例如,第一机器学习模型的至少部分模型参数传递给第二机器学习模型,第二机器学习模型的至少部分模型参数传递给第三机器学习模型,第三机器学习模型的至少部分模型参数传递给第一机器学习模型。在其它实施例中,模型参数的传递也可以为其它传递形式,本公开实施例对预设顺序不做限定。
在其中一个实施例中,各机器学习模型的训练在独立的网络进行。
例如,第一机器学习模型、第二机器学习模型和第三机器学习模型的训练在三个独立的网络进行,三个网络之间并不能通信。
在其中一个实施例中,至少两个机器学习模型的结构相同且应用相同。
例如,第一机器学习模型、第二机器学习模型和第三机器学习模型都是剂量预测模型,并且第一机器学习模型、第二机器学习模型和第三机器学习模型的结构相同。
在其中一个实施例中,各机器学习模型的应用不同。
例如,第一机器学习模型是剂量预测模型,第二机器学习模型是自动勾画模型,第三机器学习模型是疗效评估模型。其中,每两个机器学习模型的结构可以部分相同也可以完全相同。
上述机器学习模型的训练方法中,获取至少两个训练样本集;基于各训练样本集进行多轮模型训练,得到各训练样本集对应的机器学习模型。由于每两个机器学习模型至少部分结构相同,并且训练其中一个机器学习模型时,至少部分利用另一个机器学习模型的结构相同部分的模型参数。因此,可以保证训练样本的数据安全,而且可以提高模型训练速度以及机器学习模型的准确度。
应该理解的是,虽然图2至图9的流程图中的各个步骤按照箭头的指示依轮显示,但是这些步骤并不是必然按照箭头指示的顺序依轮执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2至图9中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依轮进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图10所示,提供了一种机器学习模型的训练装置,包括:
样本集获取模块701,用于获取第一训练样本集和第二训练样本集;第一训练样本集和第二训练样本集中的训练样本包括医学扫描设备对扫描对象进行扫描得到的医学影像;
第一训练模块702,用于基于第一训练样本集进行多轮模型训练,得到第一机器学习模型;
第二训练模块703,用于基于第二训练样本集进行多轮模型训练,得到第二机器学习模型;
其中,第一机器学习模型与第二机器学习模型至少部分结构相同,且训练第一机器学习模型时至少部分利用第二机器学习模型的模型参数,训练第二机器学习模型时至少部分利用第一机器学习模型的模型参数。
在其中一个实施例中,上述第一训练模块702,具体用于基于第一初始模型参数和第一训练样本集进行第一轮模型训练,得到第一初始模型;第一初始模型的至少部分模型参数用于训练所述第二机器学习模型;基于第一训练样本集和当前的第二机器学习模型的至少部分模型参数进行第N轮模型训练,得到第一机器学习模型;N为大于1的正整数;若确定第一机器学习模型的模型指标满足第一预设指标,则结束第一机器学习模型的训练。
在其中一个实施例中,第一机器学习模型与第二机器学习模型部分结构相同,上述第一训练模块702,具体用于基于第一训练样本集、当前的第二机器学习模型的结构相同部分的模型参数以及前一轮训练得到的第一机器学习模型的部分模型参数进行第N轮模型训练,得到第一机器学习模型。
在其中一个实施例中,第一机器学习模型与第二机器学习模型全部结构相同,上述第一训练模块702,具体用于基于第一训练样本集、当前的第二机器学习模型的全部模型参数进行第N轮模型训练,得到第一机器学习模型。
在其中一个实施例中,上述第一训练模块702,还用于若确定第一机器学习模型的模型指标不满足第一预设指标,则进行第一机器学习模型的第N+1轮训练。
在其中一个实施例中,上述第二训练模块703,具体用于基于第二训练样本集和当前的第一机器学习模型的至少部分模型参数进行第M轮模型训练,得到第二机器学习模型;其中,M为大于0的正整数;若第二机器学习模型的模型指标满足第二预设指标,则结束第二机器学习模型的训练。
在其中一个实施例中,第一机器学习模型与第二机器学习模型部分结构相同,上述第二训练模块703,具体用于基于第二训练样本集、第一初始模型的结构相同部分的模型参数以及第二初始模型参数进行第一轮训练,得到第二初始模型;第二初始模型的至少部分参数用于训练第一机器学习模型;基于第二训练样本集、当前的第一机器学习模型的结构相同部分的模型参数以及前一轮训练得到的第二机器学习模型的部分模型参数继续进行模型训练,得到第二机器学习模型。
在其中一个实施例中,第一机器学习模型与第二机器学习模型全部结构相同,上述第二训练模块703,具体用于基于第二训练样本集、当前的第一机器学习模型的全部模型参数进行第M轮模型训练,得到第二机器学习模型。
在其中一个实施例中,上述第二训练模块703,用于若确定第二机器学习模型的模型 指标不满足第二预设指标,则进行第二机器学习模型的第M+1轮训练。
在其中一个实施例中,模型指标包括输出结果的准确率,第一预设指标包括第一预设准确率;第二预设指标包括第二预设准确率。
在其中一个实施例中,该装置还包括:
梯度下降模块,用于在每一轮训练过程中,若根据预设损失函数确定机器学习模型的输出结果不符合预设收敛条件,则利用批量梯度算法确定下降梯度并继续训练,直到确定机器学习模型的输出结果符合预设收敛条件时,停止本轮训练。
在其中一个实施例中,上述样本集获取模块701,具体用于获取第一医院的医学影像,并基于第一医院的医学影像生成第一训练样本集;获取第二医院的医学影像,并基于第二医院的医学影像生成第二训练样本集;其中,第一医院与第二医院为不同的医院。
在其中一个实施例中,第一机器学习模型和第二机器学习模型包括剂量预测模型、自动勾画模型、疗效评估模型、生存指标评估模型、癌症筛查模型和形变配准模型中的至少一种。
在其中一个实施例中,第一机器学习模型的模型参数和第二机器学习模型的模型参数通过网络传递;
或,第一机器学习模型的模型参数和第二机器学习模型的模型参数通过存储介质传递。
在其中一个实施例中,第一机器学习模型的训练和第二机器学习模型的训练分别在两个独立的网络进行。
在其中一个实施例中,第一机器学习模型的训练与第二机器学习模型的训练交替进行。
在其中一个实施例中,第一机器学习模型和第二机器学习模型的结构相同且应用相同。
在其中一个实施例中,第一机器学习模型和第二机器学习模型的应用不同。
在其中一个实施例中,训练第一机器学习模型和第二机器学习模型的过程中,仅传递模型参数。
在一个实施例中,如图11所示,提供了一种机器学习模型的训练装置,该装置包括:
样本集获取模块801,用于获取至少两个训练样本集;训练样本集中的训练样本包括医学扫描设备对扫描对象进行扫描得到的医学影像;
训练模块802,用于基于各训练样本集进行多轮模型训练,得到各训练样本集对应的机器学习模型;
其中,至少两个机器学习模型中的每两个机器学习模型至少部分结构相同,且训练其中一个机器学习模型时,至少部分利用另一个机器学习模型的结构相同部分的模型参数。
在其中一个实施例中,上述训练模块802,用于对于各机器学习模型,获取当前轮的 模型参数,并基于机器学习模型对应的训练样本集和当前轮的模型参数进行模型训练,得到机器学习模型;其中,当前轮的模型参数包括初始模型参数或另一机器学习模型中结构相同部分的模型参数。
在其中一个实施例中,各机器学习模型的训练在独立的网络进行。
在其中一个实施例中,至少两个机器学习模型的结构相同且应用相同。
在其中一个实施例中,各机器学习模型的应用不同。
关于机器学习模型的训练装置的具体限定可以参见上文中对于机器学习模型的训练方法的限定,在此不再赘述。上述机器学习模型的训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图12所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种机器学习模型的训练方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取第一训练样本集和第二训练样本集;第一训练样本集和第二训练样本集中的训练样本包括医学扫描设备对扫描对象进行扫描得到的医学影像;
基于第一训练样本集进行多轮模型训练,得到第一机器学习模型;
基于第二训练样本集进行多轮模型训练,得到第二机器学习模型;
其中,第一机器学习模型与第二机器学习模型至少部分结构相同,且训练第一机器学习模型时至少部分利用第二机器学习模型的模型参数,训练第二机器学习模型时至少部分利用第一机器学习模型的模型参数。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
基于第一初始模型参数和第一训练样本集进行第一轮模型训练,得到第一初始模型;第一初始模型的至少部分模型参数用于训练第二机器学习模型;
基于第一训练样本集和当前的第二机器学习模型的至少部分模型参数进行第N轮模型训练,得到第一机器学习模型;N为大于1的正整数;
若确定第一机器学习模型的模型指标满足第一预设指标,则结束第一机器学习模型的训练。
在一个实施例中,第一机器学习模型与第二机器学习模型部分结构相同,处理器执行计算机程序时还实现以下步骤:
基于第一训练样本集、当前的第二机器学习模型的结构相同部分的模型参数以及前一轮训练得到的第一机器学习模型的部分模型参数进行第N轮模型训练,得到第一机器学习模型。
在一个实施例中,第一机器学习模型与第二机器学习模型全部结构相同,处理器执行计算机程序时还实现以下步骤:
基于第一训练样本集、当前的第二机器学习模型的全部模型参数进行第N轮模型训练,得到第一机器学习模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
若确定第一机器学习模型的模型指标不满足第一预设指标,则进行第一机器学习模型的第N+1轮训练。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
基于第二训练样本集和当前的第一机器学习模型的至少部分模型参数进行第M轮模型训练,得到第二机器学习模型;其中,M为大于0的正整数;
若第二机器学习模型的模型指标满足第二预设指标,则结束第二机器学习模型的训练。
在一个实施例中,第一机器学习模型与第二机器学习模型部分结构相同,处理器执行计算机程序时还实现以下步骤:
基于第二训练样本集、第一初始模型的结构相同部分的模型参数以及第二初始模型参数进行第一轮训练,得到第二初始模型;第二初始模型的至少部分参数用于训练第一机器学习模型;
基于第二训练样本集、当前的第一机器学习模型的结构相同部分的模型参数以及前一轮训练得到的第二机器学习模型的部分模型参数继续进行模型训练,得到第二机器学习模型。
在一个实施例中,第一机器学习模型与第二机器学习模型全部结构相同,处理器执行计算机程序时还实现以下步骤:
基于第二训练样本集、当前的第一机器学习模型的全部模型参数进行第M轮模型训 练,得到第二机器学习模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
若确定第二机器学习模型的模型指标不满足第二预设指标,则进行第二机器学习模型的第M+1轮训练。
在一个实施例中,模型指标包括输出结果的准确率,第一预设指标包括第一预设准确率;第二预设指标包括第二预设准确率。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
在每一轮训练过程中,若根据预设损失函数确定机器学习模型的输出结果不符合预设收敛条件,则利用批量梯度算法确定下降梯度并继续训练,直到确定机器学习模型的输出结果符合预设收敛条件时,停止本轮训练。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取第一医院的医学影像,并基于第一医院的医学影像生成第一训练样本集;
获取第二医院的医学影像,并基于第二医院的医学影像生成第二训练样本集;
其中,第一医院与第二医院为不同的医院。
在一个实施例中,第一机器学习模型和第二机器学习模型包括剂量预测模型、自动勾画模型、疗效评估模型、生存指标评估模型、癌症筛查模型和形变配准模型中的至少一种。
在一个实施例中,第一机器学习模型的模型参数和第二机器学习模型的模型参数通过网络传递;
或,第一机器学习模型的模型参数和第二机器学习模型的模型参数通过存储介质传递。
在一个实施例中,第一机器学习模型的训练和第二机器学习模型的训练分别在两个独立的网络进行。
在一个实施例中,第一机器学习模型的训练与第二机器学习模型的训练交替进行。
在一个实施例中,第一机器学习模型和第二机器学习模型的结构相同且应用相同。
在一个实施例中,第一机器学习模型和第二机器学习模型的应用不同。
在一个实施例中,训练第一机器学习模型和第二机器学习模型的过程中,仅传递模型参数。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将第一机器学习模型与第二机器学习模型进行组合处理,得到目标机器学习模型。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取第一训练样本集和第二训练样本集;第一训练样本集和第二训练样本集中的训练样本包括医学扫描设备对扫描对象进行扫描得到的医学影像;
基于第一训练样本集进行多轮模型训练,得到第一机器学习模型;
基于第二训练样本集进行多轮模型训练,得到第二机器学习模型;
其中,第一机器学习模型与第二机器学习模型至少部分结构相同,且训练第一机器学习模型时至少部分利用第二机器学习模型的模型参数,训练第二机器学习模型时至少部分利用第一机器学习模型的模型参数。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
基于第一初始模型参数和第一训练样本集进行第一轮模型训练,得到第一初始模型;第一初始模型的至少部分模型参数用于训练第二机器学习模型;
基于第一训练样本集和当前的第二机器学习模型的至少部分模型参数进行第N轮模型训练,得到第一机器学习模型;N为大于1的正整数;
若确定第一机器学习模型的模型指标满足第一预设指标,则结束第一机器学习模型的训练。
在一个实施例中,第一机器学习模型与第二机器学习模型部分结构相同,计算机程序被处理器执行时还实现以下步骤:
基于第一训练样本集、当前的第二机器学习模型的结构相同部分的模型参数以及前一轮训练得到的第一机器学习模型的部分模型参数进行第N轮模型训练,得到第一机器学习模型。
在一个实施例中,第一机器学习模型与第二机器学习模型全部结构相同,计算机程序被处理器执行时还实现以下步骤:
基于第一训练样本集、当前的第二机器学习模型的全部模型参数进行第N轮模型训练,得到第一机器学习模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若确定第一机器学习模型的模型指标不满足第一预设指标,则进行第一机器学习模型的第N+1轮训练。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
基于第二训练样本集和当前的第一机器学习模型的至少部分模型参数进行第M轮模型训练,得到第二机器学习模型;其中,M为大于0的正整数;
若第二机器学习模型的模型指标满足第二预设指标,则结束第二机器学习模型的训练。
在一个实施例中,第一机器学习模型与第二机器学习模型部分结构相同,计算机程序被处理器执行时还实现以下步骤:
基于第二训练样本集、第一初始模型的结构相同部分的模型参数以及第二初始模型参数进行第一轮训练,得到第二初始模型;第二初始模型的至少部分参数用于训练第一机器学习模型;
基于第二训练样本集、当前的第一机器学习模型的结构相同部分的模型参数以及前一轮训练得到的第二机器学习模型的部分模型参数继续进行模型训练,得到第二机器学习模 型。
在一个实施例中,第一机器学习模型与第二机器学习模型全部结构相同,计算机程序被处理器执行时还实现以下步骤:
基于第二训练样本集、当前的第一机器学习模型的全部模型参数进行第M轮模型训练,得到第二机器学习模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若确定第二机器学习模型的模型指标不满足第二预设指标,则进行第二机器学习模型的第M+1轮训练。
在一个实施例中,模型指标包括输出结果的准确率,第一预设指标包括第一预设准确率;第二预设指标包括第二预设准确率。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
在每一轮训练过程中,若根据预设损失函数确定机器学习模型的输出结果不符合预设收敛条件,则利用批量梯度算法确定下降梯度并继续训练,直到确定机器学习模型的输出结果符合预设收敛条件时,停止本轮训练。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取第一医院的医学影像,并基于第一医院的医学影像生成第一训练样本集;
获取第二医院的医学影像,并基于第二医院的医学影像生成第二训练样本集;
其中,第一医院与第二医院为不同的医院。
在一个实施例中,第一机器学习模型和第二机器学习模型包括剂量预测模型、自动勾画模型、疗效评估模型、生存指标评估模型、癌症筛查模型和形变配准模型中的至少一种。
在一个实施例中,第一机器学习模型的模型参数和第二机器学习模型的模型参数通过网络传递;
或,第一机器学习模型的模型参数和第二机器学习模型的模型参数通过存储介质传递。
在一个实施例中,第一机器学习模型的训练和第二机器学习模型的训练分别在两个独立的网络进行。
在一个实施例中,第一机器学习模型的训练与第二机器学习模型的训练交替进行。
在一个实施例中,第一机器学习模型和第二机器学习模型的结构相同且应用相同。
在一个实施例中,第一机器学习模型和第二机器学习模型的应用不同。
在一个实施例中,训练第一机器学习模型和第二机器学习模型的过程中,仅传递模型参数。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将第一机器学习模型与第二机器学习模型进行组合处理,得到目标机器学习模型。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过 计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (29)
- 一种机器学习模型的训练方法,其特征在于,所述方法包括:获取第一训练样本集和第二训练样本集;所述第一训练样本集和所述第二训练样本集中的训练样本包括医学扫描设备对扫描对象进行扫描得到的医学影像;基于所述第一训练样本集进行多轮模型训练,得到第一机器学习模型;基于所述第二训练样本集进行多轮模型训练,得到第二机器学习模型;其中,所述第一机器学习模型与所述第二机器学习模型至少部分结构相同,且训练所述第一机器学习模型时至少部分利用所述第二机器学习模型的模型参数,训练所述第二机器学习模型时至少部分利用所述第一机器学习模型的模型参数。
- 根据权利要求1所述的方法,其特征在于,所述基于所述第一训练样本集进行多轮模型训练,得到第一机器学习模型,包括:基于第一初始模型参数和所述第一训练样本集进行第一轮模型训练,得到第一初始模型,所述第一初始模型的至少部分模型参数用于训练所述第二机器学习模型;基于所述第一训练样本集和当前的第二机器学习模型的至少部分模型参数进行第N轮模型训练,得到所述第一机器学习模型;N为大于1的正整数;若确定所述第一机器学习模型的模型指标满足第一预设指标,则结束所述第一机器学习模型的训练。
- 根据权利要求2所述的方法,其特征在于,所述第一机器学习模型与所述第二机器学习模型部分结构相同,所述基于所述第一训练样本集和当前的第二机器学习模型的至少部分模型参数进行第N轮模型训练,得到所述第一机器学习模型,包括:基于所述第一训练样本集、当前的第二机器学习模型的结构相同部分的模型参数以及前一轮训练得到的第一机器学习模型的部分模型参数进行第N轮模型训练,得到所述第一机器学习模型。
- 根据权利要求2所述的方法,其特征在于,所述第一机器学习模型与所述第二机器学习模型全部结构相同,所述基于所述第一训练样本集和当前的第二机器学习模型的至少部分模型参数进行第N轮模型训练,得到所述第一机器学习模型,包括:基于所述第一训练样本集、当前的第二机器学习模型的全部模型参数进行第N轮模型训练,得到所述第一机器学习模型。
- 根据权利要求2所述的方法,其特征在于,所述方法还包括:若确定所述第一机器学习模型的模型指标不满足所述第一预设指标,则进行所述第一机器学习模型的第N+1轮训练。
- 根据权利要求2所述的方法,其特征在于,所述基于所述第二训练样本集进行多轮模型训练,得到第二机器学习模型,包括:基于所述第二训练样本集和当前的第一机器学习模型的至少部分模型参数进行第M轮模型训练,得到所述第二机器学习模型;其中,M为大于0的正整数;若所述第二机器学习模型的模型指标满足第二预设指标,则结束所述第二机器学习模型的训练。
- 根据权利要求6所述的方法,其特征在于,所述第一机器学习模型与所述第二机器学习模型部分结构相同,所述基于所述第二训练样本集和当前的第一机器学习模型的至少部分模型参数进行第M轮模型训练,得到所述第二机器学习模型,包括:基于所述第二训练样本集、所述第一初始模型的结构相同部分的模型参数以及第二初始模型参数进行第一轮训练,得到第二初始模型;所述第二初始模型的至少部分参数用于训练所述第一机器学习模型;基于所述第二训练样本集、当前的第一机器学习模型的结构相同部分的模型参数以及前一轮训练得到的第二机器学习模型的部分模型参数继续进行模型训练,得到所述第二机器学习模型。
- 根据权利要求6所述的方法,其特征在于,所述第一机器学习模型与所述第二机器学习模型全部结构相同,所述基于所述第二训练样本集和当前的第一机器学习模型的至少部分模型参数进行第M轮模型训练,得到所述第二机器学习模型,包括:基于所述第二训练样本集、当前的第一机器学习模型的全部模型参数进行第M轮模型训练,得到所述第二机器学习模型。
- 根据权利要求6所述的方法,其特征在于,所述方法还包括:若确定所述第二机器学习模型的模型指标不满足所述第二预设指标,则进行所述第二机器学习模型的第M+1轮训练。
- 根据权利要求6所述的方法,其特征在于,所述模型指标包括输出结果的准确率,所述第一预设指标包括第一预设准确率;所述第二预设指标包括第二预设准确率。
- 根据权利要求6所述的方法,其特征在于,所述方法还包括:在每一轮训练过程中,若根据预设损失函数确定机器学习模型的输出结果不符合预设收敛条件,则利用批量梯度算法确定下降梯度并继续训练,直到确定所述机器学习模型的输出结果符合所述预设收敛条件时,停止本轮训练。
- 根据权利要求1所述的方法,其特征在于,所述获取第一训练样本集和第二训练样本集,包括:获取所述第一医院的医学影像,并基于所述第一医院的医学影像生成所述第一训练样本集;获取所述第二医院的医学影像,并基于所述第二医院的医学影像生成所述第二训练样本集;其中,所述第一医院与所述第二医院为不同的医院。
- 根据权利要求1所述的方法,其特征在于,所述第一机器学习模型和所述第二机器学习模型包括剂量预测模型、自动勾画模型、疗效评估模型、生存指标评估模型、癌症筛查模型和形变配准模型中的至少一种。
- 根据权利要求1所述的方法,其特征在于,所述第一机器学习模型的模型参数和所述第二机器学习模型的模型参数通过网络传递;或,所述第一机器学习模型的模型参数和所述第二机器学习模型的模型参数通过存储介质传递。
- 根据权利要求1所述的方法,其特征在于,所述第一机器学习模型的训练和第二机器学习模型的训练分别在两个独立的网络进行。
- 根据权利要求1所述的方法,其特征在于,所述第一机器学习模型的训练与所述第二机器学习模型的训练交替进行。
- 根据权利要求1所述的方法,其特征在于,所述第一机器学习模型和第二机器学习模型的结构相同且应用相同。
- 根据权利要求1所述的方法,其特征在于,所述第一机器学习模型和第二机器学习模型的应用不同。
- 根据权利要求1所述的方法,其特征在于,训练所述第一机器学习模型和所述第二机器学习模型的过程中,仅传递模型参数。
- 根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述第一机器学习模型与所述第二机器学习模型进行组合处理,得到目标机器学习模型。
- 一种机器学习模型的训练方法,其特征在于,所述方法包括:获取至少两个训练样本集;所述训练样本集中的训练样本包括医学扫描设备对扫描对象进行扫描得到的医学影像;基于各所述训练样本集进行多轮模型训练,得到各所述训练样本集对应的机器学习模型;其中,至少两个所述机器学习模型中的每两个机器学习模型至少部分结构相同,且训练其中一个机器学习模型时,至少部分利用另一个机器学习模型的结构相同部分的模型参数。
- 根据权利要求21所述的方法,其特征在于,所述基于各所述训练样本集进行多轮模型训练,得到各所述训练样本集对应的机器学习模型,包括:对于各所述机器学习模型,获取当前轮的模型参数,并基于所述机器学习模型对应的训练样本集和所述当前轮的模型参数进行模型训练,得到所述机器学习模型;其中,所述当前轮的模型参数包括初始模型参数或另一机器学习模型中结构相同部分的模型参数。
- 根据权利要求21所述的方法,其特征在于,各所述机器学习模型的训练在独立的网络进行。
- 根据权利要求21所述的方法,其特征在于,至少两个所述机器学习模型的结构相同且应用相同。
- 根据权利要求21所述的方法,其特征在于,各所述机器学习模型的应用不同。
- 一种机器学习模型的训练装置,其特征在于,所述装置包括:样本集获取模块,用于获取第一训练样本集和第二训练样本集;所述第一训练样本集和所述第二训练样本集中的训练样本包括医学扫描设备对扫描对象进行扫描得到的医学影像;第一训练模块,用于基于所述第一训练样本集进行多轮模型训练,得到第一机器学习模型;第二训练模块,用于基于所述第二训练样本集进行多轮模型训练,得到第二机器学习模型;其中,所述第一机器学习模型与所述第二机器学习模型至少部分结构相同;且训练所述第一机器学习模型时至少部分利用所述第二机器学习模型的模型参数,训练所述第二机器学习模型时至少部分利用所述第一机器学习模型的模型参数。
- 一种机器学习模型的训练装置,其特征在于,所述装置包括:样本集获取模块,用于获取至少两个训练样本集;所述训练样本集中的训练样本包括医学扫描设备对扫描对象进行扫描得到的医学影像;训练模块,用于基于各所述训练样本集进行多轮模型训练,得到各所述训练样本集对应的机器学习模型;其中,至少两个所述机器学习模型中的每两个机器学习模型至少部分结构相同,且训练其中一个机器学习模型时,至少部分利用另一个机器学习模型的结构相同部分的模型参数。
- 一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至25中任一项所述的方法的步骤。
- 一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至25中任一项所述的方法的步骤。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2021/105777 WO2023283765A1 (zh) | 2021-07-12 | 2021-07-12 | 机器学习模型的训练方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117355850A true CN117355850A (zh) | 2024-01-05 |
Family
ID=84919822
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180098440.3A Pending CN117355850A (zh) | 2021-07-12 | 2021-07-12 | 机器学习模型的训练方法、装置、计算机设备和存储介质 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP4343708A4 (zh) |
CN (1) | CN117355850A (zh) |
WO (1) | WO2023283765A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118245810B (zh) * | 2024-05-28 | 2024-08-02 | 北京壹永科技有限公司 | 训练大语言模型的方法、装置、电子设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10902598B2 (en) * | 2017-01-27 | 2021-01-26 | Arterys Inc. | Automated segmentation utilizing fully convolutional networks |
CN110400251A (zh) * | 2019-06-13 | 2019-11-01 | 深圳追一科技有限公司 | 视频处理方法、装置、终端设备及存储介质 |
CN110348436A (zh) * | 2019-06-19 | 2019-10-18 | 平安普惠企业管理有限公司 | 对图像中的文本信息进行识别的方法及相关设备 |
CN112861892B (zh) * | 2019-11-27 | 2023-09-01 | 杭州海康威视数字技术股份有限公司 | 图片中目标的属性的确定方法和装置 |
CN112257738A (zh) * | 2020-07-31 | 2021-01-22 | 北京京东尚科信息技术有限公司 | 机器学习模型的训练方法、装置和图像的分类方法、装置 |
-
2021
- 2021-07-12 EP EP21949563.7A patent/EP4343708A4/en active Pending
- 2021-07-12 CN CN202180098440.3A patent/CN117355850A/zh active Pending
- 2021-07-12 WO PCT/CN2021/105777 patent/WO2023283765A1/zh active Application Filing
Also Published As
Publication number | Publication date |
---|---|
EP4343708A4 (en) | 2024-08-07 |
WO2023283765A1 (zh) | 2023-01-19 |
EP4343708A1 (en) | 2024-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109754447B (zh) | 图像生成方法、装置、设备和存储介质 | |
US9471748B2 (en) | Method for sharing medical image data based on cloud platform, cloud platform and system | |
CN108742679B (zh) | 结节检测装置和方法 | |
CN112150376B (zh) | 血管医学影像分析方法、装置、计算机设备和存储介质 | |
CN114298234B (zh) | 脑部医学影像分类方法、装置、计算机设备和存储介质 | |
CN113780519A (zh) | 生成对抗网络训练方法、装置、计算机设备和存储介质 | |
CN112102235A (zh) | 人体部位识别方法、计算机设备和存储介质 | |
EP3044756B1 (en) | Method and apparatus for generating image alignment data | |
CN113192031B (zh) | 血管分析方法、装置、计算机设备和存储介质 | |
CN117355850A (zh) | 机器学习模型的训练方法、装置、计算机设备和存储介质 | |
CN108511052B (zh) | 用于确定投影数据组的方法以及投影确定系统 | |
CN114723723A (zh) | 医学影像处理方法、计算机设备和存储介质 | |
KR102456338B1 (ko) | 아밀로이드 베타 축적 예측 장치 및 방법 | |
US11769583B2 (en) | Systems and methods for generating a result image | |
CN110264435B (zh) | 低剂量mip图像的增强方法、装置、计算机设备和存储介质 | |
CN112669450A (zh) | 人体模型构建方法和个性化人体模型构建方法 | |
CN111651131B (zh) | 图像的显示方法、装置和计算机设备 | |
US20220406047A1 (en) | Probabilistic regularization of convolutional neurual networks for multiple-feature detection based on correlations | |
CN117238454B (zh) | 医疗图像的处理方法、装置和计算机设备 | |
CN107491631A (zh) | 用于控制向客户端设备传送双能量ct图像数据的控制对象 | |
KR20240018144A (ko) | 뇌질환 위험도를 예측하는 방법 및 뇌질환 위험도 분석 모델의 학습 방법 | |
CN118052751A (zh) | 医学数据校正方法、装置、计算机设备和存储介质 | |
CN117558395A (zh) | 医学影像扫描定位单生成方法、装置和计算机设备 | |
CN116936063A (zh) | 影像参数的配置方法、影像设备、服务器、介质和产品 | |
CN118315029A (zh) | 图像重建链路中的数据显示方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |