CN114783573A - 分布式医学影像诊断模型训练方法、装置、设备及介质 - Google Patents

分布式医学影像诊断模型训练方法、装置、设备及介质 Download PDF

Info

Publication number
CN114783573A
CN114783573A CN202210702568.2A CN202210702568A CN114783573A CN 114783573 A CN114783573 A CN 114783573A CN 202210702568 A CN202210702568 A CN 202210702568A CN 114783573 A CN114783573 A CN 114783573A
Authority
CN
China
Prior art keywords
medical image
diagnosis model
image diagnosis
target
omics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210702568.2A
Other languages
English (en)
Inventor
李泽远
王健宗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202210702568.2A priority Critical patent/CN114783573A/zh
Publication of CN114783573A publication Critical patent/CN114783573A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Radiology & Medical Imaging (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明涉及人工智能技术领域,尤其涉及一种分布式医学影像诊断模型训练方法、装置、设备及介质,本发明获取N个医学影像和对应的目标区域勾画数据,在第i个医学影像中确定Mi个目标区域;对每个医学影像目标区域提取医学影像组学特征,对每个医学影像组学特征进行特征筛选和特征降维,得到医学影像组学特征训练集;将医学影像组学特征训练集输入至初始医学影像诊断模型,对初始医学影像诊断模型进行训练,得到目标医学影像诊断模型;检测目标医学影像诊断模型的性能,当性能满足预设条件,则将目标医学影像诊断模型的参数发送至中心服务端,以更新目标医学影像诊断模型,本发明有效的提高了客户端诊断模型的训练效率。

Description

分布式医学影像诊断模型训练方法、装置、设备及介质
技术领域
本发明涉及人工智能技术领域,特别涉及一种分布式医学影像诊断模型训练方法、装置、设备及介质。
背景技术
联邦学习作为一种新的机器学习范式,它可以在保持数据隐私的同时产生无偏见的模型。在每一轮训练中,选择客户端(例如,企业、医院或移动设备)使用本地数据训练模型,并将本地模型更新发送到中央服务器进行聚合,而不传输任何本地原始数据。联邦学习无需上传本地数据,可以有效保护数据隐私;然而,训练深度学习模型往往需要大量的算力,对客户端硬件资源要求较高;在没有配置显卡(GPU)的设备上,只能依赖于中央处理器(CPU)进行运算,训练时间较长。
目前,在医学影像诊断领域,多中心医学影像联合建模中,对本地客户端训练主要采用医学影像训练集对诊断模型训练,该方法对客户端硬件资源要求较高,联邦机器学习速度较慢,诊断模型训练效率低。
发明内容
基于此,有必要针对上述技术问题,提供一种分布式医学影像诊断模型训练方法、装置、设备及介质,以解决现有技术采用医学影像训练集对诊断模型训练,联邦机器学习速度较慢,诊断模型训练效率低的问题。
第一方面,本发明实施例提供一种分布式医学影像诊断模型训练方法,所述分布式医学影像诊断模型训练方法包括:
获取N个医学影像和对应的医学影像目标区域勾画数据,N>1,根据所述医学影像和所述医学影像目标区域勾画数据,在第i个所述医学影像中确定Mi个目标区域,1<i≤N,Mi≥1;
对每个所述医学影像的Mi个目标区域提取医学影像组学特征,对每个所述医学影像组学特征进行特征筛选和特征降维,得到医学影像组学特征训练集;
将所述医学影像组学特征训练集输入至初始医学影像诊断模型,对所述初始医学影像诊断模型进行训练,得到目标医学影像诊断模型;
检测所述目标医学影像诊断模型的性能值,当所述性能值满足预设条件,则将所述目标医学影像诊断模型的参数发送至中心服务端,以更新所述目标医学影像诊断模型。
第二方面,本发明实施例提供一种分布式医学影像诊断模型训练装置,所述分布式医学影像诊断模型训练装置包括:
目标区域确定模块,用于获取N个医学影像和对应的医学影像目标区域勾画数据,N>1,根据所述医学影像和所述医学影像目标区域勾画数据,在第i个所述医学影像中确定Mi个目标区域,1<i≤N,Mi≥1;
训练集生成模块,用于对每个所述医学影像目标区域提取医学影像组学特征,对每个所述医学影像组学特征进行特征筛选和特征降维,得到医学影像组学特征训练集;
模型训练模块,用于将所述医学影像组学特征训练集输入至初始医学影像诊断模型,对所述初始医学影像诊断模型进行训练,得到目标医学影像诊断模型;
模型更新模块,用于检测所述目标医学影像诊断模型的性能,当所述性能满足预设条件,则将所述目标医学影像诊断模型的参数发送至中心服务端,以更新所述目标医学影像诊断模型。
第三方面,本发明实施例提供一种计算机设备,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的分布式医学影像诊断模型训练方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的分布式医学影像诊断模型训练方法。
本发明实施例与现有技术相比存在的有益效果是:本发明对用于诊断模型训练的训练集中的医学影像进行目标区域勾画,在目标区域内提取医学影像特征,再对医学影像特征进行特征筛选和特征降维,得到医学影像组学特征训练集,用该训练集对医学影像诊断模型进行训练,通过分析训练后的诊断模型的性能,决定是否替换原有的诊断模型;有效的降低了诊断模型训练对客户端硬件资源要求,加快了联邦学习的速度,提高了诊断模型的训练效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种分布式医学影像诊断模型训练方法的一应用环境示意图;
图2是本发明实施例一提供的一种分布式医学影像诊断模型训练方法的流程示意图;
图3是本发明实施例一提供的医学影像特征提取方法的流程示意图;
图4是本发明实施例一提供的一种医学影像特征筛选及特征降维方法的流程示意图;
图5是本发明实施例二提供的一种分布式医学影像诊断模型训练装置的结构示意图;
图6是本发明实施例三提供的一种计算机设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其他实施例中也可以实现本发明。在其他情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
应当理解,当在本发明说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本发明说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本发明说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本发明说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本发明的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
本发明实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
应理解,以下实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
为了说明本发明的技术方案,下面通过具体实施例来进行说明。
本发明实施例一提供的一种分布式医学影像诊断模型训练方法,可应用在如图1的应用环境中,该应用环境为分布式医学影像诊断模型训练系统,该系统中包括N个本地客户端和至少一个中心服务端,N为大于1的整数,其中,客户端与服务端进行通信。其中,客户端包括但不限于掌上电脑、桌上型计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、云端客户端、个人数字助理(personaldigital assistant,PDA)等客户端。服务端可以用独立的服务端或者是多个服务端组成的服务端集群来实现。
参见图2,是本发明实施例一提供的一种分布式医学影像诊断模型训练方法的流程示意图,上述分布式医学影像诊断模型训练方法可以应用于图1中的客户端,对应的客户端通过预设的应用程序接口(Application Programming Interface,API)连接服务端。每个本地客户端模型训练参数发送至中心服务端,中心服务端根据各个本地客户端发送的模型参数更新全局医学影像诊断模型,再把更新后的全局医学影像诊断模型参数发送给各个本地客户端,各个本地客户端根据接收到的全局模型参数更新本地模型。如图2所示,上述分布式医学影像诊断模型训练方法可以包括以下步骤:
步骤S201,获取N个医学影像和对应的目标区域勾画数据,N>1,根据医学影像和医学影像目标区域勾画数据,在第i个医学影像中确定Mi个目标区域,1<i≤N,Mi≥1。
本发明中,医院的医学影像中心会收集大量的医学影像,医生将收集到的N个医学影像中的每个医学影像根据自己兴趣在计算机设备的屏幕上进行感兴趣(Region ofInterest,ROI)区域勾画。比如,医生可以选择肿瘤、器官、腹膜等区域作为ROI区域,最终得到Mi个ROI区域。
医学影像诊断系统获取到医生上传的N个医学影像和每个医学影像对应Mi个ROI区域笔迹数据,提取N个医学影像中的其中一个医学影像的像素位置坐标;在该医学影像的Mi个ROI区域勾画数据中,提取Mi个ROI区域勾画笔迹的每个像素位置坐标,确定该医学影像的像素位置坐标与该医学影像对应Mi个的ROI区域勾画笔迹的像素位置坐标重合的像素位置坐标,将重合的像素位置坐标形成的封闭区域保留,将重合的像素位置坐标形成的封闭区域以外的像素删除,得到该医学影像的Mi个目标区域;对剩余的所有医学影像执行上述方法,可得到N个医学影像的所有ROI区域。
步骤S202,对每个医学影像的Mi个目标区域提取医学影像组学特征,对每个医学影像组学特征进行特征筛选和特征降维,得到医学影像组学特征训练集。
本发明中,通过上述步骤S201得到N个医学影像的所有ROI区域,需要对所有的ROI区域进行特征提取,对ROI区域进行特征提取可以包括以下步骤:
步骤S301,将医学影像目标区域进行灰度化处理,得到灰度化医学影像。
本发明中,对所有的ROI区域统一做灰度化处理,灰度化方法包括YUV亮度灰度化、最大值灰度化、平均值灰度化、Gamma校正灰度化,本发明中,可以选择其中一种对ROI区域进行灰度化处理。
例如,通过Gamma校正灰度化对ROI区域进行灰度化处理,可根据公式(1)对ROI区域进行灰度化处理。
Figure 424252DEST_PATH_IMAGE001
(1)
其中,Gray为矫正后的灰度值,R为RGB颜色中R的值,G为RGB颜色中G的值,B为RGB颜色中B的值;RGB颜色值不能简单直接相加,而是必须用2.2次方换算成物理光功率,因为RGB值与功率并非简单的线性关系,而是幂函数关系,这个函数的指数称为Gamma值;通过该Gamma校正灰度化算法可对ROI区域进行灰度化处理。
例如,通过YUV亮度灰度化算法对ROI区域进行灰度化处理,可根据公式(2)对ROI区域进行灰度化处理。
Figure 872551DEST_PATH_IMAGE002
(2)
根据YUV的颜色空间中,Y的分量的物理意义是点的亮度,由该值反映亮度等级,根据RGB和YUV颜色空间的变化关系可建立亮度Y与R、G、B三个颜色分量的对应,以这个亮度值表达图像的灰度值。
步骤S302,计算灰度化医学影像的像素灰度梯度,根据像素灰度梯度,构造灰度梯度序列。
本发明中,可以根据公式(3)和公式(4)对灰度化医学影像的像素灰度梯度构造灰度梯度序列。
Figure 308080DEST_PATH_IMAGE003
(3)
Figure 234448DEST_PATH_IMAGE004
(4)
其中,1≤m≤row-1,1≤n≤col-1,A是灰度化处理后的ROI区域,
Figure 189765DEST_PATH_IMAGE005
是灰度化处理后的ROI区域图像沿水平方向上的第m行的灰度梯度序列;
Figure 543386DEST_PATH_IMAGE006
是灰度化处理后的ROI区域图像沿竖直方向上的第n列的灰度梯度序列;row是灰度化处理后的ROI区域图像的行数,即灰度化处理后的ROI区域图像竖直方向上的像素个数;col是灰度化处理后的ROI区域图像的列数,即灰度化处理后的ROI区域图像水平方向上的像素个数;
Figure 75999DEST_PATH_IMAGE007
是灰度化处理后的ROI区域图像的灰度梯度,如公式(5)所示。
Figure 930691DEST_PATH_IMAGE008
(5)
其中,1≤i≤row-1,1≤j≤col-1。
步骤S303,计算灰度梯度序列中的相邻两个像素点之间的灰度差值,若灰度差值大于预设值,将相邻两个像素点中灰度值较大的像素点作为医学影像组学特征的边缘点,找到医学影像组学特征的所有边缘点;根据所述所有边缘点的包围区域确定医学影像组学特征。
本发明中,
Figure 865149DEST_PATH_IMAGE009
是灰度化处理后的ROI区域图像中沿水平方向上相邻像素点之间的灰度差,
Figure 265038DEST_PATH_IMAGE010
是灰度化处理后的ROI区域图像中沿竖直方向上相邻像素点之间的灰度差,
Figure 284946DEST_PATH_IMAGE009
Figure 553117DEST_PATH_IMAGE010
可根据公式(6)和公式(7)进行计算:
Figure 466715DEST_PATH_IMAGE011
(6)
Figure 162138DEST_PATH_IMAGE012
(7)
将上述计算得到的两个相邻像素点之间的灰度差值与系统预设的灰度差值阈值相比较,若两个相邻像素点之间的灰度差值大于系统预设的灰度差值阈值,则表示该两个像素点之间的灰度相差较大,为特征边缘像素,则将相邻两个像素点中灰度值较大的像素点作为医学影像组学特征的边缘点,根据所有的边缘点确定医学影像组学特征。
对医学影像进行特征提取,能够去除医学影像中与模型训练无关图像区域,只保留能够表征医学影像且对医学影像诊断模型训练有效的医学影像特征,可以有效减少客户端的计算量。
本发明中,提取到医学影像组学特征之后,还需要对提到的医学影像组学特征进行特征筛选和特征降维,以进一步降低特征维度;对于特征筛选和特征降维,可以包括以下步骤:
步骤401,计算每个医学影像组学特征与预设特征样本的特征方差值,得到每个医学影像组学特征对应的特征方差值,将特征方差值小于预设值的医学影像组学特征删除,得到筛选后剩余的医学影像组学特征。
本发明中,系统预设有特征样本,计算每个医学影像组学特征与特征样本的方差值,特征方差值较小,表示该特征与大多数特征样本的值比较相近;特征方差值较大,表示该特征与大多数特征样本的值有较大差异;将上述计算得到的方差值与预设的方差值比较,将所有小于方差值小于预设值的特征删除;若方差值为零则表示该特征为重复特征,则也将其删除,至此,得到筛选后剩余的医学影像组学特征。
步骤S402,将剩余的医学影像组学特征向量化处理,构成样本矩阵;对样本矩阵进行中心化处理,得到中心化样本矩阵。
其中,矩阵中心化是使用样本数据减去样本数据的均值,在本发明中,即每个特征向量减去特征向量均值,即是向量平移的过程,平移后的所有特征向量的中心是(0,0)。
步骤S403,计算中心化样本矩阵的协方差,根据中心化样本矩阵的协方差构建协方差矩阵,计算协方差矩阵的特征值和特征向量。
本发明中,计算中心化样本矩阵的协方差,计算协方差矩阵的特征值和特征向量为现有技术,在此不在赘述。
步骤S404,根据协方差矩阵的特征值的大小将协方差矩阵的特征向量从大到小排列,得到映射矩阵;根据预设的特征个数保留映射矩阵的前n行或者前n列对应的医学影像组学特征,得到医学影像组学特征训练集。
本发明中,对医学影像组学特征进行特征提取,特征筛选和特征降维之后,使得用于训练诊断模型的医学影像组学特征训练集数据大大减少,使数据更容易使用,大大降低模型训练的计算开销,降低对客户端硬件的要求,使得模型训练效率大大提高。
步骤S203,将医学影像组学特征训练集输入至初始医学影像诊断模型,对初始医学影像诊断模型进行训练,得到目标医学影像诊断模型。
本发明中,得到医学影像组学特征训练集之后,使用该医学影像组学特征训练集对初始医学影像诊断模型进行训练,训练过程包括以下步骤:
将上述医学影像组学特征训练集分成n份,n>1,输入至初始医学影像诊断模型,将第一份训练集输入初始医学影像诊断模型,使用预设的验证集对第一次训练的模型进行模型验证,根据医学影像诊断模型的收敛特征和准确性对医学影像诊断模型的参数进行调整。
将第二份训练集输入初始医学影像诊断模型,使用预设的验证集对第二次训练的模型进行模型验证,根据医学影像诊断模型的收敛特征和准确性对医学影像诊断模型的参数进行第二次调整。
将第n份训练集输入初始医学影像诊断模型,使用预设的验证集对第n次训练的模型进行模型验证,根据医学影像诊断模型的收敛特征和准确性对医学影像诊断模型的参数进行第n次调整,使诊断模型性能达到最优,从而得到目标医学影像诊断模型。
步骤S204,检测目标医学影像诊断模型的性能值,当性能值满足预设条件,则将目标医学影像诊断模型的参数发送至中心服务端,以更新目标医学影像诊断模型。
本发明中,医学影像诊断模型训练完成之后,需要对该医学影像诊断模型的性能进行检测,可以过以下方法对该医学影像诊断模型的性能进行检测:
将预设的验证集中的医学影像输入至目标医学影像诊断模型,计算目标医学影像诊断模型将验证集中所有的医学影像诊断完成所用的时间。
例如,预设的验证集中有100个医学影像,将100个医学影像输入至医学影像诊断模型,并开始计算时间,直至100个医学影像全部诊断完成,终止计时用时60秒,则该医学影像诊断模型诊断该验证集中的100个医学影像所用的时间为60秒。
根据目标医学影像诊断模型输出的诊断结果计算目标医学影像诊断模型的诊断的准确率。
例如,预设的验证集中100个医学影像输入至医学影像诊断模型之后,输出100个诊断结果,统计100个诊断结果中正确结果的数量为90,则可计算该医学影像诊断模型的诊断准确率为0.9。
根据上述医学影像诊断模型诊断验证集所用的时间和诊断准确率计算该医学影像诊断模型的性能值。
本发明中,若目标医学影像诊断模型的诊断准确率比初始医学影像诊断模型的诊断准确率高,且目标医学影像诊断模型的诊断时间比初始医学影像诊断模型的诊断时间短,则目标医学影像诊断模型的性能优于初始医学影像诊断模型的性能。
将目标医学影像诊断模型的参数发送至中心服务端,中心服务端根据接收到的各个客户端发送的医学影像诊断模型参数进行整合,整合方式为对应的参数加权求和后取平均值;客户端接收中心服务端发送的全局医学影像诊断模型参数,对本地客户端的医学影像诊断模型参数进行更新,得到更新后的医学影像诊断模型。
本发明中,更新目标医学影像诊断模型之后,将预设的验证集中的医学影像输入至更新后的医学影像诊断模型,根据诊断结果,判断更新后的医学影像诊断模型的性能是否优于目标医学影像诊断模型,若更新后的医学影像诊断模型的性能优于目标医学影像诊断模型,则用更新后的医学影像诊断模型替代目标医学影像诊断模型。
本发明对用于诊断模型训练的训练集中的医学影像进行目标区域勾画,通过灰度化处理在目标区域内提取医学影像特征,通过特征值和特征向量对医学影像特征进行特征筛选和特征降维,得到医学影像组学特征训练集,降低了训练集中的训练数据,用该训练集对医学影像诊断模型进行训练,通过分析训练后的诊断模型的性能,决定是否替换原有的诊断模型;本发明有效的降低了诊断模型训练对客户端硬件资源的要求,加快了联邦学习的速度,提高了诊断模型的训练效率。
对应于上文实施例的基于本地差分隐私的分布式医学影像诊断模型训练方法,图5示出了本发明实施例二提供的一种分布式医学影像诊断模型训练装置的结构框图,上述分布式医学影像诊断模型训练装置应用于分布式医学影像诊断模型训练系统的本地客户端,该分布式医学影像诊断模型训练系统包括N个本地客户端和至少一个中心服务端,N为大于1的整数,对应的客户端通过预设的应用程序接口(Application ProgrammingInterface,API)连接服务端。每个本地客户端模型训练参数发送至中心服务端,中心服务端根据各个本地客户端发送的模型参数更新全局模型参数,再把全局模型参数发送给各个本地客户端,各个本地客户端根据接收到的全局模型参数更新本地模型。为了便于说明,仅示出了与本发明实施例相关的部分。
参见图5,该分布式医学影像诊断模型训练装置包括:
目标区域确定模块51,用于获取N个医学影像和对应的目标区域勾画数据,N>1,根据医学影像和对应的医学影像目标区域勾画数据,在第i个医学影像中确定Mi个目标区域,1<i≤N,Mi≥1;
训练集生成模块52,用于对每个医学影像的Mi个目标区域提取医学影像组学特征,对每个医学影像组学特征进行特征筛选和特征降维,得到医学影像组学特征训练集;
模型训练模块53,用于将医学影像组学特征训练集输入至初始医学影像诊断模型,对初始医学影像诊断模型进行训练,得到目标医学影像诊断模型;
模型更新模块54,用于检测目标医学影像诊断模型的性能值,当性能值满足预设条件,则将目标医学影像诊断模型的参数发送至中心服务端,以更新目标医学影像诊断模型。
可选的是,上述训练集生成模块52包括:
灰度化处理单元,用于将医学影像目标区域进行灰度化处理,得到灰度化医学影像;
灰度梯度构建单元,用于计算灰度化医学影像的像素灰度梯度,根据像素灰度梯度,构造灰度梯度序列;
特征确定单元,用于计算灰度梯度序列中的相邻两个像素点之间的灰度差值,若灰度差值大于预设值,将相邻两个像素点中灰度值较大的像素点作为医学影像组学特征的边缘点,找到医学影像组学特征的所有边缘点;根据所述所有边缘点的包围区域确定医学影像组学特征。
可选的是,上述训练集生成模块52还包括:
特征筛选单元,用于计算每个医学影像组学特征与预设特征样本的特征方差值,得到每个医学影像组学特征对应的特征方差值,将特征方差值小于预设值的医学影像组学特征删除,得到筛选后剩余的医学影像组学特征。
可选的是,上述训练集生成模块52还包括:
中心化矩阵单元,用于将剩余的医学影像组学特征向量化处理,构成样本矩阵;对样本矩阵进行中心化处理,得到中心化样本矩阵;
特征向量计算单元,计算中心化样本矩阵的协方差,根据中心化样本矩阵的协方差构建协方差矩阵,计算协方差矩阵的特征值和特征向量;
训练集生成单元,用于根据协方差矩阵的特征值的大小将协方差矩阵的特征向量从大到小排列,得到映射矩阵;根据预设的特征个数保留映射矩阵的前n行或者前n列对应的医学影像组学特征,得到医学影像组学特征训练集。
可选的是,上述模型更新模块54包括:
诊断时间计算单元,用于将预设的验证集中的医学影像输入至目标医学影像诊断模型,计算目标医学影像诊断模型将验证集中所有的医学影像诊断完成所用的时间;
诊断准确率单元,用于根据目标医学影像诊断模型输出的诊断结果计算目标医学影像诊断模型的诊断的准确率;根据时间和准确率确定目标医学影像诊断模型的性能。
可选的是,上述模型更新模块54还包括:
模型性能判断单元,用于判断诊断模型性能,若目标医学影像诊断模型的诊断准确率比初始医学影像诊断模型的诊断准确率高,且目标医学影像诊断模型的诊断时间比初始医学影像诊断模型的诊断时间短,则判定为目标诊断模型的性能优于初始医学影像诊断模型的性能。
可选的是,上述分布式医学影像诊断模型训练装置还包括:
模型替代模块,用于将预设的验证集中的医学影像输入至更新后的医学影像诊断模型,根据诊断结果,判断更新后的医学影像诊断模型的性能是否优于目标医学影像诊断模型,若更新后的医学影像诊断模型的性能优于目标医学影像诊断模型,则用更新后的医学影像诊断模型替代目标医学影像诊断模型。
需要说明的是,上述模块之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
图6为本发明实施例三提供的一种计算机设备的结构示意图。如图6所示,该实施例的计算机设备包括:至少一个处理器(图6中仅示出一个)、存储器以及存储在存储器中并可在至少一个处理器上运行的计算机程序,处理器执行计算机程序时实现上述任意各个分布式医学影像诊断模型训练方法实施例中的步骤。
该终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,图6仅仅是计算机设备的举例,并不构成对计算机设备的限定,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括网络接口、显示屏和输入装置等。
所称处理器可以是CPU,该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器包括可读存储介质、内存储器等,其中,内存储器可以是客户端的内存,内存储器为可读存储介质中的操作系统和计算机可读指令的运行提供环境。可读存储介质可以是客户端的硬盘,在另一些实施例中也可以是客户端的外部存储设备,例如,客户端上配备的插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,存储器还可以既包括客户端的内部存储单元也包括外部存储设备。存储器用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,该其他程序如计算机程序的程序代码等。存储器还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
上述装置中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述分布式医学影像诊断模型训练方法实施例的步骤。
其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
计算机可读介质至少可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
本发明实现上述实施例方法中的全部或部分流程,也可以通过一种计算机程序产品来完成,当计算机程序产品在客户端上运行时,使得客户端执行时实现可实现上述分布式医学影像诊断模型训练方法实施例中的步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其他实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/客户端和方法,可以通过其他的方式实现。例如,以上所描述的装置/客户端实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其他的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种分布式医学影像诊断模型训练方法,其特征在于,包括:
获取N个医学影像和对应的医学影像目标区域勾画数据,N>1,根据所述医学影像和所述医学影像目标区域勾画数据,在第i个所述医学影像中确定Mi个目标区域,1<i≤N,Mi≥1;
对每个所述医学影像的Mi个目标区域提取医学影像组学特征,对每个所述医学影像组学特征进行特征筛选和特征降维,得到医学影像组学特征训练集;
将所述医学影像组学特征训练集输入至初始医学影像诊断模型,对所述初始医学影像诊断模型进行训练,得到目标医学影像诊断模型;
检测所述目标医学影像诊断模型的性能值,当所述性能值满足预设条件,则将所述目标医学影像诊断模型的参数发送至中心服务端,以更新所述目标医学影像诊断模型。
2.根据权利要求1所述的分布式医学影像诊断模型训练方法,其特征在于,对每个所述医学影像的Mi个目标区域提取医学影像组学特征,包括:
将所述医学影像目标区域进行灰度化处理,得到灰度化医学影像;
计算所述灰度化医学影像的像素灰度梯度,根据所述像素灰度梯度,构造灰度梯度序列;
计算所述灰度梯度序列中的相邻两个像素点之间的灰度差值,若所述灰度差值大于预设值,将所述相邻两个像素点中灰度值较大的像素点作为医学影像组学特征的边缘点,找到所述医学影像组学特征的所有边缘点;根据所述所有边缘点的包围区域确定所述医学影像组学特征。
3.根据权利要求1所述的分布式医学影像诊断模型训练方法,其特征在于,对每个所述医学影像组学特征进行特征筛选和特征降维,得到医学影像组学特征训练集,包括:
计算每个所述医学影像组学特征与预设特征样本的特征方差值,得到每个所述医学影像组学特征对应的特征方差值,将所述特征方差值小于预设值的所述医学影像组学特征删除,得到筛选后剩余的所述医学影像组学特征。
4.根据权利要求3所述的分布式医学影像诊断模型训练方法,其特征在于,得到筛选后剩余的所述医学影像组学特征之后,所述得到医学影像组学特征训练集,包括:
将剩余的所述医学影像组学特征向量化处理,构成样本矩阵;对所述样本矩阵进行中心化处理,得到中心化样本矩阵;
计算所述中心化样本矩阵的协方差,根据所述中心化样本矩阵的协方差构建协方差矩阵,计算所述协方差矩阵的特征值和特征向量;
根据所述协方差矩阵的特征值的大小将所述协方差矩阵的特征向量从大到小排列,得到映射矩阵;根据预设的特征个数保留所述映射矩阵的前n行或者前n列对应的所述医学影像组学特征,得到所述医学影像组学特征训练集。
5.根据权利要求1所述的分布式医学影像诊断模型训练方法,其特征在于,检测所述目标医学影像诊断模型的性能值包括:
将预设的验证集中的所述医学影像输入至所述目标医学影像诊断模型,计算所述目标医学影像诊断模型将所述验证集中所有的医学影像诊断完成所用的时间;
根据所述目标医学影像诊断模型输出的诊断结果计算所述目标医学影像诊断模型的诊断的准确率;根据所述时间和所述准确率确定所述目标医学影像诊断模型的性能值。
6.根据权利要求5所述的分布式医学影像诊断模型训练方法,其特征在于,根据所述时间和所述准确率确定所述目标医学影像诊断模型的性能值之后,所述性能值满足的预设条件包括:
若所述目标医学影像诊断模型的诊断准确率比所述初始医学影像诊断模型的诊断准确率高,且所述目标医学影像诊断模型的诊断时间比所述初始医学影像诊断模型的诊断时间短,则判定为所述目标医学影像诊断模型的性能优于所述初始医学影像诊断模型的性能。
7.根据权利要求1所述的分布式医学影像诊断模型训练方法,其特征在于,更新所述目标医学影像诊断模型之后,所述分布式医学影像诊断模型训练方法还包括:
将预设的验证集中的所述医学影像输入至更新后的所述医学影像诊断模型,根据诊断结果,判断所述更新后的医学影像诊断模型的性能是否优于所述目标医学影像诊断模型,若所述更新后的所述医学影像诊断模型的性能优于所述目标医学影像诊断模型,则用更新后的所述医学影像诊断模型替代所述目标医学影像诊断模型。
8.一种分布式医学影像诊断模型训练装置,其特征在于,所述分布式医学影像诊断模型训练装置包括:
目标区域确定模块,用于获取N个医学影像和对应的医学影像目标区域勾画数据,N>1,根据所述医学影像和所述医学影像目标区域勾画数据,在第i个所述医学影像中确定Mi个目标区域,1<i≤N,Mi≥1;
训练集生成模块,用于对每个所述医学影像目标区域提取医学影像组学特征,对每个所述医学影像组学特征进行特征筛选和特征降维,得到医学影像组学特征训练集;
模型训练模块,用于将所述医学影像组学特征训练集输入至初始医学影像诊断模型,对所述初始医学影像诊断模型进行训练,得到目标医学影像诊断模型;
模型更新模块,用于检测所述目标医学影像诊断模型的性能,当所述性能满足预设条件,则将所述目标医学影像诊断模型的参数发送至中心服务端,以更新所述目标医学影像诊断模型。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的分布式医学影像诊断模型训练方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的分布式医学影像诊断模型训练方法。
CN202210702568.2A 2022-06-21 2022-06-21 分布式医学影像诊断模型训练方法、装置、设备及介质 Pending CN114783573A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210702568.2A CN114783573A (zh) 2022-06-21 2022-06-21 分布式医学影像诊断模型训练方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210702568.2A CN114783573A (zh) 2022-06-21 2022-06-21 分布式医学影像诊断模型训练方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN114783573A true CN114783573A (zh) 2022-07-22

Family

ID=82421609

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210702568.2A Pending CN114783573A (zh) 2022-06-21 2022-06-21 分布式医学影像诊断模型训练方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN114783573A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108537154A (zh) * 2018-03-28 2018-09-14 天津大学 基于hog特征和机器学习的输电线路鸟巢识别方法
WO2020083298A1 (zh) * 2018-10-22 2020-04-30 深圳前海达闼云端智能科技有限公司 医学影像的识别方法、装置、存储介质和电子设备
CN113113130A (zh) * 2021-03-15 2021-07-13 湖南医云智享医疗科技有限公司 一种肿瘤个体化诊疗方案推荐方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108537154A (zh) * 2018-03-28 2018-09-14 天津大学 基于hog特征和机器学习的输电线路鸟巢识别方法
WO2020083298A1 (zh) * 2018-10-22 2020-04-30 深圳前海达闼云端智能科技有限公司 医学影像的识别方法、装置、存储介质和电子设备
CN113113130A (zh) * 2021-03-15 2021-07-13 湖南医云智享医疗科技有限公司 一种肿瘤个体化诊疗方案推荐方法

Similar Documents

Publication Publication Date Title
US11049240B2 (en) Method and system for assessing bone age using deep neural network
CN109242844B (zh) 基于深度学习的胰腺癌肿瘤自动识别系统、计算机设备、存储介质
JP7350878B2 (ja) 画像解析方法、装置、プログラム
CN111524137B (zh) 基于图像识别的细胞识别计数方法、装置和计算机设备
US20220222932A1 (en) Training method and apparatus for image region segmentation model, and image region segmentation method and apparatus
CN110197716B (zh) 医学影像的处理方法、装置及计算机可读存储介质
CN111524106A (zh) 颅骨骨折检测和模型训练方法、装置、设备和存储介质
KR101955919B1 (ko) 딥러닝 기반의 영상데이터 내 관심영역 설정방법 및 프로그램
CN108229274B (zh) 多层神经网络模型训练、道路特征识别的方法和装置
EP4181059A1 (en) Medical image processing method, apparatus, device, storage medium, and product
WO2021120961A1 (zh) 大脑成瘾结构图谱评估方法及装置
CN112001983B (zh) 生成遮挡图像的方法、装置、计算机设备和存储介质
CN111666890A (zh) 脊柱变形人群识别方法、装置、计算机设备及存储介质
CN109961435B (zh) 脑图像获取方法、装置、设备及存储介质
CN113706562A (zh) 图像分割方法、装置、系统及细胞分割方法
CN113850796A (zh) 基于ct数据的肺部疾病识别方法及装置、介质和电子设备
CN113469091A (zh) 人脸识别方法、训练方法、电子设备及存储介质
CN111353325A (zh) 关键点检测模型训练方法及装置
CN111209946B (zh) 三维图像处理方法、图像处理模型训练方法及介质
CN110570425B (zh) 一种基于深度强化学习算法的肺结节分析方法及装置
CN111369598B (zh) 深度学习模型的训练方法及装置、应用方法及装置
CN113111684B (zh) 神经网络模型的训练方法、装置和图像处理系统
CN110929731B (zh) 一种基于探路者智能搜索算法的医疗影像处理方法及装置
CN112330671A (zh) 细胞分布状态的分析方法、装置、计算机设备和存储介质
JP2018055287A (ja) 統合装置及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220722

RJ01 Rejection of invention patent application after publication