CN109858562A - 一种医学影像的分类方法、装置和存储介质 - Google Patents

一种医学影像的分类方法、装置和存储介质 Download PDF

Info

Publication number
CN109858562A
CN109858562A CN201910130011.4A CN201910130011A CN109858562A CN 109858562 A CN109858562 A CN 109858562A CN 201910130011 A CN201910130011 A CN 201910130011A CN 109858562 A CN109858562 A CN 109858562A
Authority
CN
China
Prior art keywords
medical image
lesion
classifier
sample
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910130011.4A
Other languages
English (en)
Inventor
高殿宇
曹世磊
马锴
郑冶枫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910130011.4A priority Critical patent/CN109858562A/zh
Publication of CN109858562A publication Critical patent/CN109858562A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种医学影像的分类方法、装置和存储介质;本发明实施例先获取多个医学影像样本,对该医学影像样本中的病变特征进行分类,根据分类结果构建出该医学影像样本的提升树模型,得到第一分类器组,再采用该第一分类器组从该病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集,接着,利用该目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器,然后,基于该训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果;该方案可以有效地提高医学影像的分类的准确性。

Description

一种医学影像的分类方法、装置和存储介质
技术领域
本发明涉及通信技术领域,具体涉及一种医学影像的分类方法、装置和存储介质。
背景技术
肝癌微血管侵犯(Microvascular Invasion,MVI)是影响肝癌术后生存的重要独立危险因素,但是目前,MVI判定依赖外科手术获得标本之后,进行组织病理学检查才能确定,很大的限制了MVI在临床实践应用中对早期外科治疗方式、肝切除的术式选择以及术中辅助治疗的指导等等。
病理检查方法检测是否发生MVI依赖于外科手术获得的肿瘤标本,处理过程需要专业人员经过较长时间对标本进行处理,效率较低,且观察过程会有人为主观判断,判断的准确率较低。
发明内容
本发明实施例提供一种医学影像的分类方法、装置和存储介质,可以有效地提高医学影像的分类的准确性。
本发明实施例提供一种医学影像的分类方法,包括:
获取多个医学影像样本;
对所述医学影像样本中的病变特征进行分类,根据分类结果构建出所述医学影像样本的提升树模型,得到第一分类器组;
采用所述第一分类器组从所述病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集;
利用所述目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器;
基于所述训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果。
相应的,本发明实施例还提供一种医学影像的分类装置,包括:
获取单元,用于获取多个医学影像样本;
构建单元,用于对所述医学影像样本中的病变特征进行分类,根据分类结果构建出所述医学影像样本的提升树模型,得到第一分类器组;
筛选单元,用于采用所述第一分类器组从所述病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集;
训练单元,用于利用所述目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器;
检测单元,用于基于所述训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果。
可选的,在一些实施例中,所述构建单元可以包括提取子单元和构建子单元,如下:
所述提取子单元,用于在所述医学影像样本中分割出病变区域样本,对所述病变区域样本提取多维病变特征;
所述构建子单元,用于对所述多维病变特征进行分类,根据分类结果构建出所述医学影像样本的提升树模型,得到第一分类器组。
可选的,在一些实施例中,所述提取子单元,具体用于在所述医学影像样本中筛选出病变区域和近病变旁的组织区域;将所述病变区域和近病变旁的组织区域进行扩展,得到扩展后区域;对所述扩展后区域进行分割,得到病变区域样本;利用医学影像特征提取包对所述病变区域样本提取多维病变特征。
可选的,在一些实施例中,所述构建子单元,具体用于利用每个基分类器从所述多维病变特征中随机选择多个病变特征;将所述多个病变特征进行分类,以构建出多个所述医学影像样本的分类与回归树模型;组合多个分类与回归树模型,得到所述医学影像样本的提升树模型,得到第一分类器组。
可选的,在一些实施例中,所述多个医学影像样本可以包括医学影像训练样本和医学影像验证样本,所述训练单元可以包括训练子单元和验证子单元,如下:
所述训练子单元,用于利用所述目标病变特征集构建预设第二分类器,采用所述医学影像训练样本对所述预设第二分类器进行训练,得到第二分类器;
所述验证子单元,用于采用医学影像验证样本对所述第二分类器的准确性进行验证,若验证结果满足第二预设条件,则得到训练后第二分类器。
可选的,在一些实施例中,所述检测单元可以包括获取子单元、检测子单元和确定子单元,如下:
所述获取子单元,用于获取待分类的医学影像;
所述检测子单元,用于采用所述训练后第二分类器对所述医学影像进行目标病变特征检测;
所述确定子单元,用于若检测结果指示所述医学影像存在目标病变特征,则确定所述医学影像存在病变区域。
此外,本发明实施例还提供一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本发明实施例提供的任一种医学影像的分类方法中的步骤。
本发明实施例先获取多个医学影像样本,对该医学影像样本中的病变特征进行分类,根据分类结果构建出该医学影像样本的提升树模型,得到第一分类器组,再采用该第一分类器组从该病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集,接着,利用该目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器,然后,基于该训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果;由于该方案可以先利用医学影像样本的特征训练第一分类器,再利用第一分类器筛选出能正确反映该病变的重要特征(即目标病变特征),然后使用该目标病变特征训练第二分类器,以提高第二分类器分类的准确率,确保医学影像中的信息可以被准确地检测出来,所以,相对于仅仅依靠人工对医学影像表象信息进行判断的分案而言,可以有效提高医学影像分类的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本发明实施例提供的医学影像的分类方法的场景示意图;
图1b是本发明实施例提供的医学影像的分类方法的流程图;
图1c是本发明实施例提供的医学影像的基分类器的结构示意图;
图1d是本发明实施例提供的医学影像的目标分类器的结构示意图;
图2a是本发明实施例提供的医学影像的分类方法的另一流程图;
图2b是本发明实施例提供的医学影像的分类方法的又一流程图;
图2c是本发明实施例提供的医学影像的基分类器的另一结构示意图;
图2d是本发明实施例提供的医学影像的目标分类器的又一结构示意图;
图2e是本发明实施例提供的医学影像的目标病变特征的示意图;
图2f是本发明实施例提供的医学影像的分类方法的结构示意图;
图3是本发明实施例提供的医学影像的分类装置的结构示意图;
图4是本发明实施例提供的网络设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种医学影像的分类方法、装置和存储介质。其中,该医学影像的分类可以集成在网络设备中,该网络设备可以是服务器,也可以是终端等设备。
例如,参见图1a,首先,该集成了医学影像的分类装置的网络设备先获取多个医学影像样本,对该医学影像样本中的病变特征进行分类,根据分类结果构建出该医学影像样本的提升树模型,得到第一分类器组,再采用该第一分类器组从该病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集,接着,利用该目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器,然后,基于该训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果。
由于在采用第二分类器进行检测之前,先利用医学影像样本的特征训练第一分类器,再利用第一分类器筛选出能正确反映该病变的重要特征(即目标病变特征),然后使用该目标病变特征训练第二分类器,以提高第二分类器分类的准确率,确保医学影像中的信息可以被准确地检测出来,所以,相对于仅仅依靠人工对医学影像表象信息进行判断的分案而言,可以有效提高医学影像分类的准确性。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
本实施例将从医学影像的分类装置的角度进行描述,该医学影像的分类装置具体可以集成在网络设备中,该网络设备可以是服务器,也可以是终端等设备;其中,该终端可以包括手机、平板电脑、笔记本电脑、以及个人计算(Personal Computer,PC)等设备。
一种医学影像的分类方法,包括:先获取多个医学影像样本,对该医学影像样本中的病变特征进行分类,根据分类结果构建出该医学影像样本的提升树模型,得到第一分类器组,再采用该第一分类器组从该病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集,接着,利用该目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器,然后,基于该训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果。
如图1b所示,该医学影像的分类方法的具体流程可以如下:
101、获取多个医学影像样本。
例如,具体由各医学影像采集设备,比如电子计算机断层扫描仪(ComputedTomography,CT)、或核磁共振成像仪等来对生命体组织进行影像采集,由专业人员对影像进行标注,比如由影像科医师标注进而提供给该医学影像的分类装置,即,医学影像的分类装置具体可以接收医学影像采集设备发送的医学影像样本。
其中,医学影像指的是在医疗或医学研究中,以非侵入方式取得生命体或生命体某部分内部组织的影像,比如人体的脑部、肠胃、肝脏、心脏、喉咙和阴道等影像,这些影像可以是CT影像、核磁共振影像或者正子发射断层扫描影响等等。而生命体指的是有生命形态的独立个体,比如人或动物等。医学影像样本可以指的是已经由医学影像采集设备采集,通过各种途径获取到的影像,比如从数据库或网络等。其中,该医学影像样本可以是经由专业人员对影像进行特定意义标注的影像样本,也可以是未经任何处理的影像样本。
102、对该医学影像样本中的病变特征进行分类,根据分类结果构建出该医学影像样本的提升树模型,得到第一分类器组;例如,具体可以如下:
(1)在该医学影像样本中分割出病变区域样本,对该病变区域样本提取多维病变特征。
例如,具体可以在该医学影像样本中筛选出病变区域和近病变旁的组织区域,将该病变区域和近病变旁的组织区域进行扩展,得到扩展后区域,对该扩展后区域进行分割,得到病变区域样本,利用医学影像特征提取包对该病变区域样本提取多维病变特征,利用该多维病变特征构建第一分类器组的训练集。
比如,以医学影像为肝脏CT图,医学影像样本为由影像科医师标注了肝癌数据的肝脏CT图为例,具体可以在标注的包含肝癌的区域内筛选肝癌病变区和近癌旁肝组织区域,即微血管侵犯可能存在的区域,也就是感兴趣区域(Region of Interest,ROI),在筛选出的区域向外延伸进行多个像素扩展,得到扩展后区域,对该扩展后区域进行分割,得到微血管侵犯区域样本,由医学影像特征提取的开源的python包(开源包pyradiomics)从多方面(比如从影像类型、一阶统计量、形状信息、灰度共生矩阵、灰度游程矩阵、灰度区域大小矩阵、二维灰度差分矩阵、灰度相关矩阵等等)自动完成对每一个微血管侵犯区域样本提取多维反应MVI信息的特征。
其中,影像类型可以从原始影像、小波滤波、高斯拉普拉斯滤波、平方、平方根、对数、以及指数等角度提取,一阶统计量可以从能量(Energy)、熵(Entropy)、最小值(Minimum)、第10个百分点(10th percentile)、第90个百分点(90th percentile)、最大值(Maximum)、平均值(Mean)、以及峰度(Kurtosis)等角度提取,形状信息可以从网格体积(Mesh Volume)、体素体积(Voxel Volume)、表面积(Surface Area)、球形(Sphericity)、最大三维直径(Maximum3D diameter)、主轴长度(Major Axis Length)、以及平面度(Flatness)等角度提取,灰度共生矩阵可以从自相关(Autocorrelation)、联合平均(JointAverage)、聚类趋势(Cluster Tendency)、对比度(Contrast)、相关性(Correlation)、差异熵(Difference Entropy)、以及最大相关系数(Maximal Correlation Coefficient)等角度提取,灰度游程矩阵可以从短游程因子(Short Run Emphasis)、长游程因子(Long RunEmphasis)、灰度不均匀性(Gray Level Non-Uniformity)、游程总数百分比(RunPercentage)、灰度方差(Gray Level Variance)、以及低灰度游程因子(Low Gray LevelRun Emphasis)等角度提取,灰度区域大小矩阵可以从小区域因子(Small AreaEmphasis)、大区域因子(Large Area Emphasis)、区域百分比(Zone Percentage)、灰度方差(Gray Level Variance)、以及低灰度区域因子(Low Gray Level Zone Emphasis)等角度提取,二维灰度差分矩阵可以从粗糙性(Coarseness)、对比度(Contrast)、繁忙度(Busyness)、复杂度(Complexity)、以及强度(Strength)等角度提取,灰度相关矩阵可以从小依赖因子(Small Dependence Emphasis)、大依赖因子(Large Dependence Emphasis)、以及依赖方差(Dependence Variance)等角度提取。
(2)对该多维病变特征进行分类,根据分类结果构建出该医学影像样本的提升树模型,得到第一分类器组。
例如,第一分类器组包括多个基分类器,具体可以利用每个基分类器从该多维病变特征中随机选择多个病变特征,将该多个病变特征进行分类,以构建出多个该医学影像样本的分类与回归树模型,组合多个分类与回归树模型,构建该医学影像样本的提升树模型,得到第一分类器组。
其中,分类与回归树(Classification And Regression Tree,CART)是决策树的一种,并且是非常重要的决策树,是一颗二叉树,且每个非叶子节点都有两个孩子,所以对于第一棵子树其叶子节点数比非叶子节点数多1。决策树是一种依托决策而建立起来的一种树。在机器学习中,决策树是一种预测模型,代表的是一种对象属性与对象值之间的一种映射关系,每一个节点代表某个对象,树中的每一个分叉路径代表某个可能的属性值,而每一个叶子节点则对应从根节点到该叶子节点所经历的路径所表示的对象的值。分类与回归树是在给定输入随机变量X条件下输出随机变量Y的条件概率分布的学习方法。分类与回归树假设决策树是二叉树,内部结点特征的取值为“是”和“否”,左分支是取值为“是”的分支,右分支是取值为“否”的分支。这样的决策树等价于递归地二分每个特征,将输入空间即特征空间划分为有限个单元,并在这些单元上确定预测的概率分布,也就是在输入给定的条件下输出的条件概率分布。分类与回归树算法主要包括树的生成和树的剪枝。首先基于训练数据集生成决策树,生成的决策树要尽量大;然后用验证数据集对已生成的树进行剪枝并选择最优子树,这时损失函数最小作为剪枝的标准。决策树的生成就是通过递归地构建二叉决策树的过程,对回归树用平方误差最小化准则,对分类树用基尼指数最小化准则,进行特征选择,生成二叉树。
其中,提升树模型采用加法模型(基函数的线性组合)与前向分步算法,同时基函数采用决策树算法,对待分类问题采用二叉分类树,对于回归问题采用二叉回归树。提升树模型可以看作是决策树的加法模型,先从初始训练集训练出一个基分类器,再根据基分类器的表现对训练样本分布进行调整,使得先前基分类器做错的训练样本在后续受到更多的关注,然后基于调整后的样本分布来训练下一个基分类器;如此重复进行,直至基分类器数目达到事先指定的值T,最终将这T个基学习器进行加权结合,得到提升树模型。也就是将弱分类器转化为目标分类器,即把很多分类准确率很低的分类器通过更新对数据的权重,集成起来形成一个分类效果好的分类器。
例如,每个基分类器具体可以是以分类与回归树模型作为算法的核心,如图1c所示,对于样本集D{样本1、样本2……样本i……样本n},其中样本1包括t1、t2……tm,样本i包括t1、t2……tm,样本n包括t1、t2……tm。其中,每个样本特征包含多种取值。分类与回归树的构建过程如下:
首先,对样本集D中所有样本进行初始化,然后,生成一个分类与回归树的根节点d,并将样本集D分配给作该根节点d。
基于划分特征“是”或“否”将样本集D划分成两个子样本集D1{样本1、样本2……样本k}和D2{样本k+1……样本n};然后,生成当前节点d的两个子节点d1和d2,将D1分配个子节点d1,将D2分配给子节点d2。
接着,对于每个子节点,以子节点d1为例,判断子节点是否满足预设分类终止条件,若是,则将当前的子节点d1作为叶子节点,并根据子节点d1对应的子样本集中样本的类别设置该叶子节点输出。
当子节点不满足预设分类终止条件时,继续对子节点对应的子样本集进行分类,比如以子节点d1为例,基于划分特征“是”或“否”以及划分点将D1划分成两个子样本集,可以将D1划分成子样本集D11、D12;然后,生成当前节点d1的子节点d11、d12、将D11、D12分别分配给子节点d11、d12,又比如以子节点d2为例,基于划分特征“是”或“否”以及划分点将D2划分成两个子样本集,可以将D2划分成子样本集D21、D22;然后,生成当前节点d2的子节点d21、d22、将D21、D22分别分配给子节点d21、d22。依次类推,直到子节点满足预设分类终止条件。循环训练多个基分类器中的分类与回归树模型,最后组合多个基分类器得到提升树模型。
其中,算法具体可以如下:
由获取到的医学影像样本构成样本集D,在基分类器中输入样本集D和损失函数L,如:
损失函数为L(y,f(x)),
其中,i为特征序数,x(i)为样本的某个特征,n为单个样本提取出的特征数,m为挑选出的特征数,Rn为总样本的多维病变特征数据集,X为训练样本,x为输入分类器的样本,y为特征阈值,f(x)为分类器对样本的分类结果。
对分类与回归树模型初始化,估计是损失函数极小化的常数值(是一个只有根节点的树),即
其中,f0(x)指的是对第一个节点初始化。
然后,循环训练K个CART基分类器,其中,k=1,2,…,K,如:
(a)计算损失函数的负梯度在当前模型的值,将它作为残差的估计,如:对于i=1,2,…,m
其中,rki指的是某一个特征的残差。
(b)估计回归树的节点区域,以拟合残差的近似值,如拟合残差rki,学习一个子树,得到第k棵树的叶节点区域Rkj,其中,节点j=1,2,…,J,Rkj为所有特征的残差和,即rki的和。
(c)利用线性搜索估计叶节点区域的值,使损失函数极小化,对j=1,2,…,J,计算:
其中,ckj为残差的最小值,C为常数。
(d)更新回归树:
其中,I为内部结点特征的取值。
接着,组合多个CART基分类器,得到提升树模型如下:
103、采用该第一分类器组从该病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集。
其中,预设条件的设定方式可以有很多种,比如,可以根据实际应用的需求灵活设置,也可以预先设置好存储在网络设备中。此外,预设条件可以内置于网络设备中,或者,也可以保存在存储器中并发送给网络设备,等等。其中,预设条件可以是在准确率最高的基分类器中出现频率最高的特征,也可以是在基分类器中重要性数值较大的特征,等等。其中,目标病变特征指的是最能反映病变本身特性的重要特征,目标病变特征集指的是多个目标病变特征的集合。
例如,具体可以对该第一分类器组中的多个基分类器进行交叉验证,得到每个基分类器的准确率,选择该准确率大于预设阈值的多个基分类器进行组合,得到目标分类器,如图1d所示,基于该目标分类器筛选出目标病变特征集。
其中,交叉验证(Cross Validation),也称循环估计(Rotation Estimation),就是在某种意义下将原始数据进行分组,一部分作为训练集,另一部分作为验证集。首先用训练集对分类器进行训练,再利用验证集来测试训练得到的模型,以此来作为评价分类器的性能指标。
其中,预设阈值的设定方式可以有很多种,比如,可以根据实际应用的需求灵活设置,也可以预先设置好存储在网络设备中。此外,预设阈值可以内置于网络设备中,或者,也可以保存在存储器中并发送给网络设备,等等。
其中,目标分类器指的是多个准确率大于预设阈值的基分类器的组合。
可选的,为了更准确地筛选出目标病变特征,可以先统计基分类器准确率较高时所使用的病变特征,根据使用频率筛选得到目标病变特征,即步骤“基于该目标分类器筛选出目标病变特征集”,包括:
统计该交叉验证中基分类器准确率大于预设阈值时所使用的病变特征,得到病变特征的使用频率;
根据统计结果筛选出使用频率最高的多个病变特征,得到目标病变特征集。
104、利用该目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器。
例如,具体可以将该多个医学影像样本分为医学影像训练样本和医学影像验证样本,首先利用该目标病变特征集构建预设第二分类器,采用该医学影像训练样本对该预设第二分类器进行训练,得到第二分类器,然后,采用医学影像验证样本对该第二分类器的准确性进行验证,若验证结果满足第二预设条件,则得到训练后第二分类器。
例如,具体可以使用筛选出来的重要特征(即目标病变特征)构建预设第二分类器,排除非重要特征对第二分类器构建产生的负面影响,然后调整分类器的参数,优化分类器,生成最终模型(即第二分类器)。由于第二分类器使用的是筛选出来的重要特征进行构建、训练以及参数调优,然后进行测试排除了其他非重要特征对分类器构建的干扰,可得到更好的结果(即更优化的分类器)。
105、基于该训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果。
例如,具体可以基于该训练后第二分类器对待分类的医学影像进行目标病变特征检测,根据检测结果对待分类的医学影像进行分类,得到分类结果。
比如,具体可以获取待分类的医学影像;采用该训练后第二分类器对该医学影像进行目标病变特征检测;若检测结果指示该医学影像存在目标病变特征,则确定该医学影像存在病变区域。
其中,待分类的医学影像指的是需要进行分类的医学影像,可以由各医学影像采集设备,比如电子计算机断层扫描仪或核磁共振成像仪等来对生命体组织进行影像采集,比如人体的脑部、肠胃、肝脏、心脏、喉咙和阴道等,进而提供给该医学影像检测装置,即,医学影像检测装置具体可以接收医学影像采集设备发送的待分类的医学影像。
由上可知,本发明实施例先获取多个医学影像样本,对该医学影像样本中的病变特征进行分类,根据分类结果构建出该医学影像样本的提升树模型,得到第一分类器组,再采用该第一分类器组从该病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集,接着,利用该目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器,然后,基于该训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果;由于该方案可以先利用医学影像样本的特征训练第一分类器,再利用第一分类器筛选出能正确反映该病变的重要特征(即目标病变特征),然后使用该目标病变特征训练第二分类器,以提高第二分类器分类的准确率,确保医学影像中的信息可以被准确地检测出来,所以,相对于仅仅依靠人工对医学影像表象信息进行判断的分案而言,可以有效提高医学影像分类的准确性。
根据上一个实施例所描述的方法,以下将举例作进一步详细说明。
在本实施例中,将以该医学影像的分类装置具体集成在网络设备,其以医学影像具体为肝脏CT图,对肝脏CT图进行肝细胞癌微血管侵犯检测为例进行说明。
如图2a所示,一种医学影像的分类方法,具体流程可以如下:
201、网络设备获取多个医学影像样本。
例如,网络设备可以接收用户输入的电子计算机断层扫描影像,或者,接收其他设备发送的电子计算机断层扫描影像,其中,该电子计算机断层扫描影像可以通过电子计算机断层扫描仪对肝脏区域进行影像采集,并通过各种途径获取到的影像,比如从数据库或网络等,然后由影像科医师标注,得到多个肝脏CT影像样本,进而提供给该网络设备。
202、网络设备在该医学影像样本中分割出病变区域样本,对该病变区域样本提取多维病变特征。
例如,网络设备具体可以在标注的包含肝癌的区域内筛选肝癌病变区和近癌旁肝组织区域,如图2b所示,即微血管侵犯可能存在的区域,也就是感兴趣区域,在筛选出的区域向外延伸进行多个像素扩展,得到扩展后区域,对该扩展后区域进行分割,得到微血管侵犯区域样本,由医学影像特征提取的开源的python包(开源包pyradiomics)从多方面(比如从影像类型、一阶统计量、形状信息、灰度共生矩阵、灰度游程矩阵、灰度区域大小矩阵、二维灰度差分矩阵、灰度相关矩阵等等)自动完成对每一个微血管侵犯区域样本提取多维反应MVI信息的特征。
比如,影像类型可以从原始影像、小波滤波、高斯拉普拉斯滤波、平方、平方根、对数、以及指数等角度提取,一阶统计量可以从能量、熵、最小值、第10个百分点、第90个百分点、最大值、平均值、以及峰度等角度提取,形状信息可以从网格体积、体素体积、表面积、球形、最大三维直径、主轴长度、以及平面度等角度提取,灰度共生矩阵可以从自相关、联合平均、聚类趋势、对比度、相关性、差异熵、以及最大相关系数等角度提取,灰度游程矩阵可以从短游程因子、长游程因子、灰度不均匀性、游程总数百分比、灰度方差、以及低灰度游程因子等角度提取,灰度区域大小矩阵可以从小区域因子、大区域因子、区域百分比、灰度方差、以及低灰度区域因子等角度提取,二维灰度差分矩阵可以从粗糙性、对比度、繁忙度、复杂度、以及强度等角度提取,灰度相关矩阵可以从小依赖因子、大依赖因子、以及依赖方差等角度提取,对每一个微血管侵犯区域样本提取1217个反应该MVI信息的特征。
203、网络设备对该多维病变特征进行分类,根据分类结果构建出该医学影像样本的提升树模型,得到第一分类器组。
例如,网络设备调用python开源包极端梯度提升(eXtreme Gradient Boosting,XGBoost)中的XGBoost分类器,设定分类器中树的个数和深度,每个叶子节点中最少样本数、学习率、训练样本数占比、特征占比、以及损失计算函数等参数,然后利用每个基分类器从该多维病变特征中随机选择多个病变特征,比如从1217个反应该MVI信息的特征选择974个特征,将该974个病变特征输入及到分类器中进行分类,以构建出多个该医学影像样本的分类与回归树模型,调用scikit-learn中的GridSearchCV进行参数调优,提高分类器的准确率。组合多个分类与回归树模型,得到该医学影像样本的提升树模型。
其中,scikit-learn是用python实现的机器学习算法库。scikit-learn可以实现数据预处理、分类、回归、降维、模型选择等常用的机器学习算法。而GridSearchCV就是自动调参,只要把参数输进去,就能给出最优化的结果和参数。
例如,每个基分类器具体可以是以分类与回归树模型作为算法的核心,对于样本集D{样本1、样本2……样本i……样本n},其中样本1包括t1、t2……tm,样本i包括t1、t2……tm,样本n包括t1、t2……tm。其中,每个样本特征包含多种取值。分类与回归树的构建过程如下:
首先,对样本集D中所有样本进行初始化,然后,生成一个分类与回归树的根节点d,并将样本集D分配给作该根节点d。
基于划分特征“是”或“否”将样本集D划分成两个子样本集D1{样本1、样本2……样本k}和D2{样本k+1……样本n};然后,生成当前节点d的两个子节点d1和d2,将D1分配个子节点d1,将D2分配给子节点d2。
接着,对于每个子节点,以子节点d1为例,判断子节点是否满足预设分类终止条件,比如,具体地,如图2c所示,预设分类终止条件可以为leaf=0.0019,若是,则将当前的子节点d1作为叶子节点,并根据子节点d1对应的子样本集中样本的类别设置该叶子节点输出。
当子节点不满足预设分类终止条件时,继续对子节点对应的子样本集进行分类,比如以子节点d1为例,基于划分特征“是”或“否”以及划分点将D1划分成两个子样本集,可以将D1划分成子样本集D11、D12;然后,生成当前节点d1的子节点d11、d12、将D11、D12分别分配给子节点d11、d12,又比如以子节点d2为例,基于划分特征“是”或“否”以及划分点将D2划分成两个子样本集,可以将D2划分成子样本集D21、D22;然后,生成当前节点d2的子节点d21、d22、将D21、D22分别分配给子节点d21、d22。依次类推,直到子节点满足预设分类终止条件。循环训练多个基分类器中的分类与回归树模型,最后组合多个基分类器得到提升树模型。
其中,算法具体可以如下:
由获取到的医学影像样本构成样本集D,在基分类器中输入样本集D和损失函数L,如:
损失函数为L(y,f(x)),
其中,i为特征序数,x(i)为样本的某个特征,n为单个样本提取出的特征数,m为挑选出的特征数,Rn为总样本的多维病变特征数据集,X为训练样本,x为输入分类器的样本,y为特征阈值,f(x)为分类器对样本的分类结果。
对分类与回归树模型初始化,估计是损失函数极小化的常数值(是一个只有根节点的树),即
其中,f0(x)指的是对第一个节点初始化。
然后,循环训练K个CART基分类器,其中,k=1,2,…,K,如:
(a)计算损失函数的负梯度在当前模型的值,将它作为残差的估计,如:对于i=1,2,…,m
其中,rki指的是某一个特征的残差。
(b)估计回归树的节点区域,以拟合残差的近似值,如拟合残差rki,学习一个子树,得到第k棵树的叶节点区域Rkj,其中,节点j=1,2,…,J,Rkj为所有特征的残差和,即rki的和。
(c)利用线性搜索估计叶节点区域的值,使损失函数极小化,对j=1,2,…,J,计算:
其中,ckj为残差的最小值,C为常数。
(d)更新回归树:
其中,I为内部结点特征的取值。
接着,组合多个CART基分类器,得到提升树模型如下:
比如,具体地,如图2c所示,首先,对样本集D中所有样本进行初始化选取初始值为f0<90.2232,然后,生成一个分类与回归树的根节点d,并将样本集D分配给作该根节点d。
基于划分特征“是”或“否”将样本集D划分成两个子样本集D1{样本1、样本2……样本k}和D2{样本k+1……样本n};然后,生成当前节点d的两个子节点d1和d2,将D1分配个子节点d1,将D2分配给子节点d2。
接着,对于每个子节点,判断子节点是否满足预设分类终止条件leaf=0.0019,由图可知子节点d1满足预设分类终止条件,则将当前的子节点d1作为叶子节点,并根据子节点d1对应的子样本集中样本的类别设置该叶子节点输出。
当子节点d2为f0<571.7720不满足预设分类终止条件时,继续对子节点对应的子样本集进行分类,基于划分特征“是”或“否”以及划分点将D2划分成两个子样本集,可以将D2划分成子样本集D21、D22;然后,生成当前节点d2的子节点d21、d22、将D21、D22分别分配给子节点d21、d22,选取d21的值为f0<245.9164、选取d22的值为f0<4336.0493,对子节点d21、d22继续划分。依次类推,直到子节点满足预设分类终止条件。循环训练多个基分类器中的分类与回归树模型,最后组合多个基分类器得到提升树模型。
204、网络设备采用该第一分类器组从该病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集。
其中,预设条件的设定方式可以有很多种,比如,可以根据实际应用的需求灵活设置,也可以预先设置好存储在网络设备中。此外,预设条件可以内置于网络设备中,或者,也可以保存在存储器中并发送给网络设备,等等。其中,预设条件可以是在准确率最高的基分类器中出现频率最高的特征,也可以是在基分类器中重要性数值较大的特征,等等。
例如,第一分类器组包括多个基分类器,网络设备可以将所有的医学影像样本按照4:1分为训练样本和验证样本,具体可以对该第一分类器组中的多个基分类器进行500次5折交叉验证,得到每个基分类器的准确率,然后,选择该准确率大于预设阈值,比如,准确率大于90%的多个基分类器进行组合,得到目标分类器,比如,如图2d所示,基于该目标分类器筛选出目标病变特征集,比如,如图2e所示,筛选出20个重要特征(即目标病变特征,也就是对MVI敏感的特征)及其重要性的数值表示,去除其他非重要特征影响,比如,筛选出的20个目标病变特征可以如下:
1为原始_形状_伸长率(original_shape_Elongation),2为对数函数-标准差-2-0-毫米_三维_一阶_最小值(log-sigma-2-0-mm-3D_firstorder_Minimum),3为对数函数-标准差-5-0-毫米_三维_灰度及带矩阵_大区域灰度因子(log-sigma-5-0-mm-3D_glszm_LargeAreaLowGrayLevelEmphsis),4为小波_低高低频子带_灰度共生矩阵_最小实体要求1(wavelet_LHL_glcm_lmc1),5为小波_低高高频子带_灰度共生矩阵_聚类阴影(wavelet_LHH_glcm_ClusterShade),6为小波_低低低频子带_一阶_中值(wavelet_LLL_firstorder_Median),7为原始_形状_最大二维直径切片(original_shape_Maximum2DDiameterSlice),8为对数函数-标准差-5-0-毫米_三维_一阶_第10个百分点(log-sigma-5-0-mm-3D_firstorder_10Percentile),9为对数函数-标准差-1-0-毫米_三维_基于灰度共生矩阵的纹理特征提取_依赖不均匀性标准化(log-sigma-1-0-mm-3D_gldm_DependenceNonUinformityNormalized),10为对数函数-标准差-3-0-毫米_三维_灰度共生矩阵_逆方差(log-sigma-3-0-mm-3D_glcm_InverseVariance),11为对数函数-标准差-5-0-毫米_三维_灰度行程矩阵_长游程因子(log-sigma-5-0-mm-3D_glrlm_LongRunEmphasis),12为小波_低高高频子带_灰度共生矩阵_聚类趋势(wavelet_LHH_glcm_ClusterTendency),13为小波_高高低频子带_灰度共生矩阵_相关性(wavelet_HHL_glcm_Correlation),14为小波_高高高频子带_一阶_中值(wavelet_HHH_firstorder_Median),15为原始_一阶_中值(original_firstorder_Median),16为对数函数-标准差-4-0-毫米_三维_灰度区域大小矩阵_大区域低灰度因子(log-sigma-4-0-mm-3D_glszm_LargeAreaLowGrayLevelEmphsis),17为小波_低高低频子带_一阶_四分位差(wavelet_LHL_firstorder_InterquartileRange),18为小波_低高高频子带_一阶_中值(wavelet_LHH_firstorder_Median),19为原始_灰度行程矩阵_长游程因子(original_glrlm_LongRunEmphasis),20为原始_基于灰度共生矩阵的纹理特征提取_依赖方差(original_gldm_DependenceVariance)。
其中,预设阈值的设定方式可以有很多种,比如,可以根据实际应用的需求灵活设置,也可以预先设置好存储在网络设备中。此外,预设阈值可以内置于网络设备中,或者,也可以保存在存储器中并发送给网络设备,等等。
可选的,为了更准确地筛选出目标病变特征,可以先统计基分类器准确率较高时所使用的病变特征,根据使用频率筛选得到目标病变特征,即步骤“基于该目标分类器筛选出目标病变特征集”,包括:
统计该交叉验证中基分类器准确率大于预设阈值时所使用的病变特征,得到病变特征的使用频率;
根据统计结果筛选出使用频率最高的多个病变特征,得到目标病变特征集。
205、网络设备利用该目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器。
例如,具体可以将该多个医学影像样本分为医学影像训练样本和医学影像验证样本,首先利用该目标病变特征集构建预设第二分类器,采用该医学影像训练样本对该预设第二分类器进行训练,得到第二分类器,然后,采用医学影像验证样本对该第二分类器的准确性进行验证,若验证结果满足第二预设条件,则得到训练后第二分类器。
例如,具体可以使用筛选出来的20个重要特征(即目标病变特征)构建预设第二分类器,排除非重要特征对第二分类器构建产生的负面影响,然后调整分类器的参数,优化分类器,生成最终模型(即第二分类器)。由于第二分类器使用的是筛选出来的重要特征进行构建、训练以及参数调优,然后进行测试,排除了其他非重要特征对分类器构建的干扰,可得到更好的结果(即更优化的分类器)。若验证结果满足第二预设条件,比如,第二分类器的准确率大于90%等,则得到训练后第二分类器。
206、网络设备基于该训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果。
例如,具体可以基于该训练后第二分类器对待分类的医学影像进行目标病变特征检测,根据检测结果对待分类的医学影像进行分类,得到分类结果。
比如,网络设备具体可以获取待分类的医学影像,采用该训练后第二分类器对该医学影像进行目标病变特征检测,若检测结果指示该医学影像存在目标病变特征,则确定该医学影像存在病变区域。
比如,如图2f所示,网络设备的前端A接受到数据(即输入的肝癌CT影像),然后上传给后端,后端使用训练后第二分类器将其进行判定,在输出到前端B。
此外,需说明的是,该方案的执行硬件环境可以根据实际需求而定。
另外,还需说明的是,本实施例仅仅为示例,应当理解的是,本实施例中使用到的分类器除了可以是分类与回归树模型之外,还可以使用其他分类器进行特征选择并构建分类器,等等。
由上可知,本发明实施例网络设备可以先获取多个医学影像样本,对该医学影像样本中的病变特征进行分类,根据分类结果构建出该医学影像样本的提升树模型,得到第一分类器组,再采用该第一分类器组从该病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集,接着,利用该目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器,然后,基于该训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果;由于该方案可以先利用医学影像样本的特征训练第一分类器,再利用第一分类器筛选出能正确反映该病变的重要特征(即目标病变特征),然后使用该目标病变特征训练第二分类器,以提高第二分类器分类的准确率,确保医学影像中的信息可以被准确地检测出来;而利用在术前的CT影像,由计算机辅助自动提取反应肿瘤信息的大量特征,准确判定该生命体是否有MVI发生。整个判定过程都是计算机自动完成的,快速有效,无主观因素,增加了算法的可信度,且特征选择过程直接提取高准确率分类器的重要特征,即对MVI敏感的特征,不加入主观判断,增加了模型的鲁棒性。因此,本发明可以提高医生在术前对肝癌病人MVI发生状况的了解,对病人早期外科治疗方式、肝切除的术式选择、术中辅助治疗等方面进行指导,所以,相对于仅仅依靠人工对医学影像表象信息进行判断的分案而言,可以有效提高医学影像分类的准确性,提升判断效果,改善预后。
为了更好地实施以上方法,相应的,本发明实施例还提供一种医学影像的分类装置,该医学影像的分类装置具体可以集成在网络设备中,该网络设备可以是服务器,也可以是终端等设备。
例如,如图3所示,该医学影像的分类装置可以包括获取单元301、构建单元302、筛选单元303、训练单元304和检测单元305,如下:
(1)获取单元301;
获取单元301,用于获取多个医学影像样本。
例如,具体由各医学影像采集设备,比如电子计算机断层扫描仪、或核磁共振成像仪等来对生命体组织进行影像采集,由专业人员对影像进行标注,比如由影像科医师标注进而提供给该获取单元301,即,该获取单元301具体可以接收医学影像采集设备发送的医学影像样本。
(2)构建单元302;
构建单元302,用于对该医学影像样本中的病变特征进行分类,根据分类结果构建出该医学影像样本的提升树模型,得到第一分类器组。
可选的,在一些实施例中,该构建单元302可以包括提取子单元和构建子单元,如下:
提取子单元,用于在该医学影像样本中分割出病变区域样本,对该病变区域样本提取多维病变特征。
例如,提取子单元,具体用于在该医学影像样本中筛选出病变区域和近病变旁的组织区域,将该病变区域和近病变旁的组织区域进行扩展,得到扩展后区域,对该扩展后区域进行分割,得到病变区域样本,利用医学影像特征提取包对该病变区域样本提取从多方面(比如从影像类型、一阶统计量、形状信息、灰度共生矩阵、灰度游程矩阵、灰度区域大小矩阵、二维灰度差分矩阵、灰度相关矩阵等等)多维病变特征。
其中,影像类型可以从原始影像、小波滤波、高斯拉普拉斯滤波、平方、平方根、对数、以及指数等角度提取,一阶统计量可以从能量、熵、最小值、第10个百分点、第90个百分点、最大值、平均值、以及峰度等角度提取,形状信息可以从网格体积、体素体积、表面积、球形、最大三维直径、主轴长度、以及平面度等角度提取,灰度共生矩阵可以从自相关、联合平均、聚类趋势、对比度、相关性、差异熵、以及最大相关系数等角度提取,灰度游程矩阵可以从短游程因子、长游程因子、灰度不均匀性、游程总数百分比、灰度方差、以及低灰度游程因子等角度提取,灰度区域大小矩阵可以从小区域因子、大区域因子、区域百分比、灰度方差、以及低灰度区域因子等角度提取,二维灰度差分矩阵可以从粗糙性、对比度、繁忙度、复杂度、以及强度等角度提取,灰度相关矩阵可以从小依赖因子、大依赖因子、以及依赖方差等角度提取。
构建子单元,用于对该多维病变特征进行分类,根据分类结果构建出该医学影像样本的提升树模型,得到第一分类器组。
可选的,第一分类器组包括多个基分类器,该构建子单元,具体用于利用每个基分类器从该训练集中随机选择多个病变特征,将该多个病变特征进行分类,以构建出多个该医学影像样本的分类与回归树模型,组合多个分类与回归树模型,构建该医学影像样本的提升树模型,得到第一分类器组。
(3)筛选单元303;
筛选单元303,用于采用该第一分类器组从该病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集。
其中,预设条件的设定方式可以有很多种,比如,可以根据实际应用的需求灵活设置,也可以预先设置好存储在网络设备中。此外,预设条件可以内置于网络设备中,或者,也可以保存在存储器中并发送给网络设备,等等。其中,预设条件可以是在准确率最高的基分类器中出现频率最高的特征,也可以是在基分类器中重要性数值较大的特征,等等。其中,目标病变特征指的是最能反映病变本身特性的重要特征,目标病变特征集指的是多个目标病变特征的集合。
例如,筛选单元303具体可以对该第一分类器组中的多个基分类器进行交叉验证,得到每个基分类器的准确率,然后,选择该准确率大于预设阈值的多个基分类器进行组合,得到目标分类器,基于该目标分类器筛选出目标病变特征集。
可选的,为了更准确地筛选出目标病变特征,可以先统计基分类器准确率较高时所使用的病变特征,根据使用频率筛选得到目标病变特征,即:
统计该交叉验证中基分类器准确率大于预设阈值时所使用的病变特征,得到病变特征的使用频率,根据统计结果筛选出使用频率最高的多个病变特征,得到目标病变特征集。
(4)训练单元304;
训练单元304,用于利用该目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器。
可选的,在一些实施例中,该多个医学影像样本可以包括医学影像训练样本和医学影像验证样本,该训练单元可以包括训练子单元和验证子单元,如下:
训练子单元,用于利用该目标病变特征集构建预设第二分类器,采用该医学影像训练样本对该预设第二分类器进行训练,得到第二分类器;
验证子单元,用于采用医学影像验证样本对该第二分类器的准确性进行验证,若验证结果满足第二预设条件,则得到训练后第二分类器。
例如,具体可以将该多个医学影像样本分为医学影像训练样本和医学影像验证样本,首先利用该目标病变特征集构建预设第二分类器,采用该医学影像训练样本对该预设第二分类器进行训练,得到第二分类器,然后,采用医学影像验证样本对该第二分类器的准确性进行验证,若验证结果满足第二预设条件,则得到训练后第二分类器。
例如,具体可以使用筛选出来的重要特征(即目标病变特征)构建预设第二分类器,排除非重要特征对第二分类器构建产生的负面影响,然后调整分类器的参数,优化分类器,生成最终模型(即第二分类器)。由于第二分类器使用的是筛选出来的重要特征进行构建、训练以及参数调优,然后进行测试排除了其他非重要特征对分类器构建的干扰,可得到更好的结果(即更优化的分类器)。
(5)检测单元305
检测单元305,用于基于该训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果。例如,具体可以基于该训练后第二分类器对待分类的医学影像进行目标病变特征检测,根据检测结果对待分类的医学影像进行分类,得到分类结果。
可选的,在一些实施例中,该检测单元可以包括获取子单元、检测子单元和确定子单元,如下:
获取子单元,用于获取待分类的医学影像;
检测子单元,用于采用该训练后第二分类器对该医学影像进行目标病变特征检测;
确定子单元,用于若检测结果指示该医学影像存在目标病变特征,则确定该医学影像存在病变区域。
其中,待分类的医学影像指的是需要进行分类的医学影像,可以由各医学影像采集设备,比如电子计算机断层扫描仪或核磁共振成像仪等来对生命体组织进行影像采集,比如人体的脑部、肠胃、肝脏、心脏、喉咙和阴道等,进而提供给该医学影像检测装置,即,医学影像检测装置具体可以接收医学影像采集设备发送的待分类的医学影像。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
由上可知,本发明实施例先由获取单元301获取多个医学影像样本,由构建单元302对该医学影像样本中的病变特征进行分类,根据分类结果构建出该医学影像样本的提升树模型,得到第一分类器组,再由筛选单元303采用该第一分类器组从该病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集,接着,由训练单元304利用该目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器,然后,由检测单元305基于该训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果;由于该方案可以先利用医学影像样本的特征训练第一分类器,再利用第一分类器筛选出能正确反映该病变的重要特征(即目标病变特征),然后使用该目标病变特征训练第二分类器,以提高第二分类器分类的准确率,确保医学影像中的信息可以被准确地检测出来,所以,相对于仅仅依靠人工对医学影像表象信息进行判断的分案而言,可以有效提高医学影像分类的准确性。
此外,本发明实施例还提供一种网络设备,如图4所示,其示出了本发明实施例所涉及的网络设备的结构示意图,具体来讲:
该网络设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图4中示出的网络设备结构并不构成对网络设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该网络设备的控制中心,利用各种接口和线路连接整个网络设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行网络设备的各种功能和处理数据,从而对网络设备进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据网络设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
网络设备还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该网络设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,网络设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,网络设备中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
获取多个医学影像样本,对该医学影像样本中的病变特征进行分类,根据分类结果构建出该医学影像样本的提升树模型,得到第一分类器组,再采用该第一分类器组从该病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集,接着,利用该目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器,然后,基于该训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
由上可知,本发明实施例先获取多个医学影像样本,对该医学影像样本中的病变特征进行分类,根据分类结果构建出该医学影像样本的提升树模型,得到第一分类器组,再采用该第一分类器组从该病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集,接着,利用该目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器,然后,基于该训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果;由于该方案可以先利用医学影像样本的特征训练第一分类器,再利用第一分类器筛选出能正确反映该病变的重要特征(即目标病变特征),然后使用该目标病变特征训练第二分类器,以提高第二分类器分类的准确率,确保医学影像中的信息可以被准确地检测出来,所以,相对于仅仅依靠人工对医学影像表象信息进行判断的分案而言,可以有效提高医学影像分类的准确性。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本发明实施例还提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种医学影像的分类方法中的步骤。例如,该指令可以执行如下步骤:
获取多个医学影像样本,对该医学影像样本中的病变特征进行分类,根据分类结果构建出该医学影像样本的提升树模型,得到第一分类器组,再采用该第一分类器组从该病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集,接着,利用该目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器,然后,基于该训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果。
可选的,该预设的分类模型可以由多张包含目标对象的医学样本影像训练而成。具体可以由其他设备进行训练后,提供给该医学影像的分类装置,或者,也可以由该医学影像的分类装置自行进行训练;即处理器401也可以运行存储在存储器402中的应用程序,从而实现以下功能:
采集多张包含目标对象的医学样本影像作为训练数据集,根据该训练数据集对预设的分类模型进行训练,得到分类模型。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(Read Only Memory,ROM)、随机存取记忆体(Random Access Memory,RAM)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本发明实施例所提供的任一种医学影像的分类方法中的步骤,因此,可以实现本发明实施例所提供的任一种医学影像的分类方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本发明实施例所提供的一种医学影像的分类方法、装置和存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上该,本说明书内容不应理解为对本发明的限制。

Claims (15)

1.一种医学影像的分类方法,其特征在于,包括:
获取多个医学影像样本;
对所述医学影像样本中的病变特征进行分类,根据分类结果构建出所述医学影像样本的提升树模型,得到第一分类器组;
采用所述第一分类器组从所述病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集;
利用所述目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器;
基于所述训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述医学影像样本中的病变特征进行分类,根据分类结果构建出所述医学影像样本的提升树模型,得到第一分类器组,包括:
在所述医学影像样本中分割出病变区域样本,对所述病变区域样本提取多维病变特征;
对所述多维病变特征进行分类,根据分类结果构建出所述医学影像样本的提升树模型,得到第一分类器组。
3.根据权利要求2所述的方法,其特征在于,所述第一分类器组包括多个基分类器,所述对所述多维病变特征进行分类,根据分类结果构建出所述医学影像样本的提升树模型,得到第一分类器组,包括:
利用每个基分类器从所述多维病变特征中随机选择多个病变特征;
将所述多个病变特征进行分类,以构建出多个所述医学影像样本的分类与回归树模型;
组合多个分类与回归树模型,构建所述医学影像样本的提升树模型,得到第一分类器组。
4.根据权利要求3所述的方法,其特征在于,所述采用所述第一分类器组从所述病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集,包括:
对所述第一分类器组中的多个基分类器进行交叉验证,得到每个基分类器的准确率;
选择所述准确率大于预设阈值的多个基分类器进行组合,得到目标分类器;
基于所述目标分类器筛选出目标病变特征集。
5.根据权利要求4所述的方法,其特征在于,所述基于所述目标分类器筛选出目标病变特征集,包括:
统计所述交叉验证中基分类器准确率大于预设阈值时所使用的病变特征,得到病变特征的使用频率;
根据统计结果筛选出使用频率最高的多个病变特征,得到目标病变特征集。
6.根据权利要求2所述的方法,其特征在于,所述在所述医学影像样本中分割出病变区域样本,对所述病变区域样本提取多维病变特征,包括:
在所述医学影像样本中筛选出病变区域和近病变旁的组织区域;
将所述病变区域和近病变旁的组织区域进行扩展,得到扩展后区域;
对所述扩展后区域进行分割,得到病变区域样本;
利用医学影像特征提取包对所述病变区域样本提取多维病变特征。
7.根据权利要求1至6任一项所述的方法,其特征在于,将所述多个医学影像样本分为医学影像训练样本和医学影像验证样本,所述利用所述目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器,包括:
利用所述目标病变特征集构建预设第二分类器,采用所述医学影像训练样本对所述预设第二分类器进行训练,得到第二分类器;
采用医学影像验证样本对所述第二分类器的准确性进行验证,若验证结果满足第二预设条件,则得到训练后第二分类器。
8.根据权利要求1至6任一项所述的方法,其特征在于,所述基于所述训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果,包括:
获取待分类的医学影像;
采用所述训练后第二分类器对所述医学影像进行目标病变特征检测;
若检测结果指示所述医学影像存在目标病变特征,则确定所述医学影像存在病变区域。
9.一种医学影像的分类装置,其特征在于,包括:
获取单元,用于获取多个医学影像样本;
构建单元,用于对所述医学影像样本中的病变特征进行分类,根据分类结果构建出所述医学影像样本的提升树模型,得到第一分类器组;
筛选单元,用于采用所述第一分类器组从所述病变特征中筛选出满足第一预设条件的病变特征,得到目标病变特征集;
训练单元,用于利用所述目标病变特征集对预设的第二分类器进行训练,得到训练后第二分类器;
检测单元,用于基于所述训练后第二分类器对待分类的医学影像进行目标病变特征检测,得到分类结果。
10.根据权利要求9所述的装置,其特征在于,所述构建单元,包括:
提取子单元,用于在所述医学影像样本中分割出病变区域样本,对所述病变区域样本提取多维病变特征;
构建子单元,用于对所述多维病变特征进行分类,根据分类结果构建出所述医学影像样本的提升树模型,得到第一分类器组。
11.根据权利要求10所述的装置,其特征在于,
所述构建子单元,具体用于利用每个基分类器从所述多维病变特征中随机选择多个病变特征;将所述多个病变特征进行分类,以构建出多个所述医学影像样本的分类与回归树模型;组合多个分类与回归树模型,构建所述医学影像样本的提升树模型,得到第一分类器组。
12.根据权利要求10所述的装置,其特征在于,
所述提取子单元,具体用于在所述医学影像样本中筛选出病变区域和近病变旁的组织区域;将所述病变区域和近病变旁的组织区域进行扩展,得到扩展后区域;对所述扩展后区域进行分割,得到病变区域样本;利用医学影像特征提取包对所述病变区域样本提取多维病变特征。
13.根据权利要求9至12任一项所述的装置,其特征在于,所述将所述多个医学影像样本分为医学影像训练样本和医学影像验证样本,所述训练单元,包括:
训练子单元,用于利用所述目标病变特征集构建预设第二分类器,采用所述医学影像训练样本对所述预设第二分类器进行训练,得到第二分类器;
验证子单元,用于采用医学影像验证样本对所述第二分类器的准确性进行验证,若验证结果满足第二预设条件,则得到训练后第二分类器。
14.根据权利要求9至12任一项所述的装置,其特征在于,所述检测单元,包括:
获取子单元,用于获取待分类的医学影像;
检测子单元,用于采用所述训练后第二分类器对所述医学影像进行目标病变特征检测;
确定子单元,用于若检测结果指示所述医学影像存在目标病变特征,则确定所述医学影像存在病变区域。
15.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至8任一项所述的医学影像的分类方法中的步骤。
CN201910130011.4A 2019-02-21 2019-02-21 一种医学影像的分类方法、装置和存储介质 Pending CN109858562A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910130011.4A CN109858562A (zh) 2019-02-21 2019-02-21 一种医学影像的分类方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910130011.4A CN109858562A (zh) 2019-02-21 2019-02-21 一种医学影像的分类方法、装置和存储介质

Publications (1)

Publication Number Publication Date
CN109858562A true CN109858562A (zh) 2019-06-07

Family

ID=66898466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910130011.4A Pending CN109858562A (zh) 2019-02-21 2019-02-21 一种医学影像的分类方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN109858562A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110363240A (zh) * 2019-07-05 2019-10-22 安徽威奥曼机器人有限公司 一种医学影像分类方法与系统
CN110458360A (zh) * 2019-08-13 2019-11-15 腾讯科技(深圳)有限公司 热门资源的预测方法、装置、设备及存储介质
CN110647926A (zh) * 2019-09-17 2020-01-03 腾讯科技(深圳)有限公司 医学影像流识别方法、装置、电子设备和存储介质
CN110707682A (zh) * 2019-08-28 2020-01-17 广东工业大学 基于模糊c-均值聚类的微电网中水风光电源容量配置方法
CN110717550A (zh) * 2019-10-18 2020-01-21 山东大学 一种基于多模态图像缺失补全的分类方法
CN111126502A (zh) * 2019-12-26 2020-05-08 北京安德医智科技有限公司 一种面向人工智能辅助诊断的dicom医疗影像序列分类方法
CN111190613A (zh) * 2019-12-19 2020-05-22 北京市神经外科研究所 一种脑胶质瘤影像特征提取云服务在单机中的寄宿和部署方法
CN111583217A (zh) * 2020-04-30 2020-08-25 深圳开立生物医疗科技股份有限公司 一种肿瘤消融疗效预测方法、装置、设备及计算机介质
CN111951252A (zh) * 2020-08-17 2020-11-17 中国科学院苏州生物医学工程技术研究所 多时序图像处理方法、电子设备及存储介质
CN112420150A (zh) * 2020-12-02 2021-02-26 沈阳东软智能医疗科技研究院有限公司 医学影像报告的处理方法、装置、存储介质及电子设备
TWI726459B (zh) * 2019-10-25 2021-05-01 中國醫藥大學附設醫院 遷移學習輔助預測系統、方法及電腦程式產品
CN112883962A (zh) * 2021-01-29 2021-06-01 北京百度网讯科技有限公司 眼底图像识别方法、装置、设备、存储介质以及程序产品
CN113077417A (zh) * 2021-03-16 2021-07-06 中国人民解放军总医院第一医学中心 用于肝细胞癌微血管侵犯预测的方法及系统
CN113287805A (zh) * 2021-05-27 2021-08-24 郑州大学 一种跌倒防护方法及可穿戴式跌倒防护装置
CN115795318A (zh) * 2022-11-17 2023-03-14 北京白龙马云行科技有限公司 用例对象的归类方法、模型训练方法、设备和存储介质
CN113744801B (zh) * 2021-09-09 2023-05-26 首都医科大学附属北京天坛医院 肿瘤类别的确定方法、装置、系统、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105931224A (zh) * 2016-04-14 2016-09-07 浙江大学 基于随机森林算法的肝脏平扫ct图像病变识别方法
CN109166105A (zh) * 2018-08-01 2019-01-08 中国人民解放军南京军区南京总医院 人工智能医学影像的肿瘤恶性风险分层辅助诊断系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105931224A (zh) * 2016-04-14 2016-09-07 浙江大学 基于随机森林算法的肝脏平扫ct图像病变识别方法
CN109166105A (zh) * 2018-08-01 2019-01-08 中国人民解放军南京军区南京总医院 人工智能医学影像的肿瘤恶性风险分层辅助诊断系统

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110363240A (zh) * 2019-07-05 2019-10-22 安徽威奥曼机器人有限公司 一种医学影像分类方法与系统
CN110458360A (zh) * 2019-08-13 2019-11-15 腾讯科技(深圳)有限公司 热门资源的预测方法、装置、设备及存储介质
CN110458360B (zh) * 2019-08-13 2023-07-18 腾讯科技(深圳)有限公司 热门资源的预测方法、装置、设备及存储介质
CN110707682A (zh) * 2019-08-28 2020-01-17 广东工业大学 基于模糊c-均值聚类的微电网中水风光电源容量配置方法
CN110707682B (zh) * 2019-08-28 2022-11-04 广东工业大学 基于模糊c-均值聚类的微电网中水风光电源容量配置方法
CN110647926A (zh) * 2019-09-17 2020-01-03 腾讯科技(深圳)有限公司 医学影像流识别方法、装置、电子设备和存储介质
CN110717550A (zh) * 2019-10-18 2020-01-21 山东大学 一种基于多模态图像缺失补全的分类方法
TWI726459B (zh) * 2019-10-25 2021-05-01 中國醫藥大學附設醫院 遷移學習輔助預測系統、方法及電腦程式產品
CN111190613A (zh) * 2019-12-19 2020-05-22 北京市神经外科研究所 一种脑胶质瘤影像特征提取云服务在单机中的寄宿和部署方法
CN111126502A (zh) * 2019-12-26 2020-05-08 北京安德医智科技有限公司 一种面向人工智能辅助诊断的dicom医疗影像序列分类方法
CN111583217A (zh) * 2020-04-30 2020-08-25 深圳开立生物医疗科技股份有限公司 一种肿瘤消融疗效预测方法、装置、设备及计算机介质
CN111951252A (zh) * 2020-08-17 2020-11-17 中国科学院苏州生物医学工程技术研究所 多时序图像处理方法、电子设备及存储介质
CN111951252B (zh) * 2020-08-17 2024-01-23 中国科学院苏州生物医学工程技术研究所 多时序图像处理方法、电子设备及存储介质
CN112420150A (zh) * 2020-12-02 2021-02-26 沈阳东软智能医疗科技研究院有限公司 医学影像报告的处理方法、装置、存储介质及电子设备
CN112420150B (zh) * 2020-12-02 2023-11-14 沈阳东软智能医疗科技研究院有限公司 医学影像报告的处理方法、装置、存储介质及电子设备
CN112883962A (zh) * 2021-01-29 2021-06-01 北京百度网讯科技有限公司 眼底图像识别方法、装置、设备、存储介质以及程序产品
CN112883962B (zh) * 2021-01-29 2023-07-18 北京百度网讯科技有限公司 眼底图像识别方法、装置、设备、存储介质以及程序产品
CN113077417A (zh) * 2021-03-16 2021-07-06 中国人民解放军总医院第一医学中心 用于肝细胞癌微血管侵犯预测的方法及系统
CN113287805A (zh) * 2021-05-27 2021-08-24 郑州大学 一种跌倒防护方法及可穿戴式跌倒防护装置
CN113744801B (zh) * 2021-09-09 2023-05-26 首都医科大学附属北京天坛医院 肿瘤类别的确定方法、装置、系统、电子设备及存储介质
CN115795318A (zh) * 2022-11-17 2023-03-14 北京白龙马云行科技有限公司 用例对象的归类方法、模型训练方法、设备和存储介质

Similar Documents

Publication Publication Date Title
CN109858562A (zh) 一种医学影像的分类方法、装置和存储介质
Vankdothu et al. Brain tumor segmentation of MR images using SVM and fuzzy classifier in machine learning
US10734107B2 (en) Image search device, image search method, and image search program
US11227391B2 (en) Image processing apparatus, medical image diagnostic apparatus, and program
US7599542B2 (en) System and method for detection and display of diseases and abnormalities using confidence imaging
WO2017092615A1 (zh) 一种计算机辅助诊断系统及方法
US8934695B2 (en) Similar case searching apparatus and similar case searching method
US8111896B2 (en) Method and system for automatic recognition of preneoplastic anomalies in anatomic structures based on an improved region-growing segmentation, and commputer program therefor
Hassanzadeh et al. Convolutional neural networks for prostate magnetic resonance image segmentation
RU2513905C2 (ru) Классификация изображения на основе сегментации изображения
JP7170747B2 (ja) 類似度決定装置、方法およびプログラム
US20230112591A1 (en) Machine learning based medical data checker
JP6914233B2 (ja) 類似度決定装置、方法およびプログラム
Rattan et al. An optimized lung cancer classification system for computed tomography images
CN112638262A (zh) 相似度确定装置、方法及程序
Singh MRI Brain Tumor Segmentation using Cuckoo Optimization and Ensemble CNNs
Ben Ammar et al. Harnessing Deep Learning for Early Breast Cancer Diagnosis: A Review of Datasets, Methods, Challenges, and Future Directions
EP4202827A1 (en) System and method for classifying lesions
Al-Kadi Tumour grading and discrimination based on class assignment and quantitative texture analysis techniques
Wijerathna et al. Brain Tumor Detection Using Image Processing
Khasawneh et al. [Retracted] Early Detection of Medical Image Analysis by Using Machine Learning Method
Nogueira Creating evaluation functions for oncological diseases based on pet/ct
Kouzani et al. Lung nodules detection by ensemble classification
WO2023117740A1 (en) System and method for classifying lesions
Muniandi et al. An Emperical Way to Diagnose the Cancer Stages Using Algorithm in AI System

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination