CN117649400A - 一种异常检测框架下的影像组学分析方法及系统 - Google Patents

一种异常检测框架下的影像组学分析方法及系统 Download PDF

Info

Publication number
CN117649400A
CN117649400A CN202410103861.6A CN202410103861A CN117649400A CN 117649400 A CN117649400 A CN 117649400A CN 202410103861 A CN202410103861 A CN 202410103861A CN 117649400 A CN117649400 A CN 117649400A
Authority
CN
China
Prior art keywords
boundary
image
medical image
reconstruction error
density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410103861.6A
Other languages
English (en)
Other versions
CN117649400B (zh
Inventor
简俊明
张云
黄玉玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi Cancer Hospital Jiangxi Second People's Hospital Jiangxi Cancer Center
Original Assignee
Jiangxi Cancer Hospital Jiangxi Second People's Hospital Jiangxi Cancer Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxi Cancer Hospital Jiangxi Second People's Hospital Jiangxi Cancer Center filed Critical Jiangxi Cancer Hospital Jiangxi Second People's Hospital Jiangxi Cancer Center
Priority to CN202410103861.6A priority Critical patent/CN117649400B/zh
Publication of CN117649400A publication Critical patent/CN117649400A/zh
Application granted granted Critical
Publication of CN117649400B publication Critical patent/CN117649400B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供了一种异常检测框架下的影像组学分析方法及系统,该方法通过对为阴性样本的医学影像进行预处理后,勾画出肿瘤病灶靶区,并提取影像特征,将影像特征输入自编码器中,输出对应的重构影像特征,并根据影像特征和重构影像特征,计算第一重构误差,将第一重构误差作为损失函数,对自编码器的参数进行迭代优化,随后根据同时包含阳性样本和阴性样本的验证集的医学影像,再次计算第二重构误差,并确定异常分数,根据最大化约登指数,确定阈值,最后根据待测医学影像,再次计算第三重构误差,并判断第三重构误差是否大于阈值,若是,则判定为阳性,本方法可以仅使用阴性样本进行训练,可有效降低对训练数据的需求。

Description

一种异常检测框架下的影像组学分析方法及系统
技术领域
本发明属于影像组学分析技术领域,特别涉及一种异常检测框架下的影像组学分析方法及系统。
背景技术
影像组学技术近年来飞速发展,在肿瘤相关的诊断和预后预测等领域展现出极大的价值。影像组学技术主要分为图像预处理、特征提取及模型构建三个部分。传统影像组学技术在模型构建时通常对阴性和阳性样本的比例有一定要求。
有研究表明,不平衡的样本会显著降低模型的性能,甚至使得模型完全失效。然而,样本不均衡在肿瘤相关的研究中是一个极其常见的问题。例如,在肺癌亚型鉴别中非小细胞肺癌(NSCLC)的样本数量远多于小细胞肺癌(SCLC)的样本数量,原发性肝癌中肝细胞癌(HCC)的样本数量远多于其他亚型的样本数量。过去,研究人员通常选择丢弃一部分阴性(在本文中表示数量多的那一类)样本,以维持阴性和阳性样本比例的均衡,这种做法在无形中放弃了大量具有宝贵价值的影像资料,并不是最佳选择。
发明内容
基于此,本发明实施例当中提供了一种异常检测框架下的影像组学分析方法及系统,仅使用阴性样本对模型进行训练,可有效降低对训练数据的需求。
本发明实施例的第一方面提供了一种异常检测框架下的影像组学分析方法,所述方法包括:
步骤一,获取历史医学影像,其中,所述历史医学影像均为阴性样本;
步骤二,对所述历史医学影像采用Z-Score方法进行预处理,将预处理后的历史医学影像中的肿瘤病灶靶区勾画出,并提取肿瘤病灶靶区的影像特征,其中,影像特征包括形状特征、一阶特征以及纹理特征;
步骤三,利用全连接层构建自编码器,其中,每个全连接层后均使用ReLU作为激活函数;
步骤四,将从肿瘤病灶靶区提取到的影像特征输入所述自编码器中,输出对应的重构影像特征,并根据所述影像特征和所述重构影像特征,计算第一重构误差;
步骤五,将所述第一重构误差作为损失函数,利用反向传播算法和随机梯度下降方法,对所述自编码器的参数进行迭代优化;
步骤六,获取验证集的医学影像,将验证集的医学影像重复步骤二和步骤四,得到第二重构误差,并将所述第二重构误差定义为异常分数,其中,验证集的医学影像同时包含阳性样本和阴性样本;
步骤七,根据最大化约登指数和所述异常分数,确定阈值;
步骤八,获取待测医学影像,并将待测医学影像重复步骤二和步骤四,得到第三重构误差,并判断所述第三重构误差是否大于所述阈值;
步骤九,若是,则将对应的待测医学影像判定为阳性;若否,则将对应的待测医学影像判定为阴性。
进一步的,重构误差的计算表达式为:
其中,表示为重构误差,n表示为影像特征总数,/>表示为第i个输入的影像特征,/>表示为第i个输出的重构影像特征。
进一步的,所述将所述第一重构误差作为损失函数,利用反向传播算法和随机梯度下降方法,对所述自编码器的参数进行迭代优化的步骤中,迭代优化的计算表达式为:
其中,θ为待更新参数,α为学习率,J为损失函数,表示为J对θ的偏导数。
进一步的,所述根据最大化约登指数和所述异常分数,确定阈值的计算表达式为:
其中,表示为验证集所有患者的标签,/>表示为验证集所有患者的预测值。
进一步的,所述对所述历史医学影像采用Z-Score方法进行预处理,将预处理后的历史医学影像中的肿瘤病灶靶区勾画出,并提取肿瘤病灶靶区的影像特征的步骤包括:
对所述历史医学影像采用Z-Score方法进行预处理,并选取预处理后的历史医学影像中任意位置的预设尺寸的非肿瘤病灶靶区;
计算选取出的非肿瘤病灶靶区的组织影密度,并定义为标准密度;
圈定预处理后的历史医学影像中肿瘤病灶靶区的外围,得到第一边界;
勾画预处理后的历史医学影像中肿瘤病灶靶区的内围,得到第二边界;
计算所述第一边界和所述第二边界之间区域的组织影密度,并判断所述第一边界和所述第二边界之间区域的组织影密度与所述标准密度的差值是否达到第一预设范围;
若否,则控制所述第二边界朝所述第一边界扩张,并实时计算扩张后的第二边界与第一边界之间区域的组织影密度,直至与所述标准密度的差值达到第一预设范围。
进一步的,所述计算选取出的非肿瘤病灶靶区的组织影密度,并定义为标准密度的步骤包括:
获取所述非肿瘤病灶靶区中所有像素点的灰度值,并统计灰度值大于阈值的像素点的个数;
获取预设尺寸的非肿瘤病灶靶区的像素点总数,并将灰度值大于阈值的像素点的个数除以预设尺寸的非肿瘤病灶靶区的像素点总数,得到选取出的非肿瘤病灶靶区的组织影密度,并定义为标准密度。
进一步的,所述控制所述第二边界朝所述第一边界扩张,并实时计算扩张后的第二边界与第一边界之间区域的组织影密度,直至与所述标准密度的差值达到第一预设范围的步骤包括:
控制所述第二边界以预设步进,等比例的朝所述第一边界扩张,并实时计算扩张后的第二边界与第一边界之间区域的组织影密度;
判断扩张后的第二边界与第一边界之间区域的组织影密度与所述标准密度的差值是否达到第一预设范围;
若是,则控制所述第二边界以预设步进,等比例的朝所述第一边界再次扩张,并计算再次扩张后的第二边界与第一边界之间区域的组织影密度;
判断再次扩张后的第二边界与第一边界之间区域的组织影密度与所述标准密度的差值是否达到第一预设范围;
若是,则判断再次扩张后的第二边界与第一边界之间区域的组织影密度与上一次扩张后的第二边界与第一边界之间区域的组织影密度的差值是否在第二预设范围内;
若是,则确定上一次扩张后的第二边界为肿瘤病灶靶区的目标边界。
本发明实施例的第二方面提供了一种异常检测框架下的影像组学分析系统,所述系统包括:
第一获取模块,用于获取历史医学影像,其中,所述历史医学影像均为阴性样本;
勾画模块,用于对所述历史医学影像采用Z-Score方法进行预处理,将预处理后的历史医学影像中的肿瘤病灶靶区勾画出,并提取肿瘤病灶靶区的影像特征,其中,影像特征包括形状特征、一阶特征以及纹理特征;
自编码器构建模块,用于利用全连接层构建自编码器,其中,每个全连接层后均使用ReLU作为激活函数;
第一计算模块,用于将从肿瘤病灶靶区提取到的影像特征输入所述自编码器中,输出对应的重构影像特征,并根据所述影像特征和所述重构影像特征,计算第一重构误差;
优化模块,用于将所述第一重构误差作为损失函数,利用反向传播算法和随机梯度下降方法,对所述自编码器的参数进行迭代优化;
异常分数定义模块,用于获取验证集的医学影像,将验证集的医学影像重复勾画模块和第一计算模块的步骤,得到第二重构误差,并将所述第二重构误差定义为异常分数,其中,验证集的医学影像同时包含阳性样本和阴性样本;
阈值确定模块,用于根据最大化约登指数和所述异常分数,确定阈值;
第一判断模块,用于获取待测医学影像,并将待测医学影像重复勾画模块和第一计算模块的步骤,得到第三重构误差,并判断所述第三重构误差是否大于所述阈值;
判定模块,用于当判断所述第三重构误差大于所述阈值时,则将对应的待测医学影像判定为阳性;当判断所述第三重构误差不大于所述阈值时,则将对应的待测医学影像判定为阴性。
本发明实施例的第三方面提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面提供的异常检测框架下的影像组学分析方法。
本发明实施例的第四方面提供了一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面提供的异常检测框架下的影像组学分析方法。
本发明实施例当中提供的一种异常检测框架下的影像组学分析方法及系统,该方法通过对为阴性样本的医学影像采用Z-Score方法进行预处理后,勾画出肿瘤病灶靶区,并提取影像特征,将影像特征输入自编码器中,输出对应的重构影像特征,并根据影像特征和重构影像特征,计算第一重构误差,将第一重构误差作为损失函数,对自编码器的参数进行迭代优化,随后获取同时包含阳性样本和阴性样本的验证集的医学影像,再次计算第二重构误差,并确定异常分数,根据最大化约登指数和所述异常分数,确定阈值,最后获取待测医学影像,再次计算第三重构误差,并判断第三重构误差是否大于阈值,若是,则将对应的待测医学影像判定为阳性,若否,则将对应的待测医学影像判定为阴性,本方法可以仅使用阴性样本进行训练,可有效降低对训练数据的需求。
附图说明
图1为本发明实施例一提供的一种异常检测框架下的影像组学分析方法的实现流程图;
图2为本发明实施例二提供的不同规格的模型性能示意图;
图3为本发明实施例三提供的一种异常检测框架下的影像组学分析系统的结构框图;
图4为本发明实施例四提供的一种电子设备的结构框图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
实施例一
请参阅图1,图1示出了本发明实施例一提供的一种异常检测框架下的影像组学分析方法的实现流程图,异常检测框架下的影像组学分析方法具体包括步骤一至步骤九。
步骤一,获取历史医学影像,其中,所述历史医学影像均为阴性样本。
在本实施例当中,历史医学影像为MRI(磁共振成像)数据,具体的,该历史医学影像为癌症亚型的医学影像,阴性样本指的是样本量明显偏高的那一类样本,而阳性样本指的是样本量明显偏少的那一类样本,需要说明的是,阴性样本和阳性样本均具有肿瘤病灶。
步骤二,对所述历史医学影像采用Z-Score方法进行预处理,将预处理后的历史医学影像中的肿瘤病灶靶区勾画出,并提取肿瘤病灶靶区的影像特征,其中,影像特征包括形状特征、一阶特征以及纹理特征。
具体的,由于医学影像为灰度图,首先将历史医学影像调节为预设对比度,然后采用Z-Score方法进行预处理,需要说明的是,由于不同的图像可能存在亮度的整体漂移或存在一些异常值,导致使用最大-最小值标准化的时候对噪声和均值的偏移较为敏感。使用Z-Score标准化则可减少异常噪声对归一化的影响,Z-Score标准化将原图像减去图像的均值,再除以图像的标准差,以获得具有0均值和1倍标准差的图像。
进一步的,选取预处理后的历史医学影像中任意位置的预设尺寸的非肿瘤病灶靶区;计算选取出的非肿瘤病灶靶区的组织影密度,并定义为标准密度,具体的,首先获取非肿瘤病灶靶区中所有像素点的灰度值,并统计灰度值大于阈值的像素点的个数,再获取预设尺寸的非肿瘤病灶靶区的像素点总数,可以理解的,尺寸是确定的,对应的像素点总数也是确定的,并将灰度值大于阈值的像素点的个数除以预设尺寸的非肿瘤病灶靶区的像素点总数,得到选取出的非肿瘤病灶靶区的组织影密度,并定义为标准密度;圈定预处理后的历史医学影像中肿瘤病灶靶区的外围,得到第一边界,需要说明的是,第一边界的圈定相当于粗筛,即圈定一个大致的区域,该区域中包含有肿瘤病灶靶区,其中,第一边界为规则形状,例如,矩形、圆形等,需要说明的是,圈定第一边界时,应避免第一边界与其它肿瘤病灶靶区干涉。
更进一步的,勾画预处理后的历史医学影像中肿瘤病灶靶区的内围,得到第二边界,其中,可以采用Medical Imaging Interaction Toolkit (MITK)软件对肿瘤病灶靶区进行手工勾画,如有多个序列,则分别在各个序列上进行靶区勾画,具体的,单击鼠标连续在肿瘤病灶靶区的内边缘勾画,在本实施例当中,相邻两点之间的线段是固定的,以在一定程度上保证勾画的准确度;计算第一边界和第二边界之间区域的组织影密度,可以理解的,第一边界和第二边界之间区域的组织影密度的计算方法与上述一致,并判断第一边界和第二边界之间区域的组织影密度与标准密度的差值是否达到第一预设范围;若否,则控制第二边界朝第一边界扩张,并实时计算扩张后的第二边界与第一边界之间区域的组织影密度,直至与标准密度的差值达到第一预设范围。
具体的,控制第二边界朝第一边界扩张,并实时计算扩张后的第二边界与第一边界之间区域的组织影密度,直至与标准密度的差值达到第一预设范围的步骤包括:
控制第二边界以预设步进,等比例的朝第一边界扩张,并实时计算扩张后的第二边界与第一边界之间区域的组织影密度;
判断扩张后的第二边界与第一边界之间区域的组织影密度与标准密度的差值是否达到第一预设范围;
若是,则控制第二边界以预设步进,等比例的朝第一边界再次扩张,并计算再次扩张后的第二边界与第一边界之间区域的组织影密度;
判断再次扩张后的第二边界与第一边界之间区域的组织影密度与标准密度的差值是否达到第一预设范围;
若是,则判断再次扩张后的第二边界与第一边界之间区域的组织影密度与上一次扩张后的第二边界与第一边界之间区域的组织影密度的差值是否在第二预设范围内;
若是,则确定上一次扩张后的第二边界为肿瘤病灶靶区的目标边界,其中,目标边界围合成的区域即为肿瘤病灶靶区,用于后续的影像特征提取。
需要说明的是,影像特征包括形状特征、一阶特征以及纹理特征,其中,形状特征用于定量描述感兴趣区的几何特性,包括体素体积、表面积体积比、表面积、球度、最小轴长度、网格体积、最大3D直径、最大2D直径(x方向)、最大2D直径(y方向)、最大2D直径(z方向)、长轴长度、短轴长度、伸长率、平整度等。一阶特征主要反应所测体素的对称性、均匀性以及局部强度分布变化,包括能量、总能量、熵、最小值、第10分位数、第90分位数、最大值、均值、中位数、四分位距离、极差、平均绝对误差、均方根误差、标准差、偏度、峰度、方差、均匀度等。纹理特征反映图像体素灰度之间的空间排列关系,主要包括灰度共生矩阵、灰度区域大小矩阵、灰度游程长度矩阵、邻域灰度差矩阵、灰度相关矩阵等。
步骤三,利用全连接层构建自编码器,其中,每个全连接层后均使用ReLU作为激活函数。
具体的,可以使用Python语言和Pytorch工具包,利用全连接层构建自编码器。
步骤四,将从肿瘤病灶靶区提取到的影像特征输入所述自编码器中,输出对应的重构影像特征,并根据所述影像特征和所述重构影像特征,计算第一重构误差。
在本实施例当中,重构误差的计算表达式为:
其中,表示为重构误差,n表示为影像特征总数,/>表示为第i个输入的影像特征,/>表示为第i个输出的重构影像特征。
步骤五,将所述第一重构误差作为损失函数,利用反向传播算法和随机梯度下降方法,对所述自编码器的参数进行迭代优化。
具体的,迭代优化的计算表达式为:
其中,θ为待更新参数,α为学习率,J为损失函数,表示为J对θ的偏导数。
需要说明的是,后续的验证集的医学影像和待测医学影像的操作,都是基于参数迭代优化后的自编码器进行的。
步骤六,获取验证集的医学影像,将验证集的医学影像重复步骤二和步骤四,得到第二重构误差,并将所述第二重构误差定义为异常分数,其中,验证集的医学影像同时包含阳性样本和阴性样本。
步骤七,根据最大化约登指数和所述异常分数,确定阈值。
具体的,该计算表达式为:
其中,表示为验证集所有患者的标签(阴性为0,阳性为1),/>表示为验证集所有患者的预测值。当患者的异常分数大于s时,预测值为1,反之则为0。
步骤八,获取待测医学影像,并将待测医学影像重复步骤二和步骤四,得到第三重构误差,并判断所述第三重构误差是否大于所述阈值。
步骤九,若是,则将对应的待测医学影像判定为阳性;若否,则将对应的待测医学影像判定为阴性。
综上,本发明上述实施例当中的异常检测框架下的影像组学分析方法,通过对为阴性样本的医学影像采用Z-Score方法进行预处理后,勾画出肿瘤病灶靶区,并提取影像特征,将影像特征输入自编码器中,输出对应的重构影像特征,并根据影像特征和重构影像特征,计算第一重构误差,将第一重构误差作为损失函数,对自编码器的参数进行迭代优化,随后获取同时包含阳性样本和阴性样本的验证集的医学影像,再次计算第二重构误差,并确定异常分数,根据最大化约登指数和所述异常分数,确定阈值,最后获取待测医学影像,再次计算第三重构误差,并判断第三重构误差是否大于阈值,若是,则将对应的待测医学影像判定为阳性,若否,则将对应的待测医学影像判定为阴性,本方法可以仅使用阴性样本进行训练,可有效降低对训练数据的需求。
实施例二
请参阅图2,图2是本发明实施例二提供的不同规格的模型性能示意图,其中,为了验证本发明实施例一中的异常检测框架下的影像组学分析方法的可行性,在本发明实施例二中,从UCSF-PDGM (University of California San Francisco Preoperative DiffuseGlioma MRI)数据集中获取495例脑胶质瘤患者的多参数MRI数据,其中包含IDH(isocitrate dehydrogenase,异柠檬酸脱氢酶)突变患者103例,IDH野生型患者392例。多参数MRI包含四个序列:分别为fluid-attenuated inversion recovery imaging (FLAIR,液体衰减反转恢复序列),T1-weighted imaging (T1序列),T1-weighted contrast-enhanced imaging (T1对比增强序列) and T2-weighted imaging (T2序列)。
利用分层随机抽样,将25%(n=124)的患者划分为验证集,用于模型验证。将剩下的患者中所有IDH野生型(n=294)挑选出来,用于模型训练。
构建的自编码器有四个规格,分别为:S(128-32-8-32-128)、M(128-64-20-8-20-64-128)、L(128-64-36-18-10-18-36-64-128)、XL(128-96-64-36-18-10-18-36-64-96-128),具体的,S规格指的是构建的自编码器具有五个全连接层,各全连接层的神经元数量依次为128个、32个、8个、32个及128个,M规格指的是构建的自编码器具有七个全连接层,各全连接层的神经元数量依次为128个、64个、20个、8个、20个、64个及128个,L规格指的是构建的自编码器具有九个全连接层,各全连接层的神经元数量依次为128个、64个、36个、18个、10个、18个、36个、64个及128个,XL规格指的是构建的自编码器具有十一个全连接层,各全连接层的神经元数量依次为128个、96个、64个、36个、18个、10个、18个、36个、64个、96个及128个。
需要说明的是,AUC(Area Under the Curve)为受试者工作特征曲线下面积,用于衡量学习器优劣的一种性能指标,G-mean为几何均值,由图2所示,规格S的模型AUC为0.7814,G-mean为0.7263,精度为0.6855。规格M的模型AUC为0.8018,G-mean为0.7359,精度为0.7177。规格L的模型AUC为0.7661,G-mean为0.6863,精度为0.5968。规格XL的模型AUC为0.7645,G-mean为0.7090,精度为0.6613。
实施例三
请参阅图3,图3是本发明实施例三提供的一种异常检测框架下的影像组学分析系统200的结构框图,该异常检测框架下的影像组学分析系统200包括:第一获取模块21、勾画模块22、自编码器构建模块23、第一计算模块24、优化模块25、异常分数定义模块26、阈值确定模块27、第一判断模块28以及判定模块29,其中:
第一获取模块21,用于获取历史医学影像,其中,所述历史医学影像均为阴性样本;
勾画模块22,用于对所述历史医学影像采用Z-Score方法进行预处理,将预处理后的历史医学影像中的肿瘤病灶靶区勾画出,并提取肿瘤病灶靶区的影像特征,其中,影像特征包括形状特征、一阶特征以及纹理特征;
自编码器构建模块23,用于利用全连接层构建自编码器,其中,每个全连接层后均使用ReLU作为激活函数;
第一计算模块24,用于将从肿瘤病灶靶区提取到的影像特征输入所述自编码器中,输出对应的重构影像特征,并根据所述影像特征和所述重构影像特征,计算第一重构误差,其中,重构误差的计算表达式为:
其中,表示为重构误差,n表示为影像特征总数,/>表示为第i个输入的影像特征,/>表示为第i个输出的重构影像特征;
优化模块25,用于将所述第一重构误差作为损失函数,利用反向传播算法和随机梯度下降方法,对所述自编码器的参数进行迭代优化,其中,迭代优化的计算表达式为:
其中,θ为待更新参数,α为学习率,J为损失函数,表示为J对θ的偏导数。
异常分数定义模块26,用于获取验证集的医学影像,将验证集的医学影像重复勾画模块和第一计算模块的步骤,得到第二重构误差,并将所述第二重构误差定义为异常分数,其中,验证集的医学影像同时包含阳性样本和阴性样本;
阈值确定模块27,用于根据最大化约登指数和所述异常分数,确定阈值,其中,该计算表达式为:
其中,表示为验证集所有患者的标签,/>表示为验证集所有患者的预测值。
第一判断模块28,用于获取待测医学影像,并将待测医学影像重复勾画模块和第一计算模块的步骤,得到第三重构误差,并判断所述第三重构误差是否大于所述阈值;
判定模块29,用于当判断所述第三重构误差大于所述阈值时,则将对应的待测医学影像判定为阳性;当判断所述第三重构误差不大于所述阈值时,则将对应的待测医学影像判定为阴性。
进一步的,在本发明一些可选实施例当中,所述勾画模块22包括:
选取单元,用于对所述历史医学影像采用Z-Score方法进行预处理,并选取预处理后的历史医学影像中任意位置的预设尺寸的非肿瘤病灶靶区;
组织影密度计算单元,用于计算选取出的非肿瘤病灶靶区的组织影密度,并定义为标准密度;
第一边界确定单元,用于圈定预处理后的历史医学影像中肿瘤病灶靶区的外围,得到第一边界;
第二边界确定单元,用于勾画预处理后的历史医学影像中肿瘤病灶靶区的内围,得到第二边界;
第一判断单元,用于计算所述第一边界和所述第二边界之间区域的组织影密度,并判断所述第一边界和所述第二边界之间区域的组织影密度与所述标准密度的差值是否达到第一预设范围;
扩张单元,用于当判断所述第一边界和所述第二边界之间区域的组织影密度与所述标准密度的差值未达到第一预设范围时,则控制所述第二边界朝所述第一边界扩张,并实时计算扩张后的第二边界与第一边界之间区域的组织影密度,直至与所述标准密度的差值达到第一预设范围。
进一步的,在本发明一些可选实施例当中,所述组织影密度计算单元包括:
统计子单元,用于获取所述非肿瘤病灶靶区中所有像素点的灰度值,并统计灰度值大于阈值的像素点的个数;
计算子单元,用于获取预设尺寸的非肿瘤病灶靶区的像素点总数,并将灰度值大于阈值的像素点的个数除以预设尺寸的非肿瘤病灶靶区的像素点总数,得到选取出的非肿瘤病灶靶区的组织影密度,并定义为标准密度。
进一步的,在本发明一些可选实施例当中,所述扩张单元包括:
第一控制子单元,用于控制所述第二边界以预设步进,等比例的朝所述第一边界扩张,并实时计算扩张后的第二边界与第一边界之间区域的组织影密度;
第一判断子单元,用于判断扩张后的第二边界与第一边界之间区域的组织影密度与所述标准密度的差值是否达到第一预设范围;
第二控制子单元,用于当判断扩张后的第二边界与第一边界之间区域的组织影密度与所述标准密度的差值达到第一预设范围时,则控制所述第二边界以预设步进,等比例的朝所述第一边界再次扩张,并计算再次扩张后的第二边界与第一边界之间区域的组织影密度;
第二判断子单元,用于判断再次扩张后的第二边界与第一边界之间区域的组织影密度与所述标准密度的差值是否达到第一预设范围;
第三判断子单元,用于当判断再次扩张后的第二边界与第一边界之间区域的组织影密度与所述标准密度的差值达到第一预设范围时,则判断再次扩张后的第二边界与第一边界之间区域的组织影密度与上一次扩张后的第二边界与第一边界之间区域的组织影密度的差值是否在第二预设范围内;
目标边界确定子单元,用于当判断再次扩张后的第二边界与第一边界之间区域的组织影密度与上一次扩张后的第二边界与第一边界之间区域的组织影密度的差值在第二预设范围内时,则确定上一次扩张后的第二边界为肿瘤病灶靶区的目标边界。
实施例四
本发明另一方面还提出一种电子设备,请参阅图4,所示为本发明实施例四当中的电子设备,包括存储器20、处理器10以及存储在存储器上并可在处理器上运行的计算机程序30,所述处理器10执行所述计算机程序30时实现如上述的异常检测框架下的影像组学分析方法。
其中,处理器10在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器20中存储的程序代码或处理数据,例如执行访问限制程序等。
其中,存储器20至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器20在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的硬盘。存储器20在另一些实施例中也可以是电子设备的外部存储装置,例如电子设备上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(FlashCard)等。进一步地,存储器20还可以既包括电子设备的内部存储单元也包括外部存储装置。存储器20不仅可以用于存储电子设备的应用软件及各类数据,还可以用于暂时地存储已经输出或者将要输出的数据。
需要指出的是,图4示出的结构并不构成对电子设备的限定,在其它实施例当中,该电子设备可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
本发明实施例还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的异常检测框架下的影像组学分析方法。
本领域技术人员可以理解,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种异常检测框架下的影像组学分析方法,其特征在于,所述方法包括:
步骤一,获取历史医学影像,其中,所述历史医学影像均为阴性样本;
步骤二,对所述历史医学影像采用Z-Score方法进行预处理,将预处理后的历史医学影像中的肿瘤病灶靶区勾画出,并提取肿瘤病灶靶区的影像特征,其中,影像特征包括形状特征、一阶特征以及纹理特征;
步骤三,利用全连接层构建自编码器,其中,每个全连接层后均使用ReLU作为激活函数;
步骤四,将从肿瘤病灶靶区提取到的影像特征输入所述自编码器中,输出对应的重构影像特征,并根据所述影像特征和所述重构影像特征,计算第一重构误差;
步骤五,将所述第一重构误差作为损失函数,利用反向传播算法和随机梯度下降方法,对所述自编码器的参数进行迭代优化;
步骤六,获取验证集的医学影像,将验证集的医学影像重复步骤二和步骤四,得到第二重构误差,并将所述第二重构误差定义为异常分数,其中,验证集的医学影像同时包含阳性样本和阴性样本;
步骤七,根据最大化约登指数和所述异常分数,确定阈值;
步骤八,获取待测医学影像,并将待测医学影像重复步骤二和步骤四,得到第三重构误差,并判断所述第三重构误差是否大于所述阈值;
步骤九,若是,则将对应的待测医学影像判定为阳性;若否,则将对应的待测医学影像判定为阴性。
2.根据权利要求1所述的异常检测框架下的影像组学分析方法,其特征在于,重构误差的计算表达式为:
其中,表示为重构误差,n表示为影像特征总数,/>表示为第i个输入的影像特征,/>表示为第i个输出的重构影像特征。
3.根据权利要求2所述的异常检测框架下的影像组学分析方法,其特征在于,所述将所述第一重构误差作为损失函数,利用反向传播算法和随机梯度下降方法,对所述自编码器的参数进行迭代优化的步骤中,迭代优化的计算表达式为:
其中,θ为待更新参数,α为学习率,J为损失函数,表示为J对θ的偏导数。
4.根据权利要求3所述的异常检测框架下的影像组学分析方法,其特征在于,所述根据最大化约登指数和所述异常分数,确定阈值的计算表达式为:
其中,表示为验证集所有患者的标签,/>表示为验证集所有患者的预测值。
5.根据权利要求4所述的异常检测框架下的影像组学分析方法,其特征在于,所述对所述历史医学影像采用Z-Score方法进行预处理,将预处理后的历史医学影像中的肿瘤病灶靶区勾画出,并提取肿瘤病灶靶区的影像特征的步骤包括:
对所述历史医学影像采用Z-Score方法进行预处理,并选取预处理后的历史医学影像中任意位置的预设尺寸的非肿瘤病灶靶区;
计算选取出的非肿瘤病灶靶区的组织影密度,并定义为标准密度;
圈定预处理后的历史医学影像中肿瘤病灶靶区的外围,得到第一边界;
勾画预处理后的历史医学影像中肿瘤病灶靶区的内围,得到第二边界;
计算所述第一边界和所述第二边界之间区域的组织影密度,并判断所述第一边界和所述第二边界之间区域的组织影密度与所述标准密度的差值是否达到第一预设范围;
若否,则控制所述第二边界朝所述第一边界扩张,并实时计算扩张后的第二边界与第一边界之间区域的组织影密度,直至与所述标准密度的差值达到第一预设范围。
6.根据权利要求5所述的异常检测框架下的影像组学分析方法,其特征在于,所述计算选取出的非肿瘤病灶靶区的组织影密度,并定义为标准密度的步骤包括:
获取所述非肿瘤病灶靶区中所有像素点的灰度值,并统计灰度值大于阈值的像素点的个数;
获取预设尺寸的非肿瘤病灶靶区的像素点总数,并将灰度值大于阈值的像素点的个数除以预设尺寸的非肿瘤病灶靶区的像素点总数,得到选取出的非肿瘤病灶靶区的组织影密度,并定义为标准密度。
7.根据权利要求6所述的异常检测框架下的影像组学分析方法,其特征在于,所述控制所述第二边界朝所述第一边界扩张,并实时计算扩张后的第二边界与第一边界之间区域的组织影密度,直至与所述标准密度的差值达到第一预设范围的步骤包括:
控制所述第二边界以预设步进,等比例的朝所述第一边界扩张,并实时计算扩张后的第二边界与第一边界之间区域的组织影密度;
判断扩张后的第二边界与第一边界之间区域的组织影密度与所述标准密度的差值是否达到第一预设范围;
若是,则控制所述第二边界以预设步进,等比例的朝所述第一边界再次扩张,并计算再次扩张后的第二边界与第一边界之间区域的组织影密度;
判断再次扩张后的第二边界与第一边界之间区域的组织影密度与所述标准密度的差值是否达到第一预设范围;
若是,则判断再次扩张后的第二边界与第一边界之间区域的组织影密度与上一次扩张后的第二边界与第一边界之间区域的组织影密度的差值是否在第二预设范围内;
若是,则确定上一次扩张后的第二边界为肿瘤病灶靶区的目标边界。
8.一种异常检测框架下的影像组学分析系统,其特征在于,用于实现权利1-7任一项所述的异常检测框架下的影像组学分析方法,所述系统包括:
第一获取模块,用于获取历史医学影像,其中,所述历史医学影像均为阴性样本;
勾画模块,用于对所述历史医学影像采用Z-Score方法进行预处理,将预处理后的历史医学影像中的肿瘤病灶靶区勾画出,并提取肿瘤病灶靶区的影像特征,其中,影像特征包括形状特征、一阶特征以及纹理特征;
自编码器构建模块,用于利用全连接层构建自编码器,其中,每个全连接层后均使用ReLU作为激活函数;
第一计算模块,用于将从肿瘤病灶靶区提取到的影像特征输入所述自编码器中,输出对应的重构影像特征,并根据所述影像特征和所述重构影像特征,计算第一重构误差;
优化模块,用于将所述第一重构误差作为损失函数,利用反向传播算法和随机梯度下降方法,对所述自编码器的参数进行迭代优化;
异常分数定义模块,用于获取验证集的医学影像,将验证集的医学影像重复勾画模块和第一计算模块的步骤,得到第二重构误差,并将所述第二重构误差定义为异常分数,其中,验证集的医学影像同时包含阳性样本和阴性样本;
阈值确定模块,用于根据最大化约登指数和所述异常分数,确定阈值;
第一判断模块,用于获取待测医学影像,并将待测医学影像重复勾画模块和第一计算模块的步骤,得到第三重构误差,并判断所述第三重构误差是否大于所述阈值;
判定模块,用于当判断所述第三重构误差大于所述阈值时,则将对应的待测医学影像判定为阳性;当判断所述第三重构误差不大于所述阈值时,则将对应的待测医学影像判定为阴性。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的异常检测框架下的影像组学分析方法。
10.一种电子设备,其特征在于,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-7任一项所述的异常检测框架下的影像组学分析方法。
CN202410103861.6A 2024-01-25 2024-01-25 一种异常检测框架下的影像组学分析方法及系统 Active CN117649400B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410103861.6A CN117649400B (zh) 2024-01-25 2024-01-25 一种异常检测框架下的影像组学分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410103861.6A CN117649400B (zh) 2024-01-25 2024-01-25 一种异常检测框架下的影像组学分析方法及系统

Publications (2)

Publication Number Publication Date
CN117649400A true CN117649400A (zh) 2024-03-05
CN117649400B CN117649400B (zh) 2024-05-03

Family

ID=90049729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410103861.6A Active CN117649400B (zh) 2024-01-25 2024-01-25 一种异常检测框架下的影像组学分析方法及系统

Country Status (1)

Country Link
CN (1) CN117649400B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200042829A1 (en) * 2017-07-24 2020-02-06 Huawei Technologies Co., Ltd. Classification Model Training Method and Apparatus
CN111582330A (zh) * 2020-04-22 2020-08-25 北方民族大学 基于肺部肿瘤影像划分样本空间下的集成ResNet-NRC方法
CN113052831A (zh) * 2021-04-14 2021-06-29 清华大学 脑部医学影像异常检测方法、装置、设备及存储介质
CN113420814A (zh) * 2021-06-23 2021-09-21 推想医疗科技股份有限公司 一种肺疾病检测模型的训练方法、装置、设备和介质
KR20230044124A (ko) * 2021-09-25 2023-04-03 주식회사 메디컬에이아이 설명 가능한 인공지능에 기반한 의료 데이터의 해석 방법, 프로그램 및 장치
CN115954100A (zh) * 2022-12-15 2023-04-11 东北林业大学 胃癌病理图像智能辅助诊断系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200042829A1 (en) * 2017-07-24 2020-02-06 Huawei Technologies Co., Ltd. Classification Model Training Method and Apparatus
CN111582330A (zh) * 2020-04-22 2020-08-25 北方民族大学 基于肺部肿瘤影像划分样本空间下的集成ResNet-NRC方法
CN113052831A (zh) * 2021-04-14 2021-06-29 清华大学 脑部医学影像异常检测方法、装置、设备及存储介质
CN113420814A (zh) * 2021-06-23 2021-09-21 推想医疗科技股份有限公司 一种肺疾病检测模型的训练方法、装置、设备和介质
KR20230044124A (ko) * 2021-09-25 2023-04-03 주식회사 메디컬에이아이 설명 가능한 인공지능에 기반한 의료 데이터의 해석 방법, 프로그램 및 장치
CN115954100A (zh) * 2022-12-15 2023-04-11 东北林业大学 胃癌病理图像智能辅助诊断系统

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
SCHLEGL, T (SCHLEGL, THOMAS)等: "f-AnoGAN: Fast unsupervised anomaly detection with generative adversarial networks", 《MEDICAL IMAGE ANALYSIS》, vol. 54, 1 May 2019 (2019-05-01), pages 30 - 44, XP055785711, DOI: 10.1016/j.media.2019.01.010 *
吴署光1,2 ,王宏艳1 ,颜南江2 ,王 宇: "基于 SOINN 增量自编码器的网络异常检测研究", 《兵器装备工程学报》, vol. 44, no. 5, 25 May 2023 (2023-05-25), pages 239 - 248 *
唐嘉骏: "基于深度学习的多模态检索研究", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》, no. 2, 15 February 2021 (2021-02-15) *
戚晓峰: "乳腺疾病智能诊疗研究", 《中国博士学位论文全文数据库 (医药卫生科技辑)》, no. 4, 15 April 2022 (2022-04-15) *
杨静;殷志祥;崔健中;: "支持向量机的蛋白质远程同源检测方法分析", 安徽理工大学学报(自然科学版), no. 03, 15 September 2009 (2009-09-15) *
柏志安;朱铁兵;: "基于影像云的智能辅助诊断在分级诊疗中的应用实践", 中国数字医学, no. 07, 15 July 2020 (2020-07-15) *

Also Published As

Publication number Publication date
CN117649400B (zh) 2024-05-03

Similar Documents

Publication Publication Date Title
Wang et al. A multi-view deep convolutional neural networks for lung nodule segmentation
Halder et al. Lung nodule detection from feature engineering to deep learning in thoracic CT images: a comprehensive review
US9968257B1 (en) Volumetric quantification of cardiovascular structures from medical imaging
EP3213296B1 (en) A method and system for image processing
Ochs et al. Automated classification of lung bronchovascular anatomy in CT using AdaBoost
Mahapatra Analyzing training information from random forests for improved image segmentation
Roy et al. A deep learning-shape driven level set synergism for pulmonary nodule segmentation
CN109003267B (zh) 从3d图像自动检测目标对象的计算机实现方法和系统
Zheng et al. Machine learning based vesselness measurement for coronary artery segmentation in cardiac CT volumes
US9014456B2 (en) Computer aided diagnostic system incorporating appearance analysis for diagnosing malignant lung nodules
Makni et al. Zonal segmentation of prostate using multispectral magnetic resonance images
Jin et al. Vascular tree segmentation in medical images using Hessian-based multiscale filtering and level set method
CN110910405A (zh) 基于多尺度空洞卷积神经网络的脑肿瘤分割方法及系统
KR20230059799A (ko) 병변 검출을 위해 공동 훈련을 이용하는 연결형 머신 러닝 모델
Galimzianova et al. Stratified mixture modeling for segmentation of white-matter lesions in brain MR images
Li et al. Segmentation of pulmonary nodules using a GMM fuzzy C-means algorithm
Osadebey et al. Three-stage segmentation of lung region from CT images using deep neural networks
Nayan et al. A deep learning approach for brain tumor detection using magnetic resonance imaging
US7711164B2 (en) System and method for automatic segmentation of vessels in breast MR sequences
Delmoral et al. Segmentation of pathological liver tissue with dilated fully convolutional networks: A preliminary study
CN117649400B (zh) 一种异常检测框架下的影像组学分析方法及系统
WO2020056196A1 (en) Fully automated personalized body composition profile
Mansour et al. Kidney segmentations using cnn models
Keçeli et al. A GPU-Based approach for automatic segmentation of white matter lesions
Li et al. A new efficient 2D combined with 3D CAD system for solitary pulmonary nodule detection in CT images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant