CN113658700B - 一种基于机器学习的门脉高压无创评估方法及系统 - Google Patents
一种基于机器学习的门脉高压无创评估方法及系统 Download PDFInfo
- Publication number
- CN113658700B CN113658700B CN202110938393.0A CN202110938393A CN113658700B CN 113658700 B CN113658700 B CN 113658700B CN 202110938393 A CN202110938393 A CN 202110938393A CN 113658700 B CN113658700 B CN 113658700B
- Authority
- CN
- China
- Prior art keywords
- portal
- image
- image data
- features
- pressure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 46
- 238000010801 machine learning Methods 0.000 title claims abstract description 17
- 208000007232 portal hypertension Diseases 0.000 claims abstract description 84
- 238000000034 method Methods 0.000 claims abstract description 40
- 238000012549 training Methods 0.000 claims abstract description 32
- 238000013210 evaluation model Methods 0.000 claims abstract description 29
- 230000011218 segmentation Effects 0.000 claims abstract description 23
- 238000010276 construction Methods 0.000 claims abstract description 16
- 239000011159 matrix material Substances 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 12
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 55
- 238000005070 sampling Methods 0.000 claims description 25
- 238000007477 logistic regression Methods 0.000 claims description 14
- 238000011176 pooling Methods 0.000 claims description 8
- 238000000586 desensitisation Methods 0.000 claims description 6
- 230000003902 lesion Effects 0.000 claims description 6
- 238000003745 diagnosis Methods 0.000 abstract description 3
- 230000035945 sensitivity Effects 0.000 abstract description 3
- 238000010968 computed tomography angiography Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 210000004185 liver Anatomy 0.000 description 5
- 206010003445 Ascites Diseases 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 210000003240 portal vein Anatomy 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000000405 serological effect Effects 0.000 description 3
- BPYKTIZUTYGOLE-IFADSCNNSA-N Bilirubin Chemical compound N1C(=O)C(C)=C(C=C)\C1=C\C1=C(C)C(CCC(O)=O)=C(CC2=C(C(C)=C(\C=C/3C(=C(C=C)C(=O)N\3)C)N2)CCC(O)=O)N1 BPYKTIZUTYGOLE-IFADSCNNSA-N 0.000 description 2
- 208000000624 Esophageal and Gastric Varices Diseases 0.000 description 2
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 2
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 2
- 206010016654 Fibrosis Diseases 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 210000004204 blood vessel Anatomy 0.000 description 2
- 230000007882 cirrhosis Effects 0.000 description 2
- 208000019425 cirrhosis of liver Diseases 0.000 description 2
- 238000003759 clinical diagnosis Methods 0.000 description 2
- 239000002872 contrast media Substances 0.000 description 2
- 210000002744 extracellular matrix Anatomy 0.000 description 2
- 230000003908 liver function Effects 0.000 description 2
- 210000000952 spleen Anatomy 0.000 description 2
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 1
- 108010082126 Alanine transaminase Proteins 0.000 description 1
- 206010067125 Liver injury Diseases 0.000 description 1
- 102100027378 Prothrombin Human genes 0.000 description 1
- 108010094028 Prothrombin Proteins 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 208000007536 Thrombosis Diseases 0.000 description 1
- 238000008050 Total Bilirubin Reagent Methods 0.000 description 1
- 206010046996 Varicose vein Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 230000003187 abdominal effect Effects 0.000 description 1
- 238000002583 angiography Methods 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000007857 degradation product Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 238000002091 elastography Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 230000000004 hemodynamic effect Effects 0.000 description 1
- 231100000234 hepatic damage Toxicity 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 208000007386 hepatic encephalopathy Diseases 0.000 description 1
- 210000002989 hepatic vein Anatomy 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000008818 liver damage Effects 0.000 description 1
- 229940039716 prothrombin Drugs 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000000472 traumatic effect Effects 0.000 description 1
- 208000027185 varicose disease Diseases 0.000 description 1
- 230000002227 vasoactive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/20—ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于机器学习的门脉高压无创评估方法及系统,属于医学图像处理技术领域。方法包括:S1:获取门脉高压症的图像数据并对所述图像数据进行预处理;S2:对预处理后的图像数据运用卷积神经网络进行病灶区域分割,得到门脉高压病灶区域;S3:对所述门脉高压病灶区域进行影像组学特征提取和特征矩阵构建,采用集成学习训练多个基础分类器,得到门脉高压无创评估模型;S4:调用所述门脉高压无创评估模型,对待评估的图像数据进行评估,输出门脉高压无创评估结果。本发明具有较高的灵敏度和准确性,可以帮助指导PH患者的快速诊断,进而缩短PH患者的治疗时间,具有较好的临床实用性。
Description
技术领域
本发明属于医学图像处理技术领域,尤其涉及一种基于机器学习的门脉高压无创评估方法及系统。
背景技术
门脉高压症(portalhypertension,PH)是肝硬化的主要并发症之一,是由门静脉系统压力升高引起的一系列临床表现,如食管胃静脉曲张、腹水等。临床医学上评估门脉高压的金标准为肝静脉压力梯度(Hepatic Venous Pressure Gradient,HVPG),但因其创伤性,费用高,难以重复等缺点。因此寻找一种有效准确的无创评估方法对门脉高压症的临床诊断和治疗具有重要意义。
近几年,现代医学成像技术不断发展,其产生的高分辨率图像可以为医生提供多方位视图和更多的图像细节,大大有助于临床的诊断治疗。CT血管造影(CT angiography,CTA)是一种利用计算机三维重建方法合成的非创伤性血管造影术。它利用螺旋CT的快速扫描,在短时间内完成一定范围内的横断面扫描。将采集的图像资料送入工作站进行图像重建。通过图像显示阈值的调整即可得到显示血管和组织结构的三维图像,并可利用计算机软件对其进行任意角度的观察和任意方向的切割。CTA技术可以将CT增强技术与快速扫描技术相结合,通过后处理清晰显示腹部血管细节,具有无创和操作简便的特点。
当前对于门脉高压的无创评估研究主要集中在血清学指标,影像学指标以及利用电子病历建立元模型等。血清学指标主要包括炎性介质、血管活性物质和细胞外基质(extracellular matrix,ECM)组分及其循环降解产物等,这些指标都可以间接评估门脉高压的严重程度,但血清学指标在反映肝硬化进展以及与门脉压力的作用还需要进一步研究,因此,无法完全代替有创评估。其次,影像学指标包括CT,MRI,这些检查方法可以很好的发现门脉高压的并发症如腹水,静脉曲张。近年来有研究显示运用瞬时弹性成像测定肝脏硬度值,发现其与HVPG有一定的相关性,可以在一定程度上反映门静脉压力。元模型的建立依靠患者的各种临床信息,这些信息收集复杂且与门脉高压症的相关性并不明确,因此也无法取代HVPG评估。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于机器学习的门脉高压无创评估方法及系统,通过对门脉高压症的图像数据进行预处理、病灶区域分割、分类器训练集成,得到门脉高压无创评估模型,然后通过调用门脉高压无创评估模型对待评估的图像数据进行评估,得到门脉高压无创评估结果,该方法具有较高的灵敏度和准确性,可以帮助指导PH患者的快速诊断,进而缩短PH患者的治疗时间,具有较好的临床实用性。
根据本发明的一个方面,本发明提供了一种基于机器学习的门脉高压无创评估方法,所述方法包括以下步骤:
S1:获取门脉高压症的图像数据并对所述图像数据进行预处理;
S2:对预处理后的图像数据运用卷积神经网络进行病灶区域分割,得到门脉高压病灶区域;
S3:对所述门脉高压病灶区域进行影像组学特征提取和特征矩阵构建,采用集成学习训练多个基础分类器,得到门脉高压无创评估模型;
S4:调用所述门脉高压无创评估模型,对待评估的图像数据进行评估,输出门脉高压无创评估结果。
优选地,所述获取门脉高压症的图像数据并对所述图像数据进行预处理,包括:
对图像数据进行数据脱敏,并采用如下公式对图像数据进行标准化处理:
式中,μ为图像的像素均值,x表示图像中像素值所构成的矩阵,σ和N分别表示图像的像素标准差和图像像素数量。
优选地,所述对预处理后的图像数据运用卷积神经网络进行病灶区域分割,得到门脉高压病灶区域,包括:
通过编码操作提取图像特征值,利用池化层进行逐级下采样;
通过译码操作进行逐级上采样,将下采样和上采样过程中得到特征图进行逐层相加融合;
构建损失函数LCE,对分割结果进行评估:
其中,M表示类别数,Pc表示预测样本属于类别c的概率,yc是一个列向量,其元素取值为0或1,若类别和样本的类别相同,则取值为1,否则取值为0。
优选地,所述对所述门脉高压病灶区域进行影像组学特征提取和特征矩阵构建,包括:
使用Radiomics工具包对所述门脉高压病灶区域进行影像特征提取,将图像所包含的信息进行量化,将数据特征进行归一化处理,获得预定数量的图像特征,所述图像特征包括形状特征、灰度特征、纹理特征、小波特征。
优选地,所述采用集成学习训练多个基础分类器,得到门脉高压无创评估模型,包括:
采用Bagging集成算法训练三种基础分类器,所述三种基础分类器为SVM分类器、逻辑回归分类器和朴素贝叶斯分类器;
所述SVM分类器的核函数为RBF核函数:其中x,y表示样本,γ为超参数,取值为0.5;
所述逻辑回归分类器的核函数为Sigmoid函数:
所述朴素贝叶斯分类器的核函数为:yk=arg max(P(yk|x)),argmax(.)函数表示取参数的最大值,k=0,1,2,3;分别计算x属于y0、y1、y2、y3的概率,选取其中概率的最大值,此时所对应的yk即为x所属类别。
优选地,对训练后的三种基础分类器的输出结果进行融合,作为所述门脉高压无创评估模型的评估结果:
st=αxt+βyt+δzt
式中,α,β,δ为三种基础分类器的权重,取值分别为0.4,0.4,0.2,xt,yt,zt代表三种基础分类器,st为门脉高压无创评估模型的评估结果,st的取值为0,1,2,3;其中,0代表没有患门脉高压症,1代表可能患有门脉高压症,2代表确定患有门脉高压症,3代表患有严重的门脉高压症。
根据本发明的另一个方面,本发明还提供了一种基于机器学习的门脉高压无创评估系统,所述系统包括:
处理模块,获取门脉高压症的图像数据并对所述图像数据进行预处理;
分割模块,对预处理后的图像数据运用卷积神经网络进行病灶区域分割,得到门脉高压病灶区域;
训练模块,对所述门脉高压病灶区域进行影像组学特征提取和特征矩阵构建,采用集成学习训练多个基础分类器,得到门脉高压无创评估模型;
评估模块,调用所述门脉高压无创评估模型,对待评估的图像数据进行评估,输出门脉高压无创评估结果。
优选地,所述处理模块用于:
对图像数据进行数据脱敏,并采用如下公式对图像数据进行标准化处理:
式中,μ为图像的像素均值,x表示图像中像素值所构成的矩阵,σ和N分别表示图像的像素标准差和图像像素数量。
优选地,所述分割模块用于:
通过编码操作提取图像特征值,利用池化层进行逐级下采样;
通过译码操作进行逐级上采样,将下采样和上采样过程中得到特征图进行逐层相加融合;
构建损失函数LCE,对分割结果进行评估:
其中,M表示类别数,Pc表示预测样本属于类别c的概率,yc是一个列向量,其元素取值为0或1,若类别和样本的类别相同,则取值为1,否则取值为0。
优选地,所述训练模块用于:
使用Radiomics工具包对所述门脉高压病灶区域进行影像特征提取,将图像所包含的信息进行量化,将数据特征进行归一化处理,获得预定数量的图像特征,所述图像特征包括形状特征、灰度特征、纹理特征、小波特征;
所述训练模块还用于:采用Bagging集成算法训练三种基础分类器,所述三种基础分类器为SVM分类器、逻辑回归分类器和朴素贝叶斯分类器;
所述SVM分类器的核函数为RBF核函数:其中x,y表示样本,γ为超参数,取值为0.5;
所述逻辑回归分类器的核函数为Sigmoid函数:
所述朴素贝叶斯分类器的核函数为:yk=arg max(P(yk|x)),argmax(.)函数表示取参数的最大值,k=0,1,2,3;分别计算x属于y0、y1、y2、y3的概率,选取其中概率的最大值,此时所对应的yk即为x所属类别。
所述训练模块还用于:对训练后的三种基础分类器的输出结果进行融合,作为所述门脉高压无创评估模型的评估结果:
st=αxt+βyt+δzt
式中,α,β,δ为三种基础分类器的权重,取值分别为0.4,0.4,0.2,xt,yt,zt代表三种基础分类器,st为门脉高压无创评估模型的评估结果,st的取值为0,1,2,3;其中,0代表没有患门脉高压症,1代表可能患有门脉高压症,2代表确定患有门脉高压症,3代表患有严重的门脉高压症。
有益效果:本发明通过将3D U-net模型应用于PH的病灶分割并采用集成学习完成PH的自动评估,从而实现门脉高压症的无创智能评估,克服临床上采用的复杂有创评估带来的诸多局限;本发明提供的基于机器学习的门脉高压无创评估方法具有较高的灵敏度和准确性,可以帮助指导PH患者的快速诊断,进而缩短PH患者的治疗时间,具有更好的临床实用性。
通过参照以下附图及对本发明的具体实施方式的详细描述,本发明的特征及优点将会变得清楚。
附图说明
图1是本发明的基于机器学习的门脉高压无创评估方法流程图;
图2是本发明的基于机器学习的门脉高压无创评估系统示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
图1是本发明的基于机器学习的门脉高压无创评估方法流程图。如图1所示,本发明提供了一种基于机器学习的门脉高压无创评估方法,所述方法包括以下步骤:
S1:获取门脉高压症的图像数据并对所述图像数据进行预处理。
具体地,本步骤可以包括以下步骤:
S11:通过薄层扫描方式即设置扫描层厚为5mm进行扫描,获取胸部门脉期CTA图像。造影剂采用双筒高压注射,根据患者的血流动力学特点调整,对比剂流速4-6ml/s,剂量75-120ml,盐水50ml同速注射。
S12:测量患者HVPG值,得到样本数据,具体为将测压管穿刺置于肝静脉内测定肝静脉游离压,再将导管楔入肝静脉分支并经注入造影剂测定肝静脉楔压,两者之差即为HVPG值。制定门脉高压标签,根据HVPG值将HVPG≤5mmHg的患者标记为0,表示没有患门脉高压症;5mmHg<HVPG<12mmHg的患者标记为1,表示可能患有门脉高压症;12mmHg≤HVPG<20mmHg的患者标记为2,表示确定患有门脉高压症;HVPG≥20mmHg的患者标记为3,表示患有严重的门脉高压症。
S13:对获取的预处理后的图像进行数据脱敏并剔除不规范的图像,提高数据的一致性;
S14:对训练数据进行标准化处理,可以将数据的幅度归一化到同一范围之内,减少各维度数据取值范围存在的差异而带来的干扰,公式如下:
式中μ为图像的像素均值,x表示图像中像素值所构成的矩阵,σ和N分别表示图像的像素标准差和图像像素数量。
S2:对预处理后的图像数据运用卷积神经网络进行病灶区域分割,得到门脉高压病灶区域。
本步骤中,收集患者临床病历数据,如是否有出血史,总胆红素,丙氨酸氨基转移酶等。计算门脉高压患者的child分级,根据肝性脑病程度、腹水程度、血清胆红素的水平、血清白蛋白水平、凝血酶原的时间这五个指标不同的状态,分为三个层次,分别记作1分、2分和3分,并将这五个指标的分数进行相加。根据相加后的综合分数,将肝功能储备分为A级、B级、C级,评估肝脏损害的不同严重程度,其中分数越高,表明肝脏储备功能越差。A级、B级、C级分别提示肝功能从好到坏:
规定标注的病灶区域分别为门静脉,脾脏,肝脏,血栓以及食管胃静脉曲张部位。其中获取门静脉血管直径值,具体为采用影像组学Radiomics特征提取方法中的getMaximum2DdiameterSliceFeatureValue函数,Radiomics是一个开源的python工具包,用于医学图像的影像组学特征提取。getMaximum2DdiameterSliceFeatureValue函数可以获取血管的最大直径。肝脏与脾脏的面积比值可以采用getPixelSurfaceFeatureValue函数分别得到各自的面积再相除获得。
优选地,所述对预处理后的图像数据运用卷积神经网络进行病灶区域分割,得到门脉高压病灶区域,包括:
通过编码操作提取图像特征值,利用池化层进行逐级下采样;
通过译码操作进行逐级上采样,将下采样和上采样过程中得到特征图进行逐层相加融合;
构建损失函数LCE,对分割结果进行评估:
其中,M表示类别数,Pc表示预测样本属于类别c的概率,yc是一个列向量,其元素取值为0或1,若类别和样本的类别相同,则取值为1,否则取值为0。
具体地,包括以下步骤:
S21:对CTA图像进行编码-译码操作。编码操作提取图像特征值,利用池化层进行逐级下采样,对图像进行四次卷积+最大池化操作,其中卷积核大小为3×3,步长为2,使得图像每次缩小为原来的1/2。最后得到125幅16×16的下采样特征图。其中,各卷积层使用的卷积核个数分别是32、64、128、256。
S22:译码过程使用4组反卷积操作逐级上采样,将图片扩展为原来的2倍,将对应层的特征图进行剪裁和复制,组成反卷积的结果。上采样过程结束后,得到256×256大小的图,在每一层下采样与上采样之间有一条通路可以将下采样得到的特征图与上采样过程中的特征图相加。通过底层特征与高层特征的融合保留更多高层特征图蕴含的高分辨率细节信息,完成CTA图片分割,得到ROIPH。其中,各卷积层使用的卷积核个数分别是256、128、64、32。
S23:在模型训练过程中采用交叉熵损失函数对分割结果进行评估。构建损失函数LCE。其中,M表示类别数,yc是一个列向量,元素只有0,1两种取值,如果该类别和样本的类别相同就取1,否则取0。Pc表示预测样本属于c的概率。
S3:对所述门脉高压病灶区域进行影像组学特征提取和特征矩阵构建,采用集成学习训练多个基础分类器,得到门脉高压无创评估模型。
本步骤中,使用Radiomics工具包对所述门脉高压病灶区域进行影像特征提取,将图像所包含的信息进行量化,将数据特征进行归一化处理,获得预定数量的图像特征,所述图像特征包括形状特征、灰度特征、纹理特征、小波特征。
例如,使用WORC工具包方法对步骤S2中获得的ROIPH进行影像特征提取,将图像所包含的信息进行量化。将数据特征进行归一化处理(避免一些变量成为主导成分)获得175个图像特征,包括形状特征17个,灰度特征18个,纹理特征30个,小波特征110个。此外S21中获取的临床病历特征17个。
优选地,所述采用集成学习训练多个基础分类器,得到门脉高压无创评估模型,包括:
采用Bagging集成算法训练三种基础分类器,所述三种基础分类器为SVM分类器、逻辑回归分类器和朴素贝叶斯分类器;
所述SVM分类器的核函数为RBF核函数:其中x,y表示样本,γ为超参数,取值为0.5;
所述逻辑回归分类器的核函数为Sigmoid函数:
所述朴素贝叶斯分类器的核函数为:yk=arg max(P(yk|x)),argmax(.)函数表示取参数的最大值,k=0,1,2,3;分别计算x属于y0、y1、y2、y3的概率,选取其中概率的最大值,此时所对应的yk即为x所属类别。
具体包括以下步骤:
S31:Bagging集成学习基于自助采样法(bootstrap sampling),将S31获得的1000例样本集R(每个样本包含178个特征)随机从中取出一个样本放入采样集D中,再把该样本返回样本集R中,使得下次采样时该样本仍可以被选中,这样,经过1000次随机采样操作,就可以得到包含1000个样本的采样集。
S32:依据S31步骤进行3次操作,采样出3个含有1000个训练集的采样集,然后基于每个采样集训练出3个基础学习器获得各自的结果,再将这些基础学习器的结果加权取平均即可得到集成学习器的分类结果。三个基础学习器分别为SVM分类器,逻辑回归分类器以及朴素贝叶斯分类器。SVM分类器中核函数选用RBF核函数,函数表达式其中x,y表示样本,γ为超参数,设置为0.5;逻辑回归采用Sigmoid函数,函数表达式函数取值在[0,1]之间,在零点取值为0.5,在远离0的地方函数的值会很快接近0或是1。朴素贝叶斯分类器中计算公式yk=arg max(P(yk|x)),argmax(.)函数表示取参数的最大值。是否患有门脉高压为多分类问题,因此k=0,1,2,3。所得yk即为x所属类别。上式,分别计算x属于y0、y1、y2、y3的概率,选取其中概率的最大值,此时所对应的yk即为x所属类别。
优选地,对训练后的三种基础分类器的输出结果进行融合,作为所述门脉高压无创评估模型的评估结果:
st=αxt+βyt+δzt
式中,α,β,δ为三种基础分类器的权重,取值分别为0.4,0.4,0.2,xt,yt,zt代表三种基础分类器,st为门脉高压无创评估模型的评估结果,st的取值为0,1,2,3;其中,0代表没有患门脉高压症,1代表可能患有门脉高压症,2代表确定患有门脉高压症,3代表患有严重的门脉高压症。
S4:调用所述门脉高压无创评估模型,对待评估的图像数据进行评估,输出门脉高压无创评估结果。
本步骤中,将待评估的图像数据输入到门脉高压无创评估模型中,通过模型的调用,输出待评估图像的评估结果,评估结果为0,1,2,3;其中,0代表没有患门脉高压症,1代表可能患有门脉高压症,2代表确定患有门脉高压症,3代表患有严重的门脉高压症。
本实施例中,将3D U-net模型应用于PH的病灶分割并采用集成学习完成PH的自动评估,从而实现门脉高压症的无创智能评估,克服临床上采用的复杂有创评估带来的诸多局限;本发明提供的基于机器学习的门脉高压无创评估方法具有较高的灵敏度和准确性,可以帮助指导PH患者的快速诊断,进而缩短PH患者的治疗时间,具有更好的临床实用性。
实施例2
图2是本发明的基于机器学习的门脉高压无创评估系统示意图。如图2所示,本发明还提供了一种基于机器学习的门脉高压无创评估系统,所述系统包括:
处理模块,获取门脉高压症的图像数据并对所述图像数据进行预处理;
分割模块,对预处理后的图像数据运用卷积神经网络进行病灶区域分割,得到门脉高压病灶区域;
训练模块,对所述门脉高压病灶区域进行影像组学特征提取和特征矩阵构建,采用集成学习训练多个基础分类器,得到门脉高压无创评估模型;
评估模块,调用所述门脉高压无创评估模型,对待评估的图像数据进行评估,输出门脉高压无创评估结果。
优选地,所述处理模块用于:
对图像数据进行数据脱敏,并采用如下公式对图像数据进行标准化处理:
式中,μ为图像的像素均值,x表示图像中像素值所构成的矩阵,σ和N分别表示图像的像素标准差和图像像素数量。
优选地,所述分割模块用于:
通过编码操作提取图像特征值,利用池化层进行逐级下采样;
通过译码操作进行逐级上采样,将下采样和上采样过程中得到特征图进行逐层相加融合;
构建损失函数LCE,对分割结果进行评估:
其中,M表示类别数,Pc表示预测样本属于类别c的概率,yc是一个列向量,其元素取值为0或1,若类别和样本的类别相同,则取值为1,否则取值为0。
优选地,所述训练模块用于:
使用Radiomics工具包对所述门脉高压病灶区域进行影像特征提取,将图像所包含的信息进行量化,将数据特征进行归一化处理,获得预定数量的图像特征,所述图像特征包括形状特征、灰度特征、纹理特征、小波特征;
所述训练模块还用于:采用Bagging集成算法训练三种基础分类器,所述三种基础分类器为SVM分类器、逻辑回归分类器和朴素贝叶斯分类器;
所述SVM分类器的核函数为RBF核函数:其中x,y表示样本,γ为超参数,取值为0.5;
所述逻辑回归分类器的核函数为Sigmoid函数:
所述朴素贝叶斯分类器的核函数为:yk=arg max(P(yk|x)),argmax(.)函数表示取参数的最大值,k=0,1,2,3;分别计算x属于y0、y1、y2、y3的概率,选取其中概率的最大值,此时所对应的yk即为x所属类别。
所述训练模块还用于:对训练后的三种基础分类器的输出结果进行融合,作为所述门脉高压无创评估模型的评估结果:
st=αxt+βyt+δzt
式中,α,β,δ为三种基础分类器的权重,取值分别为0.4,0.4,0.2,xt,yt,zt代表三种基础分类器,st为门脉高压无创评估模型的评估结果,st的取值为0,1,2,3;其中,0代表没有患门脉高压症,1代表可能患有门脉高压症,2代表确定患有门脉高压症,3代表患有严重的门脉高压症。
本实施例2中各个模块所执行的方法步骤的具体实施过程与实施例1中的各个步骤的实施过程相同,在此不再赘述。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。
Claims (6)
1.一种基于机器学习的门脉高压无创评估方法,其特征在于,所述方法包括以下步骤:
S1:获取门脉高压症的图像数据并对所述图像数据进行预处理;
S2:对预处理后的图像数据运用卷积神经网络进行病灶区域分割,得到门脉高压病灶区域;
S3:对所述门脉高压病灶区域进行影像组学特征提取和特征矩阵构建,采用集成学习训练多个基础分类器,得到门脉高压无创评估模型;
S4:调用所述门脉高压无创评估模型,对待评估的图像数据进行评估,输出门脉高压无创评估结果;
对图像数据进行数据脱敏,并采用如下公式对图像数据进行标准化处理:
式中,为图像的像素均值,/>表示图像中像素值所构成的矩阵,/>和N分别表示图像的像素标准差和图像像素数量;所述对预处理后的图像数据运用卷积神经网络进行病灶区域分割,得到门脉高压病灶区域,包括:
通过编码操作提取图像特征值,利用池化层进行逐级下采样;
通过译码操作进行逐级上采样,将下采样和上采样过程中得到特征图进行逐层相加融合;
构建损失函数,对分割结果进行评估:
其中,M表示类别数,表示预测样本属于类别c的概率,/>是一个列向量,其元素取值为0或1,若类别和样本的类别相同,则取值为1,否则取值为0。
2.根据权利要求1所述的方法,其特征在于,所述对所述门脉高压病灶区域进行影像组学特征提取和特征矩阵构建,包括:
使用Radiomics工具包对所述门脉高压病灶区域进行影像特征提取,将图像所包含的信息进行量化,将数据特征进行归一化处理,获得预定数量的图像特征,所述图像特征包括形状特征、灰度特征、纹理特征、小波特征。
3.根据权利要求2所述的方法,其特征在于,所述采用集成学习训练多个基础分类器,得到门脉高压无创评估模型,包括:
采用Bagging集成算法训练三种基础分类器,所述三种基础分类器为SVM分类器、逻辑回归分类器和朴素贝叶斯分类器;
所述SVM分类器的核函数为RBF核函数:,其中x,y表示样本,/>为超参数,取值为0.5;
所述逻辑回归分类器的核函数为Sigmoid函数:;
所述朴素贝叶斯分类器的核函数为:,argmax(.)函数表示取参数的最大值,k=0,1,2,3;分别计算x属于/>、/>、/>的概率,选取其中概率的最大值,此时所对应的/>即为x所属类别。
4.根据权利要求3所述的方法,其特征在于,对训练后的三种基础分类器的输出结果进行融合,作为所述门脉高压无创评估模型的评估结果:
式中,为三种基础分类器的权重,取值分别为0.4,0.4,0.2,/>代表三种基础分类器,/>为门脉高压无创评估模型的评估结果,/>的取值为0,1,2,3;其中,0代表没有患门脉高压症,1代表可能患有门脉高压症,2代表确定患有门脉高压症,3代表患有严重的门脉高压症。
5.一种基于机器学习的门脉高压无创评估系统,其特征在于,所述系统包括:
处理模块,获取门脉高压症的图像数据并对所述图像数据进行预处理;
分割模块,对预处理后的图像数据运用卷积神经网络进行病灶区域分割,得到门脉高压病灶区域;
训练模块,对所述门脉高压病灶区域进行影像组学特征提取和特征矩阵构建,采用集成学习训练多个基础分类器,得到门脉高压无创评估模型;
评估模块,调用所述门脉高压无创评估模型,对待评估的图像数据进行评估,输出门脉高压无创评估结果;
对图像数据进行数据脱敏,并采用如下公式对图像数据进行标准化处理:
式中,为图像的像素均值,/>表示图像中像素值所构成的矩阵,/>和N分别表示图像的像素标准差和图像像素数量;
通过编码操作提取图像特征值,利用池化层进行逐级下采样;
通过译码操作进行逐级上采样,将下采样和上采样过程中得到特征图进行逐层相加融合;
构建损失函数,对分割结果进行评估:
其中,M表示类别数,表示预测样本属于类别c的概率,/>是一个列向量,其元素取值为0或1,若类别和样本的类别相同,则取值为1,否则取值为0。
6.根据权利要求5所述的系统,其特征在于,所述训练模块用于:
使用Radiomics工具包对所述门脉高压病灶区域进行影像特征提取,将图像所包含的信息进行量化,将数据特征进行归一化处理,获得预定数量的图像特征,所述图像特征包括形状特征、灰度特征、纹理特征、小波特征;
所述训练模块还用于:采用Bagging集成算法训练三种基础分类器,所述三种基础分类器为SVM分类器、逻辑回归分类器和朴素贝叶斯分类器;
所述SVM分类器的核函数为RBF核函数:,其中x,y表示样本,/>为超参数,取值为0.5;
所述逻辑回归分类器的核函数为Sigmoid函数:;
所述朴素贝叶斯分类器的核函数为:,argmax(.)函数表示取参数的最大值,k=0,1,2,3;分别计算x属于/>、/>、/>的概率,选取其中概率的最大值,此时所对应的/>即为x所属类别;
所述训练模块还用于:对训练后的三种基础分类器的输出结果进行融合,作为所述门脉高压无创评估模型的评估结果:
式中,为三种基础分类器的权重,取值分别为0.4,0.4,0.2,/>代表三种基础分类器,/>为门脉高压无创评估模型的评估结果,/>的取值为0,1,2,3;其中,0代表没有患门脉高压症,1代表可能患有门脉高压症,2代表确定患有门脉高压症,3代表患有严重的门脉高压症。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110938393.0A CN113658700B (zh) | 2021-08-16 | 2021-08-16 | 一种基于机器学习的门脉高压无创评估方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110938393.0A CN113658700B (zh) | 2021-08-16 | 2021-08-16 | 一种基于机器学习的门脉高压无创评估方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113658700A CN113658700A (zh) | 2021-11-16 |
CN113658700B true CN113658700B (zh) | 2023-10-27 |
Family
ID=78479269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110938393.0A Active CN113658700B (zh) | 2021-08-16 | 2021-08-16 | 一种基于机器学习的门脉高压无创评估方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113658700B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116894973B (zh) * | 2023-07-06 | 2024-05-03 | 北京长木谷医疗科技股份有限公司 | 一种基于集成学习的髋关节病变智能自标注方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3440568A1 (de) * | 1984-11-07 | 1986-05-15 | Robert Bosch Gmbh, 7000 Stuttgart | Hochdrucksensor |
CN107945878A (zh) * | 2017-11-16 | 2018-04-20 | 祁小龙 | 一种基于放射组学的肝静脉压力梯度计算模型的构建方法 |
CN110074809A (zh) * | 2019-06-17 | 2019-08-02 | 祁小龙 | Ct图像的肝静脉压力梯度分类方法以及计算机设备 |
CN110755104A (zh) * | 2019-11-05 | 2020-02-07 | 四川大学华西医院 | 基于3d多通道卷积神经网络的肝硬化门脉高压无创评估方法 |
CN111128396A (zh) * | 2019-12-20 | 2020-05-08 | 山东大学齐鲁医院 | 一种基于深度学习的消化道疾病辅助诊断系统 |
CN111915698A (zh) * | 2020-08-21 | 2020-11-10 | 南方科技大学 | 一种脉管浸润检测方法、装置、计算机设备及存储介质 |
CN112967778A (zh) * | 2021-03-17 | 2021-06-15 | 复旦大学附属华山医院 | 基于机器学习的炎症性肠病精准用药方法及系统 |
-
2021
- 2021-08-16 CN CN202110938393.0A patent/CN113658700B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3440568A1 (de) * | 1984-11-07 | 1986-05-15 | Robert Bosch Gmbh, 7000 Stuttgart | Hochdrucksensor |
CN107945878A (zh) * | 2017-11-16 | 2018-04-20 | 祁小龙 | 一种基于放射组学的肝静脉压力梯度计算模型的构建方法 |
CN110074809A (zh) * | 2019-06-17 | 2019-08-02 | 祁小龙 | Ct图像的肝静脉压力梯度分类方法以及计算机设备 |
CN110755104A (zh) * | 2019-11-05 | 2020-02-07 | 四川大学华西医院 | 基于3d多通道卷积神经网络的肝硬化门脉高压无创评估方法 |
CN111128396A (zh) * | 2019-12-20 | 2020-05-08 | 山东大学齐鲁医院 | 一种基于深度学习的消化道疾病辅助诊断系统 |
CN111915698A (zh) * | 2020-08-21 | 2020-11-10 | 南方科技大学 | 一种脉管浸润检测方法、装置、计算机设备及存储介质 |
CN112967778A (zh) * | 2021-03-17 | 2021-06-15 | 复旦大学附属华山医院 | 基于机器学习的炎症性肠病精准用药方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113658700A (zh) | 2021-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111539930B (zh) | 基于深度学习的动态超声乳腺结节实时分割与识别的方法 | |
Pinaya et al. | Unsupervised brain imaging 3D anomaly detection and segmentation with transformers | |
CN112529894B (zh) | 一种基于深度学习网络的甲状腺结节的诊断方法 | |
CN110197713B (zh) | 一种医疗影像的处理方法、装置、设备和介质 | |
Chen et al. | 3D intracranial artery segmentation using a convolutional autoencoder | |
Wang et al. | Frnet: an end-to-end feature refinement neural network for medical image segmentation | |
CN111476757A (zh) | 一种冠脉斑块数据检测方法、系统、存储介质、终端 | |
CN113205537B (zh) | 基于深度学习的血管图像分割方法、装置、设备及介质 | |
US20220284583A1 (en) | Computerised tomography image processing | |
JP2023540910A (ja) | 病変検出のための共同訓練を伴う接続機械学習モデル | |
Iqbal et al. | MDA-Net: Multiscale dual attention-based network for breast lesion segmentation using ultrasound images | |
US20220164957A1 (en) | Recognition method of intracranial vascular lesions based on transfer learning | |
CN113012163A (zh) | 一种基于多尺度注意力网络的视网膜血管分割方法、设备及存储介质 | |
CN113658700B (zh) | 一种基于机器学习的门脉高压无创评估方法及系统 | |
CN115018863A (zh) | 基于深度学习的图像分割方法及装置 | |
Nie et al. | Recent advances in diagnosis of skin lesions using dermoscopic images based on deep learning | |
CN114663445A (zh) | 一种基于多尺度边缘感知的三维心脏图像分割方法 | |
Tan et al. | A lightweight network guided with differential matched filtering for retinal vessel segmentation | |
Hu et al. | Automatic placenta abnormality detection using convolutional neural networks on ultrasound texture | |
WO2021046418A1 (en) | Systems and methods for detection and grading of diabetic retinopathy | |
Vila et al. | Last advances on automatic carotid artery analysis in ultrasound images: towards deep learning | |
US20220028067A1 (en) | Systems and Methods for Quantifying Vessel Features in Ultrasound Doppler Images | |
CN112862785B (zh) | Cta影像数据识别方法、装置及存储介质 | |
Zhan et al. | Recognition of angiographic atherosclerotic plaque development based on deep learning | |
Van Do et al. | Segmentation of hard exudate lesions in color fundus image using two-stage CNN-based methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |