CN114317711A - 非酒精性脂肪肝的预测方法及装置 - Google Patents
非酒精性脂肪肝的预测方法及装置 Download PDFInfo
- Publication number
- CN114317711A CN114317711A CN202111645112.9A CN202111645112A CN114317711A CN 114317711 A CN114317711 A CN 114317711A CN 202111645112 A CN202111645112 A CN 202111645112A CN 114317711 A CN114317711 A CN 114317711A
- Authority
- CN
- China
- Prior art keywords
- fatty liver
- data
- liver
- classification
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000008338 non-alcoholic fatty liver disease Diseases 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000001514 detection method Methods 0.000 claims abstract description 41
- 239000003153 chemical reaction reagent Substances 0.000 claims abstract description 16
- 239000000090 biomarker Substances 0.000 claims abstract description 5
- 208000004930 Fatty Liver Diseases 0.000 claims description 212
- 206010019708 Hepatic steatosis Diseases 0.000 claims description 177
- 208000010706 fatty liver disease Diseases 0.000 claims description 174
- 231100000240 steatosis hepatitis Toxicity 0.000 claims description 156
- 239000000523 sample Substances 0.000 claims description 108
- 238000013145 classification model Methods 0.000 claims description 68
- 210000004185 liver Anatomy 0.000 claims description 42
- 210000002966 serum Anatomy 0.000 claims description 42
- 230000004927 fusion Effects 0.000 claims description 30
- 238000003066 decision tree Methods 0.000 claims description 26
- 108090000623 proteins and genes Proteins 0.000 claims description 22
- 238000004422 calculation algorithm Methods 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 15
- 102000003973 Fibroblast growth factor 21 Human genes 0.000 claims description 13
- 108090000376 Fibroblast growth factor 21 Proteins 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 9
- 102000004169 proteins and genes Human genes 0.000 claims description 8
- 238000007477 logistic regression Methods 0.000 claims description 7
- 238000011529 RT qPCR Methods 0.000 claims description 6
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 238000012165 high-throughput sequencing Methods 0.000 claims description 4
- 238000007901 in situ hybridization Methods 0.000 claims description 4
- 238000012417 linear regression Methods 0.000 claims description 4
- 150000007523 nucleic acids Chemical group 0.000 claims description 4
- 238000003757 reverse transcription PCR Methods 0.000 claims description 4
- -1 IP10 Chemical compound 0.000 claims description 3
- 102000004877 Insulin Human genes 0.000 claims description 3
- 108090001061 Insulin Proteins 0.000 claims description 3
- 229940125396 insulin Drugs 0.000 claims description 3
- 238000002156 mixing Methods 0.000 claims description 3
- 230000008447 perception Effects 0.000 claims description 3
- 238000007637 random forest analysis Methods 0.000 claims description 3
- 238000012706 support-vector machine Methods 0.000 claims description 3
- 238000008157 ELISA kit Methods 0.000 claims description 2
- 210000004369 blood Anatomy 0.000 claims description 2
- 239000008280 blood Substances 0.000 claims description 2
- 238000001378 electrochemiluminescence detection Methods 0.000 claims description 2
- 238000000684 flow cytometry Methods 0.000 claims description 2
- 238000003018 immunoassay Methods 0.000 claims description 2
- 238000003119 immunoblot Methods 0.000 claims description 2
- 238000003317 immunochromatography Methods 0.000 claims description 2
- 238000013115 immunohistochemical detection Methods 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000003745 diagnosis Methods 0.000 abstract description 3
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 38
- 108010082126 Alanine transaminase Proteins 0.000 description 38
- 238000010586 diagram Methods 0.000 description 5
- 235000018102 proteins Nutrition 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 208000008964 Chemical and Drug Induced Liver Injury Diseases 0.000 description 1
- 206010072268 Drug-induced liver injury Diseases 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 208000027761 Hepatic autoimmune disease Diseases 0.000 description 1
- 208000005176 Hepatitis C Diseases 0.000 description 1
- 206010067125 Liver injury Diseases 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 231100000753 hepatic injury Toxicity 0.000 description 1
- 208000005252 hepatitis A Diseases 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 208000019423 liver disease Diseases 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000010197 meta-analysis Methods 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 206010036067 polydipsia Diseases 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
Images
Landscapes
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及非酒精性脂肪肝的预测方法及装置。本申请一方面公开了一种将生物标志物ALT和TC联合用于非酒精性脂肪肝检测的试剂及其应用,该诊断试剂具有很好的诊断效能。另一方面公开了一种基于样本的临床指标和实验室指标,建立无创的非酒精性脂肪肝的预测方法和装置,为临床上对非酒精性脂肪肝的准确诊断奠定基础。
Description
技术领域
本发明涉及智能医疗技术领域,更具体地,涉及一种非酒精性脂肪肝的检测试剂、用途、预测方法、装置、系统及存储介质。
背景技术
非酒精性脂肪肝(NAFLD)是除过量饮酒和其他明确肝损伤因素所导致的肝细胞内脂肪沉淀,已经成为全球范围内的公共卫生挑战,经济的快速增长和生活方式的改变促使非酒精性脂肪肝在中国的发病率激。一项荟萃分析包括来自392项研究显示,目前中国NAFLD患病率为29.2%,已经超过全球NAFLD患病率(25%)。肝脏穿刺仍为诊断该病的金标准,目前尚未出现较好的通过无创方法用来精准评价和诊断该病的方法。
发明内容
为解决上述问题,我们提供了一种基于样本的临床指标和实验室指标(血清检测数据、肝脏硬度数据和肝脏脂肪变性数据)建立无创的非酒精性脂肪肝的检测试剂、预测方法、装置、系统及存储介质,为临床上对非酒精性脂肪肝的准确诊断奠定基础。
本申请公开了一种用于非酒精性脂肪肝检测的试剂及其应用,其特征在于,所述试剂包含检测样本中生物标志物的试剂,所述生物标志物为ALT和TC;
可选的,所述试剂包括:通过RT-PCR、实时定量PCR、免疫检测、原位杂交、芯片或高通量测序平台检测ALT和TC基因表达水平以诊断非酒精性脂肪肝的试剂;
优选的,所述用RT-PCR诊断非酒精性脂肪肝的产品至少包括一对特异扩增ALT和TC基因的引物;所述用实时定量PCR诊断非酒精性脂肪肝的产品至少包括一对特异扩增ALT和TC基因的引物;所述用免疫检测诊断非酒精性脂肪肝的产品包括:与ALT和TC蛋白特异性结合的抗体;所述用原位杂交诊断非酒精性脂肪肝的产品包括:与ALT和TC基因的核酸序列杂交的探针;所述用芯片诊断非酒精性脂肪肝的产品包括:蛋白芯片和基因芯片;其中,蛋白芯片包括与ALT和TC蛋白特异性结合的抗体,基因芯片包括与ALT和TC基因的核酸序列杂交的探针;
可选的,所述试剂包括芯片、试剂盒、试纸或高通量测序平台;优选的,试剂盒包括qPCR试剂盒、ELISA试剂盒、免疫印迹检测试剂盒、免疫层析检测试剂盒、免疫组化检测试剂盒、流式细胞分析试剂盒、电化学发光检测试剂盒;
可选的,所述样本包括组织、血液
本申请公开了一种非酒精性脂肪肝的预测方法,包括:
获取样本的血清检测数据、肝脏硬度数据和肝脏脂肪变性数据;
将所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据输入训练好的脂肪肝分类模型中,得到样本的第一分类结果;
将所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据输入训练好的LFC含量回归模型中,得到LFC含量预测值,基于所述LFC含量预测值得到样本的第二分类结果;
将所述第一分类结果和第二分类结果进行结果融合,得到样本非酒精性脂肪肝风险的分类结果。
进一步,所述血清检测数据包括:AST、ALT、TC、CK18、insulin、IP10、PLT的数据;所述肝脏硬度数据包括LSM的数据;所述肝脏脂肪变性数据包括CAP的数据;优选的,将血清检测数据、肝脏硬度数据和肝脏脂肪变性数据进行归一化处理。
进一步,所述脂肪肝分类模型包括有无脂肪肝分类模型,所述有无脂肪肝分类模型用于判断样本是否为脂肪肝,给出第一分类结果为有脂肪肝或无脂肪肝;
优选的,所述脂肪肝分类模型包括有无脂肪肝分类模型和轻重度脂肪肝分类模型,当判定结果为无脂肪肝,终止分类,给出第一分类结果为无脂肪肝;当判定结果为有脂肪肝,将所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据输入轻重度脂肪肝分类模型,给出第一分类结果为轻度脂肪肝或中-重度脂肪肝;
优选的,所述分类模型选自下列机器学习模型算法中的一种或几种:逻辑回归算法、朴素贝叶斯分类、支持向量机分类、支持向量机线性分类、k近邻、决策树、随机森林、xgboost、感知机算法。
进一步,所述LFC含量回归模型选自下列机器学习模型算法中的一种或几种用于计算样本LFC的含量预测值:线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归、弹性回归;优选的,所述LFC含量回归模型采用回归决策树算法计算样本LFC的含量预测值;
可选的,所述第二分类结果为无脂肪肝或轻度脂肪肝或中-重度脂肪肝。
进一步,所述脂肪肝分类模型包括特征提取模块和分类器,所述特征提取模块用于提取所述样本的血清检测数据、肝脏硬度数据和肝脏脂肪变性数据中的数据特征,将所述数据特征输入所述分类器中,得到分类结果;
所述LFC含量回归模型包括特征提取模块和回归模块,所述特征提取模块用于提取所述样本的血清检测数据、肝脏硬度数据和肝脏脂肪变性数据中的数据特征,将所述数据特征输入所述回归模块中,得到LFC含量预测值。
进一步,所述结果融合可采用下列类型中的一种或几种:简单加权融合、stacking、blending、boosting或bagging;优选的,所述简单加权融合包括算术平均融合、投票或排序融合。
一种非酒精性脂肪肝的预测系统,包括:
获取单元,用于获取样本的血清检测数据、肝脏硬度数据和肝脏脂肪变性数据;
特征提取单元,用于提取样本的所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据中的ALT、TC、CAP、AST、TB、FGF21数据特征;
第一分类单元,用于将所述ALT、TC、CAP、AST和TB数据特征输入训练好的脂肪肝分类模型中,得到样本的第一分类结果;
优选的,所述脂肪肝分类模型首先基于ALT或ALT和TC数据特征判断样本是否为脂肪肝,给出第一分类结果为有脂肪肝或无脂肪肝,当判定结果为无脂肪肝,终止分类,给出第一分类结果为无脂肪肝;当判定结果为有脂肪肝,将基于CAP或CAP和AST或CAP和AST和TB数据特征判断样本为轻度脂肪肝或中-重度脂肪肝,给出第一分类结果为轻度脂肪肝或中-重度脂肪肝;
第二分类单元,用于将所述CAP、FGF21、ALT数据特征输入训练好的LFC含量回归模型中,得到LFC含量预测值,基于所述LFC含量预测值得到样本的第二分类结果,所述第二分类结果为无脂肪肝或轻度脂肪肝或中-重度脂肪肝;
优选的,所述LFC含量回归模型基于CAP和FGF21或CAP和ALT数据特征预测样本LFC含量预测值;
融合单元,用于将所述第一分类结果和第二分类结果进行结果加权融合,得到样本非酒精性脂肪肝风险的分类结果。
一种非酒精性脂肪肝的预测系统,其特征在于,包括:
获取单元,用于获取样本的血清检测数据、肝脏硬度数据和肝脏脂肪变性数据;
第一分类单元,用于将所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据输入训练好的脂肪肝分类模型中,得到样本的第一分类结果;
第二分类单元,用于将所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据输入训练好的LFC含量回归模型中,得到LFC含量预测值,基于所述LFC含量预测值得到样本的第二分类结果;
融合单元,用于将所述第一分类结果和第二分类结果进行结果融合,得到样本非酒精性脂肪肝风险的分类结果。
一种非酒精性脂肪肝的预测装置,包括:存储器和处理器;
所述存储器用于存储程序指令;
所述处理器用于调用程序指令,当程序指令被执行时实现上述的非酒精性脂肪肝的预测方法步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的非酒精性脂肪肝的预测方法步骤。
本申请的优点:
1.本申请将有无脂肪肝分类模型和轻重度脂肪肝分类模型组合成脂肪肝分类模型,得到第一分类结果,不仅预测有无脂肪肝,还可实现对脂肪肝程度的进一步细分;
2.本申请结合血清检测数据和FibroScan数据,通过FibroScan数据和血清检测数据预测LFC含量,基于所述LFC含量得到非酒精性脂肪肝的预测结果,实现了非酒精性脂肪肝的无创诊断;
3.本申请将脂肪肝分类模型的第一分类结果和基于LFC含量得到第二分类结果进行融合,大大提高预测的准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获取其他的附图。
图1是本发明实施例提供的一种非酒精性脂肪肝的预测方法示意流程图;
图2是本发明实施例提供的一种非酒精性脂肪肝的预测装置示意图;
图3是本发明实施例提供的一种非酒精性脂肪肝的预测系统示意图;
图4是本发明实施例提供的无脂肪肝决策树分类模型示意图;
图5是本发明实施例提供的轻重度脂肪肝决策树分类模型示意图;
图6是本发明实施例提供的LFC含量回归模型示意图;
图7是本发明实施例提供的ALT和TC联合诊断效能图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的一种非酒精性脂肪肝的预测方法示意流程图,具体地,所述方法包括如下步骤:
101:获取样本的血清检测数据、肝脏硬度数据和肝脏脂肪变性数据;
在一个实施例中,所述血清检测数据包括:AST、ALT、TC、CK18、insulin、IP10、PLT的数据;所述肝脏硬度数据包括LSM的数据;所述肝脏脂肪变性数据包括CAP的数据;优选的,采用MRI-PDFF、FibroScan等方法获取样本的肝脏硬度数据和肝脏脂肪变性数据。更优选的,纳入脂肪肝检测中常用的实验室和临床指标作为样本的数据。
在一个具体实施例中,将得到的血清检测数据、肝脏硬度数据和肝脏脂肪变性数据进行预处理,优选的,预处理包括归一化处理。
102:将所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据输入训练好的脂肪肝分类模型中,得到样本的第一分类结果;
在一个实施例中,所述脂肪肝分类模型包括有无脂肪肝分类模型,所述有无脂肪肝分类模型用于判断样本是否为脂肪肝,给出第一分类结果为有脂肪肝或无脂肪肝;优选的,所述脂肪肝分类模型包括有无脂肪肝分类模型和轻重度脂肪肝分类模型,当判定结果为无脂肪肝,终止分类,给出第一分类结果为无脂肪肝;当判定结果为有脂肪肝,将所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据输入轻重度脂肪肝分类模型,给出第一分类结果为轻度脂肪肝或中-重度脂肪肝;
在一个实施例中,所述分类模型选自下列机器学习模型算法中的一种或几种:逻辑回归算法、朴素贝叶斯分类、支持向量机分类、支持向量机线性分类、k近邻、决策树、随机森林、xgboost、感知机算法。
在一个实施例中,所述脂肪肝分类模型包括特征提取模块和分类器,所述特征提取模块用于提取所述样本的血清检测数据、肝脏硬度数据和肝脏脂肪变性数据中的数据特征,将所述数据特征输入所述分类器中,得到分类结果。
103:将所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据输入训练好的LFC含量回归模型中,得到LFC含量预测值,基于所述LFC含量预测值得到样本的第二分类结果;
在一个实施例中,所述LFC含量回归模型选自下列机器学习模型算法中的一种或几种用于计算样本LFC的含量预测值:线性回归(Linear Regression)、逻辑回归(LogisticRegression)、多项式回归(Polynomial Regression)、逐步回归(Stepwise Regression)、岭回归(Ridge Regression)、套索回归(Lasso Regression)、弹性回归(ElasticNetRegression);优选的,所述LFC含量回归模型采用回归决策树算法计算样本LFC的含量预测值;可选的,所述第二分类结果为无脂肪肝或轻度脂肪肝或中-重度脂肪肝。
在一个实施例中,所述LFC含量回归模型包括特征提取模块和回归模块,所述特征提取模块用于提取所述样本的血清检测数据、肝脏硬度数据和肝脏脂肪变性数据中的数据特征,将所述数据特征输入所述回归模块中,得到LFC含量预测值。
在一个实施例中,所述基于所述LFC含量预测值得到样本的第二分类结果的具体分类为:无脂肪肝:LFC含量预测值≤5.1%;轻度脂肪肝组:5.1%<LFC含量预测值<14.1%;中-重度脂肪肝组:14.1%<LFC含量预测值。
104:将所述第一分类结果和第二分类结果进行结果融合,得到样本非酒精性脂肪肝风险的分类结果。
在一个实施例中,所述结果融合可采用下列类型中的一种或几种:简单加权融合、stacking、blending、boosting或bagging;优选的,所述简单加权融合包括算术平均融合、投票或排序融合。
图2是本发明实施例提供的一种非酒精性脂肪肝的预测装置,所述装置包括:存储器和处理器;
所述存储器用于存储程序指令;
所述处理器用于调用程序指令,当程序指令被执行时实现上述非酒精性脂肪肝的预测方法步骤。
图3是本发明实施例提供的一种非酒精性脂肪肝的预测系统,包括:
获取单元301,用于获取样本的血清检测数据、肝脏硬度数据和肝脏脂肪变性数据;
第一分类单元302,用于将所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据输入训练好的脂肪肝分类模型中,得到样本的第一分类结果;
第二分类单元303,用于将所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据输入训练好的LFC含量回归模型中,得到LFC含量预测值,基于所述LFC含量预测值得到样本的第二分类结果;
融合单元304,用于将所述第一分类结果和第二分类结果进行结果融合,得到样本非酒精性脂肪肝风险的分类结果。
在一个具体实施例中,一种非酒精性脂肪肝的预测系统,包括:
获取单元,用于获取样本的血清检测数据、肝脏硬度数据和肝脏脂肪变性数据;
特征提取单元,用于提取样本的所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据中的ALT、TC、CAP、AST、TB、FGF21数据特征;
第一分类单元,用于将所述ALT、TC、CAP、AST和TB数据特征输入训练好的脂肪肝分类模型中,得到样本的第一分类结果;优选的,所述脂肪肝分类模型首先基于ALT或ALT和TC数据特征判断样本是否为脂肪肝,给出第一分类结果为有脂肪肝或无脂肪肝,当判定结果为无脂肪肝,终止分类,给出第一分类结果为无脂肪肝;当判定结果为有脂肪肝,将基于CAP或CAP和AST或CAP和AST和TB数据特征判断样本为轻度脂肪肝或中-重度脂肪肝,给出第一分类结果为轻度脂肪肝或中-重度脂肪肝;
优选的,所述脂肪肝分类模型包括无脂肪肝决策树分类模型和轻重度脂肪肝决策树分类模型,所述无脂肪肝决策树分类模型首先根据ALT的阈值进行判定,若样本数据的ALT数据不小于ALT的阈值的可直接分类,若样本数据的ALT数据小于ALT的阈值,继而用样本的TC数据进行分类,比较样本的TC数据和TC的阈值的大小,给出第一分类结果为有脂肪肝或无脂肪肝,当判定结果为无脂肪肝,终止分类,给出第一分类结果为无脂肪肝;当判定结果为有脂肪肝,将样本数据输入轻重度脂肪肝决策树分类模型,所述轻重度脂肪肝决策树分类模型基于CAP的阈值进行判定,若样本数据的CAP数据小于CAP的阈值的可直接分类,若样本数据的CAP数据不小于CAP的阈值,继而用样本的AST数据进行分类,若样本的AST数据不小于AST的阈值,可直接分类,若样本数据的AST数据小于AST的阈值,继续用TB数据进行分类,比较样本的TB数据和TB的阈值的大小,给出样本的第一分类结果为轻度脂肪肝或中-重度脂肪肝。
第二分类单元,用于将所述CAP、FGF21、ALT数据特征输入训练好的LFC含量回归模型中,得到LFC含量预测值,基于所述LFC含量预测值得到样本的第二分类结果,所述第二分类结果为无脂肪肝或轻度脂肪肝或中-重度脂肪肝;优选的,所述LFC含量回归模型基于CAP和FGF21或CAP和ALT数据特征预测样本LFC含量预测值;
优选的,所述LFC含量回归模型首先根据CAP的阈值进行判定,若样本数据的CAP数据不小于ALT的阈值,继而用样本的ALT数据进行分类,比较样本的ALT数据和ALT的阈值的大小,给出LFC含量预测值;若样本数据的CAP数据小于CAP的阈值,继而用样本的FGF21数据进行分类,比较样本的FGF21数据和FGF21的阈值的大小,给出LFC含量预测值,基于所述LFC含量预测值得到样本的第二分类结果:无脂肪肝:LFC含量预测值≤5.1%;轻度脂肪肝组:5.1%<LFC含量预测值<14.1%;中-重度脂肪肝组:14.1%<LFC含量预测值。
融合单元,用于将所述第一分类结果和第二分类结果进行结果加权融合,得到样本非酒精性脂肪肝风险的分类结果。
在一个具体实施例中,所述第一分类单元中的脂肪肝分类模型为决策树分类模型,所述决策树分类模型的构建步骤为:从所述样本中的实验室和临床指标数据选择数据特征,并根据数据特征的重要度,构建子节点,使越重要的数据特征越靠近根节点,对初步获得的决策树分类模型经过修剪,目的是获得不会过度拟合的决策树分类模型。优选的,所述脂肪肝分类模型为无脂肪肝决策树分类模型,具体如图4所示。更优选的,所述脂肪肝分类模型还包括轻重度脂肪肝决策树分类模型(具体如图5所示),当有无脂肪肝决策树分类模型判定结果为无脂肪肝,终止分类,给出第一分类结果为无脂肪肝;当有无脂肪肝决策树分类模型判定结果为有脂肪肝,将样本的数据输入轻重度脂肪肝决策树分类模型中,给出第一分类结果为轻度脂肪肝或中-重度脂肪肝。
在一个具体实施例中,所述无脂肪肝决策树分类模型(具体如图4所示)基于样本的ALT和TC数据特征,给出分类结果为有脂肪肝或无脂肪肝,当判定结果为无脂肪肝,终止分类,给出第一分类结果为无脂肪肝。所述脂肪肝分类模型还包括轻重度脂肪肝决策树分类模型(具体如图5所示),当判定结果为有脂肪肝,轻重度脂肪肝决策树分类模型将基于CAP、AST和TB数据特征判断样本为轻度脂肪肝或中-重度脂肪肝,给出第一分类结果为轻度脂肪肝或中-重度脂肪肝。
在一个具体实施例中,所述LFC含量回归模型采用回归决策树算法计算样本LFC的含量预测值,具体如图6所示。将样本的数据输入LFC含量回归模型,得到LFC含量预测值,基于所述LFC含量预测值得到样本的第二分类结果:无脂肪肝:LFC含量预测值≤5.1%;轻度脂肪肝组:5.1%<LFC含量预测值<14.1%;中-重度脂肪肝组:14.1%<LFC含量预测值。
在一个具体实施例中,将样本的数据输入LFC含量回归模型,LFC含量回归模型基于CAP、FGF21、ALT数据特征,具体如图6所示,得到LFC含量预测值,基于所述LFC含量预测值得到样本的第二分类结果:无脂肪肝:LFC含量预测值≤5.1%;轻度脂肪肝组:5.1%<LFC含量预测值<14.1%;中-重度脂肪肝组:14.1%<LFC含量预测值。
在一个具体实施例中,对医院收集的460个患者样本(纳排标准如下所示)采用ALT和TC两个指标作为非酒精性脂肪肝检测标志物进行检测,结果如图7所示(Cut Off:0.725,Sensitivity:0.759,Specificity:0.733,AUC=0.789),显示ALT和TC联合作为非酒精性脂肪肝检测标志物具有很好的诊断效能。
纳排标准,受试者需同时满足以下条件:(1)年龄18-75岁;(2)超声提示脂肪肝;(3)丙氨酸氨基转移酶(ALT)>40U/L;(4)不是甲肝、乙肝、丙肝或其他病毒性肝病患者;(5)不是药物性肝损伤或自身免疫性肝病患者;(6)男性饮酒折合乙醇量小于30克/每天,女性小于20克/每天。
本发明的一个目的在于提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述的非酒精性脂肪肝的预测方法步骤。
本验证实施例的验证结果表明,为适应症分配固有权重相对于默认设置来说可以适度改善本方法的性能。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上对本发明所提供的一种计算机设备进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种用于非酒精性脂肪肝检测的试剂及其应用,其特征在于,所述试剂包含检测样本中生物标志物的试剂,所述生物标志物为ALT和TC;
可选的,所述试剂包括:通过RT-PCR、实时定量PCR、免疫检测、原位杂交、芯片或高通量测序平台检测ALT和TC基因表达水平以诊断非酒精性脂肪肝的试剂;
优选的,所述用RT-PCR诊断非酒精性脂肪肝的产品至少包括一对特异扩增ALT和TC基因的引物;所述用实时定量PCR诊断非酒精性脂肪肝的产品至少包括一对特异扩增ALT和TC基因的引物;所述用免疫检测诊断非酒精性脂肪肝的产品包括:与ALT和TC蛋白特异性结合的抗体;所述用原位杂交诊断非酒精性脂肪肝的产品包括:与ALT和TC基因的核酸序列杂交的探针;所述用芯片诊断非酒精性脂肪肝的产品包括:蛋白芯片和基因芯片;其中,蛋白芯片包括与ALT和TC蛋白特异性结合的抗体,基因芯片包括与ALT和TC基因的核酸序列杂交的探针;
可选的,所述试剂包括芯片、试剂盒、试纸或高通量测序平台;优选的,试剂盒包括qPCR试剂盒、ELISA试剂盒、免疫印迹检测试剂盒、免疫层析检测试剂盒、免疫组化检测试剂盒、流式细胞分析试剂盒、电化学发光检测试剂盒;
可选的,所述样本包括组织、血液。
2.一种非酒精性脂肪肝的预测方法,包括:
获取样本的血清检测数据、肝脏硬度数据和肝脏脂肪变性数据;
将所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据输入训练好的脂肪肝分类模型中,得到样本的第一分类结果;
将所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据输入训练好的LFC含量回归模型中,得到LFC含量预测值,基于所述LFC含量预测值得到样本的第二分类结果;
将所述第一分类结果和第二分类结果进行结果融合,得到样本非酒精性脂肪肝风险的分类结果。
3.根据权利要求1中所述的非酒精性脂肪肝的预测方法,其特征在于,所述血清检测数据包括:AST、ALT、TC、CK18、insulin、IP10、PLT的数据;所述肝脏硬度数据包括LSM的数据;所述肝脏脂肪变性数据包括CAP的数据;可选的,将血清检测数据、肝脏硬度数据和肝脏脂肪变性数据进行预处理,优选的,所述预处理包括归一化处理。
4.根据权利要1中所述的非酒精性脂肪肝的预测方法,其特征在于,所述脂肪肝分类模型包括有无脂肪肝分类模型,所述有无脂肪肝分类模型用于判断样本是否为脂肪肝,给出第一分类结果为有脂肪肝或无脂肪肝;
优选的,所述脂肪肝分类模型包括有无脂肪肝分类模型和轻重度脂肪肝分类模型,当判定结果为无脂肪肝,终止分类,给出第一分类结果为无脂肪肝;当判定结果为有脂肪肝,将所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据输入轻重度脂肪肝分类模型,给出第一分类结果为轻度脂肪肝或中-重度脂肪肝;
优选的,所述分类模型选自下列机器学习模型算法中的一种或几种:逻辑回归算法、朴素贝叶斯分类、支持向量机分类、支持向量机线性分类、k近邻、决策树、随机森林、xgboost、感知机算法。
5.根据权利要求3中所述的非酒精性脂肪肝的预测方法,其特征在于,所述LFC含量回归模型选自下列机器学习模型算法中的一种或几种用于计算样本LFC的含量预测值:线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归、弹性回归;优选的,所述LFC含量回归模型采用回归决策树算法计算样本LFC的含量预测值;
可选的,所述第二分类结果为无脂肪肝或轻度脂肪肝或中-重度脂肪肝。
6.根据权利要求1中所述的非酒精性脂肪肝的预测方法,其特征在于,所述脂肪肝分类模型包括特征提取模块和分类器,所述特征提取模块用于提取所述样本的血清检测数据、肝脏硬度数据和肝脏脂肪变性数据中的数据特征,将所述数据特征输入所述分类器中,得到分类结果;
可选的,所述LFC含量回归模型包括特征提取模块和回归模块,所述特征提取模块用于提取所述样本的血清检测数据、肝脏硬度数据和肝脏脂肪变性数据中的数据特征,将所述数据特征输入所述回归模块中,得到LFC含量预测值;
可选的,所述结果融合可采用下列类型中的一种或几种:简单加权融合、stacking、blending、boosting或bagging;优选的,所述简单加权融合包括算术平均融合、投票或排序融合。
7.一种非酒精性脂肪肝的预测系统,包括:
获取单元,用于获取样本的血清检测数据、肝脏硬度数据和肝脏脂肪变性数据;
特征提取单元,用于提取样本的所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据中的ALT、TC、CAP、AST、TB、FGF21数据特征;
第一分类单元,用于将所述ALT、TC、CAP、AST和TB数据特征输入训练好的脂肪肝分类模型中,得到样本的第一分类结果;优选的,所述脂肪肝分类模型首先基于ALT或ALT和TC数据特征判断样本是否为脂肪肝,给出第一分类结果为有脂肪肝或无脂肪肝,当判定结果为无脂肪肝,终止分类,给出第一分类结果为无脂肪肝;当判定结果为有脂肪肝,将基于CAP或CAP和AST或CAP和AST和TB数据特征判断样本为轻度脂肪肝或中-重度脂肪肝,给出第一分类结果为轻度脂肪肝或中-重度脂肪肝;
第二分类单元,用于将所述CAP、FGF21、ALT数据特征输入训练好的LFC含量回归模型中,得到LFC含量预测值,基于所述LFC含量预测值得到样本的第二分类结果,所述第二分类结果为无脂肪肝或轻度脂肪肝或中-重度脂肪肝;优选的,所述LFC含量回归模型基于CAP和FGF21或CAP和ALT数据特征预测样本LFC含量预测值;
融合单元,用于将所述第一分类结果和第二分类结果进行结果加权融合,得到样本非酒精性脂肪肝风险的分类结果。
8.一种非酒精性脂肪肝的预测系统,其特征在于,包括:
获取单元,用于获取样本的血清检测数据、肝脏硬度数据和肝脏脂肪变性数据;
第一分类单元,用于将所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据输入训练好的脂肪肝分类模型中,得到样本的第一分类结果;
第二分类单元,用于将所述血清检测数据、肝脏硬度数据和肝脏脂肪变性数据输入训练好的LFC含量回归模型中,得到LFC含量预测值,基于所述LFC含量预测值得到样本的第二分类结果;
融合单元,用于将所述第一分类结果和第二分类结果进行结果融合,得到样本非酒精性脂肪肝风险的分类结果。
9.一种非酒精性脂肪肝的预测装置,包括:存储器和处理器;
所述存储器用于存储程序指令;
所述处理器用于调用程序指令,当程序指令被执行时实现权利要求2-6任意一项所述的非酒精性脂肪肝的预测方法步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求2-6任意一项所述的非酒精性脂肪肝的预测方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111645112.9A CN114317711A (zh) | 2021-12-30 | 2021-12-30 | 非酒精性脂肪肝的预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111645112.9A CN114317711A (zh) | 2021-12-30 | 2021-12-30 | 非酒精性脂肪肝的预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114317711A true CN114317711A (zh) | 2022-04-12 |
Family
ID=81017715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111645112.9A Pending CN114317711A (zh) | 2021-12-30 | 2021-12-30 | 非酒精性脂肪肝的预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114317711A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004191129A (ja) * | 2002-12-10 | 2004-07-08 | Seiri Kagaku Kenkyusho:Kk | 抗体または抗原を用いた病態解析チップおよびその利用法 |
US20200249242A1 (en) * | 2017-07-19 | 2020-08-06 | Bio-Rad Europe Gmbh | Biomarker combinations to simultaneously evaluate non-alcoholic steatohepatitis and hepatic fibrosis status |
CN113611410A (zh) * | 2021-09-08 | 2021-11-05 | 温州医科大学附属第一医院 | 一种脂肪性肝炎风险诊断设备、系统及其残差网络的训练方法 |
-
2021
- 2021-12-30 CN CN202111645112.9A patent/CN114317711A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004191129A (ja) * | 2002-12-10 | 2004-07-08 | Seiri Kagaku Kenkyusho:Kk | 抗体または抗原を用いた病態解析チップおよびその利用法 |
US20200249242A1 (en) * | 2017-07-19 | 2020-08-06 | Bio-Rad Europe Gmbh | Biomarker combinations to simultaneously evaluate non-alcoholic steatohepatitis and hepatic fibrosis status |
CN113611410A (zh) * | 2021-09-08 | 2021-11-05 | 温州医科大学附属第一医院 | 一种脂肪性肝炎风险诊断设备、系统及其残差网络的训练方法 |
Non-Patent Citations (3)
Title |
---|
张婷等: "四川地区中老年体检人群非酒精性脂肪性肝病患病率调查及与代谢相关指标的相关性分析", 《现代预防医学》 * |
李素贞: "血清学指标与非酒精性脂肪性肝病进展期纤维化的相关性及其诊断价值", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》 * |
王治西等: "12项血液生化指标检验在脂肪肝诊断中的临床应用", 《现代职业教育》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109308545A (zh) | 预测患糖尿病几率的方法、装置、计算机设备及存储介质 | |
EP3318995A1 (en) | Methods and apparatus for identifying disease status using biomarkers | |
CN105219844A (zh) | 一种谱筛查十一种疾病的基因标志物组合、试剂盒以及疾病风险预测模型 | |
Blalock et al. | Gene expression analysis of urine sediment: evaluation for potential noninvasive markers of interstitial cystitis/bladder pain syndrome | |
CN105442052A (zh) | 一种检测诊断主动脉夹层病致病基因的dna文库及其应用 | |
CN105506115A (zh) | 一种检测诊断遗传性心肌病致病基因的dna文库及其应用 | |
CN110189824B (zh) | 原发性肝癌根治切除术的预后情况分组方法、装置和系统 | |
CN113223714B (zh) | 一种用于预测子痫前期风险的基因组合、子痫前期风险预测模型及其构建方法 | |
CN107208131A (zh) | 用于肺癌分型的方法 | |
KR101914348B1 (ko) | 암 리스크를 검출하는 방법 | |
Kobashigawa et al. | The evolving use of biomarkers in heart transplantation: consensus of an expert panel | |
CN111192687A (zh) | 一种进展期阑尾炎列线图预测模型及其用途 | |
CN111257558B (zh) | 基于机器学习的慢性淋巴细胞白血病肿瘤细胞识别方法 | |
CN114317711A (zh) | 非酒精性脂肪肝的预测方法及装置 | |
CN103698531A (zh) | Rv1860、Rv0173和/或Rv1812c蛋白在制备诊断活动性肺结核的产品中的用途 | |
CN103698530B (zh) | 结核分支杆菌蛋白在制备诊断活动性肺结核的产品中的用途 | |
CN112557283A (zh) | 一组反复妊娠丢失疾病诊疗免疫标志物及应用 | |
CN107614674A (zh) | 检查系统、检查装置以及检查方法 | |
Yördan et al. | Hybrid AI-Based Chronic Kidney Disease Risk Prediction | |
CN110993092A (zh) | 一种基于n-糖指纹图谱和大数据算法鉴别肝硬化及肝癌的方法 | |
US8969022B2 (en) | Method and system for detecting lymphosarcoma in cats using biomarkers | |
CN103675293A (zh) | Rv3872、Rv0164和/或Rv1926c蛋白在制备诊断活动性肺结核的产品中的用途 | |
CN116047082B (zh) | 一种fgl1蛋白用于制备诊断慢性肾脏病的试剂盒的用途 | |
CN116400075B (zh) | 检测狼疮性肾炎标志物的试剂及方法 | |
CN103675292B (zh) | Rv0174、Rv1729c和/或Rv3835蛋白在制备诊断活动性肺结核的产品中的用途 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220412 |