CN113257428A - 一种川崎病丙球无反应预测方法、存储介质及终端设备 - Google Patents
一种川崎病丙球无反应预测方法、存储介质及终端设备 Download PDFInfo
- Publication number
- CN113257428A CN113257428A CN202110476990.6A CN202110476990A CN113257428A CN 113257428 A CN113257428 A CN 113257428A CN 202110476990 A CN202110476990 A CN 202110476990A CN 113257428 A CN113257428 A CN 113257428A
- Authority
- CN
- China
- Prior art keywords
- kawasaki disease
- lasso
- logistic regression
- clinical
- unresponsive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000011200 Kawasaki disease Diseases 0.000 title claims abstract description 60
- 208000001725 mucocutaneous lymph node syndrome Diseases 0.000 title claims abstract description 60
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000007477 logistic regression Methods 0.000 claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 11
- 238000012216 screening Methods 0.000 claims abstract description 9
- 238000006243 chemical reaction Methods 0.000 claims abstract description 7
- 108010088751 Albumins Proteins 0.000 claims description 12
- 102000009027 Albumins Human genes 0.000 claims description 12
- 210000000440 neutrophil Anatomy 0.000 claims description 12
- 238000011282 treatment Methods 0.000 claims description 12
- 108010003415 Aspartate Aminotransferases Proteins 0.000 claims description 9
- 102000004625 Aspartate Aminotransferases Human genes 0.000 claims description 9
- 210000003979 eosinophil Anatomy 0.000 claims description 9
- 210000003743 erythrocyte Anatomy 0.000 claims description 9
- 102000001554 Hemoglobins Human genes 0.000 claims description 7
- 108010054147 Hemoglobins Proteins 0.000 claims description 7
- FKNQFGJONOIPTF-UHFFFAOYSA-N Sodium cation Chemical compound [Na+] FKNQFGJONOIPTF-UHFFFAOYSA-N 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 229910001415 sodium ion Inorganic materials 0.000 claims description 7
- 102000004169 proteins and genes Human genes 0.000 claims description 6
- 108090000623 proteins and genes Proteins 0.000 claims description 6
- 210000004698 lymphocyte Anatomy 0.000 claims description 5
- 238000004820 blood count Methods 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 4
- 108090000340 Transaminases Proteins 0.000 claims description 3
- 102000003929 Transaminases Human genes 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims description 2
- 210000004027 cell Anatomy 0.000 claims description 2
- 229930195712 glutamate Natural products 0.000 claims description 2
- KHPXUQMNIQBQEV-UHFFFAOYSA-N oxaloacetic acid Chemical compound OC(=O)CC(=O)C(O)=O KHPXUQMNIQBQEV-UHFFFAOYSA-N 0.000 claims description 2
- 206010061926 Purulence Diseases 0.000 claims 1
- 230000035945 sensitivity Effects 0.000 abstract description 9
- 230000004044 response Effects 0.000 abstract description 3
- 230000000007 visual effect Effects 0.000 abstract description 3
- 210000004369 blood Anatomy 0.000 description 7
- 239000008280 blood Substances 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- 208000006331 coronary aneurysm Diseases 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 108060003951 Immunoglobulin Proteins 0.000 description 3
- 230000001154 acute effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 102000018358 immunoglobulin Human genes 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 108010074051 C-Reactive Protein Proteins 0.000 description 2
- 102100032752 C-reactive protein Human genes 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 102000003855 L-lactate dehydrogenase Human genes 0.000 description 2
- 108700023483 L-lactate dehydrogenases Proteins 0.000 description 2
- 108010048233 Procalcitonin Proteins 0.000 description 2
- 238000008050 Total Bilirubin Reagent Methods 0.000 description 2
- YBHILYKTIRIUTE-UHFFFAOYSA-N berberine Chemical compound C1=C2CC[N+]3=CC4=C(OC)C(OC)=CC=C4C=C3C2=CC2=C1OCO2 YBHILYKTIRIUTE-UHFFFAOYSA-N 0.000 description 2
- 229940093265 berberine Drugs 0.000 description 2
- QISXPYZVZJBNDM-UHFFFAOYSA-N berberine Natural products COc1ccc2C=C3N(Cc2c1OC)C=Cc4cc5OCOc5cc34 QISXPYZVZJBNDM-UHFFFAOYSA-N 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 210000004351 coronary vessel Anatomy 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 210000001165 lymph node Anatomy 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- CWCXERYKLSEGEZ-KDKHKZEGSA-N procalcitonin Chemical compound C([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)[C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCSC)NC(=O)[C@H]1NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)[C@@H](N)CSSC1)[C@@H](C)O)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 CWCXERYKLSEGEZ-KDKHKZEGSA-N 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 206010037844 rash Diseases 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 210000003556 vascular endothelial cell Anatomy 0.000 description 2
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 1
- 108010082126 Alanine transaminase Proteins 0.000 description 1
- 102000002723 Atrial Natriuretic Factor Human genes 0.000 description 1
- 101800001288 Atrial natriuretic factor Proteins 0.000 description 1
- 101800001890 Atrial natriuretic peptide Proteins 0.000 description 1
- 206010010741 Conjunctivitis Diseases 0.000 description 1
- 206010011968 Decreased immune responsiveness Diseases 0.000 description 1
- 206010012455 Dermatitis exfoliative Diseases 0.000 description 1
- 241001669679 Eleotris Species 0.000 description 1
- 206010015150 Erythema Diseases 0.000 description 1
- 206010015218 Erythema multiforme Diseases 0.000 description 1
- 208000010201 Exanthema Diseases 0.000 description 1
- 241000285023 Formosa Species 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 102400001263 NT-proBNP Human genes 0.000 description 1
- NPYPAHLBTDXSSS-UHFFFAOYSA-N Potassium ion Chemical compound [K+] NPYPAHLBTDXSSS-UHFFFAOYSA-N 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 206010040047 Sepsis Diseases 0.000 description 1
- 206010040844 Skin exfoliation Diseases 0.000 description 1
- 206010051495 Strawberry tongue Diseases 0.000 description 1
- 206010047115 Vasculitis Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 210000001099 axilla Anatomy 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- DSSYKIVIOFKYAU-UHFFFAOYSA-N camphor Chemical compound C1CC2(C)C(=O)CC1C2(C)C DSSYKIVIOFKYAU-UHFFFAOYSA-N 0.000 description 1
- NSQLIUXCMFBZME-MPVJKSABSA-N carperitide Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)=O)[C@@H](C)CC)C1=CC=CC=C1 NSQLIUXCMFBZME-MPVJKSABSA-N 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000035618 desquamation Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 231100000321 erythema Toxicity 0.000 description 1
- 201000005884 exanthem Diseases 0.000 description 1
- 238000009093 first-line therapy Methods 0.000 description 1
- 238000011010 flushing procedure Methods 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 210000002200 mouth mucosa Anatomy 0.000 description 1
- 238000011119 multifactor regression analysis Methods 0.000 description 1
- 238000012314 multivariate regression analysis Methods 0.000 description 1
- 230000010016 myocardial function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000035778 pathophysiological process Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 210000004976 peripheral blood cell Anatomy 0.000 description 1
- 210000003800 pharynx Anatomy 0.000 description 1
- 229910001414 potassium ion Inorganic materials 0.000 description 1
- 108010008064 pro-brain natriuretic peptide (1-76) Proteins 0.000 description 1
- 201000003068 rheumatic fever Diseases 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 238000011287 therapeutic dose Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了一种川崎病丙球无反应预测方法、存储介质及终端设备,其中,方法包括步骤:运用Lasso对川崎病临床训练数据集进行特征筛选,选出14个与发生IVIGRKD相关的特征;将14个特征进行Logistic回归,构建Lasso‑Logistic回归模型;根据Lasso‑Logistic回归模型绘制列线图,并在每个特征对应线段上标注刻度,表示该特征的取值范围;给每个特征的每个取值水平进行赋分并计算14个特征的总得分,通过总得分与发生IVIGKD概率之间的函数转换关系得出川崎病丙球无反应预测结果。本发明将构建的Lasso‑Logistic回归模型用于预测IVIGRKD具有更高的灵敏度和特异度;还根据Lasso‑Logistic回归模型绘制出可视化的列线图,使得预测模型易于理解;并且临床医生根据病人临床资料数据可在列线图中评分后得出IVIGRKD发生概率,具有临床应用性。
Description
技术领域
本发明涉及儿童川崎病发生丙球无反应的预测技术领域,尤其涉及一种川崎病丙球无反应预测方法、存储介质及终端设备。
背景技术
川崎病(Kawasaki disease,KD)又称皮肤粘膜淋巴结综合征,由日本学者川崎富于1967年首次报道。KD主要发生在5岁以下的儿童,目前病因不明,系急性、自限性的发热出疹血管炎性疾病,可累及全身中、小血管,目前已取代风湿热成为发达国家儿童后天获得性心脏病首位病因,其发病率呈现逐年上升趋势。川崎病的病因及发病机制尚未完全明确,炎症性反应为其主要病理生理学过程。KD的严重并发症是冠状动脉瘤(Coronary arteryaneurysm,CAA)形成。研究表明血管内皮细胞功能持续障碍是冠状动脉瘤的重要原因,小檗碱(Berberine,BBR)因其血管内皮细胞保护作用可能是KD新的治疗方法。大剂量静脉注射免疫丙种球蛋白 (Intravenous immunoglobulin,IVIG)是目前公认的一线治疗,免疫丙种球蛋白的使用剂量不管是1g/kg/d 1-2天或单次2g/kg/d,其疗效差异无统计学意义[7]。经IVIG治疗后,冠状动脉瘤发生率已从25%降至4%左右,但仍有10%-20%患儿出现IVIG无反应(Intravenous immunoglobulin resistant,IVIGR)。2017年AHA关于KD诊疗指南对IVIGR定义为,应用首剂静脉注射免疫丙种球蛋白结束至少36小时后到两周期间仍有或再次出现体温(腋窝)≥37.3℃,并伴随5项主要临床诊断至少一项者。主要临床表现为:①口唇潮红干裂、草莓舌、咽部及口腔粘膜红斑;②双侧非渗出性结膜炎;③皮疹:斑丘疹、弥漫性红皮病、多形性红斑;④急性期手足潮红或硬肿,亚急性期甲周脱屑;⑤单侧颈部淋巴结肿大(直径≥1.5cm)。
目前已有相关研究表明发病年龄<12个月,男性患儿,首剂IVIG治疗早于急性期病程4天,血常规中高水平的白细胞(WBC)和中性粒细胞百分比(NEU%)、低水平的血小板计数(PLT)和血红蛋白浓度(HB),炎症指标如红细胞沉降率(ESR)、C反应蛋白(CRP)、降钙素原(PCT)的升高,生化检验中低水平的血清白蛋白(ALB)和血清钠离子浓度、高水平的钾离子浓度、总胆红素(TB)、谷草转氨酶(AST)以及谷丙转氨酶(ALT),评估心肌功能中高水平的乳酸脱氢酶(LDH)和心房钠尿肽(NT-proBNP) 等是预测川崎病患儿发生IVIGRKD的常见危险因素[9-12]。也有新研究提示 NLR、PLR、MPVLR等外周血细胞参数是发生IVIGRKD的危险因素,因血常规在临床中廉价、操作简单易行,近年来逐渐被关注。世界各地区研究人员在此基础上建立预测IVIGRKD评分系统,目前影响力较大的有,日本Kobayashi、Egami、Sano,韩国Moon,中国大陆地区北京Yang,中国大陆地区上海Wang,中国台湾地区Lin建立的Formosa评分系统等。上述评分系统在KD临床治疗方案上除了Moon对IVIG使用剂量为1g/kg,其余研究均采用IVIG 2g/kg的治疗量。但各研究的评分项目差异较大,在预测效能上灵敏度和特异度高低不一,显示出不同评分系统地区特异性。其他地区对上述某些评分体系进行预测效能评价,如Loomba等、Sleeper等和Tremoule等的研究应用 Egami于美国KD患儿,Sarah等探讨Kobayashi于英国KD患儿,Shin等对韩国患儿应用Kobayashi进行验证,Fu等将Kobayashi应用于中国北京KD 患儿,何跃娥等将Kobayashi、Egami、Sano三各评分系统应用于中国温州 KD患儿。以上评分体系预测效能均不高,因此现依然没有任何一个预测 IVIGRKD评分系统能被全世界广泛接受并指导于临床应用。目前中国深圳地区暂未建立起川崎病专病数据库,亦缺乏高效能的预测IVIGRKD评分模型。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供一种川崎病丙球无反应预测方法、存储介质及终端设备,旨在解决现有IVIGRKD评分系统的评分项目差异较大,在预测效能上灵敏度和特异度高低不一,显示出不同评分系统地区特异性的问题。
本发明的技术方案如下:
一种川崎病丙球无反应预测方法,其中,包括步骤:
运用Lasso对川崎病临床训练数据集进行特征筛选,选出14个与发生 IVIGRKD相关的特征;
将所述14个特征进行Logistic回归,构建Lasso-Logistic回归模型;
根据所述Lasso-Logistic回归模型绘制列线图,并根据所述 Lasso-Logistic回归模型中14个特征对发生IVIGRKD的贡献程度,在每个特征对应线段上标注刻度,表示该特征的取值范围,线段的长度反映了该特征对发生IVIGKD的贡献度;
给每个特征的每个取值水平进行赋分并计算14个特征的总得分,通过总得分与发生IVIGKD概率之间的函数转换关系得出川崎病丙球无反应预测结果。
所述川崎病丙球无反应预测方法,其中,所述14个特征为年龄、IVIG 治疗前血常规中的平均血小板体积、血小板与淋巴细胞比值、嗜酸性粒细胞绝对值、IVIG治疗后48h血常规中的中性粒细胞绝对值、血小板计数、血红蛋白浓度、红细胞计数、谷草转氨酶、钠离子浓度、总蛋白、白蛋白、是否有无菌性脓尿以及左冠状动脉前降支的Z值。
所述川崎病丙球无反应预测方法,其中,Logistic回归方程为: Log-odds ratiofor IVIGR=21.0427+(-0.26)×年龄+(-0.38)×IVIG治疗前血常规中的平均血小板体积+0.0006×血小板与淋巴细胞比值+ (-10.2483)×嗜酸性粒细胞绝对值+0.00269×谷草转氨酶+(-0.127)×钠离子浓度+(-0.0418)×白蛋白+0.0461×总蛋白+1.0832×是否有无菌性脓尿+0.00163×血小板计数+(-0.0277)×血红蛋白浓度+0.2167× IVIG治疗后48h血常规中的中性粒细胞绝对值+(-0.569)×红细胞计数+ 0.0451×左冠状动脉前降支的Z值。
所述川崎病丙球无反应预测方法,其中,运用Lasso对川崎病临床训练数据集进行特征筛选,选出14个与发生IVIGRKD相关的特征之前,还包括步骤:
获取川崎病临床病例数据,并对所述川崎病临床病例数据进行初步统计、数据清洗、缺失值填补及标准化处理,得到标准化川崎病临床数据;
将所述标准化川崎病临床数据按照预定比例划分成川崎病临床训练数据集和川崎病临床验证数据集。
一种存储介质,其中,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现本发明任意一项川崎病丙球无反应预测方法中的步骤。
一种终端设备,其中,包括处理器,适于实现各指令;以及存储介质,适于存储多条指令,所述指令适于由处理器加载并执行本发明任意一项川崎病丙球无反应预测方法中的步骤。
有益效果:本发明提供的川崎病丙球无反应预测方法,采用Lasso进行特征选择,可解释性强,入选的变量能避免过拟合,而后将所选特征进行Logistic回归处理,构建的Lasso-Logistic回归模型用于预测IVIGRKD 具有更高的灵敏度和特异度;本发明还将Lasso-Logistic回归模型绘制成可视化的列线图,使得预测模型易于理解;并且临床医生根据病人临床资料数据可在列线图中评分后得出IVIGRKD发生概率,具有临床应用性。
附图说明
图1为本发明提供的一种川崎病丙球无反应预测方法较佳实施例的流程图。
图2为本发明提供的一种川崎病丙球无反应预测方法的具体流程图。
图3为本发明根据Lasso-Logistic回归模型绘制的列线图示意图。
图4为本发明一种终端设备的原理框图。
具体实施方式
本发明提供一种川崎病丙球无反应预测方法、存储介质及终端设备,为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语 (包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
机器学习是一门多学科交叉的专业,它涵盖概率论知识、统计学知识、近似理论知识和复杂算法知识,以计算机作为工具,致力于真实实时的模拟人类学习方式,将现有内容进行知识结构划分来有效提高学习效率[29]。机器学习处理的是数据,通过学习输入的数据,从而建立模型,以便预测新的数据都输出。它具有学习能力强、覆盖范围广、适应力强和可移植性好的优势,因此应用广泛,在数据分析与挖掘、模式识别(如医学图像分析、生物特征识别、搜索引擎等)、生物信息学以及人工智能等领域均有应用。目前结合机器学习等智能计算技术的大数据分析技术是大数据领域研究热点和发展趋势。
现有技术中,Kobayashi、Egami、Sano等提出的IVIGRKD预测模型多运用多变量回归分析选出IVIGRKD的危险因素,并纳入评分项目,根据ROC 曲线或四分位数决定各评分项目得临界值,再以OR值、HR值或回归系数确定每个变量的权重,最终依据ROC曲线的灵敏度和特异度等指标建成 IVIGRKD预测评分系统,导致评分项目差异较大,在预测效能上灵敏度和特异度高低不一,显示出不同评分系统地区特异性。
基于此,本发明提供了一种川崎病丙球无反应预测方法,如图1所示,其包括步骤:
S10、运用Lasso对川崎病临床训练数据集进行特征筛选,选出14个与发生IVIGRKD相关的特征;
S20、将所述14个特征进行Logistic回归,构建Lasso-Logistic回归模型;
S30、根据所述Lasso-Logistic回归模型绘制列线图,并根据所述 Lasso-Logistic回归模型中14个特征对发生IVIGRKD的贡献程度,在每个特征对应线段上标注刻度,表示该特征的取值范围,线段的长度反映了该特征对发生IVIGKD的贡献度;
S40、给每个特征的每个取值水平进行赋分并计算14个特征的总得分,通过总得分与发生IVIGKD概率之间的函数转换关系得出川崎病丙球无反应预测结果。
本实施例选用Lasso进行特征选择,后与分类器Logistic回归建立 IVIGRKD预测模型,选择它们的原因是,Lasso能够对变量进行筛选和降低模型的复杂程度,避免过拟合,Logistic回归是经典回归方法,适用于自变量与因变量呈线性关系的数据,将所选特征进行Logistic回归处理构建的Lasso-Logistic回归模型用于预测IVIGRKD具有更高的灵敏度和特异度;本实施例还将Lasso-Logistic回归模型绘制成可视化的列线图,使得预测模型易于理解;并且临床医生根据病人临床资料数据可在列线图中评分后得出IVIGRKD发生概率,具有临床应用性。
本实施例中,Lasso是机器学习中的一种特征筛选算法,是一种处理具有复共线性数据的有偏估计。通过构造一个惩罚函数得到一个较为精炼的模型,使得它压缩一些系数,得出的非零系数的变量即为所选出的特征。
在一些实施方式中,对2014年-2018年深圳市儿童医院833例川崎病临床病例数据进行研究,如图2所示,首先对所述川崎病临床病例数据进行初步统计、数据清洗、缺失值填补及标准化处理,得到标准化川崎病临床数据,将所述标准化川崎病临床数据按照预定3:7的比例划分得到70%的川崎病临床训练数据集和30%的川崎病临床验证数据集;之后运用Lasso 对川崎病临床训练数据集进行特征筛选,选出14个发生IVIGRKD的危险因素,即获得14个特征,将所述14个特征进行Logistic回归处理,构建 Lasso-Logistic回归模型,基于此结果绘制列线图(又称诺模图, Nomogram),它建立于多因素回归分析基础上,整合多个预测指标,运用带有刻度的线段,按照一定比例绘制在同一平面上,以表达预测模型中各变量的相互关系。
在本实施例中,选出的14个特征为年龄,IVIG治疗前血常规中的平均血小板体积(MPV)、血小板与淋巴细胞比值(PLR)以及嗜酸性粒细胞绝对值(EO),IVIG治疗后48h血常规中的中性粒细胞绝对值(NEU)、血小板计数(PLT)、血红蛋白浓度(HB)以及红细胞计数(RBC),谷草转氨酶(AST)、钠离子浓度,总蛋白(TP),白蛋白(ALB),是否有无菌性脓尿(Pyuria),左冠状动脉前降支的Z值(LADZ)。
本实施例中,计算得到的Logistic回归方程见下:Log-odds ratio for IVIGR=21.0427+(-0.26)×Age+(-0.38)×MPV+0.0006×PLR+(-10.2483) ×EO+0.00269×AST+(-0.127)×Na+(-0.0418)×ALB+0.0461×TP+ 1.0832×Pyuria+0.00163×PLT+(-0.0277)×HB+0.2167×NEU+ (-0.569)×RBC+0.0451×LADZ。
在本实施例中,当构建Lasso-Logistic回归模型后,可采用30%的川崎病临床验证数据集运用Bootstrap法有放回地重复抽样1000次建模,计算Lasso-Logistic回归模型的AUC值、灵敏度、特异度、准确率及其95%可信区间,通过灵敏度、特异度、AUC、95%可信区间等指标与目前现有影响力较大的IVIGRKD评分系统进行比较,评价新模型可靠性。
在本实施例中,如图3所示,在构建Lasso-Logistic回归模型后,根据模型中14个特征对发生IVIGRKD的贡献程度,在每个特征对应线段上标注刻度,表示该特征的取值范围,线段的长度反映了该特征对发生IVIGKD 的贡献度。对于是否存在无菌性脓尿(Pyuria)该二分类特征,若存在脓尿则在列线图中记为“有”,否则记为“无”。
在本实施例中,根据临床病例数据给每个特征的每个取值水平进行赋分并计算得分,这里包括单项得分(每个特征在不同取值下对应的单项得分),以及总得分(全部变量取值后对应的单项得分合计的总得分),最后通过总得分与发生IVIGKD概率之间的函数转换关系得出结果。
在一些具体的实施方式中,如果一个患儿该14个特征总得分分别等于 175、234、256、270、295以及315,其相应发生IVIGRKD的预测概率分别是0.1%、10%、40%、70%、95%以及99%。
在一些实施方式中,还提供一种存储介质,其中,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如本发明所述川崎病丙球无反应预测方法中的步骤。
在一些实施方式中,还提供一种终端设备,如图4所示,其包括至少一个处理器(processor)20;显示屏21;以及存储器(memory)22,还可以包括通信接口(CommunicationsInterface)23和总线24。其中,处理器20、显示屏21、存储器22和通信接口23可以通过总线24完成相互间的通信。显示屏21设置为显示初始设置模式中预设的用户引导界面。通信接口23可以传输信息。处理器20可以调用存储器22中的逻辑指令,以执行上述实施例中的方法。
此外,上述的存储器22中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器22作为一种计算机可读存储介质,可设置为存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令或模块。处理器20通过运行存储在存储器22中的软件程序、指令或模块,从而执行功能应用以及数据处理,即实现上述实施例中的方法。
存储器22可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器22可以包括高速随机存取存储器,还可以包括非易失性存储器。例如,U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
此外,上述存储介质以及终端设备中的多条指令处理器加载并执行的具体过程在上述方法中已经详细说明,在这里就不再一一陈述。
作为举例,所述终端设备包括处理器20,所述处理器20可以调用存储器22中的逻辑指令,以执行以下指令:
运用Lasso对川崎病临床训练数据集进行特征筛选,选出14个与发生 IVIGRKD相关的特征;
将所述14个特征进行Logistic回归,构建Lasso-Logistic回归模型;
根据所述Lasso-Logistic回归模型绘制列线图,并根据所述 Lasso-Logistic回归模型中14个特征对发生IVIGRKD的贡献程度,在每个特征对应线段上标注刻度,表示该特征的取值范围,线段的长度反映了该特征对发生IVIGKD的贡献度;
给每个特征的每个取值水平进行赋分并计算14个特征的总得分,通过总得分与发生IVIGKD概率之间的函数转换关系得出川崎病丙球无反应预测结果。
下面通过具体实施例对本发明一种川崎病丙球无反应预测方法做进一步的解释说明:
实施例1
获得患儿临床病例数据为:年龄:5月,MPV:12.2fL,PLR:198,AST: 44IU/L,Na:134mmol/L,ALB:26g/L,TP:44.9g/L,Pyuria:是,PLT: 478*109/L,HB:117g/L,NEU:7.94*109/L,RBC:3.62*1012/L,LADZ:3.73。
根据实施例1中患儿临床病例数据给川崎病患儿的“年龄,IVIG治疗前血常规中的平均血小板体积(MPV)、血小板与淋巴细胞比值(PLR)以及嗜酸性粒细胞绝对值(EO),IVIG治疗后48h血常规中的中性粒细胞绝对值(NEU)、血小板计数(PLT)、血红蛋白浓度(HB)以及红细胞计数 (RBC),谷草转氨酶(AST)、钠离子浓度,总蛋白(TP),白蛋白(ALB),是否有无菌性脓尿(Pyuria),左冠状动脉前降支的Z值(LADZ)”的每个取值水平进行赋分并计算单项得分,全部特征取值后对应的单项得分合计形成总得分=38+10+4+2+12+12+5+26+18+56+25+5=215,根据所述总得分对应预测IVIGRKD发生率为79%。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (6)
1.一种川崎病丙球无反应预测方法,其特征在于,包括步骤:
运用Lasso对川崎病临床训练数据集进行特征筛选,选出14个与发生IVIGRKD相关的特征;
将所述14个特征进行Logistic回归,构建Lasso-Logistic回归模型;
根据所述Lasso-Logistic回归模型绘制列线图,并根据所述Lasso-Logistic回归模型中14个特征对发生IVIGRKD的贡献程度,在每个特征对应线段上标注刻度,表示该特征的取值范围,线段的长度反映了该特征对发生IVIGKD的贡献度;
给每个特征的每个取值水平进行赋分并计算14个特征的总得分,通过总得分与发生IVIGKD概率之间的函数转换关系得出川崎病丙球无反应预测结果。
2.根据权利要求1所述川崎病丙球无反应预测方法,其特征在于,所述14个特征为年龄、IVIG治疗前血常规中的平均血小板体积、血小板与淋巴细胞比值、嗜酸性粒细胞绝对值、IVIG治疗后48h血常规中的中性粒细胞绝对值、血小板计数、血红蛋白浓度、红细胞计数、谷草转氨酶、钠离子浓度、总蛋白、白蛋白、是否有无菌性脓尿以及左冠状动脉前降支的Z值。
3.根据权利要求2所述川崎病丙球无反应预测方法,其特征在于,Logistic回归方程为:Log-odds ratio for IVIGR=21.0427+(-0.26)×年龄+(-0.38)×IVIG治疗前血常规中的平均血小板体积+0.0006×血小板与淋巴细胞比值+(-10.2483)×嗜酸性粒细胞绝对值+0.00269×谷草转氨酶+(-0.127)×钠离子浓度+(-0.0418)×白蛋白+0.0461×总蛋白+1.0832×是否有无菌性脓尿+0.00163×血小板计数+(-0.0277)×血红蛋白浓度+0.2167×IVIG治疗后48h血常规中的中性粒细胞绝对值+(-0.569)×红细胞计数+0.0451×左冠状动脉前降支的Z值。
4.根据权利要求1所述川崎病丙球无反应预测方法,其特征在于,运用Lasso对川崎病临床训练数据集进行特征筛选,选出14个与发生IVIGRKD相关的特征之前,还包括步骤:
获取川崎病临床病例数据,并对所述川崎病临床病例数据进行初步统计、数据清洗、缺失值填补及标准化处理,得到标准化川崎病临床数据;
将所述标准化川崎病临床数据按照预定比例划分成川崎病临床训练数据集和川崎病临床验证数据集。
5.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1-4任意一项川崎病丙球无反应预测方法中的步骤。
6.一种终端设备,其特征在于,包括处理器,适于实现各指令;以及存储介质,适于存储多条指令,所述指令适于由处理器加载并执行权利要求1-4任意一项川崎病丙球无反应预测方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110476990.6A CN113257428A (zh) | 2021-04-29 | 2021-04-29 | 一种川崎病丙球无反应预测方法、存储介质及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110476990.6A CN113257428A (zh) | 2021-04-29 | 2021-04-29 | 一种川崎病丙球无反应预测方法、存储介质及终端设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113257428A true CN113257428A (zh) | 2021-08-13 |
Family
ID=77223322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110476990.6A Pending CN113257428A (zh) | 2021-04-29 | 2021-04-29 | 一种川崎病丙球无反应预测方法、存储介质及终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113257428A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115684570A (zh) * | 2022-08-02 | 2023-02-03 | 首都医科大学附属北京朝阳医院 | 传染病检测装置、设备、系统、介质及程序产品 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106971067A (zh) * | 2017-03-17 | 2017-07-21 | 苏州大学附属儿童医院 | 丙种球蛋白无反应型川崎病的预测方法及预测系统 |
-
2021
- 2021-04-29 CN CN202110476990.6A patent/CN113257428A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106971067A (zh) * | 2017-03-17 | 2017-07-21 | 苏州大学附属儿童医院 | 丙种球蛋白无反应型川崎病的预测方法及预测系统 |
Non-Patent Citations (1)
Title |
---|
吴业媚: "深圳市儿童医院川崎病丙球无反应危险因素分析及预测模型建立研究", 《万方数据知识服务平台》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115684570A (zh) * | 2022-08-02 | 2023-02-03 | 首都医科大学附属北京朝阳医院 | 传染病检测装置、设备、系统、介质及程序产品 |
CN115684570B (zh) * | 2022-08-02 | 2024-04-12 | 首都医科大学附属北京朝阳医院 | 传染病检测装置、设备、系统、介质及程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106339593B (zh) | 基于医疗数据建模的川崎病分类预测方法 | |
Chen et al. | Generative consistency for semi-supervised cerebrovascular segmentation from TOF-MRA | |
CN109670179A (zh) | 基于迭代膨胀卷积神经网络的病历文本命名实体识别方法 | |
WO2022166158A1 (zh) | 一种基于卷积生存网络的血透并发症长期风险预测系统 | |
Maheshwari et al. | Machine learning applied to diabetes dataset using Quantum versus Classical computation | |
CN113257428A (zh) | 一种川崎病丙球无反应预测方法、存储介质及终端设备 | |
Sapna et al. | Implementation of genetic algorithm in predicting diabetes | |
Leigh et al. | BMI and healthy life expectancy in old and very old women | |
CN111883258B (zh) | 一种构建ohss分度分型预测模型的方法 | |
Farrell et al. | Measurements of damage and repair of binary health attributes in aging mice and humans reveal that robustness and resilience decrease with age, operate over broad timescales, and are affected differently by interventions | |
Mahajan et al. | Diabetes mellitus prediction using supervised machine learning techniques | |
Yang et al. | Application of extreme learning machine in the survival analysis of chronic heart failure patients with high percentage of censored survival time | |
Jia et al. | STCM-Net: A symmetrical one-stage network for temporal language localization in videos | |
Jin et al. | Diagnosis of each main coronary artery stenosis based on whale optimization algorithm and stacking model | |
CN114611879A (zh) | 一种基于多任务学习的临床风险预测系统 | |
CN103830721A (zh) | 一种建立类风湿性关节炎动物模型的诱导剂及其制备与应用 | |
CN116913550A (zh) | 一种ppi相关糖尿病风险预测模型的建模方法和应用 | |
Bai et al. | CBDPS 1.0: A Python GUI application for machine learning models to predict bitter-tasting children’s oral medicines | |
Obeidavi et al. | Diagnosing thyroid disease by neural networks | |
CN112951364A (zh) | 一种基于maut法的药物经济学评价方法 | |
CN112466436A (zh) | 基于循环神经网络的智能中医开方模型训练方法及装置 | |
Sharma | DermaDetect: a novel computer vision model for an accurate diagnosis of skin conditions and rashes | |
Gilani | Joint modeling of repeated ordinal measures and time to event data for CHD risk assessment | |
CN117373674B (zh) | 主动脉瓣狭窄持续性风险预测方法、系统、设备及介质 | |
Wang et al. | Prediction of sepsis from clinical data using long short-term memory and extreme gradient boosting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210813 |