CN109949942A - 基于铁代谢指标的结核病风险预测模型的构建方法和系统 - Google Patents

基于铁代谢指标的结核病风险预测模型的构建方法和系统 Download PDF

Info

Publication number
CN109949942A
CN109949942A CN201910093522.3A CN201910093522A CN109949942A CN 109949942 A CN109949942 A CN 109949942A CN 201910093522 A CN201910093522 A CN 201910093522A CN 109949942 A CN109949942 A CN 109949942A
Authority
CN
China
Prior art keywords
model
sample
iron
tuberculosis
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910093522.3A
Other languages
English (en)
Inventor
陈心春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Orange Moon Biotechnology Co Ltd
Original Assignee
Shenzhen Orange Moon Biotechnology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Orange Moon Biotechnology Co Ltd filed Critical Shenzhen Orange Moon Biotechnology Co Ltd
Priority to CN201910093522.3A priority Critical patent/CN109949942A/zh
Publication of CN109949942A publication Critical patent/CN109949942A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供了一种基于铁代谢指标的结核病发病风险预测模型的建立方法,包括以下步骤:(1)样本的收集与处理;(2)从样本中测定铁代谢指标,具体包括三种血清铁的数据,即血清铁、转铁蛋白和铁蛋白;(3)使用神经网络的方法拟合训练集进行模型的构建,记录最优模型参数;同时根据ROC曲线使用验证集计算模型分类的阈值,构建得到结核病发病风险评估模型。本发明测定了样本人血清中铁代谢指标的数据,利用神经网络模型对这三个指标进行建模分析,利用算法和铁代谢指标,建立了一种结核病发病风险预测的模型,该模型具有高敏感性、特异性,可用于结核病发病的风险评估。

Description

基于铁代谢指标的结核病风险预测模型的构建方法和系统
技术领域
本发明涉及模型的构建方法,具体涉及一种基于铁代谢指标的结核病风险预测模型的构建方法和系统。
背景技术
结核病是严重危害人类健康的慢性传染性疾病。据世界卫生组织2016年报道,全球新发1040万人,死亡140万人,耐药48万人。我国是全球结核病高负担第二的国家,如何提高结核病防治效果是国家布局的重大攻关课题。及时发现和诊断结核病患者,是当前提高治疗成功率,减少疾病传播的结核病防治主要策略。然而,由于结核病的复杂性和特殊性,当前的结核病诊断技术远远不能满足临床的需求。病原学诊断,也就是从患者来源的标本中找到结核菌存在的直接证据,是当前确诊结核病的金标准,具体包括微生物学显微镜检查(分枝杆菌抗酸染色涂片)和分枝杆菌培养,以及近年来发展的核酸检测诊断技术。遗憾的是,这些技术存在敏感性严重不足的缺点,即便联合应用上述三项检测技术的敏感性也不足50%:另外,结核菌培养还存在耗时长(1到2个月),对生物安全要求高等缺点。这些现实问题,不仅容易造成临床上的误诊和漏诊,延误治疗机会,而且从结核病预防控制的角度,显著增加了结核在社区播散的机会,增加结核病防控的难度。
人工神经网络是由大量处理单元互联组成的非线性、自适应信息处理系统。它是在现代神经科学研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。它的构筑理念是受到生物(人或其他动物)神经网络功能的运作启发而产生的。人工神经网络通常是通过一个基于数学统计学类型的学习方法(LearningMethod)得以优化,所以人工神经网络也是数学统计学方法的一种实际应用,通过统计学的标准数学方法我们能够得到大量的可以用函数来表达的局部结构空间,另一方面在人工智能学的人工感知领域,我们通过数学统计学的应用可以来做人工感知方面的决定问题(也就是说通过统计学的方法,人工神经网络能够类似人一样具有简单的决定能力和简单的判断能力),这种方法比起正式的逻辑学推理演算更具有优势。
铁是维持结核菌和宿主基本代谢的重要微量元素,铁代谢与结核病发生发展关系密切。临床上通过络合法、化学发光法和免疫比浊法来检测人血清样本中铁代谢相关指标:血清铁serum iron、铁蛋白ferritin和转铁蛋白transferrin。我们测定了样本人血清中铁代谢指标的数据,利用神经网络模型(NNET,Neural Network)对这三个指标进行建模分析,该模型是把已知的足够多的系统输入、输出值做为训练样本,按给定的规则训练网络,使该网络的输出误差控制在预定范围内的一种算法。NNET具有大规模并行、分布式存储和处理、自组织、自适应和自学能力,特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题;我们利用该算法和铁代谢指标,建立了一种结核病发病风险预测的模型,该模型具有高敏感性、特异性,可用于结核病发病的风险评估。
发明内容
本发明的目的在于提供一种基于铁代谢指标的结核病风险预测模型的构建方法,利用神经网络算法,构建用于评估结核病发病风险模型。
为实现上述目的,本发明提供了一种基于铁代谢指标的结核病风险预测模型的构建方法,包括以下步骤:
(1)样本的收集与处理;
(2)从样本中测定铁代谢指标,具体包括三种代谢相关指标的数据,即血清铁、转铁蛋白和铁蛋白;
(3)使用神经网络的方法拟合训练集进行模型的构建,记录最优模型参数;同时根据ROC曲线使用验证集计算模型分类的阈值,构建得到结核病发病风险评估模型。
进一步地,所述步骤(1)中样本的收集与处理的具体方法为:每位受试者空腹12h,使用含有分离胶的真空管采集静脉血5mL,血标本室温放置30min~45min后,1000g离心5分钟,分离血清,置洁净试管加盖低温保存。
进一步地,所述步骤(2)中血清铁的检测方法为络合法,转铁蛋白的检测方法为免疫比浊法,铁蛋白的检测方法为化学发光法。
进一步地,所述步骤(3)中模型建立及优化的具体方法为:纳入肺结核患者、健康对照者、结核菌潜伏感染、结核病治愈、非结核菌肺炎病人,将纳入者按照3:1比例完全随机分为训练组和测试组,所有血清铁、转铁蛋白和铁蛋白含量值均取log2(x),采用神经网络模型,通过5次随机抽样、10倍交叉验证后,最终选择网络层数为5,权重衰减值为0.1,诊断阈值为0.3823。
基于这种构建方法的构建系统,包括:
数据采集模块,至少用于数据采集,获取样本数据集;
数据处理模块,至少用于从样本数据集中提取可用于构建评估模型的有效样本;
模型构建模块,至少用于将所述有效样本的不完整数据集随机分割为训练集和验证集,并使用神经网络的方法拟合训练集,记录最优模型参数;
阈值计算模块,至少用于根据ROC曲线使用验证集计算模型分类阈值。
本发明的优点在于:
本发明测定了样本人血清中铁代谢指标的数据,利用神经网络模型(NNET,NeuralNetwork)对这三个指标进行建模分析,该模型是把已知的足够多的系统输入、输出值做为训练样本,按给定的规则训练网络,使该网络的输出误差控制在预定范围内;利用该算法和铁代谢指标,建立了一种结核病发病风险预测的模型,该模型具有高敏感性、特异性,可用于结核病发病的风险评估。
附图说明
图1(A)是本发明实施例中标本血清铁的含量值的比较图;
图1(B)是本发明实施例中标本铁蛋白的含量值的比较图;
图1(C)是本发明实施例中标本转铁蛋白的含量值的比较图;
图2是本发明实施例中基于神经网络算法的结核病发病风险评估模型的预测值;
图3是本发明实施例中基于神经网络算法的结核病风险评估模型的ROC曲线图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步说明,以下实施例旨在说明本发明而不是对本发明的进一步限定。
本发明所采用的原料均能够从市场上购买或按照现有技术合成。
实施例
一种基于铁代谢指标的结核病风险预测模型的构建方法,包括以下步骤:
(1)样本的收集与处理;
本实施例纳入人群空腹12h,使用含有分离胶的真空管采集静脉血5mL,血标本室温放置30min~45min后,1000g离心5分钟,分离血清,置洁净试管加盖低温保存;血清样本可在2-8℃储存一周。
(2)从样本中测定铁代谢指标,具体包括三种代谢相关指标的数据,即血清铁、转铁蛋白和铁蛋白;血清铁的检测方法为络合法,转铁蛋白的检测方法为免疫比浊法,铁蛋白的检测方法为化学发光法;检测的具体步骤如下:
步骤一:络合法检测血清铁含量
全自动生化仪器(西门子SIEMENS ADVIA2400)检测标本前需要采用血清铁标准品进行校正,按照仪器使用SOP输入正确的实验参数,仪器自动向反应杯中加入100μl样本、1000μl R1,室温孵育5分钟,记录595nm处吸光度A1,然后加入250μl R2,其中R1和R2均来源于铁测定试剂盒,室温反应5分钟,记录吸光度A2,计算样本的吸光度差值(A2-A1),并建立标准液吸光度-浓度对应关系的工作曲线,在工作曲线上读取对应的浓度值(μg/dl);
步骤二:免疫比浊法检测转铁蛋白含量
使用西门子SIEMENS ADVIA2400进行检测,检测标本前需采用转铁蛋白标准品进行校正,按照仪器使用SOP输入正确的实验参数,仪器自动向反应杯中加入100μl样本、1000μl R1,室温孵育5分钟,记录340nm处吸光度A1,然后加入5μl R2,其中R1和R2均来源于转铁蛋白测定试剂盒,室温反应5分钟,记录吸光度A2,计算样本的吸光度差值(A2-A1),并建立标准液吸光度-浓度对应关系的工作曲线,在工作曲线上读取对应的浓度值(g/l);
步骤三:化学发光法检测血清铁蛋白含量
免疫化学发光检测系统(雅培I2000SR)检测标本前需要采用不同浓度铁蛋白标准品进行校正,按照仪器使用SOP输入正确的实验参数,仪器将标本自动加入反应杯中,同时加入微粒子R1,孵育10min,样本中的铁蛋白和铁蛋白抗体包被的微粒子结合;冲洗后,加入吖啶酯标记的铁蛋白抗体结合物R2,形成混合物之后,再次冲洗,将预激发液和激发液加入到反应混合物中,其中R1和R2均来源于铁蛋白测定试剂盒。测定产生的化学发光反应,以相对发光单位表示;样本中的铁蛋白含量和光学系统检测到的相对发光单位值之间成正比;即可建立标准品浓度相对发光单位-浓度对应关系的工作曲线,在工作曲线上读取样本对应的浓度值(pmol/L)。
上述过程中使用的标准品和检测试剂具体信息如下表1所示:
表1:
(3)使用神经网络的方法拟合训练集进行模型的构建,记录最优模型参数;同时根据ROC曲线使用验证集计算模型分类的阈值,构建得到结核病发病风险评估模型;
为了简明易懂,在本发明中使用了一些简单缩写,具体如下表所示:
本实施例将人群分为五组:健康对照HC 200例、结核病TB 316例、结核菌潜伏感染LTBI 167例、结核病治愈RxTB 100例和非结核性细菌性肺炎PN 100例,通过检测每例外周血血清铁、铁蛋白和转铁蛋白的含量,绘制得到图1(A)为标本血清铁的含量值的比较,图1(B)为标本铁蛋白的含量值的比较和图1(C)为标本转铁蛋白的含量值的比较,将全部实施例按照4:1比例完全随机分为训练组和测试组,其中训练组包括152HC,237TB,132LTBI,63RxTB和79PN;测试组包括48HC,79TB,35LTBI,37RxTB和21PN;将所有标本血清铁、铁蛋白和转铁蛋白含量值均取log2(x),本实施例NNET模型采用权重衰减(weight decay),尽量减少分类误差,避免模型过度拟合(over-fitting);将训练组数据输入NNET模型,通过5次随机抽样、10倍交叉验证(cross validation)后,最终选择网络层数为5,权重衰减值为0.1;训练组样本经过NNET模型换算后(NNET值),通过ROC曲线判断NNET值用于预测结核病发病风险的的效能,具体包括AUC、准确性、灵敏度和特异性;为提供结核病发病预测方法,通过调整阈值(cut-off)使特异性接近90%,尽可能选择较高灵敏度;当阈值为0.3823时,训练组及测试组结核病人相对应换算值(NNET值)均明显高于其余四组人群,具体结果如图2所示,图2是本发明实施例中基于铁代谢指标的神经网络算法用于结核病发病风险评估模型的分析结果,可用于结核病风险评估。
图3表示本发明实施例基于神经网络算法的结核病风险评估模型的ROC曲线图;用于获取评估结核病发病分险的最佳阈值,通过ROC曲线,在阈值为0.3823时,灵敏度和特异性为表2所示;
表2
参数 训练组 测试组
AUC 0.91(0.89,0.94) 0.90(0.86,0.94)
准确性 0.85(0.82,0.88) 0.84(0.79,0.89)
灵敏度 0.83(0.77,0.87) 0.70(0.58,0.79)
特异性 0.86(0.83,0.89) 0.92(0.86,0.96)
表2表示基于铁代谢指标的NNET模型在训练组和测试组中用于预测结核病发病风险的检验效能,NNET模型在训练组和测试组中的AUC、准确性、灵敏度、特异性分别为:0.91(95%CI 0.89-0.94)、85%(95%CI 82%-88%)、83%(95%CI 77%-87%)、86%(95%CI83%-89%)和0.90(95%CI 0.86-0.94)、84%(95%CI 79%-89%)、70%(95%CI 58%-79%)、92%(95%CI 86%-96%)。
本发明还提供了基于铁代谢指标的结核病风险预测模型的构建方法的构建系统,包括:
数据采集模块,至少用于数据采集,获取样本数据集;
数据处理模块,至少用于从样本数据集中提取可用于构建评估模型的有效样本;
模型构建模块,至少用于将所述有效样本的不完整数据集随机分割为训练集和验证集,并使用神经网络的方法拟合训练集,记录最优模型参数;
阈值计算模块,至少用于根据ROC曲线使用验证集计算模型分类阈值。
综上所述,本发明通过检测病人外周血清铁、铁蛋白和转铁蛋白含量指标,然后利用建立的运算公式模型,计算各个标本NNET值及诊断阈值,从而诊断病人是否患有活动性结核病。NNET值越高,则说明患结核的可能性高。
最后应说明的是:以上实施例仅用以说明本发明而并非限制本发明所描述的技术方案;本领域的普通技术人员应当理解,仍然可以对本发明进行修改或等同替换;而一切不脱离本发明的精神和范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围中。

Claims (5)

1.一种基于铁代谢指标的结核病风险预测模型的构建方法,其特征在于,包括以下步骤:
(1)样本的收集与处理;
(2)从样本中测定铁代谢指标,具体包括三种代谢相关指标的数据,即血清铁、转铁蛋白和铁蛋白;
(3)使用神经网络的方法拟合训练集进行模型的构建,记录最优模型参数;同时根据ROC曲线使用验证集计算模型分类的阈值,构建得到结核病发病风险评估模型。
2.根据权利要求1所述的构建方法,其特征在于,所述步骤(1)中样本的收集与处理的具体方法为:每位受试者空腹12h,使用含有分离胶的真空管采集静脉血5mL,血标本室温放置30min~45min后,1000g离心5分钟,分离血清,置洁净试管加盖低温保存。
3.根据权利要求1所述的构建方法,其特征在于,所述步骤(2)中血清铁的检测方法为络合法,转铁蛋白的检测方法为免疫比浊法,铁蛋白的检测方法为化学发光法。
4.根据权利要求1所述的构建方法,其特征在于,所述步骤(3)中模型建立及优化的具体方法为:纳入肺结核患者、健康对照者、结核菌潜伏感染、结核病治愈、非结核菌肺炎病人,将纳入者按照3:1比例完全随机分为训练组和测试组,所有血清铁、转铁蛋白和铁蛋白含量值均取log2(x),采用神经网络模型,通过5次随机抽样、10倍交叉验证后,最终选择网络层数为5,权重衰减值为0.1,诊断阈值为0.3823。
5.一种基于权利要求1-4中任一项所述的构建方法的构建系统,其特征在于,包括:
数据采集模块,至少用于数据采集,获取样本数据集;
数据处理模块,至少用于从样本数据集中提取可用于构建评估模型的有效样本;
模型构建模块,至少用于将所述有效样本的不完整数据集随机分割为训练集和验证集,并使用神经网络的方法拟合训练集,记录最优模型参数;
阈值计算模块,至少用于根据ROC曲线使用验证集计算模型分类阈值。
CN201910093522.3A 2019-01-30 2019-01-30 基于铁代谢指标的结核病风险预测模型的构建方法和系统 Pending CN109949942A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910093522.3A CN109949942A (zh) 2019-01-30 2019-01-30 基于铁代谢指标的结核病风险预测模型的构建方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910093522.3A CN109949942A (zh) 2019-01-30 2019-01-30 基于铁代谢指标的结核病风险预测模型的构建方法和系统

Publications (1)

Publication Number Publication Date
CN109949942A true CN109949942A (zh) 2019-06-28

Family

ID=67007489

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910093522.3A Pending CN109949942A (zh) 2019-01-30 2019-01-30 基于铁代谢指标的结核病风险预测模型的构建方法和系统

Country Status (1)

Country Link
CN (1) CN109949942A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113298360A (zh) * 2021-04-30 2021-08-24 上海淇玥信息技术有限公司 一种用于资源分配的风险控制方法、装置和系统
CN117551761A (zh) * 2024-01-11 2024-02-13 深圳大学 用于诊断潜伏性结核感染队列中的高风险人群和低风险人群的生物标志物及其应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109243604A (zh) * 2018-09-14 2019-01-18 苏州贝斯派生物科技有限公司 一种基于神经网络算法的川崎病风险评估模型的构建方法及构建系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109243604A (zh) * 2018-09-14 2019-01-18 苏州贝斯派生物科技有限公司 一种基于神经网络算法的川崎病风险评估模型的构建方法及构建系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
贺晨艳等: "《贫血和血清镁水平在肺结核患者痰菌转阴临床研究》", 《陕西医学杂志》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113298360A (zh) * 2021-04-30 2021-08-24 上海淇玥信息技术有限公司 一种用于资源分配的风险控制方法、装置和系统
CN113298360B (zh) * 2021-04-30 2023-01-06 上海淇玥信息技术有限公司 一种用于资源分配的风险控制方法、装置和系统
CN117551761A (zh) * 2024-01-11 2024-02-13 深圳大学 用于诊断潜伏性结核感染队列中的高风险人群和低风险人群的生物标志物及其应用

Similar Documents

Publication Publication Date Title
Louvet et al. Combining data from liver disease scoring systems better predicts outcomes of patients with alcoholic hepatitis
CN109943636A (zh) 一种结直肠癌微生物标志物及其应用
CN108363908B (zh) 用于检测生物分子的智谱系统
Senapati et al. A prospective study of the Bedside Index for Severity in Acute Pancreatitis (BISAP) score in acute pancreatitis: an Indian perspective
Schaff et al. Novel centrifugal technology for measuring sperm concentration in the home
WO2021179514A1 (zh) 一种基于人工智能的新型冠状病毒患者病况分类系统
CN112635069A (zh) 一种基于常规检验数据的肺结核智能识别方法
CN106202968A (zh) 癌症的数据分析方法及装置
CN113327679A (zh) 一种肺栓塞临床风险及预后评分方法与系统
CN109949942A (zh) 基于铁代谢指标的结核病风险预测模型的构建方法和系统
US20130197811A1 (en) Method for Diagnosis of an Infectious Disease Stage and Determination of Treatment
CN115064215B (zh) 一种通过相似度进行菌株溯源及属性鉴定的方法
CN112466402A (zh) 一种使用血液标志物预测年龄的方法
Dimech et al. A review of testing used in seroprevalence studies on measles and rubella
CN103218537A (zh) 遗传性眼病病例登记网络管理系统
CN114038501B (zh) 一种基于机器学习的背景菌判定方法
CN115099331A (zh) 基于可解释性机器学习算法的恶性胸腔积液辅助诊断系统
CN101539579A (zh) 糖尿病自身抗体谱免疫印迹试剂盒
Chan et al. Initial collection of an inadequate 24-hour urine sample in children does not predict subsequent inadequate collections
CN113539473A (zh) 一种仅使用血常规检验数据诊断布氏杆菌病的方法及系统
Fierz Basic problems of serological laboratory diagnosis
WO2015081267A1 (en) Immune monitoring to predict and prevent infection
CN106361289A (zh) 一种慢性肾衰竭预警系统
CN103336127A (zh) 一种早期肝病、肝纤维化和肝硬化指示剂与诊断剂
CN100580453C (zh) 评价乙肝患者机体免疫力水平的检测试剂盒及其制备方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190628

RJ01 Rejection of invention patent application after publication