CN113736896A - 用于预测遗传性血管性水肿发作的标志物及其应用 - Google Patents

用于预测遗传性血管性水肿发作的标志物及其应用 Download PDF

Info

Publication number
CN113736896A
CN113736896A CN202111057830.4A CN202111057830A CN113736896A CN 113736896 A CN113736896 A CN 113736896A CN 202111057830 A CN202111057830 A CN 202111057830A CN 113736896 A CN113736896 A CN 113736896A
Authority
CN
China
Prior art keywords
model
hereditary angioedema
bacteria
attack
abundance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111057830.4A
Other languages
English (en)
Inventor
支玉香
曹阳
阚浩轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking Union Medical College Hospital Chinese Academy of Medical Sciences
Original Assignee
Peking Union Medical College Hospital Chinese Academy of Medical Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking Union Medical College Hospital Chinese Academy of Medical Sciences filed Critical Peking Union Medical College Hospital Chinese Academy of Medical Sciences
Priority to CN202111057830.4A priority Critical patent/CN113736896A/zh
Publication of CN113736896A publication Critical patent/CN113736896A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Public Health (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Physiology (AREA)
  • Microbiology (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供用于预测遗传性血管性水肿发作的标志物及其应用。所述标志物为肠道中15个菌属细菌在肠道菌群中的相对丰度,将15个菌属细菌的相对丰度数据输入XGBoost模型后,所得分值≥0.402的,遗传性血管性水肿发作风险高,所得分值<0.402的,无遗传性血管性水肿发作风险。本发明首次发现肠道菌群与HAE的发作密切相关,并建立了一套基于肠道菌群的遗传性血管性水肿急性发作的标志物和风险预警模型,可辅助临床进行HAE急性发作的提前预测,对降低HAE急性水肿发病率,提高其疾病治疗率具有重要的临床意义。

Description

用于预测遗传性血管性水肿发作的标志物及其应用
技术领域
本发明涉及微生物组学和生物信息学,具体地说,涉及用于预测遗传性血管性水肿发作的标志物及其应用。
背景技术
遗传性血管性水肿(hereditary angioedema,HAE)是一种罕见的、威胁生命的遗传性疾病,发病率约为1/10000-1/50000,以急性、反复发作的皮下和(或)黏膜下组织水肿为特征,具有非凹陷性、自限性、局限性、不可预计性等特点,常见的受累部位包括面部、四肢、躯干、生殖道、上呼吸道以及胃肠道。HAE患者之间表现出的症状具有明显的临床异质性,具体表现在发病的年龄、频率、好发部位以及严重程度,而同一个患者每次发作表现出的症状也有所不同,轻者可仅表现为轻微的肢端水肿、不影响正常日常生活,严重时如若累及胃肠道,则可出现难以忍受的腹痛、恶心、呕吐、腹泻、腹腔积液,而呼吸道黏膜水肿会快速引发呼吸困难或窒息,导致部分患者因反复喉水肿发作而行多次气管切开手术,部分患者抢救不及时而窒息死亡。因此HAE不可预计及难以评估的特点显著降低了HAE患者的生活质量,加重了患者的心理及精神负担,甚至直接威胁到患者的生命。
典型的HAE是由编码C1酯酶抑制物(C1 esterase inhibitor,C1-INH)基因SERPING1突变导致的C1-INH的量减少或功能异常所致。目前在临床上,HAE需结合家族史、临床表现和实验室检查(主要是补体C4浓度降低、C1-INH浓度减低或功能异常)进行诊断,必要时可以结合SERPING1的一代测序或MLPA。然而目前临床上没有用于预测HAE发作的生物标志物。
尽管目前HAE的诊断可以依靠检测补体水平或者检测基因突变,然而C4的耗竭程度和C1-INH的功能水平与发作频率、发作部位及严重程度无明显相关性,因此无法预测患者短期内的临床病程、无法用于指导预防和治疗等临床干预。另外同一家系中携带相同突变类型的患者,他们的临床表现轻重程度亦明显不同,表明单靠基因突变无法决定疾病严重程度,更无法对疾病的发作进行预测。
由于缺少有效的生物标志物用于预测HAE的发作,患者一旦确诊,需长期进行预防治疗,目前国内普遍应用的预防类药物为雄性激素达那唑,该药物副作用明显,会导致患者体重增加、月经紊乱、关节疼痛、肝脏损害、视力减退、痤疮等,增加了患者经济、精神及心理压力。因此急需找到预警水肿发作,即评估疾病活动性的生物标志物,以期对HAE患者实现个体化的预防和治疗,减轻患者的经济负担。
目前为止,国内外尚无关于HAE病情和肠道菌群的相关性研究报道。
发明内容
本发明的目的是提供用于预测遗传性血管性水肿发作的标志物及其应用。
为了实现本发明目的,第一方面,本发明提供用于预测遗传性血管性水肿发作的标志物,所述标志物为肠道中15个菌属细菌在肠道菌群中的相对丰度,15个菌属如下:Hungatella(梭菌科Hungatella属)、黄杆菌属(Flavonifractor)、厌氧棍状菌属(Anaerotruncus)、罕见小球菌属(Subdoligranulum)、假丁酸弧菌属(Pseudobutyrivibrio)、厌氧菌属(Anaerostipes)、厌氧产氢杆菌属(Hydrogenoanaerobacterium)、Agathobacter(毛螺菌科Agathobacter属)、布劳特氏菌属(Blautia)、萨特氏菌属(Sutterrella)、脱硫弧菌属(Desulfovibrio)、嗜胆菌属(Bilophila)、柠檬酸杆菌属(Citrobacter)、巨单胞菌属(Megamonas)和拟普雷沃菌属(Alloprevotella);
将15个菌属细菌的相对丰度数据输入XGBoost模型后,所得分值≥0.402的,遗传性血管性水肿发作风险高,所得分值<0.402的,无遗传性血管性水肿发作风险。
第二方面,本发明提供与所述标志物配套的检测试剂或试剂盒,所述检测试剂或试剂盒包含用于检测肠道中15个菌属细菌的引物和/或探针。
第三方面,本发明提供所述标志物在构建遗传性血管性水肿发作风险预测模型中的应用。
第四方面,本发明提供三套遗传性血管性水肿发作风险预测模型的构建方法,
第一套方案包括以下步骤:
(1)分别检测遗传性血管性水肿非发作期和发作期患者粪便样本中15个菌属细菌的丰度;
(2)将步骤(1)所得丰度数据分为训练集和测试集,输入Xgboost模型,优化参数,用训练集训练,用测试集测试,存储模型。
第二套方案包括以下步骤:
(1)分别检测遗传性血管性水肿非发作期和发作期患者粪便样本中6个菌属细菌的丰度;
(2)将步骤(1)所得丰度数据分为训练集和测试集,输入随机森林模型,优化参数,用训练集训练,用测试集测试,存储模型;
其中,6个菌属如下:副普雷沃氏菌属(Paraprevotella)、厌氧菌属(Anaerostipes)、毛螺菌属(Lachnospira)、萨特氏菌属(Sutterrella)、布劳特氏菌属(Blautia)和巨单胞菌属(Megamonas)。
第三套方案包括以下步骤:
(1)分别检测遗传性血管性水肿非发作期和发作期患者粪便样本中3个菌属细菌的丰度;
(2)将步骤(1)所得丰度数据分为训练集和测试集,输入决策树模型,优化参数,用训练集训练,用测试集测试,存储模型;
其中,3个菌属如下:副普雷沃氏菌属(Paraprevotella)、Intestinimonas(颤螺旋菌科Intestinimonas属)和另枝菌属(Alistipes)。
前述的方法,步骤(2)优选采用交叉验证进行参数优化。
前述的方法,样本中细菌丰度的测定方法选自宏基因组测序、16S rDNA测序或qPCR定量检测中的任一种或至少两种组合。
优选地,肠道微生物可来自于采集的患者粪便,粪便中含有患者肠道内主要微生物,通过溶解,离心,转录,扩增等物理和生物学手段获取全部肠道菌群16S rRNA基因V3-V4区序列及其拷贝数,基于绝对丰度可进一步计算出样本中每个菌属细菌的相对丰度。
第五方面,本发明提供所述标志物或所述风险预测模型的构建方法在遗传性血管性水肿发作风险预测/评估中的应用。
借由上述技术方案,本发明至少具有下列优点及有益效果:
本发明首次发现肠道菌群与HAE的发作密切相关,并建立了一套基于肠道菌群的遗传性血管性水肿急性发作的标志物和风险预警模型,具有对患者进行疾病发作预测、协助治疗管理的能力,且具备易获取、可重复、测量周期短的特点。
本发明不仅提供了高灵敏性和高特异性的HAE发作预测模型,而且可展示个体与结HAE发作相关的肠道细菌情况,临床医生可根据个体肠道菌的实际情况给出临床指导意见,例如某些风险值范围的人群,特定肠道菌丰度已接近或超过特定值,可建议通过粪群移植,服用益生菌,改善饮食等方式改善肠道环境以做到提前预防,以减少发生HAE急性水肿的风险。此外对某些高风险且已确诊患有HAE患者,也可根据肠道菌情况进行某些必要的肠道微环境治疗。本发明可辅助临床进行HAE急性发作的提前预测,对降低HAE急性水肿发病率,提高其疾病治疗率具有重要的临床意义。
附图说明
图1为本发明较佳实施例中随机森林模型的预测结果。
图2为本发明较佳实施例中XGBoost模型的预测结果。
图3为本发明较佳实施例中决策树模型的预测结果。
图4为本发明较佳实施例中HAE发作风险模型建立的技术路线图。
图5为本发明较佳实施例中XGBoost算法得到15个特征菌属。
具体实施方式
本发明提供一种HAE急性发作的微生物标志物以及基于微生物所建立的预警模型,本发明的HAE急性发作的微生物风险预警模型预测HAE急性发作的风险精确度高,灵敏性好,只需要获取肠道微生物标志物的相对丰度,通过模型计算给出风险预警,即可预测患者近期疾病发作的可能,利于个体通过及时的医疗干预和生活习惯调整等减少发作可能或者缓解严重程度。
肠道微生物可来自于采集的患者粪便,粪便中含有患者肠道内主要微生物,通过溶解,离心,转录,扩增等物理和生物学手段获取全部肠道菌群16S rRNA基因V3-V4区序列及其拷贝数,基于绝对丰度可以进一步计算出样本中每种菌属的相对丰度。
为解决HAE患者是否会急性发作的问题,本发明使用多种统计分析手段,对近1个月内有急性水肿发作和没有发作的患者进行对比,分别获取27例HAE急性发作患者和28例无发作患者的肠道微生物相对丰度数据,并使用决策树、随机森林、XGBoost等机器学习算法,筛选出最能够区分出急性水肿发作和没有发作两类患者的菌属。
本发明采用如下技术方案:
第一方面,本发明提供一种微生物标志物,用于预测HAE的急性发作,标志物包括
1、由随机森林模型筛选出6个菌属(联合预测值达到AUC=0.80),包括:副普雷沃氏菌属(Paraprevotella)、厌氧菌属(Anaerostipes)、毛螺菌属(Lachnospira)、萨特氏菌属(Sutterrella)、布劳特氏菌属(Blautia)、巨单胞菌属(Megamonas)。
联合使用6种菌属细菌的相对丰度数据输入随机森林模型后,随机模型输出特征值R,以R=0.361为截断值,超过0.361归为急性发作的患者,低于0.361归为无发作,敏感性达到83.33%,特异性达到80.00%(图1)。
2、由XGBoost筛选出15个菌属(联合预测值达到AUC=0.86):Hungatella(梭菌科Hungatella属)、黄杆菌属(Flavonifractor)、厌氧棍状菌属(Anaerotruncus)、罕见小球菌属(Subdoligranulum)、假丁酸弧菌属(Pseudobutyrivibrio)、厌氧菌属(Anaerostipes)、厌氧产氢杆菌属(Hydrogenoanaerobacterium)、Agathobacter(毛螺菌科Agathobacter属)、布劳特氏菌属(Blautia)、萨特氏菌属(Sutterrella)、脱硫弧菌属(Desulfovibrio)、嗜胆菌属(Bilophila)、柠檬酸杆菌属(Citrobacter)、巨单胞菌属(Megamonas)、拟普雷沃菌属(Alloprevotella)。
联合使用15种菌属细菌的相对丰度数据输入XGBoost模型后,随机模型输出特征值X,以R=0.402为截断值,超过0.402归为急性发作的患者,低于0.402归为无发作,敏感性达到92.31%,特异性达到77.78%(图2)。
3、由决策树所选出3种菌属(联合预测值达到AUC=0.77),副普雷沃氏菌属(Paraprevotella)、Intestinimonas(颤螺旋菌科Intestinimonas属)和另枝菌属(Alistipes)。
联合使用3种菌属细菌的相对丰度数据输入决策树模型后,决策树模型输出特征值D,以D=0为截断值,超过0归为急性发作的患者,低于0归为无发作,敏感性达到66.67%,特异性达到80.00%(图3)。
第二方面,本发明提供一种检测如第一方面所述的预测HAE急性发作的微生物标志物的试剂。
本发明中,所述试剂可以是针对所述HAE急性发作微生物标志物的引物探针组合或其他检测试剂,用以判断所述微生物标志物的丰度。
第三方面,本发明提供一种如前所述的预测HAE发作微生物标志物或试剂的用途,所述用途包括用于构建预测HAE急性发作风险的模型,制备评估HAE发作风险的试剂,或制备预测HAE发作风险试剂盒。
第四方面,本发明提供一种预测HAE急性发作的模型,所述模型的输入变量为第一方面所述的HAE患者肠道微生物标志物的丰度。优选地,所述HAE患者肠道微生物标志物丰度的测定方法包括宏基因组测序、16S测序或qPCR定量检测中的任一种或至少两种的组合。本发明将某一类细菌丰度作为预测指标,因此,不管是用宏基因组测序定量,还是16S测序定量,甚至是qPCR定量,皆可作为测量手段,多样化了定量手段,打破了特定实验设备和实验技能的限制,使某些不具备特定实验设备的实验室也可实验本发明的数据测量和预测。
第五方面,本发明提供一种如第四方面所述的模型构建方法,包括如下步骤:
(1)分别检测非发作期和发作期患者粪便样本中的如第一方面所述微生物标志物的细菌丰度;(2)将步骤(1)所得数据分为训练集和测试集,输入机器学习模型,优化参数,用训练集训练,用测试集测试,存储模型。优选地,步骤(2)所述机器学习模型包括决策树、随机森林或Xgboost中的任一种,优选Xgboost。
优选地,步骤(2)所述优化参数交叉验证进行参数优化。本发明中交叉验证是在机器学习建立模型和验证模型参数时常用的办法。重复的使用数据,将得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的效果。在此基础上可以得到多组不同的训练集和测试集,某次训练集中的某个样本再下次可能成为测试集中的样本,即所谓“交叉验证”。
优选地,所述模型的输出值判定结果如下:(A)风险值<0.402判定为发作风险低,无需调整肠道菌群;(B)0.402≤风险值判定为发作风险高,需要调整肠道菌群,降低HAE发作风险。
以下实施例用于说明本发明,但不用来限制本发明的范围。若未特别指明,实施例均按照常规实验条件,如Sambrook等分子克隆实验手册(Sambrook J&Russell DW,Molecular Cloning:a Laboratory Manual,2001),或按照制造厂商说明书建议的条件。实施例1模型算法的建立与筛选
本发明通过前期筛选运算找到最适模型与特定种属的细菌作为微生物标志物,根据带类标的数据进行模型优化调参,提高模型的精确度和灵敏度,通过输出的风险值进行预测,并可以指示肠道微生物平衡状态,指导个体化肠道菌群调整,降低HAE发作风险,实施路线图见图4。
本发明通过大量信息的筛选与匹配,挑选XGBoost为最优模型基础,具体方法如下:
1、从北京协和医院就诊的HAE患者中,获取27例近1月内有急性发作和28例无发作患者的肠道菌群的16S rRNA基因测序数据。
2、根据16S rRNA基因测序数据匹配出不同的肠道菌的丰度数据。为了尽可能的寻找标志物,并考虑宏基因组数据库和16S数据库的匹配性,同时考虑qPCR无法测量含量特别微小的种等原因,本次匹配到达属级别,共有486个属级别的细菌。
3、运用机器学习挑选模型算法。监督学习为通过一部分输入数据和输出数据之间的相应关系,生成函数,将输入映射到合适的输出,比如分类。本发明的样本数据都已在临床确诊,带有已分类好的标签,因此将在有监督的机器学习分类模型中进行探索选择。分别将所有样本的细菌丰度值作为输入数据,样本的诊断结果作为输出分类标签。按照以下步骤进行算法构建:
(a)将所有数据随机分成60%的训练集和40%的测试集;
(b)构建机器学习分类器。用所有细菌(486个种属)的丰度值作为输入数据,先后尝试决策树,随机森林以及Xgboost三种机器学习模型;
(c)交叉验证调参,选取ROC-AUC得分最好的参数;
(d)用测试集进行结果验证;
(e)模型评价。
上述步骤重复200次,得到灵敏性(TPR)集合,和特异性(FPR)序列集合,将平均的TPR和FPR做ROC曲线,计算测试集的平均受试者曲线的曲线下方面积(AUC)和标准差。选取最高ROC-AUC得分的XGBoost为最佳模型。
在不同模型条件下,基于16S rRNA基因V3-V4区序列设计的PCR检测引物测序区域V3+V4,引物为338F和806R:
上游引物338F:5′-ACTCCTACGGGAGGCAGCA-3′
下游引物806R:5′-GGACTACHVGGGTWTCTAAT-3′
实施例2特定种属的细菌挑选
1、XGBoost模型得到变量特征的重要性(Feature-importance)分数(图5),根据该分数的高低排序,逐步增加细菌变量个数,得到ROC-AUC最优所需要的变量,结果显示,输入特征变量15个特定种属的细菌丰度时ROC-AUC值最大。
2、测试模型,将数据拆分为训练集和测试集,输入样本的15个特定种属的细菌丰度,输入Xgboost模型,模型根据GridsearchCV进行参数优化,用训练集训练,用测试集测试。
3、存储模型,用于后续测量数据的发病风险预测。
输入变量个数和组合会产生不同的ROC-AUC,发明人优选出最适的输入变量与模型搭配,即采用本发明所述15种菌属作为输入对象可以在较高预测准确度的条件下降低对微生物标志物检测方法的要求,采用宏基因组、16S或qPCR均可以实现相同的功能,具有良好的通用性。
XGBoost算法下22例验证集中的样本实际分类与算法特征值见表1。
表1
Figure BDA0003255387520000071
本发明以特定的细菌菌群相对丰度为输入指标,构建了相应的预测HAE水肿发作的风险模型。通过确立基于肠道菌群的高灵敏度和特异度的HAE急性发作风险预警模型构建,有助于医师及时鉴别发作活动期患者、制定或调整临床干预措施,防止急性水肿的发作,尤其是急性胃肠道和喉头水肿,进而避免患者窒息等危急情况的发生,同时有助于识别疾病相对静止期的患者,减少长期使用预防性药物的副作用。该预警模型能对HAE水肿的活动性进行预警,对其个体化的预防和治疗提供有效的生物标志物。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之做一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (10)

1.用于预测遗传性血管性水肿发作的标志物,其特征在于,所述标志物为肠道中15个菌属细菌在肠道菌群中的相对丰度,15个菌属如下:Hungatella、黄杆菌属(Flavonifractor)、厌氧棍状菌属(Anaerotruncus)、罕见小球菌属(Subdoligranulum)、假丁酸弧菌属(Pseudobutyrivibrio)、厌氧菌属(Anaerostipes)、厌氧产氢杆菌属(Hydrogenoanaerobacterium)、Agathobacter、布劳特氏菌属(Blautia)、萨特氏菌属(Sutterrella)、脱硫弧菌属(Desulfovibrio)、嗜胆菌属(Bilophila)、柠檬酸杆菌属(Citrobacter)、巨单胞菌属(Megamonas)和拟普雷沃菌属(Alloprevotella);
将15个菌属细菌的相对丰度数据输入XGBoost模型后,所得分值≥0.402的,遗传性血管性水肿发作风险高,所得分值<0.402的,无遗传性血管性水肿发作风险。
2.与权利要求1所述标志物配套的检测试剂或试剂盒,其特征在于,所述检测试剂或试剂盒包含用于检测肠道中15个菌属细菌的引物和/或探针;
其中,15个菌属的定义同权利要求1中所述。
3.权利要求1所述标志物在构建遗传性血管性水肿发作风险预测模型中的应用。
4.遗传性血管性水肿发作风险预测模型的构建方法,其特征在于,包括以下步骤:
(1)分别检测遗传性血管性水肿非发作期和发作期患者粪便样本中15个菌属细菌的丰度;
(2)将步骤(1)所得丰度数据分为训练集和测试集,输入Xgboost模型,优化参数,用训练集训练,用测试集测试,存储模型;
其中,15个菌属的定义同权利要求1中所述。
5.根据权利要求4所述的方法,其特征在于,步骤(2)采用交叉验证进行参数优化。
6.遗传性血管性水肿发作风险预测模型的构建方法,其特征在于,包括以下步骤:
(1)分别检测遗传性血管性水肿非发作期和发作期患者粪便样本中6个菌属细菌的丰度;
(2)将步骤(1)所得丰度数据分为训练集和测试集,输入随机森林模型,优化参数,用训练集训练,用测试集测试,存储模型;
其中,6个菌属如下:副普雷沃氏菌属(Paraprevotella)、厌氧菌属(Anaerostipes)、毛螺菌属(Lachnospira)、萨特氏菌属(Sutterrella)、布劳特氏菌属(Blautia)和巨单胞菌属(Megamonas)。
7.根据权利要求6所述的方法,其特征在于,步骤(2)采用交叉验证进行参数优化。
8.遗传性血管性水肿发作风险预测模型的构建方法,其特征在于,包括以下步骤:
(1)分别检测遗传性血管性水肿非发作期和发作期患者粪便样本中3个菌属细菌的丰度;
(2)将步骤(1)所得丰度数据分为训练集和测试集,输入决策树模型,优化参数,用训练集训练,用测试集测试,存储模型;
其中,3个菌属如下:副普雷沃氏菌属(Paraprevotella)、Intestinimonas和另枝菌属(Alistipes)。
9.根据权利要求8所述的方法,其特征在于,步骤(2)采用交叉验证进行参数优化。
10.根据权利要求4-9任一项所述的方法,其特征在于,样本中细菌丰度的测定方法选自宏基因组测序、16S rDNA测序或qPCR定量检测中的任一种或至少两种组合。
CN202111057830.4A 2021-09-09 2021-09-09 用于预测遗传性血管性水肿发作的标志物及其应用 Pending CN113736896A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111057830.4A CN113736896A (zh) 2021-09-09 2021-09-09 用于预测遗传性血管性水肿发作的标志物及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111057830.4A CN113736896A (zh) 2021-09-09 2021-09-09 用于预测遗传性血管性水肿发作的标志物及其应用

Publications (1)

Publication Number Publication Date
CN113736896A true CN113736896A (zh) 2021-12-03

Family

ID=78737711

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111057830.4A Pending CN113736896A (zh) 2021-09-09 2021-09-09 用于预测遗传性血管性水肿发作的标志物及其应用

Country Status (1)

Country Link
CN (1) CN113736896A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109641031A (zh) * 2016-08-23 2019-04-16 德国杰特贝林生物制品有限公司 预防与c1酯酶抑制剂缺乏相关的遗传性血管性水肿急性发作的方法
CN109716129A (zh) * 2016-09-16 2019-05-03 戴埃克斯有限公司 用于遗传性血管性水肿的rna生物标记
CN113311056A (zh) * 2021-05-10 2021-08-27 中国医学科学院北京协和医院 用于遗传性血管水肿的标志物及其应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109641031A (zh) * 2016-08-23 2019-04-16 德国杰特贝林生物制品有限公司 预防与c1酯酶抑制剂缺乏相关的遗传性血管性水肿急性发作的方法
CN109716129A (zh) * 2016-09-16 2019-05-03 戴埃克斯有限公司 用于遗传性血管性水肿的rna生物标记
CN113311056A (zh) * 2021-05-10 2021-08-27 中国医学科学院北京协和医院 用于遗传性血管水肿的标志物及其应用

Similar Documents

Publication Publication Date Title
CN109943636B (zh) 一种结直肠癌微生物标志物及其应用
US20190367995A1 (en) Biomarkers for colorectal cancer
WO2021184412A1 (zh) 基于肠道微生物的双相情感障碍生物标志物及其筛选应用
CN104540962A (zh) 糖尿病生物标志物及其应用
AU2016267392B2 (en) Validating biomarker measurement
CN107075446B (zh) 用于肥胖症相关疾病的生物标记物
US20150376697A1 (en) Method and system to determine biomarkers related to abnormal condition
CN111505288A (zh) 一种新的抑郁症生物标志物及其应用
CN110964778A (zh) 肠杆菌科作为缺血性脑卒中生物标志物的用途
Kiss et al. Comparison of the prevalence of 21 GLIM phenotypic and etiologic criteria combinations and association with 30-day outcomes in people with cancer: a retrospective observational study
Bukavina et al. Global meta-analysis of urine microbiome: colonization of polycyclic aromatic hydrocarbon–degrading bacteria among bladder cancer patients
CN114214438B (zh) 胆道菌群检测试剂在制备预测胆道结石术后早期复发的试剂中的应用
CN113736896A (zh) 用于预测遗传性血管性水肿发作的标志物及其应用
WO2020096024A1 (ja) 卵巣がんバイオマーカーとしての膣微生物叢の利用
CN114196727B (zh) 预测遗传性血管水肿发作及严重程度的标志物及其应用
US20230375534A1 (en) Means and methods to diagnose gut flora dysbiosis and inflammation
WO2018049946A1 (zh) 用于子宫腺肌症检测的生物标志物组合及其应用
CN109749960A (zh) 基于多种肠道细菌含量评估便秘风险及便秘程度的方法及装置
CN112384634A (zh) 骨质疏松生物标志物及其用途
CN101294220A (zh) 判断重性抑郁症发病易感性的方法
Levinson Weak associations between prognostic biomarkers and disease in preliminary studies illustrates the breach between statistical significance and diagnostic discrimination
CN114058695B (zh) 泌尿道菌群检测在女性泌尿道结石诊断中的应用
CN118064613A (zh) 一种与人运动耐力相关的检测标志物及其应用
CN114891890A (zh) 一种结直肠癌相关基因筛查试剂盒
CN116543899A (zh) 一种慢性肾病微生物标志物的应用和风险预测模型及其构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination