CN117106946A - 用于新型冠状病毒感染患者无创诊断的口腔真菌微生物基因标志物及其应用 - Google Patents
用于新型冠状病毒感染患者无创诊断的口腔真菌微生物基因标志物及其应用 Download PDFInfo
- Publication number
- CN117106946A CN117106946A CN202310442340.9A CN202310442340A CN117106946A CN 117106946 A CN117106946 A CN 117106946A CN 202310442340 A CN202310442340 A CN 202310442340A CN 117106946 A CN117106946 A CN 117106946A
- Authority
- CN
- China
- Prior art keywords
- patients
- distinguishing
- novel coronavirus
- microorganism
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 244000005700 microbiome Species 0.000 title claims abstract description 70
- 208000001528 Coronaviridae Infections Diseases 0.000 title claims abstract description 57
- 241000233866 Fungi Species 0.000 title claims abstract description 49
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 38
- 238000003745 diagnosis Methods 0.000 title claims abstract description 22
- 210000000214 mouth Anatomy 0.000 title claims abstract description 17
- 239000003550 marker Substances 0.000 title claims abstract description 11
- 241000711573 Coronaviridae Species 0.000 claims abstract description 39
- 238000001514 detection method Methods 0.000 claims abstract description 23
- 238000003757 reverse transcription PCR Methods 0.000 claims abstract description 14
- 208000015181 infectious disease Diseases 0.000 claims abstract description 8
- 230000007812 deficiency Effects 0.000 claims abstract description 5
- 230000002538 fungal effect Effects 0.000 claims description 28
- 108700005443 Microbial Genes Proteins 0.000 claims description 18
- 230000000813 microbial effect Effects 0.000 claims description 16
- 238000012795 verification Methods 0.000 claims description 15
- 238000002790 cross-validation Methods 0.000 claims description 13
- 238000012163 sequencing technique Methods 0.000 claims description 11
- 238000012165 high-throughput sequencing Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- 239000003153 chemical reaction reagent Substances 0.000 claims description 8
- 238000000034 method Methods 0.000 claims description 8
- 238000007637 random forest analysis Methods 0.000 claims description 7
- 238000003066 decision tree Methods 0.000 claims description 6
- 239000011248 coating agent Substances 0.000 claims description 5
- 238000000576 coating method Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000003759 clinical diagnosis Methods 0.000 claims description 2
- 238000002360 preparation method Methods 0.000 claims 1
- 239000003814 drug Substances 0.000 abstract description 3
- 206010035664 Pneumonia Diseases 0.000 abstract 1
- 241000566145 Otus Species 0.000 description 16
- 230000004069 differentiation Effects 0.000 description 13
- 201000010099 disease Diseases 0.000 description 13
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 13
- 238000010200 validation analysis Methods 0.000 description 12
- 238000013461 design Methods 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 208000025721 COVID-19 Diseases 0.000 description 2
- 101100004280 Caenorhabditis elegans best-2 gene Proteins 0.000 description 2
- 206010009944 Colon cancer Diseases 0.000 description 2
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 238000001793 Wilcoxon signed-rank test Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 238000007622 bioinformatic analysis Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 244000005706 microflora Species 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 206010039073 rheumatoid arthritis Diseases 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 101100406674 Arabidopsis thaliana OTU4 gene Proteins 0.000 description 1
- 241001678559 COVID-19 virus Species 0.000 description 1
- 208000034657 Convalescence Diseases 0.000 description 1
- 241000725303 Human immunodeficiency virus Species 0.000 description 1
- 208000022559 Inflammatory bowel disease Diseases 0.000 description 1
- 241001454354 Kingella Species 0.000 description 1
- 241000315672 SARS coronavirus Species 0.000 description 1
- 208000000102 Squamous Cell Carcinoma of Head and Neck Diseases 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 210000002249 digestive system Anatomy 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 201000000459 head and neck squamous cell carcinoma Diseases 0.000 description 1
- 230000005745 host immune response Effects 0.000 description 1
- 244000005702 human microbiome Species 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000028709 inflammatory response Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/6895—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- Analytical Chemistry (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Immunology (AREA)
- Theoretical Computer Science (AREA)
- Genetics & Genomics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Epidemiology (AREA)
- Mycology (AREA)
- Botany (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明属于生物医药技术领域,具体涉及一种用于新型冠状病毒感染患者无创诊断的口腔真菌微生物基因标志物及其应用。本发明提供了一种用于区别新型冠状病毒感染和非感染者的口腔真菌微生物模型(基因标志物),由SEQ ID NO:1‑2所示的2种真菌微生物基因组成,所述微生物基因在人体口腔中富集。本发明的真菌微生物基因标志物(模型)在新冠肺炎感染患者和非感染者中实现了良好的区别能力,也验证了该区别模型在中国不同地域中的可行性、适用性和普适性。同时证明了该真菌区别模型能够弥补RT‑PCR检测的不足,将感染新冠病毒的疑似患者从健康人群的鉴定出来。
Description
技术领域
本发明属于生物医药技术领域,具体涉及一种用于新型冠状病毒感染患者无创诊断的口腔真菌微生物基因标志物及其应用。
背景技术
通过逆转录聚合酶链反应(reverse transcription-polymerase chainreaction,RT-PCR)进行核酸检测来判断是否感染新型冠状病毒(Severe AcuteRespiratory Syndrome Coronavirus 2,SARS-CoV-2),是目前公认的诊断“金标准”。但是,由于病毒窗口期、采样及实验操作失误等各方面的原因,感染新型冠状病毒后,部分患者经RT-PCR检测出现假阴性的结果,且假阴性率高达20%,这极大的增加了疾病的传染源和传播范围。因此,建立一种新的区别健康人和新型冠状病毒感染者的诊断模型,以弥补现有检测方法的不足,对于新型冠状病毒感染防治工作具有重大意义。
正常人体寄居的微生物种类超过1000种,数量高达100万亿。这些数量庞大的微生物和人体内环境相互作用,共同构成了人体微生态系统。口腔微生态系统作为消化系统的起始端,是人体微生态系统的重要组成部分,与人体健康和疾病密切相关。口腔拥有仅次于肠道的人体第二大微生物群落,包括细菌、真菌、病毒等,与人类健康息息相关。许多研究都集中在健康和疾病中的人类细菌组,很少关注人类真菌组。这可能是由于人类微生物组中真菌的比例很小,不到1%。然而,真菌在人类健康和疾病状态中起着关键作用。它维持微生物群落的结构和代谢,与细菌相互作用,参与宿主免疫反应,从而调节炎症反应的程度,影响人体健康和疾病状态,如人类免疫缺陷病毒、炎症肠病、哮喘。现有研究阐明了COVID-19患者的口腔细菌特征,并将口腔细菌与COVID-19的严重程度联系起来。然而,COVID-19患者和康复者的口腔真菌改变情况仍不清楚。
口腔微生态的特征或者基于口腔微生物建立的区别模型作为特定疾病或肿瘤的区分工具正越来越多被广泛报道和认可。口腔菌群可反映人对疾病的易感性,提示口腔菌群具有潜在的预警和诊断作用。Burkhardt F等(Gut,2017年)通过宏基因组学报道了口腔微生态与结直肠癌的相关性,指出16个菌种可能成为区分结直肠癌的口腔微生物标志物。Zhang X等(Nature Medicine,2015年)通过宏基因组测序技术解析了中国人群类风湿性关节炎患者的口腔微生态结果,在微生物基因和功能水平上,鉴定了类风湿性特异性的6个牙齿微生物标志物和2个唾液微生物标志物,创建了两个高准确度的类风湿性关节炎患者区分模型。Richard B等(JAMA Oncology,2018)等指出口腔中共生Corynebacterium和Kingella的丰度越高,头颈部鳞状细胞癌的风险就越低,这对癌症的预防有潜在的意义。我们先前的研究(Gut,2021)指出口腔细菌标志物能够有效诊断新型冠状病毒感染患者,并成功实现跨区域验证。因而,口腔微生物可能是不同疾病诊断的有力工具。然而,用于区别新型冠状病毒感染和非感染者的口腔真菌微生物模型还未曾有人报道过。
发明内容
本发明提供了一种用于区别新型冠状病毒感染和非感染者的口腔真菌微生物模型(基因标志物),由SEQ ID NO:1-2所示的2种真菌微生物基因组成,所述微生物基因在人体口腔中富集。
2种真菌微生物基因序列如下:
>OTU4
GCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCAACTTGCGCTctctGGTATTCCGGAGAGCATGCCTGTTTGAGTGTCATGATCtctcAACCAATAGAGTTTTCTATTGGCTTGGATCTGGGTGCTGCGAAACAATCGCTCACCTTAAAGGAGTTAGCAACTAAGCGATGTCGTCCGACGTAATAAGTTTCGTCTGGTAATTCGACTGAGCCAATTGCTTCTAATTGTCTTTTGACTTttttGACTCTGG
>OTU925
GCATGATAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCAACTTGCGCTctctGGTATTCCGGAGAGCATGCCTGTTTGAGTGTCATGATCtctcAACCAATAGAGTTTTCTATTGGCTTGGATCTGGGTGCTGCGAAACAATCGCTCACCTTAAAGGAGTTAGCAACTAAGCGATGTCGTCCGACGTAATAAGTTTCGTCTGGTAATTCGACTGAGCCAATTGCTTCTAATTGTCTTTTGACTTttttGACTCTGGCC
另外本发明还提供了一种用于检测试剂,包括用于检测SEQ ID NO:1-2所示的2种真菌微生物基因的引物SEQ ID NO:3-4,序列如下:
引物Primers
测序区域ITS2
上游引物:ITS3F GCATCGATGAAGAACGCAGC
下游引物:ITS4R TCCTCCGCTTATTGATATGC
本发明还提供了检测试剂在建立一种区别新型冠状病毒感染和非感染者的口腔真菌微生物模型中的应用,所述检测试剂适用于检测SEQ ID NO:1-2所示的2种真菌微生物基因。
所述微生物区别模型适用于区别新型冠状病毒感染和非感染者,新型冠状病毒感染者包括RT-PCR检测阳性的确诊患者及RT-PCR检测阴性但IgG抗体阳性的临床诊断患者(疑似患者)。
对所述对象的舌苔进行检测,以便确定该样本是否包含所述的真菌微生物基因,是否可以建立区别新型冠状病毒感染和非感染者的真菌微生物基因模型。
通过收集入组对象的舌苔样本,抽提微生物总DNA,完成微生物DNA的ITS测序,检测是否存在SEQ ID NO:1-2所示的2种微生物基因。
进一步的,通过收集入组对象的舌苔样本,抽提微生物总DNA,进行口腔菌群的ITS测序。基于高通量测序数据,在训练集中建立新型冠状病毒感染和非感染者的真菌微生物区别模型,建立新型冠状病毒感染患病率(probability of disease,POD)指数;POD指数在验证集中计算其区别能力,进行验证;进一步在来自不同地域的独立诊断集中进行独立验证,实现真菌微生物基因区别模型在中国新型冠状病毒感染人群中的普适性;最后在新型冠状病毒感染疑似患者中进行验证,证实真菌微生物基因区别模型弥补RT-PCR检测不足的可能性。
具体包括:
(1)收集入组对象(新型冠状病毒感染和非感染者)的舌苔样本,按照DNA的标准抽提方法完成舌苔样本中真菌微生物总DNA的抽提,在Illumina MiSeq平台完成口腔菌群的ITS高通量测序工作;
(2)基于高通量测序数据,在真菌微生物区别模型的训练集中,在48例新型冠状病毒感染患者和88例健康对照之间,基于一个随机森林模型,通过一个五倍交叉验证的算法,鉴定了用于该模型的最佳的2个真菌微生物基因标志物。
(3)基于2个真菌微生物基因标志物,通过使用随机生成的决策树的比率来计算新型冠状病毒感染患病率的患病率(Probability of disease,POD)指数。
(4)该真菌微生物区别模型在48例新型冠状病毒感染确诊患者和88例健康对照者之间的区别能力达到99.79%,POD指数在新型冠状病毒感染确诊患者中明显升高,两组之间有显著性差异(p=2.8x10-25);
(5)在验证集中,该真菌微生物区别模型在23例新型冠状病毒感染确诊患者和44例健康对照之间的区别能力达到99.6%;POD指数在新型冠状病毒感染确诊患者中明显升高,两组之间有显著性差异(p=3.2x10-12);
(6)在独立诊断集中,该真菌微生物区别模型在75例来自杭州的新型冠状病毒感染确诊患者和44例健康对照之间的区别能力达到100%;POD指数在杭州地区新型冠状病毒感染确诊患者中明显升高,两组之间有显著性差异(p=4.3x10-26)。
(7)在验证集中,该真菌微生物区别模型在36例新型冠状病毒感染疑似患者和44例健康对照之间的区别能力达到99.94%;POD指数在疑似患者中明显升高,两组之间有显著性差异(p=3.7x10-16)。
因此,本发明的真菌微生物基因区别模型在新型冠状病毒感染和非感染患者中实现了良好的区别能力,也验证了该区别模型能够将核酸检测阴性而IgG抗体阳性的疑似患者从健康人群中鉴别出来。
另外,还提供了一种用于区别新型冠状病毒感染和非感染的口腔真菌微生物模型的试剂盒,包括用于检测SEQ ID NO:1-2所示的2种微生物基因的引物。
本发明的具体操作步骤如下:
(1)按照前瞻性临床试验的设计原则,本发明的研究设计如图1所示。该研究方案得到了郑州大学第一附属医院和光山县人民医院伦理委员会的批准。所有入组的患者签署研究方案知情同意书和临床样本收集知情同意书。
(2)每一个入组的新型冠状病毒感染和非感染患者提供一份新鲜的舌苔样本,研究实验人员将样本在70℃灭活1小时,然后立即冻存于-80℃冰箱。舌苔真菌总DNA的抽提方法按照试剂盒的说明书进行。
(3)完成舌苔真菌总DNA样本的扩增和DNA文库构建,在Illumina Miseq测序平台完成ITS测序。所有的输出序列完成基本的预处理和基本的生物信息学分析。
(4)使用USEARCH(版本11.0.667)从原始数据中提取单次读取的干净数据,并且丢弃每个碱基具有>1个预期错误的读取。根据UPARSE操作分类单元(OTU)分析流程,使用UPARSE将质量过滤后的序列聚类为唯一序列并按丰度递减顺序排序以识别代表性序列。使用UPARSE(7.1版本http://drive5.com/uparse/)去除嵌合序列后,根据98.5%的相似性对OTU进行分类,并使用unite v8.3版本(https://unite.ut.ee/repository.php)进行注释,那些注释为未分类的真菌进一步对ITS_RefSeq_Fungi 1.1版本执行BLAST(ftp://ftp.ncbi.nlm.nih.gov/blast/db/ITS_RefSeq_Fungi.tar.gz)。
(5)基于高通量测序数据产生的代表性序列,计算出微生物基因标志物发现集的OTUs频率文件、验证集的OTUs频率文件和独立诊断集的OTUs频率文件。这些OTUs用于一个相关性研究来鉴定在新型冠状病毒感染和非感染患者之间差异明显的OTUs丰度。使用Wilcoxon检验方法统计分析新型冠状病毒感染和非感染患者之间差异的真菌微生物基因标志物。选择出的2个OTU微生物基因标志物做进一步的分析。
(6)在真菌微生物区别模型的训练集中,包括48例新型冠状病毒感染确诊患者和88例健康对照,使用筛选出的OTUs丰度文件,在一个随机森林模型(R软件3.4.1和随机森林软件包4.6–12)中采用五倍交叉验证的算法(除了设置“importance=TRUE”之外,软件参数默认)进行真菌微生物基因标志物的筛选。采用五倍交叉验证的5次试验,获得了交叉验证错误曲线,其中最小的交叉验证错误点作为cut-off值使用。最小的交叉验证错误值加上对应值的标准差为cut-off值。筛选出小于cut-off值的错误率的8个以下的OTU标志物的集合,选择最小数目OTU的集合作为最佳的真菌微生物基因标志物的集合,最终鉴定了用于该模型的最佳的2个真菌微生物基因标志物(图2)。选择出的2个真菌微生物OTU标志物的基因序列见SEQ ID NO:1-2。
(7)通过使用随机生成的决策树的比率来计算患病率(Probability of disease,POD)指数。决策树预测样本为“COVID-19”,设置的参数预测为:proximity=T,norm.votes=T,predict.all=TRUE。在LOO模式中构建的随机森林模型用于预测验证集中每一个样本的POD指数,最终计算每一个样本的平均预测的POD指数。
(8)使用R 3.3.0程序包中的pROC工具计算受试者工作曲线(ROC),用来评估微生物区别模型,曲线下面积(AUC)用于指定ROC的效应值。
(9)该微生物区别模型在48例新冠病毒确诊患者和88例健康对照之间的区别能力达到99.79%(图4),POD指数在新冠病毒确诊患者中明显升高,两组之间有显著性差异(p=p=2.8x10-25)(图3)。
(10)在验证集中,POD指数在23例新型冠状病毒感染确诊患者中明显升高,两组之间有显著性差异(p=3.2x10-12)(图5),该微生物区别模型在23例新型冠状病毒感染确诊患者和44例健康对照之间的区别能力达到99.6%(图6)。
(11)在独立诊断集中,POD指数在来自杭州地区的75例新型冠状病毒感染确诊患者中明显升高,两组之间有显著性差异(p=4.3x10-26)(图7),该微生物区别模型在75例杭州地区新型冠状病毒感染确诊患者和44例健康对照之间的区别能力达到100%(图8)
(12)在验证集中,POD指数在36例中新型冠状病毒感染疑似患者中明显升高,两组之间有显著性差异(p=3.7x10-16)(图9),该微生物区别模型在在36例新型冠状病毒感染疑似患者和44例健康对照之间的区别能力达到99.94%(图10)。
因此,本发明的真菌微生物基因标志物(模型)在新型冠状病毒感染感染患者和非感染者中实现了良好的区别能力,也验证了该区别模型在中国不同地域中的可行性、适用性和普适性。同时证明了该真菌区别模型能够弥补RT-PCR检测的不足,将感染新冠病毒的疑似患者从健康人群的鉴定出来。
附图说明
图1.一种用于区别新型冠状病毒感染感染和非感染的口腔真菌微生物模型的研究设计和临床应用。
图2.基于随机森林模型采用五倍交叉验证法鉴定的最佳的口腔真菌微生物基因标志物。
图3.在48例新型冠状病毒感染确诊患者和88例健康对照的训练集中,患病率(POD)指数在两组之间的表达差异;
图4.在48例新型冠状病毒感染确诊患者和88例健康对照的训练集中,真菌微生物基因区别模型实现的区别效能;
图5.在验证集中,与44例健康对照人群相比,患病率(POD)指数在23例新型冠状病毒感染确诊患者的表达差异;
图6.在验证集中,患病率(POD)指数在44例健康对照和23例新型冠状病毒感染确诊患者之间的区别能力;
图7.在独立诊断集中,与44例健康对照人群相比,患病率(POD)指数在75例杭州地区新型冠状病毒感染确诊患者的表达差异;
图8.在独立诊断集中,患病率(POD)指数在44例健康对照和75例杭州地区新型冠状病毒感染确诊患者之间的区别能力;
图9.在验证集中,与44例健康对照人群相比,患病率(POD)指数在36例新型冠状病毒感染疑似患者的表达差异;
图10.在验证集中,患病率(POD)指数在44例健康对照和36例新型冠状病毒感染疑似患者之间的区别能力。
具体实施方式
下面结合实施例对本发明作进一步的阐述,但本发明的保护内容不仅限于这些实施例。
下列实施例中所用方法如无特别说明,均为常规方法。下列实施例中所需要的材料或试剂,如无特殊说明均为公开商业途径获得。
本发明通过收集入组对象的舌苔样本,抽提微生物总DNA,进行口腔真菌菌群的ITS测序。基于高通量测序数据,在训练集中建立新型冠状病毒感染和非感染者的真菌微生物区别模型,建立新型冠状病毒感染患病率(probability of disease,POD)指数;POD指数在验证集中计算其区别能力,进行验证;进一步在来自不同地域的独立诊断集中进行独立验证,实现真菌微生物基因区别模型在中国新型冠状病毒感染人群中的普适性;最后在新型冠状病毒感染疑似患者中进行验证,以证明微生物基因区别模型弥补RT-PCR的可能性。
其操作步骤如下:
(1)按照前瞻性临床试验的设计原则,本发明的研究设计如图1所示。该研究方案得到了郑州大学第一附属医院和光山县人民医院伦理委员会的批准。所有入组的患者签署研究方案知情同意书和临床样本收集知情同意书。
(2)每一个入组的新型冠状病毒感染患者和非感染患者提供一份新鲜的舌苔样本,研究实验人员将样本在70℃灭活1小时,然后立即冻存于-80℃冰箱。舌苔真菌总DNA的抽提方法按照试剂盒的说明书进行。
(3)完成舌苔真菌总DNA样本的扩增和DNA文库构建,在Illumina Miseq测序平台完成ITS测序。所有的输出序列完成基本的预处理和基本的生物信息学分析。
(4)使用USEARCH(版本11.0.667)从原始数据中提取单次读取的干净数据,并且丢弃每个碱基具有>1个预期错误的读取。根据UPARSE操作分类单元(OTU)分析流程,使用UPARSE将质量过滤后的序列聚类为唯一序列并按丰度递减顺序排序以识别代表性序列。使用UPARSE(7.1版本http://drive5.com/uparse/)去除嵌合序列后,根据98.5%的相似性对OTU进行分类,并使用unite v8.3版本(https://unite.ut.ee/repository.php)进行注释,那些注释为未分类的真菌进一步对ITS_RefSeq_Fungi 1.1版本执行BLAST
(ftp://ftp.ncbi.nlm.nih.gov/blast/db/ITS_RefSeq_Fungi.tar.gz)。
(5)基于高通量测序数据产生的代表性序列,计算出微生物基因标志物发现集的OTUs频率文件、验证集的OTUs频率文件和独立诊断集的OTUs频率文件。这些OTUs用于一个相关性研究来鉴定在新型冠状病毒感染和非感染患者之间差异明显的OTUs丰度。使用Wilcoxon检验方法统计分析新型冠状病毒感染和非感染患者之间差异的真菌微生物基因标志物。选择出的2个OTU微生物基因标志物做进一步的分析。
(6)在微生物区别模型的训练集中,包括48例新型冠状病毒感染确诊患者和88例健康对照,使用筛选出的OTUs丰度文件,在一个随机森林模型(R软件3.4.1和随机森林软件包4.6–12)中采用五倍交叉验证的算法(除了设置“importance=TRUE”之外,软件参数默认)进行真菌微生物基因标志物的筛选。采用五倍交叉验证的5次试验,获得了交叉验证错误曲线,其中最小的交叉验证错误点作为cut-off值使用。最小的交叉验证错误值加上对应值的标准差为cut-off值。筛选出小于cut-off值的错误率的8个以下的OTU标志物的集合,选择最小数目OTU的集合作为最佳的真菌微生物基因标志物的集合,最终鉴定了用于该模型的最佳的2个真菌微生物基因标志物(图2)。选择出的2个真菌微生物OTU标志物的基因序列见SEQ ID NO:1-2。(7)通过使用随机生成的决策树的比率来计算患病率(Probabilityof disease,POD)指数。决策树预测样本为“COVID-19”,设置的参数预测为:proximity=T,norm.votes=T,predict.all=TRUE。在LOO模式中构建的随机森林模型用于预测验证集中每一个样本的POD指数,最终计算每一个样本的平均预测的POD指数。
(8)使用R 3.3.0程序包中的pROC工具计算受试者工作曲线(ROC),用来评估微生物区别模型,曲线下面积(AUC)用于指定ROC的效应值。
(9)该微生物区别模型在48例新冠病毒确诊患者和88例健康对照之间的区别能力达到99.79%(图4),POD指数在新冠病毒确诊患者中明显升高,两组之间有显著性差异(p=
p=2.8x10-25)(图3)。
(10)在验证集中,POD指数在23例新型冠状病毒感染确诊患者中明显升高,两组之间有显著性差异(p=3.2x10-12)(图5),该微生物区别模型在23例新型冠状病毒感染确诊患者和44例健康对照之间的区别能力达到99.6%(图6)。
(11)在独立诊断集中,POD指数在来自杭州地区的75例新型冠状病毒感染确诊患者中明显升高,两组之间有显著性差异(p=4.3x10-26)(图7),该微生物区别模型在75例杭州地区新型冠状病毒感染确诊患者和44例健康对照之间的区别能力达到100%(图8)
(12)在验证集中,POD指数在36例中新型冠状病毒感染疑似患者中明显升高,两组之间有显著性差异(p=3.7x10-16)(图9),该微生物区别模型在在36例新型冠状病毒感染疑似患者和44例健康对照之间的区别能力达到99.94%(图10)。
因此,本发明的真菌微生物基因区别模型在新型冠状病毒感染患者和非感染者中实现了良好的区别能力,也验证了该区别模型在中国不同地域中的可行性、适用性和普适性。同时证明了该区别模型能够弥补RT-PCR检测的不足,将核酸检测阴性的新型冠状病毒感染者从健康人群中鉴别出来。
Claims (10)
1.一种用于区别新型冠状病毒感染和非感染者的口腔真菌微生物基因标志物,其特征在于:由SEQ ID NO:1-2所示的2种真菌微生物基因组成,所述微生物在口腔中富集。
2.一种用于检测权利要求1所述口腔真菌微生物模型的检测试剂,包括用于检测权利要求1所述的SEQ ID NO:1-2所示的2种真菌微生物基因的引物。
3.根据权利要求1所述的检测试剂,其特征在于:所述引物序列为SEQ ID NO:3-4。
4.权利要求2所述检测试剂在制备新型冠状病毒感染和非感染的区分检测试剂盒中的应用,所述检测试剂适用于检测权利要求1所述的口腔真菌微生物基因。
5.根据权利要求4所述的应用,其特征在于:所述区分检测试剂盒适用于区分新型冠状病毒感染和非感染者,其中新型冠状病毒感染者包括RT-PCR检测阳性的确诊患者及RT-PCR检测阴性但IgG抗体阳性的临床诊断患者。
6.根据权利要求2所述的应用,其特征在于:对所述对象的舌苔进行检测,以便确定该样本是否包含所述的真菌微生物基因,是否可以建立区别新型冠状病毒感染和非感染的真菌微生物基因模型。
7.根据权利要求6所述的应用,其特征在于:通过收集入组对象的舌苔样本,抽提微生物总DNA,完成微生物DNA的ITS测序,检测是否存在权利要求1所述的2种真菌微生物基因。
8.根据权利要求7所述的应用,其特征在于:通过收集入组对象的舌苔样本,抽提微生物总DNA,进行口腔真菌的ITS测序;基于高通量测序数据,在训练集中建立新型冠状病毒感染和非感染者的真菌微生物区别模型,建立新型冠状病毒感染患病率(probabilityofdisease,POD)指数;POD指数在验证集中计算其区别能力,进行验证;进一步在来自不同地域的独立诊断集中进行独立验证,实现微生物基因区别模型在中国新型冠状病毒感染人群中的普适性;最后在新型冠状病毒感染疑似患者中进行验证,实现微生物基因区别模型弥补RT-PCR检测不足的可能性。
9.根据权利要求4所述的应用,其特征在于,具体包括:
(1)收集入组对象的舌苔样本,入组对象包括71例来自河南的新型冠状病毒感染确诊患者、75例杭州地区的新型冠状病毒感染确诊患者、36例新型冠状病毒感染疑似患者和132例健康对照,按照DNA的标准抽提方法完成舌苔样本中微生物总DNA的抽提,在IlluminaMiSeq平台完成口腔菌群的ITS高通量测序工作;
(2)基于高通量测序数据,在微生物区别模型的训练集中,在48例新型冠状病毒感染确诊患者和88例健康对照者之间,基于一个随机森林模型,通过一个五倍交叉验证的算法,鉴定了用于该模型的最佳的2个真菌微生物基因标志物;
(3)基于2个真菌微生物基因标志物,通过使用随机生成的决策树的比率来计算新型冠状病毒感染的患病率POD指数;
(4)该真菌微生物区别模型在48例新型冠状病毒感染确诊患者和88例健康对照者之间的区别能力达到99.79%,POD指数在新型冠状病毒感染确诊患者中明显升高,两组之间有显著性差异;
(5)在验证集中,该真菌微生物区别模型在23例新型冠状病毒感染确诊患者和44例健康对照之间的区别能力达到99.6%;POD指数在新型冠状病毒感染确诊患者中明显升高,两组之间有显著性差异;
(6)在独立诊断集中,该真菌微生物区别模型在75例来自杭州的新型冠状病毒感染确诊患者和44例健康对照之间的区别能力达到100%;POD指数在杭州地区新型冠状病毒感染确诊患者中明显升高,两组之间有显著性差异;
(7)在验证集中,该真菌微生物区别模型在36例新型冠状病毒感染疑似患者和44例健康对照之间的区别能力达到99.94%;POD指数在疑似患者中明显升高,两组之间有显著性差异。
10.一种用于区别新型冠状病毒感染和非感染者的口腔真菌微生物模型的试剂盒,包括用于检测权利要求1所述的SEQ ID NO:1-2所示的2种真菌微生物基因的引物。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310442340.9A CN117106946A (zh) | 2023-04-23 | 2023-04-23 | 用于新型冠状病毒感染患者无创诊断的口腔真菌微生物基因标志物及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310442340.9A CN117106946A (zh) | 2023-04-23 | 2023-04-23 | 用于新型冠状病毒感染患者无创诊断的口腔真菌微生物基因标志物及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117106946A true CN117106946A (zh) | 2023-11-24 |
Family
ID=88798953
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310442340.9A Pending CN117106946A (zh) | 2023-04-23 | 2023-04-23 | 用于新型冠状病毒感染患者无创诊断的口腔真菌微生物基因标志物及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117106946A (zh) |
-
2023
- 2023-04-23 CN CN202310442340.9A patent/CN117106946A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110349630B (zh) | 血液宏基因组测序数据的分析方法、装置及其应用 | |
CN105603066B (zh) | 精神障碍的肠道微生物标志物及其应用 | |
CN113160882B (zh) | 一种基于三代测序的病原微生物宏基因组检测方法 | |
CN114457192B (zh) | 对唾液中EB病毒CpG位点进行甲基化分型的试剂在制备鼻咽癌诊断试剂盒中的应用 | |
CN107034301A (zh) | 一种检测肺结节为良性或恶性的试剂盒及其应用 | |
CN115537462B (zh) | 一种同时检测病原菌和宿主基因表达量的测序方法及在细菌性脑膜炎诊断和预后中的应用 | |
CN112119167A (zh) | 抑郁症生物标志物及其用途 | |
CN113707316A (zh) | 免疫状态评估方法及应用 | |
Guo et al. | Dysbiosis in peripheral blood mononuclear cell virome associated with systemic lupus erythematosus | |
CN110511995B (zh) | 一组结核病标志物及其应用 | |
CN117106946A (zh) | 用于新型冠状病毒感染患者无创诊断的口腔真菌微生物基因标志物及其应用 | |
CN114317725B (zh) | 克罗恩病生物标志物、试剂盒及生物标志物的筛选方法 | |
CN113862382B (zh) | 肠道菌群的生物标志物在制备诊断成人免疫性血小板减少症的产品中的应用 | |
CN113308560B (zh) | 一种用于新型冠状病毒感染患者无创诊断的口腔微生物基因标志物及其应用 | |
CN115927588A (zh) | 一种用于新型冠状病毒感染患者无创诊断的口腔真菌微生物基因标志物及其应用 | |
CN112609024B (zh) | 一种用于新型冠状病毒感染患者无创诊断的肠道微生物基因标志物及其应用 | |
CN115331737A (zh) | 一种分析肠道菌群中致病菌和量化菌群地域特征的方法 | |
CN112680549A (zh) | 一种用于区别自身免疫性肝炎和健康人群的口腔微生物基因标志物及其应用 | |
CN114107454A (zh) | 基于宏基因/宏转录组测序的呼吸道感染病原检测方法 | |
CN116445599A (zh) | 一种用于系统性红斑狼疮患者无创诊断的口腔微生物基因标志物及其临床应用 | |
CN112063709A (zh) | 一种以微生物作为诊断标志物的重症肌无力的诊断试剂盒及应用 | |
CN112011605A (zh) | 微生物菌群在疾病诊断中的应用 | |
CN115261500B (zh) | 爆发力相关的肠道微生物标记物及其应用 | |
CN117467784A (zh) | 用于评估covid-19患者康复1年后中和抗体水平的口腔真菌微生物基因标志物 | |
CN114703305B (zh) | 用于预测新冠肺炎患者一年后中和抗体水平的口腔微生物基因标志物及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |