CN114959077A - 用于区别胆管细胞癌和健康人群的口腔微生物基因标志物及其应用 - Google Patents

用于区别胆管细胞癌和健康人群的口腔微生物基因标志物及其应用 Download PDF

Info

Publication number
CN114959077A
CN114959077A CN202210377493.5A CN202210377493A CN114959077A CN 114959077 A CN114959077 A CN 114959077A CN 202210377493 A CN202210377493 A CN 202210377493A CN 114959077 A CN114959077 A CN 114959077A
Authority
CN
China
Prior art keywords
microbial
cholangiocellular carcinoma
healthy people
distinguishing
oral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210377493.5A
Other languages
English (en)
Inventor
饶本臣
任志刚
余祖江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Affiliated Hospital of Zhengzhou University
Original Assignee
First Affiliated Hospital of Zhengzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Affiliated Hospital of Zhengzhou University filed Critical First Affiliated Hospital of Zhengzhou University
Priority to CN202210377493.5A priority Critical patent/CN114959077A/zh
Publication of CN114959077A publication Critical patent/CN114959077A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Physiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Artificial Intelligence (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于生物医药技术领域,具体涉及一种区别胆管细胞癌和健康人群的口腔微生物基因标志物及其应用。本发明提供了一种用于区别胆管细胞癌和健康人群的口腔微生物基因标志物,由SEQ ID NO:1‑3所示的3种微生物基因组成,所述微生物基因在人体口腔中明显富集。因此,本发明的微生物基因区别模型在胆管细胞癌和健康人群中实现了良好的区别能力。也验证了该区别模型的可行性和适用性。

Description

用于区别胆管细胞癌和健康人群的口腔微生物基因标志物及 其应用
技术领域
本发明属于生物医药技术领域,具体涉及一种区别胆管细胞癌和健康人群的口腔微生物基因标志物及其应用。
背景技术
肝癌是全球最常见的恶性肿瘤之一,2021年美国有42,230例新病例和30,230例死亡。原发性肝癌包括肝细胞癌(HCC)(占75%-85%)和胆管细胞癌(CCA)(占10%-15%)以及其他罕见类型。近年来,胆管癌的患病率和死亡率都有所增加。胆管癌呈散发性,危险因素存在地区差异。在东南亚,CCA的常见危险因素是肝吸虫(Opisthorcis viverrini和Clonorchis sinensis)、慢性伤寒携带和慢性导管内胆结石,以及胆总管(胆管)囊肿和Caroli病(肝内胆管囊肿)。然而,在西方国家,最重要的危险因素是原发性硬化性胆管炎(PSC)。还有其他风险因素,包括胸腔放疗、乙型肝炎病毒(HBV)或丙型肝炎病毒(HCV)感染和肝硬化。胆管癌因其解剖位置、生长模式和缺乏明确的诊断标准而难以诊断。尽管经常发现和报告新的诊断生物标志物,但存在许多局限性。肝活检是诊断CCA的金标准,但是,它是一种侵入性操作,有时无法执行此操作。因此,迫切需要寻找新的、非侵入性的CCA诊断生物标志物。
口腔微生态系统与健康和疾病密切相关。众所周知,口腔微生物菌群失调不仅会导致口腔疾病,例如龋齿、牙周炎、口腔粘膜疾病,还会涉及全身性疾病,包括胃肠系统疾病,例如炎性肠病、肝硬化、胰腺癌,神经系统疾病,例如阿尔茨海默氏病,内分泌系统性疾病,例如糖尿病、多囊卵巢综合征,免疫系统疾病,例如类风湿关节炎和心血管系统疾病,例如动脉粥样硬化。
人类微生物组中关健功能菌可成为人类疾病的新型生物标志物。基于肠道微生物组建立疾病诊断模型已经在多个疾病中广泛应用,Qin J等率先使用宏基因组学报道了肠道微生态与2型糖尿病的相关性,指出23个菌种可能成为区分2型糖尿病的肠道微生物标志物。Qin N,Li A等(2014年Nature杂志)通过宏基因组测序技术解析了中国人群肝硬化患者肠道微生态结构,在微生物基因和功能水平上,鉴定了肝硬化特异性的15个标记物,创建了一个高准确度的肝硬化患者区分指数。口腔微生态的特征或者基于口腔微生物建立的区别模型作为特定疾病或肿瘤的区分工具正越来越多被广泛报道和认可。Cui J等对78名胃炎患者和50名健康个体进行研究,提出口腔微生态可以作为胃炎及其癌前病变的无创标志物。Lu H,指出2个菌属(原细菌属和梭菌属)可能成为区分肝癌的口腔微生物标志物,这是基于口腔微生物组建立的无创诊断模型。因而,口腔微生物可能是不同疾病诊断的有力工具。然而,用于区别胆管细胞癌和健康人群的口腔微生物模型还未曾报道过。
发明内容
本发明提供了一种用于区别胆管细胞癌和健康人群的口腔微生物基因标志物,由SEQ ID NO:1-3所示的3种微生物基因组成,所述微生物基因在人体口腔中明显富集。
>OTU20
CCTACGGGTGGCTGCAGTGGGGAATTTTGGACAATGGGCGAAAGCCTGATCCAGCAATGCCGCGTgtgtgATGAAGGCCTTCGGGTTGTAAAGCACTTTTGGCGGGAACGAAAAGGACTGTGCCAATACCACGGTTCGATGACGGTACCCGCAGAATAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGAGTGCGCAGGCGGTTTTGCAAGACCGATGTGAAATCCCCGGGCTTAACCTGGGAACTGCATTGGTGACTGCAAGGCTAGAGTgtgtCAGAGGGAGGTGGAATTCCGCATGTAGCAGTGAAATGCGTAGATATGCGGAGGAACACCGATGGCGAAGGCAGCCTCCTGGGATAACACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTAGTAGTC
>OTU30
CCTACGGGTGGCTGCAGTGAGGAATATTGGTCAATGGGCGAGAGCCTGAACCAGCCAAGTAGCGTGCAGGATGACGGCCCTCCGGGTTGTAAACTGCTTTTAGTTGGGAATAAaaaaaGGGACTTGTCCCTTCTTGTATGTACCTTCAGAAaaaGGACCGGCTAATTCCGTGCCAGCAGCCGCGGTAATACGGAAGGTCCAGGCGTTATCCGGATTTATTGGGTTTAAAGGGAGCGTAGGCGGATTGTTAAGTCAGCGGTTAAAGGGTGTGGCTCAACCATGCATTGCCGTTGAAACTGGCGATCTTGAGTGCAGACAGGGATGCCGGAATTCGTGGTGTAGCGGTGAAATGCTTAGATATCACGAAGAACTCCGATCGCGAAGGCAGGTGTCCGGGCTGCAACTGACGCTGAGGCTCGAAAGTGTGGGTATCAAACAGGATTAGATACCCTAGTAGTC
>OTU51
CCTACGGGTGGCTGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCGACGCCGCGTGAGGGATGGAGGCCTTCGGGTTGTAAACCTCTTTCGCCAGTGAAGCAGGCCTGTCCCTTGTGGGTGGGTTGACGGTAGCTGGATAAGAAGCGCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGCGCGAGCGTTGTCCGGAATTATTGGGCGTAAAGAGCTCGTAGGCGGCTGGTCGCGTCTGTCGTGAAATCCTCTGGCTTAACTGGgggCTTGCGGTGGGTACGGGCCGGCTTGAGTGCGGTAGGGGAGACTGGAACTCCTGGTGTAGCGGTGGAATGCGCAGATATCAGGAAGAACACCGGTGGCGAAGGCGGGTCTCTGGGCCGTTACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTAGTAGTC
另外本发明还提供了一种检测试剂,包括用于检测SEQ ID NO:1-3所示的3种微生物基因的引物。所述引物序列为SEQ ID NO:4-5,引物序列如下:
引物Primers
测序区域V3+V4:338F-806R
上游引物:338F ACTCCTACGGGAGGCAGCA
下游引物:806R GGACTACHVGGGTWTCTAAT
通过收集入组对象的唾液样本,抽提微生物总DNA,完成微生物DNA的16S rDNAMiseq测序,检测是否存在权利要求1所述的3种微生物基因。
进一步的,通过收集入组对象的唾液样本,抽提微生物总DNA,进行口腔菌群的16SrDNA Miseq测序。基于高通量测序数据,建立胆管细胞癌和健康人群的微生物区别模型,建立胆管细胞癌患病率(probability of disease,POD)指数;POD指数可用于计算其区别能力,进行验证。
具体包括:
(1)收集入组对象(胆管细胞癌患者和健康人群)的唾液样本,按照DNA的标准抽提方法完成唾液样本中微生物总DNA的抽提,在Illumina MiSeq平台完成口腔菌群的16SrDNA高通量测序工作;
(2)基于高通量测序数据,在微生物区别模型的队列中,在50例胆管细胞癌和100例健康人之间,基于一个随机森林模型,通过一个五倍交叉验证的算法,鉴定了用于该模型的最佳的3个微生物基因标志物。
(3)基于3个微生物基因标志物,通过使用随机生成的决策树的比率来计算胆管细胞癌的患病率(Probability of disease,POD)指数。
(4)该微生物区别模型在50例胆管细胞癌患者和100例健康人之间的区别能力达到99.22%,POD指数在胆管细胞癌患者中明显升高,两组之间有显著性差异(p<0.0001)。
(5)在验证集中,该微生物区别模型在24例胆管细胞癌患者和50例健康对照之间的区别能力达到98.08%;POD指数在胆管细胞癌患者中明显升高,两组之间有显著性差异(p<0.0001)。
因此,本发明的微生物基因区别模型在胆管细胞癌和健康人群中实现了良好的区别能力。也验证了该区别模型的可行性和适用性。
另外,还提供了一种用于区别胆管细胞癌和健康人群的口腔微生物模型的试剂盒,包括用于检测权利要求1所述的SEQ ID NO:1-3所示的3种微生物基因的引物。
本发明还提供了用于区别胆管细胞癌和健康人群的口腔微生物基因标志物在建立一种区别胆管细胞癌和健康人群的口腔微生物模型中的应用。
所述微生物区别模型适用于区别胆管细胞癌患者和健康人群。
对所述对象的唾液进行检测,以便确定该样本是否包含所述的微生物基因,是否可以建立区别胆管细胞癌患者和健康人群的微生物基因模型。
一种区别胆管细胞癌和健康人群的口腔微生物模型,包括SEQ ID NO:1-3所示的3种微生物基因。
本发明的具体操作步骤如下:
(1)按照前瞻性临床试验的设计原则,本发明的研究设计如图1所示。该研究方案得到了郑州大学第一附属医院伦理委员会的批准。所有入组的患者签署研究方案知情同意书和临床样本收集知情同意书。
(2)每一个入组的胆管细胞癌患者和健康人提供一份新鲜的唾液样本,研究实验人员将样本按照每份500ul的体积分装成10份,并立即冻存于-80℃冰箱。唾液细菌总DNA的抽提方法按照试剂盒的说明书进行。
(3)完成唾液细菌总DNA样本的扩增和DNA文库构建,在IlluminaMiseq测序平台完成16S rDNA测序。所有的输出序列完成基本的预处理和基本的生物信息学分析。
(4)从所有样本中随机抽选等量的序列数,按照UPARSE传递途径拼接成对应的16SrDNA基因序列分类单元(Operational Taxonomy Units,OTUs),将产生的所有样本的OTUs基因序列收集整理。基于微生物基因序列,使用RDP分类器2.6版本注释。
(5)基于高通量测序数据产生的代表性序列,计算出微生物基因标志物的OTUs频率文件。这些OTUs用于一个相关性研究来鉴定在胆管细胞癌患者和健康人群之间的OTUs丰度。使用Wilcoxon检验方法统计分析胆管细胞癌患者和健康人群之间差异的微生物基因标志物。
(6)在微生物区别模型的训练集中,包括50例胆管细胞癌患者和100例健康人,使用筛选出的OTUs丰度文件,在一个随机森林模型(R软件3.4.1和随机森林软件包4.6–12)中采用五倍交叉验证的算法(除了设置“importance=TRUE”之外,软件参数默认)进行微生物基因标志物的筛选。采用五倍交叉验证的5次试验,获得了交叉验证错误曲线,其中最小的交叉验证错误点作为cut-off值使用。最小的交叉验证错误值加上对应值的标准差为cut-off值。筛选出小于cut-off值的错误率的3个以下的OTUs标志物的集合,选择最小数目OTUs的集合作为最佳的微生物基因标志物的集合,最终鉴定了用于该模型的最佳的3个微生物基因标志物(图2)。选择出的3个微生物OTUs标志物的基因序列见SEQ ID NO:1-3。
(7)通过使用随机生成的决策树的比率来计算患病率(Probability of disease,POD)指数。决策树预测样本为“CCA”,设置的参数预测为:proximity=T,norm.votes=T,predict.all=TRUE。在LOO模式中构建的随机森林模型用于预测队列中每一个样本的POD指数,最终计算每一个样本的平均预测的POD指数。
(8)使用R 3.3.0程序包中的pROC工具计算受试者工作曲线(ROC),用来评估微生物区别模型,曲线下面积(AUC)用于指定ROC的效应值。
(9)该微生物区别模型在50例胆管细胞癌和100例健康人群之间的区别能力达到99.22%(图3),POD指数在胆管细胞癌患者中明显升高,两组之间有显著性差异(p<0.0001)(图4)。
(10)在验证集中,POD指数在24例胆管细胞癌中明显升高,两组之间有显著性差异(p<0.0001)(图5),该微生物区别模型在24例胆管细胞癌和50例健康对照之间的区别能力达到98.08%(图6)。
因此,本发明的微生物基因区别模型在胆管细胞癌和健康人群中实现了良好的区别能力,也验证了该区别模型的可行性和适用性。
附图说明
图1.一种用于区别胆管细胞癌和健康人群的口腔微生物模型的研究设计和应用。
图2.基于随机森林模型采用五倍交叉验证法鉴定的最佳的口腔微生物基因标志物。
图3.在50例胆管细胞癌和100例健康人群的队列中,患病率(POD)指数在两组之间的差异;
图4.在50例胆管细胞癌和100例健康人群的队列中,微生物基因区别模型实现的区别效能;
图5.在验证集中,与50例健康对照人群相比,患病率(POD)指数在24例胆管细胞癌样本的中显著升高;
图6.在验证集中,患病率(POD)指数在50例健康对照和24例胆管细胞癌之间的区别能力;
具体实施方式
下面结合实施例对本发明作进一步的阐述,但本发明的保护内容不仅限于这些实施例。
下列实施例中所用方法如无特别说明,均为常规方法。下列实施例中所需要的材料或试剂,如无特殊说明均为公开商业途径获得。
本发明通过收集入组对象的唾液样本,抽提微生物总DNA,进行口腔菌群的16SrDNA Miseq测序。基于高通量测序数据,在训练集中建立胆管细胞癌和健康人群的微生物区别模型,建立胆管细胞癌患病率(probability of disease,POD)指数;POD指数可用于计算其区别能力,在验证集中进行验证。
其操作步骤如下:
(1)按照前瞻性临床试验的设计原则,本发明的研究设计如图1所示。该研究方案得到了郑州大学第一附属医院伦理委员会的批准。所有入组的患者签署研究方案知情同意书和临床样本收集知情同意书。
(2)每一个入组的胆管细胞癌患者和健康人提供一份新鲜的唾液样本,研究实验人员将样本按照每份500ul的体积分装成10份,并立即冻存于-80℃冰箱。唾液细菌总DNA的抽提方法按照试剂盒的说明书进行。
(3)完成唾液细菌总DNA样本的扩增和DNA文库构建,在IlluminaMiseq测序平台完成16S rDNA测序。所有的输出序列完成基本的预处理和基本的生物信息学分析。
(4)从所有样本中随机抽选等量的序列数,按照UPARSE传递途径拼接成对应的16SrDNA基因序列分类单元(Operational Taxonomy Units,OTUs),将产生的所有样本的OTUs基因序列收集整理。基于微生物基因序列,使用RDP分类器2.6版本注释。
(5)基于高通量测序数据产生的代表性序列,计算出微生物基因标志物的OTUs频率文件。这些OTUs用于一个相关性研究来鉴定在胆管细胞癌患者和健康人群之间的OTUs丰度。使用Wilcoxon检验方法统计分析胆管细胞癌患者和健康人群之间差异的微生物基因标志物。
(6)在微生物区别模型的队列中,包括50例胆管细胞癌患者和100例健康人,使用筛选出的OTUs丰度文件,在一个随机森林模型(R软件3.4.1和随机森林软件包4.6–12)中采用五倍交叉验证的算法(除了设置“importance=TRUE”之外,软件参数默认)进行微生物基因标志物的筛选。采用五倍交叉验证的5次试验,获得了交叉验证错误曲线,其中最小的交叉验证错误点作为cut-off值使用。最小的交叉验证错误值加上对应值的标准差为cut-off值。筛选出小于cut-off值的错误率的3个以下的OTUs标志物的集合,选择最小数目OTUs的集合作为最佳的微生物基因标志物的集合,最终鉴定了用于该模型的最佳的3个微生物基因标志物(图2)。选择出的3个微生物OTUs标志物的基因序列见SEQ ID NO:1-3。
(7)通过使用随机生成的决策树的比率来计算患病率(Probability of disease,POD)指数。决策树预测样本为“CCA”,设置的参数预测为:proximity=T,norm.votes=T,predict.all=TRUE。在LOO模式中构建的随机森林模型用于预测每一个样本的POD指数,最终计算每一个样本的平均预测的POD指数。
(8)使用R 3.3.0程序包中的pROC工具计算受试者工作曲线(ROC),用来评估微生物区别模型,曲线下面积(AUC)用于指定ROC的效应值。
(9)该微生物区别模型在50例胆管细胞癌和100例健康人群之间的区别能力达到99.22%(图4),POD指数在胆管细胞癌患者中明显升高,两组之间有显著性差异(p<0.0001)(图3)。
(10)在验证集中,POD指数在24例胆管细胞癌中明显升高,两组之间有显著性差异(p<0.0001)(图5),该微生物区别模型在24例胆管细胞癌和50例健康对照之间的区别能力达到98.08%(图6)。
因此,本发明的微生物基因区别模型在胆管细胞癌和健康人群中实现了良好的区别能力,也验证了该区别模型在的可行性和适用性。
序列表
<110> 郑州大学第一附属医院
<120> 用于区别胆管细胞癌和健康人群的口腔微生物基因标志物及其应用
<160> 5
<170> SIPOSequenceListing 1.0
<210> 1
<211> 465
<212> DNA
<213> 口腔微生物(Oral microorganism)
<400> 1
cctacgggtg gctgcagtgg ggaattttgg acaatgggcg aaagcctgat ccagcaatgc 60
cgcgtgtgtg atgaaggcct tcgggttgta aagcactttt ggcgggaacg aaaaggactg 120
tgccaatacc acggttcgat gacggtaccc gcagaataag caccggctaa ctacgtgcca 180
gcagccgcgg taatacgtag ggtgcaagcg ttaatcggaa ttactgggcg taaagagtgc 240
gcaggcggtt ttgcaagacc gatgtgaaat ccccgggctt aacctgggaa ctgcattggt 300
gactgcaagg ctagagtgtg tcagagggag gtggaattcc gcatgtagca gtgaaatgcg 360
tagatatgcg gaggaacacc gatggcgaag gcagcctcct gggataacac tgacgctcat 420
gcacgaaagc gtggggagca aacaggatta gataccctag tagtc 465
<210> 2
<211> 459
<212> DNA
<213> 口腔微生物(Oral microorganism)
<400> 2
cctacgggtg gctgcagtga ggaatattgg tcaatgggcg agagcctgaa ccagccaagt 60
agcgtgcagg atgacggccc tccgggttgt aaactgcttt tagttgggaa taaaaaaagg 120
gacttgtccc ttcttgtatg taccttcaga aaaaggaccg gctaattccg tgccagcagc 180
cgcggtaata cggaaggtcc aggcgttatc cggatttatt gggtttaaag ggagcgtagg 240
cggattgtta agtcagcggt taaagggtgt ggctcaacca tgcattgccg ttgaaactgg 300
cgatcttgag tgcagacagg gatgccggaa ttcgtggtgt agcggtgaaa tgcttagata 360
tcacgaagaa ctccgatcgc gaaggcaggt gtccgggctg caactgacgc tgaggctcga 420
aagtgtgggt atcaaacagg attagatacc ctagtagtc 459
<210> 3
<211> 460
<212> DNA
<213> 口腔微生物(Oral microorganism)
<400> 3
cctacgggtg gctgcagtgg ggaatattgc acaatgggcg caagcctgat gcagcgacgc 60
cgcgtgaggg atggaggcct tcgggttgta aacctctttc gccagtgaag caggcctgtc 120
ccttgtgggt gggttgacgg tagctggata agaagcgccg gctaactacg tgccagcagc 180
cgcggtaata cgtagggcgc gagcgttgtc cggaattatt gggcgtaaag agctcgtagg 240
cggctggtcg cgtctgtcgt gaaatcctct ggcttaactg ggggcttgcg gtgggtacgg 300
gccggcttga gtgcggtagg ggagactgga actcctggtg tagcggtgga atgcgcagat 360
atcaggaaga acaccggtgg cgaaggcggg tctctgggcc gttactgacg ctgaggagcg 420
aaagcgtggg gagcgaacag gattagatac cctagtagtc 460
<210> 7
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
actcctacgg gaggcagca 19
<210> 8
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ggactachvg ggtwtctaat 20

Claims (10)

1.一种用于区别胆管细胞癌和健康人群的口腔微生物基因标志物,其特征在于:由SEQIDNO:1-3所示的3种微生物基因组成,所述微生物在口腔中明显富集。
2.一种用于检测权利要求1所述口腔微生物基因标志物的检测试剂,包括用于检测权利要求1所述的SEQ ID NO:1-3所示的3种微生物基因的引物。
3.根据权利要求2所述的检测试剂,其特征在于:所述引物序列为SEQ ID NO:4-5。
4.权利要求2或3所述检测试剂在制备胆管细胞癌和健康人群的区分检测试剂盒中的应用,所述检测试剂适用于检测权利要求1所述的口腔微生物基因。
5.根据权利要求4所述的应用,其特征在于:通过收集入组对象的唾液样本,抽提微生物总DNA,完成微生物DNA的16S rDNA Miseq测序,检测是否存在权利要求1所述的3种微生物基因。
6.根据权利要求5所述的应用,其特征在于:通过收集入组对象的唾液样本,抽提微生物总DNA,进行口腔菌群的16S rDNA Miseq测序;基于高通量测序数据,在队列中建立胆管细胞癌患者和健康人群的微生物区别模型,建立胆管细胞癌患病率POD指数;POD指数可用于计算其区别能力,进行验证。
7.根据权利要求4所述的应用,其特征在于,具体包括:
(1)收集入组对象的唾液样本,入组对象包括50例胆管细胞癌患者和100例健康人,按照DNA的标准抽提方法完成唾液样本中微生物总DNA的抽提,在Illumina MiSeq平台完成口腔菌群的16S rDNA高通量测序工作;
(2)基于高通量测序数据,在微生物区别模型的队列中,在50例胆管细胞癌患者和100例健康人之间,基于一个随机森林模型,通过一个五倍交叉验证的算法,鉴定了用于该模型的最佳的3个微生物基因标志物;
(3)基于3个微生物基因标志物,通过使用随机生成的决策树的比率来计算胆管细胞癌患病率POD指数;
(4)该微生物区别模型在50例胆管细胞癌患者和100例健康人之间的区别能力达到99.22%,POD指数在胆管细胞癌患者中明显升高,两组之间有显著性差异;
(5)在验证集中,该微生物区别模型在24例胆管细胞癌患者和50例健康对照之间的区别能力达到98.08%;POD指数在胆管细胞癌患者中明显升高,两组之间有显著性差异。
8.一种用于区别胆管细胞癌患者和健康人群的口腔微生物模型的试剂盒,包括用于检测权利要求1所述的SEQ ID NO:1-3所示的3种微生物基因的引物。
9.权利要求1所述口腔微生物基因标志物在构建适用于区分胆管细胞癌患者和健康人群的口腔微生物模型的应用。
10.一种用于区分胆管细胞癌患者和健康人群的口腔微生物模型,其特征在于,包括SEQ IDNO:1-3所示的3种微生物基因。
CN202210377493.5A 2022-04-11 2022-04-11 用于区别胆管细胞癌和健康人群的口腔微生物基因标志物及其应用 Pending CN114959077A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210377493.5A CN114959077A (zh) 2022-04-11 2022-04-11 用于区别胆管细胞癌和健康人群的口腔微生物基因标志物及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210377493.5A CN114959077A (zh) 2022-04-11 2022-04-11 用于区别胆管细胞癌和健康人群的口腔微生物基因标志物及其应用

Publications (1)

Publication Number Publication Date
CN114959077A true CN114959077A (zh) 2022-08-30

Family

ID=82978471

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210377493.5A Pending CN114959077A (zh) 2022-04-11 2022-04-11 用于区别胆管细胞癌和健康人群的口腔微生物基因标志物及其应用

Country Status (1)

Country Link
CN (1) CN114959077A (zh)

Similar Documents

Publication Publication Date Title
CN109852714B (zh) 一种肠癌早期诊断和腺瘤诊断标志物及用途
CN109830264B (zh) 肿瘤患者基于甲基化位点进行分类的方法
CN106460045B (zh) 人类基因组常见拷贝数变异用于癌症易感风险评估
CN107034301A (zh) 一种检测肺结节为良性或恶性的试剂盒及其应用
CN110205378B (zh) 一组脊柱结核血浆miRNA联合诊断标记物及其应用
CN109371147A (zh) 一种用于区别肝癌和非肝癌的肠道微生物基因标志物及其应用
CN112330596A (zh) 一种基于机器学习算法的用于预测crc转移的影像组学(ra)模型
CN111254207A (zh) 用于区别自身免疫性肝炎和健康人群的肠道微生物标志物及其应用
CN115094142B (zh) 用于诊断肺肠型腺癌的甲基化标志物
CN113913333B (zh) 一种肺癌诊断标志物及用途
CN111833963A (zh) 一种cfDNA分类方法、装置和用途
CN113724862B (zh) 一种结直肠癌生物标志物及其筛选方法和应用
CN106156540B (zh) 分析个体两类状态的免疫差异、辅助确定个体状态的方法
CN112680549A (zh) 一种用于区别自身免疫性肝炎和健康人群的口腔微生物基因标志物及其应用
CN114959077A (zh) 用于区别胆管细胞癌和健康人群的口腔微生物基因标志物及其应用
CN114045337A (zh) 基于肠道微生物的胆管癌非侵入性标志物筛选、分析方法及应用
CN115331737A (zh) 一种分析肠道菌群中致病菌和量化菌群地域特征的方法
CN113862382B (zh) 肠道菌群的生物标志物在制备诊断成人免疫性血小板减少症的产品中的应用
CN114703305B (zh) 用于预测新冠肺炎患者一年后中和抗体水平的口腔微生物基因标志物及其应用
CN114717342B (zh) 用于预测新冠肺炎患者一年后中和抗体水平的肠道微生物基因标志物及其应用
CN113308560B (zh) 一种用于新型冠状病毒感染患者无创诊断的口腔微生物基因标志物及其应用
CN112609024B (zh) 一种用于新型冠状病毒感染患者无创诊断的肠道微生物基因标志物及其应用
CN109762900B (zh) 结直肠癌标志物及其应用
CN116445599A (zh) 一种用于系统性红斑狼疮患者无创诊断的口腔微生物基因标志物及其临床应用
CN117106946A (zh) 用于新型冠状病毒感染患者无创诊断的口腔真菌微生物基因标志物及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination