CN112375832A - 一种用于表征肺腺癌气阴两虚证的肠道菌群组合及筛选及模型建立方法 - Google Patents
一种用于表征肺腺癌气阴两虚证的肠道菌群组合及筛选及模型建立方法 Download PDFInfo
- Publication number
- CN112375832A CN112375832A CN202011243447.3A CN202011243447A CN112375832A CN 112375832 A CN112375832 A CN 112375832A CN 202011243447 A CN202011243447 A CN 202011243447A CN 112375832 A CN112375832 A CN 112375832A
- Authority
- CN
- China
- Prior art keywords
- streptococcus
- intestinal flora
- prevotella
- screening
- combination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000000968 intestinal effect Effects 0.000 title claims abstract description 57
- 208000011580 syndromic disease Diseases 0.000 title claims abstract description 37
- 208000010507 Adenocarcinoma of Lung Diseases 0.000 title claims abstract description 36
- 201000005249 lung adenocarcinoma Diseases 0.000 title claims abstract description 36
- 208000031971 Yin Deficiency Diseases 0.000 title claims abstract description 33
- 238000012216 screening Methods 0.000 title claims abstract description 30
- 238000000034 method Methods 0.000 title claims abstract description 27
- 241000194017 Streptococcus Species 0.000 claims abstract description 65
- 238000007477 logistic regression Methods 0.000 claims abstract description 22
- 241000186000 Bifidobacterium Species 0.000 claims abstract description 17
- 241000606125 Bacteroides Species 0.000 claims abstract description 16
- 241000607768 Shigella Species 0.000 claims abstract description 7
- 241000605861 Prevotella Species 0.000 claims description 52
- 238000004458 analytical method Methods 0.000 claims description 22
- 230000000694 effects Effects 0.000 claims description 14
- 238000012163 sequencing technique Methods 0.000 claims description 14
- 241001608234 Faecalibacterium Species 0.000 claims description 11
- 244000005700 microbiome Species 0.000 claims description 11
- 108020004465 16S ribosomal RNA Proteins 0.000 claims description 9
- 230000007812 deficiency Effects 0.000 claims description 8
- 238000012795 verification Methods 0.000 claims description 8
- 238000012408 PCR amplification Methods 0.000 claims description 7
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 241000894007 species Species 0.000 claims description 5
- 238000003559 RNA-seq method Methods 0.000 claims description 4
- 238000011002 quantification Methods 0.000 claims description 4
- 238000000246 agarose gel electrophoresis Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000002550 fecal effect Effects 0.000 claims description 3
- 230000008014 freezing Effects 0.000 claims description 3
- 238000007710 freezing Methods 0.000 claims description 3
- 239000007788 liquid Substances 0.000 claims description 3
- 229910052757 nitrogen Inorganic materials 0.000 claims description 3
- 238000010257 thawing Methods 0.000 claims description 3
- 238000010230 functional analysis Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims 1
- 239000003814 drug Substances 0.000 abstract description 26
- 238000011160 research Methods 0.000 abstract description 10
- 238000010200 validation analysis Methods 0.000 abstract 2
- 238000005516 engineering process Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 230000006872 improvement Effects 0.000 description 5
- 238000007689 inspection Methods 0.000 description 5
- 238000012512 characterization method Methods 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 3
- 210000003608 fece Anatomy 0.000 description 3
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 3
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 2
- 238000000585 Mann–Whitney U test Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 210000002429 large intestine Anatomy 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 241000588914 Enterobacter Species 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 241001410206 Protella Species 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/689—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Immunology (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Microbiology (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种用于表征肺腺癌气阴两虚证的肠道菌群组合及筛选及模型建立方法,肠道菌群组合在属水平上的分布前6位的是拟杆菌属,粪杆菌属,双歧杆菌属,普氏菌属,大肠志贺氏杆菌属和链球菌属,运用16s‑RNA测序方法测序,并通过宏基因组学方法加以验证,本发明对筛选得到的肠道菌群组合进行了组外样本宏基因组学验证,该模型发现组的AUC值为0.801,宏基因验证组的AUC值为0.842,证明所发现的属水平上2个特别显著的普氏菌属和链球菌属以及建立的逻辑斯蒂回归模型的结果稳定可靠,明显优于简单罗列几个肠道菌群的形式,得到了深入研究与临床推广中医证型的核心参数,具有普适性和科学性。
Description
技术领域
本发明属于临床医学、分子医学、检验医学、中医学或中西医结合医学领域,具体的说,是一种用于表征肺腺癌气阴两虚证的肠道菌群组合及筛选及模型建立方法。
背景技术
气阴两虚证是非小细胞肺癌的中医典型证候,也是中医学特有的学术概念。其通过中医师经临床四诊合参后得出主观判断结论,目前主要参考内容有《中药新药临床研究指导原则》、《恶性肿瘤中医诊疗指南》中的相关内容,但缺乏客观标准,影响结果的准确性,临床运用及推广均受到限制。明确中医典型证候的客观物质基础有助于促进中医学标准化、客观化发展,并为提高临床诊疗水平提供研究基础。针对非小细胞肺癌的研究表明,肠道菌群在手术、化疗、靶向等治疗前后表现出了种属与活性的显著差异性,并已有经筛选得到与评价临床疗效较为相关的肠道菌群的报道。中医有“肺与大肠相表里”的经典理论,且中医证型研究中已有某些肠道微生物与特定证型相关的报道,但目前尚不足以表征中医证候的生物学特征;基础研究表明,气阴两虚证的生物学内涵可能涉及炎症、免疫、细胞凋亡等多个内容,且有越来越多的证据表明与肠道菌群密切相关。因此,运用科学方法筛选出具有客观表征肺腺癌气阴两虚证作用的肠道菌群组合是科学可行的,并且有助于中医证型的临床推广运用。目前,已有运用组学技术探索中医证型生物学内涵的研究并发现了一些特异性的标记物,但可以表征肺腺癌气阴两虚证的肠道菌群及其组合尚未见报道。因此,为了进一步探究肠道菌群在肺腺癌气阴两虚证中的分布情况及表征作用,运用16s-RNA(16s-RNAsequencing)技术对肺腺癌气阴两虚证首诊患者的肠道微生物进行测序,进而经生信分析后阐述特定肠道菌群在肺腺癌气阴两虚证形成过程中的作用机制,建立判别模型并通过宏基因组学结果验证后得到稳定结果,这是目前探究中医证型生物学基础的较为创新和重要的技术手段,并能较好地将筛选得到肠道菌群及组合转化为客观量化肺腺癌气阴两虚证的核心参数,有助于开展临床运用及推广。
发明内容
本发明针对目前肺腺癌气阴两虚证缺乏肠道菌群组合表征的现状,作出了改进,提供了一种肠道菌群组合用于表征肺腺癌气阴两虚证及其筛选方法和建立判别模型的方法,通过运用16s RNA(16s-RNA sequencing)技术对肺腺癌气阴两虚证首诊患者的肠道微生物进行测序,发现在属水平上分布最为丰富的前6位肠道菌群依次是拟杆菌属(Bacteroides),粪杆菌属(Faecalibacterium),双歧杆菌属 (Bifidobacterium),普氏菌属(Prevotella_9)和大肠志贺氏杆菌属 (Escherichia-Shigella)和链球菌属(Streptococcus),进而运用LEfSe(LDA Effect Size) 分析方法在属水平上筛选得到两个特别显著的为普氏菌属(Prevotella_9)和链球菌属(Streptococcus),并使用普氏菌属(Prevotella_9)和链球菌属(Streptococcus)的相对丰度作为自变量建立用于表征肺腺癌气阴两虚证的逻辑斯蒂(Logistic)回归模型,经带入宏基因组学结果进行验证,确定了属水平上2个特别显著的普氏菌属(Prevotella_9)和链球菌属(Streptococcus)以及逻辑斯蒂(Logistic)回归模型的结果准确性,实现了运用肠道菌群组合来客观量化非小细胞肺癌气阴两虚证这一目标,并为临床推广提供了方法及检验核心参数。这一属水平上肠道菌群组合及其在本领域中的合理变形,均属于本发明技术方案要保护的内容。
本发明是通过以下技术方案来实现的:
本发明公开了一种用于表征肺腺癌气阴两虚证的肠道菌群组合,肠道菌群组合在属水平上的分布前6位的是拟杆菌属(Bacteroides),粪杆菌属 (Faecalibacterium),双歧杆菌属(Bifidobacterium),普氏菌属(Prevotella_9),大肠志贺氏杆菌属(Escherichia-Shigella)和链球菌属(Streptococcus)。
作为进一步地改进,本发明所述的肠道菌群组合中,运用LEfSe(LDA EffectSize)分析方法在属水平上筛选得到两个特别显著的为普氏菌属(Prevotella_9)和链球菌属(Streptococcus)。
本发明还公开了一种表征肺腺癌气阴两虚证的肠道菌群组合的筛选方法,运用16s-RNA测序(16S ribosomal RNA sequencing)方法测序,并通过宏基因组学方法加以验证,包括如下步骤:
1)、获取样本的新鲜粪便样本;
2)、微生物总DNA的提取;
3)、PCR扩增、定量后在IlluminaNovaSeq平台上进行测序;
4)、生物信息分析;
5)、筛选肠道菌群:于属水平上根据表达丰度依次筛选得到前6位的是拟杆菌属(Bacteroides),粪杆菌属(Faecalibacterium),双歧杆菌属(Bifidobacterium),普氏菌属(Prevotella_9)和大肠志贺氏杆菌属(Escherichia-Shigella)和链球菌属(Streptococcus);
6)、筛选特别显著的肠道菌群组合:运用LEfSe(LDA Effect Size)分析方法在属水平上筛选得到两个特别显著的为普氏菌属(Prevotella_9)和链球菌属(Streptococcus),其AUC值分别为0.725和0.756,并建立用于表征肺腺癌气阴两虚证的逻辑斯蒂(Logistic)回归模型,其AUC值为0.801;
7)、运用宏基因组学的结果带入逻辑斯蒂(Logistic)回归模型进行验证,其 AUC值为0.842,普氏菌属(Prevotella_9)和链球菌属(Streptococcus)其AUC值分别为0.801和0.702。
作为进一步地改进,所述的步骤1)-4)具体包括如下步骤:
1)、获取样本的新鲜粪便样本:清晨收集新鲜粪便5-10g放入采样管中,盖紧,液氮速冻,置于冰箱保藏;
3)、PCR扩增、定量后在IlluminaNovaSeq平台上进行测序:PCR扩增,使用靶向区引物对DNA样品进行测序,扩增文库的大小和数量分别在Agilent 2100生物分析仪和Illumina定量试剂盒(Kapa Biosciences)进行评估,在Illumina NovaSeq平台上进行测序;
4)、生物信息分析:使用SILVA数据库和NT-16S进行序列的物种注释,使用QIIME2计算α和β多样性,使用PICRUSt(v1.1.2)进行功能分析。
作为进一步地改进,本发明所述的步骤6)中,筛选显著的肠道菌群通过:运用LEfSe(LDAEffect Size)分析方法加以筛选,设定P<0.01和LDA值>3.0。
本发明还公开了一种运用肠道菌群表征肺腺癌气阴两虚证的模型建立方法,使用普氏菌属(Prevotella_9)和链球菌属(Streptococcus)的相对丰度作为自变量,建立逻辑斯蒂(Logistic)回归模型:
其中Y为逻辑斯蒂的运算值,e为自然对数;
该模型发现组的AUC值为0.801,宏基因验证组的AUC值为0.842。
本发明的有益效果如下:
本发明通过16s RNA技术检验了肺腺癌气阴两虚证患者、非气阴两虚证患者以及健康人群的粪便,从样本中获得了6082880个原始数据,总共鉴定出9817 个特征,每个样本平均具有6973±106个特征。覆盖率估计值为99.79%,能较好地表征样本的生物学特征,论证了本方法科学性与可行性。从检验数据中,首先运用Wilcoxon秩和检验(设定P<0.01为标准)保证组间定量数据最大差异性;经应用测序深度分析(Rarefaction Curve)和多样性分析(Shannon and Simpson index)评估α多样性(菌群在组内样本中的丰富度和均匀度),应用加权的主坐标轴分析(PCoA)评估β多样性(菌群在组间样本中的差异性),保证样本的测序深度和独立性。在属水平上筛选得到拟杆菌属(Bacteroides),粪杆菌属(Faecalibacterium),双歧杆菌属(Bifidobacterium),普氏菌属(Prevotella_9)和大肠志贺氏杆菌属(Escherichia-Shigella)和链球菌属(Streptococcus),进而运用 LEfSe(LDAEffect Size)分析方法在属水平上筛选得到两个特别显著的为普氏菌属(Prevotella_9)和链球菌属(Streptococcus)并以其的相对丰度作为自变量建立了用于表征肺腺癌气阴两虚证的逻辑斯蒂(Logistic)回归模型。选取并公开了一种以属水平上的普氏菌属(Prevotella_9)和链球菌属(Strepto coccus)为组合、具有客观量化肺腺癌气阴两虚证作用的表征方法与检验技术,并为研究肺腺癌气阴两虚证的生物学基础提供更为丰富客观的研究依据。
本发明对筛选得到的肠道菌群组合进行了组外样本宏基因组学验证,该模型发现组的AUC值为0.801,宏基因验证组的AUC值为0.842,证明所发现的属水平上2个特别显著的普氏菌属(Prevotella_9)和链球菌属(Strepto coccus)以及建立的逻辑斯蒂(Logistic)回归模型的结果稳定可靠,明显优于简单罗列几个肠道菌群的形式,得到了深入研究与临床推广中医证型的核心参数,具有普适性和科学性,并可基于此设计与构建检验试剂盒运用于临床检验、实验研究及推广应用等。
本发明较现有的临床常规粪便检验水平深入一个层次,临床检验为粪便样本,检验对象为肠道微生物,其准确性更优,且客观反映了与中医气阴两虚证的关联情况,目前并没有相关临床报道。
本发明筛选得到了客观的肠道菌群,证明了中医证型及“肺与大肠相表里”理论确实存在客观生物学基础。
本发明建立了一套辅助提高医师主观判断准确性、具有高准确度、高一致性的标准化表征肺腺癌气阴两虚证的工具,为后续研发检验试剂盒等转化提供研究基础与核心操作参数,同时为肺腺癌气阴两虚证的辨证论治提供临床辅助工具,提升中医药治疗的科学内涵,促进中医、中西医结合防治肺癌水平的提升。
附图说明
图1是16s RNA技术检验肺腺癌气阴两虚证、肺腺癌非气阴两虚证和健康人群的粪便样本后经筛选得到在属水平上的肠道菌群;
图2是运用LEfSe(LDA Effect Size)分析方法筛选得到在属水平上的特别显著肠道菌群及其相应的AUC值;
图3是发现组逻辑斯蒂回归模型的AUC值;
图4是宏基因组学结果验证的特别显著肠道菌群的AUC值;
图5是宏基因组学结果验证的逻辑斯蒂回归模型的AUC值。
具体实施方法:
下面通过具体实施例,结合说明书附图对本发明的技术方案作进一步地说明:
本发明公开了一种用于表征肺腺癌气阴两虚证的肠道菌群组合,其为属水平上的拟杆菌属(Bacteroides),粪杆菌属(Faecalibacterium),双歧杆菌属(Bifidobacterium),普氏菌属(Prevotella_9)和大肠志贺氏杆菌属(Escherichia-Shigella)和链球菌属(Streptococcus);肠道菌群组合中,有2个特别显著的为普氏菌属(Prevotella_9) 和链球菌属(Streptococcus)。
本发明还公开了一种表征肺腺癌气阴两虚证的肠道菌群组合的筛选方法,包括如下步骤:
1)、获取样本的新鲜粪便样本:清晨收集新鲜粪便5-10g放入采样管中,盖紧,液氮速冻,置于-80℃冰箱保藏;
3)、PCR扩增:使用靶向16s RNAV3-V4区的引物(341F:5'-CCTACGG GNGG CWGCAG-3';805R:5'-GACTACHVGGGTATCTAATCC-3')对DNA样品进行测序,扩增文库的大小和数量分别在Agilent 2100生物分析仪和Illumina定量试剂盒(Kapa Biosciences)进行评估,在IlluminaNovaSeq平台上进行测序;
4)、生信分析:使用SILVA数据库和NT-16S进行序列的物种注释;使用 QIIME2计算α和β多样性;使用PICRUSt(v1.1.2)进行生物功能分析;
5)、筛选肠道菌群:图1是16s RNA技术检验肺腺癌气阴两虚证、肺腺癌非气阴两虚证和健康人群的粪便样本后经筛选得到在属水平上的肠道菌群;于属水平上筛选得到前6位的是拟杆菌属(Bacteroides),粪杆菌属(Faecalibacterium),双歧杆菌属(Bifidobacterium),普氏菌属(Prevotella_9)和大肠志贺氏杆菌属 (Escherichia-Shigella)和链球菌属(Streptococcus);筛选肠道菌群通过:经 Wilcoxon秩和检验(P<0.01)保证组间定量数据最大差异性;经应用测序深度分析(Rarefaction Curve)和多样性分析(Shannon and Simpson index)评估α多样性 (菌群在组内样本中的丰富度和均匀度),应用加权的主坐标轴分析(PCoA)评估β多样性(菌群在组间样本中的差异性),保证样本的测序深度和独立性;
6)、筛选特别显著的肠道菌群组合:图2是运用LEfSe(LDA Effect Size)分析方法筛选得到在属水平上的特别显著肠道菌群及其相应的AUC值;运用 LEfSe(LDA EffectSize)分析方法在属水平上筛选得到两个特别显著的为普氏菌属(Prevotella_9)和链球菌属(Streptococcus),其AUC分别为0.725和0.756,并建立用于表征肺腺癌气阴两虚证的逻辑斯蒂(Logistic)回归模型,其AUC值为0.801;筛选特别显著的肠道菌群组合依据LEfSe(LDA Effect Size)分析方法(设定P<0.01和LDA值>3.0)加以筛选。
7)、运用宏基因组学的结果带入逻辑斯蒂(Logistic)回归模型进行验证,图5 是宏基因组学结果验证的逻辑斯蒂回归模型的AUC值,为0.842;图4是宏基因组学结果验证的特别显著肠道菌群的AUC值,普氏菌属(Prevotella_9)和链球菌属(Streptococcus)的AUC值分别为0.801和0.702;经宏基因组学结果带入验证后,确定了属水平上2个特别显著的普氏菌属(Prevotella_9)和链球菌属(Strepto coccus)以及逻辑斯蒂(Logistic)回归模型的结果准确性。
本发明还公开了一种表征肺腺癌气阴两虚证的模型建立方法,使用普氏菌属(Prevotella_9)和链球菌属(Streptococcus)的相对丰度作为自变量建立逻辑斯蒂回归模型;图3是发现组逻辑斯蒂回归模型的AUC值,其AUC值为0.801;经验证后,使用普氏菌属(Prevotella_9)和链球菌属(Streptococcus)的相对丰度作为自变量建立逻辑斯蒂回归模型;
其中,Y为逻辑斯蒂的运算值,e为自然对数。
其经运算验证,发现样本组中AUC=0.801,验证样本组中AUC=0.842。 AUC值是评估标记物的一个业界标准,AUC值越接近1,说明标记物的区分力越强;根据AUC的值来确定是否选择该分子标记物;逻辑斯蒂模型的AUC值越高,表示该模型的运算结果更为准确。
以上为本发明的优选实施方式,本发明不局限于以上内容,本领域技术人员在不脱离本发明的精神和构思的额前提下直接导出的或联想到的其他改进和变化,均应认为包含在本发明的保护范围内。
Claims (6)
1.一种用于表征肺腺癌气阴两虚证的肠道菌群组合,其特征在于,所述的肠道菌群组合在属水平上的分布前6位的是拟杆菌属(Bacteroides),粪杆菌属(Faecalibacterium),双歧杆菌属(Bifidobacterium),普氏菌属(Prevotella_9),大肠志贺氏杆菌属(Escherichia-Shigella)和链球菌属(Streptococcus)。
2.根据权利要求1所述的用于表征肺腺癌气阴两虚证的肠道菌群组合,其特征在于,所述的肠道菌群组合中,运用LEfSe(LDA Effect Size)分析方法在属水平上筛选得到两个特别显著的为普氏菌属(Prevotella_9)和链球菌属(Streptococcus)。
3.一种表征肺腺癌气阴两虚证的肠道菌群组合的筛选方法,其特征在于运用16s-RNA测序(16S ribosomal RNA sequencing)方法测序,并通过宏基因组学方法加以验证,包括如下步骤:
1)、获取样本的新鲜粪便样本;
2)、微生物总DNA的提取;
3)、PCR扩增、定量后在Illumina NovaSeq平台上进行测序;
4)、生物信息分析;
5)、筛选肠道菌群:于属水平上根据表达丰度依次筛选得到前6位的是拟杆菌属(Bacteroides),粪杆菌属(Faecalibacterium),双歧杆菌属(Bifidobacterium),普氏菌属(Prevotella_9)和大肠志贺氏杆菌属(Escherichia-Shigella)和链球菌属(Streptococcus);
6)、筛选特别显著的肠道菌群组合:运用LEfSe(LDA Effect Size)分析方法在属水平上筛选得到两个特别显著的为普氏菌属(Prevotella_9)和链球菌属(Streptococcus),其AUC值分别为0.725和0.756,并建立用于表征肺腺癌气阴两虚证的逻辑斯蒂(Logistic)回归模型,其AUC值为0.801;
7)、运用宏基因组学的结果带入逻辑斯蒂(Logistic)回归模型进行验证,其AUC值为0.842,普氏菌属(Prevotella_9)和链球菌属(Streptococcus)其AUC值分别为0.801和0.702。
4.根据权利要求3所述的表征肺腺癌气阴两虚证的肠道菌群组合的筛选方法,其特征在于,其特征在于步骤1)-4)具体包括如下步骤:
1)、获取样本的新鲜粪便样本:清晨收集新鲜粪便5-10g放入采样管中,盖紧,液氮速冻,置于冰箱保藏;
3)、PCR扩增、定量后在Illumina NovaSeq平台上进行测序:PCR扩增,使用靶向区引物对DNA样品进行测序,扩增文库的大小和数量分别在Agilent 2100生物分析仪和Illumina定量试剂盒(Kapa Biosciences)进行评估,在Illumina NovaSeq平台上进行测序;
4)、生物信息分析:使用SILVA数据库和NT-16S进行序列的物种注释,使用QIIME2计算α和β多样性,使用PICRUSt(v1.1.2)进行功能分析。
5.根据权利要求3所述的表征肺腺癌气阴两虚证的肠道菌群组合的筛选方法,其特征在于:
所述的步骤6)中,筛选显著的肠道菌群通过:运用LEfSe(LDA Effect Size)分析方法加以筛选,设定P<0.01和LDA值>3.0。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011243447.3A CN112375832B (zh) | 2020-11-09 | 2020-11-09 | 一种用于表征肺腺癌气阴两虚证的肠道菌群组合及筛选及模型建立方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011243447.3A CN112375832B (zh) | 2020-11-09 | 2020-11-09 | 一种用于表征肺腺癌气阴两虚证的肠道菌群组合及筛选及模型建立方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112375832A true CN112375832A (zh) | 2021-02-19 |
CN112375832B CN112375832B (zh) | 2023-10-31 |
Family
ID=74578836
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011243447.3A Active CN112375832B (zh) | 2020-11-09 | 2020-11-09 | 一种用于表征肺腺癌气阴两虚证的肠道菌群组合及筛选及模型建立方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112375832B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113870948A (zh) * | 2021-08-20 | 2021-12-31 | 中国人民解放军海军军医大学第三附属医院 | 影响医学结局变量关键分子的筛选方法、系统、终端和存储介质 |
CN114023386A (zh) * | 2021-10-26 | 2022-02-08 | 艾德范思(北京)医学检验实验室有限公司 | 宏基因组数据分析及特征菌筛选方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110408699A (zh) * | 2019-07-11 | 2019-11-05 | 福建卫生职业技术学院 | 肠癌肠道菌群标志物及其应用 |
-
2020
- 2020-11-09 CN CN202011243447.3A patent/CN112375832B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110408699A (zh) * | 2019-07-11 | 2019-11-05 | 福建卫生职业技术学院 | 肠癌肠道菌群标志物及其应用 |
Non-Patent Citations (6)
Title |
---|
HE ZHUANG等: "《Dysbiosis of the Gut Microbiome in Lung Cancer》", 《FRONTIERS IN CELLULAR AND INFECTION MICROBIOLOGY》, vol. 9, pages 112 * |
JIABIN CHEN等: "《Analysis of Gut Microbiota Composition in Lung Adenocarcinoma Patients with TCM Qi-Yin Deficiency》", 《THE AMERICAN JOURNAL OF CHINESE MEDICINE》, vol. 49, no. 7, pages 1667 - 1682 * |
何昕晖等: "《肠道菌群与妇科恶性肿瘤关系的研究进展》", 《肿瘤综合治疗电子杂志》, vol. 6, no. 3, pages 1 - 4 * |
孟珅: "《肺癌患者及健康对照人群血液及肠道菌群比较研究》", 《中国优秀硕士学位论文全文数据库(医药卫生科技辑)》, vol. 2019, no. 12, pages 072 - 48 * |
朱佳: "《乳腺癌患者肠道微生物宏基因组学研究》", 《中国博士学位论文全文数据库(医药卫生科技辑)》, vol. 2018, no. 12, pages 072 - 320 * |
王振宇等: "《基于肺与大肠相表里理论探讨清肺合剂对于肺癌小鼠疗效及肠道菌群多样性研究》", 《浙江中医杂志》, vol. 54, no. 12, pages 878 - 880 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113870948A (zh) * | 2021-08-20 | 2021-12-31 | 中国人民解放军海军军医大学第三附属医院 | 影响医学结局变量关键分子的筛选方法、系统、终端和存储介质 |
CN114023386A (zh) * | 2021-10-26 | 2022-02-08 | 艾德范思(北京)医学检验实验室有限公司 | 宏基因组数据分析及特征菌筛选方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112375832B (zh) | 2023-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109637588B (zh) | 一种基于全转录组高通量测序构建基因调控网络的方法 | |
CN108034724B (zh) | 用于预测结直肠癌预后及死亡风险的环状rna分子标记物及其应用 | |
CN109897899B (zh) | 一种用于局部晚期食管鳞癌预后判断的标志物及其应用 | |
CN109830264B (zh) | 肿瘤患者基于甲基化位点进行分类的方法 | |
CN105473739B (zh) | 结直肠癌生物标志物 | |
CN111500705B (zh) | IgAN肠道菌群标志物、IgAN代谢物标志物及其应用 | |
CN108559777B (zh) | 一种新型分子标记及其在制备用于肾透明细胞癌诊断和预后的试剂盒中的应用 | |
CN112375832A (zh) | 一种用于表征肺腺癌气阴两虚证的肠道菌群组合及筛选及模型建立方法 | |
CN112609015A (zh) | 一种预测结直肠癌风险的微生物标志物及其应用 | |
CN114150066B (zh) | 外泌体cda、hmgn1等在肺癌诊断中的应用 | |
CN113362893A (zh) | 肿瘤筛查模型的构建方法及应用 | |
CN113444793B (zh) | 检测肺腺癌抗氧化应激通路相关基因突变的试剂盒 | |
KR20190137012A (ko) | 복합 유전 정보 네트워크 분석에 기반한 질병 위험도 진단 방법 | |
CN112037863B (zh) | 一种早期nsclc预后预测系统 | |
CN112342161A (zh) | 一种用于表征肺腺癌气虚痰湿证的肠道菌群组合的筛选方法及肠道菌群组合及模型建立方法 | |
KR101841673B1 (ko) | 유전자의 결실을 이용한 유방암 환자의 예후 예측 방법 | |
CN110408706A (zh) | 一种评估鼻咽癌复发的生物标志物及其应用 | |
CN116121383A (zh) | 一种用于血液恶性肿瘤临床诊疗中的组合物及其应用 | |
CN113186292B (zh) | 一种基于肺组织内基因甲基化的肺癌诊断试剂盒 | |
CN110780070B (zh) | 一种用于检测癌症化疗敏感性的血浆蛋白分子、应用及试剂盒 | |
CN113278697B (zh) | 一种基于外周血内基因甲基化的肺癌诊断试剂盒 | |
CN116162705B (zh) | 一种胃癌诊断产品和诊断模型 | |
CN116959554A (zh) | 一种基于CAFs相关基因的前列腺癌生化复发预测模型及其应用 | |
CN118389684A (zh) | 一种用于联合影像组学辅助诊断恶性肺结节的血浆cfDNA特征模型及其应用 | |
CN114428172A (zh) | 用于预测结直肠癌患者术后远处转移风险的标志物及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |