CN112735530A - 一种基于菌群结构进行样品溯源的方法 - Google Patents

一种基于菌群结构进行样品溯源的方法 Download PDF

Info

Publication number
CN112735530A
CN112735530A CN202110090838.4A CN202110090838A CN112735530A CN 112735530 A CN112735530 A CN 112735530A CN 202110090838 A CN202110090838 A CN 202110090838A CN 112735530 A CN112735530 A CN 112735530A
Authority
CN
China
Prior art keywords
sample
flora
tracing
source
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110090838.4A
Other languages
English (en)
Inventor
吴森
王绪敏
方向东
单广乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Genomics of CAS
Original Assignee
Beijing Institute of Genomics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Genomics of CAS filed Critical Beijing Institute of Genomics of CAS
Priority to CN202110090838.4A priority Critical patent/CN112735530A/zh
Publication of CN112735530A publication Critical patent/CN112735530A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种基于菌群结构进行样品溯源的方法,属于微生物分析技术领域。本发明通过16S序列扩增、宏基因组以及大数据获取大量样本的菌群结构,通过判断待测样品的香农指数以及菌群结构的相似性,从而确定某一确定来源的菌群图谱,并依据菌群图谱进行样品来源的溯源。本发明所述的样品溯源的方法高效、准确、快速,且操作简便。

Description

一种基于菌群结构进行样品溯源的方法
技术领域
本发明涉及微生物分析技术领域,具体涉及一种基于菌群结构进行样品溯源的方法。
背景技术
微生物溯源(microbial source tracking,MST)是一种利用单个或群体微生物的指标,建立区别、鉴定微生物源头的流程。近年来,MST技术在水体病原微生物检测及鉴定中的应用越来越广泛。微生物溯源研究有助于人们更深入地了解病原菌种群结构及其多样性的起源和进化,为病原菌的检疫、流行监测、综合防治等研究提供重要的信息资料和科学依据。在病原微生物溯源技术研究中,生物学方法、噬菌体敏感性、多位点酶电泳、等表型分析方法和扩增片段长度多态性、核糖体分型、重复序列PCR、简单重复序列、单核苷酸多态性、多位点可变串联重复序列、多位点序列分析等分子方法均发挥了重要作用。
微生物溯源分析具备较高的难度,微生物的系统发育关系较为复杂,而通过构建进化树(phylogenetic tree)来描述物种或分子间的进化关系,是生物信息学方法在微生物领域溯源分析中的重要应用。例如,科研人员在对微生物进行研究的过程中,如果发现一种新型病毒,就需要对该病毒进行全基因测序,进而通过基因对比,找到相类似的病毒对其进行系统发育分析,建立系统发育树。通过系统发育树可以找到与该病毒具备同源关系的病毒,将其进行分析对比,进而快速找到微生物进化的根源及应用方式。
专利CN108841942A公开了一种PM2.5细菌群落组成来源快速分析及风险评估方法,该方法包括PM2.5取样,微生物基因组提取,PCR扩增,产物纯化,荧光定量,高通量测序并进行细菌多样性及丰度分析,从而准确判断PM2.5的细菌来源。专利CN111122689A公开了一种微生物污染源溯源的方法,通过样品微生物培养得到单菌落,使用基质辅助激光解析电离-飞行时间质谱仪对单菌落进行质谱分析,得到微生物单菌落的谱图数据及种属信息,从而判断被污染产品中微生物的来源。现有技术中微生物样品溯源的专业性较强,需要使用专业设备进行分析,对技术人员的要求高。
因此,亟需开发一种准确、快速、高效、操作简便的样品溯源的方法。
发明内容
针对上述不足,本发明提供了一种基于菌群结构进行样品溯源的方法。本发明通过16S序列、宏基因组以及大数据获取大量样本的菌群结构,通过判断待测样品的香农指数以及菌群结构的相似性,从而确定某一确定来源的菌群图谱,并依据菌群图谱进行样品来源的溯源。本发明所述的方法可高效、准确、快速地实现待测样品溯源。
为了实现上述发明目的,本发明的技术方案如下:
一方面,本发明提供了一种基于菌群结构进行样品溯源的方法,所述的方法包括以下步骤:
(1)确定菌种聚类阈值,通过16S序列扩增、宏基因组以及大数据分析获取已知样本的菌群结构;
(2)分析待测样品的菌群结构;
(3)对比步骤(1)已知样本和步骤(2)待测样品的菌群结构,确定待测样品的菌群图谱进行样品的溯源。
具体地,步骤(1)中所述的菌种聚类阈值为97-100%,优选为99%。
具体地,步骤(1)中所述的16S序列为V3-V4区,16S序列扩增引物为SEQ ID NO:1:F:5′-AATGATACGGCGACCACC-3′;SEQ ID NO:2:R:5′-CAAGCAGAAGACGGCATA-3′。
具体地,步骤(1)中所述的大数据分析包括以下步骤:去除引物接头,获取样品真实序列;去除冗余序列,加快分析进度并降低对分析设备硬件的要求;根据相似性聚类,并与数据库进行比对,获取各序列的注释信息;将去除引物接头的序列与聚类结果进行比较,获取每个样品每种菌群的具体序列数、相对丰度以及香农指数。
具体地,步骤(1)中所述的菌群结构包括菌种类型,菌种比例和香农指数参数。
进一步具体地,所述的菌种包括优势菌群和劣势菌群。
进一步具体地,步骤(3)中所述的对比步骤(1)已知样本和步骤(2)待测样品的菌群结构包括以下步骤:判断待测样品香农指数参数是否在已知样本香农指数参数范围内;判断待测样品优势菌群和劣势菌群的种类及其比例与已知样本相似度是否为75-100%。
另一方面,本发明提供了一种菌群结构在样品溯源中的应用,所述的菌群结构包括菌种类型,菌种比例和香农指数参数。
具体地,所述的菌种包括优势菌群和劣势菌群。
与现有技术相比,本发明的积极和有益效果在于:
本发明提供了一种基于菌群结构进行样品溯源的方法,通过对比待检测样品和已知样本的菌群结构,包括菌种类型、每种菌的比例(优势菌群以及劣势菌群)以及香农指数参数,可高效、准确、快速地实现待测样品溯源,操作简便。
附图说明
图1为香农指数参数结果图。
图2为样品溯源检测结果图。
具体实施方式
下面结合具体实施例,对本发明作进一步详细的阐述,下述实施例不用于限制本发明,仅用于说明本发明。以下实施例中所使用的实验方法如无特殊说明,实施例中未注明具体条件的实验方法,通常按照常规条件,下述实施例中所使用的材料、试剂等,如无特殊说明,均可从商业途径得到。
除非另外定义,否则本文中所用的全部技术与科学用语均具有本领域技术人员通常理解的含义。
实施例1样品追溯
(1)以97-100%作为菌种聚类阈值,通过16S序列测序、宏基因组以及大数据分析(去除引物接头,获取样品真实序列;去除冗余序列,加快分析进度并降低对分析设备硬件的要求;根据相似性聚类,并与数据库进行比对,获取各序列的注释信息;将去除引物接头的序列与聚类结果进行比较,获取每个样品每种菌群的具体序列数、相对丰度以及香农指数)获取已知样本的菌群结构,包括优势菌群和劣势菌群类型、比例和香农指数参数。
16S序列扩增引物为:
SEQ ID NO:1:F:5′-AATGATACGGCGACCACC-3′;
SEQ ID NO:2:R:5′-CAAGCAGAAGACGGCATA-3′。
(2)分析待测样品的菌群结构,包括优势菌群和劣势菌群类型、比例和香农指数参数。
(3)对比已知样本和待测样品的菌群结构,通过判断样品的香农指数以及菌群结构的相似性,从而确定某一来源的菌群图谱,并依据菌群图谱进行样品的溯源。
实验例1准确性检测
以土壤样品为例,检测本发明所述方法的准确性。
根据北京110个土壤样品代表,统计其属水平以及种水平菌种图谱,截取含量较高的前50种样品、含量较低的后50种菌群为菌群图谱以及相应的香农指数参数。统计结果如下表1所示。
表1北京土壤样品代表统计结果
Figure BDA0002912604600000041
Figure BDA0002912604600000051
Figure BDA0002912604600000061
Figure BDA0002912604600000071
Figure BDA0002912604600000081
o__、f__、g__表示菌种荚膜抗原为o、f、g抗原的任意菌。
当所追溯样品的香农指数参数位于表1所示范围,且优势菌群以及劣势菌群的种类以及相对含量与表1中所示相似度达到85%,则可认为待追溯样品为北京土壤样品。
采用本申请实施例1及实验例1的方法对440个样品进行溯源,其中包括40个北京土壤样品和400个东北土壤样品,其香农指数参数如图1所示,检测结果如图2所示,结果表明,通过本申请所述的基于菌群结构的样品追溯方法,对440个土壤样品进行溯源,可准确鉴定出其中40个北京土壤样品和400个东北土壤样品,操作简单,准确性高。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
序列表
<110> 中国科学院北京基因组研究所(国家生物信息中心)
<120> 一种基于菌群结构进行样品溯源的方法
<130> 20210114
<160> 2
<170> SIPOSequenceListing 1.0
<210> 1
<211> 18
<212> DNA
<213> 人工序列(artificial sequence)
<400> 1
aatgatacgg cgaccacc 18
<210> 2
<211> 18
<212> DNA
<213> 人工序列(artificial sequence)
<400> 2
caagcagaag acggcata 18

Claims (10)

1.一种基于菌群结构进行样品溯源的方法,其特征在于,所述的方法包括以下步骤:
(1)确定菌种聚类阈值,通过16S序列扩增、宏基因组以及大数据分析获取已知样本的菌群结构;
(2)分析待测样品的菌群结构;
(3)对比步骤(1)已知样本和步骤(2)待测样品的菌群结构,确定待测样品的菌群图谱进行样品的溯源。
2.根据权利要求1所述的样品溯源的方法,其特征在于,步骤(1)中所述的菌种聚类阈值为97-100%。
3.根据权利要求2所述的样品溯源的方法,其特征在于,步骤(1)中所述的菌种聚类阈值为99%。
4.根据权利要求3所述的样品溯源的方法,其特征在于,步骤(1)中所述的16S序列为V3-V4区,16S序列扩增引物为SEQ ID NO:1:F:5′-AATGATACGGCGACCACC-3′;SEQ ID NO:2:R:5′-CAAGCAGAAGACGGCATA-3′。
5.根据权利要求4所述的样品溯源的方法,其特征在于,步骤(1)中所述的大数据分析包括以下步骤:去除引物接头,获取样品真实序列;去除冗余序列,加快分析进度并降低对分析设备硬件的要求;根据相似性聚类,并与数据库进行比对,获取各序列的注释信息;将去除引物接头的序列与聚类结果进行比较,获取每个样品每种菌群的具体序列数、相对丰度以及香农指数。
6.根据权利要求5所述的样品溯源的方法,其特征在于,步骤(1)中所述的菌群结构包括菌种类型,菌种比例和香农指数参数。
7.根据权利要求6所述的样品溯源的方法,其特征在于,所述的菌种包括优势菌群和劣势菌群。
8.根据权利要求7所述的样品溯源的方法,其特征在于,步骤(3)中所述的对比步骤(1)已知样本和步骤(2)待测样品的菌群结构包括以下步骤:判断待测样品香农指数参数是否在已知样本香农指数参数范围内;判断待测样品优势菌群和劣势菌群的种类及其比例与已知样本相似度是否为75-100%。
9.一种菌群结构在样品溯源中的应用,其特征在于,所述的菌群结构包括菌种类型,菌种比例和香农指数参数。
10.根据权利要求9所述的应用,其特征在于,所述的菌种包括优势菌群和劣势菌群。
CN202110090838.4A 2021-01-22 2021-01-22 一种基于菌群结构进行样品溯源的方法 Pending CN112735530A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110090838.4A CN112735530A (zh) 2021-01-22 2021-01-22 一种基于菌群结构进行样品溯源的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110090838.4A CN112735530A (zh) 2021-01-22 2021-01-22 一种基于菌群结构进行样品溯源的方法

Publications (1)

Publication Number Publication Date
CN112735530A true CN112735530A (zh) 2021-04-30

Family

ID=75593745

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110090838.4A Pending CN112735530A (zh) 2021-01-22 2021-01-22 一种基于菌群结构进行样品溯源的方法

Country Status (1)

Country Link
CN (1) CN112735530A (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040053395A1 (en) * 2000-11-17 2004-03-18 Jagueline Horswell Determination of sample origin by a micro flora dna profiling method
CN102517392A (zh) * 2011-12-26 2012-06-27 深圳华大基因研究院 基于宏基因组16s高可变区v3的分类方法和装置
CN104715165A (zh) * 2014-12-19 2015-06-17 中国石油天然气集团公司 一种基于宏基因技术的石油污染海洋生态环境评价方法
WO2015097006A1 (en) * 2013-12-24 2015-07-02 Universite De Liege Metagenomic analysis of samples
CN106192022A (zh) * 2016-08-08 2016-12-07 中国科学院北京基因组研究所 16SrRNA多重测序文库的构建方法
CN106191045A (zh) * 2016-08-08 2016-12-07 中国科学院北京基因组研究所 用于多重核酸测序的Index和引物
WO2017096385A1 (en) * 2015-12-04 2017-06-08 Biome Makers Inc. Microbiome based identification, monitoring and enhancement of fermentation processes and products
JP2017189166A (ja) * 2016-04-12 2017-10-19 学校法人慶應義塾 慢性膿皮症の診断方法及び慢性膿皮症の診断用キット
CN107338296A (zh) * 2017-07-20 2017-11-10 中国水产科学研究院黄海水产研究所 南极磷虾贮藏过程中导致其品质劣化的优势菌群确定方法
CN108841942A (zh) * 2018-06-04 2018-11-20 常州市环境监测中心 一种pm2.5细菌群落组成来源快速分析及风险评估方法
CN109402237A (zh) * 2018-11-20 2019-03-01 上海海洋大学 一种鲜切叶菜的菌群测定方法
CN109706235A (zh) * 2019-01-29 2019-05-03 广州康昕瑞基因健康科技有限公司 一种肠道微生物菌群的检测和分析方法及其系统
CN110097928A (zh) * 2019-04-17 2019-08-06 广东省微生物研究所(广东省微生物分析检测中心) 一种基于肠道菌群预测组织微量元素含量的预测方法和预测模型
CN110846424A (zh) * 2019-11-05 2020-02-28 烟台大学 出入境口岸微生物的快速检验检疫方法
CN111816258A (zh) * 2020-07-20 2020-10-23 杭州谷禾信息技术有限公司 人体菌群16S rDNA高通量测序物种精确鉴定的优化方法

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040053395A1 (en) * 2000-11-17 2004-03-18 Jagueline Horswell Determination of sample origin by a micro flora dna profiling method
CN102517392A (zh) * 2011-12-26 2012-06-27 深圳华大基因研究院 基于宏基因组16s高可变区v3的分类方法和装置
WO2015097006A1 (en) * 2013-12-24 2015-07-02 Universite De Liege Metagenomic analysis of samples
CN104715165A (zh) * 2014-12-19 2015-06-17 中国石油天然气集团公司 一种基于宏基因技术的石油污染海洋生态环境评价方法
WO2017096385A1 (en) * 2015-12-04 2017-06-08 Biome Makers Inc. Microbiome based identification, monitoring and enhancement of fermentation processes and products
JP2017189166A (ja) * 2016-04-12 2017-10-19 学校法人慶應義塾 慢性膿皮症の診断方法及び慢性膿皮症の診断用キット
CN106191045A (zh) * 2016-08-08 2016-12-07 中国科学院北京基因组研究所 用于多重核酸测序的Index和引物
CN106192022A (zh) * 2016-08-08 2016-12-07 中国科学院北京基因组研究所 16SrRNA多重测序文库的构建方法
CN107338296A (zh) * 2017-07-20 2017-11-10 中国水产科学研究院黄海水产研究所 南极磷虾贮藏过程中导致其品质劣化的优势菌群确定方法
CN108841942A (zh) * 2018-06-04 2018-11-20 常州市环境监测中心 一种pm2.5细菌群落组成来源快速分析及风险评估方法
CN109402237A (zh) * 2018-11-20 2019-03-01 上海海洋大学 一种鲜切叶菜的菌群测定方法
CN109706235A (zh) * 2019-01-29 2019-05-03 广州康昕瑞基因健康科技有限公司 一种肠道微生物菌群的检测和分析方法及其系统
CN110097928A (zh) * 2019-04-17 2019-08-06 广东省微生物研究所(广东省微生物分析检测中心) 一种基于肠道菌群预测组织微量元素含量的预测方法和预测模型
CN110846424A (zh) * 2019-11-05 2020-02-28 烟台大学 出入境口岸微生物的快速检验检疫方法
CN111816258A (zh) * 2020-07-20 2020-10-23 杭州谷禾信息技术有限公司 人体菌群16S rDNA高通量测序物种精确鉴定的优化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
THE SEASONAL VARIATION OF MICROBIAL COMMUNITIES IN DRINKING WATER SOURCES IN SHANGHAI: "The seasonal variation of microbial communities in drinking water sources in Shanghai", 《JOURNAL OF CLEANER PRODUCTION》, 15 April 2020 (2020-04-15), pages 2 - 3 *

Similar Documents

Publication Publication Date Title
Tshikhudo et al. Bacterial species identification getting easier
Moussaoui et al. Matrix-assisted laser desorption ionization time-of-flight mass spectrometry identifies 90% of bacteria directly from blood culture vials
US20210403991A1 (en) Sequencing Process
Kang et al. The effect of sample size in studies of soil microbial community structure
CN111052249B (zh) 确定预定染色体保守区域的方法、确定样本基因组中是否存在拷贝数变异的方法、系统和计算机可读介质
CN113066533B (zh) 一种mNGS病原体数据分析方法
CN113481311B (zh) 用于鉴定布鲁氏菌疫苗株m5的snp分子标记及其应用
CN116179664A (zh) 基于内参确定微生物的高通量检测方法和系统及试剂盒
François et al. Increase in taxonomic assignment efficiency of viral reads in metagenomic studies
CN115786541B (zh) 鉴别布鲁氏菌疫苗株a19的snp分子标记、引物探针、试剂盒、方法和应用
Kshikhundo et al. Bacterial species identification
CN107937567B (zh) 一组鉴定僵蚕的特异性引物及其鉴定方法
CN113528614B (zh) 一种植物叶际表面微生物宏基因组检测方法
CN114540519B (zh) 用于鉴别大曲中解淀粉芽孢杆菌的引物、试剂盒及鉴别方法
CN112735530A (zh) 一种基于菌群结构进行样品溯源的方法
CN114974427A (zh) 一种多靶标检测引物组及其设计方法
CN113957164A (zh) 一种婴儿配方乳粉中克罗诺杆菌属的CRISPR One Pot检测方法及其试剂盒
CN109652573B (zh) 用于鼠伤寒沙门菌或其单相菌变种分型检测的vntr位点、检测引物组及检测分析方法
CN112680534B (zh) 一种用于识别假阳性反应的结核分枝杆菌sRNA荧光定量PCR标准品及其应用
CN112522417A (zh) 一种用于检测男性人类基因组dna的dna片段和引物对
CN113403367B (zh) 一种宏基因组绝对定量的检测方法及其应用
CN110501414B (zh) 一种vim型和spm型金属酶铜绿假单胞菌的识别模型、构建方法及应用
CN108642190A (zh) 基于14个常染色体snp遗传标记的法医学复合检测试剂盒
CN110331210B (zh) 一套用于获取馆藏甲虫标本DNA条形码的Mini-Barcoding引物及其应用
WO2023077482A1 (zh) 一种结核分枝杆菌的mnp标记组合、引物对组合、试剂盒及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination