CN111944914A - 一种基于抗性基因及毒力因子基因评价水体健康风险的方法 - Google Patents
一种基于抗性基因及毒力因子基因评价水体健康风险的方法 Download PDFInfo
- Publication number
- CN111944914A CN111944914A CN202010684761.9A CN202010684761A CN111944914A CN 111944914 A CN111944914 A CN 111944914A CN 202010684761 A CN202010684761 A CN 202010684761A CN 111944914 A CN111944914 A CN 111944914A
- Authority
- CN
- China
- Prior art keywords
- parb
- mags
- health risk
- sample
- virulence factor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000036541 health Effects 0.000 title claims abstract description 67
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 46
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000007923 virulence factor Effects 0.000 title claims abstract description 23
- 239000000304 virulence factor Substances 0.000 title claims abstract description 23
- 238000012163 sequencing technique Methods 0.000 claims abstract description 14
- 230000000813 microbial effect Effects 0.000 claims abstract description 6
- 108700026244 Open Reading Frames Proteins 0.000 claims description 13
- 230000003115 biocidal effect Effects 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 7
- 239000003242 anti bacterial agent Substances 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000000513 principal component analysis Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 2
- 108020004707 nucleic acids Proteins 0.000 claims description 2
- 102000039446 nucleic acids Human genes 0.000 claims description 2
- 150000007523 nucleic acids Chemical class 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims 1
- 238000012847 principal component analysis method Methods 0.000 claims 1
- 244000052616 bacterial pathogen Species 0.000 abstract description 18
- 239000003814 drug Substances 0.000 abstract description 8
- 229940079593 drug Drugs 0.000 abstract description 8
- 238000004458 analytical method Methods 0.000 abstract description 6
- 238000011156 evaluation Methods 0.000 abstract description 6
- 238000012136 culture method Methods 0.000 abstract description 4
- 239000010865 sewage Substances 0.000 description 14
- 244000005700 microbiome Species 0.000 description 10
- 241000282414 Homo sapiens Species 0.000 description 6
- 244000039328 opportunistic pathogen Species 0.000 description 6
- 241000607534 Aeromonas Species 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 238000007400 DNA extraction Methods 0.000 description 4
- 241000589516 Pseudomonas Species 0.000 description 4
- 241000589291 Acinetobacter Species 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 108020004414 DNA Proteins 0.000 description 3
- 229940088710 antibiotic agent Drugs 0.000 description 3
- 238000011109 contamination Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 241001245615 Dechloromonas Species 0.000 description 2
- 206010059866 Drug resistance Diseases 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 244000000010 microbial pathogen Species 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012502 risk assessment Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000000528 statistical test Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 1
- 101000694320 Drosophila melanogaster RuvB-like helicase 2 Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000685990 Homo sapiens Specifically androgen-regulated gene protein Proteins 0.000 description 1
- 241000589248 Legionella Species 0.000 description 1
- 208000007764 Legionnaires' Disease Diseases 0.000 description 1
- 108700041567 MDR Genes Proteins 0.000 description 1
- 241000068036 Malikia Species 0.000 description 1
- 102100023355 Specifically androgen-regulated gene protein Human genes 0.000 description 1
- 241000589651 Zoogloea Species 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000003950 pathogenic mechanism Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/689—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Immunology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种基于抗性基因及毒力因子基因评价水体健康风险的方法,该方法基于宏基因组测序分析,通过对测序数据的组装和分箱,得到微生物基因组草图,从中识别出潜在的耐药性致病菌(PARB),并评价样品中潜在PARB的丰度、多样性和风险等级,对PARB含有ARGs和VFGs的数量及类型进行评估,从而确定环境中潜在的PARB的量及健康风险水平。本发明方法基于宏基因组测序,能够在基因组层面上识别出潜在的PARB,且呈现出较高的可信度,避免了传统纯培养法耗时且易受培养条件影响的限制,能够广泛应用于水体健康风险评价。
Description
技术领域
本发明属于污水处理技术领域,具体涉及一种基于抗性基因及毒力因子基因评价水体健康风险的方法。
背景技术
受人类活动的影响,河湖水质逐渐恶化,污染水体对人类带来的健康风险已经引起了越来越多的关注。目前水环境中健康风险评价的一个重要内容是对微生物中病原菌分布的评估。通常用于检测病原菌的方法有纯培养法和基于PCR的分子检测。传统纯培养法耗费时间且易受培养条件的影响,难以应用于大规模生态调查;基于PCR的检测方法则严重受限于扩增目的基因引物的特异性,而很难准确获得病原菌的种类分布。因此,现阶段需要一种新的检测方法用于快速、准确检测环境病原菌的种类及数量。
携带毒力因子基因(VFGs)的细菌作为潜在的病原菌能入侵人或动物而使之患病,而随着抗生素的大量使用,抗生素抗性基因(ARGs)通过基因水平转移等方式转移到病原菌中,由这些含有ARGs的病原菌引起的疾病更难以治疗,因此ARGs及VFGs对于评价环境微生物风险是至关重要的。现阶段已有大量研究旨在通过量化环境中的ARG基因评价水环境中病原微生物的健康风险,然而健康风险水平不仅仅依赖于ARG的数量,更与其遗传背景相关。当ARGs与VFGs共存于生物染色体、质粒等遗传因子中时,其对人类及动物的潜在风险将会上升。基因组中同时携带了ARGs和VFGs的潜在的耐药性致病菌(PARB),既存在潜在的致病风险,且能在一定程度上降低抗生素的治疗效果。因此,相比于抗生素耐药菌,PARB更合适作为一项评价水环境中微生物健康风险的指标。
发明内容
针对现有技术的不足,本发明将提供一种基于抗性基因(ARGs)及毒力因子基因(VFGs)评价水体健康风险的方法,通过对水体样品的宏基因组测序,识别出样品中潜在的PARB,并对PARB含有的ARGs和VFGs的数量及类型进行分析,从而评价水体健康风险水平。
为了实现上述目的,本发明的技术方案概述如下:该方法基于宏基因组测序分析,通过对测序数据的组装和分箱,得到微生物基因组草图,从中识别出潜在的耐药性致病菌(PARB),并评价样品中潜在PARB的丰度、多样性和风险等级,对PARB含有的ARGs和VFGs的数量及类型进行评估,从而确定环境中潜在的PARB的量及健康风险水平。
本发明技术方案进一步详述,所述方法包括如下步骤:
(1)采集水体样品,提取获得样品的宏基因组测序数据,并对原始测序数据(rawreads)进行质量过滤,得到高质量读段(clean reads);
(2)对每个样品获得的clean reads进行组装,获得重叠群(contigs);
(3)根据contigs的核酸组成和丰度变化模式,对序列进行聚类、分箱,得到微生物基因组草图(metagenomic assembled genomes,MAGs),对所有的MAGs根据完整度和污染率进行评估,选择出符合要求的高质量代表性MAGs,对高质量代表性MAGs进行去冗余,获得非冗余MAGs集;
(4)对所述非冗余MAGs集的所有contigs预测开放阅读框(ORF),对所有ORF依次与抗生素抗性基因数据库和毒力因子数据库比对,识别出同时含有ARG序列和VFG序列的MAGs即定义为潜在的PARB,并统计这些潜在的PARB携带ARG和VFG的种类及数量;
(5)样品中属于潜在的PARB的MAGs丰度的计算:使用基于映射(mapping)的方法获得每个样品中能与非冗余MAGs集中所有MAGs成功比对上的reads的数目占该样品reads总数的百分比,以及非冗余基因集中每个MAG在各个样品中的覆盖度,每个样品中每个PARB的丰度根据公式(1)计算:
其中,样品中reads映射的百分比代表一个样品中能与非冗余MAGs集成功比对上的reads的数目占该样品reads总数的百分比,单个PARB覆盖度即一个属于潜在的PARB的MAG在一个样品中的覆盖度,所有MAG覆盖度之和代表所有MAGs在一个样品中的覆盖度之和。
(6)单个PARB健康风险率的计算:将由步骤(4)得到的每个PARB携带的ARGs的数量、ARGs的类型、VFGs的数量和VFGs的类型数据,利用主成分分析(PCA)方法,获得一个主成分,并对该主成分的值进行归一化,归一化后的各个PARB主成分的值即为各个PARB的健康风险率;
(7)水体健康风险的计算:PARB的健康风险率与各个采样点PARB丰度乘积之和即可代表水体健康风险水平。
本发明产生的有益效果如下:
(1)本发明方法基于宏基因组测序,能够在基因组层面上识别出潜在的耐药性致病菌(PARB),且呈现出较高的可信度;避免了传统纯培养法耗时且易受培养条件影响的限制,能够广泛应用于水体健康风险评价。
(2)本发明方法不仅能鉴定环境中与人体健康相关的致病菌,同时还可以准确获得这些致病菌的种类及数量分布。
(3)本发明方法可以明确水体中潜在的耐药性致病菌携带的抗性基因和毒力因子基因类型及数量,有助于了解其致病机理及抗性类型,进一步准确评价水体健康风险情况。
(4)本发明方法可以针对大量样品进行快速、准确地检测环境病原菌的种类及数量,同时考虑了具有耐药性的病原菌在健康风险上的影响。
附图说明
图1:具体实施方式中本发明方法的流程示意图。
图2:具体实施方式中通惠河和清河水体健康风险分布。
图3:具体实施方式中通惠河和清河水体中总氮(TN)浓度分布。
具体实施方式
下面参照具体的实施例进一步描述本发明,但是本领域技术人员应该理解,本发明并不限于这些具体的实施例。
下述实施例中的方法,如无特别说明,均为常规方法,其中所用的试剂,如无特别说明,均为常规市售试剂。
1样品采集及数据分析方法
1.1样品采集
选取北京市高碑店污水处理厂的受纳河流通惠河作为研究对象,高碑店污水处理厂于2017年4月升级改造结束,在升级前(2015年12月、2016年3月、2016年9月)和升级后(2018年9月、2018年12月、2019年3月)对通惠河进行了采样。同时选取了清河污水处理厂(2013年12月升级改造结束)的受纳河流清河作为对照在同样时间段内进行了采样。每条河每次采集5个样品(清河在2015年12月只采集了4个样品),两条河共采集了59个样品。
1.2 DNA提取及宏基因组测序
使用水样DNA提取试剂盒(DNeasy PowerWater Kit,QIAGEN,Hilden,NorthRhine-Westphalia,Germany),按照试剂盒说明书对样品进行总DNA的提取。提取后的DNA采用浓度为1%的琼脂糖进行琼脂糖凝胶电泳,以此鉴定样品中DNA片段的长度和浓度,出现明亮而清晰的条带说明该样品DNA提取成功。
将所有DNA样品送至华大基因公司,使用Illumina Hiseq X-Ten平台进行宏基因组测序(150个配对末端读数)。
1.3宏基因组数据分析
对得到的原始的测序数据(raw reads)进行如下处理:去除质量值连续≤20的碱基数达到40%的reads;去除含N的碱基数目总和达到10%的reads;去除adapter污染;去除duplication污染,最终获得高质量读段(clean reads)。
使用软件MEGAHIT(v1.1.3)将每个样品进行单独组装以及分组混合组装获得重叠群(contigs),而后根据contigs的丰度变化模式,利用软件MetaWRAP(v1.2)进行分箱,其内置MetaBAT 2、MaxBin 2和CONCOCT三种方法计算contigs之间的相关性,进行聚类、分箱,得到微生物基因组草图(metagenomic assembled genomes,MAGs)。通过这三种软件得到的MAGs利用MetaWRAP中的bin_refinement模块根据完整度和污染率进行评估,选出高质量代表性的MAGs(完整度>60%、污染率<10%)。最后,利用dRep工具基于默认参数识别高度相似的MAGs组,并为每个MAGs组选择最具代表性的MAG,对MAGs进行去冗余,获得非冗余MAGs集。
对每个MAG所包含的所有contigs用软件Prodigal(v2.6.3)预测开放阅读框(openreading frame,ORF),并利用BLASTP工具将所有的ORFs与ARG-OAP v2中的抗生素抗性基因数据库(http://smile.hku.hk/SARGs)比对,根据相似度>80%,长度>top hit的70%的筛选条件,提取出所有被认为是潜在的ARG序列的ORFs。使用相同的方法,利用BLASTP工具将所有的ORFs与毒力因子数据库(VFDB)中的蛋白序列VFDB_setA_pro.fas(http://www.mgc.ac.cn/VFs/download.htm)比对,根据相似度>80%,长度>top hit的70%的筛选条件,识别出所有被认为是潜在的VFG序列的ORFs。既含有ARG序列,又含有VFG序列的MAGs即被认为是潜在的PARB。同时根据比对结果,获得每个PARB携带的ARGs和VFGs的种类和数量。
样品中属于潜在的PARB的MAGs丰度的计算:利用软件BBMap(v38.43)使用基于映射(mapping)的方法获得每个样品中能与非冗余MAGs集成功比对上的reads的数目占该样品reads总数的百分,以及非冗余基因集中每个MAG在各个样品中的覆盖度。每个样品中每个PARB的丰度根据公式(1)计算:
其中,样品中reads映射的百分比代表一个样品中能与非冗余MAGs集成功比对上的reads的数目占该样品reads总数的百分比,单个PARB覆盖度即一个属于潜在的PARB的MAG在一个样品的覆盖度,所有MAG覆盖度之和代表所有MAGs在一个样品中的覆盖度之和。
1.4健康风险评估
首先计算单个PARB的健康风险率。当PARB携带的ARGs和VFGs的数量及类型越多时,健康风险越高。将由1.3得到的每个PARB携带的ARGs的数量、ARGs的类型数、VFGs的数量和VFGs的类型数,在R语言(v3.6.3)中利用主成分分析(PCA)方法,将ARGs的数量、ARGs的类型数、VFGs的数量和VFGs的类型数这四个属性降维,获得一个能代表该四个属性的主成分特征,并对该主成分的值进行归一化,归一化后的各个PARB主成分的值即为各个PARB的健康风险率。水体健康风险水平根据公式(2)计算,即为PARB的健康风险率与各个采样点PARB丰度乘积之和。
1.5统计检验
采用非参数检验的统计方法检验不同区域水体健康风险是否有限制差异,数据的统计分析通过R进行。对于显著性差异结果,*代表差异显著度p<0.05,**代表p<0.01,***代表p<0.001。
2试验结果及水体健康风险评价
如1中所述,对通惠河和清河进行了采样,将基于抗性基因及毒力因子基因的方法应用到实际水体的健康风险评价中去。
2.1污水处理厂升级前后河流健康风险情况
通过1.3,获得了每个PARB携带的ARGs的数量、ARGs的类型数、VFGs的数量和VFGs的类型数,以及样品中PARB的丰度。基于1.4所述方法,获得了各个PARB的健康风险率。每个样品中所有PARB的健康风险率与其对应的丰度数据乘积之和即为该样品的水体健康风险水平(见表1)。
表1
注:采样点的名称,前四个数字代表采样时间,第一个字母G代表通惠河,Q代表清河。
根据样品采集时的设计,将通惠河在2015年12月、2016年3月、2016年9月采集的共15个样品作为升级前的样品,在2018年9月、2018年12月、2019年3月采集的共15个样品作为升级后的样品,对污水处理厂升级前和升级后通惠河的水体健康风险水平进行比较,并进行统计检验。同样的,将清河在2015年12月、2016年3月、2016年9月采集的共14个样品作为升级后短时间的样品,在2018年9月、2018年12月、2019年3月采集的共15个样品作为升级后长时间的样品,对污水处理厂升级短时间和升级长时间后受纳河流清河的水体健康风险水平进行比较,并进行统计检验(见图2)。
测定结果分析:从图2可以看出,高碑店污水处理厂升级前后,通惠河的健康风险并没有明显下降,而同样时间段清河的健康风险显著下降,这说明污水处理厂的升级在短时间内不会明显降低受纳河流的健康风险,但升级长时间后受纳河流的健康风险会有明显降低。
2.2污水处理厂升级前后受纳河流主要的健康风险PARB
根据单个PARB的健康风险及其在河流中的丰度,分别挑选了两条河流中健康风险前10的PARB来代表河流中的高健康风险PARB,如表2所示。发现两条河流中健康风险前10的PARB中有7个是一致的,这7个PARB分别属于气单胞菌属Aeromonas、假单胞菌属Pseudomonas和动胶菌属Zoogloea。此外,通惠河中的高健康风险PARB还有3个分别属于气单胞菌属Aeromonas、不动杆菌属Acinetobacter和Malikia属,而清河中的其他3个高风险PARB仍是属于假单胞菌属Pseudomonas。两条河流的高风险PARB中假单胞菌属Pseudomonas、气单胞菌属Aeromonas和不动杆菌属Acinetobacter都是已知的机会致病菌。
两条河流的高风险PARB均大量携带多药耐药抗性基因和进攻型毒力因子基因及运动型毒力因子基因,表明这些PARB对人体具有较强的侵袭力,同时还对多种抗生素具有耐药性,对人类健康有很大的威胁。
表2
2.3对本发明评价方法有效性的验证
将本方法分析鉴定出的PARB与VFDB数据库(http://www.mgc.ac.cn/VFs/main.htm)中的机会致病菌比较来验证本方法的准确性。本方法鉴定出了123个PARB,其中有60个(48.8%)是VFDB数据库中已知的机会致病菌,分别是病原假单胞菌属Pseudomonas31个、不动杆菌属Acinetobacter 20个、气单胞菌属Aeromonas 8个以及军团菌属Legionella 1个,这些PARB基因组内同时含有多个ARGs和VFGs。这说明本方法能较好识别水环境样品中的机会致病菌。
此外,本方法鉴定出的123个PARB中,还有63个并不是已知的机会致病菌,如有15个属于Methyloversatilis属,该属的微生物一般认为是反硝化功能菌,5个属于对污染物有降解能力的功能菌Dechloromonas属,通过本方法鉴定出河流中的Methyloversatilis属和Dechloromonas属等不是机会致病菌的微生物也携带了抗性基因和毒力因子基因,这说明微生物之间可能发生了抗性基因和毒力因子基因的水平转移,使得部分菌的健康风险变高。
为进一步验证本方法提出的评价水体健康风险水平的方法,我们对河流水体总氮(TN)浓度进行了分析,结果见图3。通过对总氮浓度的分析发现,高碑店污水处理厂升级后,通惠河的TN浓度有明显下降,从20~30mg/L下降到10mg/L左右。而清河污水处理厂早已升级改造,故清河的TN浓度在采样期间内并没有明显下降。我们发现,仅仅从TN这一营养物质浓度来看,污水处理厂的升级会使得受纳河流水质得到明显改善,但通过本方法对耐药性致病微生物的分析发现,污水处理厂的升级经过较长时间之后,受纳河流的健康风险才会明显下降,通过这一结果的比较,说明了本发明方法具有较高的可靠性,能够更为准确地反映出水环境中潜在的微生物健康风险。
上述实例表明本发明所述的基于抗性基因及毒力因子基因评价水体健康风险的方法能够在基因组层面上较为准确识别出水体中潜在的耐药性致病菌,并能给出水体健康风险水平的量化,能较好地应用在水环境健康风险评价中。
尽管已经示出和描述了本发明的实施例,但对于本领域的普通技术人员而言,应该理解在不脱离本发明的精神和原理的情况下可以对这些实施例进行各种形式和细节的变化、修改、替换和变型,本发明的范围由权利要求及其等同物所限定。
Claims (5)
1.一种基于抗性基因及毒力因子基因评价水体健康风险的方法,其特征在于,所述方法包括如下步骤:
(1)采集水体样品,提取获得样品的宏基因组测序数据,并对原始测序数据raw reads进行质量过滤,得到高质量读段clean reads;
(2)对每个样品获得的clean reads进行组装,获得重叠群contigs;
(3)根据contigs的核酸组成和丰度变化模式,对序列进行聚类、分箱,得到微生物基因组草图MAGs,对所有的MAGs根据完整度和污染率进行评估,选择出符合要求的高质量代表性MAGs,对高质量代表性MAGs进行去冗余,获得非冗余MAGs集;
(4)对所述非冗余MAGs集的所有contigs预测开放阅读框ORF,将所有ORF依次与抗生素抗性基因数据库和毒力因子数据库比对,识别出同时含有ARG序列和VFG序列的MAGs即定义为潜在的PARB,并统计这些潜在的PARB携带的ARG和VFG的种类及数量;
(5)样品中属于潜在的PARB的MAGs丰度的计算:使用基于映射的方法获得每个样品中能与非冗余MAGs集中所有MAGs成功比对上的reads的数目占该样品reads总数的百分比,以及非冗余MAGs集中每个MAG在各个样品中的覆盖度,每个样品中每个PARB的丰度根据公式(1)计算:
其中,样品中reads映射的百分比代表一个样品中能与非冗余MAGs集成功比对上的reads的数目占该样品reads总数的百分比,单个PARB覆盖度即一个属于潜在的PARB的MAG在一个样品中的覆盖度,所有MAG覆盖度之和代表所有MAGs在一个样品中的覆盖度之和;
(6)单个PARB健康风险率的计算:将步骤(4)得到的每个PARB携带的ARGs的数量、ARGs的类型、VFGs的数量和VFGs的类型数据,利用主成分分析的方法,获得一个主成分,并对该主成分的值进行归一化,归一化后的各个PARB主成分的值即为各个PARB的健康风险率;
(7)水体健康风险的计算:PARB的健康风险率与各个采样点PARB丰度乘积之和即可代表水体健康风险水平。
2.根据权利要求1所述的一种基于抗性基因及毒力因子基因评价水体健康风险的方法,其特征在于,所述步骤(3)中对所有的MAGs根据完整度和污染率进行评估,根据完整度>60%、污染率<10%选择高质量代表性MAGs。
3.根据权利要求1所述的一种基于抗性基因及毒力因子基因评价水体健康风险的方法,其特征在于,所述步骤(4)中所述抗生素抗性基因数据库使用ARGs_OAP_v2.0,所述毒力因子数据库使用VFDB。
4.根据权利要求1所述的一种基于抗性基因及毒力因子基因评价水体健康风险的方法,其特征在于,所述步骤(4)中所有ORF依次与抗生素抗性基因数据库和毒力因子数据库比对,符合相似度>80%、长度>top hit的70%的条件即被认为是潜在的ARG序列或VFG序列。
5.根据权利要求1所述的一种基于抗性基因及毒力因子基因评价水体健康风险的方法,其特征在于,所述步骤(6)中利用R语言进行主成分分析和归一化处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010684761.9A CN111944914A (zh) | 2020-07-16 | 2020-07-16 | 一种基于抗性基因及毒力因子基因评价水体健康风险的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010684761.9A CN111944914A (zh) | 2020-07-16 | 2020-07-16 | 一种基于抗性基因及毒力因子基因评价水体健康风险的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111944914A true CN111944914A (zh) | 2020-11-17 |
Family
ID=73341322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010684761.9A Pending CN111944914A (zh) | 2020-07-16 | 2020-07-16 | 一种基于抗性基因及毒力因子基因评价水体健康风险的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111944914A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113943787A (zh) * | 2021-11-01 | 2022-01-18 | 安徽医科大学 | 一种环境样本中抗生素抗性基因的高通量检测方法和系统 |
CN114262715A (zh) * | 2021-12-28 | 2022-04-01 | 中国环境科学研究院 | 一种堆肥产品中抗性基因环境健康风险评估的方法 |
CN115062933A (zh) * | 2022-06-01 | 2022-09-16 | 生态环境部南京环境科学研究所 | 水环境中抗生素残留的微生物耐药性多层级风险评估方法 |
CN117174165A (zh) * | 2023-10-25 | 2023-12-05 | 清华大学 | 基于宏基因组的环境耐药组分析方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108804875A (zh) * | 2018-06-21 | 2018-11-13 | 中国科学院北京基因组研究所 | 一种利用宏基因组数据分析微生物群体功能的方法 |
CN109706237A (zh) * | 2019-02-27 | 2019-05-03 | 中国科学院生态环境研究中心 | 一种评价污染水体恢复状况的方法 |
CN110349629A (zh) * | 2019-06-20 | 2019-10-18 | 广州赛哲生物科技股份有限公司 | 一种利用宏基因组或宏转录组检测微生物的分析方法 |
-
2020
- 2020-07-16 CN CN202010684761.9A patent/CN111944914A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108804875A (zh) * | 2018-06-21 | 2018-11-13 | 中国科学院北京基因组研究所 | 一种利用宏基因组数据分析微生物群体功能的方法 |
CN109706237A (zh) * | 2019-02-27 | 2019-05-03 | 中国科学院生态环境研究中心 | 一种评价污染水体恢复状况的方法 |
CN110349629A (zh) * | 2019-06-20 | 2019-10-18 | 广州赛哲生物科技股份有限公司 | 一种利用宏基因组或宏转录组检测微生物的分析方法 |
Non-Patent Citations (1)
Title |
---|
JINSONG LIANG等: "Identification and quantification of bacterial genomes carrying antibiotic resistance genes and virulence factor genes for aquatic microbiological risk assessment", 《WATER RES.》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113943787A (zh) * | 2021-11-01 | 2022-01-18 | 安徽医科大学 | 一种环境样本中抗生素抗性基因的高通量检测方法和系统 |
CN114262715A (zh) * | 2021-12-28 | 2022-04-01 | 中国环境科学研究院 | 一种堆肥产品中抗性基因环境健康风险评估的方法 |
CN114262715B (zh) * | 2021-12-28 | 2023-07-28 | 中国环境科学研究院 | 一种堆肥产品中抗性基因环境健康风险评估的方法 |
CN115062933A (zh) * | 2022-06-01 | 2022-09-16 | 生态环境部南京环境科学研究所 | 水环境中抗生素残留的微生物耐药性多层级风险评估方法 |
CN115062933B (zh) * | 2022-06-01 | 2023-04-18 | 生态环境部南京环境科学研究所 | 水环境中抗生素残留的微生物耐药性多层级风险评估方法 |
CN117174165A (zh) * | 2023-10-25 | 2023-12-05 | 清华大学 | 基于宏基因组的环境耐药组分析方法 |
CN117174165B (zh) * | 2023-10-25 | 2024-03-12 | 清华大学 | 基于宏基因组的环境耐药组分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111944914A (zh) | 一种基于抗性基因及毒力因子基因评价水体健康风险的方法 | |
CN109273053B (zh) | 一种高通量测序的微生物数据处理方法 | |
CN110004239A (zh) | 一种基于微生物溯源解析水体污染源的方法 | |
CN109559780A (zh) | 一种高通量测序的rna数据处理方法 | |
Li et al. | Barcoding for diatoms in the Yangtze River from the morphological observation and 18S rDNA polymorphic analysis | |
CN114525276B (zh) | 一种高通量qPCR芯片及其在检测微生物重金属抗性基因中的应用 | |
Tang et al. | Exploring diversity patterns and driving mechanisms of the antibiotic resistome and microbiome in saline groundwater | |
CN113789394B (zh) | 一种鉴定三疣梭子蟹氨氮耐受性状的分子标记c13及其应用 | |
CN105603081B (zh) | 一种非诊断目的的肠道微生物定性与定量的检测方法 | |
CN110423835A (zh) | 用于下呼吸道病原微生物检测的引物组合物 | |
CN113373248A (zh) | 一种检测致病性细菌的探针组合、芯片、试剂盒及方法 | |
CN112980937A (zh) | 基于高通量测序的有害藻华种分子快速检测方法 | |
Al-Meshhdany et al. | Five diatom species identified by using potential application of next generation DNA sequencing | |
CN116622902B (zh) | 一种鉴别云南西北部产金荞麦的snp分子标记组合及其方法与应用 | |
CN116606956B (zh) | 一种鉴别云南南部产金荞麦的snp分子标记组合及其方法与应用 | |
CN116622901B (zh) | 一种鉴别云南中部产金荞麦的snp分子标记组合及其方法与应用 | |
CN113493847B (zh) | 基于PMA高通量测序和PICRUSt的抗生素抗性基因及潜在宿主细菌的鉴定方法 | |
CN116622903B (zh) | 一种鉴别贵州产金荞麦的snp分子标记组合及其方法与应用 | |
CN116004777A (zh) | 一种微生物抗生素抗性基因的高通量检测引物组、芯片、试剂盒及其检测方法 | |
CN110501414B (zh) | 一种vim型和spm型金属酶铜绿假单胞菌的识别模型、构建方法及应用 | |
Savichtcheva et al. | Qualitative and quantitative estimation of host-specific fecal pollution using Bacteroides–Prevotella 16S rRNA genetic markers by T-RFLP and real-time PCR analyses | |
CN111627500A (zh) | 一种基于宏基因组技术识别水体中携带毒性因子病原菌的方法 | |
Blackwood | Analysing microbial community structure by means of terminal restriction fragment length polymorphism (T-RFLP). | |
CN118308472A (zh) | 一种识别和鉴定氮循环基因和宿主的方法以及评价水生态系统氮循环功能恢复情况的方法 | |
CN115852001A (zh) | 一种小麦病原菌检测方法及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201117 |
|
RJ01 | Rejection of invention patent application after publication |