CN109082479A - 从样本中鉴定微生物物种的方法和装置 - Google Patents

从样本中鉴定微生物物种的方法和装置 Download PDF

Info

Publication number
CN109082479A
CN109082479A CN201710447898.0A CN201710447898A CN109082479A CN 109082479 A CN109082479 A CN 109082479A CN 201710447898 A CN201710447898 A CN 201710447898A CN 109082479 A CN109082479 A CN 109082479A
Authority
CN
China
Prior art keywords
rna
dna
read
candidate microbial
microbial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710447898.0A
Other languages
English (en)
Other versions
CN109082479B (zh
Inventor
姬敬开
麻锦敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Priority to CN201710447898.0A priority Critical patent/CN109082479B/zh
Publication of CN109082479A publication Critical patent/CN109082479A/zh
Application granted granted Critical
Publication of CN109082479B publication Critical patent/CN109082479B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提出从样本中鉴定微生物物种的方法和装置。该方法包括:获得DNA和RNA测序结果;将DNA测序结果进行比对,以便获得第一候选微生物集合和特异性DNA测序读段集合;将RNA测序结果进行比对,以便获得第二候选微生物集合和特异性RNA测序读段集合;选取第一候选微生物集合和第二候选微生物集合的交集的至少一部分作为第三候选微生物集合;分别从特异性DNA和RNA测序读段集合中选取相同数目的特异性DNA和RNA测序读段,分别获得过滤DNA和RNA测序读段集合;以及对第三候选微生物集合进行过滤处理,以便获得第四候选微生物集合,构成样本中的微生物物种。由此,能够准确地鉴定到种水平的微生物,避免背景微生物干扰,同时可找出活跃表达的致病性微生物,且操作简便。

Description

从样本中鉴定微生物物种的方法和装置
技术领域
本发明涉及生物领域。具体地,本发明涉及从样本中鉴定微生物物种的方法和装置。
背景技术
病原微生物的感染一直是人类长期困扰的疾病,但是由于造成人类感染的微生物复杂多变,对病原微生物感染的治疗造成了极大的干扰,精确地鉴定病原微生物是对其治疗至关重要的步骤。
然而,目前从样本中鉴定微生物物种的方法和装置仍有待研究。
发明内容
本发明旨在至少在一定程度上解决现有技术中存在的技术问题至少之一。为此,本发明提出了从样本中鉴定微生物物种的方法和装置。利用本发明的从样本中鉴定微生物物种的方法和装置能够准确地鉴定到种水平的微生物,避免背景微生物干扰,同时可以找出活跃表达的致病性微生物,且操作简便。
需要说明的是,本发明是基于发明人的下列发现而完成的:
目前对于病原微生物的鉴定主要依靠的是分离培养、PCR等技术来实现的,但是这些技术在时效性、敏感性和精确度上往往有很大的局限,而借助高通量测序技术可以一定程度上的克服这些缺陷。
随着测序技术的飞跃发展,测序成本以及所需时间不断下降,运用高通量测序技术进行病原微生物鉴定将有很大的应用前景。相对于传统分离培养技术,高通量测序技术能够克服很多病原微生物不能够分离培养的问题,而且分离培养往往费时费力,在临床应用上有很大的局限性;相对于PCR技术,高通量测序技术能够更广泛地对病原微生物进行鉴定,PCR技术局限于已知且有参考序列的病原微生物,而且PCR技术一次鉴定的种类往往也很有限。
采用高通量测序的方式对病原微生物的鉴定主要分为两种,一种是基于16S rRNA基因测序的方法,另一种是用宏基因组测序的方法。16S rRNA基因是编码原核生物核糖体小亚基的基因,是细菌系统分类学研究中常用的标志,通过对该区域的特异性扩增以及测序可以对样本的微生物组成进行分析。宏基因组测序则不涉及特异性区域的扩增,而是通过提取样本中总核酸(DNA或RNA)的方式对所有的序列进行非特异性扩增和测序,然后再对测序数据进行分析鉴定。
相对于16S rRNA基因测序,宏基因组测序是对样本中所有微生物进行全基因组高通量测序,克服了16S rRNA基因测序只能检测细菌的缺点。而且由于16S rRNA基因往往只能鉴定到属水平,难以进行更细的分类,对于某些细菌的分辨效果也较差,而宏基因组测序则可以进行更精细的物种分类,同时可以在基因的水平对于细菌的耐药性进行分析。采用高通量测序技术在总核酸水平进行病原微生物的鉴定主要分为基于RNA的宏转录组测序和基于DNA的宏基因组测序,两种方法分别在RNA和DNA层面上都可以实现对病原微生物的鉴定。
但是,进行病原微生物鉴定的样本种类繁多,比如鼻咽拭子、痰液、尿液、脑脊液、血液等,由于外界环境的影响以及采样过程中的污染,这些样本中往往含有很多背景干扰微生物,给病原微生物的鉴定造成了很大的干扰,因此去除背景微生物干扰,找到真正的致病性微生物是宏基因组测序鉴定病原微生物的关键。
有鉴于此,发明人通过对样本RNA宏转录组以及DNA宏基因组水平进行测序,并将这两种水平的测序结果进行对比分析,克服了传统分离培养以及PCR鉴定病原微生物的局限,同时解决了背景微生物的干扰,对样本进行准确的微生物鉴定,同时可以找出活跃表达的致病性微生物。
为此,在本发明的一个方面,本发明提出了一种从样本中鉴定微生物物种的方法。根据本发明的实施例,所述方法包括:(1)分别从所述样本中提取DNA和RNA,并分别对所述DNA和所述RNA进行测序,以便获得由多个DNA测序读段构成的DNA测序结果和由多个RNA测序读段构成的RNA测序结果;(2)将所述DNA测序结果与第一参考序列集合进行比对,以便获得第一候选微生物集合和特异性DNA测序读段集合,所述第一候选微生物集合的每一种微生物均被至少一个特异性DNA测序读段支持,所述特异性DNA测序读段集合的每一种特异性DNA测序读段仅支持一种微生物;(3)将所述RNA测序结果与第二参考序列集合进行比对,以便获得第二候选微生物集合和特异性RNA测序读段集合,所述第二候选微生物集合的每一种微生物均被至少一个特异性RNA测序读段支持,所述特异性RNA测序读段集合的每一种特异性RNA测序读段仅支持一种微生物;(4)选取所述第一候选微生物集合和所述第二候选微生物集合的交集的至少一部分作为第三候选微生物集合;(5)分别从所述特异性DNA测序读段集合和所述特异性RNA测序读段集合中选取相同数目的所述特异性DNA测序读段和所述特异性RNA测序读段,分别获得过滤DNA测序读段集合和过滤RNA测序读段集合;以及(6)基于所述过滤DNA测序读段集合和过滤RNA测序读段集合,对所述第三候选微生物集合进行过滤处理,以便获得第四候选微生物集合,所述第四候选微生物集合构成所述样本中的微生物物种。
本发明分别对样本中的DNA和RNA进行测序及结果比对,得到DNA宏基因组数据(第一候选微生物集合)和RNA宏转录组数据(第二候选微生物集合)。通过对这两组数据进行比对分析,从而能够准确地鉴定到种水平的微生物,避免背景微生物干扰。另外,通过比对分析,可以获得每个物种的RNA转录水平的定量结果,从而将活跃表达的致病微生物从背景微生物或者定植微生物区分开来。同时对RNA的测序能检出更多的微生物物种,比如RNA病毒。
根据本发明的实施例,上述从样本中鉴定微生物物种的方法还可以具有下列附加技术特征:
根据本发明的实施例,针对所述第三候选微生物集合中的每一种候选微生物,所述过滤处理是通过下列步骤完成的:(a)确定所述微生物在所述过滤DNA测序读段集合中获得的DNA测序读段支持数,以及该微生物在所述过滤RNA测序读段集合中获得的RNA测序读段支持数;(b)基于公式定量值=RNA支持数/DNA支持数,确定每一种候选微生物的定量值;(c)选择所述定量值不小于预定阈值的候选微生物作为所述第四候选微生物集合的成员。
根据本发明的实施例,针对细菌、古菌和病毒,所述预定阈值为1.5。
根据本发明的实施例,针对真菌,所述预定阈值为2。
根据本发明的实施例,所述相同数目为1M。
根据本发明的实施例,所述第一候选微生物集合和所述第二候选微生物集合中每一种微生物均为种水平。
根据本发明的实施例,步骤(2)之前,进一步包括:将所述DNA测序结果中除去低质量序列、低复杂度序列、编码核糖体RNA的DNA序列、人的基因组序列以及未知序列;以及将所述RNA测序结果中除去低质量序列、低复杂度序列、核糖体RNA的序列、人的基因组序列转录的RNA序列以及未知序列。
根据本发明的实施例,所述核糖体RNA序列包括:细菌的16SrRNA和23SrRNA、古菌的16SrRNA和23SrRNA、真核的18SrRNA和28SrRNA,以及5SrRNA和5.8SrRNA。
根据本发明的实施例,步骤(4)包括:(4-1)选取所述第一候选微生物集合和所述第二候选微生物集合的交集;(4-2)针对交集中的每一种微生物,选取至少有1个特异性DNA测序读段支持和1个特异性RNA测序读段支持的微生物作为第三候选微生物集合的成员。
在本发明的另一方面,本发明提出了一种从样本中鉴定微生物物种的装置。根据本发明的实施例,所述装置包括:提取单元,所述提取单元适于分别从所述样本中提取DNA和RNA;测序单元,所述测序单元适于分别对所述DNA和所述RNA进行测序,以便获得由多个DNA测序读段构成的DNA测序结果和由多个RNA测序读段构成的RNA测序结果;DNA比对单元,适于将所述DNA测序结果与第一参考序列集合进行比对,以便获得第一候选微生物集合和特异性DNA测序读段集合;RNA比对单元,适于将所述RNA测序结果与第二参考序列集合进行比对,以便获得第二候选微生物集合和特异性RNA测序读段集合;第一选取单元,适于选取所述第一候选微生物集合和所述第二候选微生物集合的交集的至少一部分作为第三候选微生物集合;第二选取单元,适于分别从所述特异性DNA测序读段集合和所述特异性RNA测序读段集合中选取相同数目的所述特异性DNA测序读段和所述特异性RNA测序读段,分别获得过滤DNA测序读段集合和过滤RNA测序读段集合;以及过滤单元,适于基于所述过滤DNA测序读段集合和过滤RNA测序读段集合,对所述第三候选微生物集合进行过滤处理,以便获得第四候选微生物集合,所述第四候选微生物集合构成所述样本中的微生物物种。由此,利用本发明的装置能够准确地鉴定到种水平的微生物,避免背景微生物干扰,同时可以找出活跃表达的致病性微生物,且操作简便。
根据本发明的实施例,所述过滤单元包括:确定支持数单元,适于确定所述微生物在所述过滤DNA测序读段集合中获得的DNA测序读段支持数,以及该微生物在所述过滤RNA测序读段集合中获得的RNA测序读段支持数;确定定量值单元,适于基于公式定量值=RNA支持数/DNA支持数,确定每一种候选微生物的定量值;判断单元,适于选择所述定量值不小于预定阈值的候选微生物作为所述第四候选微生物集合的成员。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1显示了根据本发明一个实施例的从样本中鉴定微生物物种的方法的流程示意图;
图2显示了根据本发明一个实施例的从样本中鉴定微生物物种的装置的结构示意图;
图3显示了根据本发明一个实施例的痰液DNA样本微生物种类分布图;
图4显示了根据本发明一个实施例的痰液RNA样本微生物种类分布图;
图5显示了根据本发明一个实施例的痰液RNA和DNA比较微生物种类分布图;
图6显示了根据本发明一个实施例的脑脊液DNA样本微生物种类分布图;
图7显示了根据本发明一个实施例的脑脊液RNA样本微生物种类分布图;以及
图8显示了根据本发明一个实施例的脑脊液RNA和DNA比较微生物种类分布图。
具体实施方式
下面详细描述本发明的实施例。下面描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
需要说明的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。进一步地,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
本发明提出了从样本中鉴定微生物物种的方法和装置,下面将分别对其进行详细描述。
从样本中鉴定微生物物种的方法
在本发明的一个方面,本发明提出了一种从样本中鉴定微生物物种的方法。根据本发明的实施例,参见图1,该方法包括:S100提取和测序、S200DNA测序结果比对、S300RNA测序结果比对、S400选取交集、S500获得过滤DNA测序读段集合和过滤RNA测序读段集合以及S600过滤处理。由此,利用本发明的方法能够准确地鉴定到种水平的微生物,避免背景微生物干扰,同时可以找出活跃表达的致病性微生物,且操作简便。下面将分别对其进行详细描述。
根据本发明的实施例,该方法包括:
S100提取和测序
在该步骤中,分别从样本中提取DNA和RNA,并分别对DNA和RNA进行测序,以便获得由多个DNA测序读段构成的DNA测序结果和由多个RNA测序读段构成的RNA测序结果。
根据本发明的实施例,步骤S200之前,进一步包括:将DNA测序结果中除去低质量序列、低复杂度序列、编码核糖体RNA的DNA序列、人的基因组序列以及未知序列;以及将RNA测序结果中除去低质量序列、低复杂度序列、核糖体RNA的序列、人的基因组序列转录的RNA序列以及未知序列。由于后续步骤中涉及到RNA数据和DNA数据的定量比较,而rRNA在RNA数据中所占比例较多。为了消除rRNA的干扰,对于RNA测序结果进行了rRNA去除处理,对DNA测序结果进行了编码rRNA的DNA去除处理。由此,以便进一步保证DNA测序结果中仅含微生物的DNA测序读段,RNA测序结果中仅含微生物的RNA测序读段。
根据本发明的具体实施例,步骤S200之前,分别将DNA测序结果和RNA测序结果进行如下操作:1)将测序结果中去除低质量序列并进行长度过滤。2)针对RNA测序结果,用SortMeRNA(sortmerna-2.0)去除rRNA数据:参数设置为97%identity,97%coverage,所用数据库为SILVA数据库中细菌的16SrRNA和23SrRNA,古菌的16SrRNA和23SrRNA,真核的18SrRNA和28SrRNA,以及Rfam数据库中的5SrRNA和5.8SrRNA数据库。针对DNA测序结果,采用和RNA相同的策略去除编码rRNA的DNA序列。3)用Kraken(kraken-0.10.5-beta)对去除rRNA的数据进行快速分类。所用的数据库为NCBI中refseq数据库里的细菌、古菌、真菌、病毒、质粒以及NCBI里人的基因组数据(GRCh38)。4)将分为微生物的以及未知的部分用Bowtie2再次和人的转录本数据(UCSC,refMrna)比对进一步去除人的序列(Bowtie2比对参数为—sensitive--mp 1,1--np 1--score-min L,0,-0.1)。5)将剩余的序列用SEQCLEAN去除低复杂度序列。
S200 DNA测序结果比对
在该步骤中,将DNA测序结果与第一参考序列集合进行比对,以便获得第一候选微生物集合和特异性DNA测序读段集合,第一候选微生物集合的每一种微生物均被至少一个特异性DNA测序读段支持,特异性DNA测序读段集合的每一种特异性DNA测序读段仅支持一种微生物。将DNA测序结果(过滤后的序列)与第一参考序列集合(例如Kraken所用的NCBI中refseq数据库里的细菌、古菌、真菌、病毒、质粒序列)进行比对,获得一定数量的DNA测序读段支持的候选微生物分类结果(包含特异性的和非特异性的DNA测序读段),并从中筛选出仅支持一种候选微生物物种的特异性DNA测序读段。
S300 RNA测序结果比对
在该步骤中,将RNA测序结果与第二参考序列集合进行比对,以便获得第二候选微生物集合和特异性RNA测序读段集合,第二候选微生物集合的每一种微生物均被至少一个特异性RNA测序读段支持,特异性RNA测序读段集合的每一种特异性RNA测序读段仅支持一种微生物。将RNA测序结果(过滤后的序列)与第二参考序列集合(Kraken所用的NCBI中refseq数据库里的细菌、古菌、真菌、病毒、质粒序列)进行比对,获得一定数量的RNA测序读段支持的候选微生物分类结果(包含特异性的和非特异性的RNA测序读段),并从中筛选出仅支持一种候选微生物物种的特异性RNA测序读段。
需要说明的是,为了描述方便,将步骤DNA测序结果比对和RNA测序结果比对标注了先后进行顺序,即先进行DNA测序结果比对,再进行RNA测序结果比对。实际上,对于步骤S200和S300的先后顺序不作严格限定,也可以先进行S300RNA测序结果比对,再进行S200DNA测序结果比对,具体可以根据实际需要进行选择。
根据本发明的实施例,第一候选微生物集合和第二候选微生物集合中每一种微生物均为种水平。第一参考序列和第二参考序列中包含种水平序列,进而通过与DNA测序结果和RNA测序结果,可以得到种水平的鉴定结果。由此,克服了16S rRNA基因只能鉴定到属水平,难以进行更细分类的缺陷。
S400选取交集
在该步骤中,选取第一候选微生物集合和第二候选微生物集合的交集的至少一部分作为第三候选微生物集合。挑选第三候选微生物集合的标准是某种微生物在第一候选微生物集合和第二候选微生物集合中都至少有一条特异性测序读段支持,即某种微生物在特异性DNA测序读段集合中至少存在一条特异性测序读段,同时在特异性RNA测序读段集合中至少存在一条特异性测序读段。
根据本发明的实施例,步骤S400包括:
(4-1)选取第一候选微生物集合和第二候选微生物集合的交集;
(4-2)针对交集中的每一种微生物,选取至少有1个特异性DNA测序读段支持和1个特异性RNA测序读段支持的微生物作为第三候选微生物集合的成员。
S500获得过滤DNA测序读段集合和过滤RNA测序读段集合
在该步骤中,分别从特异性DNA测序读段集合和特异性RNA测序读段集合中选取相同数目的特异性DNA测序读段和特异性RNA测序读段,分别获得过滤DNA测序读段集合和过滤RNA测序读段集合。根据本发明的具体实施例,相同数目为1M。将特异性DNA测序读段集合和特异性RNA测序读段集合按照相同数目(1M)进行切分,得到多个1M测序读段,从而实现数据均一化。
S600过滤处理
在该步骤中,基于过滤DNA测序读段集合和过滤RNA测序读段集合,对第三候选微生物集合进行过滤处理,以便获得第四候选微生物集合,第四候选微生物集合构成样本中的微生物物种。
根据本发明的实施例,针对第三候选微生物集合中的每一种候选微生物,过滤处理是通过下列步骤完成的:
(a)确定微生物在过滤DNA测序读段集合中获得的DNA测序读段支持数,以及该微生物在过滤RNA测序读段集合中获得的RNA测序读段支持数;
(b)基于公式定量值=RNA支持数/DNA支持数,确定每一种候选微生物的定量值;
(c)选择定量值不小于预定阈值的候选微生物作为第四候选微生物集合的成员。
由此,通过在相同数据量(例如1M)下,对相同物种的RNA支持数和DNA支持数进行比较,从而进一步确定微生物物种类型。
根据本发明的实施例,针对细菌、古菌和病毒,所述预定阈值为1.5。发明人发现,预定阈值设定过低,过滤越宽松,容易出现假阳性;阈值设定过高,过滤较严格,容易出现假阴性。为此,发明人发现,预定阈值为1.5,能够准确地鉴定出细菌、古菌和病毒。
根据本发明的实施例,针对真菌,所述预定阈值为2。发明人发现,预定阈值设定过低,过滤越宽松,容易出现假阳性;阈值设定过高,过滤较严格,容易出现假阴性。为此,发明人发现,预定阈值为2,能够准确地鉴定出真菌。
从样本中鉴定微生物物种的装置
在本发明的又一方面,本发明提出了从样本中鉴定微生物物种的装置,该装置可以用于实施前面从样本中鉴定微生物物种的方法。根据本发明的实施例,该装置包括:提取单元100、测序单元200、DNA比对单元300、RNA比对单元、第一选取单元500、第二选取单元600以及过滤单元700。由此,利用本发明的装置能够准确地鉴定到种水平的微生物,避免背景微生物干扰,同时可以找出活跃表达的致病性微生物,且操作简便。下面将对其进行详细描述。
根据本发明的实施例,该装置包括:
提取单元100
在该步骤中,提取单元适于分别从样本中提取DNA和RNA。
测序单元200
在该步骤中,适于分别对DNA和RNA进行测序,以便获得由多个DNA测序读段构成的DNA测序结果和由多个RNA测序读段构成的RNA测序结果。
DNA比对单元300
在该步骤中,适于将DNA测序结果与第一参考序列集合进行比对,以便获得第一候选微生物集合和特异性DNA测序读段集合。
RNA比对单元
在该步骤中,适于将RNA测序结果与第二参考序列集合进行比对,以便获得第二候选微生物集合和特异性RNA测序读段集合。
第一选取单元500
在该步骤中,适于选取第一候选微生物集合和第二候选微生物集合的交集的至少一部分作为第三候选微生物集合。
第二选取单元600
在该步骤中,适于分别从特异性DNA测序读段集合和特异性RNA测序读段集合中选取相同数目的特异性DNA测序读段和特异性RNA测序读段,分别获得过滤DNA测序读段集合和过滤RNA测序读段集合。
过滤单元700
在该步骤中,适于基于过滤DNA测序读段集合和过滤RNA测序读段集合,对第三候选微生物集合进行过滤处理,以便获得第四候选微生物集合,第四候选微生物集合构成样本中的微生物物种。
根据本发明的实施例,过滤单元包括:
确定支持数单元,适于确定微生物在过滤DNA测序读段集合中获得的DNA测序读段支持数,以及该微生物在过滤RNA测序读段集合中获得的RNA测序读段支持数;
确定定量值单元,适于基于公式定量值=RNA支持数/DNA支持数,确定每一种候选微生物的定量值;
判断单元,适于选择定量值不小于预定阈值的候选微生物作为第四候选微生物集合的成员。
由此,通过在相同数据量(例如1M)下,对相同物种的RNA支持数和DNA支持数进行比较,从而进一步确定微生物物种类型。
本领域技术人员能够理解的是,前面针对从样本中鉴定微生物物种的方法所描述的特征和优点,同样适用于该装置,在此不再赘述。
下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
一般方法
1、DNA提取及测序
1)用QIAamp DNA Mini kit(Qiagen)提取样本DNA。
2)用Agilent 2100 Bioanalyzer(Agilent)对提取的DNA进行浓度和质量的检测。
3)用Covaris E210(Covaris)将2μg的总DNA进行片段化处理。
4)用QIA Quick PCR extraction kit(Qiagen)对DNA片段进行纯化,并用洗脱缓冲液洗脱。
5)纯化后的DNA片段进行末端修复。
6)修复后的DNA片段加接头,然后纯化扩增。
接下来的步骤按照Ion Torrent的标准流程处理,并进行高通量测序,得到由多个DNA测序读段构成的DNA测序结果。
2、RNA提取及测序
1)用Qiagen RNeasy kit(Qiagen)从样本提取总RNA。
2)用Agilent 2100 Bioanalyzer(Agilent)对提取的总RNA进行浓度和质量的检测。
3)用Covaris E210(Covaris)将2μg的总RNA进行片段化处理。
4)以片段化的短序列作为模板合成双链cDNA。
5)用QIA Quick PCR extraction kit(Qiagen)对双链cDNA片段进行纯化,并用洗脱缓冲液洗脱。
6)纯化后的cDNA片段进行末端修复。
7)修复后的cDNA片段加接头,然后纯化扩增。
8)接下来的步骤按照Ion Torrent的标准流程处理,并进行高通量测序,得到由多个RNA测序读段构成的RNA测序结果。
实施例1
在该步骤中,按照下列方法鉴定痰液样本中的微生物:
由上述一般方法得到痰液样本DNA测序数据量约为47M,RNA测序的数据量约为47M。经过去除低质量、核糖体序列、人的序列以及低复杂度序列步骤,得到由9287条reads构成的DNA测序结果(如图3)和由12713条reads构成的RNA测序结果(如图4)。DNA和RNA共有的微生物(包括细菌、古菌、病毒和真核类)为126种,根据reads数(设定为1)过滤得到的微生物种类为43种。然后将RNA和DNA数据切分为1M reads数的集合进行比较。对比较的结果进行过滤,细菌、古菌和病毒的过滤标准是相同数据量下,同一物种RNA和DNA reads数的比值大于等于1.5,真核类的比值大于等于2。最后得到的微生物结果为15种(如图5),经过分析得出感染的微生物主要是人腺病毒C型(Human mastadenovirus C),杜氏假丝酵母(candida dubliniensis),口腔链球菌(Streptococcus oralis)等。
实施例2
在该步骤中,按照下列方法鉴定脑脊液样本中的微生物:
由上述一般方法得到脑脊液样本DNA测序数据量约为5M,RNA测序的数据量约为4M。经过去除低质量、核糖体序列、人的序列以及低复杂度序列步骤,得到由133265条reads构成的DNA测序结果(如图6)和由974328条reads构成的RNA测序结果(如图7)。DNA和RNA共有的微生物(包括细菌,古菌,病毒和真核类)为44种,根据reads数(设定为1)过滤得到的微生物种类为11种。然后将RNA和DNA数据切分为1M reads数的集合进行比较。对比较的结果进行过滤,细菌、古菌和病毒的过滤标准是相同数据量下,同一物种RNA和DNA reads数的比值大于等于1.5,真核类的比值大于等于2。最后得到的微生物结果为5种(如图8),经过分析得出感染的微生物主要是尾刺奈格里原虫(Naegleria gruberi),福氏耐格里变形虫(Naegleria fowleri),痤疮丙酸杆菌(propionibacterium acnes)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种从样本中鉴定微生物物种的方法,其特征在于,包括:
(1)分别从所述样本中提取DNA和RNA,并分别对所述DNA和所述RNA进行测序,以便获得由多个DNA测序读段构成的DNA测序结果和由多个RNA测序读段构成的RNA测序结果;
(2)将所述DNA测序结果与第一参考序列集合进行比对,以便获得第一候选微生物集合和特异性DNA测序读段集合,所述第一候选微生物集合的每一种微生物均被至少一个特异性DNA测序读段支持,所述特异性DNA测序读段集合的每一种特异性DNA测序读段仅支持一种微生物;
(3)将所述RNA测序结果与第二参考序列集合进行比对,以便获得第二候选微生物集合和特异性RNA测序读段集合,所述第二候选微生物集合的每一种微生物均被至少一个特异性RNA测序读段支持,所述特异性RNA测序读段集合的每一种特异性RNA测序读段仅支持一种微生物;
(4)选取所述第一候选微生物集合和所述第二候选微生物集合的交集的至少一部分作为第三候选微生物集合;
(5)分别从所述特异性DNA测序读段集合和所述特异性RNA测序读段集合中选取相同数目的所述特异性DNA测序读段和所述特异性RNA测序读段,分别获得过滤DNA测序读段集合和过滤RNA测序读段集合;以及
(6)基于所述过滤DNA测序读段集合和过滤RNA测序读段集合,对所述第三候选微生物集合进行过滤处理,以便获得第四候选微生物集合,所述第四候选微生物集合构成所述样本中的微生物物种。
2.根据权利要求1所述的方法,其特征在于,针对所述第三候选微生物集合中的每一种候选微生物,所述过滤处理是通过下列步骤完成的:
(a)确定所述微生物在所述过滤DNA测序读段集合中获得的DNA测序读段支持数,以及该微生物在所述过滤RNA测序读段集合中获得的RNA测序读段支持数;
(b)基于公式定量值=RNA支持数/DNA支持数,确定每一种候选微生物的定量值;
(c)选择所述定量值不小于预定阈值的候选微生物作为所述第四候选微生物集合的成员。
3.根据权利要求2所述的方法,其特征在于,针对细菌、古菌和病毒,所述预定阈值为1.5,针对真菌,所述预定阈值为2。
4.根据权利要求1所述的方法,其特征在于,步骤(4)包括:
(4-1)选取所述第一候选微生物集合和所述第二候选微生物集合的交集;
(4-2)针对交集中的每一种微生物,选取至少有1个特异性DNA测序读段支持和1个特异性RNA测序读段支持的微生物作为第三候选微生物集合的成员。
5.根据权利要求1所述的方法,其特征在于,所述相同数目为1M。
6.根据权利要求1所述的方法,其特征在于,所述第一候选微生物集合和所述第二候选微生物集合中每一种微生物均为种水平。
7.根据权利要求1所述的方法,其特征在于,步骤(2)之前,进一步包括:
将所述DNA测序结果中除去低质量序列、低复杂度序列、编码核糖体RNA的DNA序列、人的基因组序列以及未知序列;以及
将所述RNA测序结果中除去低质量序列、低复杂度序列、核糖体RNA的序列、人的基因组序列转录的RNA序列以及未知序列。
8.根据权利要求7所述的方法,其特征在于,所述核糖体RNA序列包括:细菌的16SrRNA和23SrRNA、古菌的16SrRNA和23SrRNA、真核的18SrRNA和28SrRNA以及5SrRNA和5.8SrRNA。
9.一种从样本中鉴定微生物物种的装置,其特征在于,包括:
提取单元,所述提取单元适于分别从所述样本中提取DNA和RNA;
测序单元,适于分别对所述DNA和所述RNA进行测序,以便获得由多个DNA测序读段构成的DNA测序结果和由多个RNA测序读段构成的RNA测序结果;
DNA比对单元,适于将所述DNA测序结果与第一参考序列集合进行比对,以便获得第一候选微生物集合和特异性DNA测序读段集合;
RNA比对单元,适于将所述RNA测序结果与第二参考序列集合进行比对,以便获得第二候选微生物集合和特异性RNA测序读段集合;
第一选取单元,适于选取所述第一候选微生物集合和所述第二候选微生物集合的交集的至少一部分作为第三候选微生物集合;
第二选取单元,适于分别从所述特异性DNA测序读段集合和所述特异性RNA测序读段集合中选取相同数目的所述特异性DNA测序读段和所述特异性RNA测序读段,分别获得过滤DNA测序读段集合和过滤RNA测序读段集合;以及
过滤单元,适于基于所述过滤DNA测序读段集合和过滤RNA测序读段集合,对所述第三候选微生物集合进行过滤处理,以便获得第四候选微生物集合,所述第四候选微生物集合构成所述样本中的微生物物种。
10.根据权利要求9所述的装置,其特征在于,所述过滤单元包括:
确定支持数单元,适于确定所述微生物在所述过滤DNA测序读段集合中获得的DNA测序读段支持数,以及该微生物在所述过滤RNA测序读段集合中获得的RNA测序读段支持数;
确定定量值单元,适于基于公式定量值=RNA支持数/DNA支持数,确定每一种候选微生物的定量值;
判断单元,适于选择所述定量值不小于预定阈值的候选微生物作为所述第四候选微生物集合的成员。
CN201710447898.0A 2017-06-14 2017-06-14 从样本中鉴定微生物物种的方法和装置 Active CN109082479B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710447898.0A CN109082479B (zh) 2017-06-14 2017-06-14 从样本中鉴定微生物物种的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710447898.0A CN109082479B (zh) 2017-06-14 2017-06-14 从样本中鉴定微生物物种的方法和装置

Publications (2)

Publication Number Publication Date
CN109082479A true CN109082479A (zh) 2018-12-25
CN109082479B CN109082479B (zh) 2022-04-19

Family

ID=64839507

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710447898.0A Active CN109082479B (zh) 2017-06-14 2017-06-14 从样本中鉴定微生物物种的方法和装置

Country Status (1)

Country Link
CN (1) CN109082479B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110343754A (zh) * 2019-08-15 2019-10-18 深圳谱元科技有限公司 一种用于造血干细胞移植供体病原微生物快速检测的方法
CN112614544A (zh) * 2020-12-28 2021-04-06 杭州瑞普基因科技有限公司 Kraken2软件输出结果的优化方法及鉴定样本中物种类型的方法
CN112825267A (zh) * 2019-11-21 2021-05-21 深圳华大基因科技服务有限公司 确定小核酸序列集合的方法及其应用
CN113215235A (zh) * 2021-06-17 2021-08-06 嘉兴允英医学检验有限公司 一种高通量快速检测病原微生物的方法
CN113284560A (zh) * 2021-04-28 2021-08-20 广州微远基因科技有限公司 病原检测背景微生物判断方法及应用
CN114334004A (zh) * 2021-12-04 2022-04-12 江苏先声医学诊断有限公司 一种病原微生物快速比对鉴定方法及其应用

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103642799A (zh) * 2013-12-27 2014-03-19 中南大学 一种分离微生物宏基因组dna与总rna的方法
CN105112569A (zh) * 2015-09-14 2015-12-02 中国医学科学院病原生物学研究所 基于宏基因组学的病毒感染检测及鉴定方法
CN105407728A (zh) * 2013-07-21 2016-03-16 霍勒拜欧姆公司 用于微生物组表征、监测和治疗的方法和系统
CN105525033A (zh) * 2014-09-29 2016-04-27 天津华大基因科技有限公司 检测血液中微生物的方法及装置
WO2016168350A1 (en) * 2015-04-13 2016-10-20 uBiome, Inc. Method and system for microbiome-derived characterization, diagnostics and therapeutics for cutaneous conditions
WO2016210251A1 (en) * 2015-06-25 2016-12-29 Ascus Biosciences, Inc. Methods, apparatuses, and systems for analyzing microorganism strains from complex heterogeneous communities, predicting and identifying functional relationships and interactions thereof, and selecting and synthesizing microbial ensembles based thereon
CN106414775A (zh) * 2014-04-11 2017-02-15 宾夕法尼亚大学董事会 用于宏基因组生物标志检测的组合物和方法
WO2017044827A1 (en) * 2015-09-10 2017-03-16 Life Technologies Corporation Purification of nucleic acid from environmental or biological samples
WO2017044901A1 (en) * 2015-09-09 2017-03-16 uBiome, Inc. Method and system for microbiome-derived diagnostics and therapeutics for conditions associated with gastrointestinal health

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105407728A (zh) * 2013-07-21 2016-03-16 霍勒拜欧姆公司 用于微生物组表征、监测和治疗的方法和系统
CN103642799A (zh) * 2013-12-27 2014-03-19 中南大学 一种分离微生物宏基因组dna与总rna的方法
CN106414775A (zh) * 2014-04-11 2017-02-15 宾夕法尼亚大学董事会 用于宏基因组生物标志检测的组合物和方法
CN105525033A (zh) * 2014-09-29 2016-04-27 天津华大基因科技有限公司 检测血液中微生物的方法及装置
WO2016168350A1 (en) * 2015-04-13 2016-10-20 uBiome, Inc. Method and system for microbiome-derived characterization, diagnostics and therapeutics for cutaneous conditions
WO2016210251A1 (en) * 2015-06-25 2016-12-29 Ascus Biosciences, Inc. Methods, apparatuses, and systems for analyzing microorganism strains from complex heterogeneous communities, predicting and identifying functional relationships and interactions thereof, and selecting and synthesizing microbial ensembles based thereon
WO2017044901A1 (en) * 2015-09-09 2017-03-16 uBiome, Inc. Method and system for microbiome-derived diagnostics and therapeutics for conditions associated with gastrointestinal health
WO2017044827A1 (en) * 2015-09-10 2017-03-16 Life Technologies Corporation Purification of nucleic acid from environmental or biological samples
CN105112569A (zh) * 2015-09-14 2015-12-02 中国医学科学院病原生物学研究所 基于宏基因组学的病毒感染检测及鉴定方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110343754A (zh) * 2019-08-15 2019-10-18 深圳谱元科技有限公司 一种用于造血干细胞移植供体病原微生物快速检测的方法
CN112825267A (zh) * 2019-11-21 2021-05-21 深圳华大基因科技服务有限公司 确定小核酸序列集合的方法及其应用
CN112825267B (zh) * 2019-11-21 2024-05-14 深圳华大基因科技服务有限公司 确定小核酸序列集合的方法及其应用
CN112614544A (zh) * 2020-12-28 2021-04-06 杭州瑞普基因科技有限公司 Kraken2软件输出结果的优化方法及鉴定样本中物种类型的方法
CN112614544B (zh) * 2020-12-28 2024-05-17 杭州瑞普基因科技有限公司 Kraken2软件输出结果的优化方法及鉴定样本中物种类型的方法
CN113284560A (zh) * 2021-04-28 2021-08-20 广州微远基因科技有限公司 病原检测背景微生物判断方法及应用
CN113284560B (zh) * 2021-04-28 2022-05-17 广州微远基因科技有限公司 病原检测背景微生物判断方法及应用
CN113215235A (zh) * 2021-06-17 2021-08-06 嘉兴允英医学检验有限公司 一种高通量快速检测病原微生物的方法
CN114334004A (zh) * 2021-12-04 2022-04-12 江苏先声医学诊断有限公司 一种病原微生物快速比对鉴定方法及其应用
CN114334004B (zh) * 2021-12-04 2024-03-15 江苏先声医学诊断有限公司 一种病原微生物快速比对鉴定方法及其应用

Also Published As

Publication number Publication date
CN109082479B (zh) 2022-04-19

Similar Documents

Publication Publication Date Title
CN109082479A (zh) 从样本中鉴定微生物物种的方法和装置
US11519032B1 (en) Transposition of native chromatin for personal epigenomics
Atkins et al. Fungal molecular diagnostics: a mini review
JP6404714B2 (ja) 多変量診断アッセイ及びこれを用いるための方法
CN106661606A (zh) 用于检测和表征微生物的方法
CA2906725C (en) Characterization of biological material using unassembled sequence information, probabilistic methods and trait-specific database catalogs
CN110875082B (zh) 一种基于靶向扩增测序的微生物检测方法和装置
Ellison et al. In situ hybridization for the detection of rust fungi in paraffin embedded plant tissue sections
Hoshino et al. Differential diagnostic assays for discriminating mycobacteria, especially for nontuberculous mycobacteria: what does the future hold?
CN106164295A (zh) 减小基因组覆盖测量中的偏差
Zhang et al. Optimized sequencing adaptors enable rapid and real-time metagenomic identification of pathogens during runtime of sequencing
EP3601588B1 (en) Phenotypic characterization of cells
CN112331268B (zh) 目标物种特有序列的获取方法及目标物种检测方法
Bhawe et al. Microarray analysis in glioblastomas
JP2007060953A (ja) 細菌叢の分析方法
CN105734162B (zh) Bol024541基因在鉴定植物菌核病抗性中的用途
Mandlik et al. Microbial identification in endodontic infections with an emphasis on molecular diagnostic methods: a review
Welsh et al. The prevalence of controls in phyllosphere microbiome research: a methodological review
Decordier et al. Fluorescence in situ hybridization (FISH) technique for the micronucleus test
CN115927677B (zh) 基于特异序列标签的类鼻疽伯克霍尔德菌的检测方法与应用
Hemmert et al. Rapid methods for pathogen detection in bloodstream infections.
WO2023040997A1 (zh) 一种单基因检测方法及其应用
CN117051136A (zh) 一种结核分枝杆菌复合群鉴定及耐药检测引物组
JP2022025456A (ja) 多発性硬化症を検査する方法
Deplano et al. Nosocomial infections caused by staphylococci

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 518083 comprehensive building, Beishan Industrial Zone, Yantian District, Guangdong, Shenzhen

Applicant after: BGI SHENZHEN

Address before: 518083 comprehensive building, Beishan Industrial Zone, Yantian District, Guangdong, Shenzhen

Applicant before: BGI SHENZHEN

GR01 Patent grant
GR01 Patent grant