CN113355438A - 一种血浆微生物物种多样性评估方法、装置和存储介质 - Google Patents

一种血浆微生物物种多样性评估方法、装置和存储介质 Download PDF

Info

Publication number
CN113355438A
CN113355438A CN202110612817.4A CN202110612817A CN113355438A CN 113355438 A CN113355438 A CN 113355438A CN 202110612817 A CN202110612817 A CN 202110612817A CN 113355438 A CN113355438 A CN 113355438A
Authority
CN
China
Prior art keywords
annotation
plasma
sample
sequencing
quality control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110612817.4A
Other languages
English (en)
Other versions
CN113355438B (zh
Inventor
陈海新
黄毅
林小芳
刘久成
易鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Guiinga Medical Laboratory
Shenzhen Jinjia Technology Co Ltd
Original Assignee
Shenzhen Genehome Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Genehome Technology Co ltd filed Critical Shenzhen Genehome Technology Co ltd
Priority to CN202110612817.4A priority Critical patent/CN113355438B/zh
Publication of CN113355438A publication Critical patent/CN113355438A/zh
Application granted granted Critical
Publication of CN113355438B publication Critical patent/CN113355438B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Botany (AREA)
  • Mycology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请公开了一种血浆微生物物种多样性评估方法、装置和存储介质,方法包括信息注释及合并步骤、物种多样性评估步骤。本申请通过两种不同的算法对血浆样本的非人源序列进行注释,以获取微生物物种及其丰度信息,并且对血浆样本的微生物物种及其丰度信息进行定量分析,得到微生物物种多样性指数,从而能够通过微生物物种多样性指数对血浆样本的微生物物种多样性进行定量评估;此外,本申请只需受检者的血浆样本即可进行液体活检,取样方便快捷,并且测序数据适用于低深度数据,检测成本更低,且支持甲基化测序数据,可对同一个样本进行多维度分析。

Description

一种血浆微生物物种多样性评估方法、装置和存储介质
技术领域
本申请涉及微生物检测领域,具体涉及一种血浆微生物物种多样性评估方法、装置和存储介质。
背景技术
基于宿主与微生物的关系,宿主中的微生物可分为多种,包括正常菌群、与宿主共生的包括寄生的微生物、引起机体感染致病的微生物——病原体等。宿主的血浆含有游离DNA,包括来源于宿主的和来源于微生物的游离DNA片段。通过检测人体血浆中微生物游离DNA的来源和物种多样性,能够评估人体血浆微生物的生态平衡状态,为某些早期没有明显症状的复杂疾病提供医疗预警。
传统的血浆微生物检测方法为血培养,即通过对患者血液进行采集并装入含有培养基的瓶中进行培养,以此来确定使得患者致病的微生物。通常血培养发现阳性后,还需要进一步进行病原体分离鉴定,确定所感染的病原体并进行指导用药。
但是,血培养存在以下不足:1)需要的采血量较大,一般成人需要20-30ml,婴儿需要2ml以上;2)血培养周期较长,最少需要3-4天时间;3)血培养只能针对部分细菌或真菌进行培养,对于病毒以及一些较难培养的细菌无法获得培养结果;4)血培养阳性率较低,仅有30%-40%的血培养结果为阳性,即仅有30-40%的血流感染可通过培养发现致病菌,从而实现检测;5)血培养假阳性率较高,虽然部分样本可以得到血培养阳性结果,但由于皮肤消毒不彻底或采血操作不规范常常会引起培养的假阳性,影响临床判断。
此外,随着分子生物学的研究和发展,基于核酸序列的病原体检测技术逐渐发展。但其应用于血浆微生物检测的案例较少,绝大部分只针对血液中的病毒进行检测,并且,一次也只能检测一个或几个病原体,检测灵敏度有限,对于临床应用具有很大局限。
由此可见,现有技术往往是针对已经致病的微生物进行检测,并且检测的微生物种类有限,如何对血浆微生物物种多样性进行检测,是血浆微生物检测的难点。
发明内容
本申请的目的是提供一种血浆微生物物种多样性评估方法、装置和存储介质。
为了实现上述目的,本申请采用了以下技术方案:
本申请的第一方面公开了一种血浆微生物物种多样性评估方法,包括:
信息注释及合并步骤:基于kmer方法和蛋白比对方法分别对非人源序列进行注释,合并两种方法得到的注释结果,所述注释结果包括微生物物种及其丰度信息;
物种多样性评估步骤:利用所述注释结果计算微生物物种多样性指数,根据所述微生物物种多样性指数评估待测血浆样本中微生物物种多样性。
值得说明的是,本申请通过两种不同的算法对DNA测序数据的非人源序列进行注释,以获取血浆样本的微生物物种及其丰度信息,并且对血浆样本的微生物物种及其丰度信息进行定量分析,得到微生物物种多样性指数,从而能够通过微生物物种多样性指数对血浆样本的微生物物种多样性进行定量评估;此外,本申请只需受检者的血浆样本即可进行液体活检,取样方便快捷,并且测序数据适用于低深度数据,检测成本更低,且支持甲基化测序数据,可对同一个样本进行多维度分析。
本申请的一种实现方式中,所述信息注释及合并步骤之前还包括非人源序列获取步骤,所述非人源序列获取步骤包括:
获取待测血浆样本的测序数据,对测序数据进行质量控制,过滤接头和低质量碱基,以得到经过质控的测序数据;
以人源序列为参考基因组,将经过质控的测序数据和参考基因组进行比对,去除比对到参考基因组上的序列,以获得非人源序列;
优选的,所述低质量碱基包括低质量碱基序列中质量值小于20的碱基数占序列总碱基数的比值大于80%的reads或者N的占比小于5%的reads。
本申请的一种实现方式中,所述非人源序列获取步骤之前还包括样本采集和测序步骤,所述样本采集和测序步骤包括:
采集待测血浆样本,提取样本中的核酸,将核酸中的RNA反转录为cDNA,对提取的DNA或cDNA进行建库和测序,获得待测血浆样本的测序数据。
本申请的一种实现方式中,所述非人源序列获取步骤之后还包括非人源序列质控步骤,所述非人源序列质控步骤还包括:
判断所述非人源序列的在测序数据中的占比是否在预设范围内;
若非人源序列的在测序数据中的占比不在合预设范围内,则重新进行所述样本采集和测序步骤;
优选的,所述非人源序列的在测序数据中的占比的预设范围为0.0001%-1%。
本申请的一种实现方式中,所述样本采集和测序步骤还包括,在提取的DNA或cDNA中添加非人源的外源参照核酸,获得混合核酸样本,对混合核酸样本进行建库和测序,使得待测血浆样本的测序数据中含有所述外源参照核酸的测序数据;
优选的,所述外源参照核酸为pUC19质粒。
本申请的一种实现方式中,所述信息注释及合并步骤之后还包括注释结果质控步骤,所述注释结果质控步骤包括第一步质控和第二步质控;
所述第一步质控包括:
判断注释结果是否包含所述对外源参照核酸的注释;
若注释结果不包含所述外源参照核酸的注释结果,则重新进行所述信息注释及合并步骤,或者,重新对所述混合核酸样本进行建库和测序;
若注释结果包含外源参照核酸的注释结果,则第一步质控合格,进行第二步质控;
所述第二步质控包括:
将注释结果包含的微生物按丰度由高到低进行排序,获取丰度排序前预设个数的微生物在人群中的丰度分布,若注释结果中丰度排序前预设个数的任一微生物的丰度大于其在人群中最高丰度的2倍,则存在微生物污染,需要重新进行待测血浆样本采集;
若注释结果中丰度排序前预设个数的微生物的丰度均小于或等于其在人群中最高丰度的2倍,则第二步质控合格,进行后续的物种多样性评估步骤;
优选的,所述预设个数为5个。
本申请的一种实现方式中,所述微生物物种多样性指数包括Shannon指数、Simpson指数、chao指数中的至少一种。
本申请的第二方面公开了一种血浆微生物物种多样性评估装置,其特征在于,包括:
信息注释及合并模块:用于基于kmer方法和蛋白比对方法分别对非人源序列进行注释,合并两种方法得到的注释结果,所述注释结果包括微生物物种及其丰度信息;
物种多样性评估模块:用于利用注释得到的微生物物种和丰度信息计算微生物物种多样性指数,以此评估待测血浆样本中微生物物种多样性。
本申请的第三方面公开了一种血浆微生物物种多样性评估装置,所述装置包括:
存储器,用于存储程序;处理器,用于通过执行所述存储器存储的程序以实现上述一种血浆微生物物种多样性评估方法。
本申请的第四方面公开了一种计算机可读存储介质,所述介质用于存储程序,所述程序能够被处理器执行以实现上述一种血浆微生物物种多样性评估方法。
由于采用以上技术方案,本申请的有益效果在于:
本申请的血浆微生物物种多样性评估方法,通过两种不同的算法对DNA测序数据的非人源序列进行注释,以获取血浆样本的微生物物种及其丰度信息,并且对血浆样本的微生物物种及其丰度信息进行定量分析,得到微生物物种多样性指数,从而能够通过微生物物种多样性指数对血浆样本的微生物物种多样性进行定量评估;此外,本申请只需受检者的血浆样本即可进行液体活检,取样方便快捷,并且测序数据适用于低深度数据,检测成本更低,且支持甲基化测序数据,可对同一个样本进行多维度分析。
附图说明
图1为本申请实施例提供的一种血浆微生物物种多样性评估方法的流程框图;
图2为本申请实施例中提供的一种血浆微生物物种多样性评估装置的结构框图。
具体实施方式
下面通过具体实施方式对本申请作进一步详细说明。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
现有技术往往是针对已经致病的微生物进行检测,检测周期长,并且检测的微生物种类有限,如何对血浆中所有微生物进行快速检测,并定量分析血浆中微生物物种的多样性,是血浆微生物检测的难点。
为了解决上述问题,如图1所示,本实施例提供了一种血浆微生物物种多样性评估方法,包括:
S201:基于kmer方法和蛋白比对方法分别对待测血浆样本的非人源序列进行注释,合并两种方法得到的注释结果,所述注释结果包括微生物物种及其丰度信息。
具体地,血浆样本通过处理血液样本得到,待测血浆样本的非人源序列通过提取血浆中的核酸,对核酸的至少一部分进行序列测定,以获得待测血浆样本的非人源序列。kmer是指将非人源序列reads分成包含k个碱基的字符串,一般长短为m的reads可以分成m-k+1个kmers,将获得的kmer匹配到微生物kmer数据库中进行快速检索,选择最优匹配结果作为该非人源序列reads的注释信息,例如,kraken、kraken2、krakenUniq等软件均能通过kmer方法对非人源序列进行微生物物种注释。蛋白比对方法是指将reads按照六种可能的蛋白编码阅读框翻译为6种蛋白,与微生物蛋白数据库进行比对,选择最优比对结果作为该reads的注释信息,如DIAMOND,Kaiju,和MMseqs2等软件均能通过蛋白比对方法对非人源序列进行微生物物种注释。根据kmer方法和蛋白比对方法的注释结果和注释条数进行整合得到非人源序列的微生物物种及其丰度信息。
本实施例的一种实现方式中,所述基于kmer方法和蛋白比对方法分别对待测血浆样本的非人源序列进行注释,合并两种方法得到的注释结果,所述注释结果包括微生物物种及其丰度信息之前还包括:
获取待测血浆样本的测序数据,对测序数据进行质量控制,过滤接头和低质量碱基,以得到经过质控的测序数据;
以人源序列为参考基因组,将经过质控的测序数据和参考基因组进行比对,去除比对到参考基因组上的序列,以获得非人源序列。
具体的,血浆样本的测序数据为待测血浆样本的高通量测序数据,也即二代测序数据(NGS数据),此处的待测样本的测序数据可以是已有的经过质控处理后的NGS数据(通常称为Clean reads),也可以是对待测血浆样本进行预处理后提取核酸,将RNA反转录为cDNA,对提取的DNA和反转录获得的cDNA构建测序文库,然后基于二代测序方法进行测序后获得的原始数据(即FASTQ格式的raw data或raw reads,read或reads可翻译为序列或测序序列),该原始数据还需要进行质控处理(即通常所说的去除低质量reads),具体地,根据原始数据的序列组成以及序列质量,除去原始数据中包含接头序列的reads并过滤掉低质量reads,其中,所述低质量碱基包括低质量碱基序列中质量值小于20的碱基数占序列总碱基数的比值大于80%的reads或者N的占比小于5%的reads。
本实施例的一种具体实现方式中,以人源序列hg19或者是grch38为参考基因组,利用比对软件bwa或bowtie2将经过质控的测序数据和参考基因组进行比对,利用samtools软件去除比对到参考基因组上的序列,获得待测血浆样本的非人源序列。
在实际研究中,通过收集五百多个健康样本和癌症样本进行分析统计,计算每个样本的测序数据中非人源序列的占比,发现健康样本和癌症样本之间的非人源序列占比无显著性差异,因而测序数据的非人源序列占比能作为一个质量控制指标,通过样本中非人源序列的占比判断非人源序列是否满足下一步骤的分析要求。具体地,获得非人源序列之后还包括非人源序列质控步骤,所述非人源序列质控步骤还包括:
判断所述非人源序列的在测序数据中的占比是否在预设范围内;
若非人源序列的在测序数据中的占比不在合预设范围内,则重新进行所述样本采集和测序步骤。
本实施例的一个具体实现方式中,所述非人源序列的在测序数据中的占比的预设范围为0.001%-1%,将该非人源序列占比范围作为非人源序列的质控标准,若非人源序列的占比不满足该范围,则说明该非人源序列的占比异常,需要重进行样本采集和测序。
本实施例的一种实现方式中,获取待测血浆样本的测序数据之前还包括样本采集和测序步骤,所述样本采集和测序步骤包括:
采集待测血浆样本并提取样本中的核酸,将RNA反转录为cDNA,对提取的DNA和反转录获得的cDNA依序进行以下处理:DNA分段、末端修复处理、接头连接处理、分离出单股DNA、DNA成环处理、DNA滚环扩增形成DNA纳米球、固定DNA纳米球得到DNA纳米球阵列,对DNA纳米球阵列进行测序,获得待测血浆样本的测序数据。
本实施例的一种实现方式中,为了确保注释结果的可靠性,所述样本采集和测序步骤还包括,在提取的核酸中,将RNA反转录为cDNA,添加非人源的外源参照核酸,获得混合核酸样本,对混合核酸样本进行建库和测序,具体包括:DNA分段、末端修复处理、接头连接处理、分离出单股DNA、DNA成环处理、DNA滚环扩增形成DNA纳米球、固定DNA纳米球得到DNA纳米球阵列,对DNA纳米球阵列进行测序,使得待测血浆样本的测序数据中含有所述外源参照核酸的测序数据。
本实施例的一种具体实现方式中,所述外源参照核酸为pUC19质粒。
本实施例的一种实现方式中,所述信息注释及合并步骤之后还包括注释结果质控步骤,所述注释结果质控步骤包括第一步质控和第二步质控;
所述第一步质控包括:
判断注释结果是否包含所述对外源参照核酸的注释;
若注释结果不包含所述外源参照核酸的注释结果,则重新进行所述信息注释及合并步骤,或者,重新对所述混合核酸样本进行建库和测序;
若注释结果包含外源参照核酸的注释结果,则第一步质控合格,进行第二步质控;
所述第二步质控包括:
将注释结果包含的微生物按丰度由高到低进行排序,获取丰度排序前预设个数的微生物在人群中的丰度分布,若注释结果中丰度排序前预设个数的任一微生物的丰度大于其在人群中最高丰度的2倍,则存在微生物污染需要重新进行待测血浆样本采集;
若注释结果中丰度排序前预设个数的微生物的丰度均小于或等于其在人群中最高丰度的2倍,则第二步质控合格,进行后续的物种多样性评估步骤。
本实施例的一种具体实施方式中,所述预设个数为5个,也即将注释结果包含的微生物按丰度由高到低进行排序,丰度前5的微生物中任一微生物丰度大于其在人群中最高丰度的2倍,则说明该微生物物种在血浆中的丰度异常,样品在实验过程中有可能受到该微生物物种的污染,应当重新进行样本采集和测序步骤,或者重新对采集的待测血浆样本进行DNA或RNA提取,或者排除污染源后重新对所述混合核酸样本进行建库和测序,以进行微生物污染排查。
本实施例的的一种实现方式中,为了排除微生物污染是由于采集血浆样本后,在实验操作过程引入的微生物导致的,本实施例还设置有空白对照样本,所述空白对照样本采取和待测血浆样本相同的实验操作,并按照上述方法进行微生物物种多样性评估,若所述空白对照组出现微生物注释结果,则说明实验操作过程引入了微生物,第一步质控和第二步质控之间还包括第三步质控:在将待测血浆样本的注释结果和空白对照样本的注释结果进行比较,将待测血浆样本中和空白对照样本相同的注释结果进行剔除,而后对剔除后的注释结果进行第二步质控,从而避免实验操作过程引入污染对后续分析结果造成影响。
S204:利用所述注释结果计算微生物物种多样性指数,根据所述微生物物种多样性指数评估待测血浆样本中微生物物种多样性。
具体的,所述微生物物种多样性指数包括Shannon指数、Simpson指数、chao指数中的至少一种,上述指数可以通过用于分析生物信息的R包计算得到,其中,R包是指R语言编写的程序分析包,例如diversity包。对于健康样本,其微生物物种多样性指数一般在一定的范围内波动,如果待测血浆样本的微生物物种多样性指数超出该范围,则说明待测血浆样本的微生物多样性过高或过低。例如,若待测血浆样本的shannon指数<4.5,则说明该样本的微生物多样性过低,待测血浆样本的微生物平衡状态被打破,需要对待测血浆样本的微生物分布情况进行进一步分析。
值得说明的是,本申请通过两种不同的算法对DNA测序数据的非人源序列进行注释,以获取血浆样本的微生物物种及其丰度信息,并且对血浆样本的微生物物种及其丰度信息进行定量分析,得到微生物物种多样性指数,从而能够通过微生物物种多样性指数对血浆样本的微生物物种多样性进行定量评估;此外,本申请只需受检者的血浆样本即可进行液体活检,取样方便快捷,并且测序数据适用于低深度数据,检测成本更低,且支持甲基化测序数据,可对同一个样本进行多维度分析。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
本申请的第二方面公开了一种血浆微生物物种多样性评估装置,其特征在于,包括:
信息注释及合并模块301:用于基于kmer方法和蛋白比对方法分别对非人源序列进行注释,合并两种方法得到的注释结果,所述注释结果包括微生物物种及其丰度信息;
物种多样性评估模块302:用于利用所述注释结果计算微生物物种多样性指数,根据所述微生物物种多样性指数评估待测血浆样本中微生物物种多样性。
本申请的第三方面公开了一种血浆微生物物种多样性评估装置,所述装置包括:
存储器,用于存储程序;处理器,用于通过执行所述存储器存储的程序以实现上述一种血浆微生物物种多样性评估方法。
本申请的第四方面公开了一种计算机可读存储介质,所述介质用于存储程序,所述程序能够被处理器执行以实现上述一种血浆微生物物种多样性评估方法。
下面将通过具体实施例本发明作进一步说明。应当理解,实施例仅是示例性的,并不构成对本发明保护范围的限制。
实施例1
1.使用试剂盒提取待测血浆样本的DNA,并进行超声打断;
2.加入试剂进行末端修复,接头连接,进行纳米球扩增,上机测序,获得测序数据;
3.对测序数据进行质控,并将质控后的测序数据比对到人类基因组,并去掉mapping的reads,以获得非人源序列;
4.对非人源序列的fastq文件进行注释,得到非人源序列的微生物物种及丰度信息;
具体的,Kaiju和kraken的注释结果均包括三列,第一列为是否分类,C表示是,U表示否;第二列表示reads id,第三列表示注释结果,注释结果包括到的物种id;合并Kaiju和kraken的注释结果得到五列信息,第一列为文件名,第二列为微生物丰度,第三列为reads条数,第四列为物种ID,第五列为物种的拉丁文名。其中,合并策略为kraken优先,表示当不同软件注释结果有矛盾时,以kraken的注释结果为准。
5.对合并的注释结果进行质控,然后使用R包的diversity包进行微生物多样性分析,得到待测血浆样本的shanon指数的值为4.95,而健康样本的shanon指数≧4.5,由此可知,待测血浆样本的shanon指数在正常范围内,也即待测血浆样本的微生物物种多样性处于正常水平。
以上应用了具体个例对本申请进行阐述,只是用于帮助理解本申请,并不用以限制本申请。对于本申请所属技术领域的技术人员,依据本申请的思想,还可以做出若干简单推演、变形或替换。

Claims (10)

1.一种血浆微生物物种多样性评估方法,其特征在于,包括:
信息注释及合并步骤:基于kmer方法和蛋白比对方法分别对待测血浆样本的非人源序列进行注释,合并两种方法得到的注释结果,所述注释结果包括微生物物种及其丰度信息;
物种多样性评估步骤:利用注释得到的微生物物种和丰度信息计算微生物物种多样性指数,以此评估待测血浆样本中微生物物种多样性。
2.根据权利要求1所述的血浆微生物物种多样性评估方法,其特征在于,所述信息注释及合并步骤之前还包括非人源序列获取步骤,所述非人源序列获取步骤包括:
获取待测血浆样本的测序数据,对测序数据进行质量控制,过滤接头和低质量碱基,以得到经过质控的测序数据;
以人源序列为参考基因组,将经过质控的测序数据和参考基因组进行比对,去除比对到参考基因组上的序列,以获得非人源序列;
优选的,所述低质量碱基包括低质量碱基序列中质量值小于20的碱基数占序列总碱基数的比值大于80%的reads或者N的占比小于5%的reads。
3.根据权利要求2所述的血浆微生物物种多样性评估方法,其特征在于,所述非人源序列获取步骤之前还包括样本采集和测序步骤,所述样本采集和测序步骤包括:
采集待测血浆样本,提取样本中的核酸,并将核酸中的RNA反转录为cDNA,对提取的DNA和cDNA进行建库和测序,获得待测血浆样本的测序数据。
4.根据权利要求3所述的血浆微生物物种多样性评估方法,其特征在于,所述非人源序列获取步骤之后还包括非人源序列质控步骤,所述非人源序列质控步骤还包括:
判断所述非人源序列的在测序数据中的占比是否在预设范围内;
若非人源序列的在测序数据中的占比不在合预设范围内,则重新进行所述样本采集和测序步骤;
优选的,所述非人源序列的在测序数据中的占比的预设范围为0.001%-1%。
5.根据权利要求4所述的血浆微生物物种多样性评估方法,其特征在于,所述样本采集和测序步骤还包括,在提取的DNA和cDNA中添加非人源的外源参照核酸,获得混合核酸样本,对混合核酸样本进行建库和测序,使得待测血浆样本的测序数据中含有所述外源参照核酸的测序数据;
优选的,所述外源参照核酸为pUC19质粒。
6.根据权利要求5所述的血浆微生物物种多样性评估方法,其特征在于,所述信息注释及合并步骤之后还包括注释结果质控步骤,所述注释结果质控步骤包括第一步质控和第二步质控;
所述第一步质控包括:
判断注释结果是否包含所述对外源参照核酸的注释;
若注释结果不包含所述外源参照核酸的注释结果,则重新进行所述信息注释及合并步骤,或者,重新对所述混合核酸样本进行建库和测序;
若注释结果包含外源参照核酸的注释结果,则第一步质控合格,进行第二步质控;
所述第二步质控包括:
将注释结果包含的微生物按丰度由高到低进行排序,获取丰度排序前预设个数的微生物在人群中的丰度分布,若注释结果中丰度排序前预设个数的任一微生物的丰度大于其在人群中最高丰度的2倍,则存在微生物污染,需要重新进行待测血浆样本采集;
若注释结果中丰度排序前预设个数的微生物的丰度均小于或等于其在人群中最高丰度的2倍,则第二步质控合格,进行后续的物种多样性评估步骤;
优选的,所述预设个数为5个。
7.根据权利要求1所述的血浆微生物物种多样性评估方法,其特征在于,所述微生物物种多样性指数包括Shannon指数、Simpson指数、chao指数中的至少一种。
8.一种血浆微生物物种多样性评估装置,其特征在于,包括:
信息注释及合并模块:用于基于kmer快速匹配方法和蛋白比对方法分别对待测血浆样本的非人源序列进行注释,合并两种方法得到的注释结果,所述注释结果包括微生物物种及其丰度信息;
物种多样性评估模块:用于利用注释得到的微生物物种和丰度信息计算微生物物种多样性指数,以此评估待测血浆样本中微生物物种多样性。
9.一种血浆微生物物种多样性评估装置,所述装置包括:
存储器,用于存储程序;处理器,用于通过执行所述存储器存储的程序以实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,所述介质用于存储程序,所述程序能够被处理器执行以实现如权利要求1-7任一项所述的方法。
CN202110612817.4A 2021-06-02 2021-06-02 一种血浆微生物物种多样性评估方法、装置和存储介质 Active CN113355438B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110612817.4A CN113355438B (zh) 2021-06-02 2021-06-02 一种血浆微生物物种多样性评估方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110612817.4A CN113355438B (zh) 2021-06-02 2021-06-02 一种血浆微生物物种多样性评估方法、装置和存储介质

Publications (2)

Publication Number Publication Date
CN113355438A true CN113355438A (zh) 2021-09-07
CN113355438B CN113355438B (zh) 2022-05-10

Family

ID=77531159

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110612817.4A Active CN113355438B (zh) 2021-06-02 2021-06-02 一种血浆微生物物种多样性评估方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN113355438B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105525033A (zh) * 2014-09-29 2016-04-27 天津华大基因科技有限公司 检测血液中微生物的方法及装置
CN108804875A (zh) * 2018-06-21 2018-11-13 中国科学院北京基因组研究所 一种利用宏基因组数据分析微生物群体功能的方法
CN110349629A (zh) * 2019-06-20 2019-10-18 广州赛哲生物科技股份有限公司 一种利用宏基因组或宏转录组检测微生物的分析方法
CN110349630A (zh) * 2019-06-21 2019-10-18 天津华大医学检验所有限公司 血液宏基因组测序数据的分析方法、装置及其应用
CN110751984A (zh) * 2019-10-31 2020-02-04 广州微远基因科技有限公司 宏基因组或宏转录组测序数据自动化分析方法及系统
CN111161794A (zh) * 2018-12-30 2020-05-15 深圳碳云智能数字生命健康管理有限公司 肠道微生物测序数据处理方法、装置、存储介质及处理器

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105525033A (zh) * 2014-09-29 2016-04-27 天津华大基因科技有限公司 检测血液中微生物的方法及装置
CN108804875A (zh) * 2018-06-21 2018-11-13 中国科学院北京基因组研究所 一种利用宏基因组数据分析微生物群体功能的方法
CN111161794A (zh) * 2018-12-30 2020-05-15 深圳碳云智能数字生命健康管理有限公司 肠道微生物测序数据处理方法、装置、存储介质及处理器
CN110349629A (zh) * 2019-06-20 2019-10-18 广州赛哲生物科技股份有限公司 一种利用宏基因组或宏转录组检测微生物的分析方法
CN110349630A (zh) * 2019-06-21 2019-10-18 天津华大医学检验所有限公司 血液宏基因组测序数据的分析方法、装置及其应用
CN110751984A (zh) * 2019-10-31 2020-02-04 广州微远基因科技有限公司 宏基因组或宏转录组测序数据自动化分析方法及系统

Also Published As

Publication number Publication date
CN113355438B (zh) 2022-05-10

Similar Documents

Publication Publication Date Title
CN110349630B (zh) 血液宏基因组测序数据的分析方法、装置及其应用
CN110349629B (zh) 一种利用宏基因组或宏转录组检测微生物的分析方法
Di Bella et al. High throughput sequencing methods and analysis for microbiome research
EP2926288B1 (en) Accurate and fast mapping of targeted sequencing reads
CN113160882B (zh) 一种基于三代测序的病原微生物宏基因组检测方法
CN111341383B (zh) 一种检测拷贝数变异的方法、装置和存储介质
CN111009286A (zh) 对宿主样本进行微生物分析的方法和装置
CN108319813A (zh) 循环肿瘤dna拷贝数变异的检测方法和装置
CN110875082B (zh) 一种基于靶向扩增测序的微生物检测方法和装置
CN114121160B (zh) 一种检测样本中宏病毒组的方法和系统
CN105986013A (zh) 确定微生物种类的方法和装置
CN107893116A (zh) 用于检测基因突变的引物对组合、试剂盒以及构建文库的方法
JP2016518822A (ja) アセンブルされていない配列情報、確率論的方法、及び形質固有(trait−specific)のデータベースカタログを用いた生物材料の特性解析
CN116403644A (zh) 一种用于癌症风险预测的方法及装置
CN113096737B (zh) 一种用于对病原体类型进行自动分析的方法及系统
CN112331268B (zh) 目标物种特有序列的获取方法及目标物种检测方法
CN113355438B (zh) 一种血浆微生物物种多样性评估方法、装置和存储介质
KR20210040714A (ko) 핵산 서열 분석에서 위양성 변이를 검출하는 방법 및 장치
CN109215736B (zh) 一种肠道病毒组的高通量检测方法及应用
CN113470752A (zh) 一种基于纳米孔测序仪的细菌测序数据鉴定方法
US20210214774A1 (en) Method for the identification of organisms from sequencing data from microbial genome comparisons
Amir Microbiome analysis using 16S amplicon sequencing: from samples to ASVs
CN114107454A (zh) 基于宏基因/宏转录组测序的呼吸道感染病原检测方法
CN211578386U (zh) 一种宏基因组分析装置
CN117524313A (zh) 一种病原体宏基因组测序数据的分析方法、装置及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220317

Address after: 518122 floors 1-2, building 5, No. 14, Zhongxing Road, Kengzi street, Pingshan District, Shenzhen, Guangdong

Applicant after: Shenzhen guiinga Medical Laboratory

Applicant after: Shenzhen Jinjia Technology Co., Ltd

Address before: 518118 4th floor, building 3, the first branch of Zhongcheng Life Science Park, Zhongxing Road, Kengzi street, Pingshan District, Shenzhen City, Guangdong Province

Applicant before: Shenzhen genehome Technology Co.,Ltd.

TA01 Transfer of patent application right
CB02 Change of applicant information

Address after: 518122 floors 1-2, building 5, No. 14, Zhongxing Road, Kengzi street, Pingshan District, Shenzhen, Guangdong

Applicant after: Shenzhen guiinga Medical Laboratory

Applicant after: Shenzhen jiyinga Information Technology Co., Ltd

Address before: 518122 floors 1-2, building 5, No. 14, Zhongxing Road, Kengzi street, Pingshan District, Shenzhen, Guangdong

Applicant before: Shenzhen guiinga Medical Laboratory

Applicant before: Shenzhen Jinjia Technology Co., Ltd

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant