CN114921530B - 一种基于内参进行血浆微生物游离dna宏基因组定量检测的方法及系统 - Google Patents

一种基于内参进行血浆微生物游离dna宏基因组定量检测的方法及系统 Download PDF

Info

Publication number
CN114921530B
CN114921530B CN202210593922.2A CN202210593922A CN114921530B CN 114921530 B CN114921530 B CN 114921530B CN 202210593922 A CN202210593922 A CN 202210593922A CN 114921530 B CN114921530 B CN 114921530B
Authority
CN
China
Prior art keywords
sequence
internal reference
specific detection
nucleic acid
plasma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210593922.2A
Other languages
English (en)
Other versions
CN114921530A (zh
Inventor
吴文娟
王莉莉
王珺
韩序
王计超
温冬华
田文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Jieyi Biotechnology Co ltd
Shanghai East Hospital Tongji University Affiliated East Hospital
Original Assignee
Hangzhou Jieyi Biotechnology Co ltd
Shanghai East Hospital Tongji University Affiliated East Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Jieyi Biotechnology Co ltd, Shanghai East Hospital Tongji University Affiliated East Hospital filed Critical Hangzhou Jieyi Biotechnology Co ltd
Priority to CN202210593922.2A priority Critical patent/CN114921530B/zh
Publication of CN114921530A publication Critical patent/CN114921530A/zh
Application granted granted Critical
Publication of CN114921530B publication Critical patent/CN114921530B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Epidemiology (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Computation (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种基于内参进行血浆微生物游离DNA宏基因组定量检测的方法,包括:在含有病原核酸序列和人源核酸序列的待测血浆中添加已知含量的内参序列;从添加有内参序列的待测血浆中提取游离DNA,并对所述游离DNA进行文库构建、上机测序及生物信息学分析,得到包含内参特异检出序列、病原特异检出序列及人源特异检出序列的总测序数据;统计出内参特异检出RPM值及病原特异检出RPM值;通过理论模型计算出待测血浆中细菌核酸浓度,提出以每毫升血浆中的微生物特异cfDNA拷贝数作为检测信号值,对病原体的真实载量进行评估。本发明提供了一种实现上述检测方法的系统。本发明具有高效快速、操作简便、高灵敏度、高精密度、高准确性的优点。

Description

一种基于内参进行血浆微生物游离DNA宏基因组定量检测的 方法及系统
技术领域
本发明属于分子生物学技术领域,涉及核酸的检测方法,具体来说是一种基于内参进行血浆微生物游离DNA宏基因组定量检测的方法及系统。
背景技术
宏基因组下一代测序(metagenomic next-generation sequencing,mNGS)可直接对临床标本进行无预先假设、独立于培养的病原体检测,尤其是复杂感染性疾病中少见、新发或不典型的病原体。在过去十年中,基于快速、友好型数据分析工具以及准确、全面数据库的建立,测序仪器的激增及测序成本的指数级下降,使mNGS技术能够跨越从微生物研究到诊断微生物学的鸿沟,推动其在微生物学实验室及预防感染措施的广泛应用。
结合液体活检的无创性及易获得性以及微生物基因组数据库的可用性,基于mNGS的血浆微生物游离DNA(microbial cell-free DNA,mcfDNA)测序在改善疾病的诊断和治疗方面具有前所未有的潜力。1948年,Mandel和Metais第一次报道了来自人体细胞释放到体液中的cfDNA。在不同健康个体中,血浆cfDNA含量差异较大,通常为0-100纳克/毫升,有时超过1500纳克/毫升。在感染性疾病状态下,血浆cfDNA含量明显增加。cfDNA来源于核基因组、线粒体基因组和微生物基因组。其中人类DNA占比超过90%,甚至超过99%,而微生物游离DNA只占一小部分。进一步的研究表明,mcfDNA的半衰期仅几分钟,主要通过肝脏清除,短于nuDNA(10-15分钟)。
血浆中的mcfDNA主要有两种来源:1)微生物菌体进入血液。由于全身系统性感染,血液循环系统中存在微生物,或者局部感染时,微生物可能短暂侵入血液循环系统,导致一过性的菌血症。这些入侵微生物会被宿主免疫系统及抗感染药物杀灭,导致微生物DNA释放到循环中,在核酸外切酶的存在下形成称为mcfDNA的小片段;2)核酸片段进入血液。病原体感染人体细胞,导致人体细胞凋亡,将微生物核酸片段释放到血液循环系统中,或当血液供应丰富的器官发生局部感染时,巨噬细胞发挥免疫作用,吞噬病原体后细胞凋亡,释放微生物核酸片段。
血浆mcfDNA由于其非侵入性和可获得性,已被用作广泛病原体感染的生物标志物。研究证明,血浆mcfDNA测序的灵敏度显著高于血培养。然而,血浆mcfDNA测序的临床应用仍面临着前所未有的挑战。由于人类基因组远大于微生物基因组(比细菌基因组大1000倍),且宿主DNA含量的个体差异较大,检出序列数很难反映病原的真实含量,对于判断检出的可靠性以及监控病原载量较为困难。鉴于目前的湿试验去宿主策略可能导致某些病原核酸漏检,拟寻找更有效的方法以评估病原的真实载量。
发明内容
本发明的目的在于提供一种基于内参进行血浆微生物游离DNA宏基因组定量检测的方法和系统,所述的这种基于内参进行血浆微生物游离DNA宏基因组定量检测的方法和系统要解决现有技术中血浆微生物的检测中检出序列数很难反映病原的真实含量、可能导致某些病原核酸漏检的技术问题。
本发明提供了一种基于内参进行血浆微生物游离DNA宏基因组定量检测的方法,包括如下步骤:
1)在含有病原核酸序列和人源核酸序列的待测血浆中添加已知含量的内参序列;
2)从添加有内参序列的待测血浆中提取游离DNA,并对上述游离DNA进行文库构建、上机测序及生物信息学分析,得到包含内参特异检出序列、病原特异检出序列及人源特异检出序列的总测序数据;
3)从上述测序数据统计出内参特异检出RPM值及病原特异检出RPM值,所述的内参特异检出RPM值为每百万测序序列中匹配到该内标上的序列数,所述的病原特异检出RPM值为每百万测序序列中匹配到某微生物基因组上的序列数;
4)通过如下理论模型计算出待测血浆中细菌核酸浓度,提出以每毫升血浆中的微生物特异cfDNA拷贝数(copies ofmicrobe-specific cfDNA per milliliter ofplasma,CPM)作为检测信号值,对病原体的真实载量进行评估:
非肠杆菌科细菌:Log10(病原特异检出RPM值/内参特异检出RPM值)=1.132(Log10待测病原核酸浓度)-5.910;
肠杆菌科细菌:Log10(病原特异检出RPM值/内参特异检出RPM值)=1.242(Log10待测病原核酸浓度)-6.730。
进一步的,步骤1)中,上述内参序列是人工设计,其序列不属于任何已知的生物核酸序列,且与病原核酸序列和人源核酸序列均不存在交叉序列。
进一步的,所述内参序列是通过随机序列生成器模拟生成随机序列,然后将生成的随机序列与微生物基因组数据库及人源基因组数据库进行比对分析,从而得到未比对到上述微生物基因组数据库及人源基因组数据库的序列。
进一步的,所述内参序列的筛选需要考虑片段长度及GC含量对mNGS灵敏度的影响。
进一步的,所述内参序列的片段长度为150-250bp,最优为188bp;GC含量为45-60%,最优为53.72%。
进一步的,所述内参序列在待测血浆中的含量,是根据内参特异检出RPM值与人源核酸背景的相关性而确定的内标添加量,该添加量保证在不同血浆人源核酸背景下内参序列都能被稳定检出,且不影响病原检出的灵敏度。
进一步的,所述内参序列在待测血浆中的添加量为108-109copies/mL,最优为109copies/mL。
进一步的,所述待测血浆中细菌核酸浓度的理论模型包括非肠杆菌科细菌及肠杆菌科细菌两种。
本发明还提供了实现上述一种基于内参进行血浆微生物游离DNA宏基因组定量检测的生信分析系统,包括:
测序数据分析单元,用于分析待测血浆的全部测序数据,上述待测血浆中含有病原核酸序列和人源核酸序列,且含有已知含量的内参序列,上述测序数据包含内参特异检出序列、病原特异检出序列及人源特异检出序列;
测序数据统计单元,用于从上述测序数据统计出内参特异检出RPM值及病原特异检出RPM值,所述的内参特异检出RPM值为每百万测序序列中匹配到该内标上的序列数,所述的病原特异检出RPM值为每百万测序序列中匹配到某微生物基因组上的序列数;
病原核酸计算单元,通过如下理论模型计算出待测血浆中细菌核酸浓度,提出以CPM作为检测信号值,对病原体的真实载量进行评估:
非肠杆菌科细菌:Log10(病原特异检出RPM值/内参特异检出RPM值)=1.132(Log10待测病原核酸浓度)-5.910;
肠杆菌科细菌:Log10(病原特异检出RPM值/内参特异检出RPM值)=1.242(Log10待测病原核酸浓度)-6.730。
进一步的,所述内参序列是人工设计,其序列不属于任何已知的生物核酸序列,且与病原核酸序列和人源核酸序列均不存在交叉序列。
本发明根据宏基因组下一代测序检测原理,建立了血浆微生物游离DNA宏基因组定量检测的理论模型。通过在宏基因组下一代测序检测中加入已知含量的内参序列,将该内参序列与血浆样本同时进行游离DNA提取、文库构建、上机测序及生物信息学分析,通过结合理论模型与内参序列的检出情况评估待测血浆中微生物游离核酸的真实含量。
本发明建立了基于内参进行血浆微生物游离DNA宏基因组定量检测的理论模型,该模型具有高效快速、操作简便、高灵敏度、高精密度、高准确性等有益效果:
(1)高效快速:相比于传统诊断方法,mNGS从样本接收到报告约24h;
(2)操作简便:无需额外分子生物学检测技术辅助,可直接通过测序数据对血浆样本中的细菌核酸进行计算;
(3)高灵敏度:检出限可达到16CPM,定量限可达到61CPM;
(4)高精密度:批内精密度平均值为7%,批间精密度平均值为13%;
(5)高准确性:通过内参特异检出RPM值及病原特异检出RPM值,计算血浆样本中的细菌真实载量,不受人源背景核酸影响,为血浆微生物游离DNA宏基因组测序提供更真实准确的结果。
附图说明
图1为本发明实施例中基于内参进行血浆微生物游离DNA宏基因组定量检测的研究路线;
图2为本发明实施例中基于内参进行血浆微生物游离DNA宏基因组定量检测的生信分析系统;
图3为本发明实施例1中疑似脓毒症患者的提取后血浆cfDNA浓度分布;
图4为本发明实施例1中相同GC含量、不同片段长度的内参筛选(Spike m1片段长度最短,为52bp;Spike m2为99bp;Spike m3为142bp;Spike m4为204bp;Spike m5片段长度最长,为303bp);
图5为本发明实施例1中相同片段长度、不同GC含量的内参筛选。(A)内标的投入浓度为109copies/mL;(B)内标的投入浓度为108copies/mL。(Spike1 GC含量最低,为34.04%;Spike2为40.82%;Spike3为53.72%;Spike4为63.27%;Spike5 GC含量最高,为72.60%);
图6为本发明实施例3中六种代表性微生物的标定投入浓度和观测浓度之间的相关性;
图7为本发明实施例中5中该定量方法的同属之间抗干扰性测试;
图8为本发明实施例中6中该定量方法的准确性测试。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。在以下的实施方式中,很多细节描述是为了使得本发明能够被更好地理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的。
另外,说明书中所描述的特点、操作或者特征可以以任何适当的方式结合形成各种实施方式。同时,方法描述中各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某个实施例,并不意味这是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
如图1所示,本发明的一个实施例提供一种基于内参进行血浆微生物游离DNA宏基因组定量检测的方法,包括如下步骤:
S01:在含有病原核酸序列和人源核酸序列的待测血浆中添加已知含量的内参序列,上述内参序列是人工设计,其序列不属于任何已知的生物核酸序列,且与病原核酸序列和人源核酸序列均不存在交叉序列;
本发明实施例提供一种用于血浆微生物游离DNA宏基因组定量检测的内参序列,该内参序列是通过随机序列生成器模拟生成随机序列,然后将生成的随机序列与微生物基因组数据库及人源基因组数据库进行比对分析,从而得到未比对到上述微生物基因组数据库及人源基因组数据库的序列。
在本发明的一个实施例中,综合考虑片段长度及GC含量对mNGS灵敏度的影响,从一系列不同片段长度(50bp-300bp)及不同GC含量(34%-74%)的内标中筛选合适的内标序列。最终,得到内参序列的片段长度为188bp,GC含量为53.72%。
在本发明的一个实施例中,由于宏基因组下一代测序可同时对样本中的全部核酸进行检测,包括内参序列、病原序列及人源序列。为保证在不同血浆人源核酸背景下内参序列都能被稳定检出,且不影响病原检出的灵敏度,本发明根据内参特异检出RPM值与人源核酸背景的相关性,确定内标序列最优添加量为109copies/mL。
本发明所述样本类型为血浆。
本发明所述病原体种类为细菌。在本发明的一个实施例中,病原核酸来源于铜绿假单胞菌、肺炎克雷伯菌、鲍曼不动杆菌、金黄色葡萄球菌、屎肠球菌及肺炎链球菌。
S02:从添加有内参序列的待测血浆中提取游离DNA,并对上述游离DNA进行文库构建、上机测序及生物信息学分析,得到包含内参特异检出序列、病原特异检出序列及人源特异检出序列的总测序数据。
本发明所述血浆微生物游离DNA宏基因组测序方法的主要步骤如下:
在待测血浆核酸提取前,将内参序列按照已知含量进行添加,采用相应核酸提取试剂盒及自动核酸提取仪提取1mL待测血浆中的游离DNA。然后,对提取的游离DNA进行文库构建。例如,使用NGSmaster进行PCR-free的全自动文库构建方法,主要步骤包括:末端修复及加A、接头连接及纯化。对制备的文库进行定量、混合后上机,上机测序可以根据IlluminaNextSeq500平台上机操作进行。
S03:从上述测序数据统计出内参特异检出RPM值(每百万测序序列中匹配到该内标上的序列数)及病原特异检出RPM值(每百万测序序列中匹配到某微生物基因组上的序列数)。
本发明中,经过数据质控后得到高质量的数据,按照生信分析流程进行分析。例如,通过Bowtie 2将高质量的测序数据与NCBI核苷酸数据库中的人类参考基因组(hg19)进行比对,以去除人源序列。通过Kraken 2(置信度=0.5)将剩余序列与人工整理的微生物数据库进行比对,以进行快速分类,并使用Bowtie 2对内标序列以及目标检测的微生物序列再次进行比对验证,分别统计出内参特异检出RPM值(每百万测序序列中匹配到该内标上的序列数)及病原特异检出RPM值(每百万测序序列中匹配到某微生物基因组上的序列数)。
S04:通过如下理论模型计算出待测血浆中细菌核酸浓度,提出以CPM作为检测信号值,对病原体的真实载量进行评估:
非肠杆菌科细菌:Log10(病原特异检出RPM值/内参特异检出RPM值)=1.132(Log10待测病原核酸浓度)-5.910;
肠杆菌科细菌:Log10(病原特异检出RPM值/内参特异检出RPM值)=1.242(Log10待测病原核酸浓度)-6.730。
在本发明的一个实施例中,内参特异检出RPM值不受病原核酸浓度的影响。病原特异检出RPM值与病原核酸浓度呈正相关,且病原特异检出RPM值与人源核酸背景呈负相关。因此,通过病原特异检出RPM值/内参特异检出RPM值,可以实现病原定量,且不受人源核酸背景影响。
本发明中,将病原特异检出RPM值/内参特异检出RPM值和病原核酸浓度进行Log10对数转换后,病原特异检出RPM值/内参特异检出RPM值与病原核酸浓度呈线性关系。
需注意的是,由于肠杆菌科序列同源性较高,导致在干试验生信分析环节肠杆菌科鉴定到属的灵敏度降低。因此,本发明中肠杆菌科细菌的理论模型不同于非肠杆菌科细菌。
以下通过实施例详细说明本发明的技术方案和效果,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本实施例综合考虑片段长度及GC含量对mNGS灵敏度的影响,以筛选内参序列。
1.片段长度测试
首先分析ICU疑似脓毒症人群血浆cfDNA浓度及人源cfDNA长度以建立血浆背景。经排除和纳入标准,共收集310例疑似脓毒症人群的血浆。提取1mL血浆cfDNA,发现不同人源的血浆cfDNA浓度范围可达1000倍以上,浓度最低为0.06ng/μL,最高为102ng/μL,中位数为1.14ng/μL。由于疑似脓毒症患者血浆cfDNA浓度呈非正态分布,故使用四分位数法建立低、中、高三种不同人源血浆背景。低宿主(Q1)、中宿主(Q2)、高宿主(Q3)血浆cfDNA浓度分别为0.55ng/μL、1.14ng/μL、2.64ng/μL(图3)。
设计5个GC含量相近、长度在50bp到300bp之间的磷酸化双链DNA片段(表1)。将5个DNA片段合成到质粒pUC57,使用BamHⅠ限制性内切酶对质粒进行快速酶切。向1mL低、中、高人源血浆中投入0.2ng酶切质粒,各3个重复,进行标准mNGS检测。
表1 5个GC含量相近、长度不同的磷酸化双链DNA片段
Figure BDA0003666867830000081
Figure BDA0003666867830000091
在片段长度测试中,相同的片段投入拷贝数下,Spike m1(片段长度为52bp)的特异检出RPM值最低,且检出不稳定,在中人源核酸背景中未检测到该序列。Spike m3(片段长度为142bp)和Spike m4(片段长度为204bp)的检出率较高,且Spike的特异检出RPM值(换算成Log10)与人源核酸背景呈负相关,如图4所示。考虑到病原体片段以200bp左右为优势的单峰分布,结合以上片段长度对mNGS的影响,因此选择200bp左右作为合适的内标片段长度。
2.GC含量测试
设计5个片段长度一定,GC含量在34%-74%之间的磷酸化双链DNA片段(表2)。用Qubit 3.0进行双链DNA浓度(ng/μL)检测,根据公式:(6.02×1023)×(ng/μL×10-9)/(DNAlength×660)=copies/μL,计算双链DNA拷贝数(copies/μL)。向1mL低、中、高血浆中投入109copies的Spike 1-5,低、中、高各3个重复。将Spike 1-5稀释10倍,向1mL低、中、高血浆中投入108copies的Spike 1-5,低、中、高各3个重复,进行标准mNGS检测。
在GC含量测试中,相同的片段投入拷贝数下,Spike 3(GC=53.72%)的特异检出RPM值最高,Spike 1(GC=34.04%)的特异检出RPM值最低,Spike 3的特异检出RPM值与人源核酸背景呈负相关(如图5所示)。与投入浓度为108copies/mL的Spike3相比,当投入浓度为109copies/mL时,Spike3的特异检出RPM值与人源核酸背景的相关性更强(R2=0.9694vs.R2=0.8427),且检出的稳定性更好。因此,Spike3可以作为合适的内标。
表2 5个片段长度相近、GC含量不同的磷酸化双链DNA片段
Figure BDA0003666867830000101
实施例2
本实施例通过模拟样本确定上述定量方法的检出限(Limit ofDetection,LoD)。
在低、中、高人源核酸背景下,对6种代表性微生物的LoD进行评估。将每个代表性细菌酶切的gDNA以名义上相等的拷贝数混合,投入1mL低、中、高阴性血浆中,标定每个病原体投入的最高浓度约为16000CPM,按4倍梯度稀释,共7个梯度。每个微生物的稀释范围从16000CPM到0CPM不等。同时向每管血浆中加入109copies/mL Spike 3。在低、中、高三种人源背景下,每个梯度各3个重复,进行mNGS标准工作流程检测。内标参与从DNA提取到测序的定量mNGS全流程,低、中、高阴性血浆参与每批次运行,样本的平均下机数据量约为13M,病原体检出CPM=CPM病原体-CPM阴性。对每个梯度的三个重复进行Probit回归分析,以建立每个血浆基质中每个参考微生物的LoD,LoD定义为95%的重复均能检测到每个病原体的最低投入浓度(3/3)。
通过Probit回归分析确定低、中、高三种人源血浆基质中六种参考微生物的检出限(见表3)。在中位测序深度数约为13M序列下,对每种人源血浆背景的7个浓度梯度的3个重复进行Probit回归分析来确定LoD。六种细菌在低人源血浆中的最低检出限为14-60CPM,中位数为16CPM(表3)。在高人源血浆背景下,LoD范围增加到18-239CPM,中位数为61CPM。
实施例3
本实施例通过模拟样本确定上述定量方法的定量限(Limit ofQuantitation,LoQ)及线性区间。
NGS文库是向低、中、高人源背景的血浆基质中添加微生物混合物来制备。每个微生物的浓度从16000到0CPM不等。根据mNGS标准工作流程,连续建库三天,即每个梯度有9个重复。内标参与从DNA提取到测序的定量mNGS全流程,低、中、高阴性血浆参与每批次运行,样本的平均下机数据量约为13M,病原体检出CPM=CPM病原体-CPM阴性。本试验的LoQ定义为mcfDNA的最低投入浓度,大于或等于LoD,其精密度对应于变异系数小于50%,同时与较高浓度保持线性关系。从这些模型中产生一个决定系数(R2)来评估投入病原体载量与观测浓度的相关性。建立病原体投入浓度与测得CPM值的线性关系。将病原体投入浓度与测得CPM值进行对数转换,在对数尺度上进行最佳线性拟合。
本次试验测定了三种人源血浆背景下6种参考微生物的定量限(见表3)。在LoQ实验中,利用9个重复(3个批次)测定了不同浓度梯度下的精密度。考虑到变异系数需要低于50%,并且在较高浓度有很强的线性关系,因此在三种人源血浆背景下,六种微生物的LoQ都高于LoD。在三种人源血浆背景下,定义为50%CV的中位LoQ从61到238CPM不等,保持在一个梯度范围内。
线性分析的最佳拟合如下图6所示。在微生物浓度为61CPM(低人源的中位LoQ)-16000CPM(测试的最高浓度)的低、中、高人源血浆基质中都观察到了较强的线性关系。在低、中、高人类背景水平下,R2值分别为0.9714、0.9671、0.9581,且低、中、高人源几乎重合。
表3 6种病原体的检出限及定量限
Figure BDA0003666867830000121
实施例4
本实施例通过模拟样本进行上述定量方法的精密度测试。
精密度样本是在低人源血浆背景下设计的,向每个样本中投入相同浓度的微生物混合物,将其冷冻在-80℃下保存到测试当天。每天解冻12份,共测试5天,按标准工作流程处理,评估批内和批间精密度。
定性重复性定义为检测结果为阳性的样本比例(每种微生物的样本数n=60),可见每种细菌均稳定检出。定量精密度即5个批次的批内和批间精密度,可见所有细菌的批内精密度为5-10%,平均值为7%;批间精密度为7-24%,平均值为13%,见表4。
表4批内和批间精密度
Figure BDA0003666867830000131
实施例5
本实施例通过模拟样本进行上述定量方法的抗干扰性测试。
将抗干扰性测试作为特异性指标之一,表示混合感染期间遗传相似生物体之间的抗干扰能力。向1mL低人源血浆中投入一定量的金黄色葡萄球菌和表皮葡萄球菌,两种细菌间的理论比值为4:1,1:1,1:4,各三个重复。根据标准工作流程,观察两者的CPM值。
遗传相似的金黄色葡萄球菌和表皮葡萄球菌的CPM值与理论投入浓度较为接近,观测比值与理论比值也较为接近(图7)。所以,与单一感染的预期浓度相比,混合感染期间微生物DNA浓度没有显著差异。
实施例6
本实施例通过临床样本进行上述定量方法的准确性测试。
收集定量mNGS为阳性的患者血浆样本24例,病原体浓度尽量涵盖线性范围。全流程检测包括样本处理、建库、上机测序和下机数据分析,最终获得掺入病原体核酸的检出结果CPM值,与数字PCR结果进行比较。将CPM值与测得ddPCR结果进行对数转换,在对数尺度上进行最佳线性拟合。
为了验证该定量试验的准确性,将CPM值与测得ddPCR结果进行对数转换,发现CPM值与ddPCR得到的浓度较为一致,R2为0.8659(图8)。
序列表
<110> 上海市东方医院(同济大学附属东方医院)
杭州杰毅生物技术有限公司
<120> 一种基于内参进行血浆微生物游离DNA宏基因组定量检测的方法及系统
<160> 10
<170> SIPOSequenceListing 1.0
<210> 1
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
tttaggttct gtcgtggtag catgactaaa gagtaaggtt ggaggtgtaa tc 52
<210> 2
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tgtttgacgt ccgcggcgaa acattatatc acttcggtcc taatatttaa ttcactcctc 60
cgttacgcac catcaagttg gccgtagtac ttaaattca 99
<210> 3
<211> 142
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gtggcagttt atgccaactt ttgtactaga catcggtaaa atacgaattt tacgcacaat 60
tttacagtac atttaaccac aggagaacaa cctaaacggc aggagccgca ccggaaaccc 120
agtaggttca tggagagatt gg 142
<210> 4
<211> 204
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
cgtgtaatca taaaaggggc cgaaataatt tagtcgtata atacatttaa aatagtagtc 60
tttcagactt ccctgatgtg ttcatgtttc tttgcctcga ttgcccttgc ggatgcacta 120
agtggaatcc ttgctaaaat aaggcttttg ttgggacctc gataaatcat gtgaacaggg 180
ttccgtttac atggtaacgc tccg 204
<210> 5
<211> 303
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
ttgagtttaa ggtatgtatg cgaatttacc taaatggata agataatgcg acgacaggta 60
tcattctatg cattaaccac aaaattcttt tgaagacctt cataagagcc gataaggttc 120
tcgcctattg cctgaaggta aaactaactt acaaggtcac atcgtcttag tgtaaaccca 180
ggcatttcct gtactaagtt tagtctcgag tctactagtt gcctgctaac ctcacatggc 240
gcggtagtct tgccgtcctc tatagtctct gagctcctct gcgctgaaat taggtcaact 300
gac 303
<210> 6
<211> 188
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ttgagaaaac ccctttcttg tcaaaaaaga cttcagcgta tatctcattt tgagaatttt 60
tccaactcag atcagacgtc gtaaaaattt tatttgcgaa ttcgtacctt tcgcttaaaa 120
agccgtaaaa tatacgtcag gtcatacaat tgaccctaca tattattagc gtttaggatc 180
cctataaa 188
<210> 7
<211> 195
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
taatatacac tgtgtaagca aaagcgaata aatgtatacc ggtacattca gacactaatt 60
aggcagcggt tacttatctc tgaacttctg gcaatcagcc ctaagactac cgttaaagaa 120
tttgtaaagc gccgcttgcc tgtctaaacg tttgtttaaa caagcactga cgtcttacgg 180
caatgctata cccgt 195
<210> 8
<211> 188
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ccacatgttt ctgacttgaa agtttcgggg gctagggttt tcacaccaac tgccggagta 60
agcaagtcgg tataacgcag agggttgcaa agctcccctc ggagagatag gaggcagcaa 120
tgaaggaaac tccacgagcc cattctgggt atgtggtgtc tcgcttgata gtaccacccc 180
gcgacgac 188
<210> 9
<211> 196
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
ggagggtgtg gttgtagctg ggcggagggg acacggagta gtcgtgccgt tgatcgtaat 60
aggtcagggg acttacttac gataggtggg ccgccggagg gtggagtggc ggatcccgac 120
ctgaaaggac ggtccgacgt agctaccgat cccgggatcg agggcgaggc taccagtacc 180
gcttggccgt aaccgc 196
<210> 10
<211> 197
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
cggctagtct gacgcgtagt ggccgcgcct gcagccgcca caggtcatgt acccctcgcg 60
cgctctcact ccgcctgcgg gtctccggga cctgctaaac cgggcgcgct cctagctgta 120
gtccgtcccg ccagggaccg gcggcgcgcc tccggaggta cgctgccggt actcggcgtc 180
acggcgccgg agcgggg 197

Claims (1)

1.一种基于内参进行血浆微生物游离DNA宏基因组定量检测的生信分析系统,其特征在于包括:
测序数据分析单元,用于分析待测血浆的全部测序数据,上述待测血浆中含有病原核酸序列和人源核酸序列,且含有已知含量的内参序列,所述的内参序列如SEQ ID No.8所示,所述内参序列在待测血浆中的添加量为109 copies/mL;
上述测序数据包含内参特异检出序列、病原特异检出序列及人源特异检出序列;
测序数据统计单元,用于从上述测序数据统计出内参特异检出RPM值及病原特异检出RPM值,所述的内参特异检出RPM值为每百万测序序列中匹配到该内标上的序列数,所述的病原特异检出RPM值为每百万测序序列中匹配到某微生物基因组上的序列数;
病原核酸计算单元,通过如下理论模型计算出待测血浆中细菌核酸浓度,提出以CPM作为检测信号值,对病原体的真实载量进行评估:
非肠杆菌科细菌:Log10(病原特异检出RPM值/内参特异检出RPM值)=1.132(Log10待测病原核酸浓度)- 5.910;
肠杆菌科细菌:Log10(病原特异检出RPM值/内参特异检出RPM值)=1.242(Log10待测病原核酸浓度)- 6.730。
CN202210593922.2A 2022-05-27 2022-05-27 一种基于内参进行血浆微生物游离dna宏基因组定量检测的方法及系统 Active CN114921530B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210593922.2A CN114921530B (zh) 2022-05-27 2022-05-27 一种基于内参进行血浆微生物游离dna宏基因组定量检测的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210593922.2A CN114921530B (zh) 2022-05-27 2022-05-27 一种基于内参进行血浆微生物游离dna宏基因组定量检测的方法及系统

Publications (2)

Publication Number Publication Date
CN114921530A CN114921530A (zh) 2022-08-19
CN114921530B true CN114921530B (zh) 2023-03-14

Family

ID=82811070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210593922.2A Active CN114921530B (zh) 2022-05-27 2022-05-27 一种基于内参进行血浆微生物游离dna宏基因组定量检测的方法及系统

Country Status (1)

Country Link
CN (1) CN114921530B (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111394486A (zh) * 2020-04-09 2020-07-10 复旦大学附属儿科医院 基于宏基因组测序的儿童感染性疾病病原检测及鉴定方法
CN111607639A (zh) * 2020-05-08 2020-09-01 深圳华大因源医药科技有限公司 基于内参进行宏基因组病原定量检测的方法和装置

Also Published As

Publication number Publication date
CN114921530A (zh) 2022-08-19

Similar Documents

Publication Publication Date Title
Yeri et al. Evaluation of commercially available small RNASeq library preparation kits using low input RNA
CN111607639A (zh) 基于内参进行宏基因组病原定量检测的方法和装置
CN114898808B (zh) 一种预测肺炎克雷伯菌对头孢吡肟敏感性的方法及系统
CN105316418B (zh) 用于检测肉制品中鸭源性成分的特异性引物、探针、试剂盒及其检测方法
Szóstak et al. The standardisation of the approach to metagenomic human gut analysis: from sample collection to microbiome profiling
CN108753974B (zh) 一种结直肠癌肿瘤标志物及其检测方法与装置
Gustafson et al. DNA-based detection for onychomycosis correlates better to histopathology than does fungal culture
Yuan et al. A signal cascade amplification strategy based on RT-PCR triggering of a G-quadruplex DNAzyme for a novel electrochemical detection of viable Cronobacter sakazakii
CN111816256A (zh) 核酸样本检测方法及装置、存储介质及电子设备
Rassoulian Barrett et al. Sensitive identification of bacterial DNA in clinical specimens by broad-range 16S rRNA gene enrichment
Mordant et al. Evaluation of sample preservation and storage methods for metaproteomics analysis of intestinal microbiomes
Talebi et al. Fusion transcript discovery using RNA sequencing in formalin-fixed paraffin-embedded specimen
Xu et al. Improved accuracy of etiological diagnosis of spinal infection by metagenomic next-generation sequencing
CN114196743A (zh) 一种病原微生物快速检测方法及其试剂盒
CN113265452A (zh) 一种基于Nanopore宏基因组RNA-seq的生物信息学检测病原体的方法
CN114921530B (zh) 一种基于内参进行血浆微生物游离dna宏基因组定量检测的方法及系统
Yoon et al. Magnetic bead-based nucleic acid purification kit: Clinical application and performance evaluation in stool specimens
Li et al. Diagnostic Value of Metagenomic Next‐Generation Sequencing for Pneumonia in Immunocompromised Patients
CN113249441B (zh) 用于血流感染病原微生物检测的参考品及其制备方法
CN115188411A (zh) 一种基于单分子自适应采样测序的病原微生物和耐药基因的检测方法及系统
CN115786582A (zh) 结合CRISPR/Cas12a与RPA检测猴痘病毒方法、试剂盒及其制备方法
CN115011695A (zh) 基于游离环状dna基因的多癌种识别标志物、试剂盒及应用
CN114480682A (zh) 一种检测结核分枝杆菌的组合物、试剂盒及其应用
Chen et al. Rapid metagenomic identification of two major swine pathogens with real-time Nanopore sequencing
Hewitt et al. Toward rapid sequenced-based detection and characterization of causative agents of bacteremia

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant