CN113571128A - 一种用于宏基因组学病原体检测参考阈值建立的方法 - Google Patents

一种用于宏基因组学病原体检测参考阈值建立的方法 Download PDF

Info

Publication number
CN113571128A
CN113571128A CN202110895536.4A CN202110895536A CN113571128A CN 113571128 A CN113571128 A CN 113571128A CN 202110895536 A CN202110895536 A CN 202110895536A CN 113571128 A CN113571128 A CN 113571128A
Authority
CN
China
Prior art keywords
detection
negative control
pathogen
sample
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110895536.4A
Other languages
English (en)
Inventor
申奥
吴红龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huada Biotechnology Wuhan Co ltd
BGI Shenzhen Co Ltd
Shenzhen Huada Yinyuan Pharmaceutical Technology Co Ltd
BGI Genomics Co Ltd
Original Assignee
Huada Biotechnology Wuhan Co ltd
BGI Shenzhen Co Ltd
Shenzhen Huada Yinyuan Pharmaceutical Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huada Biotechnology Wuhan Co ltd, BGI Shenzhen Co Ltd, Shenzhen Huada Yinyuan Pharmaceutical Technology Co Ltd filed Critical Huada Biotechnology Wuhan Co ltd
Priority to CN202110895536.4A priority Critical patent/CN113571128A/zh
Publication of CN113571128A publication Critical patent/CN113571128A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Abstract

本发明公开了一种用于宏基因组学病原体检测参考阈值建立的方法。该方法包括:确定临床样本类型;确定其组成成分及人源细胞含量分布范围;设置梯度阴性对照;对阴性对照样本按照待测临床样本即将进行的宏基因组检测流程进行多批次重复测试;统计不同人源细胞浓度的阴性对照样本中不同病原体的检测序列数,得到对应病原体在不同人源细胞浓度的阴性对照样本的检测序列数波动区间;以对应病原体在阴性对照样本中的检测序列数波动区间上限的120%为阈值。本发明能实现样本检测结果分层判别,提高宏基因组学病原检测结果准确性;可提高报告解读效率;可有效减少宏基因组检测结果的假阳性;可实时评估检测流程中的污染,指导实验室流程改进。

Description

一种用于宏基因组学病原体检测参考阈值建立的方法
技术领域
本发明涉及生物技术领域,具体涉及一种用于宏基因组学病原体检测参考阈值建立的方法。
背景技术
随着二代测序成本的降低和检测时效性的缩短,宏基因组学检测技术越来越多的应用到临床致病病原体的检测中,因其具有无偏性,覆盖病原广等优势,可一次性对样本中的全部病原进行检测,并且无需培养,可直接对临床样本进行检测,可有效鉴别混合感染及其他难培养的微生物,对临床感染病原体的检测具有重要意义。但宏基因组学方法在临床推广及使用过程中也遇到一定的瓶颈,包括对于人源细胞含量较高的样本病原体检测敏感性较低的问题;对于宏基因组检出的大量病原体如何解读的问题;对于呼吸道样本检出定植菌和致病菌的甄别等问题,都是困扰临床医生使用本技术的主要问题。
宏基因组学检测原理是对样本中的全部核酸进行检测,其检测结果受诸多因素影响,包括检测样本中的人源细胞含量,病原核酸含量,病原体类型,病原基因组大小,测序数据量大小,检测环境,检测所使用的各种试剂、耗材,病原体数据库,生信比对算法等因素影响。所有的影响因素均会呈现在最终的检测结果中,因此如何在不同影响因素下建立合理的检测阈值,并且对检测结果进行有效的过滤,是宏基因组学结果呈现准确性的重要环节。
发明内容
本发明提供了一种针对宏基因组检测结果进行参考阈值建立的方法,可以辅助临床对宏基因组检测结果进行过滤,减少结果中的干扰信息,为临床提供更加准确的检测结果。
第一方面,本发明要求保护一种用于建立宏基因组学病原体检测参考阈值的方法。
本发明所要求保护的用于建立宏基因组学病原体检测参考阈值的方法,可包括如下步骤:
(1)确定待进行宏基因组学病原体检测的临床样本的类型。
(2)根据所述临床样本的类型确定其组成成分以及人源细胞含量数量级分布范围10n至10n+m个细胞/mL;其中,m和n均为正整数;所述组成成分不包括病原体。
(3)根据步骤(2)确定的所述临床样本的组成成分及人源细胞含量数量级分布范围10n至10n+m个细胞/mL,设置m个阴性对照样本;所述阴性对照样本的组成成分与所述临床样本尽可能保持一致,如能获得阴性临床样本的,最好使用阴性临床样本作为阴性对照样本。
当m=1时,所述阴性对照样本的人源细胞含量为10n个细胞/mL;
当m≥2时,按照人源细胞含量由少到多的顺序,第1个所述阴性对照样本中人源细胞含量为10n个细胞/mL,第2个所述阴性对照样本中人源细胞含量为10n+1个细胞/mL,以此类推,第m个所述阴性对照样本中人源细胞含量为10n+m-1个细胞/mL;其中,所述阴性对照样本和所述临床样本的对应参考关系如下:第1个所述阴性对照样本可作为人源细胞含量数量级为10n至10n+1个细胞/mL的临床样本的参考阴性对照,第2个所述阴性对照样本可作为人源细胞含量为10n+1至10n+2个细胞/mL的临床样本的参考阴性对照,第m个所述阴性对照样本可作为人源细胞含量为10n+m-1至10n+m个细胞/mL的临床样本的参考阴性对照。即,当所述临床样本中人源细胞含量数量级为10n至10n+1个细胞/mL时,选用第1个所述阴性对照样本作为阴性参考;当所述临床样本中人源细胞含量数量级为10n+1至10n+2个细胞/mL时,选用第2个所述阴性对照样本作为阴性参考;以此类推,当所述临床样本中人源细胞含量数量级为10n+m-1至10n+m时,选用第m个所述阴性对照样本作为阴性参考。
(4)对步骤(3)确定好的m个所述阴性对照样本按照待测临床样本即将进行的宏基因组检测流程(包括实验环境、试剂、耗材,生信分析流程等均一致)进行多批次多重复测试。
(5)将相同人源细胞含量下,不同批次,不同重复检测的所述阴性对照样本记为阴性对照样本A,将所述阴性对照样本A中所检测到的不同病原体的检测序列数按照20Mreads的测序数据量进行标准化处理并统计,得到对应病原体在所述阴性对照样本A中的检测序列数波动区间。该步骤可以形成该人源细胞含量下不同病原体的检测序列数波动区间,同时还可以形成人源细胞含量连续变化范围内的不同病原体的检测序列数波动区间。
(6)依据步骤(3)中的所述对应参考关系,找到与所述阴性对照样本A对应人源细胞浓度下的临床样本,记为临床样本A;所述临床样本A进行宏基因组学病原体检测时不同病原体的参考阈值为:步骤(5)中得到的对应病原体在所述阴性对照样本A中的检测序列数波动区间上限的120%。
进一步地,在步骤(2)中,取经步骤(1)确定类型的所述临床样本共N份,N为大于等于30的正整数,可通过商品化的荧光PCR试剂盒对N份所述临床样本中的人源核酸含量分别进行测定,从而确定该类型所述临床样本的人源细胞含量数量级分布范围10n至10n+m个细胞/mL。
进一步地,在步骤(2)中,可通过调研临床相关书籍及文献完成根据所述临床样本的类型确定其组成成分。
进一步地,在步骤(4)中,所述多批次多重复可为:不同人源细胞含量的所述阴性对照样本至少检测3个批次,每批次至少重复检测10次。相应的,步骤(5)中,每种人源细胞含量下汇总的总样本例数不低于30例。
第二方面,本发明要求保护一种宏基因组学病原体检测方法。
本发明所要求保护的宏基因组学病原体检测方法,可包括:
步骤1:按照前文第一方面中所述方法建立对应于不同人源细胞含量数量级的不同临床样本进行宏基因组学病原体检测时不同病原体的参考阈值。
步骤2:对所述待测临床样本进行宏基因组检测,并将所得数据按照20Mreads的测序数据量进行标准化处理,同批次检测中添加某一已知人源细胞含量的所述阴性对照样本作为批内阴性对照。
步骤3:检测所述待测临床样本中的人源细胞含量。
步骤4:将步骤2中同批次的所述阴性对照样本的检测结果与步骤(5)中确定的对应人源细胞含量下的所述阴性对照样本中病原体的检测序列数波动区间进行对比,若检测到的病原体的检测序列数的标准化数据均在对应波动区间内或不超过波动区间上限的120%,则认为本次检测结果中阴性对照在控;若所述阴性对照样本中检测到的病原体的检测序列数的标准化数据超出对应波动区间上限的120%,则认为本次检测阴性对照异常,提示本次实验存在污染,建议重新检测以排查原因。
步骤5:对于步骤2中阴性对照在控的批次,将该批次检测的所述待测临床样本中的病原体的检测序列数的标准化数据与步骤1确定的对应参考阈值进行比较。若所述待测临床样本中检测到的某种病原体的检测序列数的标准化数据超出对应波动区间上限的120%,则认为所述待测临床样本中候选含有该病原体;反之,则认为所述待测临床样本中不含有该病原体。
步骤5可得到病原检测结果列表。然后解读人员可根据患者临床信息及检测结果列表进行解读,最终给出检测报告。
进一步地,在步骤2中,对所述待测临床样本进行宏基因组检测的过程中,还可包括如下步骤:向所述待测临床样本中添加内参序列进行质控。
其中,所述内参序列与病原体核酸序列以及人源核酸序列库均不存在交叉(相互匹配)序列。
进一步地,步骤3中,可通过商品化的荧光PCR试剂盒对所述待测临床样本中的人源核酸含量进行测定,从而确定所述待测临床样本中的人源细胞含量。
或者,步骤3中,可根据所述待测临床样本中所述内参序列的特异检出序列数来换算所述待测临床样本中人源细胞的含量。详细换算方案参照中国发明专利(发明名称:基于内参进行宏基因组病原定量检测的方法和装置,专利公布号:CN111607639A),具体公式如下:
内参特异检出序列数=(内参序列大小×内参浓度×总测序序列数×内参特征系数)/(人基因组大小×人源核酸浓度),其中内参特征系数为一常数。
第三方面,本发明要求保护一种用于进行宏基因组学病原体检测的系统。
本发明要求保护的用于进行宏基因组学病原体检测的系统,可含有:
(A)进行宏基因组学病原体检测所需试剂和/或仪器。
(B)装置,包括数据输入模块、阈值存储模块、数据比较模块以及结论输出模块。
所述数据输入模块被配置为采集按照前文第二方面所述方法检测得到的所述待测临床样本中的病原体的检测序列数按照20Mreads的测序数据量进行标准化后的数据。
所述阈值存储模块被配置为存储按照前文第一方面所述方法建立的对应于不同人源细胞含量数量级的不同临床样本进行宏基因组学病原体检测时不同病原体的参考阈值。
所述数据比较模块被配置为接收来自所述数据输入模块发送的所述待测临床样本中的病原体的检测序列数的标准化数据,调用所述阈值存储模块中存储的相应人源细胞含量数量级对应的临床样本进行宏基因组学病原体检测时不同病原体的参考阈值,然后将所述待测临床样本中的每种病原体的检测序列数的标准化数据与对应病原体的参考阈值进行比较。
所述结论输出模块被配置为接收所述数据比较模块发送的比较结果,然后根据所述比较结果输出结论。
第四方面,本发明要求保护一种计算机可读存储介质。
本发明要求保护的计算机可读存储介质,存储有用于执行下述步骤的计算机程序:
采集按照前文第二方面所述方法检测得到的所述待测临床样本中的病原体的检测序列数按照20Mreads的测序数据量进行标准化后的数据;
将所述待测临床样本中的每种病原体的检测序列数的标准化数据与前文第一方面所述方法建立的对应病原体的参考阈值进行比较;
根据所述比较结果输出结论。
在第三方面和第四方面中,可按照如下输出结论:若所述待测临床样本中的某种病原体的检测序列数的标准化数据高于对应病原体的参考阈值,则认为所述待测临床样本中候选含有该病原体;反之,则认为所述待测临床样本中不含有该病原体。
在本发明的具体实施方式中,所述临床样本具体为脑脊液。所述阴性对照样本具体为额外添加人源细胞的人工脑脊液。所述人工脑脊液为商品化的无菌人工脑脊液,具体为北京酷来搏科技有限公司产品,货号SL6630X-500mL,所述人工脑脊液的主要组成成分包括无机盐,离子以及特定的pH值范围。所述人源细胞为Hela细胞。所述脑脊液样本中人源细胞含量数量级分布范围为103至106cells/mL,因此所述阴性对照样本共设置3个,分别为额外添加103cells/mL、104cells/mL和105cells/mL人源细胞的所述人工脑脊液(其中人源细胞的含量为在所述阴性对照样本中的终含量)。20种实验室常见的污染菌和/或20种脑脊液中常见致病菌在所述阴性对照样本中的检测序列数波动区间详见表1。
本发明提供了一种基于宏基因组病原体检测参考阈值建立的方法,针对病原体的类型、基因组大小等特性进行单独设定,过滤准确性更高;本发明提供的宏基因组检测阈值建立方案,同时可以动态监控宏基因组检测实验室的环境微生物变化,能够更准确地对宏基因组病原检测结果进行校正;本发明通过设置阴性对照的方式对病原体的参考阈值进行建立,并且按照临床样本检测流程进行处理,可以有效排除试剂、耗材、环境及生信比对过程中出现的其他病原微生物对检测结果的干扰;本发明选取的阴性对照包含一组不同人源细胞含量的阴性样本,其人源细胞含量的设置是根据待测样本类型实际的人源细胞含量分布所设置,具有较好的等效性;本发明设置的阴性对照样本与待测样本按照完全相同的流程进行处理,可以最大程度反映真实样本检测中干扰影响。
本发明技术方案带来的有益效果:
1)本发明可以针对不同样本类型、不同人源细胞含量的样本建立对应的宏基因组检测病原体序列的参考阈值,能够实现样本检测结果的分层判别,提高宏基因组学病原检测结果的准确性。
2)本发明提供的方案可以有效减少宏基因组病原检测结果的报告解读周期,提高报告解读效率;通过本发明的技术方案,可进一步应用于自动化解读流程,进一步缩短报告周期。
3)本发明采用阴性对照样本过滤的方式进行参考区间设定,并且按照与临床样本检测完全一致的流程进行处理,可以有效地对宏基因组病原检测过程中的试剂、耗材、环境及生信比对过程中的微生物污染进行过滤,减少宏基因组检测结果中的假阳性。
4)本发明可以对整个检测流程中的污染物质进行动态监测,实时评估检测流程中的污染,指导实验室流程改进。
附图说明
图1为56例脑脊液临床样本人源细胞含量分布统计。
图2为不同人源细胞浓度下模拟阴性脑脊液样本中检出病原体情况。
图3为临床样本检出病原体过滤情况展示。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、用于宏基因组学病原体检测参考阈值的建立方法
本实施例中选取脑脊液样本进行展示,主要流程如下:
1、脑脊液临床样本中人源核酸含量的测定:随机选取了56例脑脊液临床样本(受试者知情并同意),使用江苏宏微特斯医药科技有限公司生产的“人源管家基因DNA定量检测试剂盒(荧光PCR法)”对其中的人源核酸含量进行测定,并换算成人源细胞数进行统计。测定结果显示脑脊液样本中的人源细胞含量集中在103-106cells/mL之间,如图1所示。
2、根据调研得到的脑脊液样本组成成分信息,主要包括人源细胞,无机盐,各种离子等。选取人工脑脊液(北京酷来搏科技有限公司,货号SL6630X-500mL)(包含无机盐、离子及适当的pH值)加Hela细胞的方式作为模拟脑脊液的组成,并且制备细胞浓度分别为103cells/mL,104cells/mL,105cells/mL的模拟脑脊液阴性样本。
3、将上述制备好的模拟脑脊液阴性样本按照脑脊液临床样本的检测流程进行检测,每个浓度进行3批次检测,每批次设置10个重复样本,分别按照MGISEQ-2000平台文库构建及上机操作说明进行上机测序,按照生信分析流程进行数据分析后生成病原检测结果列表。
4、分别统计不同细胞浓度下,30例模拟脑脊液阴性样本中检出的病原体种类及按照20Mreads测序数据量下标准化以后的检测值。统计结果显示:103cells/mL的模拟脑脊液阴性样本中共比对到病原体3892种,包括细菌和真菌;104cells/mL的模拟脑脊液阴性样本中共比对到病原体3581种,包括细菌和真菌;105cells/mL的模拟脑脊液阴性样本中共比对到病原体1706种,包括细菌和真菌。
5、统计每种病原体在不同细胞浓度下的30次检测值,确定其检测值变化范围,详见图2所示。如下表1选取了经过上述统计结果得到的20种实验室常见的污染菌及20种脑脊液中常见致病菌作为代表进行展示。对应检出参考值范围如下。
表1、不同细胞浓度下病原体检测序列波动区间(标准化)
Figure BDA0003197734580000071
Figure BDA0003197734580000081
Figure BDA0003197734580000091
6、选取5例已知临床结果的脑脊液样本及1例细胞浓度为104cells/mL的阴性模拟脑脊液样本进行检测,对上述建立的参考区间的准确性进行验证。按照脑脊液宏基因组学检测流程检测,并生成检测结果列表。同时,对5例样本进行了人源核酸qPCR定量检测,定量结果及临床结果如下表2所示。
表2、5例脑脊液临床样本信息
Figure BDA0003197734580000092
Figure BDA0003197734580000101
7、将阴性对照样本检测结果列表与建立的104cells/mL的病原检测序列数波动区间进行比对过滤,所有病原体的检测值均在设定的参考区间范围内,表明本次检测结果阴性对照合格,可进一步对临床样本检测结果进行分析;
8、在某一人源细胞浓度下,以病原体在相应阴性对照样本中按照20Mreads测序数据量下标准化的检测序列数波动区间上限的120%作为阈值。将5例临床样本的检测结果列表与对应人源细胞含量范围内的病原体序列数波动区间上限的120%(阈值)进行比对过滤,如果某种病原体在临床样本中按照20Mreads测序数据量下的标准化检测序列数超出对应波动区间上限的120%,则认为该临床样本中候选含有该病原体;反之,则认为该临床样本中不含有该病原体,比对结果如图3所示,绝大部分病原体检出序列数均在设定的参考区间内。根据过滤后的结果对5例临床样本中的病原体检出情况进行统计,结果如下表3所示。
表3、5例脑脊液临床样本过滤后结果
Figure BDA0003197734580000102
Figure BDA0003197734580000111
Figure BDA0003197734580000121
注:表中*表示对应菌目前没有中文名,但是是属于隐球菌的,所以用*来表示。
9、将上述过滤结果根据患者临床信息进行进一步解读判断,最终给出检测结果报告。报告结果显示,5例样本与临床诊断结果均一致。
通过本实施例对脑脊液临床样本按照本发明建立的参考区间及阈值进行过滤后(如果某种病原体在临床样本中的标准化检测序列数超出对应病原体参考区间上限的120%,则认为该临床样本中候选含有该病原体;反之,则认为该临床样本中不含有该病原体),最终得到的病原体种类相较过滤前明显减少,对过滤后的病原体检出情况进行解读判断,最终确定的检测结果与临床诊断结果具有很好的一致性,说明本发明对提高宏基因组学病原体检测准确性具有较好的效果。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。

Claims (10)

1.一种用于建立宏基因组学病原体检测参考阈值的方法,包括如下步骤:
(1)确定待进行宏基因组学病原体检测的临床样本的类型;
(2)根据所述临床样本的类型确定其组成成分以及人源细胞含量数量级分布范围10n至10n+m个细胞/mL;其中,m和n均为正整数;
(3)根据步骤(2)确定的所述临床样本的组成成分及人源细胞含量数量级分布范围10n至10n+m个细胞/mL,设置m个阴性对照样本;所述阴性对照样本的组成成分与所述临床样本一致;
当m=1时,所述阴性对照样本的人源细胞含量为10n个细胞/mL;
当m≥2时,按照人源细胞含量由少到多的顺序,第1个所述阴性对照样本中人源细胞含量为10n个细胞/mL,第2个所述阴性对照样本中人源细胞含量为10n+1个细胞/mL,以此类推,第m个所述阴性对照样本中人源细胞含量为10n+m-1个细胞/mL;其中,所述阴性对照样本和所述临床样本的对应参考关系如下:第1个所述阴性对照样本作为对应人源细胞含量数量级为10n至10n+1个细胞/mL的所述临床样本的参考阴性对照,第2个所述阴性对照样本作为对应人源细胞含量为10n+1至10n+2的所述临床样本的参考阴性对照,第m个所述阴性对照样本作为对应人源细胞含量为10n+m-1至10n+m的所述临床样本的参考阴性对照;
(4)对步骤(3)确定好的m个所述阴性对照样本按照待测临床样本即将进行的宏基因组检测流程进行多批次多重复测试;
(5)将相同人源细胞含量下,不同批次,不同重复检测的所述阴性对照样本记为阴性对照样本A,将所述阴性对照样本A中所检测到的不同病原体的检测序列数按照20Mreads的测序数据量进行标准化处理并统计,得到对应病原体在所述阴性对照样本A中的检测序列数波动区间;
(6)依据步骤(3)中的所述对应参考关系,找到与所述阴性对照样本A对应人源细胞浓度下的临床样本,记为临床样本A;所述临床样本A进行宏基因组学病原体检测时不同病原体的参考阈值为:步骤(5)中得到的对应病原体在所述阴性对照样本A中的检测序列数波动区间上限的120%。
2.一种宏基因组学病原体检测方法,包括:
步骤1:按照权利要求1所述方法建立对应于不同人源细胞含量数量级的不同临床样本进行宏基因组学病原体检测时不同病原体的参考阈值;
步骤2:对所述待测临床样本进行宏基因组检测,并将所得数据按照20Mreads测序数据量进行标准化处理,同批次检测中添加某一已知人源细胞含量的所述阴性对照样本作为批内阴性对照;
步骤3:检测所述待测临床样本中的人源细胞含量;
步骤4:将步骤2中同批次的所述阴性对照样本的检测结果与步骤(5)中确定的对应人源细胞含量下的所述阴性对照样本中病原体的检测序列数波动区间进行对比,若检测到的病原体的检测序列数的标准化数据均在对应波动区间内或不超过波动区间上限的120%,则认为本次检测结果中阴性对照在控;若所述阴性对照样本中检测到的病原体的检测序列数的标准化数据超出对应波动区间上限的120%,则认为本次检测阴性对照异常,重新检测;
步骤5:对于步骤2中阴性对照在控的批次,将该批次检测的所述待测临床样本中的病原体的检测序列数的标准化数据与步骤1确定的对应参考阈值进行比较。
3.根据权利要求1或2所述的方法,其特征在于:步骤(2)中,取经步骤(1)确定类型的所述临床样本共N份,N为大于等于30的正整数,通过实时荧光定量PCR法对N份所述临床样本中的人源核酸含量分别进行测定,从而确定该类型所述临床样本的人源细胞含量数量级分布范围10n至10n+m个细胞/mL。
4.根据权利要求1-3中任一所述的方法,其特征在于:步骤(4)中,所述多批次多重复为:不同人源细胞含量的所述阴性对照样本至少检测3个批次,每批次至少重复检测10次。
5.根据权利要求1-4中任一所述的方法,其特征在于:步骤2中,对所述待测临床样本进行宏基因组检测的过程中,还包括如下步骤:向所述待测临床样本中添加内参序列进行质控。
6.根据权利要求1-5中任一所述的方法,其特征在于:步骤3中,通过荧光PCR的方法对所述待测临床样本中的人源核酸含量进行测定,从而确定所述待测临床样本中的人源细胞含量。
7.根据权利要求1-6中任一所述的方法,其特征在于:步骤3中,根据所述待测临床样本中所述内参序列的特异检出序列数来换算所述待测临床样本中人源细胞的含量。
8.一种用于进行宏基因组学病原体检测的系统,含有:
(A)进行宏基因组学病原体检测所需试剂和/或仪器;
(B)装置,包括数据输入模块、阈值存储模块、数据比较模块以及结论输出模块;
所述数据输入模块被配置为采集按照权利要求2-7中任一所述方法检测得到的所述待测临床样本中的病原体的检测序列数按照20Mreads的测序数据量进行标准化后的数据;
所述阈值存储模块被配置为存储按照权利要求1-7中任一所述方法建立的对应于不同人源细胞含量数量级的不同临床样本进行宏基因组学病原体检测时不同病原体的参考阈值;
所述数据比较模块被配置为接收来自所述数据输入模块发送的所述待测临床样本中的病原体的检测序列数的标准化数据,调用所述阈值存储模块中存储的相应人源细胞含量数量级对应的临床样本进行宏基因组学病原体检测时不同病原体的参考阈值,然后将所述待测临床样本中的每种病原体的检测序列数的标准化数据与对应病原体的参考阈值进行比较;
所述结论输出模块被配置为接收所述数据比较模块发送的比较结果,然后根据所述比较结果输出结论。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有用于执行下述步骤的计算机程序:
采集按照权利要求2-7中任一所述方法检测得到的所述待测临床样本中的病原体的检测序列数按照20Mreads的测序数据量进行标准化后的数据;
将所述待测临床样本中的每种病原体的检测序列数的标准化数据与按照权利要求1-7中任一所述方法建立的对应病原体的参考阈值进行比较;
根据所述比较结果输出结论。
10.根据权利要求8所述的系统或权利要求9所述的计算机可读存储介质,其特征在于:按照如下输出结论:若所述待测临床样本中的某种病原体的检测序列数的标准化数据高于对应病原体的参考阈值,则认为所述待测临床样本中候选含有该病原体;反之,则认为所述待测临床样本中不含有该病原体。
CN202110895536.4A 2021-08-05 2021-08-05 一种用于宏基因组学病原体检测参考阈值建立的方法 Pending CN113571128A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110895536.4A CN113571128A (zh) 2021-08-05 2021-08-05 一种用于宏基因组学病原体检测参考阈值建立的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110895536.4A CN113571128A (zh) 2021-08-05 2021-08-05 一种用于宏基因组学病原体检测参考阈值建立的方法

Publications (1)

Publication Number Publication Date
CN113571128A true CN113571128A (zh) 2021-10-29

Family

ID=78170461

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110895536.4A Pending CN113571128A (zh) 2021-08-05 2021-08-05 一种用于宏基因组学病原体检测参考阈值建立的方法

Country Status (1)

Country Link
CN (1) CN113571128A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114317705A (zh) * 2022-03-03 2022-04-12 天津金匙医学科技有限公司 一种采用单标签进行相对定量的mNGS病原检测方法
CN115859174A (zh) * 2023-01-06 2023-03-28 深圳市儿童医院 一种细菌性脑膜炎分类模型构建方法及其在识别脑脊液宏基因组测序假阳性结果中的应用

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120004111A1 (en) * 2007-11-21 2012-01-05 Cosmosid Inc. Direct identification and measurement of relative populations of microorganisms with direct dna sequencing and probabilistic methods
CN110751984A (zh) * 2019-10-31 2020-02-04 广州微远基因科技有限公司 宏基因组或宏转录组测序数据自动化分析方法及系统
CN111009286A (zh) * 2018-10-08 2020-04-14 深圳华大因源医药科技有限公司 对宿主样本进行微生物分析的方法和装置
CN111304300A (zh) * 2019-12-17 2020-06-19 北京金匙基因科技有限公司 一种检测待测样品中各个微生物物种的基因组dna拷贝数的方法
CN111607639A (zh) * 2020-05-08 2020-09-01 深圳华大因源医药科技有限公司 基于内参进行宏基因组病原定量检测的方法和装置
WO2021006523A1 (ko) * 2019-07-08 2021-01-14 주식회사 엠디헬스케어 세균 메타게놈 분석을 통한 뇌종양 진단방법
WO2021013900A1 (fr) * 2019-07-23 2021-01-28 bioMérieux Procédé de détection et de quantification d'une espèce biologique d'intérêt par analyse métagénomique
WO2021013901A1 (fr) * 2019-07-23 2021-01-28 bioMérieux Procédé de détection et de quantification d'une espèce biologique d'intérêt par analyse métagénomique, avec prise en compte d'un calibrateur.
FR3099180A1 (fr) * 2019-07-23 2021-01-29 bioMérieux Procédé de détection et de quantification d'une espèce biologique d'intérêt par analyse métagénomique, comportant l'utilisation d'une espèce de contrôle.

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120004111A1 (en) * 2007-11-21 2012-01-05 Cosmosid Inc. Direct identification and measurement of relative populations of microorganisms with direct dna sequencing and probabilistic methods
US20140136120A1 (en) * 2007-11-21 2014-05-15 Cosmosid Inc. Direct identification and measurement of relative populations of microorganisms with direct dna sequencing and probabilistic methods
CN111009286A (zh) * 2018-10-08 2020-04-14 深圳华大因源医药科技有限公司 对宿主样本进行微生物分析的方法和装置
WO2021006523A1 (ko) * 2019-07-08 2021-01-14 주식회사 엠디헬스케어 세균 메타게놈 분석을 통한 뇌종양 진단방법
WO2021013900A1 (fr) * 2019-07-23 2021-01-28 bioMérieux Procédé de détection et de quantification d'une espèce biologique d'intérêt par analyse métagénomique
WO2021013901A1 (fr) * 2019-07-23 2021-01-28 bioMérieux Procédé de détection et de quantification d'une espèce biologique d'intérêt par analyse métagénomique, avec prise en compte d'un calibrateur.
FR3099180A1 (fr) * 2019-07-23 2021-01-29 bioMérieux Procédé de détection et de quantification d'une espèce biologique d'intérêt par analyse métagénomique, comportant l'utilisation d'une espèce de contrôle.
CN110751984A (zh) * 2019-10-31 2020-02-04 广州微远基因科技有限公司 宏基因组或宏转录组测序数据自动化分析方法及系统
CN111304300A (zh) * 2019-12-17 2020-06-19 北京金匙基因科技有限公司 一种检测待测样品中各个微生物物种的基因组dna拷贝数的方法
CN111607639A (zh) * 2020-05-08 2020-09-01 深圳华大因源医药科技有限公司 基于内参进行宏基因组病原定量检测的方法和装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ARNT EBINGER 等: "A theoretical and generalized approach for the assessment of the sample-specific limit of detection for clinical metagenomics", COMPUTATIONAL AND STRUCTURAL BIOTECHNOLOGY JOURNAL, vol. 19 *
SIYUAN FAN 等: "Metagenomic Next-generation Sequencing of Cerebrospinal Fluid for the Diagnosis of Central Nervous System Infections: A Multicentre Prospective", BIORXIV,HTTPS://DOI.ORG/10.1101/658047 *
STEVE MILLER 等: "Laboratory validation of a clinical metagenomic sequencing assay for pathogen detection in cerebrospinal fluid", GENOME RESEARCH, vol. 29 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114317705A (zh) * 2022-03-03 2022-04-12 天津金匙医学科技有限公司 一种采用单标签进行相对定量的mNGS病原检测方法
CN115859174A (zh) * 2023-01-06 2023-03-28 深圳市儿童医院 一种细菌性脑膜炎分类模型构建方法及其在识别脑脊液宏基因组测序假阳性结果中的应用

Similar Documents

Publication Publication Date Title
Budak et al. Comparison of three automated systems for urine chemistry and sediment analysis in routine laboratory practice
CN113571128A (zh) 一种用于宏基因组学病原体检测参考阈值建立的方法
CN111951895A (zh) 基于宏基因组学的病原分析方法、分析装置、设备及存储介质
CN109266717B (zh) 一种通过单细胞分析检测细菌耐药性的方法和装置
CN108319813A (zh) 循环肿瘤dna拷贝数变异的检测方法和装置
CN111607639A (zh) 基于内参进行宏基因组病原定量检测的方法和装置
Koken et al. Determination of cut-off values for leucocytes and bacteria for urine flow cytometer (UF-100) in urinary tract infections
CN113160882B (zh) 一种基于三代测序的病原微生物宏基因组检测方法
CN114333987A (zh) 一种基于宏基因组测序的预测耐药表型的数据分析方法
Niemelä Uncertainty of quantitative determinations derived by cultivation of microorganisms
Akin et al. Comparison of LabUMat‐with‐UriSed and iQ® 200 fully automatic urine sediment analysers with manual urine analysis
CN110875082A (zh) 一种基于靶向扩增测序的微生物检测方法和装置
CN110277139B (zh) 一种基于互联网的微生物限度检查系统及方法
Diao et al. Assessing the quality of metagenomic next-generation sequencing for pathogen detection in lower respiratory infections
CN110672860B (zh) 五种细胞因子组合作为电离辐射损伤生物标志物
Okada et al. Enumeration of bacterial cell numbers and detection of significant bacteriuria by use of a new flow cytometry-based device
CN107239676B (zh) 一种针对胚胎染色体的序列数据处理装置
CN113470752B (zh) 一种基于纳米孔测序仪的细菌测序数据鉴定方法
PRENCE A practical guide for the validation of genetic tests
CN104178563B (zh) 用于核酸样品的测量方法
Kocer et al. Diagnostic accuracy of a new urinalysis system, DongJiu, for diagnosis of urinary tract infection
CN116884550B (zh) 多平台hpv分型检测结果智能交互校验审核及处置指引系统
CN117935918A (zh) 病原微生物数据分析方法和装置、处理器
CN212955181U (zh) 用于新型冠状病毒核酸检测的数字pcr试剂盒
Risk What do MTs and MLTs do? Exploring the tasks of laboratorians

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination