CN114891870A - 一种基于mNGS检测致癌病原体的方法、系统及装置 - Google Patents

一种基于mNGS检测致癌病原体的方法、系统及装置 Download PDF

Info

Publication number
CN114891870A
CN114891870A CN202210732106.5A CN202210732106A CN114891870A CN 114891870 A CN114891870 A CN 114891870A CN 202210732106 A CN202210732106 A CN 202210732106A CN 114891870 A CN114891870 A CN 114891870A
Authority
CN
China
Prior art keywords
sample
rpm
sequencing
cancer
reads
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210732106.5A
Other languages
English (en)
Inventor
童云广
唐剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Aoming Medical Laboratory Co ltd
Original Assignee
Hangzhou Aoming Medical Laboratory Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Aoming Medical Laboratory Co ltd filed Critical Hangzhou Aoming Medical Laboratory Co ltd
Priority to CN202210732106.5A priority Critical patent/CN114891870A/zh
Publication of CN114891870A publication Critical patent/CN114891870A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/702Specific hybridization probes for retroviruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/705Specific hybridization probes for herpetoviridae, e.g. herpes simplex, varicella zoster
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/706Specific hybridization probes for hepatitis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/708Specific hybridization probes for papilloma
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/185Escherichia
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/22Klebsiella
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/38Pseudomonas
    • C12R2001/385Pseudomonas aeruginosa
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/42Salmonella
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/44Staphylococcus
    • C12R2001/445Staphylococcus aureus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/46Streptococcus ; Enterococcus; Lactococcus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/72Candida
    • C12R2001/725Candida albicans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/90Protozoa ; Processes using protozoa
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Virology (AREA)
  • Botany (AREA)
  • Mycology (AREA)
  • Communicable Diseases (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种基于mNGS检测致癌病原体的方法、系统及装置。本发明通过使用合理的过滤指标,结合健康受试者样本和阴性对照样本的临床背景设置,及病原体感染致癌依据的判断标准配置,通过对mNGS检测数据的分析,实现了癌症患者致癌病原体准确地判断。本发明对癌症患者对的致癌病原体检出率高达100%,特异性为100%,不仅可以避免癌症患者反复筛查和盲目用药,而且可以显著降低不必要的临床费用,为癌症患者和社会带来临床检测效益。

Description

一种基于mNGS检测致癌病原体的方法、系统及装置
技术领域
本发明涉及基因检测技术领域,尤其涉及到一种基于mNGS检测病原体感染是否为致癌因素的方法、系统及装置。
背景技术
世界卫生组织国际癌症研究所的调查研究结果表明在2018年,全球有13%的新发癌症病例是由传染性病原体感染引起的,而1/3的此类癌症患者为中国人。病原学鉴定是感染所致癌症针对性治疗中最重要的环节。目前,病原体鉴定的方法一般有培养分离、形态学检测、生化检测、免疫学检测以及PCR检测等。但是因为这些方法主要是对一种或几种病原体的目标性鉴别,所以在一定程度上存在漏检病原体的可能性。
mNGS是一种宏基因组二代测序技术,其具有覆盖广的优点,可以通过样本中的核酸进行高通量测序,结合数据库的核酸序列信息比对,实现对绝大部分病原体的鉴别。目前已有公司分别采用微生物丰度指标, RPM-样本/RPM-水的比例识别和RPM-微生物比例来识别可能的致病病原体。但是由于肿瘤微环境的复杂性,上述这些方法不仅对于人源比例不同的样本会产生假阴性结果,而且不能很好地识别感染所致癌症的病原体,严重影响了病原体感染所致癌症患者的治疗质量和生活质量。
因此,非常必要建立一种基于mNGS检测病原体感染是否为患者癌症致癌因素的方法、系统及装置,从而可以为临床治疗病原体感染相关癌症的治疗提供有效辅助用药建议,实现对症治疗和改善病原体感染致癌患者治疗效果的目的。本发明提供了一种基于mNGS检测致癌病原体的方法、系统及装置,结合使用合理的过滤指标,健康受试者样本和阴性对照样本的临床背景设置,及病原体感染致癌依据的判断标准配置,实现了癌症患者致癌病原体准确地检出,克服了现有技术的不足。
发明内容
定义:为了让本发明更容易理解,特此定义某些术语。除非另有规定,本发明中所用的所有技术和术语与本发明所属技术领域的技术人员通常理解的含义相同。除非特别说明,本发明应用和涵盖的技术是本发明所属技术领域的技术人员熟知的标准方法。所述材料、方法和实施例仅用作说明目的,而不以任何方式限制本发明的保护范围。
如本发明所述,术语“样本”一般是指包括核苷酸或包含至少一个核苷酸序列的混合物的生物体液、细胞、组织、器官,或生物体中用于测序或定相的样本,或用于测序或定相的来自非生物(如环境)的样本。本发明所述样本包括但不限于痰/口腔液、羊水、血液、血液的部分、细针活检样本(如外科活检、细针穿刺活检等)、尿液、腹膜液、胸膜液、组织外植体、器官或组织培养或细胞制剂,或其部分或从中分离的内容。所述来自生物体的样本通常取自人类受试者(如患者),但亦可从任意具有染色体的生物体中采集,包括但不限于狗、猫、马、山羊、绵羊、牛、猪等。从生物来源或预处理后改变其特征而获得的样本同样可以直接使用,如从血液制备血浆,稀释粘稠液体等。预处理方法还可包括但不限于过滤、沉淀、稀释、蒸馏、混合、离心、冷冻、冻干、浓缩、扩增、核酸片段化、干扰组分的灭活、试剂的添加、裂解等。
在一些实施例中,本发明所述健康受试者或阴性对照的临床样本选自以下组中的一个或多个:血液、淋巴液、间隙液、脑脊液、肺泡灌洗液、支气管灌洗液、痰液、胸腹水、尿液、唾液、粪便或其他组织或体液样本,或实验室环境样本等。
在一些实施例中,本发明所述每种类型的健康受试者或临床阴性对照的样本不少于100例,优选不少于200例。
如本发明所述,术语“宏基因组”,意指“群落基因组”,即特定小生境中所有微小生物遗传物质之和。
如本发明所述,术语“测序”是指鉴别一个或多个核苷酸中G、A、T、C或U的组成情况。
如本发明所述,术语“第二代测序”是指包括,如通过合成技术测序、焦磷酸测序、离子半导体技术、单分子实时测序和连接法测序等方法。在第二代测序过程中,每次读长的大小根据所采用的具体测序方法而有所改变,其长度范围为30bp左右到15 ,000bp左右。譬如,如连接法测序的核酸读长为50bp左右;离子半导体技术测序的核酸读长为400bp左右,焦磷酸测序的核酸读长为700bp左右;单分子实时测序的核酸读长在10 ,000bp至15 ,000bp之间。
在一些实施例中,本发明所述测序通过Illumina测序平台进行。在一些实施例中,本发明所述测序通过Life测序平台进行。
在一些实施例中,本发明所述测序测序平台的总数据量为15M。在一些实施例中,本发明所述测序测序平台的总数据量为17M。在一些实施例中,本发明所述测序测序平台的总数据量为20M。在一些实施例中,本发明所述测序测序平台的总数据量为23M。在一些实施例中,本发明所述测序测序平台的总数据量为25M。在一些实施例中,本发明所述测序测序平台的总数据量为30M。在一些实施例中,本发明所述测序测序平台的总数据量为50M。在一些实施例中,本发明所述测序测序平台的总数据量为100M。在一些实施例中,本发明所述测序测序平台的总数据量为150M。在一些实施例中,本发明所述测序测序平台的总数据量为300M。在一些实施例中,本发明所述测序测序平台的总数据量为500M。在一些实施例中,本发明所述测序测序平台的总数据量为1000M。在一些实施例中,本发明所述测序测序平台的总数据量为至少1050M。
如本发明所述,样本核酸的测序方法使用“单端测序”或“双端测序”方法。
如本发明所述,术语“单端测序”是指通过“单端读取”的方式从核苷酸一端读取向另一端进行基因组片段的测序,从而来确定核苷酸序列的方法。在单端测序过程中,片段两端之一的n个碱基为一个读段,其中n是测序循环数。与此同时,单端读取为第二代测序和其他大规模平行测序技术过程中的常规技术手段,可通过配置有执行单端测序功能的仪器(如:Illumina的Hiseq 2500)来实现。
单端读取的标称、平均、均值或绝对长度的范围为20个连续核苷酸-300个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为22个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为25个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为28个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为32个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为38个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为42个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为46个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为50个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为55个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为60个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为65个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为70个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为75个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为80个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为85个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为95个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为105个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为115个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为125个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为135个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为145个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为155个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为165个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为175个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为185个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为195个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为205个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为215个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为225个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为235个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为245个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为255个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为265个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为275个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为285个连续核苷酸。在一些实施例中,本发明所述单端读取的标称、平均、均值或绝对长度为295个连续核苷酸。
如本发明所述,术语“双端测序”是指通过从核酸片段一端到另一端读取指定读长的正向序列,然后从片段的另一侧进行反向序列读取,并将数据配对为相邻序列的测序方法。
如本发明所述,术语“读长”是指描述核苷酸样本或参考片段连续碱基对的序列。读长可以从测序装置直接获得,或者间接地从关于样本已存储的序列信息获得。在一些实施例中,本发明所述核酸序列读长长度为25-100bp。在一些实施例中,本发明所述核酸序列读长长度为30-100bp。在一些实施例中,本发明所述核酸序列读长长度为50-200bp。在一些实施例中,本发明所述核酸序列读长长度为50-400bp。
在一些实施例中,本发明所述测序方法为SE50。在一些实施例中,本发明所述测序方法为SE75。在一些实施例中,本发明所述测序方法为SE100。在一些实施例中,本发明所述测序方法为SE150。在一些实施例中,本发明所述测序方法为SE200。在一些实施例中,本发明所述测序方法为PE50。在一些实施例中,本发明所述测序方法为PE100。在一些实施例中,本发明所述测序方法为PE150。在一些实施例中,本发明所述测序方法为PE200。
如本发明所述,术语“覆盖度”为选定物种基因组覆盖1×以上的区域加和占基因组大小L的比例,由于同一个物种可能存在多个基因组版本,计算时以最长基因组(Lmax )计算,覆盖的位置按各个基因组的实际比对位置(Pi )计算,对于多基因组物种,得到的覆盖度C为估算值,即Capprox =∑Pi/Lmax。
如本发明所述,术语“离散度”为物种支持的序列数能覆盖到的参考基因组窗口数(n)占总窗口(N)的比 例,即D=n/N。其中,D的取值范围为[0,1],越接近1表明覆盖越均匀,离散度好可信度高。
如本发明所述,用语“K-mer算法”是指按照一定长以及间隔切分字符串,依照K-mer的方式对待比对基因数据进行分割,然后对分割的多个基因片段数据进行比对分析。
如本发明所述,用语“计算机程序产品”是指上载有用于执行本发明计算机可读程序指令的计算机可读存储介质。
如本发明所述,用语“计算机可读存储介质”是指可以保持和存储由指令执行设备使用的指令的有形设备。所述计算机可读存储介质,可包括但不限于:电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述任意合适的组合。
在一些实施例中,本发明所述计算机可读存储介质为便携式计算机盘。在一些实施例中,本发明所述计算机可读存储介质为硬盘。在一些实施例中,本发明所述计算机可读存储介质为随机存取存储器(RAM)。在一些实施例中,本发明所述计算机可读存储介质为只读存储器(ROM)。在一些实施例中,本发明所述计算机可读存储介质为可擦式可编程只读存储器(EPROM或闪存)。在一些实施例中,本发明所述计算机可读存储介质为静态随机存取存储器(SRAM)。在一些实施例中,本发明所述计算机可读存储介质为便携式压缩盘只读存储器(CD-ROM)。在一些实施例中,本发明所述计算机可读存储介质为数字多功能盘(DVD)。在一些实施例中,本发明所述计算机可读存储介质为记忆棒。在一些实施例中,本发明所述计算机可读存储介质为软盘。在一些实施例中,本发明所述计算机可读存储介质为机械编码设备。在一些实施例中,本发明所述计算机可读存储介质为存储有指令的打孔卡或凹槽内凸起结构。在一些实施例中,本发明所述计算机可读存储介质为上述实施例中所述计算机可读存储介质之间任意合适的组合。
进一步地,本发明所述计算机可读存储介质区别于无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(如通过光纤电缆的光脉冲)或通过电线传输的电信号的瞬时信号本身。
如本发明所述,各个计算/处理设备、外部计算机或外部存储设备可以从计算机可读存储介质计算机或通过网络(如因特网、局域网、广域网和/或无线网) 下载本发明所述可读程序指令。
进一步地,本发明所述网络包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。
进一步地,本发明所述计算机可程序指令可通过每个计算/处理设备中的网络适配卡或者网络接口从网络接收并转发,并可存储在各个计算/处理设备中的计算机可读存储介质中。
进一步地,本发明所述计算机可程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意合编写的源代码或目标代码。
更进一步地,本发明所述编程语言包括面向对象的编程语言,如Python、Smalltalk、C++等,以及常规的过程式编程语言,如C语言或类似的编程语言。
进一步地,本发明所述计算机可读程序指令是指可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行或完全在远程计算机或服务器上执行。
更进一步地,本发明所述远程计算机是指可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(如利用因特网服务提供商来通过因特网连接)。
进一步地,本发明所述可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)可以通过本发明所述计算机可读程序指令的状态信息来进行个性化定制,从而实现本发明的各个方面。
进一步地,本发明所述计算机可读程序指令可以通过通用计算机、专用计算机或其它可编程数据处理装置的处理单元执行时,构建能实现流程图中的一个或多个方框中规定的功能/动作的装置。
进一步地,本发明所述计算机可读程序指令可以存储在计算机可读存储介质中,从而使存储有指令的计算机可读介质成为一个制造品。所述制造品可以通过这些指令使计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而实现流程图中的一个或多个方框中规定的功能/动作的各个方面的指令。
为了解决上述技术问题,第一方面,本发明提供了一种基于mNGS检测致癌病原体的分析方法,所述方法包括如下步骤:第一步,对疑似病原体感染所致癌症的样本和健康受试者样本进行核酸提取,并建库,与临床阴性对照样本一块测序,获取mNGS测序数据;第二步,对第一步中获得的样本mNGS测序数据进行过滤、去重和去除人源序列;第三步,对第二步中所筛选的样本测序片段结合病原微生物(包括病毒、细菌、真菌、寄生虫)序列数据库进行比对分析;第四步,根据第三步样本中所检测到的各个病原微生物特异序列数和总微生物序列数计算每百万总微生物测序数据量中各个病原微生物特异序列数的所占比例(RPM),并分别计算各个病原微生物的RPM-癌症样本,RPM-健康受试者样本与RPM-临床阴性对照样本的比例值,统计健康受试者样本和临床阴性对照样本背景库中每百万总微生物测序数据量中各个病原微生物特异序列数的所占比例(RPM)分布的最大值、最小值、中位数、平均数、标准差等相关指标;当健康受试者样本和临床阴性对照样本中病原微生物特异序列数为0时,则两者的RPM=1;第五步,计算各个病原微生物的RPM-癌症样本与RPM-健康受试者样本之间的比例值,结合ROC分析确定通过将足够例数临床阴性对照样本和健康受试者样本中掺入接近检测限浓度不同病原微生物所制备的模拟阳性样本进行mNGS检测后获得的RPM比例阳性判断值,结合病原体指标置信分析,对样本中的每个物种的病原微生物进行判断。当RPM-癌症样本与RPM-健康受试者样本之间的比例值大于阳性判断值,显著差异性分析P≤0.01且病原体指标置信度大于等于95%的为阳性,即所确定的病原微生物感染为致癌的主要因素;当RPM-癌症样本与RPM-健康样本之间的比例值设置相应的判断值为大于阳性判断值,显著差异性分析P≤0.01但病原体指标置信度小于95%的为弱阳性,即所确定的病原微生物感染为致癌的次要因素;当RPM-癌症样本与RPM-健康样本之间的比例值小于阳性判断值为阴性,即所确定的病原微生物感染与致癌无关。所述病原体指标,包括但不限于如病原微生物特异序列数、属内丰度、种丰度、覆盖度、离散度、毒力因子等。
在第二方面,本发明还提供了可用于致癌病原体mNGS检测的分析系统,所述分析系统包括以下模块:数据模块,质控模块,比对模块,计算模块和判断模块;
进一步地,所述数据模块为提取疑似病原体感染所致癌症的样本,健康受试者样本的核酸,建库,与临床阴性对照样本一块测序,获取mNGS测序数据的模块;
进一步地,所述质控模块为对数据模块中获得的样本mNGS测序数据进行过滤、去重和去除人源序列的模块;
进一步地,所述比对模块为对质控模块中所筛选的样本测序片段结合病原微生物(包括病毒、细菌、真菌、寄生虫)序列数据库进行比对分析;
进一步地,所述计算模块为根据比对模块中所检测到样本中的各个病原微生物特异序列数和总微生物序列数计算每百万总微生物测序数据量中各个病原微生物特异序列数的所占比例(RPM),并进一步计算各个病原微生物的RPM-癌症样本,RPM-健康受试者样本与RPM-临床阴性对照样本的比例值,统计健康受试者样本和临床阴性对照样本背景库中每百万总微生物测序数据量中各个病原微生物特异序列数的所占比例(RPM)分布的最大值、最小值、中位数、平均数、标准差等相关指标;当健康受试者样本和临床阴性对照样本中病原微生物特异序列数为0时,则两者的RPM=1;
进一步地,所述判断模块为计算模块中各个病原微生物的RPM-癌症样本与RPM-健康受试者样本之间的比例值,结合ROC分析确定通过将足够例数临床阴性对照样本和健康受试者样本中掺入接近检测限浓度不同病原病原微生物所制备的模拟阳性样本进行mNGS检测后获得的RPM比例阳性判断值,结合病原体指标置信分析,对样本中的每个物种的病原微生物进行判断。当RPM-癌症样本与RPM-健康受试者样本之间的比例值大于阳性判断值,显著差异性分析P≤0.01且病原体指标置信度大于等于95%的为阳性,即所确定的病原微生物感染为致癌的主要因素;当RPM-癌症样本与RPM-健康样本之间的比例值设置相应的判断值为大于阳性判断值,显著差异性分析P≤0.01但病原体指标置信度小于95%的为弱阳性,即所确定的病原微生物感染为致癌的次要因素;当RPM-癌症样本与RPM-健康样本之间的比例值小于阳性判断值为阴性,即所确定的病原微生物感染与致癌无关。所述病原体指标,包括但不限于如病原微生物特异序列数、属内丰度、种丰度、覆盖度、离散度、毒力因子等;
优选地,所述判断模块中,RPM-癌症样本与RPM-健康受试者样本之间的比例值设置相应的阳性判断值为大于1的自然数,显著差异性分析P≤0.01且病原体指标置信度大于等于95%的为阳性,即所确定病原微生物的感染为致癌的主要因素;RPM-癌症样本与RPM-健康受试者样本之间的比例值设置相应的判断值为大于1的自然数,显著差异性分析P≤0.01但病原体指标置信度小于95%,则为弱阳性,即为所确定病原微生物的感染为致癌的次要因素;RPM-癌症样本与RPM-健康受试者样本之间的比例值设置相应的判断值为小于或等于1的自然数为阴性,即为所确定病原微生物的感染为非致癌因素;
在一些实施例中,本发明所述测序通过Illumina测序平台进行。在一些实施例中,本发明所述测序通过Life测序平台进行。在一些实施例中,本发明所述测序方法为SE50。在一些实施例中,本发明所述测序方法为SE75。在一些实施例中,本发明所述测序方法为SE100。在一些实施例中,本发明所述测序方法为SE150。在一些实施例中,本发明所述测序方法为SE200。在一些实施例中,本发明所述测序方法为PE50。在一些实施例中,本发明所述测序方法为PE100。在一些实施例中,本发明所述测序方法为PE150。在一些实施例中,本发明所述测序方法为PE200;
在一些实施例中,本发明所述测序测序平台的总数据量为15M。在一些实施例中,本发明所述测序测序平台的总数据量为17M。在一些实施例中,本发明所述测序测序平台的总数据量为20M。在一些实施例中,本发明所述测序测序平台的总数据量为23M。在一些实施例中,本发明所述测序测序平台的总数据量为25M。在一些实施例中,本发明所述测序测序平台的总数据量为30M。在一些实施例中,本发明所述测序测序平台的总数据量为50M。在一些实施例中,本发明所述测序测序平台的总数据量为100M。在一些实施例中,本发明所述测序测序平台的总数据量为150M。在一些实施例中,本发明所述测序测序平台的总数据量为300M。在一些实施例中,本发明所述测序测序平台的总数据量为500M。在一些实施例中,本发明所述测序测序平台的总数据量为1000M。在一些实施例中,本发明所述测序测序平台的总数据量为至少1050M;
在一些实施例中,本发明所述健康受试者样本和阴性对照样本的临床背景库样本选自以下的一个或多个:血液、淋巴液、间隙液、脑脊液、肺泡灌洗液、支气管灌洗液、痰液、胸腹水、尿液、唾液、粪便、实验室环境样本或采样环境样本。其中,每种类型的健康受试者样本和阴性对照样本的临床样本不少于100例,优选不少200例。
在第三方面,本发明还提供了一种致癌病原体mNGS检测数据分析的设备,其包括:存储器,处理单元;
进一步地,所述存储器用于存储本发明中一个或多个程序;
进一步地,所述处理单元用于耦合至所述存储器并被配置为执行所述一个或多个程序使管理系统执行多个动作;
优选地,所述动作包括执行根据本发明所述的mNGS数据分析方法的步骤。
在第四方面,本发明还提供了一种计算机可读存储介质,所述可读存储介质存储有机器可执行的本发明所述分析方法的指令;
进一步地,所述指令在被执行时,让机器执行上述实施例所述的方法。
在第五方面,本发明还提供了如上所述的方法或系统或设备或计算机可读存储介质在致癌病原体mNGS检测数据分析中的用途。
与现有技术相比,本发明具有如下优点:通过使用合理的过程设计,结合健康受试者样本和阴性样本的临床样本背景设置,实现了准确鉴定出癌症患者的致癌病原体,克服了现有技术的不足,从而可以为临床治疗病原体感染相关肿瘤的治疗提供有效辅助用药建议,给社会和癌症病患带来检测收益,同时实现对症治疗和改善病原体感染致癌患者治疗效果的目的。
附图说明
图1一种基于mNGS检测致癌病原体方法的流程图。
具体实施方式
以下将结合具体的实施例进一步阐述本发明。
下列实施例描述了本发明的一些实施方案。但是应理解,实施例仅以举例说明的方式给出,绝不限制本发明的范围。
图1是本发明实施例1-16基于mNGS检测致癌病原体的流程图。
实施例1 mNGS检测样本的DNA提取
按照商用样本基因组DNA提取试剂盒说明书进行不同样本的DNA提取,并用Qubit3荧光计进行浓度测定,-20℃冷冻保存备用。
实施例2一种基于mNGS检测致癌病原体的文库构建及测序模式
第一步,在无菌PCR管A中配制50微升反应体系(50纳克提取的DNA样本,5微升Tagment Enzyme A50,10微升5×Tagment 缓冲液及适量双蒸水),通过移液枪上下吸打使混合液充分混匀;
第二步,将第一步中配好反应体系的无菌PCR管A放入PCR仪上于75℃热盖,在50-55℃反应5-10min,且在10-12℃放置。当反应结束后,取出所述无菌PCR管A,随后加入6XTermination 缓冲液通过涡旋或移液枪上下吸打充分混匀,然后在室温下孵育5-10min;
第三步,在第二步反应完的无菌PCR管A内加入30微升磁珠,通过移液枪上下吸打混匀,于室温静止10-15min,随后将无菌PCR管A置于磁力架上5-10min,移除上清,然后加入250-300微升80%乙醇漂洗磁珠,孵育30-60s 后移除上清液。在进行两次漂洗处理后,移除无菌PCR管A管底残留乙醇,往里加入灭菌超纯水混匀,室温孵育2-5min,随后将无菌PCR管A置于磁力架,吸取上清液,用于PCR反应;
第四步,取15微升第三步中PCR反应液,5微升10×PCR引物,2.5微升N7XX Index引物,2.5微升N5XX Index 引物和25微升2×PCR Mix加入到无菌PCR管B中配制成50微升PCR反应体系,混匀后离心,放入 PCR仪中进行PCR反应,所述PCR反应条件为:在105摄氏度下热盖;75摄氏度预变性2-4分钟;其次95摄氏度变性60秒,60摄氏度退火/延伸30秒,10-25个循环,最后72摄氏度延伸8分钟,然后将反应体系在4摄氏度进行放置;
第五步,往第四步扩增好的无菌PCR管B中加入40-60微升磁珠充分混匀,在室温孵育5-10min ,随后将所述无菌PCR管B置于磁力架上,并将无菌PCR管B中的上清转移至无菌PCR管C中,同时丢弃磁珠。然后往无菌PCR管C中加入8-12微升磁珠并混匀,在室温放置5-10min后置于磁力架上,移除上清,然后加入80%乙醇漂洗磁珠,孵育30-60s 后移除上清液。在进行两次漂洗处理后,移除无菌PCR管C管底残留乙醇,往里加入25-35微升灭菌超纯水混匀,室温孵育2-5min,随后将无菌PCR管C置于磁力架,吸取上清液,用作测序文库,进行文库质量评价和质控。与此同时,当文库质控合格后,根据文库大小选择测序模式在Illumina测序平台或Life测序平台进行测序。其中,脑脊液、肺泡灌洗液、血浆、痰液、胸腹水及其他样本的测序模式分别为15-25M reads、35-45M reads、45-55M reads、75-85Mreads、95-105M reads及15-30M reads。
实施例3 RPM比例阳性判断值确定
第一步,对临床阴性对照样本和健康受试者样本中掺入接近检测限浓度不同病原病原微生物所制备的模拟阳性样本和健康受试者样本按前述实施例所述步骤进行核酸提取和建库,与临床阴性对照样本一块测序,获取mNGS测序数据;
第二步,对第一步中获得的样本mNGS测序数据进行过滤、去重和去除人源序列;第三步,对第二步中所筛选的样本的测序片段结合病原微生物(包括病毒、细菌、真菌、寄生虫)序列数据库进行比对分析;
第四步,根据第三步样本中所检测到样本的各个病原微生物特异序列数和总微生物序列数计算每百万总微生物测序数据量中各个病原微生物特异序列数的所占比例(RPM),并分别计算各个病原微生物的RPM-模拟阳性样本,RPM-健康受试者样本与RPM-临床阴性对照样本的比例值,统计健康受试者样本和临床阴性对照样本背景库中每百万总微生物测序数据量中各个病原微生物特异序列数的所占比例(RPM)分布的最大值、最小值、中位数、平均数、标准差指标;当临床阴性对照样本中病原微生物特异序列数为0时,则RPM-临床阴性对照样本值为1;第五步,计算各个病原微生物的RPM-模拟阳性样本与RPM-健康受试者样本之间的比例值,结合ROC分析确定RPM比例阳性判断值。
实施例4 一个梅克尔多元癌细胞病毒感染所致梅克尔细胞癌的mNGS检测确定实例
对疑似病原体感染所致梅克尔细胞癌患者的血浆样本按照前述实施例1和2进行DNA提取、建库和上机测序。样本的原始数据读长为80bp,原始Reads为34.80M,原始数据Q30为93.0%。在过滤掉低质量的数据后得到的Clean Reads为31.08M;数据去重后得到的Unique Reads为30.13M。其中,比对到人的人源Reads 为29.26M,占比为97.10 %;比对到微生物的微生物Reads为0.87M,占比为2.90 %。此外,测序结果表明患者存在白色念珠菌、金黄色葡萄球菌、化脓球菌和梅克尔多元癌细胞病毒4种病原微生物,它们的Species Reads数、属/种类丰度、种丰度、覆盖度、深度和离散度依次分别为:29、32、51和77;80.13%、75.24%、90.38%、42.01%;0.69%、0.47%、1.72%、0.11%;0.0234%、0.0125%、0.0097%、0.0178%;1、1、1、1;0.86、0.92、0.54、0.98。与此同时,白色念珠菌、金黄色葡萄球菌、化脓球菌和梅克尔多元癌细胞病毒4种病原微生物在RPM-癌症样本与RPM-健康受试者样本之间的比例值分别为:1.23、1.44、1.71、1.80。根据RPM-癌症样本与RPM-健康受试者样本之间比例值的阳性判读标准大于等于1的物种有白色念珠菌、金黄色葡萄球菌、化脓球菌和梅克尔多元癌细胞病毒4个,且显著性差异均小于0.01%。但是只有梅克尔多元癌细胞病毒的病原体指标置信度为95%。因此,该样本最终认为是梅克尔多元癌细胞病毒感染为该梅克尔细胞癌患者致癌的主要因素。与临床结果一致。说明检出成功,检出率为100%,特异性为100%。
实施例5 一个乙肝病毒(HBV)感染所致肝癌的mNGS检测确定实例
对疑似病原体感染所致肝癌患者的血浆样本按照前述实施例1和2进行DNA提取、建库和上机测序。样本的原始数据读长为80bp,原始Reads为36.23M,原始数据Q30为91.2%。在过滤掉低质量的数据后得到的Clean Reads为32.45M;数据去重后得到的UniqueReads为31.70M。其中,比对到人的人源Reads 为31.31M,占比为98.77 %;比对到微生物的微生物Reads为0.39M,占比为1.23 %。此外,测序结果表明患者存在肝螺杆菌、韦荣球菌、链球菌、乙肝病毒、拟杆菌和瘤胃球菌6种病原微生物,它们的Species Reads数、属/种类丰度、种丰度、覆盖度、深度和离散度依次分别为:45、21、14、69、33和8;85.78%、72.04%、82.25%、44.32%、60.64%和34.07%;0.72%、0.51%、1.44%、0.37%、3.03%和0.80%;0.0451%、0.0516%、0.0129%、0.0892%、0.0101%和0.0077%;1、1.3、2.5、1、1和1;0.92、0.88、0.63、0.99、0.47和0.71。与此同时,肝螺杆菌、韦荣球菌、链球菌、乙肝病毒、拟杆菌和瘤胃球菌6种病原微生物在RPM-癌症样本与RPM-健康受试者样本之间的比例值分别为:1.35、0.33、0.72、1.91、0.47和0.20。根据RPM-癌症样本与RPM-健康受试者样本之间比例值的阳性判读标准大于等于1的物种有肝螺杆菌和乙肝病毒2个,且显著性差异均小于0.01%。但是只有乙肝病毒的病原体指标置信度为95%。因此,该样本最终认为是乙肝病毒感染为该肝癌患者致癌的主要因素。与临床结果一致。说明检出成功,检出率为100%,特异性为100%。
实施例6 一个人乳头状瘤病毒(HPV)感染所致宫颈癌的mNGS检测确定实例
对疑似病原体感染所致宫颈癌患者的细胞样本按照前述实施例1和2进行DNA提取、建库和上机测序。样本的原始数据读长为75bp,原始Reads为26.90M,原始数据Q30为93.7%。在过滤掉低质量的数据后得到的Clean Reads为24.63M;数据去重后得到的UniqueReads为23.86M。其中,比对到人的人源Reads 为23.63M,占比为99.02 %;比对到微生物的微生物Reads为0.23M,占比为0.98 %。此外,测序结果表明患者存在霉菌、衣原体、滴虫和乳头状瘤病毒4种病原微生物,它们的Species Reads数、属/种类丰度、种丰度、覆盖度、深度和离散度依次分别为:21、27、18和55;80.21%、74.66%、56.03%和44.48%;0.85%、0.42%、0.09%和3.23%;0.0890%、0.0432%、0.0146%、0.0785%;1、1、1和1;0.90、0.85、0.74和0.97。与此同时,霉菌、衣原体、滴虫和乳头状瘤病毒4种病原微生物在RPM-癌症样本与RPM-健康受试者样本之间的比例值分别为:0.55、0.81、0.74和1.87。根据RPM-癌症样本与RPM-健康受试者样本之间比例值的阳性判读标准大于等于1的物种有霉菌、衣原体、滴虫和乳头状瘤病毒4种病原微生物,且显著性差异均小于0.01%。但是只有乳头状瘤病毒的病原体指标置信度为95%。因此,该样本最终认为是乳头状瘤病毒感染为该宫颈癌患者致癌的主要因素。与临床结果一致。说明检出成功,检出率为100%,特异性为100%。
实施例7 一个人T细胞白血病I型病毒感染所致成人T细胞白血病的mNGS检测确定实例
对疑似病原体感染所致成人T细胞白血病患者的血浆样本按照前述实施例1和2进行DNA提取、建库和上机测序。样本的原始数据读长为80bp,原始Reads为34.60M,原始数据Q30为95.6%。在过滤掉低质量的数据后得到的Clean Reads为32.27M;数据去重后得到的Unique Reads为31.44M。其中,比对到人的人源Reads 为30.99M,占比为98.56 %;比对到微生物的微生物Reads为0.45M,占比为1.44 %。此外,测序结果表明患者存在T细胞白血病I型病毒、铜绿假单胞菌、金黄色葡萄球菌、克雷白菌和巨噬细胞病毒 5种病原微生物,它们的Species Reads数、属/种类丰度、种丰度、覆盖度、深度和离散度依次分别为:54、20、15、19和33;79.24%、80.2%、48.71%、67.91%和40.05%;5.80%、3.35%、0.27%、2.71%和0.10%;0.0780%、0.0557%、0.0215%、0.0214%和0.0702%;1、1.1、1、1和1.3;0.98、0.49、0.81、0.54和0.90。与此同时,T细胞白血病I型病毒、铜绿假单胞菌、金黄色葡萄球菌、克雷白菌和巨噬细胞病毒 5种病原微生物在RPM-癌症样本与RPM-健康受试者样本之间的比例值分别为:1.62、0.57、0.43、1.35和1.84。根据RPM-癌症样本与RPM-健康受试者样本之间比例值的阳性判读标准大于等于1的物种有T细胞白血病I型病毒、克雷白菌和巨噬细胞病毒 3种病原微生物,且显著性差异均小于0.01%。但是只有T细胞白血病I型病毒的病原体指标置信度为95%。因此,该样本最终认为是T细胞白血病I型病毒感染为该成人T细胞白血病患者致癌的主要因素。与临床结果一致。说明检出成功,检出率为100%,特异性为100%。
实施例8 一个人类第8型疱疹病毒感染所致卡波西肉瘤的mNGS检测确定实例
对疑似病原体感染所致卡波西肉瘤患者的血浆样本按照前述实施例1和2进行DNA提取、建库和上机测序。样本的原始数据读长为80bp,原始Reads为32.24M,原始数据Q30为91.0%。在过滤掉低质量的数据后得到的Clean Reads为28.74M;数据去重后得到的UniqueReads为28.29M。其中,比对到人的人源Reads 为28.04M,占比为99.12 %;比对到微生物的微生物Reads为0.25M,占比为0.88%。此外,测序结果表明患者存在内源性逆转录病毒、人乳头瘤病毒、金黄色葡萄球菌、痤疮丙酸杆菌和人类第8型疱疹病毒 5种病原微生物,它们的Species Reads数、属/种类丰度、种丰度、覆盖度、深度和离散度依次分别为:66、24、32、18和21;85.11%、82.4%、50.26%、46.78%和30.34%;4.28%、4.04%、1.01%、0.90%和3.77%;0.0824%、0.0502%、0.0309%、0.0424%和0.0833%;1、1、1、1和1;0.86、0.78、0.62、0.57和0.97。与此同时,内源性逆转录病毒、人乳头瘤病毒、金黄色葡萄球菌、痤疮丙酸杆菌和人类第8型疱疹病毒 5种病原微生物在RPM-癌症样本与RPM-健康受试者样本之间的比例值分别为:1.13、1.4、1.56、1.71和1.68。根据RPM-癌症样本与RPM-健康受试者样本之间比例值的阳性判读标准大于等于1的物种有内源性逆转录病毒、人乳头瘤病毒、金黄色葡萄球菌、痤疮丙酸杆菌和人类第8型疱疹病毒 5种病原微生物,且显著性差异均小于0.01%。但是只有人类第8型疱疹病毒的病原体指标置信度为95%。因此,该样本最终认为是人类第8型疱疹病毒感染为该卡波西肉瘤患者致癌的主要因素。与临床结果一致。说明检出成功,检出率为100%,特异性为100%。
实施例9 一个寡养单胞菌感染所致胆管癌的mNGS检测确定实例
对疑似病原体感染所致胆管癌患者的血浆样本按照前述实施例1和2进行DNA提取、建库和上机测序。样本的原始数据读长为80bp,原始Reads为31.02M,原始数据Q30为94.1%。在过滤掉低质量的数据后得到的Clean Reads为28.95M;数据去重后得到的UniqueReads为26.68M。其中,比对到人的人源Reads 为25.22M,占比为94.53 %;比对到微生物的微生物Reads为1.46M,占比为5.47 %。此外,测序结果表明患者存在HCV病毒、寡养单胞菌、异尖线虫、华支睾吸虫和肝吸虫5种病原微生物,它们的Species Reads数、属/种类丰度、种丰度、覆盖度、深度和离散度依次分别为:6、22、69、2和2;85.51%、95.07%、80.44%、45.08%、11.06%;0.43%、0.35%、1.28%、0.07%、0.02%;0.0012%、0.0251%、0.0346%、0.0023%、0.0001%;1、1、1、1、1;0.97、0.99、0.96、0.42、0.57。与此同时,HCV病毒、寡养单胞菌、异尖线虫、华支睾吸虫和肝吸虫5种病原微生物在RPM-癌症样本与RPM-健康受试者样本之间的比例值分别为:2.20、1.91、1.96、0.65、0.38。根据RPM-癌症样本与RPM-健康受试者样本之间比例值的阳性判读标准大于等于1的物种有HCV病毒、寡养单胞菌和异尖线虫3个,且显著性差异均小于0.01%。但是只有寡养单胞菌的病原体指标置信度为95%。因此,该样本最终认为是寡养单胞菌感染为该胆管癌患者致癌的主要因素。与临床结果一致。说明检出成功,检出率为100%,特异性为100%。
实施例10 一个冠状病毒感染所致鼻咽癌的mNGS检测确定实例
对疑似病原体感染所致鼻咽癌患者的血浆样本按照前述实施例1和2进行DNA提取、建库和上机测序。样本的原始数据读长为75bp,原始Reads为27.89M,原始数据Q30为92.5%。在过滤掉低质量的数据后得到的Clean Reads为25.79M;数据去重后得到的UniqueReads为22.45M。其中,比对到人的人源Reads 为21.52M,占比为95.86 %;比对到微生物的微生物Reads为0.93M,占比为4.14 %。此外,测序结果表明患者携带有EB病毒、冠状病毒、无乳链球菌、黏液罗氏菌、金黄色葡萄球菌、光滑念珠菌和热带念球菌7种病原微生物,它们的Species Reads数、属/种类丰度、种丰度、覆盖度、深度和离散度依次分别为:10、87、17、42、73、22和59;90.32%、84.78%、65.04%、100%、47.57%、90.31%;98.25%、43.56%、13.70%、5.12%、10.48%、23.62%、12.79%;0.021%、0.0047%、0.0025%、0.0018%、0.0036%、0.0052%、0.0040%;1.1、1、1.05、1.3、1、1.2、1;0.78、0.96、0.94、0.75、0.97、0.44、0.69。与此同时,EB病毒、冠状病毒、无乳链球菌、黏液罗氏菌、金黄色葡萄球菌、光滑念珠菌和热带念球菌7种病原微生物在RPM-癌症样本与RPM-健康受试者样本之间的比例值分别为:0.67、1.83、0.30、1.99、0.54、0.76、0.28。根据RPM-癌症样本与RPM-健康受试者样本之间比例值的阳性判读标准大于等于1的物种有冠状病毒和黏液罗氏菌2个,且显著性差异均小于0.01%。但是只有冠状病毒的病原体指标置信度大于等于95%。因此,该样本最终认为是冠状病毒为该鼻咽癌患者致癌的主要因素。与临床结果一致。说明检出成功,检出率为100%,特异性为100%。
实施例11 滴虫病原体感染所致宫颈癌的mNGS检测确定实例
对疑似病原体感染所致宫颈癌患者的细胞样本按照前述实施例1和2进行DNA提取、建库和上机测序。样本的原始数据读长为90bp,原始Reads为36.42M,原始数据Q30为91.4%。在过滤掉低质量的数据后得到的Clean Reads为32.85M;数据去重后得到的UniqueReads为31.21M。其中,比对到人的人源Reads 为30.69M,占比为98.33 %;比对到微生物的微生物Reads为2.16M,占比为1.67 %。此外,测序结果表明患者携带有HPV病毒、疱疹Ⅱ型病毒、滴虫、假单胞菌和金黄色葡萄球菌5种病原微生物,它们的Species Reads数、属/种类丰度、种丰度、覆盖度、深度和离散度依次分别为:75、31、54、13和22;61.08%、42.10%、79.11%、91.05%和35.27%;33.61%、66.27%、12.14%、7.58%和50.29%;0.0073%、0.0056%、0.0014%、0.0099%和0.0278%;1、3.2、1、5.7和1.2;0.78、0.81、0.97、0.42和0.33。与此同时,HPV病毒、疱疹Ⅱ型病毒、滴虫、假单胞菌和金黄色葡萄球菌5种病原微生物在RPM-癌症样本与RPM-健康受试者样本之间的比例值分别为:0.52、1.34、2.11、0.74、和0.16。根据RPM-癌症样本与RPM-健康受试者样本之间比例值的阳性判读标准大于等于1的物种有疱疹Ⅱ型病毒和滴虫2个,且显著性差异均小于0.01%。但是只有滴虫的病原体指标置信度大于等于95%。因此,该样本最终认为是滴虫为该宫颈癌患者致癌的主要因素。与临床结果一致。说明检出成功,检出率为100%,特异性为100%。
实施例12 具核梭杆菌感染所致结直肠癌的mNGS检测确定实例
对疑似病原体感染所致结直肠癌者的血浆样本按照前述实施例1和2进行DNA提取、建库和上机测序。样本的原始数据读长为80bp,原始Reads为30.21M,原始数据Q30为92.2%。在过滤掉低质量的数据后得到的Clean Reads为27.62M;数据去重后得到的UniqueReads为26.78M。其中,比对到人的人源Reads 为26.04M,占比为97.23 %;比对到微生物的微生物Reads为0.74M,占比为2.77 %。此外,测序结果表明患者携带有具核梭杆菌、巨细胞病毒、产肠毒素脆弱类杆菌、肠埃希菌、肝螺杆菌和沙门氏菌6种病原微生物,它们的Species Reads数、属/种类丰度、种丰度、覆盖度、深度和离散度依次分别为:42、64、37、23、11和55;72.33%、51.57%、32.89%、60.38%、31.22%和23.04%;29.54%、52.39%、7.08%、16.27%、10.22%和6.35%;0.0112%、0.0089%、0.0127%、0.0243%、0.0046%和0.0065%;1、1.4、2.1、1、1.1和1;0.98、0.70、0.82、0.53、0.19和0.25。与此同时,具核梭杆菌、巨细胞病毒、产肠毒素脆弱类杆菌、肠埃希菌、肝螺杆菌和沙门氏菌6种病原微生物在RPM-癌症样本与RPM-健康受试者样本之间的比例值分别为:1.78、1.23、2.46、1.85、0.59和0.16。根据RPM-癌症样本与RPM-健康受试者样本之间比例值的阳性判读标准大于等于1的物种有具核梭杆菌、巨细胞病毒、产肠毒素脆弱类杆菌和肠埃希菌4个,且显著性差异均小于0.01%。但是只有具核梭杆菌的病原体指标置信度大于等于95%。因此,该样本最终认为是具核梭杆菌为该结直肠癌患者致癌的主要因素。与临床结果一致。说明检出成功,检出率为100%,特异性为100%。
实施例13草螺菌和鞘脂单胞菌感染所致肺癌的mNGS检测确定实例
对疑似病原体感染所致肺癌患者的肺泡灌洗液样本按照前述实施例1和2进行DNA提取、建库和上机测序。样本的原始数据读长为75bp,原始Reads为28.33M,原始数据Q30为93.4%。在过滤掉低质量的数据后得到的Clean Reads为25.86M;数据去重后得到的UniqueReads为24.63M。其中,比对到人的人源Reads 为23.56M,占比为95.67 %;比对到微生物的微生物Reads为1.07M,占比为4.33 %。此外,测序结果表明患者携带有草螺菌、鞘脂单胞菌、奈瑟氏球菌、链球菌、卟啉单胞菌、疱疹病毒HHV-6和EB病毒7种病原微生物,它们的SpeciesReads数、属/种类丰度、种丰度、覆盖度、深度和离散度依次分别为:77、89、21、35、41、8和13;80.4%、62.13%、35.24%、52.46%、47.79%、23.8%和34.27%;41.02%、39.25%、12.43%、26.89%、5.56%、9.67%和16.88%;0.0342%、0.0127%、0.0009%、0.0108%、0.0091%、0.0079%和0.0056%;1、1、1.3、1.7、1、1和3.5;0.99、0.97、0.54、0.32、0.78和0.65。与此同时,草螺菌、鞘脂单胞菌、奈瑟氏球菌、链球菌、卟啉单胞菌、疱疹病毒HHV-6和EB病毒7种病原微生物在RPM-癌症样本与RPM-健康受试者样本之间的比例值分别为:2.21、1.75、0.37、0.90、0.23、1.89和1.52。根据RPM-癌症样本与RPM-健康受试者样本之间比例值的阳性判读标准大于等于1的物种有草螺菌、鞘脂单胞菌、疱疹病毒HHV-6和EB病毒4个,且显著性差异均小于0.01%。但是只有草螺菌和鞘脂单胞菌的病原体指标置信度大于等于95%。因此,该样本最终认为是草螺菌和鞘脂单胞菌感染为该肺癌患者致癌的主要因素。与临床结果一致。说明检出成功,检出率为100%,特异性为100%。
实施例14日本血吸虫感染所致肝癌的mNGS检测确定实例
对疑似病原体感染所致肝癌患者的肺泡灌洗液样本按照前述实施例1和2进行DNA提取、建库和上机测序。样本的原始数据读长为80bp,原始Reads为36.02M,原始数据Q30为90.1%。在过滤掉低质量的数据后得到的Clean Reads为31.23M;数据去重后得到的UniqueReads为29.45M。其中,比对到人的人源Reads 为28.34M,占比为96.22 %;比对到微生物的微生物Reads为1.11M,占比为3.78 %。此外,测序结果表明患者携带有日本血吸虫、肝螺杆菌、毛螺菌、链球菌、韦荣球菌、克雷伯氏菌、HBV病毒和瘤胃球菌8种病原微生物,它们的Species Reads数、属/种类丰度、种丰度、覆盖度、深度和离散度依次分别为:46、32、27、15、8、40、6和2;77.87%、67.24%、37.55%、47.69%、61.23%、14.2%、19.87%和44.93%;33.67%、27.11%、10.58%、33.16%、4.43%、7.99%、6.24%和25.35%;0.0511%、0.0201%、0.0006%、0.0102%、0.0167%、0.0045%、0.0077%和0.0089%;1、1、3.1、1.2、1、5.1、3.2、1.5和1;0.97、0.71、0.58、0.39、0.65、0.50、0.34和0.22。与此同时,日本血吸虫、肝螺杆菌、毛螺菌、链球菌、韦荣球菌、克雷伯氏菌、HBV病毒和瘤胃球菌8种病原微生物在RPM-癌症样本与RPM-健康受试者样本之间的比例值分别为:1.69、1.82、0.36、0.71、0.50、0.13、1.37和0.48。根据RPM-癌症样本与RPM-健康受试者样本之间比例值的阳性判读标准大于等于1的物种有日本血吸虫、肝螺杆菌和HBV病毒3个,且显著性差异均小于0.01%。但是只有日本血吸虫的病原体指标置信度大于等于95%。因此,该样本最终认为是日本血吸虫感染为该肝癌患者致癌的主要因素。与临床结果一致。说明检出成功,检出率为100%,特异性为100%。
实施例15小鼠乳腺肿瘤病毒感染所致乳腺癌的mNGS检测确定实例
对疑似病原体感染所致乳腺癌患者的血浆样本按照前述实施例1和2进行DNA提取、建库和上机测序。样本的原始数据读长为75bp,原始Reads为28.56M,原始数据Q30为94.7%。在过滤掉低质量的数据后得到的Clean Reads为26.69M;数据去重后得到的UniqueReads为25.2M。其中,比对到人的人源Reads 为24.68M,占比为97.94 %;比对到微生物的微生物Reads为0.52M,占比为1.06 %。此外,测序结果表明患者携带有具核梭杆菌、脆弱拟杆菌、小鼠乳腺肿瘤病毒、人乳头瘤病毒和EB病毒5种病原微生物,它们的Species Reads数、属/种类丰度、种丰度、覆盖度、深度和离散度依次分别为:72、28、39、17和5;81.22%、56.03%、27.34%、15.58%和32.05%;47.21%、22.09%、13.92%、4.02%和16.04%;0.0645%、0.0128%、0.0010%、0.0043%和0.0005%;1、1.3、1、1和1.5;0.93、0.69、0.98、0.46和0.81。与此同时,具核梭杆菌、脆弱拟杆菌、小鼠乳腺肿瘤病毒、人乳头瘤病毒和EB病毒5种病原微生物在RPM-癌症样本与RPM-健康受试者样本之间的比例值分别为:2.01、0.15、1.56、0.78和1.81。根据RPM-癌症样本与RPM-健康受试者样本之间比例值的阳性判读标准大于等于1的物种有具核梭杆菌、小鼠乳腺肿瘤病毒和EB病毒3个,且显著性差异均小于0.01%。但是只有小鼠乳腺肿瘤病毒的病原体指标置信度大于等于95%。因此,该样本最终认为是小鼠乳腺肿瘤病毒为该乳腺癌患者致癌的主要因素。与临床结果一致。说明检出成功,检出率为100%,特异性为100%。
实施例16马拉色菌、幽门螺杆菌和HBV病毒感染所致胰腺癌的mNGS检测确定实例
对疑似病原体感染所致胰腺癌患者的血浆样本按照前述实施例1和2进行DNA提取、建库和上机测序。样本的原始数据读长为80bp,原始Reads为33.44M,原始数据Q30为92.5%。在过滤掉低质量的数据后得到的Clean Reads为30.04M;数据去重后得到的UniqueReads为28.85M。其中,比对到人的人源Reads 为28.28M,占比为98.02 %;比对到微生物的微生物Reads为0.57M,占比为1.98 %。此外,测序结果表明患者携带有马拉色菌、幽门螺杆菌、HBV病毒、葡萄球菌、肠球菌、大肠杆菌和克雷伯菌7种病原微生物,它们的SpeciesReads数、属/种类丰度、种丰度、覆盖度、深度和离散度依次分别为:38、27、25、11、9和3;77.58%、63.29%、37.26%、13.34%、48.02%和24.89%;60.22%、41.13%、35.65%、8.76%、19.07%和12.84%;0.0901%、0.0512%、0.0748%、0.0022%、0.0009%和0.0013%;1、1、1、1.5、3.4和2.7;0.99、0.97、0.99、0.32、0.57和0.85。与此同时,马拉色菌、幽门螺杆菌、HBV病毒、葡萄球菌、肠球菌、大肠杆菌和克雷伯菌7种病原微生物在RPM-癌症样本与RPM-健康受试者样本之间的比例值分别为:1.56、1.32、1.83、0.40、0.12和0.74。根据RPM-癌症样本与RPM-健康受试者样本之间比例值的阳性判读标准大于等于1的物种有马拉色菌、幽门螺杆菌、HBV病毒、葡萄球菌、肠球菌和大肠杆菌6个,且显著性差异均小于0.01%。但是只有马拉色菌、幽门螺杆菌和HBV病毒的病原体指标置信度大于等于95%。因此,该样本最终认为是马拉色菌、幽门螺杆菌和HBV病毒为该胰腺癌患者致癌的主要因素。与临床结果一致。说明检出成功,检出率为100%,特异性为100%。
实施例17 一种基于mNGS检测致癌病原体的装置
本实施例所述装置硬件及操作系统配置分为检测致癌病原体的运行前端配置和后端配置;
进一步地,本实施例所述装置的后端配置为187G 内存和64核CPU配置;主频为2.5GHz及以上,硬盘为6TB及以上,支持/ dev/shm以内存盘的形式作为共享内存,通过预申请内存防止Swap到硬盘,内存的读写速度速度为10-100G每秒。与此同时,通过内存地址映射,采用/dev/shm支持进程间文件通信(IPC) ,进程并行数为10个。显示器分辨率为1366*768,显卡为VGA Asus Turbo GTX 1080TI;网络架构为B/S 架构(浏览器/服务器) 网络类型为局域网;带宽为千兆网络及以上, 配置有真核生物,病原体微生物数, Kraken2数据库。为了确定判断分类的准确性,采用区域标记,结合K-mer算法和二次比对程序,准确获得测序样本中微生物的片段数,基于BAM文件计算得到覆盖度、深度和离散度指标。实现对病原微生物的覆盖度、深度分布和离散度等相关指标的准确计算;
进一步地,本实施例所述装置的前端配置为CPU 4 颗,16 核/颗;主频为2.5GHz及以上 ,内存为1T 及以上,硬盘为1T 及以上,显示器分辨率为1366*768,显卡为VGA AsusTurbo GTX 1080TI,操作系统为WINDOWS server 2012 R2 操作系统;OFFICE 2010,Firefox 65、C相对风险度ome 73 及其以上版本;网络架构为B/S 架构(浏览器/服务器)网络类型为局域网;带宽为千兆网络及以上;
进一步地,本实施例所述装置在最低配置运行环境下,检测致癌病原体的运行效率要求患者的账户管理登录成功/登出成功运行时间小于3秒;
进一步地,本实施例所述装置在最低配置运行环境下,检测致癌病原体的运行分析满载运行分析时,运行时间小于480分钟;检测致癌病原体的运行分析半载运行分析时,运行时间小于200分钟;检测致癌病原体的运行分析单样本运行分析时,运行时间小于60分钟;
进一步地,本实施例所述装置在最低配置运行环境下,检测致癌病原体的运行对患者分析的结果报告调取运行时间小于3秒。
实施例18 一种基于mNGS检测致癌病原体的装置在实际临床辅助应用的情况
将实际临床上的200个疑似病原体感染致癌患者的临床mNGS检测信息读入本发明所述基于mNGS检测致癌病原体的装置,进行临床辅助应用。通过对患者的回访和治疗跟踪,结果表明本发明所述基于mNGS检测致癌病原体装置能较好地进行疑似病原体感染所致癌患者的病原微生物识别,给医生提供辅助治疗建议,从而能较好地改善疑似病原体感染所致癌患者的预后。其中,临床辅助应用结果表明:对照组(未按本发明所述基于mNGS检测致癌病原体装置的治疗建议进行辅助治疗的疑似病原体感染所致癌患者)的预后较差;而按本发明所述基于mNGS检测致癌病原体装置的治疗建议给出的建议进行辅助治疗的组的癌症患者总生存率明显改善,临床辅助应用实验数据表明结病原体感染致癌患者预后的平均总生存率提高了92%。可见,本发明所述基于mNGS检测致癌病原体的装置装置不仅利于给医院医生的辅助诊疗提供有效的建议,而且也给使用本发明所述装置的病原体感染致癌患者的带来了使用收益,具有较好的市场前景和应用。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (10)

1.一种基于mNGS检测致癌病原体的方法,其特征在于,所述方法包括如下步骤:第一步,对疑似病原体感染所致癌症的样本和健康受试者样本进行核酸提取,并建库,与临床阴性对照样本一块测序,获取mNGS测序数据;第二步,对第一步中获得的样本mNGS测序数据进行过滤、去重和去除人源序列;第三步,对第二步中所筛选的样本的测序片段结合病原微生物(包括病毒、细菌、真菌、寄生虫)序列数据库进行比对分析;第四步,根据第三步样本中所检测到样本的各个病原微生物特异序列数和总微生物序列数计算每百万总微生物测序数据量中各个病原微生物特异序列数的所占比例(RPM),并分别计算各个病原微生物的RPM-癌症样本,RPM-健康受试者样本与RPM-临床阴性对照样本的比例值,统计健康受试者样本和临床阴性对照样本背景库中每百万总微生物测序数据量中各个病原微生物特异序列数的所占比例(RPM)分布的最大值、最小值、中位数、平均数、标准差指标;当临床阴性对照样本中病原微生物特异序列数为0时,则RPM-临床阴性对照样本值为1;第五步,计算各个病原微生物的RPM-癌症样本与RPM-健康受试者样本之间的比例值,结合ROC分析确定通过将足够例数临床阴性对照样本和健康受试者样本中掺入接近检测限浓度不同病原病原微生物所制备的模拟阳性样本进行mNGS检测后获得的RPM比例阳性判断值,结合病原微生物指标置信分析,对样本中的每个物种的病原微生物进行判断;当RPM-癌症样本与RPM-健康受试者样本之间的比例值大于阳性判断值,显著差异性分析P≤0.01且病原体指标置信度大于等于95%的为阳性,即所确定的病原微生物感染为致癌的主要因素;当RPM-癌症样本与RPM-健康样本之间的比例值设置相应的判断值为大于阳性判断值,显著差异性分析P≤0.01但病原体指标置信度小于95%的为弱阳性,即所确定的病原微生物感染为致癌的次要因素;当RPM-癌症样本与RPM-健康样本之间的比例值小于阳性判断值为阴性,即所确定的病原微生物感染与致癌无关。
2.根据权利要求1所述的一种基于mNGS检测致癌病原体的方法,所述步骤中第一步中疑似病原体感染所致癌症的样本和健康受试者样本的测序总数据量分别大于等于15M。
3.根据权利要求1所述的一种基于mNGS检测致癌病原体的方法,所述步骤中健康受试者样本和临床阴性对照样本的临床样本选自以下的一个或多个:血液、淋巴液、间隙液、脑脊液、肺泡灌洗液、支气管灌洗液、痰液、胸腹水、尿液、唾液、粪便、实验室环境样本或采样环境样本。
4.根据权利要求1所述的一种基于mNGS检测致癌病原体的方法,所述步骤中健康受试者样本或临床阴性对照样本的临床样本都不少于100例。
5.根据权利要求1所述的一种基于mNGS检测致癌病原体的方法,所述步骤中用于所确定病原微生物感染为致癌主要因素的阳性判断值为大于1的自然数。
6.根据权利要求1所述的一种基于mNGS检测致癌病原体的方法,所述步骤中用于所确定病原微生物感染与致癌无关的阴性判断值为小于或等于1的自然数。
7.一种基于mNGS检测致癌病原体的系统,其特征在于,所述系统包含基于权利要求1所述分析方法中包含的步骤构建的模块:数据模块,质控模块,比对模块,计算模块和判断模块。
8.一种基于mNGS检测致癌病原体的装置,其特征在于,所述装置包含可用于存储和执行权利要求1所述分析方法中步骤程序的元件:存储器和处理单元。
9.一种计算机可读存储介质,其特征在于,所述可读存储介质可存储权利要求1所述分析方法中步骤程序的指令,所述指令在被执行时,使机器执行如权利要求1所述的分析方法。
10.权利要求1-6中所述的方法或权利要求7所述的系统或权利要求8所述的装置或权利要求9所述的计算机可读存储介质在mNGS检测致癌病原体的用途。
CN202210732106.5A 2022-06-26 2022-06-26 一种基于mNGS检测致癌病原体的方法、系统及装置 Pending CN114891870A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210732106.5A CN114891870A (zh) 2022-06-26 2022-06-26 一种基于mNGS检测致癌病原体的方法、系统及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210732106.5A CN114891870A (zh) 2022-06-26 2022-06-26 一种基于mNGS检测致癌病原体的方法、系统及装置

Publications (1)

Publication Number Publication Date
CN114891870A true CN114891870A (zh) 2022-08-12

Family

ID=82730217

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210732106.5A Pending CN114891870A (zh) 2022-06-26 2022-06-26 一种基于mNGS检测致癌病原体的方法、系统及装置

Country Status (1)

Country Link
CN (1) CN114891870A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104313180A (zh) * 2007-06-01 2015-01-28 科学与工业研究委员会 同时检测和鉴别眼睛和中枢神经系统的细菌、真菌、寄生虫和病毒感染的新方法
US20200273576A1 (en) * 2019-02-26 2020-08-27 Tempus Systems and methods for using sequencing data for pathogen detection
CN111816245A (zh) * 2020-07-20 2020-10-23 成都博欣医学检验实验室有限公司 结合mNGS和临床知识库的病原微生物检测方法及系统
CN113066533A (zh) * 2021-04-02 2021-07-02 欧蒙医学诊断(中国)有限公司 一种mNGS病原体数据分析方法
WO2022067019A1 (en) * 2020-09-26 2022-03-31 The Regents Of The University Of California Hybrid protocols and barcoding schemes for multiple sequencing technologies

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104313180A (zh) * 2007-06-01 2015-01-28 科学与工业研究委员会 同时检测和鉴别眼睛和中枢神经系统的细菌、真菌、寄生虫和病毒感染的新方法
US20200273576A1 (en) * 2019-02-26 2020-08-27 Tempus Systems and methods for using sequencing data for pathogen detection
CN111816245A (zh) * 2020-07-20 2020-10-23 成都博欣医学检验实验室有限公司 结合mNGS和临床知识库的病原微生物检测方法及系统
WO2022067019A1 (en) * 2020-09-26 2022-03-31 The Regents Of The University Of California Hybrid protocols and barcoding schemes for multiple sequencing technologies
CN113066533A (zh) * 2021-04-02 2021-07-02 欧蒙医学诊断(中国)有限公司 一种mNGS病原体数据分析方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
QIANG CHEN等: "Screening of potential microbial markers for lung cancer using metagenomic sequencing", 《CANCER MEDICINE》 *
李娜等: "宏基因二代测序技术检测多瘤病毒在尿路感染中的临床应用", 《中华医学杂志》 *

Similar Documents

Publication Publication Date Title
Gu et al. Rapid pathogen detection by metagenomic next-generation sequencing of infected body fluids
US20220365067A1 (en) Analysis of cell-free dna in urine and other samples
Long et al. Diagnosis of sepsis with cell-free DNA by next-generation sequencing technology in ICU patients
Lucena-Aguilar et al. DNA source selection for downstream applications based on DNA quality indicators analysis
Kubota et al. Real-time duplex applications of loop-mediated AMPlification (LAMP) by assimilating probes
CN107893116B (zh) 用于检测基因突变的引物对组合、试剂盒以及构建文库的方法
Chen et al. Comparison of the next-generation sequencing (NGS) technology with culture methods in the diagnosis of bacterial and fungal infections
CA3044231A1 (en) Validation methods and systems for sequence variant calls
Bardin et al. Metabolic phenotyping and strain characterisation of Pseudomonas aeruginosa isolates from cystic fibrosis patients using rapid evaporative ionisation mass spectrometry
Liu et al. Surveillance of SARS-CoV-2 at the Huanan seafood market
KR20190010533A (ko) 항생제 감수성을 결정하는 방법 및 시스템
Chai et al. Intratumor microbiome features reveal antitumor potentials of intrahepatic cholangiocarcinoma
CN113066533B (zh) 一种mNGS病原体数据分析方法
Park et al. A systematic sequencing-based approach for microbial contaminant detection and functional inference
Parris et al. Non-target RNA depletion strategy to improve sensitivity of next-generation sequencing for the detection of RNA viruses in poultry
Hassan et al. A role for arthropods as vectors of multidrug-resistant Enterobacterales in surgical site infections from South Asia
Lopez et al. A method of processing nasopharyngeal swabs to enable multiple testing
Liapikou et al. Emerging strategies for the noninvasive diagnosis of nosocomial pneumonia
Gupta et al. Fast track diagnostic tools for clinical management of sepsis: Paradigm shift from conventional to advanced methods
Liu et al. Second‐Generation Sequencing with Deep Reinforcement Learning for Lung Infection Detection
Xiao et al. A rapid and inexpensive nucleic acid detection platform for Listeria monocytogenes based on the CRISPR/Cas12a system
Liu et al. De novo identification of microbial contaminants in low microbial biomass microbiomes with Squeegee
Kravik et al. High sequence similarity between avian pathogenic E. coli isolates from individual birds and within broiler chicken flocks during colibacillosis outbreaks
Alwan et al. The emergence of novel Iranian variants in sheeppox and goatpox viral envelope proteins with remarkably altered putative binding affinities with the host receptor
Sun et al. A paired comparison of plasma and bronchoalveolar lavage fluid for metagenomic next-generation sequencing in critically ill patients with suspected severe pneumonia

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220812