CN113227401A - 来自克隆性造血的无细胞dna突变的片段大小表征 - Google Patents

来自克隆性造血的无细胞dna突变的片段大小表征 Download PDF

Info

Publication number
CN113227401A
CN113227401A CN202080007339.8A CN202080007339A CN113227401A CN 113227401 A CN113227401 A CN 113227401A CN 202080007339 A CN202080007339 A CN 202080007339A CN 113227401 A CN113227401 A CN 113227401A
Authority
CN
China
Prior art keywords
variants
variant
tumor
sample
cancer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202080007339.8A
Other languages
English (en)
Other versions
CN113227401B (zh
Inventor
姜婷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Inc
Original Assignee
Illumina Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Inc filed Critical Illumina Inc
Publication of CN113227401A publication Critical patent/CN113227401A/zh
Application granted granted Critical
Publication of CN113227401B publication Critical patent/CN113227401B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/13Tumour cells, irrespective of tissue of origin
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K45/00Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2803Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily
    • C07K16/2818Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily against CD28 or CD152
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2803Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily
    • C07K16/2827Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily against B7 molecules, e.g. CD80, CD86
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/505Medicinal preparations containing antigens or antibodies comprising antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/0081Purging biological preparations of unwanted cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Virology (AREA)
  • Primary Health Care (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Developmental Biology & Embryology (AREA)
  • Crystallography & Structural Chemistry (AREA)

Abstract

本发明提供了用于区分无细胞DNA样本中的癌症变体与来源于造血细胞的体细胞变体的方法和系统。在一些实施方案中,可以基于片段大小分布来区分所述癌症变体与来源于造血细胞的体细胞变体。

Description

来自克隆性造血的无细胞DNA突变的片段大小表征
技术领域
本文提供的方法和系统的一些实施方案涉及根据从无细胞DNA(cfDNA)样本获得的序列数据进行变体检出。在一些实施方案中,可以基于多种变体的片段大小分布来区分来源于造血细胞的体细胞变体与癌症变体。
背景技术
已知人DNA中的突变是引发癌症的原因,这些突变现在是癌症研究和治疗的焦点。循环肿瘤DNA(ctDNA)是一种非侵入性实时生物标记,可以为癌症患者治疗前后提供诊断和预后信息。然而,仅一小部分无细胞DNA(cfDNA)来源于肿瘤细胞,大多数片段来自造血细胞。造血细胞所携带的体细胞突变可能是cfDNA中影响临床决策的假阳性突变的主要原因。
发明内容
本公开涉及用于区分来自cfDNA样本的癌症变体与来源于造血细胞的体细胞变体的方法和系统。
本文提供的一些实施方案涉及用于区分循环肿瘤DNA(ctDNA)样本中的癌症变体与造血细胞变体的方法。在一些实施方案中,所述方法包括(a)获得或已经获得包含多种无细胞DNA(cfDNA)片段的ctDNA样本;(b)从所述样本中提取cfDNA片段,其中所述cfDNA片段包含多种变体;(c)对所述多种变体中的每一种变体进行分子图谱分析;以及(d)通过移除所鉴定的造血细胞变体来鉴定癌症变体。在一些实施方案中,对所述多种变体中的每一种变体进行分子图谱分析包括(i)确定所述多种变体中的每一种变体的变体等位基因频率(VAF),其中所述多种变体包括癌症变体和造血细胞变体,以及(ii)生成片段大小分布图谱以鉴定造血细胞变体。
本文提供的一些实施方案涉及确定肿瘤的肿瘤突变负荷的方法。在一些实施方案中,所述方法包括从包含肿瘤细胞的生物样本中获得序列数据;根据所述序列数据确定多种变体;以及使用本文所述的方法中的任一种确定所述多种变体中癌症变体的数量,其中所述癌症变体的数量等于肿瘤的肿瘤突变负荷。
本文提供的一些实施方案涉及治疗肿瘤的方法。在一些实施方案中,所述方法包括根据本文所述的方法中的任一种确定肿瘤突变负荷大于或等于10种癌症变体的肿瘤,以及通过施用有效量的检查点抑制剂来治疗所述肿瘤。
本文提供的一些实施方案涉及用于分析基因变异数据的电子系统。在一些实施方案中,所述系统包括在处理器上运行并且被适配为根据来自cfDNA样本的序列数据鉴定多种变体的信息学模块,其中所述多种变体包括癌症变体和造血细胞变体;用于对所述多种变体中的每一种变体进行分子图谱分析的分析仪,其中所述分析仪被配置为确定所述多种变体中的每一种变体的变体等位基因频率(VAF)并且被配置为生成片段大小分布图谱;用于通过移除所鉴定的造血细胞变体来鉴定癌症变体的分析仪;以及被适配为返回未从所述多种变体中移除的变体的显示模块。
附图说明
图1示出了用于区分癌症变体与来源于造血细胞的体细胞变体的示例性方法的流程图。
图2描绘了实体FFPE组织样本与血浆样本之间的变体一致性的示例性结果。
图3描绘了实体组织与血浆样本之间的体细胞和克隆性造血突变之间的变体等位基因频率比较的示例性结果。
图4描绘了来自源于克隆性造血的样本、种系健康样本、体细胞白血病或体细胞实体样本的突变的片段大小分布。
图5描绘了通过片段大小分布对不同来源的体细胞或克隆性造血(CH)细胞中的突变进行分类。
图6描绘了cfDNA中克隆性造血变体的变体等位基因频率与在白细胞(血沉棕黄层)中观察到的变体的变体等位基因频率的相关性。
图7A-图7B描绘了肿瘤突变负荷(TMB)。图7A描绘了与全血细胞TMB(T/N TMB)相比的仅肿瘤TMB(仅T TMB)中的TMB。图7B描绘了与经克隆性造血调节的仅T TMB相比的T/NTMB中的TMB。
具体实施方式
在以下具体实施方式中,参考了附图,附图形成具体实施方式的一部分。在附图中,除非上下文另有规定,否则类似的符号通常标识类似的组分。具体实施方式、附图和权利要求书中所述的示例性实施方案并非旨在为限制性的。在不脱离本文所提出的主题的精神或范围的情况下,可利用其他实施方案,并且可作出其他改变。将容易理解的是,如本文大体所述并且如附图所示,本公开的各方面可被布置、替代、组合、分离和设计成多种不同的构型,所有这些构型均明确涵盖于本文中。
本文提供的系统、方法和组合物的实施方案涉及用于根据从取自用户或患者的无细胞DNA(cfDNA)样本获得的序列数据确定核酸变体(“变体检出”)的方法和系统。在一些实施方案中,所述方法和系统可以基于片段大小分布来区分与癌症无关的来自不同细胞来源的体细胞突变与肿瘤突变。在一些实施方案中,可以基于变体的片段大小分布来区分来源于造血细胞的体细胞变体与来源于肿瘤细胞的突变,两者均从cfDNA样本获得。cfDNA样本包括来源于肿瘤细胞和其他来源(包括克隆性造血)的DNA片段。来自肿瘤细胞的DNA片段大小不同于造血细胞的DNA片段大小,因此来自cfDNA样本的片段可以应用于片段大小分布图谱,以区分肿瘤与造血细胞,这可以更好地确定样本中的肿瘤突变负荷。更具体地,在一些实施方案中,相对于携带来自克隆性造血或白血病的体细胞突变的片段,携带来自实体瘤的体细胞突变的片段具有较小的大小。
除非本文另有定义,否则结合本申请使用的科学和技术术语应具有其根据本说明书所理解的以及本公开所属领域的普通技术人员所理解的普通含义。应当理解,本公开不限于本文所述的具体方法、方案和试剂等,因此可以有所变化。免疫学和分子生物学中常见术语的定义可以见于Merck Sharp&Dohme公司出版的The Merck Manual of Diagnosisand Therapy,第20版,2018(ISBN 0911910190,978-0911910421);由Blackwell Science公司出版的Robert S.Porter等人(编辑),The Encyclopedia of Molecular Cell Biologyand Molecular Medicine,1999-2012(ISBN 9783527600908);以及由VCH Publishers,Inc.出版的Robert A.Meyers(编辑),Molecular Biology and Biotechnology:aComprehensive Desk Reference,1995(ISBN 1-56081-569-8);由Elsevier出版的wernerLuttmann的Immunology,2006;Janeway的Immunobiology,Kenneth Murphy、Allan Mowat、Casey weaver(编辑),W.W.Norton&Company,2016(ISBN 0815345054,978-0815345053);由Jones&Bartlett Publishers出版的Lewin's Genes XI,2014(ISBN-1449659055);MichaelRichard Green和Joseph Sambrook,Molecular Cloning:A Laboratory Manual,第4版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,USA(2012)(ISBN1936113414);Davis等人,Basic Methods in Molecular Biology,ElsevierScience Publishing,Inc.,New York,USA(2012)(ISBN 044460149X);LaboratoryMethods in Enzymology:DNA,Jon Lorsch(编辑)Elsevier,2013(ISBN 0124199542);Current Protocols in Molecular Biology(CPMB),Frederick M.Ausubel(编辑),JohnWiley and Sons,2014(ISBN047150338X,9780471503385),Current Protocols inProtein Science(CPPS),John E.Coligan(编辑),John Wiley and Sons,Inc.,2005;以及Current Protocols in Immunology(CPI)(John E.Coligan、ADA MKruisbeek、David HMargulies、Ethan M Shevach、Warren Strobe(编辑)John Wiley and Sons,Inc.,2003(ISBN 0471142735,9780471142737),这些文献的内容各自以引用的方式全文并入本文。
如本文所用,“无细胞DNA”或“cfDNA”具有其根据本说明书所理解的普通含义,是指血流中的自由循环DNA,但其可能不一定是肿瘤起源的。cfDNA可以由于各种过程(包括正常和异常凋亡事件、细胞排泄、坏死等)而从细胞中释放。由于各种医学病症、疾病状态或妊娠,cfDNA的特定形式可存在于循环系统中。实体组织(包括癌症)也是血浆cfDNA库的促成部分。cfDNA可以由于核内体外片段化产生的核酸片段长度为特征,其中所述片段的长度可为约100bp至200bp,诸如100bp、110bp、120bp、130bp、140bp、150bp、160bp、170bp、180bp、190bp或200bp,或在由任何两个前述值限定的范围内的长度。在一些实施方案中,该片段的长度为166bp。
如本文所用,“循环肿瘤DNA”或“ctDNA”具有其根据本说明书所理解的普通含义,是指可能不与细胞相关联的肿瘤来源的片段化DNA。ctDNA可来自血浆或血清中存在的cfDNA的一部分,并且可来源于肿瘤或循环肿瘤细胞。ctDNA携带赘生性细胞基因组的分子特征。相对于对瘤内基因多样性的一小部分和焦点部分进行询问的肿瘤组织显微解剖,ctDNA可以用于通过灌注采样对原发和转移位点的克隆变种进行采样。然而,由于被大量正常cfDNA稀释,ctDNA可以低等位基因频率存在。在一些实施方案中,低等位基因频率的量小于5%、小于4%、小于3%、小于2%、小于1%、小于0.9%、小于0.8%、小于0.7%、小于0.6%、小于0.5%、小于0.4%、小于0.3%或小于0.2%,或者在由任何两个前述值限定的范围内。
在一些实施方案中,本文所述的方法和系统能够区分来源于造血细胞的体细胞变异与来源于肿瘤细胞的突变。
如本文所用,“变体”可以包括核酸分子内的多态性。多态性可以包括插入、缺失、可变长度串联重复、单核苷酸突变,以及结构变体,诸如易位、拷贝数变异或它们的组合。变体可以包括种系变体或体细胞变体。如本文所用,“种系变体”可以包括存在于个体的胚细胞和所有细胞中的变体,并且可被传给后代。如本文所用,“体细胞变体”可以包括存在于个体的肿瘤细胞中或造血细胞所携带的但不存在于其他细胞中的变体,并且可能不被遗传。
基因突变的分析可以在多种表型(包括遗传性疾病和某些躯体疾病,例如癌症)的研究中提供有价值的信息。变体等位基因可以包括基因在其DNA序列中的特定位点处的变体形式。一些基因序列因个体而异,而不会产生任何效果,而另一些基因序列则可以产生显著不同的表型。例如,DNA序列中的单个突变可以改变基因的打开或关闭或者蛋白质在代谢链中的功能。存在基因变异的群体的基因数据不仅可以提供对基因与表型之间的关系的了解,而且还可以提供对与变体相关的表型的进化历史的了解。例如,生物器官或系统中随时间推移发生的变化(诸如肾脏、头发或肌肉组织变化)可能与体细胞突变有关。
如本文所用,“变体等位基因频率”或“VAF”具有其根据本说明书所理解的普通含义,是指观察到的与变体匹配的测序读段除以目标位置的总覆盖率的百分比。VAF可包括携带变体的测序读段的比例的量度。
“造血细胞”具有其根据本说明书所理解的普通含义,是指造血系统的任何类型的细胞,包括但不限于:未分化细胞,诸如造血干细胞和祖细胞(HSPC);以及分化细胞,诸如巨核细胞、血小板、红细胞、白血球、粒细胞、单核细胞、淋巴细胞和自然杀伤(NK)细胞。如本文所用,“克隆性造血”具有其根据本说明书所理解的普通含义,是指具有一个或多个体细胞突变的造血细胞亚群的克隆生长。克隆性造血(CH)可以是在cfDNA中鉴定的假阳性突变的主要来源,因此可影响临床决策。因此,本公开涉及用于确定体细胞突变来源于CH还是肿瘤细胞的方法和系统。
意义未明的克隆性造血(CHIP)可能是一种常见的衰老相关现象,其中造血干细胞(HSC)或其他早期血细胞祖细胞促使血细胞在遗传上不同的亚群形成。在一些实施方案中,体细胞变体起源的确定可以指示肿瘤的肿瘤突变负荷(TMB)。在一些实施方案中,体细胞变体起源的确定可以用于确定靶向治疗。
如本文所用,“肿瘤突变负荷”或“TMB”具有其根据本说明书所理解的普通含义,是指肿瘤细胞所携带的突变的量度。在最近的研究表明TMB与检查点抑制剂免疫疗法的有效性之间存在相关性之后,TMB已成为癌症治疗选择的重要生物标记。在计算TMB时,鉴定和滤除种系变体可能是有用的。种系变体可包括个体出生就有(或在肿瘤与正常细胞之间共享)但与参考基因组相比被检测为变体的变体。这些变体对区分肿瘤细胞与正常细胞无用,因此如果未正确滤出,可能导致过高估计TMB。此外,还可以滤除来源于造血细胞(例如,克隆性造血)的体细胞变体,以区分肿瘤细胞与克隆性造血。实施方案包括确定cfDNA样本的TMB,根据该TMB选择肿瘤的治疗,以及向有需要的受试者施用该治疗。
在一些实施方案中,可通过确定合格变体除以有效小组大小来计算TMB。合格变体包括例如编码区中的变体、不出现在低置信度区中的变体、频率大于0.4%且小于40%的变体、覆盖率大于500倍的变体、单核苷酸变体(排除多核苷酸变体)、插入和缺失变体(插入缺失)、非同义和同义变体,排除COSMIC(癌症中体细胞突变目录)计数大于50的变体和/或排除克隆性造血受影响基因(诸如Tet甲基胞嘧啶双加氧酶2(TET2)、肿瘤蛋白p53(TP53)、DNA(胞嘧啶-5)-甲基转移酶3A(DNMT3A)和/或casitas B谱系淋巴瘤(CBL))中具有突变的变体。有效小组大小可以包括例如覆盖率大于500倍的总编码区。
方法
本文提供的一些实施方案涉及用于确定体细胞变体起源的方法。在一些实施方案中,该方法包括区分cfDNA样本中的来源于克隆性造血(CH)的DNA突变与指示肿瘤变体的DNA突变。在一些实施方案中,可以通过分析cfDNA中DNA片段的片段大小分布来区分CH与肿瘤变体。
如本文所用,“片段大小分布”根据本说明书具有其普通含义,是指按大小分布cfDNA的片段以产生片段大小图谱。所产生的片段大小图谱可以用于区分不同细胞来源的体细胞突变。
用于区分不同细胞来源的体细胞突变的示例性方法在图1中示意性地示出。方法100包括获得或已经获得样本的步骤105。在一些实施方案中,样本是生物样本。在一些实施方案中,生物样本可以包括肿瘤细胞。在一些实施方案中,生物样本可以包括血清样本、粪便样本、血液样本和肿瘤样本。在一些实施方案中,生物样本被固定。在一些实施方案中,样本包括cfDNA。在一些实施方案中,样本包括ctDNA。在一些实施方案中,样本包括多种变体,包括例如体细胞和种系变体。在一些实施方案中,该方法包括移除种系变体。
只要生物样本含有足以进行分析的核酸,就没有特别要求一定量的生物样本。因此,生物样本的量可包括约1μL至约500μL,诸如1μL、2μL、3μL、4μL、5μL、6μL、7μL、8μL、9μL、10μL、15μL、20μL、25μL、30μL、35μL、40μL、45μL、50μL、60μL、70μL、80μL、90μL、100μL、150μL、200μL、250μL、300μL、350μL、400μL、450μL或500μL,或由任何两个前述值限定的范围内的量。
在一些实施方案中,该方法包括从受试者获得样本。在一些实施方案中,该方法包括具有从受试者获得的样本。在一些实施方案中,受试者可以提供生物样本,或者单独实体可以提供生物样本。生物样本可以是由受试者产生的任何物质。一般来讲,生物样本可以是取自受试者的任何组织或由受试者产生的任何物质。生物样本的示例可以包括血液、血浆、唾液、脑脊液(CSF)、面颊组织、尿液、粪便、皮肤、毛发、器官组织。在一些实施方案中,生物样本是实体瘤或实体瘤的活体组织切片。在一些实施方案中,生物样本是福尔马林固定、石蜡包埋(FFPE)组织样本。生物样本可以是包含核酸的任何生物样本。生物样本可源于受试者。受试者可以是哺乳动物、爬行动物、两栖动物、禽类或鱼类。在一些实施方案中,受试者是人类。在一些实施方案中,该方法还包括获得匹配的肿瘤样本。通过将肿瘤和cfDNA变体结果匹配,可以构建来源于肿瘤细胞、健康细胞和异常造血细胞的片段大小图谱。
在一些实施方案中,方法100包括从样本中提取DNA的步骤110。可通过任何合适的提取方法提取生物样本的DNA。实现该目的的方法对于本领域技术人员而言是众所周知的,包括例如苯酚/氯仿提取、乙醇沉淀、氯化铯梯度、CHELEX或二氧化硅柱或珠方法。可使用本领域已知的方法和/或可商购获得的试剂盒(例如,通过使用由QIAGEN提供的QIAamp DNAblood Mini Kit或DNeasy Blood&Tissue Kit)从细胞中提取DNA。
在一些实施方案中,方法100包括文库制备和富集的步骤115。文库制备和富集可以根据本领域已知的方法进行。例如,文库制备和富集的方法可包括标准规程,包括以下步骤:末端修复和加A尾、衔接子连接、连接提取纯化、指数PCR、第一次杂交、第一次靶标捕获、第二次杂交、第二次靶标捕获、文库扩增、提取纯化扩增文库、文库定量和/或文库均一化。
在一些实施方案中,方法100还包括测序的步骤120。DNA文库的测序可以例如使用HiSeq进行。HiSeq可用151bp配对末端读段进行。配对末端测序提供了包含重复序列的DNA区域之间的高质量比对,并通过填充共有序列中的空位产生用于从头测序的长重叠群。配对末端DNA测序还检测常见的DNA重排,诸如插入、缺失和倒位。在一些实施方案中,测序包括使用独特分子标识符(UMI)进行分子图谱分析。
在一些实施方案中,方法100还包括变体等位基因频率(VAF)分析的步骤125。VAF分析可根据本领域确立的方法进行,其中测定包含变体等位基因的位点处的读段比例。在cfDNA中,由于肿瘤部分较低(通常量小于20%),种系与体细胞系之间的VAF可能明显不同。ctDNA可包括量为0.2%至0.4%的低VAF变体的高度灵敏检测。
变体频率分析可包括从收集自测序器的序列数据中移除变体数据。可以例如通过将过滤器(诸如数据库过滤器或接近过滤器)应用于表示多种变体的数据来移除种系变体。数据库过滤器可以用于将变体鉴定为种系变体,并将该变体从表示样本中的多种变体的数据中移除。对于多种变体中的特定变体,数据库过滤器可以与数据库中对应变体的等位基因计数相关。接近过滤器可以与多种变体中的某种变体的等位基因频率、该变体在基因组区域中的位置以及该变体的等位基因频率与所鉴定的种系变体在基因组的相同区域中的等位基因频率的接近度相关。在一些实施方案中,应用数据库过滤器包括确定多种变体中的第一种系变体,其中第一种系变体在第一参考组变体中各自具有大于或等于阈值等位基因计数的等位基因计数。在一些实施方案中,应用接近过滤器包括:(i)将多种变体中的变体合并到多个箱中,其中将位于基因组的相同区域中的变体合并到相同箱中;(ii)确定多种变体中的数据库变体,其中数据库变体存在于第二参考组变体中;以及/或者(iii)确定多种变体中的第二种系变体,其中第二种系变体各自与第二种系变体相同的仓中具有至少一个数据库变体的等位基因频率的近似范围内的等位基因频率。
在一些实施方案中,多种变体中的变体可以被分类或合并成多个箱,使得位于基因组的相同区域中的变体被分类或合并到相同箱。在一些实施方案中,基因组的相同区域可以在相同染色体内、在染色体的相同臂内、在相同染色体细胞带内。在一些实施方案中,基因组的相同区域可以在相同的连续100Mb、50Mb、40Mb、30Mb、20Mb、10Mb、5Mb、1Mb内,或在任何两个前述数值之间的任何范围内。
在一些实施方案中,接近过滤器还包括用于确定哪些合并的变体可被容易地识别为种系变体的指令或命令。例如,合并的变体可以具有存在于一个或多个参考数据库中的对应变体并且可被识别为种系变体。
在一些实施方案中,接近过滤器包括用于确定样本中等位基因频率大于或等于阈值频率的变体是种系变体的指令。在一些此类实施方案中,等位基因频率大于或等于0.7、0.8、0.9、或1.0的变体可以被鉴定为种系变体,但是应当认识到,更高或更低的等位基因频率仍在本公开的范围内。
在一些实施方案中,接近过滤器包括用于确定尚未被鉴定为种系变体的变体的等位基因频率的近似范围的指令。变体的等位基因频率的近似范围可以包括高于或低于该变体的等位基因频率的等位基因频率范围。在一些实施方案中,近似范围是具有来自0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09或任何两个前述数值之间的范围内的任何数值的变体的等位基因频率的最大值和最小值的范围。例如,对于等位基因频率为0.2且近似范围为0.05的变体,近似范围的最小值和最大值将分别为0.15和0.25的等位基因频率。
在一些实施方案中,假设给定变体的支持证据由二项式过程生成,则近似范围由二项式分布的两(n)个标准差的值确定。例如,对于具有等位基因频率(x)、覆盖率(y)的变体,近似范围(z)可以为:
z=n*sqrtfy*x*(1-x))/y
例如,对于等位基因频率为0.2、覆盖率/测序深度为100的变体,近似范围将为0.08,并且近似范围的最小值和最大值将分别为0.12和0.28的等位基因频率。在一些实施方案中,近似范围是高于和低于变体的等位基因频率0.05或与变体的等位基因频率的二项分布相差两(n)个标准差中的较高者。
在一些实施方案中,如果变体在与变体相同的箱中具有在一个或多个所鉴定的种系变体的近似范围内的等位基因频率,则该变体可以被鉴定为种系变体。在一些实施方案中,如果变体在与变体相同的箱中具有在超过1、2、3、4、5、6、7、8、9或10个所鉴定的种系变体的近似范围内的等位基因频率,则该变体可以被鉴定为种系变体。在一些实施方案中,如果变体在与变体相同的箱中具有在超过5个所鉴定的种系变体的近似范围内的等位基因频率,则该变体可以被鉴定为种系变体。例如,在一个实施方案中,其中如果变体在与变体相同的箱中具有在超过5个所鉴定的种系变体的近似范围内的等位基因频率,则该变体将被鉴定为种系变体:等位基因频率为0.2、近似范围为0.05因此最小范围为0.15且最大范围为0.25并且被合并在表示染色体7的箱中的变体将被鉴定为种系变体,其中超过5个所鉴定的种系变体具有在变体的近似范围内的等位基因频率并且被合并在表示染色体7的箱中。
在一些实施方案中,接近过滤器鉴定体细胞变体,所述体细胞变体是未被鉴定为种系变体的变体。在一些实施方案中,从来自肿瘤的测序数据获得的体细胞变体的数量是肿瘤的肿瘤突变负荷。
在一些实施方案中,数据库过滤器或接近过滤器可以应用于多种变体,以从多种变体中鉴定和移除种系变体。在一些实施方案中,可以连续应用数据库过滤器和接近过滤器。例如,数据库过滤器的输出可以用于接近过滤器的输入。相反,接近过滤器的输出可以用作数据库过滤器的输入。
在一些实施方案中,在步骤125进行变体等位基因频率分析之后,方法100还包括片段大小分布的步骤130。使用基因组坐标进行读段折叠后,可以使用共有序列推断片段大小。在一些实施方案中,片段大小分布包括基于不同细胞来源的变体类型生成片段大小的图谱,使得不同细胞来源或不同变体类型生成不同的片段大小图谱。在一些实施方案中,所提供的片段大小取决于细胞系。
在一些实施方案中,方法100包括鉴定癌症变体的步骤135。鉴定癌症变体可以通过分析片段大小分布并移除已知与CH相关联的片段大小分布来进行。在一些实施方案中,鉴定癌症变体包括将片段大小分布拟合到似然模型。在一些实施方案中,使用图1所示的方法100分析匹配的肿瘤样本,其中匹配的肿瘤和cfDNA变体结果使得能够构建来源于肿瘤细胞、健康细胞和异常造血细胞的片段大小图谱。为了从CH中鉴定体细胞突变,可进行拟合观察到的不同细胞来源的片段大小的似然比测试。在一些实施方案中,鉴定癌症变体以大于75%(诸如大于75%、80%、85%、90%、95%、96%、97%、98%或99%)的敏感性或以由任何两个前述值限定的范围内的敏感性进行。
治疗方法
所述方法和系统的一些实施方案包括治疗患有或疑似患有肿瘤的受试者的方法。在一些此类实施方案中,可以通过本文提供的方法和系统来确定存在于cfDNA样本中的癌症变体的数量。例如,可以从cfDNA样本获得序列数据,可以根据该序列数据鉴定多种变体,并且可以建立片段大小分布图谱以从癌症变体中鉴定和描绘CH,从而鉴定多种变体中的癌症变体。在一些实施方案中,从来自cfDNA样本的测序数据获得的癌症变体的数量是TMB。在一些实施方案中,将TMB计算为每个基因组区域的癌症变体的平均数,诸如每50kb、100kb、1Mb、10Mb、100Mb等的突变。可以通过对整个基因组或其一部分进行测序来对TMB进行采样。例如,可以通过富集一个或多个感兴趣的基因组区域(诸如肿瘤基因小组、完整外显子组、部分外显子组等)来对基因组的一部分进行测序。
治疗患有或疑似患有肿瘤的受试者的一些实施方案可以包括确定cfDNA样本具有大于或等于TMB阈值的TMB,以及使肿瘤与有效量的治疗剂接触。一些实施方案包括治疗患有肿瘤的受试者,并且可以包括确定cfDNA样本具有大于或等于TMB阈值的TMB,以及向受试者施用有效量的治疗剂。在一些实施方案中,TMB阈值可以为2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000,或在任何两个前述数值之间的范围内的任何数值。
在一些实施方案中,通过确定合格变体除以有效小组大小来计算TMB。合格变体包括例如编码区中的变体、不在低置信度区中的变体、频率大于0.4%且小于40%的变体、覆盖率大于500倍的变体、单核苷酸变体(排除多核苷酸变体)以及插入和缺失变体(插入缺失)、非同义和同义变体,排除COSMIC计数大于50的变体和/或排除‘I’ET2、TP53、DNMT3A和/或CBL中具有突变的变体。有效小组大小可以包括例如覆盖率大于500倍的总编码区。
治疗剂的示例包括化学治疗剂。在一些实施方案中,治疗剂可以包括检查点抑制剂。检查点抑制剂的示例包括CTLA-4抑制剂、PD-1抑制剂和PD-L1抑制剂。在一些实施方案中,检查点抑制剂可以包括伊匹单抗、纳武单抗、派姆单抗、斯巴单抗、阿特珠单抗、阿维单抗和度伐单抗。肿瘤的示例包括结直肠肿瘤、肺肿瘤、子宫内膜肿瘤、子宫肿瘤、胃肿瘤、黑素瘤、乳腺肿瘤、胰腺肿瘤、肾肿瘤、膀胱肿瘤和脑肿瘤。可以用本文所包括的方法和系统治疗的癌症的更多示例在U.S.2018/0218789中列出,该文献以引用的方式全文明确并入本文。
系统
一些实施方案包括用于执行本文所述的方法的基于计算机的系统和计算机实现的方法。在一些实施方案中,所述系统可以用于确定用于区分CH与癌症变体的片段大小分布图谱。在一些实施方案中,所述系统还包括要应用于变异数据以鉴定和移除种系变体的数据库过滤器和/或接近过滤器。本文提供的方法和系统的一些实施方案包括用于分析变异数据的电子系统。在一些此类实施方案中,所述系统和计算机实现的方法包括用于变体等位基因频率和用于片段大小分布的分析仪。一些实施方案可以包括在处理器上运行并且被适配为根据来自生物样本的序列数据鉴定多种变体的信息学模块,其中多种变体包括CH和癌症变体。本文提供的一些实施方案包括用于鉴定多种变体中的CH的计算机实现的方法。一些此类实施方案可以包括从来自生物样本的序列数据接收多种变体,所述多种变体可以包括CH和癌症变体。一些实施方案包括将肿瘤和cfDNA变体结果匹配,以构建来源于肿瘤细胞、健康细胞和异常造血细胞的片段大小图谱。在一些实施方案中,从来自cfDNA样本的测序数据获得的肿瘤变体是TMB。
该系统可以包括一个或多个客户端部件。一个或多个客户端部件可以包括用户界面。该系统可以包括一个或多个服务器部件。服务器部件可以包括一个或多个存储器位置。一个或多个存储器位置可以被配置为接收数据输入。数据输入可以包括测序数据。测序数据可以由来自受试者的核酸样本生成。该系统还可以包括一个或多个计算机处理器。一个或多个计算机处理器可以可操作地联接到一个或多个存储器位置。一个或多个计算机处理器可以被编程为将测序数据映射到参考序列。一个或多个计算机处理器可以被进一步编程为根据测序数据确定多种变体的存在或不存在。一个或多个计算机处理器可以被进一步编程为确定变体等位基因频率。一个或多个计算机处理器可以被进一步编程为确定片段大小分布图谱。一个或多个计算机处理器可以被进一步编程为通过片段大小分布确定不同来源的突变的分类。一个或多个计算机处理器可以被进一步编程为生成用于在屏幕上显示的输出。输出可以包括鉴定CH和/或癌症变体的一个或多个报告。
所述方法和系统的一些实施方案可以包括一个或多个客户端部件。一个或多个客户端部件可以包括一个或多个软件部件、一个或多个硬件部件或它们的组合。一个或多个客户端部件可以通过一个或多个服务器部件访问一个或多个服务。一个或多个服务可以由一个或多个客户端部件通过网络访问。本文所用的“服务”是指系统的任何产品、方法、功能或用途。例如,用户可以下订单进行基因检测。可以通过系统的一个或多个客户端部件来下订单,并且可以通过网络将请求传输到系统的一个或多个服务器部件。网络可以是互联网、内联网和/或外联网,或者与互联网通信的内联网和/或外联网。在一些情况下,网络是电信和/或数据网络。网络可以包括一个或多个计算机服务器,这些计算机服务器可以实现分布式计算,诸如云计算。在一些情况下,网络借助于计算机系统可以实现对等网络,该对等网络可使联接到计算机系统的设备充当客户端或服务器。
系统的一些实施方案可以包括一个或多个存储器位置,诸如随机存取存储器、只读存储器、闪存存储器;电子存储单元,诸如硬盘;用于与一个或多个其他系统通信的通信接口,诸如网络适配器;以及/或者外围设备,诸如高速缓存、其他存储器、数据存储和/或电子显示适配器。存储器、存储单元、接口和/或外围设备可通过通信总线(诸如母板)与CPU通信。存储单元可以是用于存储数据的数据存储单元或数据存储库。在一个示例中,一个或多个存储器位置可以存储所接收的测序数据。
所述方法和系统的一些实施方案可以包括一个或多个计算机处理器。一个或多个计算机处理器可以可操作地联接到一个或多个存储器位置,以例如访问存储的测序数据。一个或多个计算机处理器可以实现机器可执行代码,以执行本文所述的方法。例如,一个或多个计算机处理器可以执行机器可读代码,以将测序数据输入映射到参考序列,并且/或者识别CH和/或癌症变体。
本文提供的方法和系统的一些实施方案可以包括机器可执行代码或机器可读代码。在一些此类实施方案中,机器可执行代码或机器可读代码可以以软件的形式提供。在使用期间,代码可以由处理器执行。在一些情况下,代码可以从存储单元检索并存储在存储器上,以供处理器随时访问。在一些实施方案中,可以排除电子存储单元,并且机器可执行指令存储在存储器上。代码可以被预编译并且被配置为与具有被适配为执行代码的处理器的机器一起使用,可以在运行时期间被编译,或者可以在运行时期间被解译。代码可以以编程语言提供,该编程语言可以被选择为使代码能够以预编译、编译或解译的方式执行。
本文提供的系统和方法的一些实施方案(诸如计算机系统)可以在编程中体现。本技术的各个方面可被认为是“产品”或“制品”,其通常为机器(或处理器)可执行代码和/或在机器可读介质类型上承载或体现的相关数据的形式。机器可执行代码可以存储在电子存储单元(诸如存储器或硬盘)上。“存储”类型介质可以包括计算机、处理器等的任何或所有有形存储器,或它们的相关模块,诸如各种半导体存储器、磁带驱动器、磁盘驱动器等,它们可随时为软件编程提供非暂态存储。所有或部分软件有时可通过互联网或各种其他电信网络进行通信。此类通信例如可使得软件能够从一个计算机或处理器加载到另一个计算机或处理器中,例如从管理服务器或主机加载到应用服务器的计算机平台中。因此,可承载软件元件的另一种类型的介质包括光波、电波和电磁波,诸如通过有线网络和光学固话网络以及通过各种空中链路在本地设备之间的物理接口上使用。承载此类波的物理元件(诸如有线或无线链路、光学链路等)也可被认为是承载软件的介质。如本文所用,除非限于非暂态有形“存储”介质,否则术语诸如计算机或机器“可读介质”是指参与向处理器提供指令以供执行的任何介质。
本文所公开的方法和系统的一些实施方案可以包括一个或多个电子显示器或者与一个或多个电子显示器通信。电子显示器可以是计算机系统的一部分,或者直接或通过网络联接到计算机系统。计算机系统可以包括用于提供本文所公开的各种特征和功能的用户界面(UI)。UI的示例包括但不限于图形用户界面(GUT)和基于网络的用户界面。UI可以提供交互式工具,用户可以通过该交互式工具利用本文所述的方法和系统。以举例的方式,如本文所设想的UI可以是基于网络的工具,保健从业者可以通过该工具订购基因测试,定制待测试的基因变体列表,以及接收和查看生物医学报告。
本文所公开的方法和系统的一些实施方案可包括生物医学数据库、基因组数据库、生物医学报告、疾病报告、病例控制分析以及基于来自一个或多个数据库的数据和/或信息进行罕见变体发现分析、一个或多个测定、一个或多个数据或结果、基于或来源于一个或多个测定的一个或多个输出、基于或来源于一个或多个数据或结果的一个或多个输出,或者它们的组合。
实施例
本发明的实施方案在以下实施例中进一步定义。应当理解,这些实施例仅以例示的方式给出。通过以上讨论和这些实施例,本领域的技术人员可以确定本发明的基本特征,并且在不脱离本发明的实质和范围的情况下,可以对本发明的实施方案作出各种变化和修改,以使其适用于各种用途和条件。因此,除了本文所示和所述的那些之外,根据前面的描述,本发明的实施方案的各种修改对于本领域的技术人员而言将是显而易见的。此类修改也旨在落入所附权利要求的范围内。本文所述的每篇参考文献的公开内容以引用的方式全文并入本文,并且用于本文所参考的公开内容。
实施例1
FFPE与血浆样本的变体等位基因频率测定
从无细胞DNA(cfDNA)和匹配的肿瘤样本获得序列数据。通过不同的肿瘤分期(包括实体瘤和白血病)收集四种原始组织类型的样本。总共分析四种组织类型的85个血浆样本,其中15个膀胱样本和32个肺样本与FFPE组织匹配,如表1所示。
表1
类型 血浆样本 组织样本
白血病 5 N/A
膀胱 15 15
55 32
健康 10 N/A
图2示出FFPE与血浆样本之间的变体等位基因频率测定。如图2所示,在具有匹配的FFPE和血浆的47个样本中,在血浆中检测到33个COSMIC热点变体。在33个变体中,在VAF>3%的FFPE中检测到17个变体,在VAF≤3%的FFPE中检测到六个变体,并且检测到十个野生型FFPE。如图所示,仅存在于血浆样本中但不存在于FFPE样本中的大多数突变聚集在TP53、DNMT3A、TET2、SF3B1和CBL中,已知这些基因与克隆性造血(CH)相关。还在具有低变体等位基因频率的FFPE样本中检测到CH突变。
图3描绘了体细胞突变与CH突变之间的VAF比较。如图3所示,体细胞突变的VAF在FFPE中显著较高(p=2e–5),这可能是由于肿瘤脱落,而CH突变的VAF在血浆样本中显著较高(p=0.01)。
实施例2
片段大小分布
使用如实施例1所示的VAF测定来构建片段大小图谱。片段大小图谱来源于肿瘤细胞、健康细胞和异常造血细胞。血浆、体细胞、CH和种系中存在三种主要的变体类型。这些来源于不同的组织来源,如表2所示。
表2
Figure BDA0003130478820000171
通过从携带突变等位基因的测序数据中提取片段来确定变体类型与不同组织来源之间的片段大小差异。结果在所有样本中聚集。如图4所示,发现突变的片段大小分布因不同来源而异。携带来自实体瘤的体细胞突变的片段的大小分布(峰在138bp处)相对于携带来自CH或白血病的体细胞突变的片段的大小分布(峰在166bp处)发生改变。在携带体细胞突变的片段与健康造血细胞之间未观察到大小分布的显著差异(p值=0.86)。
如图5所示,将不同来源的突变按片段大小分布分类。通过混合不同来源的片段,以2000倍覆盖率计算机模拟不同VAF的10,000个CH或体细胞突变。通过用似然模型拟合片段大小分布,实现了81.5%、92.5%、98.3%和99.8%的灵敏度,对于1%、2.5%、5%和10%CH突变,特异性分别为82%、92.5%、97.5%和99.9%。
这些实施例表明,恶性或健康造血细胞释放的cfDNA的片段大小分布不同于实体瘤释放的cfDNA的片段大小分布。另外,片段大小分布可以用于区分不同细胞来源的体细胞突变。
实施例3
cfDNA中的克隆性造血变体
使用图1所示的方法对四十对cfDNA和血沉棕黄层(白细胞)DNA进行图谱分析。在cfDNA和血沉棕黄层中均观察到变体为非种系(具有低VAF)。结果包括106个变体,其中92个是非同义的,14个是同义的。如图6所示,针对cfDNA测定的VAF与针对血沉棕黄层测定的VAF相关。
实施例4
测量肿瘤突变负荷
使用实施例3所分析的样本确定肿瘤突变负荷。样本包括40对cfDNA和血沉棕黄层DNA,使用图1所示的方法对其进行图谱分析。
通过确定合格变体除以有效小组大小来计算原始TMB。合格变体包括编码区中的变体、不在低置信度区中的变体、频率大于0.4%且小于40%的变体、覆盖率大于500倍的变体、单核苷酸变体(SNV)以及插入和缺失变体(插入缺失)、非同义和同义变体,排除COSMIC计数大于50的变体,排除多核苷酸变体(MNV)和/或排除‘I’E T2、TP53、DNMT3A和/或CBL中具有突变的变体。有效小组大小包括覆盖率大于500倍的总编码区。在该实施例中,总变体包括1025个,种系过滤后的变体包括121个,合格区域中的变体包括86个,合格区域中的SNV和插入缺失包括81个,COSMIC移除后的变体计数包括80个,约0.4%的变体计数包括78个,并且排除基因TET2、TP53、DNMT3A和CBL的变体计数包括75个变体。因此,合格变体总计76个。有效小组大小为1.307291Mb。原始TMB为76/1.30729=57.4个突变/Mb。经调节的TMB为(57.37055–1.5)/0.91=61.4。
如图7A所示,与全血细胞TMB(T/N TMB)相比,仅肿瘤TMB(仅T TMB)中的TMB与R2的相关性为0.91,并且由于CH变体,仅肿瘤TMB高于肿瘤正常TMB。如图7B所示,与经克隆性造血调节的仅T TMB相比,T/N TMB中的TMB与R2的相关性为0.934,并且仅肿瘤TMB类似于肿瘤正常TMB。
如本文所用,术语“包含”与“包括”、“含有”或“特征在于”同义,并且是包括性的或开放式的,并且不排除另外的未列举的要素或方法步骤。
以上描述公开了本发明的几种方法和材料。本发明易于在方法和材料上进行修改,以及在制造方法和装置上进行改变。考虑到本公开或本文公开的本发明的实践,此类修改对于本领域技术人员而言将变得显而易见。因此,并非意图将本发明限制于本文所公开的具体实施方案,而是其涵盖了落入本发明的真实范围和实质内的所有修改形式和替代形式。
本文引用的所有参考文献,包括但不限于公开和未公开的申请、专利和参考文献,均全文以引用方式并入本文,并且据此成为本说明书的一部分。就以引用方式并入的出版物和专利或专利申请与说明书中包含的公开内容相矛盾的程度而言,本说明书旨在取代和/或优先于任何此类矛盾的材料。

Claims (17)

1.一种用于区分循环肿瘤DNA(ctDNA)样本中的癌症变体与造血细胞变体的方法,包括:
(a)获得或已经获得包含多种无细胞DNA(cfDNA)片段的ctDNA样本;
(b)从所述样本中提取cfDNA片段,其中所述cfDNA片段包含多种变体;
(c)对所述多种变体中的每一种变体进行分子图谱分析,包括:
(i)确定所述多种变体中的每一种变体的变体等位基因频率(VAF),其中所述多种变体包括癌症变体和造血细胞变体,以及
(ii)生成片段大小分布图谱以鉴定造血细胞变体;
(d)通过移除所鉴定的造血细胞变体来鉴定癌症变体。
2.根据权利要求1所述的方法,还包括从所述多种变体中移除种系变体。
3.根据权利要求2所述的方法,其中通过将数据库过滤器或接近过滤器应用于所述多种变体来移除所述种系变体。
4.根据权利要求1所述的方法,还包括对所述cfDNA片段进行测序以获得序列数据。
5.根据权利要求4所述的方法,还包括将所述序列数据与参考序列进行比对,以及鉴定所述序列数据中的变体。
6.根据权利要求1所述的方法,其中所述ctDNA样本来源于实体样本或血浆样本。
7.根据权利要求6所述的方法,其中所述实体样本被固定。
8.根据权利要求6所述的方法,其中所述样本包含肿瘤细胞。
9.根据权利要求6所述的方法,其中所述样本包括血清样本、粪便样本、血液样本或肿瘤样本。
10.根据权利要求1所述的方法,其中所述方法是计算机实现的方法。
11.一种确定肿瘤的肿瘤突变负荷的方法,包括:
从包含肿瘤细胞的生物样本中获得序列数据;
根据所述序列数据确定多种变体;以及
根据权利要求1所述的方法确定所述多种变体中癌症变体的数量,其中所述癌症变体的数量等于肿瘤的肿瘤突变负荷。
12.一种治疗肿瘤的方法,包括:
根据权利要求11所述的方法确定肿瘤突变负荷大于或等于10种癌症变体的肿瘤;以及
通过施用有效量的检查点抑制剂来治疗所述肿瘤。
13.根据权利要求12所述的方法,其中所述肿瘤选自由以下项组成的组:结直肠肿瘤、肺肿瘤、子宫内膜肿瘤、子宫肿瘤、胃肿瘤、黑素瘤、乳腺肿瘤、胰腺肿瘤、肾肿瘤、膀胱肿瘤和脑肿瘤。
14.根据权利要求12所述的方法,其中所述检查点抑制剂选自由以下项组成的组:CTLA-4抑制剂、PD-1抑制剂和PD-L1抑制剂。
15.根据权利要求12所述的方法,其中所述检查点抑制剂选自由以下项组成的组:伊匹单抗、纳武单抗、派姆单抗、斯巴单抗、阿特珠单抗、阿维单抗和度伐单抗。
16.一种用于分析基因变异数据的电子系统,包括:
在处理器上运行并且被适配为根据来自cfDNA样本的序列数据鉴定多种变体的信息学模块,其中所述多种变体包括癌症变体和造血细胞变体;
用于对所述多种变体中的每一种变体进行分子图谱分析的分析仪,其中所述分析仪被配置为确定所述多种变体中的每一种变体的变体等位基因频率(VAF)并且被配置为生成片段大小分布图谱;
用于通过移除所鉴定的造血细胞变体来鉴定癌症变体的分析仪;以及
被适配为返回未从所述多种变体中移除的变体的显示模块。
17.根据权利要求16所述的系统,其中所述系统还包括被配置为从所述多种变体中移除种系变体的数据库过滤模块或接近过滤模块。
CN202080007339.8A 2019-10-08 2020-09-16 来自克隆性造血的无细胞dna突变的片段大小表征 Active CN113227401B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962912440P 2019-10-08 2019-10-08
US62/912,440 2019-10-08
PCT/US2020/050979 WO2021071638A1 (en) 2019-10-08 2020-09-16 Fragment size characterization of cell-free dna mutations from clonal hematopoiesis

Publications (2)

Publication Number Publication Date
CN113227401A true CN113227401A (zh) 2021-08-06
CN113227401B CN113227401B (zh) 2024-06-07

Family

ID=72659968

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080007339.8A Active CN113227401B (zh) 2019-10-08 2020-09-16 来自克隆性造血的无细胞dna突变的片段大小表征

Country Status (8)

Country Link
US (1) US20210102199A1 (zh)
EP (1) EP4041924A1 (zh)
JP (2) JP2022516092A (zh)
KR (1) KR20210098492A (zh)
CN (1) CN113227401B (zh)
AU (1) AU2020364225B2 (zh)
CA (1) CA3123297A1 (zh)
WO (1) WO2021071638A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11995051B1 (en) * 2021-01-04 2024-05-28 Color Health, Inc. Variant identification by unique data set detection
WO2023168247A1 (en) * 2022-03-02 2023-09-07 Olatec Therapeutics Llc Methods for treating solid cancer patients with clonal hematopoiesis of indeterminate potential
KR102544002B1 (ko) 2022-03-10 2023-06-16 주식회사 아이엠비디엑스 체세포 변이 및 생식세포 변이를 구별하는 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170058332A1 (en) * 2015-09-02 2017-03-02 Guardant Health, Inc. Identification of somatic mutations versus germline variants for cell-free dna variant calling applications
CN108603234A (zh) * 2016-01-22 2018-09-28 格瑞尔公司 基于变体的疾病诊断和追踪
US20180307796A1 (en) * 2017-04-21 2018-10-25 Illumina, Inc. Using cell-free dna fragment size to detect tumor-associated variant
CN108885648A (zh) * 2016-02-09 2018-11-23 托马生物科学公司 用于分析核酸的系统和方法
WO2019169042A1 (en) * 2018-02-27 2019-09-06 Cornell University Ultra-sensitive detection of circulating tumor dna through genome-wide integration

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016085876A1 (en) * 2014-11-25 2016-06-02 The Broad Institute Inc. Clonal haematopoiesis
CA2980078C (en) * 2015-03-16 2024-03-12 Personal Genome Diagnostics Inc. Systems and methods for analyzing nucleic acid
CN107922973B (zh) 2015-07-07 2019-06-14 远见基因组系统公司 用于基于测序的变型检测的方法和系统
CN109196359B (zh) * 2016-02-29 2022-04-12 基础医疗股份有限公司 用于评估肿瘤突变负荷的方法和系统
US11959142B2 (en) * 2017-05-04 2024-04-16 The Johns Hopkins University Detection of cancer
EP3665308A1 (en) * 2017-08-07 2020-06-17 The Johns Hopkins University Methods and materials for assessing and treating cancer
EP3765633A4 (en) * 2018-03-13 2021-12-01 Grail, Inc. PROCESS AND SYSTEM FOR THE SELECTION, ADMINISTRATION AND ANALYSIS OF HIGH DIMENSIONAL DATA
WO2020132499A2 (en) * 2018-12-21 2020-06-25 Grail, Inc. Systems and methods for using fragment lengths as a predictor of cancer
EP3938534A4 (en) * 2019-03-13 2023-03-29 Grail, LLC SYSTEMS AND METHODS FOR ENRICHMENT OF CANCER DERIVED FRAGMENTS USING FRAGMENT SIZE

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170058332A1 (en) * 2015-09-02 2017-03-02 Guardant Health, Inc. Identification of somatic mutations versus germline variants for cell-free dna variant calling applications
CN108603234A (zh) * 2016-01-22 2018-09-28 格瑞尔公司 基于变体的疾病诊断和追踪
CN108885648A (zh) * 2016-02-09 2018-11-23 托马生物科学公司 用于分析核酸的系统和方法
US20180307796A1 (en) * 2017-04-21 2018-10-25 Illumina, Inc. Using cell-free dna fragment size to detect tumor-associated variant
WO2019169042A1 (en) * 2018-02-27 2019-09-06 Cornell University Ultra-sensitive detection of circulating tumor dna through genome-wide integration

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
FLORENT MOULIERE ET AL.: "Enhanced detection of circulating tumor DNA by fragment size analysis", 《SCIENCE TRANSLATIONAL MEDICINE》, vol. 10, no. 466, 7 November 2018 (2018-11-07), pages 4921, XP093054355, DOI: 10.1126/scitranslmed.aat4921 *
HU ET AL.: "False-positive plasma genotyping due to clonal hematopoiesis", 《CLINICAL CANCER RESEARCH: AN OFFICIAL JOURNAL OF THE AMERICAN ASSOCIATION FOR CANCER RESEARCH》, vol. 24, no. 18, pages 4437 - 4443 *
黄宝丽: "血浆循环游离DNA在非小细胞肺癌中的临床应用研究", 《中国优秀硕士学位论文全文数据库(电子期刊)》, vol. 2017, no. 1, 15 January 2017 (2017-01-15), pages 072 - 22 *

Also Published As

Publication number Publication date
KR20210098492A (ko) 2021-08-10
US20210102199A1 (en) 2021-04-08
JP2022516092A (ja) 2022-02-24
CA3123297A1 (en) 2021-04-15
WO2021071638A1 (en) 2021-04-15
CN113227401B (zh) 2024-06-07
JP2023089073A (ja) 2023-06-27
AU2020364225A1 (en) 2021-07-22
AU2020364225B2 (en) 2023-10-19
EP4041924A1 (en) 2022-08-17

Similar Documents

Publication Publication Date Title
JP6930948B2 (ja) 癌検出のための血漿中dnaの突然変異解析
US11984195B2 (en) Methylation pattern analysis of tissues in a DNA mixture
JP6829211B2 (ja) 癌スクリーニング及び胎児分析のための変異検出
US20200149118A1 (en) Cell-free dna for assessing and/or treating cancer
CN113227401B (zh) 来自克隆性造血的无细胞dna突变的片段大小表征
IL267845A (en) Maternal plasma transcriptome analysis using heavily parallel RNA flooring
US20210262016A1 (en) Methods and systems for somatic mutations and uses thereof
US20220228221A1 (en) Diagnostics and Treatments Based Upon Molecular Characterization of Colorectal Cancer
Zhang et al. Identification of five cytotoxicity-related genes involved in the progression of triple-negative breast cancer
Gerrie et al. Population-based characterization of the genetic landscape of chronic lymphocytic leukemia patients referred for cytogenetic testing in British Columbia, Canada: the role of provincial laboratory standardization
Kamath-Loeb et al. Accurate detection of subclonal variants in paired diagnosis-relapse acute myeloid leukemia samples by next generation Duplex Sequencing
Wilmott et al. Tumour procurement, DNA extraction, coverage analysis and optimisation of mutation-detection algorithms for human melanoma genomes
WO2020053467A1 (es) Método de obtención de datos útiles para el diagnóstico, estratificación y/o seguimiento de pacientes con artritis reumatoide
Saygin et al. Acute lymphoblastic leukemia with myeloid mutations is a high-risk disease associated with clonal hematopoiesis
TW202424208A (zh) 無細胞dna的表觀遺傳學分析
EA042093B1 (ru) Мутационный анализ днк в плазме для детектирования рака

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40058359

Country of ref document: HK

GR01 Patent grant