CN116018646A - 用于表征无细胞核酸片段的方法 - Google Patents

用于表征无细胞核酸片段的方法 Download PDF

Info

Publication number
CN116018646A
CN116018646A CN202180047341.2A CN202180047341A CN116018646A CN 116018646 A CN116018646 A CN 116018646A CN 202180047341 A CN202180047341 A CN 202180047341A CN 116018646 A CN116018646 A CN 116018646A
Authority
CN
China
Prior art keywords
cfna
fragments
fragment
sequence
oligonucleotide decoy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180047341.2A
Other languages
English (en)
Inventor
戴安娜·阿布杜伊瓦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aktur Corp
Original Assignee
Aktur Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aktur Corp filed Critical Aktur Corp
Publication of CN116018646A publication Critical patent/CN116018646A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本公开内容提供了用于无细胞核酸(cfNA)的各种用途的方法和系统。cfNA片段化模式的功能性分型可以用于疾病的非侵入性检测、诊断和监测。一个实施方案可以确定对象中癌症的阶段、对象中癌症的进展或对象中对癌症的治疗的应答性。本文公开的另一个实施方案可以包括无测序诊断方法。

Description

用于表征无细胞核酸片段的方法
交叉引用
本申请要求2020年5月22日提交的美国临时申请第63/029,328号的优先权的权益,其通过引用并入本文。
背景技术
无细胞核酸(cfNA)可以包括无细胞脱氧核糖核酸(cfDNA)、无细胞核糖核酸(cfRNA)或其一些组合并且存在于人类的循环血浆、尿液和其他体液中。cfDNA包括单链DNA片段和双链DNA片段两者,它们可能在健康个体的循环血浆中处于低浓度。然而,cfDNA水平在患有慢性和急性病理的患者中可能升高,并且可以提供一种非侵入性方法来定量或观察组织损伤、细胞死亡或细胞更新。来源于肿瘤的cfDNA可用于肿瘤存在、类型或位置的非侵入性检测,并且可以允许肿瘤或其他恶性肿瘤的早期检测。已经在母体循环中观察到胎儿来源的cfDNA,并且可以被用作产前筛查的非侵入性方法。在移植受者的循环液中也已经检测到供体来源的cfDNA,并且可能是这些群体中急性排斥反应的生物标志物。考虑到在治疗广泛病症中与侵入性诊断程序相关联的风险,使用非侵入性基于cfDNA的诊断可能很重要。
发明内容
在一些方面,本公开内容提供了一种表征来源于基因组区域的无细胞核酸(cfNA)片段的方法,其包括:使包括cfNA的组合物与包括与基因组区域的序列互补的序列的寡核苷酸诱饵接触,以及表征与寡核苷酸诱饵杂交的cfNA片段的片段化模式(fragmentationpattern),其中表征片段化模式不包括鉴定cfNA片段的基因组位置或长度。在一些实施方案中,表征cfNA片段的片段化模式包括分析与寡核苷酸诱饵杂交的cfNA片段的丰度。在一些实施方案中,表征cfNA片段的片段化模式包括分析与寡核苷酸诱饵杂交的cfNA片段的大小。在一些实施方案中,表征cfNA片段的片段化模式包括计算转录活性评分(TAS)。在一些实施方案中,分析cfNA片段的大小包括进行电泳分离。在一些实施方案中,电泳分离包括凝胶电泳或毛细管电泳。在一些实施方案中,电泳分离包括cfNA片段的微流体分离。在一些实施方案中,分析cfNA片段的大小包括将cfNA片段的迁移率与已知标准进行比较。在一些实施方案中,计算TAS包括确定长度为至少230、255、270、285或310个核苷酸的总cfNA的比例。在一些实施方案中,计算TAS包括确定长度为230-600个核苷酸的总cfNA的比例。在一些实施方案中,计算TAS包括确定受DNA聚合酶或转录因子保护的总cfNA的比例。在一些实施方案中,增加的TAS指示医学病况。在一些实施方案中,TAS的增加或减少指示医学病况。
在一些实施方案中,表征cfNA片段包括:i)对与寡核苷酸诱饵杂交的cfNA片段进行测序,以及ii)对cfNA片段核苷酸序列与参考序列进行无比对序列比较;其中基因组区域包括参考序列。在一些实施方案中,所述方法进一步包括对与寡核苷酸诱饵的第一末端远端的序列比对的cfNA片段序列相对于与寡核苷酸诱饵的第二末端远端的序列比对的cfNA片段序列的相对量进行定量。在一些实施方案中,表征cfNA片段的片段化模式包括:a)对与寡核苷酸诱饵杂交的cfNA片段进行测序,b)鉴定基因组区域内的两个或更多个子区域,和c)将包括与每个子区域匹配的序列的cfNA片段的数量进行计数,其中寡核苷酸诱饵包括与基因组区域的序列互补的序列。在一些实施方案中,如果cfNA片段的序列与子区域的序列在40个连续碱基上具有不超过一个的错配,则cfNA片段与子区域匹配。
在一些实施方案中,所述方法包括a)使所述组合物与寡核苷酸诱饵和第二寡核苷酸诱饵接触,b)分析与寡核苷酸诱饵杂交的cfNA片段,和c)分析与第二寡核苷酸诱饵杂交的cfNA片段,其中寡核苷酸诱饵和第二寡核苷酸诱饵包括与基因组区域的序列互补的序列。在一些实施方案中,所述方法进一步包括将与寡核苷酸诱饵杂交的cfNA片段和与第二寡核苷酸诱饵杂交的cfNA片段进行比较。在一些实施方案中,分析与寡核苷酸诱饵和第二寡核苷酸诱饵杂交的cfNA片段包括测量与寡核苷酸诱饵杂交的cfNA片段的量和与第二寡核苷酸诱饵杂交的cfNA片段的量。在一些实施方案中,分析与寡核苷酸诱饵和第二寡核苷酸诱饵杂交的cfNA片段包括分析cfNA片段的大小。在一些实施方案中,所述方法进一步包括a)对与寡核苷酸诱饵的第一末端远端的序列比对的cfNA片段序列相对于与寡核苷酸诱饵的第二末端远端的序列比对的cfNA片段序列的相对量进行定量,b)对与第二寡核苷酸诱饵的第一末端远端的序列比对的cfNA片段序列相对于与第二寡核苷酸诱饵的第二末端远端的序列比对的cfNA片段序列的相对量进行定量。在一些实施方案中,所述方法进一步包括对与寡核苷酸诱饵的末端远端的序列比对的cfNA片段序列相对于与第一寡核苷酸诱饵的第二末端远端的序列比对的cfNA片段序列的相对量进行定量。
在一些方面,本公开内容提供了一种表征包括基因组区域的序列的cfNA片段的方法,其包括将来自包括有包括基因组区域的第一部分的cfNA的组合物的cfNA片段的量与包括基因组区域的第二部分的cfNA片段的量进行比较。在一些实施方案中,包括基因组区域的第一部分和第二部分的cfNA片段的量通过包括扩增基因组区域的所述部分的方法来确定。在一些实施方案中,扩增通过PCR、环介导等温扩增、基于核酸序列的扩增、链置换扩增或多重置换扩增进行。
在一些方面,本公开提供了一种表征包括基因组区域的序列的cfNA片段的方法,其包括对cfNA片段进行测序,以及将匹配代表第一片段化模式的第一组参考序列的cfNA片段序列的量与匹配代表第二片段化模式的第二组参考序列的cfNA片段序列的量进行比较。在一些实施方案中,通过无比对序列比较来鉴定与第一组参考序列和第二组参考序列匹配的cfNA片段序列。
在一些方面,本公开提供了一种分析cfNA片段化模式的方法,其包括根据本文公开的方法来表征包括两个或更多个基因组区域的序列的cfNA片段。在一些实施方案中,寡核苷酸诱饵与亲和标签缀合。在一些实施方案中,亲和标签是生物素。在一些实施方案中,寡核苷酸诱饵与固体表面缀合。在一些实施方案中,固体表面是珠。在一些实施方案中,固体表面是平面表面。在一些实施方案中,cfNA片段是无细胞脱氧核糖核酸(cfDNA)片段。在一些实施方案中,cfNA片段是无细胞核糖核酸(cfRNA)片段。在一些实施方案中,包括cfNA的组合物是血浆、血清、唾液、尿液、血液组分、脑脊液、胸膜液、羊水、腹膜液、腹水、腹腔骨盆冲洗液/灌洗液、浆液性渗出液、气管支气管或支气管肺泡灌洗液。在一些实施方案中,包括cfNA的组合物是血浆。在一些实施方案中,基因组区域包括启动子的至少一个核苷酸、转录起始位点、DNase I超敏位点、Pol II暂停位点、第一外显子或外显子边界的内含子。在一些实施方案中,基因组区域包括第一外显子。在一些实施方案中,基因组区域包括活性转录起始位点。在一些实施方案中,基因组区域包括类固醇应答基因的起始位点或第一外显子。在一些实施方案中,类固醇应答基因是糖皮质激素应答基因、抗炎基因或嗜中性粒细胞激活特征基因。在一些实施方案中,类固醇应答基因是DUSP1或SAE1。在一些实施方案中,基因组区域包括血管标志物基因的起始位点或第一外显子。在一些实施方案中,内皮细胞标志物基因是VWF或EPHB4。在一些实施方案中,基因组区域选自EPHB4的前5个外显子。
在一些方面,本公开内容提供了一种评估对象的医学病况的方法,其包括根据本文公开的方法中的任何一种来表征包括基因组区域的序列的cfNA片段的片段化模式。
在一些方面,本公开提供了一种用于治疗对象的癌症的适应性免疫疗法的方法,其包括:a)向所述对象施用第一疗程的第一免疫疗法化合物;b)从所述对象获得与血管再生(angiogenesis)和/或血管生成(vasculogenesis)相关联的一种或多种基因的纵向无细胞DNA片段化概况;和c)向所述对象施用第二疗程的免疫疗法;其中所述第二疗程的免疫疗法包括:i.第二免疫疗法化合物,如果无细胞DNA片段化概况指示对所述第一免疫疗法化合物的应答不足;或者ii.第二疗程的第一免疫疗法化合物,如果无细胞DNA片段化概况不指示对所述第一免疫疗法化合物的应答不足。
在一些方面,本公开提供了一种在对象中治疗医学病况的方法,其包括:向所述对象施用一疗程的疗法,以及从所述对象获得一个或多个基因组区域的纵向无细胞DNA片段化概况;其中纵向无细胞DNA片段化概况指示所述对象已对所述疗程的疗法产生应答。
在一些方面,本公开内容提供了一种在对象中治疗医学病况的方法,其包括:从所述对象获得一个或多个基因组区域的无细胞DNA片段化概况;以及向所述对象施用一疗程的疗法,其中所述无细胞DNA片段化概况指示所述疗程的疗法适用于所述对象。
根据以下详细描述,本公开内容的其他方面和优点对于本领域技术人员将变得显而易见,其中仅示出和描述了本公开内容的说明性实施方案。如将认识到的,本公开内容能够具有其他和不同的实施方案,并且其若干细节能够在各种明显方面进行修改,所有这些都不脱离本公开内容。因此,附图和描述本质上被认为是说明性的,并且不被视为限制性的。
通过引用并入
本说明书中提及的所有出版物、专利和专利申请均通过引用以其整体并入本文,其程度与如同每个单独的出版物、专利或专利申请被具体且单独地指明通过引用并入的程度相同。就通过引用并入的出版物和专利或专利申请与包含在本说明书中的公开相矛盾而言,本说明书旨在取代和/或优先于任何此类矛盾的材料。
附图说明
本发明的新的特征在所附的权利要求中详细阐述。通过参考以下阐述说明性实施方案的详细描述和附图(在本文中也称为“图(Figure)”和“图(FIG.)”),将获得对本发明的特征和优点的更好理解,在说明性实施方案中利用了本发明的原理,在附图中:
图1示出了一个示意图,其中雌性对象在施用抽血之后接受单次每日剂量为40mg的泼尼松龙,一种广泛用于治疗多种疾病的有效抗炎药物。16小时后进行第二次抽血。
图2示出了抗炎糖皮质激素治疗诱导DUSP1的表达,观察到在时间点2相对于时间点1的长读数计数的相对增加。
图3示出了糖皮质激素治疗诱导miR-708的表达,导致RAP1B表达的抑制,观察到在时间点2相对于时间点1的“长”读数计数的相对下降。
图4示出了如由跨越6个外显子的复合信号确定的染色体7的基因组区域(EphB4基因座)的cfDNA片段化模式的表征及其用于监测对免疫疗法的应答。
图5示出了包括代表脉管系统概况的两个基因组区域的cfDNA片段化模式的表征。
图6示出了一种方法的示意图,其中寡核苷酸诱饵靶向代表临床相关功能的多个基因组区域,并基于片段长度将它们聚类以产生复合信号。
图7示出了基于测序的解卷积,其中将缺少绝对或相对基因组位置的各种大小的序列的自定义参考集合映射到文库,并且所映射的计数解卷积不涉及直接大小确定。
图8示出了cfNA片段与对沉默(短)和活跃(长)cfDNA片段化模式具有选择性的诱饵的杂交捕获,其中通过测量与每个诱饵杂交的cfDNA的量来确定模式之间的区别。
图9示出了在竞争性PCR反应中使用三种探针,随后通过考虑扩增偏倚或直接针对合成池进行校准,对基础片段计数进行解卷积。
图10示出了在竞争性PCR反应中使用四种探针,随后对基础计数进行解卷积。
图11示出了使用包括多个区段(关键字)的cfNA测序和自定义参考来区分cfNA片段化模式。
图12-图18示出了区分两种cfNA片段化模式的各种方法。
图19示出了DUSP1的p1启动子区域和转录活性基因座(TAL)中基因表达的加帽分析(CAGE)信号,其中cfNA片段化模式在转录沉默状态和活跃状态之间不同。
图20示出了与杂交捕获结合使用的各种过程。
图21示出了基于杂交的捕获,其中诱饵(或探针)与转录活性基因座(TAL)的核酸序列互补。
图22示出了用于捕获与DUSP1的TAL相关联的cfNA片段的示例性诱饵。
图23示出了一种模拟,其中来源于DUSP1的TAL的cfNA片段被示例性诱饵捕获。
图24示出了侧翼为测序衔接子的cfDNA片段。序列读数的长度可以比cfDNA片段的长度更长。
图25示出了一种模拟,其中来源于DUSP1的TAL的cfNA片段被示例性诱饵捕获。在两个时间点捕获的cfNA片段被分为长cfNA片段组和短cfNA片段组。右图示出了从长cfNA片段的比例计算的TAS。
图26示出了两个cfNA样本的生物分析仪迹线。两个样本都在大约167个碱基对处具有较短cfDNA片段的主峰,这是受单核小体保护的cfDNA片段的大小。右边的迹线具有指示转录活性的较高比例的长cfDNA片段。
图27示出了由来自DUSP1的TAL的诱饵捕获的cfNA样本的生物分析仪迹线。单核小体峰向右移动,因为cfNA的侧翼是测序衔接子。长cfDNA片段的比例在时间点2处较高。
图28A-28B示出了从生物分析仪迹线中区分短片段和长片段的方法。短片段的长度与受单核小体保护的DNA的大小一致。
图29示出了从由诱饵捕获的cfDNA片段确定的转录激活评分。在时间点2处测量的TAS的增加与来自图25的NGS模拟的预期一致。
图30A-30D示出了用于捕获来源于TAL的cfDNA的双诱饵系统,所述TAL与参与糖皮质激素代谢的两种基因-DUSP1和SAE1相关联。
图31使用图31的双诱饵系统分析从糖皮质激素治疗实验中分离的cfDNA,比较了模拟的(基于NGS的)和实际的双诱饵转录激活评分。
图32示出了N诱饵复合读出系统。
图33示出了通过cfDNA片段的序列与参考序列的无比对比较来表征与诱饵杂交的cfDNA片段的模拟示例。
图34示出了对与在诱饵的末端远端的序列比对的cfDNA片段序列的相对量进行定量的模拟示例。
图35示出了通过对包括与转录活性基因座内的两个或更多个经鉴定的子区域中的每一个相匹配的序列的cfDNA片段的数量进行计数来表征与诱饵杂交的cfDNA片段的模拟示例。
图36示出了表征与一个转录活性基因座内的两个诱饵杂交的cfDNA片段的模拟示例。
图37示出了表征与一个转录活性基因座内的两个诱饵杂交的cfDNA片段的模拟示例,所述转录活性基因座与指示长cf DNA片段的参考序列无比对匹配。
具体实施方式
虽然本文示出和描述了本发明的各种实施方案,但是对于本领域的技术人员来说将显而易见的是,此类实施方案仅通过示例的方式提供。在不脱离本发明的情况下,本领域技术人员可以想到许多变化、改变和替换。应该理解,可以采用本文描述的本发明的实施方案的各种替代方案。
如本文所用,术语“核酸”通常是指任何长度的核苷酸(例如,至少2、3、4、5、6、7、8、9、10、100、500、1000或更多个核苷酸)的聚合物形式,脱氧核糖核苷酸或核糖核苷酸,或其类似物。核酸可以包含一个或多个选自腺苷(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(TO和尿嘧啶(U)或其变体的亚基。核苷酸可以包含A、C、G、T或U或其变体。核苷酸可以包含任何可以并入到生长中的核酸链的亚基。此类亚基可以是A、C、G、T或U,或对更多互补的A、C、G、T或U中的一种具有特异性的,或与嘌呤(例如A或G,或其变体)或嘧啶(例如C、T或U,或其变体)互补的任何其他亚基。在一些示例中,核酸可以是单链或双链的,在一些情况下,核酸分子是环状的。核酸的非限制性示例包括脱氧核糖核酸(DNA)和核糖核酸(RNA)。核酸可以包含基因或基因片段的编码区域或非编码区域、由连锁分析定义的基因座、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核酶、cDNA、重组核酸、分支核酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物。核酸分子可以包括一个或多个修饰的核苷酸,诸如甲基化的核苷酸和核苷酸类似物。
如本文所用,术语“表达(express)”和“表达(expression)”意指允许或导致基因或DNA序列中的信息变得明显,例如通过激活参与相应基因或DNA序列的转录和翻译的细胞功能来产生蛋白质。DNA序列在细胞中表达或由细胞表达,以形成“表达产物”,诸如蛋白质。表达产物本身,例如所得到的蛋白质,也可以是待被细胞“表达”的。表达产物可以被表征为细胞内的、细胞外的或跨膜的。术语“细胞内的”意指细胞内的物质。术语“细胞外的”意指细胞外的物质。术语跨膜意指在细胞外具有胞外结构域、一部分嵌入细胞膜中并且在细胞内具有胞内结构域的物质。
如本文所用,术语“样本”、“生物样本”或“患者样本”通常指是含有或怀疑含有核酸分子的任何样本。例如,样本可以是含有一种或多种核酸分子的生物样本。生物样本可以从以下中获得(例如,从以下中提取或分离)或者包含以下:血液(例如,全血)、血浆、血清、脐带血、绒毛膜绒毛、羊水、灌洗液(例如,支气管肺泡、胃、腹膜、导管、耳、关节镜)、活检样本(例如,来自植入前胚胎)、体腔穿刺样本、胎儿有核细胞或胎儿细胞残余物、胆汁、母乳、尿液、唾液、粘膜排泄物、痰、粪便、汗液、阴道液、来自鞘膜积液(例如,睾丸鞘膜积液)的液体、阴道冲洗液、胸膜液、腹水、脑脊液、支气管肺泡灌洗液、来自乳头的排出液、来自身体不同部位(例如,甲状腺、乳房)的抽吸液、泪液、胚胎细胞或胎儿细胞(例如,胎盘细胞)。在一些实施方案中,通过足跟或手指穿刺、从头皮静脉或通过耳垂穿刺获得血液样本。生物样本可以是流体或组织样本(例如,皮肤样本)。生物样本可以包含来自活的或死的对象的任何组织或材料。生物样本可以是无细胞样本。生物样本可以包括核酸(例如,DNA或RNA)或其片段。
术语“核酸”可以指脱氧核糖核酸(DNA)、核糖核酸(RNA)或其任何杂交体或片段。样本中的核酸可以是无细胞核酸。样本可以是液体样本或固体样本(例如,细胞或组织样本)。在一些实例中,样本从无细胞体液诸如全血中获得。在这种情况下,样本可以包含无细胞DNA和/或无细胞RNA。在一些示例中,可以富集cfDNA的生物样本(例如,经由离心方案获得的血浆样本)中的大部分DNA可以是无细胞的(例如,大于50%、60%、70%、80%、90%、95%或99%的DNA可以是无细胞的)。可以对生物样本进行处理以物理破坏组织或细胞结构(例如,离心和/或细胞裂解),从而将细胞内组分释放到溶液中,该溶液可以进一步含有酶、缓冲液、盐、去污剂等,其可以用于制备用于分析的样本。在一些示例中,样本可以包含循环肿瘤细胞或循环胎儿细胞。
如本文所用,术语“全血液样本”通常是指未被分馏或分离成其组成部分的全血液样本。在采集过程期间,全血可以与抗凝血剂诸如EDTA或ACD混合,但通常不以其他方式加工。“全血”可以指用于输血或进一步加工的特定标准化的产品,或者指任何未经修饰的采集的血液。
如本文所用,术语“血液分馏”通常是指分馏全血或将其分离成其组成部分的过程。这可以通过对血液进行离心来完成。得到的组分可以是上层相中的血浆的澄清溶液(其可以被分离成其自身的馏分),血沉棕黄层(其是在中间与血小板混合的白血球(白细胞)的薄层),以及在血细胞比容馏分中的离心管底部的红血球(红细胞)。
如本文所用,术语“血浆(blood plasma)”或“血浆(plasma)”通常是指血液中的稻草色/浅黄色液体组分,其通常将全血中的血细胞保持在悬浮状态。血浆按体积计占总血液的约55%。它是[细胞外液](细胞外的所有体液)的血管内液体部分。它主要是水(93体积%),并含有溶解的蛋白质,包括白蛋白、免疫球蛋白和纤维蛋白原、葡萄糖、凝血因子、电解质(Na+、Ca2+、Mg2+、HCO3 -、Cl-等)、激素和二氧化碳。血清是不含纤维蛋白原或其他凝血因子的血浆(即全血减去细胞和凝血因子两者)。
如本文所用,如本文所用的术语“无细胞脱氧核糖核酸”(cfDNA)通常是指体液(尤其是血液)中未被包封的DNA。cfDNA是在坏死或凋亡期间可能进入血流的核酸片段。未被包封的DNA的片段可能会被巨噬细胞或其他免疫细胞吞噬。cfDNA片段平均长度为约170个碱基对,并且可能存在于早期疾病和晚期疾病两者中。cfDNA可以具有在妊娠母体内循环的胎儿来源,来源于捐赠的器官或细胞中的受体组织,或者可以从恶性肿瘤中释放。cfDNA可以用作任何病理的存在或进展的生物标志物。
如本文所用,术语“液体活检”通常是指非侵入性或最小侵入性的实验室测试或测定(例如,生物样本或无细胞DNA的测试或测定)。在一些情况下,对通过简单的针刺获得的血浆或血清样本进行液体活检。血液可以在疗法的疗程期间的任何时间抽取,并允许动态监测分子变化,而不是依赖于静态时间点。此类“液体活检”测定可以报告一种或多种病理学相关标志物基因的测量值(例如,次要等位基因频率、基因表达或蛋白质表达)。
如本文所用,术语“片段”(例如,cfDNA片段)可以指包括至少3个连续核苷酸的多核苷酸或多肽序列的一部分。核酸片段可以保留亲本多核苷酸的生物活性和/或一些特征。cfDNA可以作为具有不同遗传和表观遗传概况和不同长度的片段脱落。片段可以是短(小)片段或长(大)片段,并且片段(诸如cfDNA片段)的大小模式可以在病理条件下变化。
如本文所用,术语“片段化模式”通常是指存在于对象中的片段(诸如cfDNA片段)的集合。片段化模式的组成可以取决于组织的来源、病理状态或疾病的进展。
如本文所用,术语“基因组区域”、“基因组定位(genomic position)”、“基因组位点”或“基因组位置(genomic location)”通常是指基因组或染色体上的物理位置,其可以与在人基因组补体中含有的基因或一组基因或核酸聚合物的一部分(例如染色体)相关联。该术语可以与特定长度的DNA相关。基因组的位置可以相对于人基因组中的染色体带或人基因组中的一个或多个特定核苷酸位置来定义。
如本文所用,术语“大小概况”和“大小分布”通常涉及生物样本中DNA片段的大小。大小概况可以是直方图,其提供了各种大小的DNA片段的量的分布。各种统计参数(也被称为大小参数或简称参数)可以将一个大小概况与另一个大小概况区分开。一个参数可以是某一大小或大小范围的DNA片段相对于所有DNA片段或相对于另一大小或范围的DNA片段的百分比。“大小概况”或“大小分布”可以代表来源于基因组的特定基因座或指定的基因座的cfDNA片段的大小。
如本文所用,术语“外显子组(exome)”通常是指由外显子组成的基因组的子集,所述序列在转录时在内含子通过RNA剪接去除后仍保留在成熟RNA中,并有助于由该基因编码的最终蛋白质产物。
如本文所用,术语“核小体”通常是指包裹在部分地负责染色体的紧密性的蛋白质的核周围的DNA的区段。在细胞核中,DNA与被称为染色质的蛋白质形成复合物,这允许DNA被浓缩成更小的体积。核小体是染色质的基本亚基。核小体由包裹在一组八个核心组蛋白周围的大约两圈DNA组成。
如本文所用,术语“寡核苷酸”通常是指包括至少一个核苷酸的核酸分子,所述核苷酸可以具有各种长度,诸如脱氧核糖核苷酸或核糖核苷酸或其类似物。寡核苷酸可以包括至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、400、500、600、700、800、900、1,000、5,000、10,000、50,000、100,000或更多个核苷酸。寡核苷酸可以包括至多约100,000、50,000、10,000、5,000、1,000、900、800、700、600、500、400、300、250、200、175、150、125、100、90、80、70、60、50、45、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或更少个核苷酸。寡核苷酸可以是未结合的(例如,在溶液中)或结合的(例如,化学结合到底物上)。寡核苷酸可以包含一个或多个非标准核苷酸、核苷酸类似物、修饰的核苷酸或其任何组合。
如本文所用,术语“诱饵”通常是指合成的寡核苷酸,所述寡核苷酸当让其在一段时间内杂交时可以捕获具有互补序列的核酸片段。诱饵可以是各种大小,可以是标记的或未标记的,并且可以靶向多个重叠和/或非重叠的基因组区域。诱饵可以优先捕获与感兴趣的分子功能相关联的核酸片段。
如本文所用,术语“诱饵池”通常是指具有靶向的捕获概况的诱饵的集合或组。诱饵池可以代表靶向感兴趣的cfNA片段的诱饵序列的优化组合。
如本文所用,术语“功能性分型”通常是指基于所估计的比例表示和一种或多种不同组分与临床参考数据的预定关联之间的比较来预测病理状况概率。可以通过针对所设计的诱饵池的特征概况并基于一组回归系数来估计一种或多种池组分相对于其他组分的组合的比例表示来确定功能性分型。
如本文所用,术语“染色质”通常是指包括细胞基因组的核蛋白结构。细胞染色质包含核酸(主要是DNA)和蛋白质(包括组蛋白和非组蛋白染色体蛋白质)。大多数真核细胞染色质呈核小体的形式,其中一个核小体核包括与八聚体缔合的约150个DNA碱基对,所述八聚体每种组蛋白H2A、H2B、H3和H4包括两个。接头DNA(长度根据生物体而变化)在核小体核之间延伸。组蛋白H1蛋白通常与接头DNA缔合。细胞染色质包括染色体和游离型染色质两者。
如本文所用,术语“表观遗传”通常是指“在遗传的传统遗传基础之上”或“除了遗传的传统遗传基础之外”编码的信息,即通常不包括对基础序列(遗传密码)的修饰。表观遗传改变是基因表达潜力的稳定改变,其由除了基因的初级核苷酸序列的改变以外的机制介导。表观基因组是可遗传细胞标志物的集合,诸如组蛋白修饰或DNA甲基化,其可以控制基因的差异表达。表观遗传改变可能是由于环境条件导致这些可遗传的细胞标志物的化学修饰。这些改变可以是跨代的。评估或确定表观遗传学概况包括检测转录组的变化以及DNA与亚硫酸氢盐的反应,以修饰未甲基化的半胱氨酸。
如本文所用,术语“细胞死亡”通常是指其中细胞停止执行其功能的不可逆事件。细胞死亡可能发生在更广泛的生理背景下,诸如发生在胚胎发育或组织更新中,或者它可能是对细胞损伤或感染性病原体的病理应答。细胞凋亡是多细胞生物体中细胞死亡的程序化形式。细胞死亡可能是由于自噬引起的,其中细胞质和细胞器隔离在双膜或多膜囊泡中,并递送到细胞自身的溶酶体中以用于后续降解。细胞死亡可能是由于坏死(一种毒性过程,其中细胞遵循能量无关的死亡模式和在细胞死亡后发生的降解过程)引起的。虽然细胞凋亡可能伴有细胞皱缩、固缩和核溶解,但胀亡(oncosis)是一种由能量耗竭诱导的过程,其导致以细胞肿胀为特征的坏死伴核溶解。细胞死亡也可能通过细胞焦亡(pyroptosis)发生,细胞焦亡是一种由病理刺激或炎性宿主因子触发的炎性程序性细胞死亡,其可以形成对此类病理状况的免疫应答。
如本文所用,术语“细胞碎片(cellular debris)”或“细胞碎片(cell debris)”通常是指在细胞死亡之后留下的有机废物。细胞碎片可以被吞噬细胞进一步加工和分解代谢。
如本文所用,术语“杂交”通常是指其中单链核酸与具有互补序列的核酸退火的现象。
如本文所用,术语“癌症”或“恶性肿瘤”通常是指其中组织或细胞的异常和未调节的生长。组织的块(肿瘤)或未受控制的细胞可以根据以下特征被定义为“良性”或“恶性”:细胞分化的程度(包括形态和功能)、生长速度、局部侵袭和转移。组织或细胞的“良性”块可以良好地分化,具有特征性地比组织或细胞的恶性块更慢的生长,并且保持局限于起源部位。此外,在一些情况下,组织或细胞的良性块不具有浸润、侵袭或转移至远处部位的能力。组织或细胞的“恶性”块可以是很差地分化(间变),具有特征性的快速生长,伴有周围组织的进行性浸润、侵袭和破坏。此外,恶性肿瘤可以具有转移到远处部位的能力。
如本文所用,术语“疾病进展”或“病理水平”可以指疾病或病理是否存在(即存在或不存在)、疾病的阶段、身体的总负担和/或疾病的严重程度的其他度量。病理水平可以以多种方式使用。例如,筛查可以检查以前未知患有病理的人是否存在病理。评估可以对被诊断患有病理的人进行调查,以监测病况随时间的进展,研究疗法的有效性或确定预后。检测可以包括“筛查”,或者可以包括检查具有提示性病理特征(例如,症状或其他阳性测试)的人是否患有病理状况。“病理水平”可以是指与病原体相关联的病理水平。
术语“癌症进展”或“癌症水平”可以指癌症是否存在(即,存在或不存在)、癌症的阶段、肿瘤的大小、转移的存在或不存在、身体的总肿瘤负荷和/或癌症的严重程度的其他度量(例如,癌症的复发)。癌症水平可以是数字或其他标记,诸如符号、字母和颜色。水平可以为零。癌症水平还可以包括与突变或几种突变相关联的癌变前或癌症前期状况(状态)。当癌症与病原体相关联时,癌症水平可以是病理水平的一种类型。预后可以被表示为患者死于癌症的机会、或癌症在特定持续时间或时间后进展的机会、或癌症转移的机会。
每当术语“至少”、“大于”或“大于或等于”在一系列两个或更多个数值中的第一个数值之前时,术语“至少”、“大于”或“大于或等于”适用于该系列数值中的每个数值。例如,大于或等于1、2或3等同于大于或等于1、大于或等于2或大于或等于3。
每当术语“不大于”、“小于”或“小于或等于”在一系列两个或更多个数值中的第一个数值之前时,术语“不大于”、“小于”或“小于或等于”适用于该系列数值中的每个数值。例如,小于或等于3、2或1等同于小于或等于3、小于或等于2或小于或等于1。
当与权利要求和/或说明书中的术语“包括”结合使用时,词语“一(a)”或“一个(an)”的使用可以意指“一个”,但也与“一个或多个”、“至少一个”和“一个或多于一个”的含义一致。
在权利要求中术语“或”的使用用于意指“和/或”,除非明确指出仅指替代物或替代物相互排斥,尽管本公开内容支持仅指替代物和“和/或”的定义。如本文所用,“另一个”可以意指至少第二个或更多个。
术语“约”用于表示值包括用于确定该值的装置和方法的误差的固有变化、或研究对象之间存在的变化。除非基于上述值另有说明,否术语“约”意指所列值的±5%。
术语“包括”、“具有”和“包含”是开放式连接动词。这些动词中的一个或多个的任何形式或时态,诸如“包括(comprises)”、“包括(comprising)”、“具有(has)”、“具有(having)”、“包含(includes)”和“包含(including)”,也是开放式的。例如,任何“包括”、“具有”或“包含”一个或多个步骤的方法不限于仅拥有那些一个或多个步骤,并且还覆盖其他未列出的步骤。
如本文所用,术语“序列上下文”是指核酸序列组成(例如,DNA序列组成)。DNA序列组成可以用于推导与基因座的潜在转录状态相关的若干上下文度量,诸如个体碱基组成、GC百分比、CpG位点的数量、信息性差异甲基化的CpG(iDMC)的数量、二核苷酸重复基序(DRM)的数量、已知TF基序的出现概况等。
如本文所用,术语“转录活性评分”或“TAS”是指较长(非典型)片段计数与基因座处片段的总丰度的加权比。它还可能涉及NA片段长度分布的不同特征,诸如簇、缺口、峰和异常值。还可以使用发现与转录相关联的异常长度模式的深度学习来总结观察到的片段长度分布中的异常。它可能涉及使用先前生成的数据进行学习和训练。
经证实,循环NA片段长度在转录活性位点的分布指示活细胞在其死亡之前/期间的转录活性。因此,可以基于该分布得出转录活性评分,并且特定片段长度的条带和相关联的分布模式可以被鉴定为未受蛋白质结合干扰的DNA的典型染色质组织,而其余的条带(或剩余条带中的一些)和相关联的峰将被标记为非典型的,并且代表与蛋白质结合相关联的NA片段,指示转录。
在健康个体和患者的血浆中循环DNA和RNA的发现是由Mandel和Metais于1948年完成的(Mandel和Metais,1948),其在1966年由Tan等人进一步完善,Tan等人在患有系统性红斑狼疮(Tan等人,1966)的患者中观察到无细胞脱氧核糖核酸(cfDNA)的异常模式,系统性红斑狼疮是其中主要抗原是核小体自身DNA的自身免疫性疾病。尽管有这些早期发现,但循环核酸(CNA)的相关性直到20世纪90年代才开始被探索,当时在患有癌症的患者的血浆中观察到了肿瘤衍生的致癌DNA的存在(Sorenson等人,1994),并在母体循环中检测到胎儿来源的DNA(Lo等人,1997)。这些发现导致随后的理解,即在患有慢性和急性病理(包括自身免疫性疾病、中风和创伤)的患者中cfDNA水平升高(Butt和Swaminathan 2008,Wagner2012),表明cfDNA的浓度可以作为非侵入性血液生物标志物,以反映组织损伤、细胞死亡和更新的速率。
循环cfDNA是相对较短的双链DNA片段,平均约170个碱基对,并且存在于循环血浆、尿液和其他体液中。在健康个体的血浆中,cfDNA可能主要来源于造血来源的细胞的凋亡,然而其他组织可能对体液中cfDNA的组成有所贡献。虽然cfDNA已经用于诸如生殖医学、肿瘤学和移植医学的专业,但其用作筛查、诊断、确定预后和提供治疗指导的非侵入性方法可适用于多种其他病理和病况。
可以根据特定序列和表观遗传特征(诸如DNA消化和/或甲基化模式)的表示和分布来分析cfDNA。除了病理相关的遗传变异外,对cfDNA的分析可以揭示垂死细胞的吞噬清除的表观遗传学足迹和特征,这可能是由当前病理以及其微环境组分(诸如肿瘤恶性肿瘤)的聚集核小体占据概况造成的。cfDNA可以由各种宿主细胞(诸如嗜中性粒细胞、巨噬细胞、嗜酸性粒细胞以及肿瘤细胞)释放,并且可能由于增加的细胞死亡和/或激活、受损的cfDNA清除和/或内源性DNase酶水平的降低而在循环血浆中积聚。在对象的血流中循环的cfDNA可以被包装到膜包被的结构诸如凋亡小体中,并且随后可以分析这些结构对cfDNA片段的特征的影响。
在细胞核中,DNA可能存在于核小体中,核小体是包括包裹在核心组蛋白八聚体周围的约145个碱基对的DNA的区段的结构,允许DNA浓缩成较小的体积成为染色质复合物。DNA和组蛋白二聚体之间的静电和氢键相互作用可能导致DNA在蛋白质表面上能量上不利的弯曲。这种弯曲可能在空间上阻止了其他DNA结合蛋白,并且可能用于调节细胞核中DNA的进入。核小体在细胞中的定位可能会随着时间的推移以及在各种细胞状态和条件下(诸如自发地部分解包裹和重新包裹)而动态波动。由于片段化模式可反映来源于受核小体单位影响的构型的组蛋白保护的DNA片段,因此核小体的稳定性和动力学可影响此类片段化模式。这些核小体动力学可源于多种因素,诸如组蛋白通过诸如乙酰化、甲基化、磷酸化或泛素化的过程进行翻译后修饰,这可能影响染色质结构。
染色质组织可根据以下因素而不同:诸如整体细胞身份、代谢状态、区域调节状态、局部基因活性、细胞死亡和DNA清除机制。所有这些因素都会影响其中在细胞死亡之后DNA被片段化的方式,从而影响片段化模式。然而,cfDNA片段化模式可能仅部分地归因于参与细胞的潜在染色质结构。片段化模式也可能是细胞死亡期间染色质压缩的方法以及DNA保护免受酶促消化的指示。由于在细胞死亡或细胞碎片转运的不同阶段,核小体的稳定性、构象和组成的变化,给定细胞类型或细胞谱系类型的基因组结构可能仅部分地有助于DNA可及性的异质性。取决于诸如死亡的模式和机制或细胞清除率的因素的额外过滤机制可能会影响cfDNA清除率并释放到循环中,导致特定cfDNA片段的优先存在或不存在。
信息性cfDNA片段可在细胞中产生并释放到血液循环中,或者它们可以是在诸如细胞凋亡、坏死、自噬、核溶解或细胞焦亡的过程期间作为核DNA片段化的结果而形成,其中不同的核酸酶在细胞死亡的不同阶段作用于DNA。细胞死亡之前的细胞的转录状态可能对片段化模式具有同样重要的影响。来自所有这些来源的cfDNA混合在循环血液中。所得到的序列特异性DNA切割模式可以在cfDNA中作为临床相关标志物进行分析。混合的cfDNA片段可以被分类为不同的组分,其对应于它们所来自的不同状态。这些组分和清除率因子可代表可以用于区分不同状态的标志物。可以通过鉴定特定区域或特征来分析片段化模式,在所述特定区域或特征中,一种或多种遗传或表观遗传状态、或一种或多种清除机制足够地不同以用作指示遗传畸变或病理状况的标志物。可以通过片段化模式分析测量或推断的遗传畸变可以包括表观遗传变体或变化,其可以允许片段化模式分析确定染色质组织或结构的变化,这些变化可能是基因组畸变或DNA表观遗传变化的结果。
区分与死亡前的细胞功能和/或细胞死亡的性质相关联的这些模式的另一种方式可以是通过将cfNA片段映射到代表不同类型的片段化的自定义参考序列,并且对与每个参考相关联的cfNA片段进行定量。与不同自定义参考相关联的cfNA片段可能在大小方面不同。
包括与指定的基因组位置的序列互补的序列的合成寡核苷酸诱饵的集合可以捕获与诱饵具有高度序列同源性的cfNA片段。可以设计新的诱饵来捕获特定于给定基因组位置和大小的无细胞片段。诱饵可以是各种大小、标记的、未标记的,并且可以代表多个重叠和/或非重叠的基因组区域。诱饵可以使得能够优先捕获与感兴趣的分子功能相关联的各种大小的特定片段。诱饵可以基于自定义参考来构建,并且靶向那些对于给定片段化最独特的子序列。具有靶向的捕获概况的诱饵的集合(诱饵池)可以代表靶向疾病相关cfNA片段的诱饵序列的优化的组合,并且将片段大小或丰度的病理和正常状态并置。通过估计一个或多个池组分相对于其他组分的组合的比例表示,对由诱饵池捕获的片段的分析可以实现功能性分型。诱饵序列设计可以由多种因素驱动,诸如预期的或凭经验观察到的靶向的区域中的核酸片段密度、通过最近邻(NN)模型描述的具有带有核酸杂交的诱饵的自由能的序列特异性热力学,以及各种大小的诱饵,以使得能够优先捕获与感兴趣的分子功能相关联的特定片段长度。不同的片段化模式可以通过用诱饵的组合靶向基因组区域来区分,所述诱饵被配置为捕获具有重叠序列但大小不同的核酸片段。例如,自定义参考(关键字)可以被设计成代表在基因组区域中以给定的片段化模式大量或选择性存在的NA片段。其他自定义参考的集合可靶向同一基因组区域内代表不同片段化模式的不同序列。通过将捕获的片段的序列映射到这些关键字,可以对生物样本中来自基因组位点(区域)的短片段和长片段的相对丰度进行定量。片段可以被与关键字具有相同或不同序列的诱饵捕获。该方法不需要确定每个捕获的片段的绝对长度、将片段序列映射到参考基因组或鉴定单独的片段的末端。可以对来源于基因组区域的cfNA片段进行测序,并且使用无比对方法将序列与自定义参考的关键字进行匹配。匹配每个关键字或一组关键字的cfNA片段的百分比与不同片段化模式的相对丰度相关。
cfNA片段的表征和分析
本公开内容的各方面可以从血流中提取无细胞核酸,用作检测疾病和监测病理进展或对治疗的应答的非侵入性方法。cfNA可以用作生物标志物诊断性确定给定疾病的存在、预后性确定患有疾病的对象的结果或者预测性确定个体对给定疗法的应答。全血可以通过诸如抽血或手指针刺的微创方法获得。血浆可以从血液中分离出来。可以通过核酸提取方案从该血浆中提取循环核酸,自定义工作流程可以在没有核酸提取的情况下降低血浆中的复杂性,或者可以从外周血中直接富集核酸,诸如通过环介导的等温扩增(LAMP)或CRISPR介导的无扩增靶标富集。
在cfNA应用中常见的片段化的DNA和少量DNA可以在分析之前扩增。核酸扩增可以指产生核酸的一个或多个拷贝。对于DNA,可以通过聚合酶链式反应(PCR)来扩增核酸,对于RNA,可以通过RT-PCR来扩增核酸。其他核酸扩增方法包括滚环扩增(RCA)(Demidov,2002)、链置换扩增(SDA)(Walker等人,1992)、螺旋酶依赖性扩增(HDA)(Vincent等人,2004)、基于核酸序列的扩增(NASBA)(Deiman等人,2002)和环介导扩增(LAMP)(Notomi等人,2000a)。DNA可以被扩增,以从少量的起始材料(即模板)产生特定DNA的区段的几百万个拷贝。其特异性可能依赖于序列杂交,并且其敏感性可能依赖于基于酶的扩增。PCR扩增法可以包括一系列重复的温度循环,其中每个循环使DNA双链体变性,与侧翼为靶序列的DNA寡核苷酸(引物)杂交,并通过DNA聚合酶延长那些引物。通过将共同的引物位点连接到每个片段的末端,仅使用一个与该片段杂交的引物就可以扩增cfDNA片段。此外,可以采用利用具有解旋酶活性的聚合酶的核酸扩增技术。解旋酶活性可以允许在恒温下扩增DNA,等温扩增,并且可以通过形成茎环DNA结构的引物来促进。一旦形成,茎环结构可以成为用于进一步扩增的模板DNA。
将循环核酸的复杂性降低至临床相关的无细胞片段表示可以包括若干种不同的方法或其组合,诸如选择性富集、选择性捕获或基于扩增子的靶标富集。选择性富集可以包括使用合成核酸诱饵的集合,当其保持杂交一段时间后,可以捕获与这些诱饵具有高度同源性的无细胞NA片段,并且可以代表多个重叠和/或非重叠的基因组区域。特定大小的NA片段可以通过磁珠上的固相可逆固定来富集。然后可以从珠中洗脱出期望的NA。经由感兴趣的靶区域的PCR扩增的基于扩增子的靶标富集可以包括使用预定的特异性引物。
核酸热力学可以在液体活检设计中提供独特的方法。许多液体活检设计可涉及用重叠诱饵均匀地平铺基因组,所述重叠诱饵可以包括不同的热力学参数,诸如静止温度。这些热力学不一致可能导致显著的捕获偏差,这可能掩盖潜在的片段分布,指示疾病况况。例如,可以使用一个模型来表征大量杂交,该模型假设该过程分两步发生—一条链的末端与另一条链的互补末端结合,随后为剩余碱基的“拉链”,以形成双螺旋。可以建立此类模型,然后使用特定的合成诱饵进行训练,以产生具有靶向的捕获概况的自定义诱饵组。本公开内容的方面可以使用受观察到的核小体占据率约束的核酸双链体形成的最近邻模型的近似,来估计和凭经验测试给定的无细胞核酸序列的热力学参数。通过热力学保护诱饵序列的优化组合,可以使富集偏差最小化,所述诱饵序列靶向疾病相关的cfNA片段并且稳定cfNA与诱饵双链体的解链温度。这些方面可以实现与细胞类型相关联的特定cfNA片段的优先化和靶向性(如与感兴趣的疾病的功能相关),并将片段大小或丰度的病理状态与正常状态并置。本公开内容的方面在富集期间可能不保存或维持基础无细胞片段丰度,并且可能扭曲基础无细胞片段丰度。无细胞片段的单独存在可能就足以获得准确读数。
本公开内容的方面可以通过可不涉及碱基映射或位置感知的非基因组序列的杂交捕获或扩增来检测一组cfNA片段中关键字表示的变化。关键字序列可以是短序列。关键字序列可以是10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、1000、1500或超过1500个核苷酸。关键字序列可以是1500、1000、500、450、400、350、300、250、200、150、100、90、80、70、60、50、40、30、20、10或少于10个核苷酸。这些关键字序列可以被映射到人基因组,但不是必须的。仅知道这些关键字的序列可能很重要。cfNA片段的列表中的每个关键字都可以进行子字符串搜索,并且如果它被找到,则可以简单地进行计数。一些cfNA片段可能具有一个关键字命中,而一些cfNA片段将具有所有关键字,并且一些cfNA片段将没有关键字命中。子字符串匹配可以包括模糊模式映射,或者在cfNA片段序列上看到精确的子序列的情况下可以是直接的。与在片段中找到关键字相比,片段中关键字的位置可能无关紧要。如果使用这些关键字设计诱饵以使用杂交和同源性捕获片段,则在检测关键字表示变化时可能不需要cfNA序列信息。诱饵可以被映射到人基因组,但可以不被映射到人基因组,因为这种映射对于鉴定cfNA片段中的关键字可以不是必需的。可以设计关键字来代表在基因组区域中以给定的片段化模式最丰富或选择性存在的NA片段。关键字可代表潜在的转录状态,从而使得能够对cfNA片段中的关键字成员进行分类,并且确定时间点和条件之间的分子功能变化。使用关键字靶向基因组区域可以实现对任何生理或病理状况的诊断,或监测经治疗或未经治疗的任何疾病或病理状况的进展,包括通过将捕获的cfNA的大小或丰度和与感兴趣的分子功能相关的片段化模式进行比较来确定癌症(诸如胰腺癌)的进展,或检测在治疗过程(诸如用类固醇治疗)期间的基因表达变化。
本公开内容的方面提供了用于表征来源于基因组来源的无细胞核酸(cfNA)片段的片段化模式的系统和方法,作为筛查、诊断、确定预后和提供治疗指导的非侵入性方法,并且可以适用于各种病理和病况。cfNA可以是任何长度的核苷酸(例如,至少2、3、4、5、6、7、8、9、10、100、500、1000或更多个核苷酸)的非包封的聚合物形式,脱氧核糖核苷酸或核糖核苷酸,或其类似物。核酸可以包含一个或多个选自腺苷(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(TO和尿嘧啶(U)或其变体的亚基。核苷酸可以包含A、C、G、T或U或其变体。核苷酸可以包含任何可以并入到生长中的核酸链的亚基。此类亚基可以是A、C、G、T或U,或对更多互补的A、C、G、T或U中的一种具有特异性的,或与嘌呤(例如A或G,或其变体)或嘧啶(例如C、T或U,或其变体)互补的任何其他亚基。在一些示例中,核酸可以是单链或双链的,在一些情况下,核酸分子是环状的。核酸的非限制性示例包括脱氧核糖核酸(DNA)和核糖核酸(RNA)。核酸可以包含基因或基因片段的编码区域或非编码区域、由连锁分析定义的基因座、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核酶、cDNA、重组核酸、分支核酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物。核酸分子可以包括一个或多个修饰的核苷酸,诸如甲基化的核苷酸和核苷酸类似物。cfNA可以包括单个片段,或者可以包括多个cfNA片段。在多个cfNA片段中可以存在1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100或多于100个cfNA片段。在多个cfNA片段中可以存在少于约100、90、80、70、60、50、45、40、35、30、25、20、15、10、9、8、7、6、5、4、3、2、1或少于1个cfNA片段。
由于样本采集的潜在非侵入性质,可以研究在患有病理状况的对象的血浆和血清中是否存在可检测到的循环核酸(DNA和RNA),以用作用于诊断或预后目的的标志物。例如,在癌症患者中,在血浆中的cfNA标志物可能与在患者的致癌组织中发现的标志物相同。循环核酸可以包括无细胞DNA或无细胞RNA。由于RNA标志物与恶性肿瘤密切相关,循环RNA在早期检测癌症筛查中可能特别有用。
cfNA可衍生自来自对象的生物样本。生物样本可以是含有或怀疑含有核酸分子的任何样本。例如,样本可以是含有一种或多种核酸分子的生物样本。生物样本可以从以下中获得(例如,从以下中提取或分离)或者包含以下:血液(例如,全血)、血浆、血清、脐带血、绒毛膜绒毛、羊水、灌洗液(例如,支气管肺泡、胃、腹膜、导管、耳、关节镜)、活检样本(例如,来自植入前胚胎)、体腔穿刺样本、胎儿有核细胞或胎儿细胞残余物、胆汁、母乳、尿液、唾液、粘膜排泄物、痰、粪便、汗液、阴道液、来自鞘膜积液(例如,睾丸鞘膜积液)的液体、阴道冲洗液、胸膜液、腹水、脑脊液、支气管肺泡灌洗液、来自乳头的排出液、来自身体不同部位(例如,甲状腺、乳房)的抽吸液、泪液、胚胎细胞或胎儿细胞(例如,胎盘细胞)。生物样本可以是流体或组织样本(例如,皮肤样本)。生物样本可以包含来自活的或死的对象的任何组织或材料。生物样本可以是无细胞样本。生物样本可以包括核酸(例如,DNA或RNA)或其片段。
样本可以是异质的,其中在样本中可以存在多于一种类型的核酸物种。例如,异质核酸可以包括但不限于:(i)胎儿来源的和母体来源的核酸,(ii)癌症和非癌症核酸,(iii)病原体和宿主核酸,并且更一般地,(iv)突变的核酸和野生型核酸。样本可以是异质的,因为存在多于一种的细胞类型,诸如胎儿细胞和母体细胞、癌细胞和非癌细胞、或致病细胞和宿主细胞。可以存在少数核酸物种和多数核酸物种。
对象可以是人类、非人灵长类(诸如黑猩猩)以及其他猿类和猴物种;农场动物,诸如牛、马、绵羊、山羊、猪;家养动物,诸如兔、狗和猫;实验动物,包括啮齿动物,诸如大鼠、小鼠和豚鼠等。对象可以是任何年龄。对象可以是,例如,老年人、成人、青少年、青春期前儿童、儿童、幼儿、婴儿。对象可以是患有疾病的患者和/或患有病况的实验动物。
可以使包括cfNA的组合物与寡核苷酸诱饵接触。包括与基因组位置互补的合成核酸碱基的寡核苷酸诱饵可以捕获与诱饵具有高度同源性的cfNA片段。可以合成寡核苷酸,或者可以产生扩增产物作为感兴趣的基因组靶标的诱饵,并且附加到捕获形式(诸如生物素化)上,并结合到链霉亲和素包被的磁珠上以用于基于溶液的捕获。结合的核酸可以作为用于捕获同源cfNA片段的诱饵。来自文库的与诱饵序列匹配的同源cfNA片段可以作为靶标。在纯化靶标富集的文库后,可以富集与诱饵具有同源性的cfNA片段,并且去除非靶向的序列。寡核苷酸诱饵可以是天然来源的。可以设计新的诱饵来捕获特定于给定基因组位置和大小的靶向的无细胞片段。诱饵可以是各种大小。寡核苷酸诱饵可以包括至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、250、300、400、500、600、700、800、900、1,000、5,000、10,000、50,000、100,000或更多个核苷酸。寡核苷酸诱饵可以包括至多约100,000、50,000、10,000、5,000、1,000、900、800、700、600、500、400、300、250、200、175、150、125、100、90、80、70、60、50、45、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或更少个核苷酸。寡核苷酸诱饵可以是未结合的(例如,在溶液中)或结合的(例如,化学结合到底物上)。寡核苷酸诱饵可以包含一个或多个非标准核苷酸、核苷酸类似物、修饰的核苷酸或其任何组合。寡核苷酸诱饵可以是标记的或未标记的,并且可以代表多个重叠和/或非重叠的基因组区域。可以存在一个寡核苷酸诱饵或多个寡核苷酸诱饵。在多个寡核苷酸诱饵中可以存在大于约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100或多于100个寡核苷酸诱饵。在多个寡核苷酸诱饵中可以存在少于约100、90、80、70、60、50、45、40、35、30、25、20、15、10、9、8、7、6、5、4或3个寡核苷酸诱饵。寡核苷酸诱饵可以与亲和标签缀合。亲和标签可以是但不限于生物素、白蛋白结合蛋白、碱性磷酸酶、辣根过氧化物酶、氯霉素乙酰基转移酶、麦芽糖结合蛋白、六组氨酸标签、谷胱甘肽S-转移酶或β半乳糖苷酶。
诱饵可以包括多组寡核苷酸,其中每组寡核苷酸对感兴趣的不同分子功能具有特异性。在多个寡核苷酸诱饵中,每个寡核苷酸诱饵可以包括不同的亲和标记,诸如荧光标记。标记试剂可以是含硫醇的荧光团。荧光团可以是呫吨染料,诸如罗丹明染料、Alexa
Figure BDA0004032409450000261
染料、Atto染料、荧光肽或蛋白质或量子点。荧光方法可以采用诸如荧光偏振、荧光测定法和荧光显微镜、
Figure BDA0004032409450000262
共振能量转移(FRET)或时间分辨荧光的荧光技术。荧光显微镜可用于确定一种或多种荧光团的存在。
各种大小的诱饵可以使得能够优先捕获与感兴趣的分子功能相关联的特定片段长度。诱饵可以基于自定义参考来构建,并且靶向最能代表给定的片段化状态或最能达到给定的片段化状态的那些子序列。具有靶向的捕获概况的诱饵池或诱饵的集合(即诱饵池)可以代表诱饵序列的优化组合,以靶向疾病相关的cfNA片段,并将片段大小或丰度的病理和正常状态并置。由诱饵池捕获的cfNA片段可以通过估计一个或多个池组分相对于片段可以杂交至的其他组分的组合的比例表示来实现功能性分型。
寡核苷酸诱饵可以与固体表面缀合。固体表面可以是任何合适的材料,其可以被表面修饰以将结合配偶体并入到固定化标签上。固体表面可以包括磁珠,磁珠有助于去除诱饵和捕获的感兴趣的靶标。固体表面可以包括树脂、凝胶、石英颗粒或其组合的表面。在一些非限制性示例中,所述方法考虑使用已经被固定在氨基硅烷改性的表面、
Figure BDA0004032409450000263
珠、
Figure BDA0004032409450000264
树脂或其他类似珠或树脂的支持物上的寡核苷酸诱饵。本文使用的表面可以是水凝胶,诸如海藻酸盐。本文使用的表面可以涂覆有聚合物,诸如聚乙二醇。含氟聚合物(Teflon-AF(Dupont)、
Figure BDA0004032409450000265
(Asahi Glass,日本))、芳香族聚合物(聚二甲苯(聚对二甲苯(Parylene),Kisco,Calif.)、聚苯乙烯、聚甲基丙烯酸甲酯)和金属表面(金涂层))、涂层方案(旋涂、浸涂、金属电子束沉积、热蒸气沉积和等离子体增强化学蒸气沉积)和功能化方法(聚烯丙基胺接枝、在PECVD中使用氨气、掺杂长链末端官能化的含氟烷烃等)可以在本文所述方法中用作有用的表面。固体支持物可以与不同的可寻址标志物缀合。
固体表面可以是珠。珠可以是聚合物,诸如聚苯乙烯珠或与二乙烯基苯交联的聚苯乙烯。固体支持物珠可以包括氧化铁芯。珠可以包括金属盐,诸如铜盐、镁盐、钙盐或锰盐。珠可以是纤维素、纤维素衍生物、明胶、丙烯酸树脂、玻璃、硅胶、聚乙烯吡咯烷酮(PVP)、乙烯基和丙烯酰胺的共聚物、聚丙烯酰胺、胶乳凝胶、葡聚糖、交联的葡聚糖(例如,SephadexTM)、橡胶、硅、塑料、硝化纤维素、天然海绵、金属和琼脂糖凝胶(SepharoseTM)。珠的直径可以取决于需要更小或更大珠的寡核苷酸诱饵或测定的样本的密度。珠可以具有至少约1微米(μm)、5μm、10μm、25μm、50μm、75μm、100μm、150μm、200μm、250μm、300μm、400μm、500μm、750μm、1,000μm或更大微米的直径。珠可以具有至多约1,000μm、750μm、500μm、400μm、300μm、250μm、200μm、150μm、100μm、75μm、50μm、25μm、10μm、5μm、1μm或小于1微米的直径。寡核苷酸诱饵可以与珠的表面上的功能单元偶联。珠可以是单个珠,或者可以是多个珠中的一个。多个珠可以包括至少1,000个孔。在多个珠中可以存在2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、1000、1500、2000、3000、4000、5000、10,000、100,000、1,000,000或多于1,000,000个孔。
固体支持物可以是平面表面。平面表面可以是孔的内部。孔可以具有x乘y乘z的尺寸,其中x、y和z各自独立地为至少约0.1μm、1μm、5μm、10μm、15μm、20μm、25μm、30μm、35μm、40μm、45μm、50μm、55μm、60μm、65μm、70μm、75μm、80μm、85μm、90μm、95μm、100μm、110μm、120μm、130μm、140μm、150μm、160μm、170μm、180μm、190μm、200μm、250μm、300μm、400μm、500μm、600μm、700μm、800μm、900μm、1,000μm或更大微米。孔可以具有x乘y乘z的尺寸,其中x、y和z各自独立地为至多约1,000μm、900μm、800μm、700μm、600μm、500μm、400μm、300μm、250μm、200μm、190μm、180μm、170μm、160μm、150μm、140μm、130μm、120μm、110μm、100μm、95μm、90μm、85μm、80μm、75μm、70μm、65μm、60μm、55μm、50μm、45μm、40μm、35μm、30μm、25μm、20μm、15μm、10μm、5μm、1μm、0.1μm或更小微米。例如,孔可以具有434μm的x尺寸、30μm的y尺寸和510μm的z尺寸。在另一示例中,孔可以具有16μm的x和y尺寸以及1μm的z尺寸。平面表面可以是多个孔中的一个孔。多个孔可以包括至少两个孔。多个孔可以包括至少1,000个孔。在多个孔中可以存在2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、1000、1500、2000、3000、4000、5000、10,000、100,000、1,000,000或多于1,000,000个孔。孔可以包括珠,或者平面表面可以并入珠。
寡核苷酸诱饵可以与cfNA片段杂交并捕获cfNA片段,并且可以表征捕获的cfNA片段的片段化模式。与诱饵寡核苷酸杂交的多个无细胞核酸可以与一个寡核苷酸诱饵序列或多个寡核苷酸诱饵序列至少约70%、75%、80%、85%、90%、95%、97%、98%、99%或更多互补。多个无细胞核酸分子可以与一个寡核苷酸诱饵序列或多个寡核苷酸诱饵序列至多约99%、98%、97%、95%、90%、85%、80%或更少互补。可以从杂交的靶序列中分离出未杂交的cfNA序列,从而均匀地富集具有高分辨能力的无细胞DNA片段的群体。
片段化模式可以检测、诊断、监测病况随时间的进展、研究疗法的有效性或确定疾病或病理状况的预后。可以用非侵入性cfNA诊断来诊断或监测的疾病或病况的非限制性示例可以包括血液恶性肿瘤、实体瘤恶性肿瘤、转移性癌症、良性肿瘤、HIV/AIDS、自身免疫性疾病、乙型肝炎、丙型肝炎、类风湿性关节炎、多发性硬化、银屑病、葡萄膜炎、硬皮病、系统性红斑狼疮、糖尿病、湿疹、帕金森病、先天性疾病、遗传异常或阿尔茨海默病。
片段化模式可以检测、诊断、监测癌症随时间的进展、研究疗法的有效性或确定癌症的预后。虽然单独的恶性肿瘤可能提供恶性细胞的独特基因组,但片段分析也可以包括与肿瘤的存在相关联的正常非异常细胞的基因组。此类片段分析可以是诊断性的和临床相关的,但是可能不直接是癌性来源的,因为肿瘤脉管系统可以包括正常细胞以及恶性细胞。可以用非侵入性cfNA诊断来诊断或监测的癌症的非限制性示例包括:急性淋巴细胞白血病、急性髓性白血病、肾上腺皮质癌、AIDS相关癌症、AIDS相关淋巴瘤、肛门癌、阑尾癌、星形细胞瘤、成神经细胞瘤、基底细胞癌、胆管癌、膀胱癌、骨癌、脑肿瘤,诸如小脑星形细胞瘤、脑星形细胞瘤/恶性神经胶质瘤、室管膜瘤、髓母细胞瘤、幕上原始神经外胚层肿瘤、视觉通路和下丘脑神经胶质瘤、乳腺癌、支气管腺瘤、伯基特淋巴瘤、原发性来源不明的癌、中枢神经系统淋巴瘤、小脑星形细胞瘤、宫颈癌、儿童癌症、慢性淋巴细胞白血病、慢性粒细胞白血病、慢性骨髓增生性病症、结肠癌、皮肤T细胞淋巴瘤、促结缔组织增生性小圆细胞瘤、子宫内膜癌、室管膜瘤、食道癌、尤文氏肉瘤、生殖细胞瘤、胆囊癌、胃癌、胃肠道类癌瘤、胃肠道间质瘤、胶质瘤、毛细胞白血病、头颈癌、心脏癌、肝细胞(肝)癌、霍奇金淋巴瘤、下咽癌、眼内黑色素瘤、胰岛细胞癌、卡波西肉瘤、肾癌、喉癌、唇和口腔癌、脂肪肉瘤、肝癌、肺癌诸如非小细胞和小细胞肺癌、淋巴瘤、白血病、巨球蛋白血症、骨/骨肉瘤恶性纤维组织细胞瘤、髓母细胞瘤、黑色素瘤、间皮瘤、转移性鳞状颈癌伴隐匿性原发(metastatic squamousneck cancer with occult primary)、口腔癌、多发性内分泌瘤形成综合征、骨髓增生异常综合征、髓性白血病、鼻腔和副鼻窦癌、鼻咽癌、成神经细胞瘤、非霍奇金淋巴瘤、非小细胞肺癌、口腔癌、口咽癌、骨肉瘤/恶性骨纤维组织细胞瘤、卵巢癌、卵巢上皮癌、卵巢生殖细胞瘤、胰腺癌、胰腺癌胰岛细胞、副鼻窦及鼻腔癌、甲状旁腺癌、阴茎癌、咽癌、嗜铬细胞瘤、松果体星形细胞瘤、松果体生殖细胞瘤、垂体腺瘤、胸膜肺母细胞瘤、浆细胞瘤形成、原发性中枢神经系统淋巴瘤、前列腺癌、直肠癌、肾细胞癌、肾盂和输尿管移行细胞癌、视网膜母细胞瘤、横纹肌肉瘤、唾液腺癌、肉瘤、皮肤癌、皮肤癌梅克尔细胞、小肠癌、软组织肉瘤、鳞状细胞癌、胃癌、T细胞淋巴瘤、喉癌、胸腺瘤、胸腺癌、甲状腺癌、滋养细胞肿瘤(妊娠)、原发部位不明的癌症、尿道癌、子宫肉瘤、阴道癌、外阴癌、
Figure BDA0004032409450000291
巨球蛋白血症和肾母细胞瘤(Wilms tumor)。
本公开内容的方面可以包括一种表征来源于基因组区域的cfNA片段的片段化模式的方法,其中表征cfNA片段的片段化模式包括分析cfNA片段的大小或丰度。表征片段化模式可以包括鉴定cfNA片段的基因组位置或长度,或者可以不包括鉴定cfNA片段的长度的基因组位置。片段可以由小片段/短片段或大片段/长片段组成。术语“小片段”和术语“短片段”可互换。术语“大片段”和术语“长片段”可互换。小片段可以比大片段包括更少的核苷酸。小片段可以包括约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、230或多于230个碱基对。小片段可以包括约少于230、200、150、100、90、80、70、60、50、45、40、35、30、25、20、15、10、9、8、7、6、5、4、3、2或1个碱基对。小片段可以具有以大约170个碱基对为中心的分布,并且可以指示单核小体保护。大片段可以包括约50、55、60、65、70、75、80、85、90、100、150、200、250、300、350、400、450、500、600、700、800、900、1000或多于1000个碱基对。大片段可以包括约1000、900、800、700、600、500、450、400、350、300、250、200、150、100、90、80、70、60、50或少于50个碱基对。大片段长度可以具有以大约330个碱基对为中心的大小分布,并且可以指示双核小体保护。如果片段的长度大于或小于230个碱基对,可以确定大或小的cfNA。包括至少230个核苷酸的大cfNA片段的量可以与包括少于230个核苷酸的小cfNA片段的量进行比较。大cfNA片段可以包括至少185、190、200、210、220、230、240、250、255、270或310个核苷酸。小cfNA片段可以包括少于220、205、190、175、170、160、150、140、130、120或110个核苷酸。大cfNA片段的增加的丰度可以指示医学病况。至少0.01、0.05、0.1、0.2、0.25、0.3、0.35或0.4的大cfNA片段与小cfNA片段的比率可以指示医学病况。大cfNA片段与小cfNA片段的比率可以为至少.1、.15、.2、.25、.3、.35、.4、.45、.5、.6、.7、.8、.9或1,并且可以指示医学病况。大cfNA片段与小cfNA片段的比率可以小于1、.9、.8、.7、6、.5、.45、.4、.35、.3、.25、.2、.15、.1或小于.1。
大cfNA片段和短cfNA片段可以跨越一个外显子,或者可以跨越多个外显子。可以根据特定序列或表观遗传特征(诸如DNA消化或甲基化模式)的表示和分布来分析cfNA片段。片段化的DNA可以在细胞中产生,并且由于在诸如细胞凋亡和坏死的细胞过程期间核DNA片段化而作为cfDNA释放到血液循环中。这种片段化可能是由于不同的核酸酶在细胞的不同阶段作用于DNA而产生的,导致序列特异性DNA切割模式,其可以在cfDNA片段化模式中进行分析。分类此类清除模式可以是细胞环境(例如,肿瘤微环境、炎症、疾病况态等)的临床相关标志物。可以通过将cfDNA片段分类为与它们来源的不同染色质状态相对应的不同组分来分析片段化模式。例如,片段化模式可以被表示为代表不同潜在染色质状态的组分之和。
可以使用公共数据库和/或经验性实验数据将特定基因组区域鉴定为概况鉴别器。例如,设计的诱饵的子集可对在健康未患病的cfNA样本中观察到的cfNA片段表现出富集偏倚,而诱饵的另一个子集可靶向在诱饵设计期间检查的所有或一些病理条件下富集的基因组区域。可以对与诱饵结合的无细胞NA靶标进行定量。用于分析cfNA片段的大小或定量cfNA的方法可以包括但不限于气相色谱法、超临界流体色谱法、液相色谱法(包括分配色谱法、吸附色谱法、离子交换色谱法、尺寸排阻色谱法、薄层色谱法和亲和色谱法)、电泳(包括毛细管电泳、毛细管区带电泳、毛细管等电点聚焦、毛细管电色谱法、胶束电动毛细管色谱法、等速电泳、瞬时等速电泳和毛细管凝胶电泳)、比较基因组杂交(CGH)、微阵列、珠阵列和高通量基因分型,诸如使用分子反转探针(MIP)。可以基于所估计的比例表示与一种或多种不同组分与临床参考数据的预定关联之间的比较,用病理状况概率来预测病理状况。
可以用微流体分离来分离cfNA片段。微流体分离可以包括微流体盒或“芯片”。微流体芯片可以包括固体表面,诸如聚苯乙烯,其可以组合通过固相提取的核酸分离;等温酶促扩增,诸如环介导扩增(LAMP)、基于核酸序列的扩增(NASBA)或重组酶聚合酶扩增(RPA);和cfNA分析物的实时光学检测。微流体盒可以在扩增反应室中并入嵌入的核酸结合膜。从裂解物中提取的靶核酸可以在膜上捕获,并在恒定的温育温度下扩增。扩增产物可以用荧光团报告物标记,但不是必须的。可以用LED光源激发荧光团报告物,并使用光电二极管或CCD检测器进行实时原位监测。对于全血分析,可以使用将血浆与全血分离以提供无细胞样本的过滤装置。微流体芯片可以利用一致的流动设计或振荡流动设计。在一致的流动设计中,核酸、液滴或溶液可以是连续流动的。溶液可以是粘性的或非粘性的。核酸、液滴或溶液可以是静止的或半静止的。核酸、液滴或溶液可以处于运动中。微流体芯片可以利用振荡或双向流动。微流体芯片可以组合基于固定室的系统的循环灵活性和连续流动系统的快速动力学。核酸、液滴或溶液可以通过单个通道来回运输,或者可以在多个通道或毛细管中运输。通道可以跨越不同的温度区域。微流体芯片可以连接到泵送系统,诸如但不限于外部泵和集成微泵。可以存在车载电源或外部电源。离心力和/或毛细管力可以用于控制流体流动。光盘形式可以用于容纳反应室或其他部件。液滴可以作为反应器环境,允许快速试剂混合和最小的表面吸附。界面化学可以用于产生此类反应器液滴(例如,油-水栓塞可以流过流体毛细管以产生油包水液滴)。
为了连接代表分子功能的特定诱饵,可以进行解卷积分析。可以通过一系列校准实验将分子功能分配给诱饵捕获产品,其中基准数据集可以表示已知的分子功能状态。例如,使用中度t检验和倍数变化可以鉴定出50种分子功能最丰富的诱饵。可以通过计算该亚型相对于所有其他亚型的片段计数并计算片段计数的算术平均值,在疾病概况中评估每个分子功能特征的评分。评分可以根据欧几里德距离通过分层聚类进行分组。可以使用其他解卷积方法,诸如最大似然/共轭梯度、二次规划、非负矩阵分解、v支持向量回归、二次规划、统一粒子群优化或潜在狄利克雷分配(LDA)模型。使用与诱饵的集合中的一个相关联的片段计数,可以基于基准计数数据估计混合物比例,或者可以使用以下方法来推断细胞/组织类型从头的数量:
如果S是含有k种细胞类型和n种基因的n×k诱饵特异性片段计数矩阵,则W可以是k×p矩阵,其中W的每一列都含有特定观察中k种细胞类型的频率,并且O可以是可以含有观察到的诱饵特异性片段计数水平的n×p计数矩阵,其中n可以表示基因的数量,并且p可以表示观察到的组织样本的数量。混合过程可以通过线性模型进行建模:
O=S×W  (等式1)
其中S可以表示源信号,W可以是细胞类型频率的权重矩阵,并且O可以是对组织样本的观察。在典型的片段计数分析设置中,O可以通过微阵列或RNA-seq来测量。W(一种细胞类型频率矩阵)和S两者都可以是未知的,其中S和W两者都可能需要被估计。可以使用细胞类型特异性标志物来估计W,并且使用估计的W求解线性模型。
由于一组基因可能在特定细胞类型中具有高片段计数,并且在所有其他细胞类型中具有低计数,所以可以使用这些基因来预测血液样本中存在的每种细胞类型的比例。例如,XS可以是m×k矩阵,其对于k种细胞类型含有m种细胞类型特异性基因。在每种细胞类型中,可以存在多种细胞类型特异性基因。由于在单个细胞类型中,每种基因可以具有更高的诱饵特异性片段计数,因此可以确定在单个细胞类型中高度表达的所有基因的平均值,并将矩阵求解为X~S:
Figure BDA0004032409450000331
X~S可以是未知的,然而,可以在观察到的混合样本上测量细胞类型特异性标志物的相应片段计数OS
Figure BDA0004032409450000332
将X~S和
Figure BDA0004032409450000333
代入等式1,可以得到
Figure BDA0004032409450000334
X~S可以是对角矩阵,因此等式2的每一边都可以乘以X~-1S,并且可以获得等式3:
Figure BDA0004032409450000341
由于W可以是频率矩阵,并且W的每一列的和可以是1,因此可以形成k个未知参数g-1...g-k的线性问题系统,其中:
Figure BDA0004032409450000342
在混合样本上的观察的数量大于所涉及的细胞类型的数量,即p>k的情况下,等式的系统可以用k个未知参数求解。在g-1...g-k可以是已知的情况下,X~-1S可以纳入等式3,并且可以计算细胞类型频率矩阵。
在对血液样本的数字分选中,可以输入血液样本中的cfNA片段计数数据和已知在特定细胞类型中具有高诱饵特异性片段计数的一组基因符号,以获得血液样本中每种细胞类型的片段计数概况。如果W未知,可以使用XS和等式3来估计W。如果W已知,则可以通过二次规划来估计S,其中O可以是血液样本中的片段计数概况,S可以是纯细胞类型的诱饵特异性片段计数概况,W可以是使用标志物基因估计的权重矩阵,并且t1和t2可以是最大和最小可测量的片段计数水平:
Figure BDA0004032409450000343
s.t S<t1和S>t2
本公开内容的方面可以包括一种表征来源于基因组区域的无细胞核酸片段的片段化模式的方法,其包括使包括cfNA的组合物与一个或多个寡核苷酸诱饵接触,以及分析与一个或多个寡核苷酸诱饵杂交的cfNA片段的丰度,其中一个或多个寡核苷酸诱饵包括与基因组区域的序列互补的序列,并且其中分析cfNA片段的大小或丰度包括对cfNA片段进行测序,以及对cfNA核苷酸序列与局部参考序列进行无比对序列比较。可以通过对无细胞NA片段进行测序并且通过将cfNA片段的基因组分布记录到数据库中来制备下一代测序文库。对于一些实施方案,可以处理数据库以用于信号变换。局部参考序列可以包括与病理状况概率相关联的已知基因组区域,所述病理状况概率基于所估计的比例表示与一种或多种不同组分与临床或经验参考数据的预定关联之间的比较。参考序列可以包括来自人基因组或另一种哺乳动物基因组的数据,或者可以包括个体对象数据。表征来源于基因组区域的cfNA片段可以包括将cfNA片段的迁移率与已知标准进行比较。已知标准可以包括人基因组或映射的动物基因组,或者可以包括临床或经验数据。
本公开内容的方面可以包括一种表征来源于基因组区域的cfNA片段的方法,其包括使包括cfNA的组合物与寡核苷酸诱饵接触,以及分析与寡核苷酸诱饵杂交的cfNA片段的大小,其中寡核苷酸诱饵包括与基因组区域的序列互补的序列,并且其中分析cfNA片段的大小可以包括拉伸cfNA片段,并获取cfNA片段的图像。分析cfNA片段的大小可以包括在光学陷阱中捕获cfNA片段的末端或流动拉伸cfNA片段。可以用商业上可获得的光学装置诸如光学显微镜、共焦显微镜、荧光显微镜、光学测序仪或成像平台来获取cfNA片段的图像。例如,配备有全内反射照明和增强型电荷耦合器件(CCD)检测器的常规显微镜可以是可用的。使用高灵敏度CCD像机成像可以允许仪器同时记录跨过表面分布的多个单独的(即单个)肽分子的荧光强度。可以使用图像分割器进行图像采集,该图像分割器将光引导通过两个带通滤波器(一个滤波器适合于每个荧光分子),以在CCD表面上记录为两个并排的图像。
本公开内容的方面可以包括一种表征来源于基因组区域的cfNA片段的方法,其包括使包括cfNA的组合物与寡核苷酸诱饵接触,以及分析与寡核苷酸诱饵杂交的cfNA片段的大小,其中寡核苷酸诱饵包括与基因组区域的序列互补的序列,并且其中分析cfNA片段的大小可以包括使cfNA片段与染料接触,将cfNA片段分离成液滴,使液滴流过检测器,测量每个cfNA片段的荧光,并由荧光强度计算大小,其中染料的荧光通过与cfNA片段接触而增强。微流体装置中、孔中、附着于支持物上或阵列中的cfNA、液滴或溶液可以在微流体装置中温育、分裂和合并。液滴的大小可以变化。液滴的直径可以为至少约0.5微米(μm)、1μm、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80、μm、90μm、100μm、150μm、200μm、250μm、300μm、350μm、400μm、450μm、500μm、600μm、700μm、800μm、900μm、1000μm或更大。它们可以小于或大于这些直径或为其间的任何值。cfNA、液滴或溶液形成频率可以为至少约0.5赫兹(Hz)、1Hz、2Hz、3Hz、4Hz、5Hz、6Hz、7Hz、8Hz、9Hz、10Hz、20Hz、30Hz、40Hz、50Hz、60Hz、70Hz、80Hz、90Hz、100Hz、200Hz、300Hz、400Hz、500Hz、600Hz、700Hz、800Hz、900Hz、1,000Hz、2,000Hz、3,000Hz、4,000Hz、5,000Hz、6,000Hz、7,000Hz、8,000Hz、9,000Hz、10,000Hz或更大。频率可以小于或大于本文列出的频率或为其间的任何值。
包含cfNA分子的溶液可以以约1微升(μL)/分钟(min)至约12μL/min的流速流动。包含cfNA分子的溶液可以以约1μL/min至约2μL/min、约1μL/min至约3μL/min、约1μL/min至约4μL/min、约1μL/min至约5μL/min、约1μL/min至约6μL/min、约1μL/min至约7μL/min、约1μL/min至约8μL/min、约1μL/min至约9μL/min、约1μL/min至约10μL/min、约1μL/min至约11μL/min、约1μL/min至约12μL/min、约2μL/min至约3μL/min、约2μL/min至约4μL/min、约2μL/min至约5μL/min、约2μL/min至约6μL/min、约2μL/min至约7μL/min、约2μL/min至约8μL/min、约2μL/min至约9μL/min、约2μL/min至约10μL/min、约2μL/min至约11μL/min、约2μL/min至约12μL/min、约3μL/min至约4μL/min、约3μL/min至约5μL/min、约3μL/min至约6μL/min、约3μL/min至约7μL/min、约3μL/min至约8μL/min、约3μL/min至约9μL/min、约3μL/min至约10μL/min、约3μL/min至约11μL/min、约3μL/min至约12μL/min、约4μL/min至约5μL/min、约4μL/min至约6μL/min、约4μL/min至约7μL/min、约4μL/min至约8μL/min、约4μL/min至约9μL/min、约4μL/min至约10μL/min、约4μL/min至约11μL/min、约4μL/min至约12μL/min、约5μL/min至约6μL/min、约5μL/min至约7μL/min、约5μL/min至约8μL/min、约5μL/min至约9μL/min、约5μL/min至约10μL/min、约5μL/min至约11μL/min、约5μL/min至约12μL/min、约6μL/min至约7μL/min、约6μL/min至约8μL/min、约6μL/min至约9μL/min、约6μL/min至约10μL/min、约6μL/min至约11μL/min、约6μL/min至约12μL/min、约7μL/min至约8μL/min、约7μL/min至约9μL/min、约7μL/min至约10μL/min、约7μL/min至约11μL/min、约7μL/min至约12μL/min、约8μL/min至约9μL/min、约8μL/min至约10μL/min、约8μL/min至约11μL/min、约8μL/min至约12μL/min、约9μL/min至约10μL/min、约9μL/min至约11μL/min、约9μL/min至约12μL/min、约10μL/min至约11μL/min、约10μL/min至约12μL/min或约11μL/min至约12μL/min的流速流动。包含cfNA分子的溶液可以以约1μL/min、约2μL/min、约3μL/min、约4μL/min、约5μL/min、约6μL/min、约7μL/min、约8μL/min、约9μL/min、约10μL/min、约11μL/min或约12μL/min流动。包含cfNA分子的溶液可以以至少约1μL/min、约2μL/min、约3μL/min、约4μL/min、约5μL/min、约6μL/min、约7μL/min、约8μL/min、约9μL/min、约10μL/min或约11μL/min流动。包含多肽分子的溶液可以以至多约2μL/min、约3μL/min、约4μL/min、约5μL/min、约6μL/min、约7μL/min、约8μL/min、约9μL/min、约10μL/min、约11μL/min或约12μL/min流动。
本公开内容的方面可以包括一种表征来源于基因组区域的cfNA片段的方法,其包括:使包括cfNA的组合物与寡核苷酸诱饵接触,并对与寡核苷酸诱饵杂交的cfNA片段进行测序,以及对cfNA片段核苷酸序列与局部参考序列进行无比对序列比较,其中寡核苷酸诱饵可以包括与基因组区域的序列互补的序列。可以用多种方法对cfNA进行测序,包括但不限于下一代测序、体细胞突变分析、扩增子测序、大规模平行测序、Maxam-Gilbert测序、桑格测序、deNovo测序、鸟枪法测序、短读取测序、长读取测序、转录组分析、单分子实时测序、离子半导体测序、焦磷酸测序、合成测序、纳米孔测序、polony测序、大规模平行特征测序、DNA纳米球测序或连接测序。cfNA片段核苷酸序列与局部参考序列的无比对序列比较可以包括不使用或不产生比对的定量序列相似性或相异度的任何方法,例如残基-残基对应性的分配。无比对方法可以不依赖于动态编程,可以对改组或重组事件具有抗性,可以适用于低序列保守性不能通过比对可靠处理的情况,并且因此可以适合于全基因组比较。无比对方法可以包括基于k-mer/单词频率、公共子字符串的长度、单词匹配数的方法、基于微比对的方法、基于信息论的方法或基于图形表示的方法。
可以分离感兴趣的基因组的多个序列长度而无需测序。可以同时分离来自生物样本的多个感兴趣的基因组而无需测序。生物样本可以与多组病原体特异性寡核苷酸接触。在一个示例中,至少一组诱饵可以包括多核糖核苷酸,并且至少一组诱饵可以包括多脱氧核糖核苷酸。因此,生物样本可以与多组病原体特异性多核糖核苷酸和多组病原体特异性多脱氧核糖核苷酸接触。每组病原体特异性寡核苷酸可以设置有不同的固定化标签。
本公开内容的方面可以包括一种表征来源于基因组区域的cfNA片段的方法,其包括:使包括cfNA的组合物与寡核苷酸诱饵接触,并对与寡核苷酸诱饵杂交的cfNA片段进行测序,以及对cfNA片段核苷酸序列与局部参考序列进行无比对序列比较,其中寡核苷酸诱饵可以包括与基因组区域的序列互补的序列,所述序列对与寡核苷酸诱饵的末端远端的序列比对的cfNA片段序列相对于与寡核苷酸诱饵的第二末端远端的序列比对的cfNA片段序列的相对量进行定量。
本公开内容的方面可以包括一种表征来源于基因组区域的cfNA片段的方法,其包括:使包括cfNA的组合物与寡核苷酸诱饵接触,以及对与寡核苷酸诱饵杂交的cfNA片段进行测序,并鉴定基因组区域内的两个或更多个子区域,以及对与每个子区域匹配的cfNA片段的数量进行计数,其中寡核苷酸诱饵可以包括与基因组区域的序列互补的序列。基因组区域内的子区域可以包括一组具有相似功能特征的基因组区域段,诸如非翻译区域(UTR)、预测的外显子或转录因子结合位点。如果cfNA片段的序列与子区域的序列相同,或者该片段的序列经由近似字符串匹配被分配给该子区域,则该片段可以与该子区域匹配。一旦获得每个参考序列匹配的计数和大小分布,就可以使用参数(诸如线性回归)、非参数(诸如人工神经网络)模型(例如任意比率)来重新定义加权评分。近似字符串匹配(模糊字符串搜索)可以包括一种查找与模式近似匹配而不是精确匹配的字符串的技术。匹配的接近度可以根据编辑距离、将字符串转换成字符串和模式之间的精确匹配所需的原始操作的数量来测量,诸如通过表征匹配的插入、删除、置换或替换。如果cfNA片段的序列与一个寡核苷酸诱饵序列或多个寡核苷酸诱饵序列至少约70%、75%、80%、85%、90%、95%、97%、98%、99%或更多互补,则该片段可以与子区域匹配。
本公开内容的方面可以包括一种表征来源于基因组区域的cfNA片段的方法,其包括:使包括cfNA的组合物与第一寡核苷酸诱饵和第二寡核苷酸诱饵接触,分析与第一寡核苷酸诱饵杂交的cfNA片段,以及分析与第二寡核苷酸诱饵杂交的cfNA片段,其中第一寡核苷酸诱饵和第二寡核苷酸诱饵包括与基因组区域的序列互补的序列,并且其中所述方法不包括鉴定cfNA片段的基因组位置或长度。可以将与第一诱饵杂交的cfNA片段和与第二诱饵杂交的cfNA片段进行比较,从而允许推断或比较样本中的不同病理状态。一个或多个寡核苷酸诱饵可以靶向来源于基因组区域的cfNA片段。在多个寡核苷酸诱饵中可以存在1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100或多于100个寡核苷酸诱饵。在多个寡核苷酸诱饵中可以存在少于约100、90、80、70、60、50、45、40、35、30、25、20、15、10、9、8、7、6、5、4或3个寡核苷酸诱饵。例如,两个寡核苷酸诱饵可以靶向来源于基因组区域的cfNA片段。跨越感兴趣的致病基因组区域的多个重叠寡核苷酸诱饵可以靶向来源于基因组区域的cfNA片段。提供一组具有对不同结合配偶体具有特异性的不同固定化标签的寡核苷酸诱饵可以允许选择性地鉴定多个不同的病原或宿主基因组,因为可以使用不同的固定化标签。寡核苷酸诱饵可以包括各种大小、标记,并且可以代表多个重叠和/或非重叠的基因组区域。第一寡核苷酸诱饵和第二寡核苷酸诱饵可以与亲和标签缀合,其中亲和标签可以是但不限于生物素、白蛋白结合蛋白、碱性磷酸酶、辣根过氧化物酶、氯霉素乙酰基转移酶、麦芽糖结合蛋白、六组氨酸标签、谷胱甘肽-S-转移酶或β半乳糖苷酶。
第一寡核苷酸诱饵和第二寡核苷酸诱饵可以与固体表面缀合。固体表面可以包括磁珠,磁珠有助于去除诱饵和捕获的感兴趣的靶标。固体表面可以包括树脂、凝胶、石英颗粒或其组合的表面。在一些非限制性示例中,所述方法考虑使用已经被固定在氨基硅烷改性的表面、
Figure BDA0004032409450000401
珠、
Figure BDA0004032409450000402
树脂或其他类似珠或树脂的支持物上的寡核苷酸诱饵。本文使用的表面可以是水凝胶,诸如海藻酸盐。本文使用的表面可以涂覆有聚合物,诸如聚乙二醇。含氟聚合物(Teflon-AF(Dupont)、
Figure BDA0004032409450000403
(Asahi Glass,日本))、芳香族聚合物(聚二甲苯(聚对二甲苯(Parylene),Kisco,Calif.)、聚苯乙烯、聚甲基丙烯酸甲酯)和金属表面(金涂层))、涂层方案(旋涂、浸涂、金属电子束沉积、热蒸气沉积和等离子体增强化学蒸气沉积)和功能化方法(聚烯丙基胺接枝、在PECVD中使用氨气、掺杂长链末端官能化的含氟烷烃等)可以在本文所述方法中用作有用的表面。固体支持物可以与不同的可寻址标志物缀合。
固体表面可以是珠。珠可以是聚合物,诸如聚苯乙烯珠或与二乙烯基苯交联的聚苯乙烯。固体支持物珠可以包括氧化铁芯。珠可以包括金属盐,诸如铜盐、镁盐、钙盐或锰盐。珠可以是纤维素、纤维素衍生物、明胶、丙烯酸树脂、玻璃、硅胶、聚乙烯吡咯烷酮(PVP)、乙烯基和丙烯酰胺的共聚物、聚丙烯酰胺、胶乳凝胶、葡聚糖、交联的葡聚糖(例如,SephadexTM)、橡胶、硅、塑料、硝化纤维素、天然海绵、金属和琼脂糖凝胶(SepharoseTM)。珠的直径可以取决于需要更小或更大珠的寡核苷酸诱饵或测定的样本的密度。珠可以具有至少约1微米(μm)、5μm、10μm、25μm、50μm、75μm、100μm、150μm、200μm、250μm、300μm、400μm、500μm、750μm、1,000μm或更大微米的直径。珠可以具有至多约1,000μm、750μm、500μm、400μm、300μm、250μm、200μm、150μm、100μm、75μm、50μm、25μm、10μm、5μm、1μm或小于1微米的直径。寡核苷酸诱饵可以与珠的表面上的功能单元偶联。珠可以是单个珠,或者可以是多个珠中的一个。多个珠可以包括至少1,000个孔。在多个珠中可以存在2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、1000、1500、2000、3000、4000、5000、10,000、100,000、1,000,000或多于1,000,000个孔。
固体支持物可以是平面表面。平面表面可以是孔的内部。孔可以具有x乘y乘z的尺寸,其中x、y和z各自独立地为至少约0.1μm、1μm、5μm、10μm、15μm、20μm、25μm、30μm、35μm、40μm、45μm、50μm、55μm、60μm、65μm、70μm、75μm、80μm、85μm、90μm、95μm、100μm、110μm、120μm、130μm、140μm、150μm、160μm、170μm、180μm、190μm、200μm、250μm、300μm、400μm、500μm、600μm、700μm、800μm、900μm、1,000μm或更大微米。孔可以具有x乘y乘z的尺寸,其中x、y和z各自独立地为至多约1,000μm、900μm、800μm、700μm、600μm、500μm、400μm、300μm、250μm、200μm、190μm、180μm、170μm、160μm、150μm、140μm、130μm、120μm、110μm、100μm、95μm、90μm、85μm、80μm、75μm、70μm、65μm、60μm、55μm、50μm、45μm、40μm、35μm、30μm、25μm、20μm、15μm、10μm、5μm、1μm、0.1μm或更小微米。例如,孔可以具有434μm的x尺寸、30μm的y尺寸和510μm的z尺寸。在另一示例中,孔可以具有16μm的x和y尺寸以及1μm的z尺寸。平面表面可以是多个孔中的一个孔。多个孔可以包括至少两个孔。多个孔可以包括至少1,000个孔。在多个孔中可以存在2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、1000、1500、2000、3000、4000、5000、10,000、100,000、1,000,000或多于1,000,000个孔。孔可以包括珠,或者平面表面可以并入珠。cfNA片段可以包含任何长度的核苷酸(例如,至少2、3、4、5、6、7、8、9、10、100、500、1000或更多个核苷酸)的任何非包封聚合物形式,无细胞脱氧核糖核苷酸(cfDNA)或无细胞核糖核苷酸(cfRNA)或其类似物。
分析与第一寡核苷酸诱饵和第二寡核苷酸诱饵杂交的cfNA片段可以包括测量与第一寡核苷酸诱饵杂交的cfNA片段的量和与第二寡核苷酸诱饵杂交的cfNA片段的量,其可以包括分析cfNA片段的大小。分析cfNA片段的大小和丰度可以允许靶向研究与感兴趣的疾病的细胞类型或功能相关联的特定cfNA片段。可以使用诸如实时聚合酶链式反应(rtPCR)或定量聚合酶链式反应(qPCR)的方法来定量片段丰度。可以使用自定义方案或装置或商业PCR仪器进行核酸扩增。商业PCR仪器可以包括PCR热循环仪和荧光读取器的组合,并且可从商业供应商处获得,诸如Agilent(Agilent)(Mx3000P qPCR系统)、伯乐实验室(Bio-RadLaboratories)(例如,CFX96 TouchTM实时PCR检测系统)、依诺米娜(Illumina)(Eco实时PCR系统)、美国生命技术公司(Life Technologies)(例如,QuantStudioTM 12K Flex系统)、德国凯杰(Qiagen)(Rotor-Gene Q)、罗氏应用科学(Roche Applied Science)(
Figure BDA0004032409450000421
系统)或赛默飞世尔科技公司(Thermo Scientific)(PikoReal实时PCR系统)以及其他。扩增的cfNA片段可以使用诸如测量UV吸光度的NanoDrop或量子位荧光计的平台进行定量,量子位荧光计是一种基于荧光染料与双链DNA(dsDNA)结合的荧光强度的DNA定量装置。诱饵池的定量可以使用微阵列整体完成。可以使用以下方法对片段大小进行定量,诸如使用自定义装置和方案或商业系统的凝胶电泳、商业毛细管电泳、cfNA片段的微流体分离、改良的流式细胞术(诸如基于嵌入染料的DNA片段大小测定,其可以显示每种染料分子的碱基对的恒定比率,导致单个DNA片段的荧光与片段长度成比例)或者可以直接计数和测定流动中单个NA片段大小的完全集成的微流体仪器,其具有用于浓度确定的集成样本体积测量。分析cfNA片段的大小也可以包括对cfNA片段进行测序,并对cfNA片段核苷酸序列与局部参考序列进行无比对序列比较。在定量cfNA片段的大小时,可以将cfNA片段的迁移率与已知标准进行比较。分析cfNA片段的大小可以包括拉伸cfNA片段和获取cfNA片段的图像。拉伸cfNA片段可以包括使用诸如光学陷阱或流动拉伸cfNA片段的方法捕获cfNA片段的末端。集成的微流体仪器可以提供用于定量丰度以及片段大小两者的多重溶液。这种仪器可以包括微流体芯片中的多重PCR扩增。这种装置可以基于自定义诱饵与固定在膜上的循环NA的杂交,以及随后的化学发光或比色检测。在溶液中,自定义诱饵的杂交可以引发酶促反应,导致可以使用光度计测量的光的产生。
分析cfNA片段的大小可以包括通过使cfDNA片段与染料接触来分析cfDNA的大小,将cfDNA片段分离成液滴,使液滴流过检测器,测量每个cfDNA片段的荧光,以及由荧光强度推断片段大小,其中染料的荧光可以通过与cfDNA片段接触而增强。荧光染料可以包括绿色荧光蛋白、异硫氰酸荧光素、荧光素、四甲基若丹明-5-(和6)-异硫氰酸盐、若丹明、花青、AlexaFluor、DAPI、Hoechst、碘化丙锭、吖啶橙或四甲基罗萨明(tetramethylrosamine)。
cfDNA液滴的大小可以变化。液滴的直径可以为至少约0.5微米(μm)、1μm、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80、μm、90μm、100μm、150μm、200μm、250μm、300μm、350μm、400μm、450μm、500μm、600μm、700μm、800μm、900μm、1000μm或更大。它们可以小于或大于这些直径或为其间的任何值。cfDNA、液滴或溶液形成频率可以为至少约0.5赫兹(Hz)、1Hz、2Hz、3Hz、4Hz、5Hz、6Hz、7Hz、8Hz、9Hz、10Hz、20Hz、30Hz、40Hz、50Hz、60Hz、70Hz、80Hz、90Hz、100Hz、200Hz、300Hz、400Hz、500Hz、600Hz、700Hz、800Hz、900Hz、1,000Hz、2,000Hz、3,000Hz、4,000Hz、5,000Hz、6,000Hz、7,000Hz、8,000Hz、9,000Hz、10,000Hz或更大。频率可以小于或大于本文列出的频率或为其间的任何值。
包含cfDNA分子的溶液可以以约1微升(μL)/分钟(min)至约12μL/min的流速流过检测器。包含cfDNA分子的溶液可以以约1μL/min至约2μL/min、约1μL/min至约3μL/min、约1μL/min至约4μL/min、约1μL/min至约5μL/min、约1μL/min至约6μL/min、约1μL/min至约7μL/min、约1μL/min至约8μL/min、约1μL/min至约9μL/min、约1μL/min至约10μL/min、约1μL/min至约11μL/min、约1μL/min至约12μL/min、约2μL/min至约3μL/min、约2μL/min至约4μL/min、约2μL/min至约5μL/min、约2μL/min至约6μL/min、约2μL/min至约7μL/min、约2μL/min至约8μL/min、约2μL/min至约9μL/min、约2μL/min至约10μL/min、约2μL/min至约11μL/min、约2μL/min至约12μL/min、约3μL/min至约4μL/min、约3μL/min至约5μL/min、约3μL/min至约6μL/min、约3μL/min至约7μL/min、约3μL/min至约8μL/min、约3μL/min至约9μL/min、约3μL/min至约10μL/min、约3μL/min至约11μL/min、约3μL/min至约12μL/min、约4μL/min至约5μL/min、约4μL/min至约6μL/min、约4μL/min至约7μL/min、约4μL/min至约8μL/min、约4μL/min至约9μL/min、约4μL/min至约10μL/min、约4μL/min至约11μL/min、约4μL/min至约12μL/min、约5μL/min至约6μL/min、约5μL/min至约7μL/min、约5μL/min至约8μL/min、约5μL/min至约9μL/min、约5μL/min至约10μL/min、约5μL/min至约11μL/min、约5μL/min至约12μL/min、约6μL/min至约7μL/min、约6μL/min至约8μL/min、约6μL/min至约9μL/min、约6μL/min至约10μL/min、约6μL/min至约11μL/min、约6μL/min至约12μL/min、约7μL/min至约8μL/min、约7μL/min至约9μL/min、约7μL/min至约10μL/min、约7μL/min至约11μL/min、约7μL/min至约12μL/min、约8μL/min至约9μL/min、约8μL/min至约10μL/min、约8μL/min至约11μL/min、约8μL/min至约12μL/min、约9μL/min至约10μL/min、约9μL/min至约11μL/min、约9μL/min至约12μL/min、约10μL/min至约11μL/min、约10μL/min至约12μL/min或约11μL/min至约12μL/min的流速流过检测器。包含cfDNA分子的溶液可以以约1μL/min、约2μL/min、约3μL/min、约4μL/min、约5μL/min、约6μL/min、约7μL/min、约8μL/min、约9μL/min、约10μL/min、约11μL/min或约12μL/min流动。包含cfDNA分子的溶液可以以至少约1μL/min、约2μL/min、约3μL/min、约4μL/min、约5μL/min、约6μL/min、约7μL/min、约8μL/min、约9μL/min、约10μL/min或约11μL/min流过检测器。包含多肽分子的溶液可以以至多约2μL/min、约3μL/min、约4μL/min、约5μL/min、约6μL/min、约7μL/min、约8μL/min、约9μL/min、约10μL/min、约11μL/min或约12μL/min流过检测器。
分析与第一寡核苷酸诱饵和第二寡核苷酸诱饵杂交的cfNA片段可以包括分析cfNA片段的大小。分析cfNA片段的大小可以包括将包括至少230个核苷酸的大cfNA片段的量与包括少于230个核苷酸的小cfNA片段的量进行比较。大cfNA片段可以包括至少185、255、270或310个核苷酸。大片段可以包括约50、55、60、65、70、75、80、85、90、100、150、200、250、300、350、400、450、500、600、700、800、900、1000或多于1000个碱基对。大片段可以包括约1000、900、800、700、600、500、450、400、350、300、250、200、150、100、90、80、70、60、50或少于50个碱基对。小cfNA片段可以包括少于220、205、190或175个核苷酸。小片段可以包括约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、230或多于230个碱基对。小片段可以包括约少于230、200、150、100、90、80、70、60、50、45、40、35、30、25、20、15、10、9、8、7、6、5、4、3、2或1个碱基对。小cfNA片段可以包括少于220、205、190或175个核苷酸。大cfNA片段的增加的丰度可以指示医学病况。至少0.2、0.25、0.3、0.35或0.4的大cfNA片段与小cfNA片段的比率可以指示医学病况。大cfNA片段与小cfNA片段的比率可以为至少.1、.15、.2、.25、.3、.35、.4、.45、.5、.6、.7、.8、.9或1并且可以指示医学病况。大cfNA与小cfNA片段的比率可以小于1、.9、.8、.7、.6、.5、.45、.4、.35、.3、.25、.2、.15、.1或小于.1。
分析与第一寡核苷酸诱饵和第二寡核苷酸诱饵杂交的cfNA片段可以包括对cfNA片段进行测序,并对cfNA片段核苷酸序列与局部参考进行无比对序列比较。表征来源于基因组区域的cfNA片段可以包括使包括cfNA的组合物与寡核苷酸诱饵接触,以及对与寡核苷酸诱饵杂交的cfNA片段进行测序,并鉴定基因组区域内的两个或更多个子区域,计数与每个子区域匹配的cfNA片段的数量,其中寡核苷酸诱饵可以包括与基因组区域的序列互补的序列。对cfNA片段序列的相对量进行定量可以包括与第一寡核苷酸诱饵的第一末端远端的序列比对,而cfNA片段序列与第一寡核苷酸诱饵的第二末端远端的序列比对。对cfNA片段序列的相对量进行定量可以包括与第二寡核苷酸诱饵的第一末端远端的序列比对,而cfNA片段序列与第二寡核苷酸诱饵的第二末端远端的序列比对。
本公开内容的方面可以包括一种表征来源于基因组区域的cfNA片段的方法,其包括:通过用包括与基因组区域的第一序列互补的序列的第一寡核苷酸诱饵杂交捕获,从生物样本收集第一组cfNA片段;通过用包括与基因组区域的第二序列互补的序列的第二寡核苷酸诱饵杂交捕获,从生物样本收集第二组cfNA片段;以及比较第一组cfNA片段和第二组cfNA片段,其中表征片段化模式不包括鉴定第一组cfNA片段或第二组cfNA片段的基因组位置或长度。第一寡核苷酸诱饵和第二寡核苷酸诱饵可以与亲和标签缀合,其中亲和标签可以包括生物素。第一寡核苷酸诱饵和第二寡核苷酸诱饵可以与固体表面缀合。固体表面可以包括珠。固体表面可以包括平面表面。cfNA片段可以包含任何长度的核苷酸(例如,至少2、3、4、5、6、7、8、9、10、100、500、1000或更多个核苷酸)的任何非包封聚合物形式,无细胞脱氧核糖核苷酸(cfDNA)或无细胞核糖核苷酸(cfRNA)或其类似物。表征cfNA片段的片段化模式可以包括分析cfNA片段的大小或丰度。
每组分子功能特异性寡核苷酸可以促进与靶标病理相关联的不同片段化模式的分离。每个固体表面可以提供有结合配偶体,所述结合配偶体对仅存在于一组分子功能特异性或病理特异性寡核苷酸上的一个固定化标签具有特异性。因此,通过将每个不同的固定化标签与特定的结合配偶体结合,可以将不同的感兴趣的基因组分离到不同的固体表面上。例如,如果感兴趣的第一致病基因组被分离到一组磁珠上,并且感兴趣的第二致病基因组被分离到一组聚苯乙烯或玻璃珠上,则简单的磁分离可以从聚苯乙烯或玻璃珠上除去磁珠,从而分离两个不同的致病基因组。有可能在同一固体表面上分离多个不同的靶标,随后利用测序和映射方案来分离和鉴定不同的靶标。
对于多个富集的核酸池,可以使用功能等位基因信息对这些富集的核酸进行功能性分型。每个细胞,健康的或者具有病理状况,都可能携带与器官作用或功能相关联的特定分子特征。虽然不同的组织和细胞类型可能看起来和操作不同,但它们都可能来源于相同的DNA序列。细胞的分子特征可能受染色质组织和转录调节的控制。虽然DNA本身在不同的细胞类型中可能保持不变,但细胞核中DNA的组织可能因核小体组织而变化。每种细胞类型,包括特定病理(诸如癌症)的细胞类型,都可以具有单独的染色质密码,其定义了可以控制基因表达的核小体位置和间隔。在细胞死亡期间,染色质密码可能经历变化,这种变化可能会保持一些细胞类型和功能特征,同时破坏其他特征。无论细胞死亡类型如何,DNA片段化都可以经由巨噬细胞溶酶体DNaseII发生,这与细胞凋亡中半胱天冬蛋白酶活化的DNase相反。这些特征可以在来自血液的cfNA中追踪,因为来自死亡细胞的一些cfNA可能逃避或逃脱吞噬作用并进入血流,导致在血浆中存在cfNA。
本公开内容的方面可以包括一种表征来源于基因组区域的cfNA片段的方法,其包括通过用包括与基因组区域的第一序列互补的序列的第一寡核苷酸诱饵杂交捕获,从生物样本收集第一组cfNA片段;通过用包括与基因组区域的第二序列互补的序列的第二寡核苷酸诱饵杂交捕获,从生物样本收集第二组cfNA片段;以及分析第一组cfNA片段和第二组cfNA片段的丰度,其中分析cfNA片段的丰度可以包括对cfNA片段进行测序和对cfNA片段核苷酸序列与局部参考进行无比对序列比较。杂交捕获可以允许有效利用当前的高通量测序,并为多个靶标基因座以及多个平行样本生成更大的数据集。在杂交捕获中,诱饵分子可以用于从核酸文库中选择靶区域以用于测序。cfNA片段的增加的丰度可以指示医学病况。可以使用诸如实时聚合酶链式反应(rtPCR)或定量聚合酶链式反应(qPCR)的方法来对片段丰度进行定量。集成的微流体仪器可以提供用于定量丰度以及片段大小两者的多重溶液。分析cfDNA的大小或丰度可以包括多种方法(诸如使用分光光度计测量260nm波长下DNA溶液的光密度),或者可以包括凝胶电泳,其将DNA片段分离并且随后定量来自嵌入染料的条带荧光,以直接定量来自含有DNA和嵌入染料的溶液的荧光。
本公开内容的方面可以包括一种表征来源于基因组区域的cfNA片段的方法,其包括:通过用包括与基因组区域的第一序列互补的序列的第一寡核苷酸诱饵杂交捕获,从生物样本收集第一组cfNA片段;通过用包括与基因组区域的第二序列互补的序列的第二寡核苷酸诱饵杂交捕获,从生物样本收集第二组cfNA片段;以及分析第一组cfNA片段和第二组cfNA片段的大小。分析cfNA的大小可以包括电泳分离,其中电泳分离可以包括凝胶电泳或毛细管电泳。电泳分离可以包括cfNA片段的微流体分离。分析cfNA的片段大小可以包括将cfNA片段的迁移率与已知标准进行比较。已知标准可以从自定义参考文库(诸如基于临床或经验数据的参考文库)提供,或者可以是商业上可获得的分子量参考集。分析cfNA片段的大小可以包括拉伸cfNA片段和获取cfNA片段的图像。
分析cfNA片段的大小可以包括在光学陷阱中捕获cfNA片段的末端或流动拉伸cfNA片段。分析cfNA片段的大小可以包括使cfNA片段与染料接触,将cfNA片段分离成液滴,使液滴流过检测器,测量每个cfNA片段的荧光,并由荧光强度计算大小,其中染料的荧光通过与cfNA片段接触而增强。
分析cfNA片段的大小可以包括:对于第一组cfNA片段,将包括至少230个核苷酸的大cfNA片段的量与包括少于230个核苷酸的小cfNA片段的量进行比较,以及对于第二组cfNA片段,将包括至少230个核苷酸的大cfNA片段的量与包括少于230个核苷酸的小cfNA片段的量进行比较。大cfNA片段可以包括至少185、255、270或310个核苷酸。大片段可以包括约50、55、60、65、70、75、80、85、90、100、150、200、250、300、350、400、450、500、600、700、800、900、1000或多于1000个碱基对。大片段可以包括约1000、900、800、700、600、500、450、400、350、300、250、200、150、100、90、80、70、60、50或少于50个碱基对。小cfNA片段可以包括少于220、205、190或175个核苷酸。小片段可以包括约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、230或多于230个碱基对。小片段可以包括约少于230、200、150、100、90、80、70、60、50、45、40、35、30、25、20、15、10、9、8、7、6、5、4、3、2或1个碱基对。小cfNA片段可以包括少于220、205、190或175个核苷酸。第一组cfNA片段中大cfNA片段的增加的丰度可以指示医学病况。第一组cfNA片段中至少为0.2、0.25、0.3、0.35或0.4的大cfNA片段与小cfNA片段的比率可以指示医学病况。第一组cfNA片段中大cfNA片段与小cfNA片段的比率可以为至少.1、.15、.2、.25、.3、.35、.4、.45、.5、.6、.7、.8、.9或1,并且可以指示医学病况。第一组cfNA片段中大cfNA与小cfNA片段的比率可以为小于1、.9、.8、.7、.6、.5、.45、.4、.35、.3、.25、.2、.15、.1或小于.1,并且可以指示医学病况。
本公开内容的方面可以包括一种表征来源于基因组区域的cfNA片段的方法,其包括:通过用包括与基因组区域的第一序列互补的序列的第一寡核苷酸诱饵杂交捕获,从生物样本收集第一组cfNA片段;通过用包括与基因组区域的第二序列互补的序列的第二寡核苷酸诱饵杂交捕获,从生物样本收集第二组cfNA片段;对第一组cfNA片段和第二组cfNA片段进行测序;以及对cfNA片段核苷酸序列与局部参考序列进行无比对序列比较。对来源于基因组区域的cfNA片段的相对量进行定量可以包括通过用包括与基因组区域的第一序列互补的序列的第一寡核苷酸诱饵杂交捕获,从生物样本收集第一组cfNA片段;通过用包括与基因组区域的第二序列互补的序列的第二寡核苷酸诱饵杂交捕获,从生物样本收集第二组cfNA片段;对第一组cfNA片段和第二组cfNA片段进行测序;鉴定基因组区域内的两个或更多个子区域;以及对与每个子区域匹配的cfNA片段的数量进行计数。如果cfNA片段的序列与子区域的序列相同,或者该片段的序列经由近似字符串匹配或类似方法(诸如Levenshtein距离、BK-Trees或Norvig方法)分配给该子区域,则该片段可以与该子区域匹配。
本公开内容的方面可以包括一种表征来源于基因组区域的cfNA片段的方法,其包括将包括基因组区域的第一部分的cfNA片段的量与包括基因组区域的第二部分的cfNA片段的量进行比较。可以从同一基因组区域或从重叠基因组区域分析多个cfNA片段。可以包括基因组区域的第一部分和第二部分的cfNA片段的量可以通过包括扩增基因组区域的所述部分的扩增的方法来确定。可以使用多种技术诸如自定义方案或装置或商业PCR仪器进行扩增。商业PCR仪器可以包括PCR热循环仪和荧光读取器的组合,并且可以从商业供应商处获得,诸如Agilent(Mx3000P qPCR系统)、伯乐实验室(例如,CFX96 TouchTM实时PCR检测系统)、依诺米娜(Eco实时PCR系统)、美国生命技术公司(例如,QuantStudioTM 12K Flex系统)、德国凯杰(Rotor-Gene Q)、罗氏应用科学(
Figure BDA0004032409450000501
系统)或赛默飞世尔科技公司(PikoReal实时PCR系统)以及其他。扩增的cfNA片段可以使用诸如测量UV吸光度的NanoDrop、量子位荧光计、基于荧光染料与双链DNA(dsDNA)结合的荧光强度的DNA定量装置的平台或诸如环介导等温扩增的方法进行定量。基于核酸序列的扩增、链置换扩增或多重置换扩增。
包括cfNA的组合物可以包括或包含血液(例如,全血)、血浆、血清、脐带血、绒毛膜绒毛、羊水、灌洗液(例如,支气管肺泡、胃、腹膜、导管、耳、关节镜)、气管支气管灌洗液、活检样本(例如,来自植入前胚胎)、体腔穿刺样本、胎儿有核细胞或胎儿细胞残余物、胆汁、乳汁、尿液、唾液、粘膜排泄物、痰、粪便、汗液、阴道液、来自鞘膜积液(例如,睾丸鞘膜积液)的液体、阴道冲洗液、胸膜液、腹水、羊水、腹膜液、腹水、腹腔骨盆冲洗液/灌洗液、浆液性渗出液、脑脊液、支气管肺泡灌洗液、来自乳头的排出液、来自身体不同部位(例如,甲状腺、乳房)的抽吸液、泪液、胚胎细胞或胎儿细胞(例如,胎盘细胞)。
基因组区域可以包括第一外显子和/或随后的外显子。基因组区域可以包括活性转录起始位点、启动子的至少一个核苷酸、转录起始位点、DNase I超敏位点、Pol II暂停位点、外显子边界的内含子或非翻译区域。基因组区域的表达或死亡后片段化可以在医学病况下改变。本公开内容的方面可以包括分析cfNA片段化模式的方法,其包括表征来源于一个、两个或多于两个基因组区域的cfNA片段。
在一些实施方案中,cfNA片段可以间接来源于基因组区域。例如,HER2基因的拷贝数在一些乳腺癌肿瘤中通过形成双微小(DM)染色体而扩增。在这些肿瘤中,DM染色体上的HER2基因组区域来源于染色体17上的HER2基因组区域。来源于DM染色体的HER2基因座的cfNA片段可以与来源于染色体17的HER2基因座的cfNA片段具有相同的序列,并且将与染色体17上的HER2基因座比对,因为cfNA片段间接来源于染色体17基因座。在另一实施方案中,cfNA片段是通过转录和RNA加工间接来源于基因组区域的cfRNA片段。
基因组区域可以包括特定生理学上相关或病理学上相关病况的起始位点或第一外显子,诸如类固醇应答基因的第一外显子。从此类基因组区域开发生物标志物可以允许跟踪所施用的药物的药代动力学或生物利用度,这将允许监测对治疗、剂量优化或治疗选择的应答的幅度。例如,类固醇应答基因的起始位点或第一外显子可以用于确定对用糖皮质激素治疗的免疫应答的幅度。具有与血管生成或血管再生相关联的分子功能的基因的起始位点或第一外显子可以用于确定恶性肿瘤对用化学疗法的治疗的应答。如在表1中可以看到的,分子功能诸如类固醇特征、血管标志物或血管再生可以通过可以与分子途径或功能相关联的多种基因与分子途径诸如血管稳定性或内皮细胞标志物基因相关联。这些特征可以追溯到特定的染色体、核苷酸序列、位置或链。
Figure BDA0004032409450000511
Figure BDA0004032409450000521
Figure BDA0004032409450000531
Figure BDA0004032409450000541
Figure BDA0004032409450000551
表1:与类固醇治疗应答和肿瘤治疗应答相关联的分子功能的靶基因组区域和关键字。
类固醇应答基因可以包括糖皮质激素应答基因、抗炎基因或嗜中性粒细胞激活特征基因。糖皮质激素应答基因可以包括FKBP5、ECHDC3、IL1R2或ZBTB16以及其他。抗炎基因可以包括DUSP1、TSC22D3、IRAK3或CD163以及其他。嗜中性粒细胞激活特征基因可以包括BCL2或MCL1以及其他。基因组区域可以包括但不限于血管标志物基因、内皮细胞标志物基因或血管再生基因的起始位点或第一外显子。血管标志物基因可以包括内皮细胞标志物基因或周皮细胞标志物基因以及其他。内皮细胞标志物基因可以包括但不限于PECAM1、CDH5、VWF或EPHB4。周皮细胞标志物基因可以包括但不限于CSPG4、ACTA2或DES。整合素基因可以包括但不限于ITGAV或ITGB3。血管再生基因可以包括但不限于血管不稳定性基因、血管稳定性基因或notch家族基因。血管不稳定性基因可以包括但不限于HIF1AN、VEGFA、PGF、FLT1、KDR、NR4A1、FGF2、FGFR1或FGFR2。血管稳定性基因可以包括但不限于ANGPT1、ANGPT2、TEK、PDGFB、PDGFRB、TGFB1、TGFBR1或ENG。根据权利要求100所述的方法,其中所述notch家族基因是NOTCH1、NOTCH3、DLL4或JAG1。基因组区域可以选自但不限于EphB4基因的前5个外显子。
本公开内容的方面可以包括一种评估对象的医学病况的方法,其包括表征来源于基因组区域的cfNA片段的片段化模式。表征来源于基因组区域的cfNA片段的片段化模式可以包括用于检测和监测一种或多种生理或病理状况的存在和进展的非侵入性测试。在给定的疾病中,改变的表观遗传调节、基因组调节和自身免疫抗体的产生之间失调性细胞死亡的相互作用可能导致循环NA(诸如cfDNA)的异常模式。自定义的富集组或描绘给定的疾病的血浆中cfNA的生物特征的最佳测定条件可以允许经由抽血或类似微创方法检测任何病理的准确的能力。分子测定、靶向的组设计和生物信息学管道的组合可能与此类方法的设计及其结果的下游解释相关联。
本公开内容的方面可以包括一种用于治疗对象的癌症的适应性免疫疗法的方法,其包括:向对象施用第一疗程的第一免疫疗法化合物;从所述对象获取与癌症相关分子功能诸如血管再生和/或血管生成相关联的一种或多种基因的纵向无细胞NA片段化概况;和向所述对象施用第二疗程的免疫疗法;其中第二疗程的免疫疗法可以包括:第二免疫疗法化合物,如果无细胞NA片段化概况指示对第一免疫疗法化合物的应答不足;或者第二疗程的第一免疫疗法化合物,如果无细胞NA片段化概况不指示对第一免疫疗法化合物的应答不足。癌症可以包括但不限于诸如肺癌、黑色素瘤、胃肠道类癌瘤、结肠直肠癌或胰腺癌的癌症。获取与癌症相关分子功能相关联的一种或多种基因的纵向cfNA片段化概况可以允许将治疗从一线疗法快速改变为第二、第三或后续疗法,这可以节省治疗过程中的时间或快速确定用于对象的最有效治疗。测量癌症进展或对疗法的应答率的能力可以降低与无效疗法相关联的副作用和成本。肿瘤进展标志物的可用性可以导致变得可用于二线疗法或有资格进行二线试验的患者的改善的存活率。
适应性免疫疗法可以包括任何免疫疗法,诸如CAR T细胞疗法,其可以规避或减轻癌细胞的免疫耐受以重建抗肿瘤免疫。如果对象中的cfNA片段化概况未指示对第一免疫疗法或化学疗法化合物有足够的应答,则可在第一疗程的免疫疗法或化学疗法之后使用第二轮且不同的免疫疗法或化学疗法。
获取纵向无细胞NA片段化概况可以包括在施用第一剂量的第一疗程的第一免疫疗法化合物之前的初始T0时间点从对象获取第一生物样本,和在施用第一剂量的第一疗程的第一免疫疗法化合物之后从对象获取一个或多个生物样本。可以在施用第一剂量的第一疗程的第一免疫疗法或化学疗法化合物之后获取一个或多个生物样本,并且该获取可以发生在施用一剂量的第一疗程的第一免疫疗法化合物的同一天。
无细胞NA片段化概况可以包括但不限于来源于与癌症相关分子功能(诸如但不限于血管再生和/或血管生成)相关联的一种或多种基因的增强子、启动子、第一外显子或启动子近端转录暂停位点的NA片段的大小。来源于基因组区域的大无细胞NA片段随时间的增加可指示对第一免疫疗法或化学疗法化合物的应答不足,所述基因组区域为诸如但不限于与癌症相关的分子功能(诸如血管再生和/或血管生成)相关联的一种或多种基因的增强子、启动子、第一外显子或启动子近端转录暂停位点。第一免疫疗法或化学疗法化合物和第二免疫疗法或化学疗法化合物可以选自但不限于帕博利珠单抗(pembrolizumab)、纳武单抗(nivolumab)、阿替利珠单抗(atezolizumab)、德瓦鲁单抗(durvalumab)、阿维单抗(avelumab)、阿昔替尼(axitinib)、伊匹木单抗(ipilimumab)、六甲密胺(altretamine)、苯达莫司汀(bendamustine)、白消安(busulfan)、卡铂(carboplatin)、卡莫司汀(carmustine)、苯丁酸氮芥(chlorambucil)、顺铂(cisplatin)、环磷酰胺(cyclophosphamide)、达卡巴嗪(cacarbazine)、cfosfamide、洛莫司丁(lomustine)、二氯甲基二乙胺(mechlorethamine)、美法仑(melphalan)、奥沙利铂(oxaliplatin)、替莫唑胺(temozolomide)、塞替派(thiotepa)、曲贝替定(trabectedin)、链脲霉素(streptozocin)、氮杂胞苷(azacytidine)、5-氟尿嘧啶(5-fluorouracil)、6-巯基嘌呤(6-mercaptopurine)、卡培他滨(capecitabine)、克拉屈滨(cladribine)、氯法拉滨(clofarabine)、阿糖胞苷(cytarabine)、地西他滨(decitabine)、氟尿苷(floxuridine)、氟达拉滨(fludarabine)、吉西他滨(gemcitabine)、羟基脲(hydroxyurea)、甲氨蝶呤(methotrexate)、奈拉滨(nelarabine)、培美曲塞(pemetrexed)、喷司他丁(pentostatin)、普拉曲沙(pralatrexate)、硫鸟嘌呤(thioguanine)、屈氟尿苷(trifluridine)/替匹嘧啶(tipiracil)组合物、柔红霉素(daunorubicin)、阿霉素(doxorubicin)、表阿霉素(epirubicin)、伊达比星(idarubicin)、戊柔比星(valrubicin)、博来霉素(bleomycin)、放线菌素D(dactinomycin)、丝裂霉素C(mitomycin-C)、米托蒽醌(mitoxantrone)、伊立替康(irinotecan)、托泊替康(topotecan)、替尼泊苷(teniposide)、依托泊苷(etoposide)、卡巴他赛(cabazitaxel)、多西他赛(docetaxel)、nab-紫杉醇(nab-paclitaxel)、紫杉醇(paclitaxel)、长春花碱(vinblastine)、长春新碱(vincristine)、长春瑞滨(vinorelbine)、三氧化二砷(arsenic trioxide)、天门冬酰胺酶(asparaginase)、艾瑞布林(eribulin)、羟基脲(hydroxyurea)、伊沙匹隆(ixabepilone)、米托坦(mitotane)、omacetaxine、培门冬酶(pegaspargase)、丙卡巴肼(procarbazine)、罗米地辛(romidepsin)或伏立诺他(vorinostat)。
本公开内容的方面可以包括一种在对象中治疗医学病况的方法,其包括:向所述对象施用一疗程的疗法以及从所述对象获取一种或多种基因的纵向无细胞DNA片段化概况;其中纵向无细胞DNA片段化概况可以指示所述对象已对所述疗程的疗法产生应答。
本公开内容的方面可以包括一种在对象中治疗医学病况的方法,其包括:从所述对象获得一种或多种基因的无细胞NA片段化概况;以及向所述对象施用一疗程的疗法,其中无细胞NA片段化概况指示所述疗程的疗法适用于所述对象。
本公开内容的方面可以包括一种试剂盒,其可以包括但不限于各种试剂的试剂盒、仪器、生物信息管道、可以不需要实验室设备的简单诊断试剂盒或盒中实验室自定义测定处理器系统的任何组合。
多诱饵系统
本公开内容提供了一种多诱饵系统,其包括用于表征来源于至少两个基因组区域的cfNA片段的至少两个寡核苷酸诱饵。在一些方面,本文公开了一种表征来源于包括第一基因组区域和第二基因组区域的至少两个基因组区域的cfNA片段的方法,其包括:a)使包括cfNA的组合物与包括与第一基因组区域的序列互补的序列的第一寡核苷酸诱饵接触,b)使所述组合物与包括与第二基因组区域的序列互补的序列的第二寡核苷酸诱饵接触,和c)分析与至少两个寡核苷酸诱饵杂交的cfNA片段的丰度、大小和序列上下文。在一些实施方案中,第一寡核苷酸诱饵富集来自组合物的短cfNA片段的群体,并且第二寡核苷酸诱饵富集来自组合物的长cfNA片段的群体。在一些实施方案中,所述方法进一步包括使所述组合物与包括与第一基因组区域的序列互补的序列的第三寡核苷酸诱饵接触。在一些实施方案中,第三寡核苷酸诱饵富集来自组合物的小cfNA片段的群体。在一些实施方案中,第三寡核苷酸诱饵富集来自组合物的长cfNA片段的群体。在一些实施方案中,所述方法进一步包括使所述组合物与包括与第二基因组区域的序列互补的序列的第四寡核苷酸诱饵接触。在一些实施方案中,第四寡核苷酸诱饵富集来自组合物的长cfNA片段的群体。在一些实施方案中,步骤(a)和步骤(b)同时发生。在一些实施方案中,至少两个基因组区域进一步包括第三基因组区域;其中所述方法进一步包括使所述组合物与包括与第三基因组区域的序列互补的序列的第五寡核苷酸诱饵接触。在一些实施方案中,第五寡核苷酸诱饵富集来自组合物的短cfNA片段的群体。在一些实施方案中,第五寡核苷酸诱饵富集来自组合物的长cfNA片段的群体。在一些实施方案中,使所述组合物与第五寡核苷酸诱饵接触与步骤(a)和步骤(b)同时发生。在一些实施方案中,所述方法进一步包括使所述组合物与包括与第三基因组区域的序列互补的序列的第六寡核苷酸诱饵接触。在一些实施方案中,第六寡核苷酸诱饵富集来自组合物的长cfNA片段的群体。在一些实施方案中,第六寡核苷酸诱饵富集来自组合物的短cfNA片段的群体。在一些实施方案中,使所述组合物与第六寡核苷酸诱饵接触与使所述组合物与第五寡核苷酸诱饵接触、步骤(a)和步骤(b)同时发生。在一些实施方案中,其中分析cfNA片段的丰度、大小和序列上下文不包括鉴定cfNA片段的基因组位置或长度。在一些实施方案中,第一寡核苷酸诱饵、第二寡核苷酸诱饵、第三寡核苷酸诱饵、第四寡核苷酸诱饵、第五寡核苷酸诱饵和/或第六寡核苷酸诱饵与亲和标签缀合。在一些方面,本公开内容提供了一种评估对象的医学病况的方法,其包括根据本文公开的任何方法表征来源于至少两个基因组区域的cfDNA片段的片段化模式。
实施例
实施例1.糖皮质激素治疗改变糖皮质激素应答基因的cfDNA片段化模式
基因表达由DNA结合蛋白(例如转录因子和聚合酶)介导,这些结合蛋白可以保护DNA免受核酸酶(包括使垂死细胞的DNA片段化的核酸酶)的切割。基因表达的改变可以改变来源于差异表达的基因的启动子和转录起始位点的cfDNA的片段化模式。
一名先前轻度暴露于毒橡树的健康女性志愿者用单剂量的40mg泼尼松龙(一种常见的抗炎药物)治疗。在泼尼松龙施用前获得第一组血液样本,并且16小时后获得第二血液样本(图1)。通过静脉穿刺将血液收集在10mL EDTA真空容器中,并在抽血后两小时内进行加工。在离心前立即通过轻轻倒置管8至10次重新混合血液样本。为了分离血浆,在室温下以1600xg离心全血10分钟。除去上部血浆层,并转移到新的锥形管中。血浆以16000xg离心10分钟。根据需要将血浆等分到1mL小瓶中,并在-80℃下储存,以保持稳定性并避免DNA的降解和污染。使用QIAamp循环核酸kid(德国凯杰,55114)从血浆中提取cfDNA,并在生物分析仪2100(Agilent技术公司)上评估血浆cfDNA的质量。使用Kapa Hyper Prep试剂盒(Kapa生物系统(Kapa Biosystems))为每个时间点产生四个cfDNA测序文库。使用依诺米娜NovaSeq 6000DNA测序仪对带条形码的文库进行定量、合并和成对末端测序。生物信息学工作流程涉及通过依诺米娜的RTA软件(v2.12)生成碱基调用,使用bcl2fastq进行去多重化,以及使用BWA v0.7.1将读数映射到人类参考基因组Hg19,在AWS云上执行。通过PicardTools v1.11和Samtools v0.1.18删除重复和低质量的读数,并使用生物信息工作流程进行处理。
已知抗炎糖皮质激素诱导DUSP1基因的表达。在泼尼松龙施用后(时间点2),来源于DUSP1基因的启动子和第一外显子的长cfDNA片段的百分比存在相对增加,与转录因子和与DUSP1结合的RNA聚合酶的预期增加一致(图2)。
糖皮质激素诱导miR-708的表达,导致RAP1B转录的抑制。在泼尼松龙施用之前和之后,比较来源于RAP1B的启动子和第一外显子的cfDNA片段,以观察抑制RAP1B的作用。在泼尼松龙施用后,存在相对较少的长读数,与预期的转录因子减少和RNA聚合酶与RAP1B启动子结合一致(图3)。
实施例2.在cfDNA片段化模式中监测免疫疗法应答
患有晚期胰腺癌的患者用1000mg/m2吉西他滨和125mg/m2 nab-紫杉醇的组合治疗。以两个月间隔采集血浆样本,并在-80℃下储存。从存活至T3时间点的三名患者的血浆样本中提取cfDNA,并在依诺米娜NovaSeq 6000DNA测序仪上对cfDNA片段进行测序,如示例1所述。询问片段化模式,以鉴定免疫疗法应答性和cfDNA片段化模式之间的信息相关性。
在EphB4基因座处观察到显著的相关性。EphB4在内皮细胞中表达,除白细胞外,内皮细胞是cfDNA的最主要来源。EphB4在血管生成中发挥作用,其为肿瘤创造血液供应,表明在EphB4表达与对免疫疗法的应答性之间的机制性联系。特别地,来源于EphB4的前6个外显子的长cfDNA片段的百分比在癌症对免疫疗法有应答的个体(PT6)中随时间增加,并且在其癌症对免疫疗法无应答的两个个体(PT11和PT2)中和在用泼尼松龙治疗的健康个体(DA)中保持恒定或降低(图4)。此外,T3时PT6中长片段的最终百分比与在健康个体中观察到的长EphB4cfDNA片段的百分比最相似(图4)。
表2:在时间疗程研究中,在三名胰腺癌患者和一名无癌症对照对象的队列中内皮细胞标志物EphB4的cfDNA片段计数
Figure BDA0004032409450000611
Figure BDA0004032409450000621
在vWF基因座处观察到免疫疗法应答性和cfDNA片段化之间的类似相关性。vWF基因也参与血管生成。从来源于染色体7上的EphB4基因和染色体12上的vWF基因的长cfDNA片段的百分比产生复合血管生成应答指数。通过在综合指数中包含多种基因,可以集中于跨越信息最丰富的外显子(外显子1)的片段,同时仍然考虑足够的总cfDNA片段以提供稳健的信号。综合指数在有应答的个体(PT6)中随时间增加,并且在无应答者中降低(图5)。在T3(最终时间点),PT6与健康个体具有相似百分比的长EphB4和vWF片段。使用两种基因来映射血管生成分子功能,与仅使用EPHB4时观察到相同的广泛模式。
通过cfDNA片段化模式的非侵入性测试对免疫疗法应答性的早期检测可以鉴定应继续治疗的有应答的患者和可能受益于用不同化合物治疗的无应答患者。
早期检测可以通过非侵入性cfDNA诊断来改善,可以允许分子功能概况,诸如脉管系统,以快速分析治疗应答,从而排除无效的治疗及其疗程长度,并在治疗周期的早期给予无应答者替代线疗法。这可以节约成本,提高生活质量并且增加存活率。
实施例3.检测cfNA片段化模式的改进的方法
用于分析临床相关基因组位点的cfNA片段化模式的靶向方法可以以深度测序的一小部分成本提供更稳健的读数。
用诱饵捕获cfDNA片段
诱饵的集合被设计为靶向来源于代表临床相关功能的基因组位点的多个cfDNA片段,如图6所示。每个诱饵捕获短(例如<230nt)和长(例如>230nt)cfDNA片段的混合物。针对不同的时间点、病况和/或患者组,比较短读取和长读取的丰度。根据由诱饵组所代表的临床相关功能,短cfDNA片段和长cfDNA片段的相对丰度的变化指示生理或病理状况的变化。
从由两个或更多个诱饵捕获的DNA的量推断片段大小
设计了一组诱饵以区分已知的cfNA片段化模式,而无需确定捕获的片段的大小,如图8所示。具有短cfNA片段和长cfNA片段的混合物的生物样本与两个诱饵接触,这两个诱饵捕获不同的cfNA片段并且对较短的或较长的片段具有偏好。例如,诱饵1可以捕获较短的片段,而诱饵2可以捕获较长的片段。然后用与诱饵1和诱饵2杂交的NA片段的相对量来推断靶向的基因组区域中短片段和长片段的相对丰度。一组诱饵可以靶向来源于一个基因组区域或多个基因组区域的cfNA片段。
将序列映射到参考以表征cfDNA片段化
来源于一个或多个基因组区域的短片段和长片段的相对丰度可以通过将捕获的片段的序列映射到自定义参考(关键字)来定量,如图7所示。该方法不需要确定每个捕获的片段的绝对长度,将片段序列映射到参考基因组,或鉴定单独的片段的末端。对从具有长NA片段和短NA片段的混合物的生物样本中分离的核酸进行测序,以确定代表性数量的NA片段中的核苷酸碱基。参考1和参考2代表基因组位点的不同部分(例如转录活性基因座)。在图7所示的示例中,参考1与短NA片段和长NA片段两者匹配,而参考2仅与较长的片段匹配。对每个测序的NA片段与参考1和参考2的匹配进行评分。与参考2(或参考1和参考2)匹配的NA片段序列相对于仅与参考1匹配的NA片段序列的比例的增加表明在基因组位点处较长NA片段的相对丰度增加。
使用NA扩增来检测NA片段化模式
核酸扩增可以用于观察NA片段化模式,而无需确定单独的NA片段的长度、鉴定单独的NA片段的末端、对片段进行测序或将其序列映射到参考基因组。
如图9所示,可以设计一组三个引物,以从生物样本中的cfNA产生短扩增子和长扩增子的混合物。正向引物和一个反向引物与短cfNA片段和长cfNA片段两者杂交,并且第二反向引物仅与较长的片段杂交。短扩增子或长扩增子的相对丰度与生物样本中短核酸片段和长核酸片段的丰度相关。
如图10所示,可以设计一组四个引物,以从生物样本中的NA的异质群体产生两个短扩增子和一个长扩增子的混合物。第一对引物(P1和P2)产生代表基因组位点的一个部分的短扩增子,并且第二对引物(P3和P4)产生代表基因组位点的另一个部分的短扩增子。可以从外部引物(P1和P4)产生更长的扩增子。短扩增子和长扩增子的相对丰度与生物样本中短核酸片段和长核酸片段的丰度相关。
使用图9的三个引物或图10的四个引物的核酸扩增可以在与所有三个或四个引物的竞争反应中进行,或在对每个扩增循环产生的每个扩增子的量进行定量的单独反应中进行。用三个引物或四个引物区分片段化模式的原则可以通过添加更多引物来扩展,以产生代表基因组位点的额外或重叠部分的各种大小的扩增子。使用多个探针允许多个重叠的多核苷酸跨越感兴趣的基因组区域。
自定义参考代表不同的片段化模式
包括来自转录活性基因座(关键字)的一个或多个区段的自定义参考被设计为代表在基因组区域中以给定的片段化模式最大量或选择性存在的cfNA片段。图11示出了基因组区域的两种片段化模式。片段化模式#1的大多数cfNA片段与自定义参考#1的关键字重叠,并且片段化模式#2的大多数cfNA片段与自定义参考#2的关键字重叠。
比较生物样本中两种片段化模式的相对丰度的一种方法是对来源于基因组区域的cfNA片段进行测序,并且经由无比对方法将序列与自定义参考#1和#2的关键字进行匹配。如果片段化模式#1占优势,则更高百分比的cfNA片段序列将与自定义参考#1的关键字匹配。对于这种方法,可以使用覆盖整个区域且对任一片段化模式均无选择性的平铺的诱饵富集来源于基因组区域(例如,转录活性基因座)的所有cfNA片段。
在另一种方法中,比较了由与自定义参考#1和#2的关键字对应的诱饵捕获的cfNA片段的量。与由自定义参考#2诱饵捕获的cfNA片段的量相比,由自定义参考#1诱饵捕获的cfNA片段的量的增加将指示与片段化模式#2相比,片段化模式#1的比例增加。
实施例4.将患病的患者与健康对照进行比较
总体上,该系统的方法包括从血浆中提取cfNA,用诱饵收集cfNA片段,对大cfNA片段和小cfNA片段进行定量,以及执行统计测试以确定病理或生理状况的存在或进展。来自一名或多名患者和一名或多名健康志愿者的生物样本通过非侵入性程序(诸如抽血)收集。使用诱饵分离多个cfNA片段。在一些实施方案中,分析了从生物样本中分离的所有cfNA片段。在其他实施方案中,由从生物样本分离的核酸部分捕获靶向的cfNA片段。针对每个生物样本,对捕获的cfNA池进行定量。鉴定了在健康和患病的队列中捕获的cfNA池的中位丰度,并且鉴定了cfNA片段的大小和/或丰度的变化最高的诱饵。大小和/或丰度的变化可以通过任何合适的参数或非参数数学关系进行比较。例如,与健康队列相比,计算在测试的样本中经鉴定的池中的cfDNA的大小和/或丰度之间的第一皮尔逊相关性。与患病的队列相比,计算测试的样本中鉴定的池中的cfDNA的大小和/或丰度之间的第二皮尔逊相关性。如果第二皮尔逊相关性的幅度强于第一皮尔逊相关性,则疾病、病症或病况被鉴定或诊断。
将健康对照与诱导的药理学应答进行比较
从通过非侵入性程序(诸如在抽血器中抽血)接受靶向药物或治疗的一名或多名患者和一名或多名健康志愿者中收集生物样本。从收集的生物样本中分离出cfNA。使用靶向预期由于药物:治疗相互作用而改变的基因组区域的诱饵从片段中分离出多个cfNA片段。针对每个样本,对分离的池进行定量,并且鉴定健康和患病的队列中分离的池的中位丰度。鉴定了cfNA片段的大小和/或丰度变化最大的诱饵。确定测试的样本相对于健康队列中所鉴定的池中的cfNA的大小和/或丰度之间的第一皮尔逊相关性,并且计算测试的样本中所鉴定的池中的cfNA的大小或丰度与患病的队列相比的第二皮尔逊相关性。如果第二皮尔逊相关性的幅度强于第一皮尔逊相关性,则疾病、病症或病况被鉴定或诊断。
纵向分析
从通过非侵入性程序(诸如在抽血器中抽血)接受靶向药物或治疗的一名或多名患者和一名或多名健康志愿者中收集生物样本。从收集的生物样本中分离出cfNA。使用靶向具有与疾病相关联的预期的调控变化的基因组区域的诱饵来分离多个cfNA片段。针对每个样本,对分离的池进行定量,并且鉴定所有时间点处隔离的池的丰度和/或大小。执行用于检测每个池的纵向时间序列中的变化的统计方法。如果经由检测时间序列数据中不同变化的变化点分析检测到统计上显著且持续的变化,则疾病、病症或病况被鉴定或诊断。
实施例5.区分两种片段化模式的方法
图12-18展示了通过富集长cfDNA片段来区分两种cfDNA片段化模式的各种方法。每幅图的顶部示出了带有启动子和转录起始位点的基因组区域。箭头代表mRNA。该示例性基因组区域具有两种状态:存在于正常细胞中的关闭状态和存在于患病细胞中的打开状态。在正常(关闭)状态下,基因组DNA包裹在核小体周围,核小体始终与基因组DNA的相同区段结合。在患病(打开)状态下,转录因子的复合体与启动子结合,并且RNA聚合酶通常在其中转录延迟或停滞的位置处与DNA的区段缔合。
当细胞死亡时,核小体、转录因子、聚合酶和其他DNA结合蛋白仍然与基因组DNA缔合,并且通过在细胞凋亡、坏死或其他形式的细胞死亡期间起作用的核酸酶保护它们所结合的DNA区段免于降解。因此,从垂死细胞释放到循环血液中的cfDNA片段根据细胞死亡之前的激活状态而具有不同的片段化模式。正常的cfDNA片段化模式具有与三个核小体结合位点重叠的cfDNA片段,并且患病的cfDNA片段化模式具有与转录因子结合位点和聚合酶停滞位点重叠的cfDNA片段。
使用捕获cfDNA片段的寡核苷酸诱饵可以区分两种片段化模式,所述cfDNA片段包括与在正常细胞中受核小体保护的一组较短cfDNA片段和在患病的细胞中受转录因子复合物保护的一组较长cfDNA片段重叠的序列,如图12所示。通过电泳根据它们的大小(长度)分离捕获的cfDNA片段。由诱饵捕获的长cfDNA片段的量的增加指示患病的状态。
使用捕获cfDNA片段的寡核苷酸诱饵可以区分两种片段化模式,所述cfDNA片段包括与在正常细胞中受核小体保护的一组较短cfDNA片段和在患病的细胞中受转录因子复合物保护的一组较长cfDNA片段重叠的序列,如图13所示。对捕获的cfDNA片段进行测序。评估每个序列与代表在患病的状态下受转录因子保护的DNA片段的一部分的参考序列的匹配。与参考序列匹配的DNA序列的百分比的增加指示患病的状态。
可以使用两个寡核苷酸诱饵来区分两种片段化模式,如图14所示。诱饵1捕获在患病的状态下受转录因子保护的长cfDNA片段。诱饵2捕获在正常状态下受核小体保护的较短cfDNA片段。由诱饵1捕获的cfDNA片段的相对量的增加指示患病的状态。
可以使用两个寡核苷酸诱饵来区分两种片段化模式,如图15所示。诱饵1捕获在患病的状态下受转录因子保护的长cfDNA片段,以及在正常状态下受核小体保护的较短cfDNA片段。诱饵2捕获在患病的状态下受聚合酶保护的长cfDNA片段,以及在正常状态下受核小体保护的较短cfDNA片段。通过电泳比较两个捕获的cfDNA片段的群体的大小。与诱饵1和诱饵2相关联的长cfDNA片段的比例的增加指示患病的状态。通过使用两个诱饵来增加结论的可信度。
可以使用两个寡核苷酸诱饵来区分两种片段化模式,如图16所示。诱饵1捕获在患病的状态下受转录因子保护的长cfDNA片段,以及在正常状态下受核小体保护的较短cfDNA片段。诱饵2捕获在患病的状态下受聚合酶保护的长cfDNA片段,以及在正常状态下受核小体保护的较短cfDNA片段。对捕获的cfDNA片段进行测序。患病的状态由捕获的具有与代表在患病的状态下受转录因子保护的DNA片段的一部分的参考序列1相匹配的序列的cfDNA片段的数量的增加和捕获的具有与代表在正常状态下受核小体保护的DNA片段的一部分的参考序列2相匹配的序列的cfDNA片段的数量的减少来指示。
通过扩增代表患病的状态和正常状态的cfDNA的区段,可以区分两种片段化模式,如图17所示。例如,使用F1和R1引物扩增来源于在患病的状态下受转录因子保护的cfDNA片段的cfDNA片段,并且使用F2和R2引物扩增来源于在正常状态下受核小体3保护的cfDNA片段的cfDNA片段。与第二引物对相比,由第一引物对扩增的区段的相对增加指示患病的状态。
通过使用平铺的诱饵捕获来源于整个基因组区域的所有cfDNA片段,可以区分这两种片段化模式,如图18所示。通过无比对方法将捕获的cfDNA片段的序列与参考序列1和参考序列2进行匹配,参考序列1代表在患病的状态下受转录因子保护的DNA区段,参考序列2代表在正常状态下受核小体3保护的DNA区段。与参考序列2相比,与参考序列1匹配的序列增加指示患病的状态。
实施例6.在泼尼松治疗后检测cfDNA片段化模式的变化
进一步分析示例1的cfDNA样本和全基因组测序数据,以确定低剂量糖皮质激素治疗是否诱导可以通过本文公开的方法检测到的变化。分析了染色体5(DUSP1)和染色体19(SAE1)上转录活性基因座内的基因组区域,以提供示例性的数据。在一些示例中,来自杂交捕获实验的转录激活评分(TAS)与来自配对末端全基因组测序(WGS)数据集的模拟结果进行比较。
有些过程仅涉及碱基调用的生成和至少一个参考序列。参考序列可以是在WGS数据的近似字符串匹配中使用的TAL的子字符串。具体而言,对WGS实验中获得的序列与参考序列进行部分模糊匹配,以鉴定哪些WGS序列与参考序列具有显著的子字符串相似性。术语“模糊”是指这样的事实,即当比较两个字符串时,匹配算法不会逐个位置地寻找完美的匹配。
基因调控由启动子和转录机制驱动(
Figure BDA0004032409450000691
等人,Activation functions1and 2of nuclear receptors:molecular strategies for transcriptionalactivation.Molecular Endocrinology.17(10):1901–9)。许多基因组区域已经被鉴定为基因及其独特RNA的特异性表达的驱动因素。转录因子是参与将DNA转录成RNA的蛋白质。转录因子包括多种启动和调节基因的转录的蛋白质,不包括RNA聚合酶。转录因子具有DNA结合结构域,这使它们能够结合至特定的DNA序列,诸如增强子或启动子序列。一些转录因子与转录起始位点附近的DNA启动子序列结合,并且帮助形成转录起始复合物。其他转录因子结合至调节序列,诸如增强子序列,并且可以刺激或抑制相关基因的转录。这些调节序列可以是被转录的基因上游或下游的数千个碱基对。
图19示出了通过基因表达的加帽分析(CAGE)技术(Kanamori-Katayama等人,Unamplified cap analysis of gene expression on a single-moleculesequencer.Genome Res.2011年7月;21(7):1150-9)发现的参与转录起始的基因组区域的示例。在FANTOM5项目中,以单个碱基对分辨率映射了跨过人基因组的转录起始事件,并且通过CAGE(Noguchi等人,FANTOM5 CAGE profiles of human and mouse samples.SciData 4,170112(2017))监测其频率。在DUSP1的启动子区域中观察到CAGE信号的峰,其被鉴定为DUSP1的p1启动子(图19)。
转录活性基因座(TAL)是具有开放和活性染色质结构的基因组区域,其能够实现转录。此类区域介导精确控制的基因表达模式,并且可以包括已知种类的转录调节元件,诸如核心启动子、近端启动子、远端增强子、沉默子、隔离子/边界元件,以及在公共数据库中描述的基因座控制区域,例如FANTOM5或DNA元件百科全书(ENCODE)。额外的调节元件以及新的区域可以在独立研究中鉴定。TAL也可以代表参与pol II转录延伸复合物的加速、减速、回溯、暂停和释放的基因组区域。在图19中示出了基因DUSP1的TAL的示例。
血流向组织递送营养物和氧气,进行免疫监测,并且去除垂死细胞中的废物。后者包括来自作为血流内或血流外细胞更新的一部分死亡的正常细胞的核酸。(Hummel等人,Cell-free DNA release under psychosocial and physical stressconditions.Transl Psychiatry 8,236(2018))。这些细胞碎片中的一些携带原始细胞功能的转录足迹。(Ulz等人,Inferring expressed genes by whole-genome sequencing ofplasma DNA.Nat Genet 48,1273-1278(2016))。在细胞死亡之前和期间,血流中cfDNA片段的计数和长度的分布可能会受到DNA结合的蛋白复合物(包括pol II转录延伸复合物)的存在的影响。本文公开了在转录活性基因座内捕获特异性无细胞核酸并能够动态监测与疾病进展和对药物或治疗的应答相关联的生物途径中的变化的方法。这些方法中的一些涉及杂交捕获和捕获产物的表征。
基于杂交的捕获是允许快速和选择性靶标富集的最强大和最通用的工具之一。杂交捕获方法通常涉及通过加热使DNA变性,然后使变性的DNA与对感兴趣的区域具有特异性的单链DNA或RNA寡核苷酸(也被称为“探针”或“诱饵”)接触,以允许诱饵与靶DNA杂交(Kozarewa等人(2015).Overview of target enrichment strategies.Curr.Protoc.Mol.Biol.112:7.21.1-7.21.23)。在一些实施方案中,RNA诱饵是优选的,因为RNA:DNA双链体比DNA:DNA杂交体具有更好的杂交效率和稳定性。(Lesnik和Freier(1995).Relativethermodynamic stability of DNA,RNA,and DNA:RNA hybrid duplexes:relationshipwith base composition and structure.Biochemistry 34,10807-10815)。洗去非特异性的未结合的分子,并且洗脱富集的DNA以用于进一步分析。
如图20所示,杂交捕获可以在溶液中或在固体支持物上进行。在“固相”中,DNA探针与固体支持物(诸如玻璃微阵列载玻片)结合(Albert等人(2007),Direct selection ofhuman genomic loci by microarray hybridization.Nat.Methods 4,903-905)。在“溶液捕获”中,游离DNA或RNA探针被生物素化,允许它们使用磁性链霉亲和素珠分离靶向的片段-探针异源双链体(Gnirke等人(2009).Solution hybrid selection with ultra-longoligonucleotides for massively parallel targetedsequencing.Nat.Biotechnol.27,182-189)。可替代地,可以通过对RNA-DNA杂交体具有特异性的固定化的抗体在塑料管的表面上进行捕获(Ferenczy等人.Diagnosticperformance of Hybrid Capture human papillomavirus deoxyribonucleic acidassay combined with liquid-based cytologic study.Am J Obstet Gynecol 1996;175:651-656)。未反应的RNA探针未固定在管表面,因此通过洗涤除去。用碱性磷酸酶缀合的RNA-DNA抗体检测杂交体,然后在化学发光底物中温育。可替代地,超短qPCR可以有效地捕获和扩增靶向的cfDNA片段(Oreskovic A,Lutz BR(2021)Ultrasensitivehybridization capture:Reliable detection of<1copy/mL short cell-free DNA fromlarge-volume urine samples.PLoS ONE 16(2):e0247851)。
基于杂交的捕获需要与DNA的模板区域互补的诱饵(或探针)(图21)。与PCR中的引物设计类似,捕获诱饵应进行优化设计。较短的诱饵产生不准确、非特异性的DNA捕获产物,而较长的诱饵导致较慢的杂交速度。诱饵的结构应相对简单,并且不含内部二级结构,以避免内部折叠。诱饵设计涉及cfDNA片段计数和长度考虑。
图22示出用于杂交捕获来源于DUSP1启动子处的转录活性基因座的cfDNA的诱饵的示例。图23和图25示出了代表可能已经被图22的诱饵从在时间点1收集的血液样本和在时间点2收集的血液样本中捕获的cfDNA片段的所有NGS序列读取。在图23和25中,基于cfDNA片段长度对序列读取进行分层。测序衔接子被连接到cfDNA的任一末端,因此当用生物分析仪测量时,其表观长度长于分离的cfDNA片段的长度,如图24所示。“较短”读取具有140-200bp的插入物大小,而“较长”读取具有270-400bp的插入物大小。由较长峰浓度与cfDNA总浓度的比例(较短峰和较长峰之间的浓度总和)计算TAS评分。
生物分析仪、胶带站、片段分析仪或其他类似仪器可以用于评估cfDNA的质量、长度和纯度。图26示出了适当迹线的示例。虽然并非所有的cfDNA样本都具有相同的大小分布,但典型的迹线示出,在大约167个碱基对处主要的短(单核小体)cfDNA峰。在通过电泳分离核酸后,将它们归一化为阶梯,然后将两个DNA标志物表示为虚拟条带。然后,生物分析仪软件自动计算每个条带的大小和浓度。在泼尼松实验中,按照生产商的说明,Agilent 2100生物分析仪和高灵敏度DNA试剂盒用于对类固醇实验中富集产物的数量、质量和大小分布进行评估(图27)。
用Agilent 2100生物分析仪软件来确定cfDNA的片段大小和电泳图谱中每个峰的浓度。在一些示例中,单核小体保护的cfDNA峰被分类为短的,而所有较长片段的cfDNA峰被分类为长的(或非典型的),如图28A所示。在其他示例中,单核小体保护的cfDNA峰被归类为短的,而cfDNA大小的特定峰被归类为长的,如图28B所示。与基于NGS的分析一样,TAS评分被定义为较长峰浓度与cfDNA总浓度(较短峰和较长峰之间的浓度总和)的比例。在类固醇实验中,对于每次抽血(#1、#2、#3和#4)产生无NGS的TAS评分,并且在时间点之间比较测量值,导致时间点之间的具有统计学意义的变化(图29),该变化与在来自NGS数据的模拟的TAS分析中观察到的变化(图25)一致。
替代的技术也可以用于确定cfDNA片段长度分布。大小分布可以通过电泳、成像和染料定量来测量。这也可以经由配对末端NGS测序来实现,该配对末端NGS测序在将读数与参考比对后确定插入物大小。它也可以经由单末端测序来确定,其中整个NA片段被碱基调用,并且调用的核苷酸的数量等于NA片段的长度。
接下来,以与上述相同的方式使用双诱饵系统捕获富集产物,所述双诱饵系统代表被映射到糖皮质激素代谢所涉及的两种基因-DUSP1和SAE1-的两个不同基因组基因座,参见图30A-30D中的扩展双诱饵示意图。由于两个诱饵在单个管中混合,因此产生单个无NGS的TAS值以表征来自两个基因组区域的捕获的cfDNA。图31将基于NGS数据的模拟的结果与来自杂交捕获实验的实际结果进行比较。在两种方法中,观察到在时间点之间存在显著差异。双诱饵系统可以扩展到如图32所示的N诱饵复合读出系统,其中N大于2。此外,使用单独的SAE1诱饵结合生物分析仪分析的杂交捕获产生的TAS结果与SUSP1和DUSP1/SAE1对的结果一致。
图33、图34和图35示出了其中用DUSP1诱饵捕获来源于DUSP1启动子区域的cfDNA片段的模拟的示例。对捕获的片段进行测序,然后无比对方法用于鉴定与重叠诱饵(图33)、远离诱饵(图34)的参考或代表不同片段化模式的两个序列(图35)匹配的片段。然后基于匹配片段的长度确定模拟的TAS。在每种情况下,模拟的转录激活评分指示在时间点2处增加的转录活性。在一些实施方案中,可以使用参数(诸如线性回归)、非参数(诸如人工神经网络)模型来重新定义加权评分,例如在获得每个参考序列的计数和大小分布匹配之后的任意比率。
为了计数为匹配,序列读取必须具有40个碱基的连续重叠,其中允许高达1个错配。可替代地,可以使用考虑字符插入、删除和取代的编辑距离(例如Levenshtein距离)来执行匹配。编辑距离是字符串度量。该度量通过鉴定将一个字符串转换为另一个字符串所必须发生的最小变更数,提供了一种用于检测两个字符串彼此接近程度的方式。
使用无NGS的方法研究了在时间点之间具有统计学意义的TAS变化的额外的基因座。例如,制造了85个碱基的超聚RNA寡核苷酸(hg19 chr19:47634187-47634271),以靶向小泛素样修饰物(SUMO)激活酶亚基1(SAE1)。
通过过夜杂交从代表泼尼松实验中两个时间点的八个cfDNA文库中捕获与SAE1诱饵杂交的cfDNA。诱饵-靶标杂交体与链霉亲和素包被的磁珠结合,并用磁体隔离,而非靶标cfDNA被冲走。按照制造商的说明,Agilent 2100生物分析仪和高灵敏度DNA试剂盒用于评估来自类固醇实验的富集产物的数量、质量和大小分布。经由Agilent 2100生物分析仪软件来确定cfDNA(+测序衔接子)的片段大小。
如前所述计算的转录激活评分(TAS)揭示了与DUSP1基因座的结果和通过NGS衍生的TAS分析观察到的模拟的变化一致的时间点之间的统计学显著变化。
虽然本文已经示出和描述了本发明的优选实施方案,但是对于本领域技术人员来说显而易见的是,此类实施方案仅通过示例的方式提供。在不脱离本发明的情况下,本领域技术人员现在可以想到许多变化、改变和替换。应当理解,在实践本发明时可以采用本文描述的本发明的实施方案的各种替代方案。
示例性实施方案的非限制性列表
除了在本公开内容的其他地方描述和提供的方面和实施方案之外,具体考虑了特定实施方案的以下非限制性列表。
1.一种表征来源于基因组区域的无细胞核酸(cfNA)片段的方法,其包括:
a)使包括cfNA的组合物与寡核苷酸诱饵接触,所述寡核苷酸诱饵包括与所述基因组区域的序列互补的序列,和
b)表征与所述寡核苷酸诱饵杂交的所述cfNA片段的片段化模式,其中表征所述片段化模式不包括鉴定所述cfNA片段的基因组位置或从所述cfNA片段的基因组位置确定片段长度。
2.根据实施方案1所述的方法,其中所述寡核苷酸诱饵与亲和标签缀合。
3.根据实施方案2所述的方法,其中所述亲和标签是生物素。
4.根据实施方案1所述的方法,其中所述寡核苷酸诱饵与固体表面缀合。
5.根据实施方案4所述的方法,其中所述固体表面是珠。
6.根据实施方案4所述的方法,其中所述固体表面是平面表面。
7.根据实施方案1至6中任一者所述的方法,其中所述cfNA片段是无细胞脱氧核糖核酸(cfDNA)片段。
8.根据实施方案1至7中任一者所述的方法,其中所述cfNA片段是无细胞核糖核酸(cfRNA)片段。
9.根据实施方案1至8中任一者所述的方法,其中表征所述cfNA片段的片段化模式包括分析所述cfNA片段的大小或丰度。
10.一种表征来源于基因组区域的cfNA片段的方法,其包括:
a)使包括cfNA的组合物与寡核苷酸诱饵接触,和
b)分析与所述寡核苷酸诱饵杂交的所述cfNA片段的丰度,其中所述寡核苷酸诱饵包括与所述基因组区域的序列互补的序列,其中分析所述cfNA片段的丰度包括对所述cfNA片段进行测序并且对cfNA片段核苷酸序列与参考序列进行无比对序列比较,并且其中所述基因组区域包括所述参考序列。
11.一种表征来源于基因组区域的cfNA片段的方法,其包括:
a)使包括cfNA的组合物与寡核苷酸诱饵接触,和
b)分析与所述寡核苷酸诱饵杂交的所述cfNA片段的大小,其中所述寡核苷酸诱饵包括与所述基因组区域的序列互补的序列。
12.根据实施方案11所述的方法,其中分析所述cfNA片段的大小包括进行电泳分离。
13.根据实施方案12所述的方法,其中所述电泳分离包括凝胶电泳或毛细管电泳。
14.根据实施方案12所述的方法,其中所述电泳分离包括cfNA片段的微流体分离。
15.根据实施方案11至14中任一者所述的方法,其中所述方法包括将cfNA片段的迁移率与已知标准进行比较。
16.根据实施方案11所述的方法,其中分析所述cfNA片段的大小包括:
i.拉伸所述cfNA片段,和
ii.获取所述cfNA片段的图像。
17.根据实施方案11所述的方法,其中分析所述cfNA片段的大小包括在光学陷阱中捕获cfNA片段的末端或流动拉伸cfNA片段。
18.根据实施方案11所述的方法,其中分析所述cfNA片段的大小包括:
i.使所述cfNA片段与染料接触,
ii.将所述cfNA片段分离成液滴,
iii.使所述液滴流过检测器,
iv.测量每个cfNA片段的荧光,和
v.由荧光强度计算大小,其中所述染料的荧光通过与所述cfNA片段接触而增强。
19.根据实施方案11至18中任一者所述的方法,其进一步包括将包括至少230个核苷酸的长cfNA片段的量与包括少于230个核苷酸的短cfNA片段的量进行比较。
20.根据实施方案19所述的方法,其中所述长cfNA片段包括至少255、270、185或310个核苷酸。
21.根据实施方案19或实施方案20所述的方法,其中所述短cfNA片段包括少于220、205、190或175个核苷酸。
22.根据实施方案19至21中任一者所述的方法,其中长cfNA片段的增加的丰度指示医学病况。
23.根据实施方案22所述的方法,其中至少0.01、0.05、0.1、0.2、0.25、0.3、0.35或0.4的长cfNA片段与短cfNA片段的比率指示医学病况。
24.一种表征来源于基因组区域的cfNA片段的方法,其包括:
a)使包括cfNA的组合物与寡核苷酸诱饵接触,和
b)对与所述寡核苷酸诱饵杂交的cfNA片段进行测序,和
c)对cfNA片段核苷酸序列与参考序列进行无比对序列比较,其中所述寡核苷酸诱饵包括与所述基因组区域的序列互补的诱饵序列,并且
其中所述基因组区域包括所述参考序列。
25.根据实施方案23所述的方法,其进一步包括:
对与所述寡核苷酸诱饵的第一末端远端的序列比对的cfNA片段序列相对于与所述寡核苷酸诱饵的第二末端远端的序列比对的cfNA片段序列的相对量进行定量。
26.一种表征来源于基因组区域的cfNA片段的方法,其包括:
a)使包括cfNA的组合物与寡核苷酸诱饵接触,和
b)对与所述寡核苷酸诱饵杂交的cfNA片段进行测序,和
c)鉴定所述基因组区域内的两个或更多个子区域,
d)对包括与每个子区域匹配的序列的cfNA片段的数量进行计数,其中所述寡核苷酸诱饵包括与所述基因组区域的序列互补的序列。
27.根据实施方案26所述的方法,其中如果:
a)片段的序列与子区域的序列相同,或
b)经由近似字符串匹配将片段的序列分配给子区域,
则所述cfNA片段与所述子区域匹配。
28.一种表征来源于基因组区域的cfNA片段的方法,其包括:
a)使包括cfNA的组合物与第一寡核苷酸诱饵和第二寡核苷酸诱饵接触,
b)分析与所述第一寡核苷酸诱饵杂交的所述cfNA片段,和
c)分析与所述第二寡核苷酸诱饵杂交的所述cfNA片段,其中所述第一寡核苷酸诱饵和所述第二寡核苷酸诱饵包括与所述基因组区域的序列互补的序列,并且
其中所述方法不包括鉴定所述cfNA片段的基因组位置或长度。
29.根据实施方案28所述的方法,其进一步包括将与所述第一诱饵杂交的所述cfNA片段和与所述第二诱饵杂交的所述cfNA片段进行比较。
30.根据实施方案28或实施方案29中任一者所述的方法,其中所述第一寡核苷酸诱饵和所述第二寡核苷酸诱饵与亲和标签缀合。
31.根据实施方案30所述的方法,其中所述亲和标签是生物素。
32.根据实施方案28至31中任一者所述的方法,其中所述第一寡核苷酸诱饵和所述第二寡核苷酸诱饵与固体表面缀合。
33.根据实施方案32所述的方法,其中所述固体表面是珠。
34.根据实施方案32所述的方法,其中所述固体表面是平面表面。
35.根据实施方案10至34中任一者所述的方法,其中所述cfNA片段是无细胞脱氧核糖核酸(cfDNA)片段。
36.根据实施方案10至34中任一者所述的方法,其中所述cfNA片段是无细胞核糖核酸(cfRNA)片段。
37.根据实施方案28至36中任一者所述的方法,其中分析与所述第一寡核苷酸诱饵和所述第二寡核苷酸诱饵杂交的所述cfNA片段包括测量与所述第一寡核苷酸诱饵杂交的cfNA片段的量和与所述第二寡核苷酸诱饵杂交的cfNA片段的量。
38.根据实施方案28至36中任一者所述的方法,其中分析与所述第一寡核苷酸诱饵和所述第二寡核苷酸诱饵杂交的所述cfNA片段包括分析所述cfDNA片段的大小。
39.根据实施方案38所述的方法,其中分析所述cfDNA片段的大小包括对所述cfNA片段进行测序和对cfNA片段核苷酸序列与参考序列进行无比对序列比较,
其中所述基因组区域包括所述参考序列。
40.根据实施方案38所述的方法,其中分析所述cfDNA片段的大小包括进行电泳。
41.根据实施方案40所述的方法,其中所述电泳为凝胶电泳或毛细管电泳。
42.根据实施方案37中任一者所述的方法,其中分析所述cfDNA片段的大小包括cfNA片段的微流体分离。
43.根据实施方案40至42中任一者所述的方法,其中所述方法进一步包括将cfNA片段的迁移率与已知标准进行比较。
44.根据实施方案38中任一者所述的方法,其中分析所述cfNA片段的大小包括:
a)拉伸所述cfNA片段,和
b)获取所述cfNA片段的图像。
45.根据实施方案44所述的方法,其中拉伸所述cfNA片段包括在光学陷阱中捕获cfNA片段的末端或流动拉伸cfNA片段。
46.根据实施方案38中任一者所述的方法,其中所述cfNA是cfDNA,并且其中分析所述cfDNA片段的大小包括:
a)使所述cfDNA片段与染料接触,
b)将所述cfDNA片段分离成液滴,
c)使所述液滴流过检测器,
d)测量每个cfDNA片段的荧光,和
e)由荧光强度推断片段大小,
其中所述染料的荧光通过与所述cfDNA片段接触而增强。
47.根据实施方案38至46中任一者所述的方法,其进一步包括将包括至少230个核苷酸的长cfNA片段的量与包括少于230个核苷酸的短cfNA片段的量进行比较。
48.根据实施方案47所述的方法,其中所述长cfNA片段包括至少255、270、185或310个核苷酸。
49.根据实施方案47或实施方案48所述的方法,其中所述短cfNA片段包括少于220、205、190或175个核苷酸。
50.根据实施方案47至49中任一者所述的方法,其中长cfNA片段的增加的丰度指示医学病况。
51.根据实施方案50所述的方法,其中至少0.2、0.25、0.3、0.35或0.4的长cfNA片段与短cfNA片段的比率指示医学病况。
52.根据实施方案28至36中任一者所述的方法,其中分析与所述第一寡核苷酸诱饵和所述第二寡核苷酸诱饵杂交的cfNA片段包括对所述cfNA片段进行测试和对cfNA片段核苷酸序列与参考序列进行无比对序列比较,其中所述基因组区域包括所述参考序列。
53.根据实施方案28至36中任一者所述的方法,其进一步包括:
a)对与所述第一寡核苷酸诱饵的第一末端远端的序列比对的cfNA片段序列相对于与所述第一寡核苷酸诱饵的第二末端远端的序列比对的cfNA片段序列的相对量进行定量,
b)对与所述第二寡核苷酸诱饵的第一末端远端的序列比对的cfNA片段序列相对于与所述第二寡核苷酸诱饵的第二末端远端的序列比对的cfNA片段序列的相对量进行定量。
54.一种表征来源于基因组区域的cfNA片段的方法,其包括:
a)通过用包括与所述基因组区域的第一序列互补的序列的第一寡核苷酸诱饵杂交捕获,从生物样本收集第一组cfNA片段;
b)通过用包括与所述基因组区域的第二序列互补的序列的第二寡核苷酸诱饵杂交捕获,从生物样本收集第二组cfNA片段;和
c)比较所述第一组cfNA片段和所述第二组cfNA片段,
其中表征所述片段化模式不包括鉴定所述第一组cfNA片段或所述第二组cfNA片段的基因组位置或长度。
55.根据实施方案54所述的方法,其中所述第一寡核苷酸诱饵和所述第二寡核苷酸诱饵与亲和标签缀合。
56.根据实施方案55所述的方法,其中所述亲和标签是生物素。
57.根据实施方案54所述的方法,其中所述第一寡核苷酸诱饵和所述第二寡核苷酸诱饵与固体表面缀合。
58.根据实施方案57所述的方法,其中所述固体表面是珠。
59.根据实施方案57所述的方法,其中所述固体表面是平面表面。
60.根据实施方案54至59中任一者所述的方法,其中所述cfNA片段是cfDNA片段
61.根据实施方案54至60中任一者所述的方法,其中所述cfNA片段是cfRNA片段。
62.根据实施方案54至61中任一者所述的方法,其中表征所述cfNA片段的片段化模式包括分析所述cfNA片段的大小或丰度。
63.一种表征来源于基因组区域的cfNA片段的方法,其包括:
a)通过用包括与所述基因组区域的第一序列互补的序列的第一寡核苷酸诱饵杂交捕获,从生物样本收集第一组cfNA片段;
b)通过用包括与所述基因组区域的第二序列互补的序列的第二寡核苷酸诱饵杂交捕获,从生物样本收集第二组cfNA片段;和
c)分析所述第一组cfNA片段和所述第二组cfNA片段的丰度。
64.根据实施方案63所述的方法,其中分析所述cfNA片段的丰度包括对所述cfNA片段进行测序,以及对cfNA片段核苷酸序列与参考序列进行无比对序列比较,其中所述基因组区域包括所述参考序列。
65.一种表征来源于基因组区域的cfNA片段的方法,其包括:
a)通过用包括与所述基因组区域的第一序列互补的序列的第一寡核苷酸诱饵杂交捕获,从生物样本收集第一组cfNA片段;
b)通过用包括与所述基因组区域的第二序列互补的序列的第二寡核苷酸诱饵杂交捕获,从生物样本收集第二组cfNA片段;和
c)分析所述第一组cfNA片段和所述第二组cfNA片段的大小。
66.根据实施方案65所述的方法,其中分析所述cfNA片段的大小包括进行电泳分离。
67.根据实施方案66所述的方法,其中所述电泳分离包括凝胶电泳或毛细管电泳。
68.根据实施方案66所述的方法,其中所述电泳分离包括cfNA片段的微流体分离。
69.根据实施方案65至68中任一者所述的方法,其中所述方法包括将cfNA片段的迁移率与已知标准进行比较。
70.根据实施方案65所述的方法,其中分析所述cfDNA片段的大小包括:
a)拉伸所述cfNA片段,和
b)获取所述cfNA片段的图像。
71.根据实施方案65所述的方法,其中分析所述cfNA片段的大小包括在光学陷阱中捕获cfNA片段的末端或流动拉伸cfNA片段。
72.根据实施方案65所述的方法,其中分析所述cfNA片段的大小包括:
a)使所述cfNA片段与染料接触,
b)将所述cfNA片段分离成液滴,
c)使所述液滴流过检测器,
d)测量每个cfNA片段的荧光,和
e)由荧光强度计算大小,
f)其中所述染料的荧光通过与所述cfNA片段接触而增强。
73.根据实施方案65至72中任一者所述的方法,其进一步包括:
a)对于所述第一组cfNA片段,将包括至少230个核苷酸的大cfNA片段的量与包括少于230个核苷酸的短cfNA片段的量进行比较;和
b)对于所述第二组cfNA片段,将包括至少230个核苷酸的长cfNA片段的量与包括少于230个核苷酸的短cfNA片段的量进行比较。
74.根据实施方案73所述的方法,其中所述长cfNA片段包括至少255、270、185或310个核苷酸。
75.根据实施方案73或实施方案74所述的方法,其中所述短cfNA片段包括少于220、205、190或175个核苷酸。
76.根据实施方案73至75中任一者所述的方法,其中所述第一组cfDNA片段中长cfNA片段的增加的丰度指示医学病况。
77.根据实施方案76所述的方法,其中所述第一组cfNA片段的至少0.2、0.25、0.3、0.35或0.4的长cfNA片段与短cfNA片段的比率指示医学病况。
78.一种表征来源于基因组区域的cfNA片段的方法,其包括:
a)通过用包括与所述基因组区域的第一序列互补的序列的第一寡核苷酸诱饵杂交捕获,从生物样本收集第一组cfNA片段;
b)通过用包括与所述基因组区域的第二序列互补的序列的第二寡核苷酸诱饵杂交捕获,从生物样本收集第二组cfNA片段;
c)对所述第一组cfDNA片段和所述第二组cfDNA片段进行测序;以及
d)对cfNA片段核苷酸序列与参考序列进行无比对序列比较,其中所述基因组区域包括所述参考序列。
79.根据实施方案78所述的方法,其进一步包括:
对与所述第一寡核苷酸诱饵的末端远端的序列比对的cfNA片段序列相对于与所述第一寡核苷酸诱饵的第二末端远端的序列比对的cfNA片段序列的相对量进行定量。
80.一种表征来源于基因组区域的cfNA片段的方法,其包括:
a)通过用包括与所述基因组区域的第一序列互补的序列的第一寡核苷酸诱饵杂交捕获,从生物样本收集第一组cfNA片段;
b)通过用包括与所述基因组区域的第二序列互补的序列的第二寡核苷酸诱饵杂交捕获,从生物样本收集第二组cfNA片段;
c)对所述第一组cfNA片段和所述第二组cfNA片段进行测序;
d)鉴定所述基因组区域内的两个或更多个子区域;和
e)对与每个子区域匹配的cfNA片段的数量进行计数。
81.根据实施方案80所述的方法,其中如果:
片段的序列与子区域的序列相同,或
片段的序列通过近似字符串匹配被分配给子区域,
则所述cfNA片段与所述子区域匹配。
82.一种表征来源于基因组区域的cfNA片段的方法,其包括将包括所述基因组区域的第一部分的cfNA片段的量与包括所述基因组区域的第二部分的cfNA片段的量进行比较。
83.根据实施方案82所述的方法,其中包括所述基因组区域的所述第一部分和所述第二部分的所述cfNA片段的量通过包括扩增所述基因组区域的所述部分的方法来确定。
84.根据实施方案83所述的方法,其中所述扩增通过PCR、环介导等温扩增、基于核酸序列的扩增、链置换扩增或多重置换扩增进行。
85.一种表征来源于基因组区域的cfNA片段的方法,其包括:
a)对来自所述基因组区域的所述cfNA片段进行测序;和
b)将匹配代表第一片段化模式的第一组参考序列的cfNA片段序列的量与匹配代表第二片段化模式的第二组参考序列的cfNA片段序列的量进行比较。
86.根据实施方案85所述的方法,其中通过无比对序列比较鉴定与所述第一组参考序列和所述第二组参考序列匹配的所述cfNA片段序列。
87.根据实施方案1至86中任一者所述的方法,其中所述包括cfNA的组合物是血浆、血清、唾液、尿液、血液组分、脑脊液、胸膜液、羊水、腹膜液、腹水、腹腔骨盆冲洗液/灌洗液、浆液性渗出液、气管支气管或支气管肺泡灌洗液。
88.根据实施方案87所述的方法,其中所述包括cfNA的组合物是血浆。
89.根据实施方案1至88中任一者所述的方法,其中所述基因组区域包括启动子的至少一个核苷酸、转录起始位点、DNase I超敏位点、Pol II暂停位点、第一外显子或外显子边界的内含子。
90.根据实施方案89所述的方法,其中所述基因组区域包括第一外显子。
91.根据实施方案89所述的方法,其中所述基因组区域包括活性转录起始位点。
92.根据实施方案1至91中任一者所述的方法,其中所述基因组区域的表达或细胞死亡后片段化在医学病况下改变。
93.一种表征cfNA片段的方法,其包括:
a)从生物样本中富集长cfNA片段的群体,和
b)将长cfNA片段的量与参考进行比较。
94.根据实施方案93所述的方法,其中所述cfNA片段是长cfNA片段。
95.根据实施方案93或实施方案94所述的方法,其中所述长cfNA片段来源于基因组区域。
96.根据实施方案94至95中任一者所述的方法,所述长cfNA片段包括至少190、至少200、至少210、至少220、至少230、至少240或至少250个连续核苷酸。
97.根据实施方案93至96中任一者所述的方法,其中所述生物样本是血浆或血清。
98.根据实施方案93至97中任一者所述的方法,其中从生物样本富集长cfNA片段的群体包括使所述生物样本与一个或多个不同的寡核苷酸诱饵接触以产生捕获的cfNA片段。
99.根据实施方案98所述的方法,其中所述一个或多个不同的寡核苷酸诱饵包括具有与受DNA结合蛋白保护的基因组区域的序列互补的序列的寡核苷酸诱饵。
100.根据实施方案99所述的方法,其中所述DNA结合蛋白不是组蛋白。
101.根据实施方案98至100中任一者所述的方法,其中从生物样本富集长cfNA片段的群体进一步包括对所述捕获的cfNA片段进行电泳分离。
102.根据实施方案93所述的方法,其中将所述长cfNA片段的量与参考进行比较包括将由所述一个或多个寡核苷酸诱饵捕获的长cfNA片段的量与由所述一个或多个寡核苷酸诱饵捕获的cfNA片段的总量进行比较。
103.根据实施方案93至102中任一者所述的方法,其中将所述长cfNA片段的量与参考进行比较包括测量所述捕获的cfNA片段的量。
104.根据实施方案93至103中任一者所述的方法,其中将所述长cfNA片段的量与参考进行比较包括对所述长cfNA片段进行测序并且将所述长cfNA片段与包括少于1000个核苷酸的参考序列进行匹配。
105.根据实施方案93至104中任一者所述的方法,其中从生物样本富集长cfNA片段的群体包括扩增所述长cfNA片段的区段。
106.一种分析cfNA片段化模式的方法,其包括根据实施方案1至105所述的方法表征来源于两个或更多个基因组区域的cfNA片段。
107.根据实施方案1至106中任一者所述的方法,其中所述基因组区域包括类固醇应答基因的起始位点或第一外显子。
108.根据实施方案107所述的方法,其中所述类固醇应答基因是糖皮质激素应答基因、抗炎基因或嗜中性粒细胞激活特征基因。
109.根据实施方案108所述的方法,其中所述糖皮质激素应答基因是FKBP5、ECHDC3、IL1R2或ZBTB16。
110.根据实施方案108所述的方法,其中所述抗炎基因是DUSP1、TSC22D3、IRAK3或CD163。
111.根据实施方案108所述的方法,其中所述嗜中性粒细胞激活特征基因是BCL2或MCL1。
112.根据实施方案1至111中任一者所述的方法,其中所述基因组区域包括血管标志物基因或血管再生基因的起始位点或第一外显子。
113.根据实施方案112所述的方法,其中所述血管标志物基因是内皮细胞标志物基因、周皮细胞标志物基因或整合素基因。
114.根据实施方案113所述的方法,其中所述内皮细胞标志物基因是PECAM1、CDH5、VWF或EPHB4。
115.根据实施方案113所述的方法,其中所述周皮细胞标志物基因是CSPG4、ACTA2或DES。
116.根据实施方案113所述的方法,其中所述整合素基因是ITGAV或ITGB3。
117.根据实施方案112所述的方法,其中所述血管再生基因是血管不稳定性基因、血管稳定性基因或notch家族基因。
118.根据实施方案117所述的方法,其中所述血管不稳定性基因是HIF1AN、VEGFA、PGF、FLT1、KDR、NR4A1、FGF2、FGFR1或FGFR2。
119.根据实施方案117所述的方法,其中所述血管稳定性基因是ANGPT1、ANGPT2、TEK、PDGFB、PDGFRB、TGFB1、TGFBR1或ENG。
120.根据实施方案117所述的方法,其中所述notch家族基因是NOTCH1、NOTCH3、DLL4或JAG1。
121.根据实施方案1至120中任一者所述的方法,其中所述基因组区域选自EphB4基因的前5个外显子。
122.一种评估对象的医学病况的方法,其包括根据实施方案1至121中任一者所述的方法来表征来源于基因组区域的cfNA片段的片段化模式。
123.一种用于治疗对象的癌症的适应性免疫疗法的方法,其包括:
a)向所述对象施用第一疗程的第一免疫疗法化合物;
b)从所述对象获取与血管再生和/或血管生成相关联的一种或多种基因的纵向无细胞DNA片段化概况;和
c)向所述对象施用第二疗程的免疫疗法;
其中所述第二疗程的免疫疗法包括:
i.第二免疫疗法化合物,如果所述无细胞DNA片段化概况指示对所述第一免疫疗法化合物的应答不足;或者
ii.第二疗程的所述第一免疫疗法化合物,如果所述无细胞DNA片段化概况不指示对所述第一免疫疗法化合物的应答不足。
124.根据实施方案123所述的方法,其中所述癌症是肺癌、黑色素瘤、胃肠道类癌瘤、结肠直肠癌或胰腺癌。
125.根据实施方案123或实施方案124所述的方法,其中获取纵向无细胞DNA片段化概况包括在施用第一剂量的所述第一疗程的所述第一免疫疗法化合物之前的时间点T0从所述对象获取第一生物样本,和在施用所述第一剂量的所述第一疗程的所述第一免疫疗法化合物之后从所述对象获取一个或多个生物样本。
126.根据实施方案125所述的方法,其中在施用所述第一剂量的所述第一疗程的所述第一免疫疗法化合物之后获取的所述一个或多个生物样本在施用一剂量的所述第一疗程的所述第一免疫疗法化合物的同一天获取。
127.根据实施方案123至126中任一者所述的方法,其中所述无细胞DNA片段化概况包括来源于与血管再生和/或血管生成相关联的一种或多种基因的增强子、启动子、第一外显子或启动子近端转录暂停位点的DNA片段的大小。
128.根据实施方案127所述的方法,其中来源于与血管再生和/或血管生成相关联的所述一种或多种基因的增强子、启动子、第一外显子或启动子近端转录暂停位点的大无细胞DNA片段随时间的增加指示对所述第一免疫疗法化合物的应答不足。
129.根据实施方案123至128中任一者所述的方法,其中所述第一免疫疗法化合物和所述第二免疫疗法化合物选自帕博利珠单抗、纳武单抗、阿替利珠单抗、德瓦鲁单抗和阿维单抗。
130.一种在对象中治疗医学病况的方法,其包括:
向所述对象施用一疗程的疗法,和
从所述对象获取一个或多个基因组区域的纵向无细胞DNA片段化概况;其中所述纵向无细胞DNA片段化概况指示所述对象已对所述疗程的疗法产生应答。
131.一种在对象中治疗医学病况的方法,其包括:
从所述对象获取一个或多个基因组区域的无细胞DNA片段化概况;和向所述对象施用一疗程的疗法,
其中所述无细胞DNA片段化概况指示所述疗程的疗法适用于所述对象。
132.一种表征来源于包括第一基因组区域和第二基因组区域的至少两个基因组区域的cfNA片段的方法,其包括:
a)使包括cfNA的组合物与包括与所述第一基因组区域的序列互补的序列的第一寡核苷酸诱饵接触,
b)使所述组合物与包括与所述第二基因组区域的序列互补的序列的第二寡核苷酸诱饵接触,
c)分析与所述至少两个寡核苷酸诱饵杂交的所述cfNA片段的丰度、大小和序列上下文。
133.根据实施方案132所述的方法,其中所述第一寡核苷酸诱饵富集来自所述组合物的小cfNA片段的群体,并且所述第二寡核苷酸诱饵富集来自所述组合物的长cfNA片段的群体。
134.根据实施方案132或133所述的方法,其进一步包括使所述组合物与包括与所述第一基因组区域的序列互补的序列的第三寡核苷酸诱饵接触。
135.根据实施方案134所述的方法,其中所述第三寡核苷酸诱饵富集来自所述组合物的小cfNA片段的群体。
136.根据实施方案132至135中任一者所述的方法,其进一步包括使所述组合物与包括与所述第二基因组区域的序列互补的序列的第四寡核苷酸诱饵接触。
137.根据实施方案136所述的方法,其中所述第四寡核苷酸诱饵富集来自所述组合物的长cfNA片段的群体。
138.根据实施方案132至137中任一者所述的方法,其中步骤(a)和步骤(b)同时发生。
139.根据实施方案132至138中任一者所述的方法,其中所述至少两个基因组区域进一步包括第三基因组区域;其中所述方法进一步包括使所述组合物与包括与所述第三基因组区域的序列互补的序列的第五寡核苷酸诱饵接触。
140.根据实施方案139所述的方法,其中所述第五寡核苷酸诱饵富集来自所述组合物的短cfNA片段的群体。
141.根据实施方案139或实施方案140所述的方法,其中使所述组合物与第五寡核苷酸诱饵接触与步骤(a)和步骤(b)同时发生。
142.根据实施方案139至141中任一者所述的方法,其进一步包括使所述组合物与包括与所述第三基因组区域的序列互补的序列的第六寡核苷酸诱饵接触。
143.根据实施方案142所述的方法,其中所述第六寡核苷酸诱饵富集来自所述组合物的长cfNA片段的群体。
144.根据实施方案141所述的方法,其中使所述组合物与所述第六寡核苷酸诱饵接触与使所述组合物与所述第五寡核苷酸诱饵接触、步骤(a)和步骤(b)同时发生。
145.根据实施方案132至144中任一者所述的方法,其中所述分析所述cfNA片段的丰度、大小和序列上下文不包括鉴定所述cfNA片段的基因组位置或长度。
146.根据实施方案132至145中任一者所述的方法,其中所述第一寡核苷酸诱饵、所述第二寡核苷酸诱饵、所述第三寡核苷酸诱饵、所述第四寡核苷酸诱饵、所述第五寡核苷酸诱饵和/或所述第六寡核苷酸诱饵与亲和标签缀合。
147.根据实施方案146所述的方法,其中所述亲和标签是生物素。
148.根据实施方案132至147中任一者所述的方法,其中所述寡核苷酸诱饵与固体表面缀合。
149.根据实施方案148所述的方法,其中所述固体表面是珠。
150.根据实施方案149所述的方法,其中所述固体表面是平面表面。
151.根据实施方案132至150中任一者所述的方法,其中所述cfNA片段是无细胞脱氧核糖核酸(cfDNA)片段。
152.根据实施方案132至150中任一者所述的方法,其中所述cfNA片段是无细胞核糖核酸(cfRNA)片段。
153.根据实施方案132至152中任一者所述的方法,其中所述分析所述cfNA片段的丰度、大小和序列上下文包括计算转录活性评分(TAS)。
154.根据实施方案132至152中任一者所述的方法,其中所述分析所述cfNA片段的丰度、大小和序列上下文包括进行电泳分离。
155.根据实施方案154所述的方法,其中所述电泳分离包括凝胶电泳或毛细管电泳。
156.根据实施方案155所述的方法,其中所述电泳分离包括cfNA片段的微流体分离。
157.根据实施方案132至156中任一者所述的方法,其中所述方法包括将cfNA片段的迁移率与已知标准进行比较。
158.根据实施方案132至152中任一者所述的方法,其中所述分析所述cfNA片段的丰度、大小和序列上下文包括:
i.拉伸所述cfNA片段,和
ii.获取所述cfNA片段的图像。
159.根据实施方案132至152中任一者所述的方法,其中所述分析所述cfNA片段的丰度、大小和序列上下文包括在光学陷阱中捕获cfNA片段的末端或流动拉伸cfNA片段。
160.根据实施方案132至152中任一者所述的方法,其中所述分析所述cfNA片段的丰度、大小和序列上下文包括:
i.使所述cfNA片段与染料接触,
ii.将所述cfNA片段分离成液滴,
iii.使所述液滴流过检测器,
iv.测量每个cfNA片段的荧光,和
v.由荧光强度计算大小;
其中所述染料的荧光通过与所述cfDNA片段接触而增强。
161.根据实施方案132至160中任一者所述的方法,其进一步包括将包括至少230个核苷酸的长cfNA片段的量与包括少于230个核苷酸的短cfNA片段的量进行比较。
162.根据实施方案161所述的方法,其中所述长cfNA片段包括至少255、270、185或310个核苷酸。
163.根据实施方案161或实施方案162所述的方法,其中所述短cfNA片段包括少于220、205、190或175个核苷酸。
164.根据实施方案161至163中任一者所述的方法,其中长cfNA片段的增加的丰度指示医学病况。
165.根据实施方案164所述的方法,其中至少0.2、0.25、0.3、0.35或0.4的长cfNA片段与短cfNA片段的比率指示医学病况。
166.根据实施方案132至152中任一者所述的方法,其中所述分析所述cfNA片段的丰度、大小和序列上下文包括对所述cfDNA片段进行测序,以及对cfNA片段核苷酸序列与参考序列进行无比对序列比较;
其中所述基因组区域包括所述参考序列。
167.根据实施方案166所述的方法,其进一步包括:
对与所述寡核苷酸诱饵的末端远端的序列比对的cfNA片段序列相对于与所述寡核苷酸诱饵的第二末端远端的序列比对的cfNA片段序列的相对量进行定量。
168.根据实施方案132至152中任一者所述的方法,其中所述分析所述cfNA片段的丰度、大小和序列上下文包括对所述cfNA片段进行测序,鉴定所述基因组区域内的两个或更多个子区域,以及对包括与每个子区域匹配的序列的cfNA片段的数量进行计数。
169.根据实施方案168所述的方法,其中如果:
a)片段的序列与子区域的序列相同,或
b)经由近似字符串匹配将片段的序列分配给子区域,
则所述cfNA片段与所述子区域匹配。
170.一种表征来源于包括第一基因组区域和第二基因组区域的至少两个基因组区域的cfNA片段的方法,其包括:
a)通过用包括与所述第一基因组区域的序列互补的序列的第一寡核苷酸诱饵杂交捕获,从生物样本中收集第一组cfNA片段;
b)通过用包括与所述第二基因组区域的序列互补的序列的第二寡核苷酸诱饵杂交捕获,从所述生物样本收集第二组cfNA片段;和
c)分析与所述至少两个寡核苷酸诱饵杂交的所述cfNA片段的丰度、大小和序列上下文。
171.根据实施方案170所述的方法,其中所述第一寡核苷酸诱饵富集来自所述组合物的小cfNA片段的群体,并且所述第二寡核苷酸诱饵富集来自所述生物样本的长cfNA片段的群体。
172.根据实施方案170或171所述的方法,其进一步包括通过用包括与所述第一基因组区域的序列互补的序列的第三寡核苷酸诱饵杂交捕获,从所述生物样本收集第三组cfNA片段。
173.根据实施方案172所述的方法,其中所述第三寡核苷酸诱饵富集来自所述组合物的小cfNA片段的群体。
174.根据实施方案170至173中任一者所述的方法,其进一步包括通过用包括与所述第二基因组区域的序列互补的序列的第四寡核苷酸诱饵杂交捕获,从所述生物样本收集第四组cfNA片段。
175.根据实施方案174所述的方法,其中所述第四寡核苷酸诱饵富集来自所述生物样本的长cfNA片段的群体。
176.根据实施方案170至175中任一者所述的方法,其中步骤(a)和步骤(b)同时发生。
177.根据实施方案170至176中任一者所述的方法,其中所述至少两个基因组区域进一步包括第三基因组区域;其中所述方法进一步包括通过用包括与所述第三基因组区域的序列互补的序列的第五寡核苷酸诱饵杂交捕获,从所述生物样本收集第五组cfNA片段。
178.根据实施方案177所述的方法,其中所述第五寡核苷酸诱饵富集来自所述生物样本的短cfNA片段的群体。
179.根据实施方案177或实施方案178所述的方法,其中从所述生物样本中收集第五组cfNA片段与步骤(a)和步骤(b)同时发生。
180.根据实施方案170至179中任一者所述的方法,其进一步包括通过用包括与所述第三基因组区域的序列互补的序列的第六寡核苷酸诱饵杂交捕获,从所述生物样本中收集第六组cfNA片段。
181.根据实施方案180所述的方法,其中所述第六寡核苷酸诱饵富集来自所述生物样本的长cfNA片段的群体。
182.根据实施方案180或根据实施方案181所述的方法,其中从所述生物样本中收集第六组cfNA片段与从所述生物样本中收集第五组cfNA片段、步骤(a)和步骤(b)同时发生。
183.根据实施方案170至182中任一者所述的方法,其中所述分析所述cfNA片段的丰度、大小和序列上下文不包括鉴定所述cfNA片段的基因组位置或长度。
184.根据实施方案170至183中任一者所述的方法,其中所述第一寡核苷酸诱饵、所述第二寡核苷酸诱饵、所述第三寡核苷酸诱饵、所述第四寡核苷酸诱饵、所述第五寡核苷酸诱饵和/或所述第六寡核苷酸诱饵与亲和标签缀合。
185.根据实施方案184所述的方法,其中所述亲和标签是生物素。
186.根据实施方案170至185中任一者所述的方法,其中所述寡核苷酸诱饵与固体表面缀合。
187.根据实施方案186所述的方法,其中所述固体表面是珠。
188.根据实施方案186所述的方法,其中所述固体表面是平面表面。
189.根据实施方案170至188中任一者所述的方法,其中所述cfNA片段是无细胞脱氧核糖核酸(cfDNA)片段。
190.根据实施方案170至189中任一者所述的方法,其中所述cfNA片段是无细胞核糖核酸(cfRNA)片段。
191.根据实施方案170至190中任一者所述的方法,其中所述分析所述cfNA片段的丰度、大小和序列上下文包括计算转录活性评分(TAS)。
192.根据实施方案170至191中任一者所述的方法,其中所述分析所述cfNA片段的丰度、大小和序列上下文包括进行电泳分离。
193.根据实施方案192所述的方法,其中所述电泳分离包括凝胶电泳或毛细管电泳。
194.根据实施方案193所述的方法,其中所述电泳分离包括cfNA片段的微流体分离。
195.根据实施方案170至194中任一者所述的方法,其中所述方法包括将cfNA片段的迁移率与已知标准进行比较。
196.根据实施方案170至195中任一者所述的方法,其中所述分析所述cfNA片段的丰度、大小和序列上下文包括
i.拉伸所述cfNA片段,和
ii.获取所述cfNA片段的图像。
197.根据实施方案170至196中任一者所述的方法,其中所述分析所述cfNA片段的丰度、大小和序列上下文包括在光学陷阱中捕获cfNA片段的末端或流动拉伸cfNA片段。
198.根据实施方案170至197中任一者所述的方法,其中所述分析所述cfNA片段的丰度、大小和序列上下文包括:
i.使所述cfNA片段与染料接触,
ii.将所述cfNA片段分离成液滴,
iii.使所述液滴流过检测器,
iv.测量每个cfNA片段的荧光,和
v.由荧光强度计算大小;
其中所述染料的荧光通过与所述cfNA片段接触而增强。
199.根据实施方案170至198中任一者所述的方法,其进一步包括将包括至少230个核苷酸的长cfNA片段的量与包括少于230个核苷酸的短cfNA片段的量进行比较。
200.根据实施方案199所述的方法,其中所述长cfNA片段包括至少255、270、185或310个核苷酸。
201.根据实施方案199或实施方案200所述的方法,其中所述短cfNA片段包括少于220、205、190或175个核苷酸。
202.根据实施方案199至201中任一者所述的方法,其中长cfNA片段的增加的丰度指示医学病况。
203.根据实施方案202所述的方法,其中至少0.2、0.25、0.3、0.35或0.4的长cfNA片段与短cfNA片段的比率指示医学病况。
204.根据实施方案170至190中任一者所述的方法,其中所述分析所述cfNA片段的丰度、大小和序列上下文包括对所述cfDNA片段进行测序,以及对cfNA片段核苷酸序列与参考序列进行无比对序列比较;
其中所述基因组区域包括所述参考序列。
205.根据实施方案204所述的方法,其进一步包括:
对与所述寡核苷酸诱饵的末端远端的序列比对的cfNA片段序列相对于与所述寡核苷酸诱饵的第二末端远端的序列比对的cfNA片段序列的相对量进行定量。
206.根据实施方案170至190中任一者所述的方法,其中所述分析所述cfNA片段的丰度、大小和序列上下文包括对所述cfNA片段进行测序,鉴定所述基因组区域内的两个或更多个子区域,以及对包括与每个子区域匹配的序列的cfNA片段的数量进行计数。
207.根据实施方案206所述的方法,其中如果:
a)片段的序列与子区域的序列相同,或
b)经由近似字符串匹配将片段的序列分配给子区域,
则所述cfNA片段与所述子区域匹配。
208.根据实施方案132至207中任一者所述的方法,其中所述包括cfNA的组合物或生物样本是血浆、血清、唾液、尿液、血液组分、脑脊液、胸膜液、羊水、腹膜液、腹水、腹腔骨盆冲洗液/灌洗液、浆液性渗出液、气管支气管或支气管肺泡灌洗液。
209.根据实施方案208所述的方法,其中所述包括cfNA的组合物或生物样本为血浆。
210.根据实施方案132至209中任一者所述的方法,其中所述基因组区域包括启动子的至少一个核苷酸、转录起始位点、DNase I超敏位点、Pol II暂停位点、第一外显子或外显子边界的内含子。
211.根据实施方案210所述的方法,其中所述基因组区域包括第一外显子。
212.根据实施方案211所述的方法,其中所述基因组区域包括活性转录起始位点。
213.根据实施方案132至212中任一者所述的方法,其中所述基因组区域的表达或细胞死亡后片段化在医学病况下改变。
214.根据实施方案132至213中任一者所述的方法,其中所述基因组区域包括类固醇应答基因的起始位点或第一外显子。
215.根据实施方案214所述的方法,其中所述类固醇应答基因是糖皮质激素应答基因、抗炎基因或嗜中性粒细胞激活特征基因。
216.根据实施方案215所述的方法,其中所述糖皮质激素应答基因是FKBP5、ECHDC3、IL1R2或ZBTB16。
217.根据实施方案215所述的方法,其中所述抗炎基因是DUSP1、TSC22D3、IRAK3或CD163。
218.根据实施方案215所述的方法,其中所述嗜中性粒细胞激活特征基因是BCL2或MCL1。
219.根据实施方案132至218中任一者所述的方法,其中所述基因组区域包括血管标志物基因、内皮细胞标志物基因或血管再生基因的起始位点或第一外显子。
220.根据实施方案219所述的方法,其中所述血管标志物基因是内皮细胞标志物基因、周皮细胞标志物基因或整合素基因。
221.根据实施方案220所述的方法,其中所述内皮细胞标志物基因是PECAM1、CDH5、VWF或EPHB4。
222.根据实施方案220所述的方法,其中所述周皮细胞标志物基因是CSPG4、ACTA2或DES。
223.根据实施方案220所述的方法,其中所述整合素基因是ITGAV或ITGB3。
224.根据实施方案219所述的方法,其中所述血管再生基因是血管不稳定性基因、血管稳定性基因或notch家族基因。
225.根据实施方案224所述的方法,其中所述血管不稳定性基因是HIF1AN、VEGFA、PGF、FLT1、KDR、NR4A1、FGF2、FGFR1或FGFR2。
226.根据实施方案224所述的方法,其中所述血管稳定性基因是ANGPT1、ANGPT2、TEK、PDGFB、PDGFRB、TGFB1、TGFBR1或ENG。
227.根据实施方案224所述的方法,其中所述notch家族基因是NOTCH1、NOTCH3、DLL4或JAG1。
228.根据实施方案132至227中任一者所述的方法,其中所述基因组区域选自EphB4基因的前5个外显子。
229.一种评估对象的医学病况的方法,其包括根据实施方案132至228中任一者所述的方法来表征来源于至少两个基因组区域的cfDNA片段的片段化模式。
230.一种确定细胞的来源的方法,其包括根据权利要求1至229中任一者所述的方法来表征来源于基因组区域的cfDNA片段的片段化模式。
231.一种用于治疗对象的癌症的适应性免疫疗法的方法,其包括:
a)向所述对象施用第一疗程的第一免疫疗法化合物;
b)从所述对象获取与血管再生和/或血管生成相关联的一种或多种基因的纵向无细胞DNA片段化概况;和
c)向所述对象施用第二疗程的免疫疗法;
其中所述第二疗程的免疫疗法包括:
i.第二免疫疗法化合物,如果所述无细胞DNA片段化概况指示对所述第一免疫疗法化合物的应答不足;或者
ii.第二疗程的所述第一免疫疗法化合物,如果所述无细胞DNA片段化概况不指示对所述第一免疫疗法化合物的应答不足。
232.根据实施方案231所述的方法,其中所述癌症是肺癌、黑色素瘤、胃肠道类癌瘤、结肠直肠癌或胰腺癌。
233.根据实施方案231或实施方案232所述的方法,其中获取纵向无细胞DNA片段化概况包括在施用第一剂量的所述第一疗程的所述第一免疫疗法化合物之前的时间点T0从所述对象获取第一生物样本,和在施用所述第一剂量的所述第一疗程的所述第一免疫疗法化合物之后从所述对象获取一个或多个生物样本。
234.根据实施方案233所述的方法,其中在施用所述第一剂量的所述第一疗程的所述第一免疫疗法化合物之后获取的所述一个或多个生物样本在施用一剂量的所述第一疗程的所述第一免疫疗法化合物的同一天获取。
235.根据实施方案231至234中任一者所述的方法,其中所述无细胞DNA片段化概况包括来源于与血管再生和/或血管生成相关联的一种或多种基因的增强子、启动子、第一外显子或启动子近端转录暂停位点的DNA片段的大小。
236.根据实施方案235所述的方法,其中来源于与血管再生和/或血管生成相关联的所述一种或多种基因的增强子、启动子、第一外显子或启动子近端转录暂停位点的大无细胞DNA片段随时间的增加指示对所述第一免疫疗法化合物的应答不足。
237.根据实施方案231至236中任一者所述的方法,其中所述第一免疫疗法化合物和所述第二免疫疗法化合物选自帕博利珠单抗、纳武单抗、阿替利珠单抗、德瓦鲁单抗和阿维单抗。

Claims (52)

1.一种表征包括基因组区域的序列的无细胞核酸(cfNA)片段的方法,所述方法包括:
c)使包括cfNA的组合物与寡核苷酸诱饵接触,所述寡核苷酸诱饵包括与所述基因组区域的序列互补的序列,和
d)表征与所述寡核苷酸诱饵杂交的所述cfNA片段的片段化模式,
其中表征所述片段化模式不包括鉴定所述cfNA片段的基因组位置或长度。
2.根据权利要求1所述的方法,其中所述表征所述cfNA片段的片段化模式包括分析与所述寡核苷酸诱饵杂交的所述cfNA片段的丰度。
3.根据权利要求1所述的方法,其中所述表征所述cfNA片段的片段化模式包括分析与所述寡核苷酸诱饵杂交的所述cfNA片段的大小。
4.根据权利要求1所述的方法,其中所述表征所述cfNA片段的片段化模式包括计算转录活性评分(TAS)。
5.根据权利要求3所述的方法,其中所述分析所述cfNA片段的大小包括进行电泳分离。
6.根据权利要求5所述的方法,其中所述电泳分离包括凝胶电泳或毛细管电泳。
7.根据权利要求5所述的方法,其中所述电泳分离包括cfNA片段的微流体分离。
8.根据权利要求3和5-7中任一项所述的方法,其中所述分析所述cfNA片段的大小包括将所述cfNA片段的迁移率与已知标准进行比较。
9.根据权利要求4-8中任一项所述的方法,其中计算TAS包括确定长度为至少230、255、270、285或310个核苷酸的总cfNA的比例。
10.根据权利要求4-8中任一项所述的方法,其中计算TAS包括确定长度为230-600个核苷酸的总cfNA的比例。
11.根据权利要求4-8中任一项所述的方法,其中计算TAS包括确定受DNA聚合酶或转录因子保护的总cfNA的比例。
12.根据权利要求9-11中任一项所述的方法,其中增加的TAS指示医学病况。
13.根据权利要求9-11中任一项所述的方法,其中TAS的增加或减少指示医学病况。
14.根据权利要求1所述的方法,其中所述表征cfNA片段包括:
i)对与所述寡核苷酸诱饵杂交的cfNA片段进行测序,和
ii)对所述cfNA片段核苷酸序列与参考序列进行无比对序列比较;
其中所述基因组区域包括所述参考序列。
15.根据权利要求14所述的方法,其进一步包括:
对与所述寡核苷酸诱饵的第一末端远端的序列比对的cfNA片段序列相对于与所述寡核苷酸诱饵的第二末端远端的序列比对的cfNA片段序列的相对量进行定量。
16.根据权利要求1-15中任一项所述的方法,其中所述表征所述cfNA片段的片段化模式包括:
e)对与所述寡核苷酸诱饵杂交的cfNA片段进行测序,
f)鉴定所述基因组区域内的两个或更多个子区域,和
g)对包括与每个子区域匹配的序列的cfNA片段的数量进行计数,
其中所述寡核苷酸诱饵包括与所述基因组区域的序列互补的序列。
17.根据权利要求16所述的方法,其中如果cfNA片段的序列与子区域的序列在40个连续碱基上具有不超过一个的错配,则所述cfNA片段与所述子区域匹配。
18.根据权利要求1-17中任一项所述的方法,其包括:
d)使所述组合物与所述寡核苷酸诱饵和第二寡核苷酸诱饵接触,
e)分析与所述寡核苷酸诱饵杂交的所述cfNA片段,和
f)分析与所述第二寡核苷酸诱饵杂交的所述cfNA片段,
其中所述寡核苷酸诱饵和所述第二寡核苷酸诱饵包括与所述基因组区域的序列互补的序列。
19.根据权利要求18所述的方法,其进一步包括将与所述寡核苷酸诱饵杂交的所述cfNA片段和与所述第二寡核苷酸诱饵杂交的cfNA片段进行比较。
20.根据权利要求18或权利要求19所述的方法,其中所述分析与所述寡核苷酸诱饵和所述第二寡核苷酸诱饵杂交的所述cfNA片段包括测量与所述寡核苷酸诱饵杂交的cfNA片段的量和与所述第二寡核苷酸诱饵杂交的cfNA片段的量。
21.根据权利要求18-20中任一项所述的方法,其中所述分析与所述寡核苷酸诱饵和所述第二寡核苷酸诱饵杂交的所述cfNA片段包括分析所述cfNA片段的大小。
22.根据权利要求18-21中任一项所述的方法,其进一步包括:
a)对与所述寡核苷酸诱饵的第一末端远端的序列比对的cfNA片段序列相对于与所述寡核苷酸诱饵的第二末端远端的序列比对的cfNA片段序列的相对量进行定量,
b)对与所述第二寡核苷酸诱饵的第一末端远端的序列比对的cfNA片段序列相对于与所述第二寡核苷酸诱饵的第二末端远端的序列比对的cfNA片段序列的相对量进行定量。
23.根据权利要求22所述的方法,其进一步包括:
对与所述寡核苷酸诱饵的末端远端的序列比对的cfNA片段序列相对于与所述第一寡核苷酸诱饵的第二末端远端的序列比对的cfNA片段序列的相对量进行定量。
24.一种表征包括基因组区域的序列的cfNA片段的方法,所述方法包括将来自包括有包括所述基因组区域的第一部分的cfNA的组合物的所述cfNA片段的量与包括所述基因组区域的第二部分的所述cfNA片段的量进行比较。
25.根据权利要求24所述的方法,其中包括所述基因组区域的所述第一部分和所述第二部分的cfNA片段的所述量通过包括扩增所述基因组区域的所述部分的方法来确定。
26.根据权利要求25所述的方法,其中所述扩增通过PCR、环介导等温扩增、基于核酸序列的扩增、链置换扩增或多重置换扩增进行。
27.一种表征包括基因组区域的序列的cfNA片段的方法,所述方法包括对所述cfNA片段进行测序,以及将匹配代表第一片段化模式的第一组参考序列的cfNA片段序列的量与匹配代表第二片段化模式的第二组参考序列的cfNA片段序列的量进行比较。
28.根据权利要求27所述的方法,其中通过无比对序列比较来鉴定与所述第一组参考序列和所述第二组参考序列匹配的所述cfNA片段序列。
29.一种分析cfNA片段化模式的方法,所述方法包括根据权利要求1至28所述的方法来表征包括两个或更多个基因组区域的序列的cfNA片段。
30.根据权利要求1-29中任一项所述的方法,其中所述寡核苷酸诱饵与亲和标签缀合。
31.根据权利要求30所述的方法,其中所述亲和标签是生物素。
32.根据权利要求1-29中任一项所述的方法,其中所述寡核苷酸诱饵与固体表面缀合。
33.根据权利要求32所述的方法,其中所述固体表面是珠。
34.根据权利要求33所述的方法,其中所述固体表面是平面表面。
35.根据权利要求1-34中任一项所述的方法,其中所述cfNA片段是无细胞脱氧核糖核酸(cfDNA)片段。
36.根据权利要求1至34中任一项所述的方法,其中所述cfNA片段是无细胞核糖核酸(cfRNA)片段。
37.根据权利要求1-36中任一项所述的方法,其中所述包括cfNA的组合物是血浆、血清、唾液、尿液、血液组分、脑脊液、胸膜液、羊水、腹膜液、腹水、腹腔骨盆冲洗液/灌洗液、浆液性渗出液、气管支气管或支气管肺泡灌洗液。
38.根据权利要求37所述的方法,其中所述包括cfNA的组合物是血浆。
39.根据权利要求1-38中任一项所述的方法,其中所述基因组区域包括启动子的至少一个核苷酸、转录起始位点、DNase I超敏位点、PolII暂停位点、第一外显子或外显子边界的内含子。
40.根据权利要求39所述的方法,其中所述基因组区域包括第一外显子。
41.根据权利要求40所述的方法,其中所述基因组区域包括活性转录起始位点。
42.根据权利要求39-41中任一项所述的方法,其中所述基因组区域包括类固醇应答基因的起始位点或第一外显子。
43.根据权利要求42所述的方法,其中所述类固醇应答基因是糖皮质激素应答基因、抗炎基因或嗜中性粒细胞激活特征基因。
44.根据权利要求43所述的方法,其中所述类固醇应答基因是DUSP1或SAE1。
45.根据权利要求39-41中任一项所述的方法,其中所述基因组区域包括血管标志物基因的起始位点或第一外显子。
46.根据权利要求45所述的方法,其中所述血管标志物基因是内皮细胞标志物基因。
47.根据权利要求46所述的方法,其中所述内皮细胞标志物基因是VWF或EPHB4。
48.根据权利要求47所述的方法,其中所述基因组区域选自EPHB4的前5个外显子。
49.一种评估对象的医学病况的方法,其包括根据权利要求1至48中任一项所述的方法来表征包括基因组区域的序列的cfNA片段的片段化模式。
50.一种用于治疗对象的癌症的适应性免疫疗法的方法,所述方法包括:
d)向所述对象施用第一疗程的第一免疫疗法化合物;
e)从所述对象获取与血管再生和/或血管生成相关联的一种或多种基因的纵向无细胞DNA片段化概况;和
f)向所述对象施用第二疗程的免疫疗法;
其中所述第二疗程的免疫疗法包括:
iii.第二免疫疗法化合物,如果所述无细胞DNA片段化概况指示对所述第一免疫疗法化合物的应答不足;或者
iv.第二疗程的所述第一免疫疗法化合物,如果所述无细胞DNA片段化概况不指示对所述第一免疫疗法化合物的应答不足。
51.一种在对象中治疗医学病况的方法,所述方法包括:
向所述对象施用一疗程的疗法,和
从所述对象获取一个或多个基因组区域的纵向无细胞DNA片段化概况;
其中所述纵向无细胞DNA片段化概况指示所述对象已对所述疗程的疗法产生应答。
52.一种在对象中治疗医学病况的方法,所述方法包括:
从所述对象获取一个或多个基因组区域的无细胞DNA片段化概况;和
向所述对象施用一疗程的疗法,
其中所述无细胞DNA片段化概况指示所述疗程的疗法适用于所述对象。
CN202180047341.2A 2020-05-22 2021-05-20 用于表征无细胞核酸片段的方法 Pending CN116018646A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063029328P 2020-05-22 2020-05-22
US63/029,328 2020-05-22
PCT/US2021/033508 WO2021236993A1 (en) 2020-05-22 2021-05-20 Methods for characterizing cell-free nucleic acid fragments

Publications (1)

Publication Number Publication Date
CN116018646A true CN116018646A (zh) 2023-04-25

Family

ID=78707696

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180047341.2A Pending CN116018646A (zh) 2020-05-22 2021-05-20 用于表征无细胞核酸片段的方法

Country Status (7)

Country Link
US (2) US20230287500A1 (zh)
EP (1) EP4154255A1 (zh)
CN (1) CN116018646A (zh)
AU (1) AU2021276524A1 (zh)
CA (1) CA3179853A1 (zh)
IL (1) IL298458A (zh)
WO (1) WO2021236993A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023244983A1 (en) * 2022-06-13 2023-12-21 Freenome Holdings, Inc. Sequence process validation methods and compositions

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014204991A1 (en) * 2013-06-17 2014-12-24 Verinata Health, Inc. Method for determining copy number variations in sex chromosomes
US20160224730A1 (en) * 2015-01-30 2016-08-04 RGA International Corporation Devices and methods for diagnostics based on analysis of nucleic acids
BR112019012958A2 (pt) * 2016-12-22 2019-11-26 Guardant Health Inc métodos e sistemas para análise de moléculas de ácido nucleico
CA3198931A1 (en) * 2017-01-20 2018-07-26 Sequenom, Inc. Methods for non-invasive assessment of genetic alterations
PT3596233T (pt) * 2017-03-17 2022-08-22 Sequenom Inc Métodos e processos para avaliação de mosaicismo genético
CA3093092A1 (en) * 2018-03-06 2019-09-12 Cancer Research Technology Limited Improvements in variant detection

Also Published As

Publication number Publication date
CA3179853A1 (en) 2021-11-25
US20230383355A1 (en) 2023-11-30
EP4154255A1 (en) 2023-03-29
WO2021236993A1 (en) 2021-11-25
US20230287500A1 (en) 2023-09-14
AU2021276524A1 (en) 2023-01-05
IL298458A (en) 2023-01-01

Similar Documents

Publication Publication Date Title
Feezor et al. Whole blood and leukocyte RNA isolation for gene expression analyses
CN105339503B (zh) 用于个人表观基因组学的至天然染色质的转座
CN106319047B (zh) 使用多态计数来解析基因组分数
JP2019520791A (ja) 5−ヒドロキシメチル化無細胞系dnaをシーケンシングすることによる非侵襲性診断
JP6198736B2 (ja) 疾患のシグネチャとしてのアイソタイププロファイルの検出
Gilboa et al. Single-molecule analysis of nucleic acid biomarkers–A review
RU2003126575A (ru) Высокочувствительный метод обнаружения структур метилирования цитозина
CN115667554A (zh) 通过核酸甲基化分析检测结直肠癌的方法和系统
US20230175058A1 (en) Methods and systems for abnormality detection in the patterns of nucleic acids
CN110198711A (zh) 癌症检测方法
KR20200035427A (ko) 세포-무함유 바이러스 핵산을 사용하는 암 스크리닝의 증강
US20230348980A1 (en) Systems and methods of detecting a risk of alzheimer&#39;s disease using a circulating-free mrna profiling assay
JP2023109998A (ja) マイクロサテライト不安定性の検出
Dudley et al. Detection and diagnostic utilization of cellular and cell-free tumor DNA
US20230383355A1 (en) Methods for characterizing cell-free nucleic acid fragments
US20120283109A1 (en) Method of analyzing target nucleic acid of biological samples
US20240158857A1 (en) Methods for characterizing cell-free nucleic acid fragments
US20240158858A1 (en) Methods for characterizing cell-free nucleic acid fragments
KR102229647B1 (ko) 신장이식 환자의 급성거부반응 진단용 miRNA 바이오 마커 및 이의 용도
RU2245551C1 (ru) Способ диагностики онкологических заболеваний
KR20230132768A (ko) 비인간 메타게놈 경로 분석에 의한 암 진단 및 분류
Beaver et al. Circulating cell-free DNA for molecular diagnostics and therapeutic monitoring
Hu et al. Circulating DNA Quantification
Song et al. Multiplex Detection of Single Nucleotide Polymorphisms by Liquid Chromatography for Nonsmall Cell Lung Cancer Staging
WO2023004203A1 (en) Use of genetic and epigenetic markers to detect cell death

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination