CN115298324A - 游离dna断裂和核酸酶 - Google Patents

游离dna断裂和核酸酶 Download PDF

Info

Publication number
CN115298324A
CN115298324A CN202080095302.5A CN202080095302A CN115298324A CN 115298324 A CN115298324 A CN 115298324A CN 202080095302 A CN202080095302 A CN 202080095302A CN 115298324 A CN115298324 A CN 115298324A
Authority
CN
China
Prior art keywords
amount
subject
cfdna
reference value
free dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080095302.5A
Other languages
English (en)
Inventor
卢煜明
赵慧君
韩小澄
倪梦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Greer LLC
Chinese University of Hong Kong CUHK
Original Assignee
Greer LLC
Chinese University of Hong Kong CUHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Greer LLC, Chinese University of Hong Kong CUHK filed Critical Greer LLC
Publication of CN115298324A publication Critical patent/CN115298324A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/113Time

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本申请提供了用于检测与核酸酶相关联的基因中的遗传病症、用于测定抗凝剂的剂量的功效以及用于监测核酸酶的活性的各种方法、设备和系统。测得的参数值可以与参考值进行比较以确定遗传病症的分类、效率或活性。可以使用片段末端处的特定碱基(例如,在末端基序中)的量、特定大小的片段末端处的特定碱基的量或游离DNA片段的总量(例如,作为浓度)。可以使用抗凝剂处理某些样品,并且不同的温育时间可以用于某些方法。

Description

游离DNA断裂和核酸酶
相关申请的交叉引用
本申请要求于2019年12月18日提交的题为“游离DNA断裂和核酸酶(Cell-FreeDNA Fragmentation And Nucleases)”的美国临时专利申请第62/949,867号和于2020年1月8日提交的题为“游离DNA断裂和核酸酶(Cell-Free DNA Fragmentation AndNucleases)”的美国临时专利申请第62/958,651号的权益,所述美国临时专利申请通过引用并且出于所有目的整体并入本文。
背景技术
游离DNA(cfDNA)是丰富的信息来源,其可以应用于如妊娠和癌症等许多生理和病理状况的诊断和预测(Chan,K.C.A.等人(2017),《新英格兰医学杂志(New EnglandJournal of Medicine)》377,513-522;Chiu,R.W.K.等人(2008),《美国国家科学院院刊(Proceedings of the National Academy of Sciences of the United States ofAmerica)》105,20458-20463;Lo,Y.M.D.等人,(1997),《柳叶刀(The Lancet)》350,485-487)。尽管循环cfDNA现在通常用作非侵入性生物标志物并且已知以短片段的形式循环,但控制cfDNA的断裂和分子谱的生理因素仍然难以捉摸。
最近的研究表明,cfDNA的断裂是与核小体的定位相关联的非随机过程(Chandrananda,D.等人,(2015),《BMC医学基因组学(BMC Medical Genomics)》8,29;Ivanov,M.等人,(2015),《BMC基因组学(BMC genomics)》16,S1;Lo,Y.M.D.等人(2010),《科学转化医学(Science Translational Medicine)》2,61ra91-61ra91;Snyder,M.W.等人,(2016),《细胞(Cell)》164,57-68;Sun,K.等人,(2019),《基因组研究(Genome Research)》29,418-427)。先前已经证明DNASE1L3核酸酶有助于血浆中cfDNA的大小曲线(Serpas,L.等人(2019),《美国国家科学院院刊》116,641-649)。
发明内容
各种实施例使用游离DNA(cfDNA)的定量断裂信息来检测与核酸酶相关联的基因中的遗传病症、用于测定抗凝剂的剂量的功效以及用于监测核酸酶的活性。测得的参数值可以与参考值进行比较以确定遗传病症的分类、效率或活性。可以使用片段末端处的特定碱基(例如,在末端基序中)的量、特定大小的片段末端处的特定碱基的量或游离DNA片段的总量(例如,作为浓度)。在一些实施例中,可以使用抗凝剂处理某些样品,并且可以使用不同的温育时间。
提供了用于例如,使用相对于参考值的片段末端处的特定碱基的量、使用经抗凝剂处理的样品中的特定大小的片段末端处的特定碱基的量以及比较用抗凝剂温育不同时间的样品的片段末端处的特定碱基的量来检测基因的遗传病症的一些实施例。
提供了用于例如,使用被施用抗凝剂的受试者的样品中的片段末端处的特定碱基的量、使用被施用抗凝剂的受试者的样品中的特定大小的片段末端处的特定碱基的量来测定抗凝剂的剂量的功效的一些实施例。
提供了用于例如,使用相对于参考值的样品中的片段末端处的特定碱基的量以及使用样品中的特定大小的片段末端处的特定碱基的量来监测核酸酶的活性的一些实施例。
下文详细描述了本公开的这些实施例和其它实施例。例如,其它实施例涉及与本文所描述的方法相关联的系统、装置和计算机可读介质。
参考以下具体描述和附图,可以更好地理解本公开的实施例的性质和优点。
附图说明
图1示出了根据本公开的实施例的末端基序的实例,包含在DNA片段的末端处的单个碱基。
图2A-2E示出了根据本公开的实施例的与不同区中的参考基因组含量相比WTcfDNA片段的5'末端的碱基含量。
图3A-3D示出了根据本公开的实施例的TSS和Pol II区的碱基含量比例。TSS(3A)和Pol II(3C)区中的参考基因组含量与WT EDTA 0小时样品(3B和3D)中cfDNA的5'末端碱基含量进行比较。
图4示出了根据本公开的实施例的跨片段大小范围的WT cfDNA的5'末端的碱基含量。
图5A-5B示出了根据本公开的实施例的富含新鲜cfDNA的EDTA 6小时样品的采集。
图6示出了根据本公开的实施例的WT小鼠中EDTA 0小时对6小时样品的大小曲线。
图7A-7D示出了根据本公开的实施例的针对随机、CTCF、TSS和Pol II区的小鼠中富含新鲜cfDNA的EDTA 6小时样品的碱基含量百分比。
图8A示出了根据本公开的实施例的WT小鼠中A<>A片段比例在短、中等和长片段方面在基线cfDNA(EDTA 0小时)与富含新鲜cfDNA(EDTA 6小时)的样品之间的比较。图8B示出了G<>G的大小曲线,并且图9A-9B示出了在短、中等和长片段方面在EDTA 0小时与EDTA 6小时之间比较的WT小鼠中C<>C、T<>T片段比例的大小曲线。P值通过曼-惠特尼U检验(Mann-Whitney U test)计算。
图10A-10B示出了根据本公开的实施例的WT和Dffb缺陷小鼠中EDTA 0小时对富含新鲜cfDNA的EDTA 6小时样品的碱基含量百分比。
图11A示出了根据本公开的实施例的Dffb缺陷小鼠中EDTA 0小时对6小时样品中cfDNA的浓度。图11B示出了根据本公开的实施例的Dffb缺陷小鼠中EDTA 0小时对6小时样品的大小曲线。图11C示出了根据本公开的实施例的Dffb缺陷小鼠中的A<>A片段比例在短、中等和长片段方面在EDTA 0小时与EDTA 6小时之间的比较。
图12A-12D示出了根据本公开的实施例的针对随机区和CTCF区的EDTA 0小时和6小时样品中Dffb缺陷小鼠中的碱基含量比例。
图13A-13D示出了根据本公开的实施例的针对TSS区和Pol II区的EDTA 0小时和6小时样品中Dffb缺陷小鼠中的碱基含量比例。
图14A示出了根据本公开的实施例的A<>A片段的构建。图14B示出了根据本公开的实施例的Dnase1l3缺陷样品的末端碱基含量与WT样品的比较。
图15示出了根据本公开的实施例的Dnase1l3缺陷样品的末端碱基含量与每片段大小的WT样品的比较。
图16A示出了根据本公开的实施例的Dnase1l3缺陷EDTA 0小时cfDNA中A<>A、A<>G和A<>C片段的百分比与WT EDTA 0小时cfDNA的基线代表(灰色)的比较。图16B示出了根据本公开的实施例的富含新鲜cfDNA的WT EDTA 6样品中A<>A、A<>G和A<>C片段的百分比与WTEDTA 0小时cfDNA的基线代表(灰色)的比较。
图17A-17B示出了根据本公开的实施例的常规和对数标度的WT、Dnase1+/-和Dnase1-/-小鼠的在肝素中温育的cfDNA的大小曲线。
图18A-18B示出了根据本公开的实施例的WT和Dnase1-/-小鼠的在肝素中温育的cfDNA的大小曲线和碱基含量。
图19示出了根据本公开的实施例的Dnase1+/-小鼠的在肝素中温育的cfDNA的大小曲线和碱基含量。
图20示出了根据本公开的实施例的在0小时和6小时肝素样品的情况下的WT、Dnase1+/-和Dnase1-/-小鼠的cfDNA数量。
图21A示出了根据本公开的实施例的在EDTA 0小时WT样品情况下的A末端、G末端、C末端和T末端片段的cfDNA大小曲线。图21B示出了根据本公开的实施例的在肝素6小时WT样品情况下的A末端、G末端、C末端和T末端片段的cfDNA大小曲线。
图22A-22D示出了根据本公开的实施例的在EDTA 0小时样品情况下的Dffb-/-、Dnase1l3-/-、Dnase1+/-和Dnase1-/-小鼠的A末端、G末端、C末端和T末端片段的cfDNA大小曲线。
图23A示出了根据本公开的实施例的肝素6小时样品(红色)与基线样品(EDTA 0小时和6小时、肝素0小时)(灰色)中CTCF区的片段末端密度的比较。图23B-23C示出了根据本公开的实施例的WT(D)的肝素0小时和6小时样品的CTCF区中的5'末端碱基代表。
图24A-24B示出了根据本公开的实施例的Dnase1-/-小鼠的肝素0小时和6小时样品的CTCF区中的5'末端碱基代表。
图25示出了重叠的图23A和23C以示出根据本公开的实施例的T末端片段峰值对应于肝素6小时中末端密度增加的核小体内区。
图26示出了根据本公开的实施例的cfDNA生成和消化的模型,其中示出核酸酶DFFB、DNASE1和DNASE1L3的切割偏好。
图27示出了根据本公开的实施例的展示用于使用包含游离DNA的生物样品检测与核酸酶相关联的基因的遗传病症的方法的流程图。
图28示出了根据本公开的实施例的展示用于使用包含游离DNA的生物样品检测与核酸酶相关联的基因的遗传病症的方法的流程图。
图29示出了根据本公开的实施例的展示用于使用包含游离DNA的生物样品检测与核酸酶相关联的基因的遗传病症的方法的流程图。
图30示出了根据本公开的实施例的展示用于测定对患有血液病症的受试者进行的治疗的功效的方法的流程图。
图31示出了根据本公开的实施例的展示用于测定对患有血液病症的受试者进行的治疗的功效的方法1300的流程图。
图32A示出了根据本公开的实施例的用肝素治疗四个病例的数据。图32B-32C示出了根据本公开的实施例的已经用肝素治疗的深静脉血栓形成(DVT)患者的两个样品的数据。
图33示出了根据本公开的实施例的针对不同DNASE1剂量的片段的不同末端的含量百分比对大小的图。图33还示出了根据本公开的实施例的所有片段大小的频率图。
图34A示出了根据本公开的实施例的用DNASE1处理的血清的大小曲线(在0和6小时处)与未处理的和EDTA处理的比较。图34B示出了血浆中的大小曲线。
图35示出了根据本公开的实施例的6小时之后不同剂量的DNASE1对血清的影响。
图36示出了根据本公开的实施例的尿液样品中的频率对大小和碱基含量对大小。
图37示出了不同组织的DNASE1表达。
图38示出了根据本公开的实施例的展示用于使用包含游离DNA的生物样品监测核酸酶的活性的方法的流程图。
图39示出了根据本公开的实施例的展示用于使用包含游离DNA的生物样品监测核酸酶的活性的方法的流程图。
图40总结了根据本公开的实施例的针对每个条件获得的非重复片段的数量。
图41A示出了两个拷贝的Dnase1基因中的缺失(Dnase1-/-)。图41B示出了两个拷贝中Dffb基因的缺失。
图42展示了根据本发明的实施例的测量系统。
图43示出了根据本发明的实施例的可与系统和方法一起使用的示例计算机系统的框图。
术语
“组织”对应于集合在一起作为功能单元的一组细胞。可以在单一组织中发现多于一种类型的细胞。不同类型的组织可以由不同类型的细胞(例如,肝细胞、肺泡细胞或血细胞)组成,但也可以与来自不同生物体(母亲相对于胎儿)的组织相对应或与健康细胞相对于肿瘤细胞相对应。“参考组织”可以与用于测定组织特异性甲基化水平的组织相对应。可以使用来自不同个体的同一组织类型的多个样品来测定所述组织类型的组织特异性甲基化水平。
“生物样品”是指取自受试者(例如,人类(或其它动物),如孕妇、患有癌症或其它病症的个人或疑似患有癌症或其它病症的个人、器官移植接受者或疑似患有涉及器官的疾病过程(例如,心肌梗塞的心脏、中风的脑或贫血的造血系统)的受试者)且含有一个或多个所关注的核酸分子的任何样品。生物样品可以是体液,如血液、血浆、血清、尿液、阴道液、水囊肿(例如,睾丸)液、阴道冲洗液、胸膜液、腹水液、脑脊髓液、唾液、汗液、泪液、痰液、支气管肺泡灌洗液、乳头排出液、来自身体不同部位(例如,甲状腺、乳房)的抽吸液、眼内流体(例如房水)等。也可以使用粪便样品。在各种实施例中,已经富集游离DNA的生物样品(例如,通过离心方案获得的血浆样品)中的大部分DNA可以是游离的,例如,大于50%、60%、70%、80%、90%、95%或99%的DNA可以是游离的。离心方案可以包含例如,3,000g×10分钟下获得流体部分,并且在例如30,000g下再离心另外10分钟以除去残留的细胞。作为生物样品分析的一部分,可以针对生物样品分析统计上显著数量的游离DNA分子(例如,以提供准确的测量结果)。在一些实施例中,分析至少1,000个游离DNA分子。在其它实施例中,可以分析至少10,000个或50,000个或100,000个或500,000个或1,000,000个或5,000,000个游离DNA分子或更多。可以分析至少相同数量的序列读段。
“序列读段”是指从核酸分子的任何组成部分或全部进行测序的一串核苷酸。例如,序列读段可以是从核酸片段测序的短核苷酸串(例如,20-150个核苷酸)、核酸片段的一端或两端处的短核苷酸串或对存在于生物样品中的整个核酸片段进行的测序。序列读段可以通过多种方式获得,例如,使用测序技术或使用探针,例如,通过杂交阵列或如可以用于微阵列的捕获探针或扩增技术,如聚合酶链反应(PCR)或使用单引物的线性扩增或等温扩增。作为生物样品分析的一部分,可以分析至少1,000个序列读段。作为其它实例,可以分析至少10,000个、或50,000个、或100,000个、或500,000个、或1,000,000个或5,000,000个序列读段。
序列读段可以包含与片段末端相关联的“终止序列”。终止序列可以对应于片段的最外N个碱基,例如,片段末端处的1-30个碱基。如果序列读段对应于整个片段,则所述序列读段可以包含两个终止序列。当配对末端测序提供对应于片段的末端的两个序列读段时,每个序列读段可以包含一个终止序列。
“序列基序”可以指DNA片段(例如,游离DNA片段)中碱基的短的、循环的模式。序列基序可以出现在片段的末端处,并且因此是终止序列的一部分或包含终止序列。“末端基序”可以指优先出现在DNA片段末端处的终止序列的序列基序,可能用于特定类型的组织。末端基序也可以恰好出现在片段的末端之前或之后,由此仍对应于终止序列。核酸酶可以针对特定末端基序具有具体的切割偏好,并且针对第二末端基序具有第二最优选的切割偏好。
术语“等位基因”是指在相同的物理基因组基因座的可替代的DNA序列,其可能带来或可能不带来不同的表型性状。在任何特定的二倍体生物体中,每个染色体具有两个拷贝(除了男性人类受试者的性染色体),每个基因的基因型包括存在于所述基因座的一对等位基因,其在纯合子中是相同的并且在杂合子中是不同的。生物体的群体或物种通常在各个个体的每个基因座处包含多个等位基因。在群体中发现多于一个等位基因的基因组基因座被称为多态性位点。某一基因座处的等位基因变异可作为群体中存在的等位基因的数量(即,多态性程度)或杂合子比例(即,杂合率)来测量。如本文所使用的,术语“多态性”是指人类基因组中的任何个体间变异,而不管其频率如何。此类变异的实例包含但不限于单核苷酸多态性、简单串联重复多态性、插入—缺失多态性、突变(可能是疾病引起)和拷贝数变异。如本文所使用的术语“单倍型”是指多个基因座上的等位基因的组合,其在同一染色体或染色体区上一起传递。单倍型可以指少到一对基因座或指染色体区,或指整个染色体或染色体臂。
“相对频率”(也简称为“频率”)可以指比例(例如,百分比、分数或浓度)。具体地,特定末端基序(例如,CCGA或仅单个碱基)的相对频率可以例如通过具有CCGA的终止序列来提供样品中的一定比例的与末端基序CCGA相关联的游离DNA片段。
“聚合值”可以指集体性质,例如,一组末端基序的相对频率。实例包含平均值、中值、相对频率的总和、相对频率之间的变化(例如,熵、标准偏差(SD)、变异系数(CV)、四分位距(IQR)或某个百分位截止值(例如,不同的相对频率之间的第95个或第99个百分位)或与相对频率的参考模式的差异(例如,距离),如可以在聚类中实施的那样。
“校准样品”可以对应于其期望的测得值(例如,核酸酶活性、遗传病症的分类或其它期望的性质)是已知的或通过校准方法测定的生物样品,例如,使用其它测量技术,如针对有效剂量的凝血测量或用于测量核酸酶数量的ELISA或量化核酸酶对DNA消化速率以测量核酸酶活性的测定。示例测量可以涉及cfDNA数量的荧光或分光光度测量,所述测量可以单独完成或在添加含核酸酶的样品之前、之后和/或与其一起实时完成。另一个实例是使用径向酶扩散方法。校准样品可以具有单独的测得值(例如,具有特定末端基序或具有特定大小的片段的量),所述校准样品可以被测定,期望的测量值可以与所述校准样品相关。
“校准数据点”包含“校准值”(例如,具有特定末端基序或具有特定大小的片段的量)和期望针对其它测试样品测定的测得值或已知值。校准值可以根据从样品的DNA分子测得的各种类型的数据(例如,具有末端基序或具有特定大小的片段的量)测定。校准值对应于与期望的性质相关的参数,例如,遗传病症的分类、核酸酶活性或抗凝剂剂量的功效。例如,可以根据为校准样品测定的测得值来测定校准值,对于所述校准样品,期望的性质是已知的。校准数据点可以以各种方式定义,例如作为离散点或作为校准函数(也被称为校准曲线或校准表面)。可以从校准数据点的另外数学变换导出校准函数。
“位点”(也被称为“基因组位点”)与单个位点相对应,所述单个位点可以是单个碱基定位或一组相关的碱基定位(例如,CpG位点、TSS位点、Dnase超敏反应位点)或较大的一组相关的碱基定位。“基因座”可以对应于包含多个位点的区。基因座可以仅包含一个位点,这将使所述基因座在所述上下文中等同于一个位点。
“cfDNA曲线”可以指样品中cfDNA片段(也简称为DNA片段)的终止序列(例如,1-30个碱基)的关系。可以提供各种关系,例如,具有特定终止序列(末端基序)的cfDNA片段的量、具有特定终止序列的cfDNA片段与一个或多个其它终止序列相比的相对频率,以及包含其它参数,如大小。可以针对各种大小的cfDNA片段提供cfDNA曲线。可以以各种方式提供此类cfDNA曲线(有时被称为cfDNA大小曲线),以展示具有给定大小(单一长度或大小范围)的一个或多个特定终止序列的cfDNA片段的量。
“分离值”与涉及两个值(例如,两个分数贡献或两个甲基化水平)的差或比率相对应。分离值可以是简单的差或比率。作为实例,x/y以及x/(x+y)的直接比率是分离值。分离值可以包含其它因子,例如,乘法因子。作为其它实例,可以使用数值的函数的差值或比率,例如两个值的自然对数(ln)的差值或比率。分离值可以包含差值和比率。
(例如,相对频率的)“分离值”和“聚合值”是参数(也称为度量)的两个实例,其提供了在不同分类(状态)之间变化的样品的度量,并且因此可以用于测定不同的分类。聚合值可以是分离值,例如,当在样品的相对频率集合和相对频率参考集合之间取差值时,如可以在聚类中所做的那样。
如本文所使用的术语“分类”是指与样品的特定性质相关的任何一个或多个数字或其它一个或多个字符。例如,符号“+”(或词语“正”)可以表示样品被分类为具有缺失或扩增。分类可以是二进制的(例如,正或负)或具有更多的分类等级(例如,从1到10或0到1的标度)。
术语“截止值”和“阈值”是指在操作中使用的预定数量。例如,截止值大小可以指超过一定大小则不包含片段的大小。阈值可以是高于或低于特定分类所应用的值。这些术语中的任一个可以在这些上下文中的任一种中使用。截止值或阈值可以是“参考值”或者可以从表示特定类别或区分两个或多个类别的参考值中得出。如本领域技术人员将理解的,可以以各种方式测定此类参考值。例如,可以针对具有不同已知分类的两个不同的受试者测定度量,并且可以选择参考值作为一个分类的代表(例如,平均值)或度量的两个集群之间的值(例如,选择以获得期望的灵敏度和特异性)。作为另一个实例,可以基于样品的统计模拟来测定参考值。可以基于期望的准确性(例如,灵敏度和特异性)来测定截止值、阈值、参考等的特定值。
“病理水平”(或病症水平)可以指与生物体相关联的病理的量、程度或严重性。实例是表达核酸酶的细胞病症。病理的另一个实例是对移植器官的排斥。其它示例病理可以包含自身免疫攻击(例如,损害肾脏狼疮性肾炎的或多发性硬化症)、炎性疾病(例如,肝炎)、纤维化过程(例如,肝硬化)、脂肪浸润(例如,脂肪肝疾病)、退化过程(例如阿尔茨海默氏病)和缺血性组织损伤(例如,心肌梗塞或中风)。受试者的健康状态可以被认为是无病理分类。病理可以是癌症。
术语“癌症水平”可以指是否存在癌症(即,存在或不存在)、癌症的阶段、肿瘤的大小、是否存在转移、身体的总肿瘤负荷、癌症对治疗的反应和/或癌症严重程度的其它度量(例如癌症复发)。癌症水平可以是数字或其它标记,如符号、字母和颜色。所述水平可以是零。癌症水平还可以包含恶化前或癌前病状(状态)。癌症水平可以以各种方式使用。例如,筛查可以检查癌症是否存在于以前不知道患有癌症的人身上。评估可以调查被诊断出患有癌症的人,以监测癌症随着时间的进展、研究疗法的有效性或确定预后。在一个实施例中,预后可以表示为患者死于癌症的可能性,或在特定持续时间或时间之后癌症进展的可能性,或癌症转移的可能性或程度。检测可以意指“筛查”或可以意指检查具有癌症暗示性特征(例如症状或其它阳性测试)的人是否患有癌症。
术语“约”或“大约”可以意指在特定值的一个可接受的误差范围内,如本领域普通技术人员所测定的,这将部分地取决于如何测量或测定所述值,即,测量系统的局限性。例如,根据本领域的实践,“约”可以意指在1个或大于1个标准偏差内。可替代地,“约”可以意指给定值的最多20%、最多10%、最多5%或最多1%的范围。可替代地,特别是对于生物系统或过程,术语“约”或“大约”可以意指在值的数量级内、值的5倍内,并且更优选地,值的2倍内。当在本申请和权利要求书中描述特定值时,除非另外指出,否则应假设术语“约”表示所述特定值在可接受的误差范围内。术语“约”可以具有本领域普通技术人员通常理解的含义。术语“约”可以指±10%。术语“约”可以指±5%。
具体实施方式
游离DNA(cfDNA)是用于癌症和产前检测并作为短片段在血浆(以及其它无细胞样品)中循环的强大的非侵入性生物标志物。在本公开中,研究了DNASE1、DNASE1L3和DNA断裂因子亚基β(DFFB,也被称为胱天蛋白酶激活的DNase)在cfDNA断裂中的相应作用。为了阐明cfDNA断裂的生物学,分析了DNASE1、DNASE1L3和DNA断裂因子亚基β(DFFB)对在这些核酸酶中的每一种核酸酶方面存在缺陷的小鼠的作用。
在一示例分析中,比较了在每种类型核酸酶方面存在缺陷的小鼠与其野生型对应物(包含cfDNA片段的终止碱基)之间的cfDNA曲线(包含cfDNA大小曲线)。DNA片段的终止碱基是一种末端基序,并且测量以特定碱基结尾的cfDNA片段的相对量(例如,比例)可以提供关于cfDNA片段、与组织核酸酶活性相关的cfDNA片段的来源、核酸酶功能和影响核酸酶的病症的信息。发现每种核酸酶在cfDNA断裂中发挥不同但互补的作用。
通过分析每种类型的核酸酶缺陷小鼠中的cfDNA片段的末端和野生型小鼠中的cfDNA片段的末端,表明每种核酸酶都有揭示cfDNA断裂的逐步过程的具体的切割偏好(例如,特定的末端基序)。证明了cfDNA首先在细胞内用DFFB生成、在细胞内用DNASE1L3和其它核酸酶生成。然后,cfDNA断裂在细胞外继续并且循环DNASE1L3和DNASE1。在使用肝素破坏核小体结构的情况下,还表明10bp周期性源于在完整的核小体结构内切割DNA。总而言之,本公开建立了cfDNA断裂的模型。
提供了用于检测与核酸酶相关联的基因中的遗传病症、用于测定抗凝剂的剂量的功效以及用于监测核酸酶的活性的各种实施例。
提供了用于例如,使用相对于参考值的片段末端处的特定碱基的量、使用经抗凝剂处理的样品中的特定大小的片段末端处的特定碱基的量以及比较用抗凝剂温育不同时间的样品的片段末端处的特定碱基的量来检测基因的遗传病症的各种技术。
提供了用于例如,使用被施用抗凝剂的受试者的样品中的片段末端处的特定碱基的量、使用被施用抗凝剂的受试者的样品中的特定大小的片段末端处的特定碱基的量来测定抗凝剂的剂量的功效的各种技术。
提供了用于例如,使用相对于参考值样品中的片段末端处的特定碱基的量以及使用样品中的特定大小的片段末端处的特定碱基的量来监测核酸酶的活性的各种技术。
I.游离DNA末端基序
末端基序涉及游离DNA片段的终止序列,例如,片段的任一末端处的K个碱基的序列。终止序列可以是具有各种碱基数(例如,1、2、3、4、5、6、7等)的k聚体。末端基序(或“序列基序”)涉及序列本身,而不是参考基因组中的特定定位。因此,在整个参考基因组中的许多定位处可能出现相同的末端基序。可以使用参考基因组来测定末端基序,例如,以鉴定刚好在起始定位之前或刚好在结束定位之后的碱基。此类碱基仍将对应于游离DNA片段的末端,例如,因为它们是基于片段的终止序列来鉴定的。
图1示出了根据本公开的实施例的末端基序的实例。图1描绘了限定要分析的4聚体末端基序的两种方式。在技术140中,从血浆DNA分子的每个末端上的前4-bp序列直接构建4聚体末端基序。例如,可以使用经测序的片段的前4个核苷酸或后4个核苷酸。在技术160中,通过使用来自片段的经测序的末端的2聚体序列和来自与所述片段的末端相邻的基因组区的另一个2聚体序列,来共同构建4聚体末端基序。在其它实施例中,可以使用其它类型的基序,例如,1聚体、2聚体、3聚体、5聚体、6聚体和7聚体末端基序。
如图1中示出的,例如,对血液样品使用纯化过程,如通过离心获得游离DNA片段110。除了血浆DNA片段之外,还可以使用其它类型的游离DNA分子,例如,来自血清、尿液、唾液和本文中提及的其它样品。在一个实施例中,DNA片段可以是平末端的。
在框120处,使DNA片段经受配对末端测序。在一些实施例中,配对末端测序可以从DNA片段的两个末端产生两个序列读段,例如,每个序列读段为30-120个碱基。这两个序列读段可以形成DNA片段(分子)的一对读段,其中每个序列读段包含DNA片段的相应末端的终止序列。在其它实施例中,可以对整个DNA片段进行测序,由此提供单个序列读段,所述单个序列读段包含所述DNA片段的两个末端的终止序列。两个末端处的两个终止序列仍然可以被认为是成对的序列读段,即使是从单个测序操作一起生成的。
在框130处,可以将序列读段与参考基因组进行比对。此比对用于说明限定序列基序的不同方式,并且在一些实施例中可以不使用此比对。例如,片段末端处的序列可以直接使用,无需与参考基因组进行比对。然而,可能期望比对具有终止序列的一致性,所述比对不依赖于受试者中的变异(例如,SNP)。例如,由于变异或测序错误,终止碱基可能与参考基因组不同,但参考中的碱基可以是被计数的一个。可替代地,可以使用序列读段末端处的碱基,以便为个体定制。可以使用如(但不限于)BLAST、FASTA、Bowtie、BWA、BFAST、SHRiMP、SSAHA2、NovoAlign和SOAP等各种软件包执行比对程序。
技术140示出了经测序的片段141的序列读段,以及与基因组145的比对。在5'末端被视为起点的情况下,第一末端基序142(CCCA)处于经测序的片段141的起点处。第二末端基序144(TCGA)处于经测序的片段141的尾部处。在分析cfDNA片段的末端优势时,此序列读段将有助于5'末端的C末端计数。在一个实施例中,当酶识别CCCA并且然后恰好在第一个C之前进行切割时,可能出现此类末端基序。如果是这种情况,则CCCA将优先处于血浆DNA片段的末端处。对于TCGA,酶可能会识别它,并且然后在A之后进行切割。当测定A的计数时,此序列读段将有助于A末端计数。
技术160示出了经测序的片段161的序列读段,以及与基因组165的比对。在5'末端被视为起点的情况下,第一末端基序162(CGCC)具有恰好在经测序的片段161的起点之前出现的第一部分(CG)和作为经测序的片段161的起点的终止序列的一部分的第二部分(CC)。第二末端基序164(CCGA)具有恰好在经测序的片段161的尾部之后的出现的第一部分(GA)和作为经测序的片段161的尾部的终止序列的一部分的第二部分(CC)。在一个实施例中,当酶识别CGCC,并且然后在G与C之间进行切割时,可能会出现此类末端基序。如果是这种情况,则CC将优先处于血浆DNA片段的末端处,而CG恰好在所述CC之前出现,由此提供了CGCC的末端基序。至于第二末端基序164(CCGA),酶可以在C与G之间切割。如果是这种情况,则CC将优先处于血浆DNA片段的末端处。对于技术160,来自相邻基因组区和经测序的血浆DNA片段的碱基数可以变化,并且不必限于固定比率,例如,代替2:2,所述比率可以是2:3、3:2、4:4、2:4等。
游离DNA末端签名中包含的核苷酸数量越多,基序的特异性就越高,因为在基因组中有6个碱基以精确配置排列的概率低于在基因组中有2个碱基以精确配置排列的概率。因此,末端基序的长度的选择可以由预期用途应用的所需灵敏度和/或特异性支配。
由于终止序列用于将序列读段与参考基因组进行比对,因此根据终止序列或恰好之前/之后测定的任何序列基序仍根据终止序列测定。因此,技术160使终止序列与其它碱基相关联,其中参考被用作进行此关联的机制。技术140与技术160之间的区别在于将特定DNA片段分配给哪两个末端基序,这会影响相对频率的特定值。但是,总体结果(例如,检测遗传病症、测定剂量的功效、监测核酸酶的活性等)不会受到DNA片段如何分配到末端基序的影响,只要一致技术被用于例如任何训练数据以测定参考值,如使用机器学习模型可能发生的那样。
所计数的具有对应于特定末端基序(例如,特定碱基)的终止序列的DNA片段的计数可以被计数(例如,存储在存储器中的阵列中)以测定特定末端基序的量。可以以各种方式对量进行测量,如原始计数或频率,其中量被归一化。归一化可以使用(例如,除以)DNA片段的总数或特定组DNA片段中的数量(例如,来自特定区、具有特定大小或具有一个或多个特定末端基序)来完成。当存在遗传病症时,以及当施用有效剂量的抗凝剂时,以及当核酸酶的活性变化(例如,增加或减少)时,已经检测到末端基序的量的差异。
II.循环和新鲜CFDNA中的终止偏好
循环cfDNA可以直接从获得自受试者的样品,例如,血液或血浆中找到。此类循环cfDNA在体内以游离形式存在。因此,游离DNA由体内细胞产生(例如,通过细胞凋亡或坏死),并且然后游离DNA开始循环(例如,在血液中)。相比之下,新鲜cfDNA是从身体的细胞中获得的,并且然后当细胞在身体外部时,例如,通过使细胞以各种方式中的任一种方式(如温育)死亡来产生游离DNA。观察到优选终止序列的差异。
A.典型循环cfDNA中的C末端偏好
分析了野生型(WT)小鼠的不同基因组区中cfDNA片段的5'末端的碱基含量比例,以检验cfDNA断裂不是随机的这一假设。对于血液样品,EDTA可以用作抗凝剂并抑制血浆核酸酶,以保持大小曲线、末端基序的频率以及在低温(例如,标准冰箱温度,如在-5℃到20℃之间)下保存时相对接近初始状态的游离DNA的浓度。如果在较高温度(例如,室温)下温育,将产生取决于温育时间量的一定量的新鲜cfDNA。时间为0指示没有在室温下温育。
图2A-2E示出了根据本公开的实施例的与不同区中的参考基因组含量相比WTcfDNA片段的5'末端的碱基含量。这些图使用相对于参考基因组的一般碱基含量的末端基序(在此实例中为单个碱基)的碱基含量百分比示出了相对于T/A在C/G处断裂的偏好。
1.定义片段的末端基序的碱基含量百分比
图2A示出了片段与进行比对的聚合区205,其中片段基于5'末端处的终止碱基进行标记。水平轴示出与区的中心的相对定位。此类区的示例类型包含开放染色质区;CTCF区;与超敏位点相关联的区,例如,对于特定核酸酶(例如,DNase);Pol II区(RNA聚合酶II);以及与转录起始位点(TSS)相关联的区。由于参考基因组中每种区类型都有许多实例,因此比对的计数数据(例如,给定区实例中每个定位的末端基序的计数)在区类型的许多实例中聚合。为每个实例选择定位0,使得可以针对每个末端基序(在本实例中为特定碱基)的给定定位聚合计数。
竖直线260展示如何为每个定位测定百分比。百分比是用特定碱基标记的读段的百分比,如上所述,对应于5'末端处的终止碱基。因此,给定定位的百分比的计算使用了在此定位处结束的所有片段。在图2A中,在对应于竖直线260的定位,碱基含量为50%A和50%C。如果末端基序多于1聚体,那么百分比的测定可以解释多于两个的可能末端基序的数量,例如,16表示末端基序是2聚体。
2.相对于参考的一般碱基含量的末端碱基含量
图2B示出了参考基因组含量(即,参考基因组)在随机区中定位处的碱基含量百分比的图。随机区是通过随机选择定位0生成的,所述定位限定1000个碱基的区,并且然后测定参考基因组中相对于所述定位的碱基含量。因此,图2B不是使用DNA片段的终止碱基测定的,而是使用了参考基因组相对于随机选择定位的碱基含量。图2B示出终止碱基到定位0的相对距离的百分比没有变化。由于参考基因组中碱基出现的差异,不同碱基的百分比确实存在差异,但给定碱基的百分比是恒定的。对于图2B中的特定数据,选择了约10,000个随机定位,其中分析了这些定位周围的碱基。这些定位示出在定位0处。在参考基因组含量的随机区中,A和T比例相等,并且C和G比例相等。对于随机区,碱基含量百分比是统一的。T和A的百分比略低于30%,并且G和C的百分比略高于20%。
图2D示出了参考基因组含量的CTCF区定位的碱基含量百分比图。已知CTCF区侧接核小体,所述核小体在真核基因组中的定位基本不变,因此根据基因组区的功能示出任何偏好。对于CTCF区,碱基含量百分比在CTCF位点处翻转,其中G/C的含量高于T/A的含量。
图2C示出了随机区中WT EDTA 0小时样品中cfDNA片段的5'末端的碱基含量。因此,对于图2C没有发生温育。终止碱基的计数数据在每个定位处聚合到随机选择的定位,并且测定在此定位处结束的每个碱基的相对频率的百分比。示出了A末端210、G末端220、T末端230和C末端240的碱基含量百分比。如果断裂是完全随机的,则末端核苷酸比例应反映小鼠基因组的组成,即28.8%A、28.8%T、21.2%C和21.2%G,如图2B中示出的。然而,随机选择的基因组区中的cfDNA片段的5'末端示出C(32.6%)的显著过度代表、G(24.4%)的轻微过度代表以及A(19.8%)和T(23.2%)的代表不足,如图2C中示出的。此类变化指示DNA在C和G定位处不成比例地断裂,因为A/T位点在参考基因组中更为普遍,但在片段末端处更少出现。
图2E示出了CTCF区中WT EDTA 0小时样品中cfDNA片段的5'末端的碱基含量。示出了A末端210、G末端220、T末端230和C末端240的碱基含量百分比。在这些样品中,与参考基因组含量相比,cfDNA片段的5'末端处的C和G过度代表,而A和T代表不足。因此,再次,存在循环cfDNA的自然断裂在C/G位点处而不是在A/T位点处的偏好。对于其它区,也可以看到此类不对称代表。
图3A-3B示出了根据本公开的实施例的TSS区的碱基含量比例。将TSS(图3A)区中的参考基因组含量与WT EDTA 0小时样品(图3B)中cfDNA的5'末端碱基含量进行比较。图3B示出了C末端中相对于参考含量的增加。A末端和T末端一般较低,并且G末端大致相同。
图3C-3D示出了根据本公开的实施例的Pol II区的碱基含量比例。将Pol II(图3C)区中的参考基因组含量与WT EDTA 0小时样品(图3D)中cfDNA的5'末端碱基含量进行比较。图3D示出了C末端中相对于参考含量的较大增加,以及G末端的较小增加。A末端和T末端通常较低。与其它图一样,示出了A末端210、G末端220、T末端230和C末端240的碱基含量百分比。
因此,在cfDNA与TSS和POL II区的比对中也可以看到这种不对称代表的模式。因为CTCF区含有一系列侧接CTCF结合位点的良好定位的核小体,并且因为TSS和Pol II区是已知的开放染色质区,所以基因组的核小体和开放区两者都显示出相同的C末端过度代表。
3.不同片段大小的末端碱基含量
图4示出了根据本公开的实施例的跨片段大小范围的WT cfDNA的5'末端的碱基含量。竖直轴是碱基含量百分比,并且水平轴是片段大小。片段的每个末端都是独立计数的。在不同的片段大小中,cfDNA片段的5'末端处的C和G过度代表,而A和T代表不足。如图5中示出的,当在0-600bp的cfDNA片段大小范围内绘制5'末端时,野生型cfDNA中跨所有片段大小的C末端过度代表和A末端代表不足是明显的并且相对一致。因此,C末端占优势的cfDNA似乎是WT小鼠中跨所有片段大小的典型cfDNA曲线。
B.新鲜cfDNA中的断裂模式(例如,针对DFFB)
可以从全血样品中的细胞中获得新鲜DNA,其中通过在室温下将全血在EDTA中温育一段时间来导致细胞死亡。以此方式,所得血浆样品可以富集新鲜DNA。
探讨了此典型cfDNA曲线(即,如先前部分中示出的)是从细胞来源“原样”创建的,或者在血浆内进一步消化之后产生。因此,试图捕获和分析从垂死细胞中新鲜产生的cfDNA,并将其曲线与上文示出的典型C末端主要cfDNA曲线进行比较。
1.温育的cfDNA的量的变化
图5A-5B示出了根据本公开的实施例的富含新鲜cfDNA的EDTA 6小时样品的采集。
图5A示出了在两个时间段内用EDTA处理的WT小鼠的cfDNA。通过在室温下将全血在EDTA中温育6小时,使样品富含新鲜cfDNA。在室温下用EDTA温育会导致细胞死亡,由此释放出新鲜cfDNA(即,在首次采集样品时并非游离但已成为游离的DNA)。通过血浆cfDNA数量增加1.1到5.9倍证实了每个配对样品中温育之后新鲜cfDNA的流入。
图5B示出了cfDNA的浓度(基因组当量GE/mL)从无温育到在室温下温育6小时的增加。还观察到长cfDNA片段的增加。
图6示出了五个不同野生型池的未温育的样品的大小曲线710(0小时)和温育(6小时)的大小曲线720。每个池都含有来自具有野生型(WT)的不同组小鼠的DNA。大小曲线在水平轴上示出DNA片段的大小(bp),以及给定大小的DNA片段的频率(按百分比)。长DNA片段(例如,350-600bp)的频率通常随着温育而增加,如长DNA片段的大小曲线720大于大小曲线710所示。
图5A、5B和6中的此类行为表明,如果将全血保存持续延长的一段时间,则样品中存在的一些血细胞可能开始泄漏游离DNA。此类泄漏可以在任何分析中加以考虑,并用于如检测和其它测量等应用。
2.新鲜cfDNA中的A末端和G末端偏好
除了作为用EDTA温育的结果的cfDNA增加,还研究了碱基末端含量的变化。用EDTA温育血液样品导致A末端和G末端含量相对于未温育的血液样品中的典型碱基末端含量增加。此增加见于各个区中,包含随机区、CTCF区、TSS区和Pol II区。
图7A-7D示出了根据本公开的实施例的针对随机、CTCF、TSS和Pol II区的小鼠中富含新鲜cfDNA的EDTA 6小时样品的碱基含量百分比。相对于图2C和2E,温育增加了A末端和G末端的频率,从而指示在温育期间发生的断裂中对A和G的偏好。
图7A示出了根据本公开的实施例的通过用EDTA温育血液样品超过6小时来制备的新鲜cfDNA样品的随机区中的碱基含量百分比。在6小时EDTA样品中分析cfDNA的5'末端,与基线0小时温育相比,在典型cfDNA中看到的C末端优势在存在新鲜cfDNA的情况下大大减少,如图2C中示出的。C末端和T末端片段分别减少到28.3%和17.0%。在随机选择的基因组区中,A末端和G末端片段分别显著增加到27.7%和27.0%。
图7B示出了根据本公开的实施例的新鲜cfDNA样品的CTCF区中的碱基含量百分比。在具有核小体阵列的CTCF区中,随机区的碱基含量变化也始终如一地可视化。在将图7B与图2E进行比较时,可以看到A末端含量从略低于20%增加到约20%-30%之间,并且G末端含量从大概低于30%增加到高于30%。
图7C示出了根据本公开的实施例的富含新鲜cfDNA的EDTA 6小时样品中TSS区中的碱基含量比例。与图3B相比,可以看到A末端含量从低于20%增加到高于20%,并且G末端含量从低于30%增加到高于30%。
图7D示出了根据本公开的实施例的富含新鲜cfDNA的EDTA 6小时样品中Pol II区中的碱基含量比例。与图3D相比,可以看到A末端含量从低于20%增加到高于20%,并且G末端含量从大概约30%增加到约40%及以上。
因此,与典型的cfDNA相比,全血温育之后的新鲜cfDNA针对A末端和G末端片段富集。由于来自垂死细胞的新鲜cfDNA曲线似乎与基线样品中发现的典型C末端主要cfDNA类似,因此推断将在随后的步骤中创建典型C末主要cfDNA。由于温育之后的片段末端偏好(例如,针对A末端的富集)不同(例如,A末端对C末端),还推断新鲜cfDNA的产生可能来源于与创建典型cfDNA的机制不同的机制。如后面的部分中示出的,A末端的富集发生在较长cfDNA中。
3.不同大小的新鲜cfDNA之中的A末端和G末端
还通过片段大小探索了碱基末端偏好。通过其两个末端核苷酸鉴定了片段,并且分析了其中两个末端以A、G、C或T终止的片段。其中鉴定出两个末端的这些片段用其末端核苷酸以及在中间的符号<>表示,使得两个末端为A的片段将被指定为A<>A。比较了不同大小的A<>A、G<>G、C<>C和T<>T片段的比例代表,从而推断对于这些两个末端都涵盖相同核苷酸偏好的片段类型,针对切割特定核苷酸的任何偏好都将最良好地可视化。在这四种类型的片段中,富含新鲜cfDNA的6小时样品的大小>150bp的A<>A片段的比例显著更高,并且在≥250bp的长片段中进一步增加。另一方面,G<>G、C<>C和T<>T片段没有因大小而具显著差异。因此,新鲜cfDNA针对长于150bp的A末端片段富集。
图8A示出了根据本公开的实施例的WT小鼠中A<>A片段比例在短、中等和长片段方面在基线cfDNA(EDTA 0小时)与富含新鲜cfDNA(EDTA 6小时)的样品之间的比较。P值通过曼-惠特尼U检验计算。在图8A中,示出了对短(≤150bp)、中等(150-250bp)、长(≥250bp)和所有片段四个类别的分析。对于每个类别,示出了EDTA 0小时和6小时的测量结果。中等和长以及所有A<>A片段的百分比显著增加。如下文所分析的,A<>A的增加可能与DNA断裂因子亚基β(DFFB)核酸酶从血液中切割细胞内DNA(即,在细胞内部)并且然后将游离DNA释放到血浆中有关。
图8B示出了G<>G的大小曲线,并且图9A-9B示出了在短、中等和长片段方面在EDTA0小时与EDTA 6小时之间比较的WT小鼠中C<>C、T<>T片段比例的大小曲线。P值通过曼-惠特尼U检验计算。如上文所提及的,G<>G、C<>C和T<>T片段的量没有因大小而具显著差异。
图10A示出了与相应基线未温育EDTA水平相比,每种片段大小的A末端、G末端、C末端和T末端片段的比例。在图10A中,计数是针对单个末端而不是双末端的,如在图8A-9B中。具体地,图10A示出了富含新鲜cfDNA的WT EDTA 6小时样品中具有A末端1010(绿色)、G末端1020(橙色)、C末端1040(蓝色)和T末端1030(红色)的cfDNA的百分比与EDTA 0小时样品(灰色)中的基线代表的比较。如图所示,A末端和G末端片段增加,并且C末端和T末端片段减少。因为这些是百分比,所以当某些组含量增加时,其它含量也存在对应的减少。
令人惊讶地,长A末端片段的增加集中在特定大小范围内,其中峰值在约200bp和400bp处,这让人联想到核小体阶梯大小。G末端片段在这些大小下也具有类似但较弱的周期性。假设这些A末端(和G末端)cfDNA片段可能是通过核小体之间的切割产生的,使得完整核小体DNA的全长得以保留。周期性的峰值将支持真正偏好在核小体间区处切割5'到A,而对切割5'到G的偏好略小。
4.DFFB对具有A末端的cfDNA的影响
由于A末端长片段是从垂死细胞中新鲜产生的,因此检查了细胞凋亡在其产生中的作用。由于DFFB是细胞凋亡期间参与DNA断裂的主要细胞内核酸酶,因此研究了来自Dffb缺陷小鼠的样品,所述小鼠的两个等位基因中的此基因都被敲除,由Dffb-/-表示。
图10B示出了Dffb缺陷EDTA 6小时样品中具有A末端(绿色)、G末端(橙色)、C末端(蓝色)、T末端(红色)的cfDNA与其在EDTA 0小时样品(灰色)中的基线代表的比较。比较每个片段大小的A末端、G末端、C末端和T末端片段比例,与基线相比,EDTA温育6小时之后Dffb缺陷小鼠中几乎没有变化,其中A末端和G末端片段中没有周期性。因此,在Dffb缺陷小鼠中,在WT小鼠中观察到的A末端片段的增加不存在,这表明DFFB可能在产生这些A末端长片段中起主要作用。
进一步研究了温育之后以及针对片段大小以及不同区的cfDNA中的整体变化。温育之后基本上没有变化。
图11A示出了根据本公开的实施例的Dffb缺陷小鼠中EDTA 0小时对6小时样品中cfDNA的浓度。EDTA温育6小时之后,cfDNA数量没有显著增加。
图11B示出了根据本公开的实施例的Dffb缺陷小鼠中EDTA 0小时对6小时样品中的大小曲线。长片段中很少或没有增加。
图11C示出了根据本公开的实施例的Dffb缺陷小鼠中的A<>A片段比例在短、中等和长片段方面在EDTA 0小时与EDTA 6小时之间的比较。如图8A中示出的,与WT小鼠不同,在Dffb缺陷小鼠中,在EDTA温育6小时之后,A<>A片段百分比没有增加。
图12A-12D示出了根据本公开的实施例的针对随机区和CTCF区的EDTA 0小时和6小时样品中Dffb缺陷小鼠中的碱基含量比例。图13A-13D示出了根据本公开的实施例的针对TSS区和Pol II区的EDTA 0小时和6小时样品中Dffb缺陷小鼠中的碱基含量比例。在随机基因组区、CTCF、TSS和Pol II区中,A末端片段没有增加。
如果没有看到图10A中的变化,这将表明动物(例如,人类或小鼠)的核酸酶存在缺陷,例如,DFFB。可以通过在两个不同时间(例如,0小时和6小时)温育并比较这两个不同时间的大小曲线来分析此类变化。缺陷变化可以指示进行细胞内切割的核酸酶中的任一种核酸酶中存在缺陷,进一步的分析可能会提供关于哪种核酸酶的详细信息。
III.DNASE1L3对典型CFDNA的影响
虽然上述分析表征了新鲜生成的cfDNA的末端碱基含量和大小曲线,但本部分分析了血浆cfDNA中典型C末端优势产生的过程。在图4中看到的所有大小的循环cfDNA片段中对C末端的这种明显偏好表明存在偏好切割5'到C的核酸酶。先前已经证明来自WT小鼠的cfDNA具有高频率的以CCNN基序结尾的片段,并且cfDNA片段末端中的这种对CCNN基序的偏好在Dnase1l3缺陷小鼠中减少(Serpas,L.等人(2019),《美国国家科学院院刊》116,641-649)。假设负责C末端偏好的核酸酶可能也是DNASE1L3。为了研究此假设,比较了Dnase1l3缺陷小鼠(Dnase1l3-/-)与WT小鼠之间的特定A<>A、G<>G、C<>C和T<>T片段比例。
图14A示出了根据本公开的实施例的A<>A片段的构建。图14A示出了A末端片段和A<>A片段。A末端片段在沃森链(Watson strand)的5'末端或克里克链(Crick strand)的5'末端处具有A。另一个末端可以用N表示,因为碱基可以是任何碱基。A<>A片段在沃森链的5'末端处具有A并且在克里克链的5'末端处具有A。此类命名法也适用于C<>C、G<>G和T<>T,所有这些贯穿整个公开使用。
图14B示出了根据本公开的实施例的Dnase1l3缺陷样品的末端碱基含量与WT样品的比较。碱基含量数据用于相同碱基的双面末端。图14B示出了WT对Dnase1l3缺陷(1l3-/-)小鼠(两者均为EDTA 0小时)中的A<>A、G<>G、C<>C和T<>T片段百分比。竖直轴是样品中的片段百分比。水平轴对应于四个类别(其它类别,例如,A<>T,未示出)的WT和1l3-/-。P值通过曼-惠特尼U检验计算。1l3-/-的A<>A和G<>G的百分比增加(即,高于WT中),而C<>C的百分比显著减少,并且1l3-/-的T<>T的百分比减少(即,低于WT中)。此类变化与Dnase1l3偏好切割C一致,因为缺少Dnase1l3不会在C处切割,而具有其它碱基切割偏好的其它核酸酶仍然存在并且在那些其它碱基处切割。
图15示出了根据本公开的实施例的Dnase1l3缺陷样品的末端碱基含量与每片段大小的WT样品的比较。图15示出了DNASE1L3缺陷EDTA 0小时cfDNA中A末端1510(绿色)、G末端1520(橙色)、C末端1540(蓝色)和T末端1530(红色)的百分比与WT EDTA 0小时cfDNA(灰色)基线代表的比较。
在图15中,在Dnase1l3缺陷小鼠和WT小鼠之间比较EDTA 0小时样品中每个片段大小的A末端、G末端、C末端和T末端片段比例,所有片段大小的C末端片段中都有减少,这与发现C<>C片段减少的结果一致。A末端片段还表现出核小体周期性模式,其中峰值频率为约200bp和400bp。因此,在Dnase1l3缺陷小鼠中,A末端片段增加,尤其是在这些峰值处。T末端片段有对应的减少,特别是在这些峰值处。这种A末端片段的核小体周期性模式类似于先前在富含新鲜cfDNA的WT EDTA 6小时样品中观察到的模式(图10A)。因此,DFFB切割的结果将是具有周期性模式的A末端片段,所述A末端片段通常会被DNASE1L3快速转变为C末端。但是,因为DNASE1L3不存在,所以A末端片段增加。同样,因此,A末端成为优势物种,而不是C末端。
这些结果表明DNASE1L3产生C末端和T末端片段两者,其中更偏好C末端,因为C<>C片段百分比更显著减少。
因此,似乎DNASE1L3缺陷导致暴露新鲜cfDNA的曲线。在底物-酶-产物关系中,当酶有缺陷时,产物会减少并且底物会增加。因此,DNASE1L3缺陷cfDNA似乎已经揭示了其底物cfDNA曲线,这似乎是由DFFB创建的cfDNA曲线。这表明至少有一些由DNASE1L3进行的切割发生在循环血液中,而DFFB切割倾向于发生在细胞内。
通过使用cfDNA片段的两个末端更详细地查看片段类型,发现在Dnase1l3缺陷样品和富含新鲜cfDNA的WT EDTA 6小时样品中,仅A<>A、A<>G和A<>C片段表明这种核小体周期性模式。
图16A示出了根据本公开的实施例的Dnase1l3缺陷EDTA 0小时cfDNA中A<>A、A<>G和A<>C片段的百分比与WT EDTA 0小时cfDNA的基线代表(灰色)的比较。图16B示出了根据本公开的实施例的富含新鲜cfDNA的WT EDTA 6样品中A<>A、A<>G和A<>C片段的百分比与WTEDTA 0小时cfDNA的基线代表(灰色)的比较。数据1610针对Dnase1l3缺陷样品。两个图的灰色线对应于WT EDTA 0小时的不同批次。
这两种样品类型的片段之间存在许多明显差异。在Dnase1l3缺陷小鼠中,A<>A、A<>G和A<>C片段的周期性模式非常突出(图16A)。由于Dnase1l3缺陷小鼠中不存在DNASE1L3活性,因此cfDNA中的这种突出可能反映了对剩余活性细胞内核酸酶(尤其是DFFB)中核小体周期性切割的真正偏好。
另一方面,在新鲜cfDNA中看到的周期性模式减弱,这在A<>C片段中尤其明显(图16B)。由于与Dnase1l3缺陷小鼠相比,DNASE1L3活性在新鲜cfDNA的生成中保留,这种差异指示DNASE1L3将在产生A<>C片段中发挥作用,这可能是产生C<>C片段的中间步骤。这些结果还指示DNASE1L3通过在DFFB之后切割来减弱对DFFB核酸酶的优先切割。因此,可以推断DNASE1L3切割主要发生在DFFB切割的后续步骤中,并且DNASE1L3可能不仅发挥作用,而且实际上可能是在cfDNA中创建具有C末端优势的典型曲线的主导者(图4)。
IV.DNASE1对CFDNA的影响(使用肝素)
尽管已经展示了创建具有C末端优势的典型cfDNA片段所涉及的步骤,但还探讨了可以如何进一步消化cfDNA片段,使得可以构建cfDNA的稳态的全貌。尽管即使在<150bp的短片段中,C末端片段仍然是最普遍的,注意到典型cfDNA曲线中大小为约50-150bp和250bp的T末端片段的富集(图4)。这些峰值与和DNASE1L3偏好相关的C末端片段或和DFFB切割偏好相关的A末端片段不一致。根据片段末端与核酸酶偏好相关的理论,探讨了这些T末端是否可能与DNASE1偏好相关。
A.Dnase1缺失的影响
为了鉴定DNASE1的切割偏好,从Dnase1-/-、Dnase1+/-和WT小鼠中采集了全血、将一种类型的样品集中池中并且将每个池平均分配到管中,用于使用肝素温育0小时或6小时。使用肝素代替EDTA,因为已知肝素可以增强DNASE1活性,同时抑制DNASE1L3(Napirei,M.等人,(2005),《生物化学杂志(The Biochemical journal)》389,355-364)。肝素也被证明可以取代核小体。
图17A-17B示出了根据本公开的实施例的WT、Dnase1+/-和Dnase1-/-小鼠的在肝素中温育的cfDNA的大小曲线。提供了常规(图17A)和对数(图17B)标度。图17A示出了具有EDTA的血液6小时之后的cfDNA大小曲线(灰色)1710,以及WT(蓝色)1720、Dnase1+/-(绿色)1730和Dnase1-/-(红色)1740小鼠的用肝素处理6小时之后的血液的数据。发现在WT和Dnase1+/-小鼠中,肝素温育6小时导致短片段显著增加,并且166bp峰值减少并且失去核小体模式。在Dnase1-/-中没有发生大小变化,并且大小模式与来自EDTA血液的cfDNA基本上相同。
为了表明这种效应是由于Dnase1,可以将蓝色曲线1720(WT肝素6小时)与红色曲线1740(Dnase1-/-,是从具有Dnase1纯合敲除的小鼠采集的血浆)进行比较。当不存在Dnase1时,非常短的DNA分子没有增加。对于Dnase1+/-,在绿色曲线1730中仍然出现(尽管较少)非常短的杂合DNA分子,使得仅一个等位基因缺失了所述基因。对数图有助于示出较长片段的量的变化。
因此,实施例可以通过用肝素处理样品并将样品与WT大小分布进行比较来检测Dnase1中的病症(例如,缺失)。
还检查了这些样品的片段末端比例的差异。
图18A-18B示出了根据本公开的实施例的WT和Dnase1-/-小鼠的在肝素中温育的cfDNA的大小曲线和碱基含量。末端片段的数据是单端数据。
图18A示出了WT肝素6小时样品的A末端1810(绿色)、G末端1820(橙色)、C末端1840(蓝色)和T末端1830(红色)的百分比与其在肝素0小时中的基线代表(灰色)的比较。图18B示出了Dnase1-/-小鼠的肝素6小时cfDNA中的A末端1860(绿色)、G末端1870(橙色)、C末端1890(蓝色)和T末端1880(红色)的百分比与其在肝素0小时中的基线代表(灰色)的比较。
图19示出了根据本公开的实施例的Dnase1+/-小鼠的在肝素中温育的cfDNA的大小曲线和碱基含量。WT、Dnase1+/-、Dnase1-/-小鼠中的肝素效应。图19示出了6小时肝素温育之后Dnase1+/-cfDNA中具有A末端1910(绿色)、G末端1920(橙色)、C末端1940(蓝色)和T末端1930(红色)的cfDNA的百分比与其0小时温育的基线(灰色)的比较。
在WT和Dnase1+/-小鼠中在6小时肝素温育之后,大小为约50-150bp的片段中的T末端片段比例增加(图18A、图19)。相比之下,在Dnase1-/-小鼠中不存在此增加(图18B)。这些观察结果支持了假设,即DNASE1可能更倾向于产生T末端片段。通常,与Dnase1-/-相比,WT和Dnase1+/-的T末端碱基含量更高。另外,在WT、Dnase1+/-和Dnase1-/-小鼠中,6小时肝素温育之后,存在具有核小体周期性的长A末端片段。与EDTA类似,A末端片段的此类观察与由于血液样品中细胞的细胞死亡导致的cfDNA的增加一致。
图20示出了根据本公开的实施例的在0小时和6小时肝素样品的情况下的WT、Dnase1+/-和Dnase1-/-小鼠的cfDNA数量。以每ml基因组当量计的cfDNA浓度在竖直轴上,水平轴具有肝素温育的不同时间。如可以看出的,cfDNA的量随温育时间而增加。
组合所有三种基因型中cfDNA量的增加和有关肝素温育诱导细胞凋亡的文献(Manaster,J.等人,(1996),《英国血液学杂志(British Journal of Haematology)》94,48-52),来自新鲜凋亡的cfDNA的A末端DFFB签名的存在是一致的。增加的具有来自DFFB的新鲜A末端片段的cfDNA被快速消化为短T末端片段(由于WT小鼠中DNASE1的肝素增强),表明DNASE1更倾向于切割5'到T。
B.从核小体切割的片段的周期性
用EDTA、肝素和不同的温育时间分析了片段的周期性。结果与DNASE1倾向于切割T末端以及肝素破坏血浆中的核小体结构一致。
图21A示出了根据本公开的实施例的在EDTA0小时WT样品的情况下的A末端、G末端、C末端和T末端片段的cfDNA大小曲线。频率是在特定的终止碱基类型内测定的,例如,特定大小的G末端的每个频率值通过G末端片段的总数进行归一化。值得注意的是,在所有小鼠基因型(WT、Dnase1l3-/-、Dffb-/-、Dnase1+/-和Dnase1-/-)中,所有A末端、G末端、C末端和T末端片段类型在≤150bp的短片段中展示出10bp的频率周期性。图22A-22D示出了根据本公开的实施例的在EDTA 0小时样品情况下的Dffb-/-、Dnase1l3-/-、Dnase1+/-和Dnase1-/-小鼠的A末端、G末端、C末端和T末端片段的cfDNA大小曲线。在图22B中Dnase1l3-/-的峰值中的10bp周期性尤其突出。
除了所有cfDNA大小的C末端偏好外,没有与10bp周期片段相关的特定末端偏好。因此,单个特定核酸酶不太可能负责10bp周期性。事实上,10bp周期性的流行理论是10bp周期性是完整核小体内DNA的核酸酶消化的结果。这是根据以下的假设:限制核酸酶进入包裹在组蛋白周围的DNA与由于DNA螺旋的结构每圈10bp导致一条DNA链周期性暴露于另一条DNA链的综合效应(Klug,A.和Lutter,L.C.(1981),《核酸研究(Nucleic Acids Res)》9,4267-4283)。
图21B示出了根据本公开的实施例的在肝素6小时WT样品的情况下的A末端、G末端、C末端和T末端片段的cfDNA大小曲线。在破坏了血浆中的核小体结构的肝素模型中,在WT中,在6小时肝素温育之后,所有片段类型的10bp周期性都被消除。进一步地,T末端2130在小片段中增加。由于肝素破坏核小体结构而导致的T末端2130的增加与DNASE1在血浆中普遍存在(与在完整细胞中相反)并且偏好切割T末端一致。肝素温育之后大小为约50-150bp的T末端片段的此类变化可以用于检测DNASE1的遗传病症,例如,如果没有发生T末端片段的预期增加。
图23A示出了根据本公开的实施例的肝素6小时样品(红色线2310)与基线样品(EDTA0小时和6小时、肝素0小时)(灰色线2320)中CTCF区的片段末端密度的比较。灰色线2320来自三个经鉴定的样品。这三条线在定位0附近示出了一些不同,但在远离定位0的峰值中具有类似的周期性。
CTCF区的特殊之处在于核小体间距非常清晰。查看灰色线2320(EDTA和肝素,没有温育),有非常好的周期性,但在肝素存在的情况下(红色线2310),波模式减少,这会破坏核小体结构,使得切割可能发生在核小体DNA中通常相对难以接近的地方。因此,在CTCF区中的良好定相的核小体中,核小体内的片段末端随着WT中肝素6小时温育而增加。因此,破坏的核小体结构(作为肝素温育的结果)导致核小体内DNA被切割。
图23B-23C示出了根据本公开的实施例的WT的肝素0小时和6小时样品的CTCF区中的5'末端碱基代表。探讨了哪些片段类型将有助于上文所提及的核小体内片段。在WT肝素6小时中,对应于核小体内定位的T末端片段的周期性很明显(图23C)。同样,在WT肝素0小时(图23B)中具有平均约20%和低至约15%(在定位0处)的T末端片段2330增加到在具有在定位0处的低至20%和峰值为30%的T末端片段2380。这些结果共同支持肝素增强DNASE1并破坏核小体结构,从而允许具有T末端偏好的DNASE1进行核小体内切割。
图24A-24B示出了根据本公开的实施例的Dnase1-/-小鼠的肝素0小时和6小时样品的CTCF区中的5'末端碱基代表。Dnase1-/-小鼠中不存在(图24A-24B)WT的周期性影响和T末端片段增加(图23B-23C)。这可以在0小时T末端片段2430和6小时T末端片段2480中看到。因为DNASE1由于小鼠的Dnase1-/-遗传病症而不存在,所以由于肝素温育而包含核小体的片段不会被DNASE1在T末端处切割。因此,缺失周期性,并且6小时T末端片段2480的比例相对于0小时T末端片段2430减少,并且对应地A末端和G末端增加。
图25示出了重叠的图23A和23C以示出根据本公开的实施例的T末端片段峰值对应于肝素6小时中末端密度增加的核小体2510之间的核小体内区。线2511对应于EDTA 0小时。线2512对应于EDTA 6小时。线2513对应于肝素0小时。线2514对应于肝素6小时。
由于接头区已经被其它酶(C/G/A末端)切割,并且T切割酶是弱竞争者,因此与T末端相比,接头区仍然富含C/G末端。(细胞中的这种核小体间切割仍然由核小体的存在引导)。然而,一旦核小体在血浆中并暴露于肝素,结构就会被破坏,并且然后核小体内区可以被肝素增强的具有较大T末端偏好的DNASE1切割。
图23C中的其它碱基(即,不是T)在肝素(或EDTA)中温育时没有示出明显的周期性,因为C末端产生的DNASE1L3大部分时间占主导地位。DNASE1L3也可以进行核小体内切割,并且因此没有观察到非常明显的模式。在更高测序深度的情况下,可以有机会在其它末端中看到周期性模式,尤其是EDTA 6小时中的A末端—在图7B中略有暗示。
V.细胞和血浆中核酸酶的切割偏好
上述观察结果允许测定DFFB、DNASE1和DNASE1L3的碱基末端切割偏好,以及核酸酶是否在细胞内或在细胞外环境(如血浆)内普遍切割。
图26示出了根据本公开的实施例的cfDNA生成和消化的模型,其中示出核酸酶DFFB、DNASE1和DNASE1L3的切割偏好。DFFB生成新鲜cfDNA(即,通过在细胞内切割),其中切割优先用于A末端,从而产生富含A末端的cfDNA。DNASE1L3生成在典型终止曲线中看到的主要富含C末端的cfDNA。此类切割发生在细胞内和细胞外。在肝素和内源性蛋白酶的帮助下,DNASE1可以在细胞外环境(例如,血浆)中进一步将cfDNA消化成T末端片段。
图26示出了细胞中示出的使用DFFB(绿色剪刀2610)和DNASE1L3(蓝色剪刀2620)的凋亡细胞。图例示出了用于切割不同碱基的三种核酸酶的优先顺序。DFFB示出为仅在细胞中起作用。DNASE1L3示出为在细胞中并且也在血浆中起作用。含有肝素的DNASE1(红色剪刀2630)示出为在血浆中起作用。示出了带有终止碱基的所得片段,其中不同颜色用于对应的核酸酶。DNA分子在细胞中被切割之后变得更短,并且然后在血浆中被切割之后甚至更短。
根据关于不同小鼠模型中的cfDNA片段末端的此工作,可以拼凑出概述生成cfDNA的断裂过程的模型。在对在EDTA中温育全血之后自发产生的新释放cfDNA的分析中,已经证明新鲜的较长cfDNA富集A末端片段。具体地,A<>A、A<>G和A<>C片段在约200bp和400bp处表现出强烈的核小体周期性。当同样的实验模型应用于Dffb缺陷小鼠的全血时,没有看到长A末端片段富集。因此可以得出结论,即DFFB可能负责生成这些A末端片段。
此假设得到了发表的关于DFFB酶的文献的证实,所述DFFB酶在细胞凋亡期间的DNA断裂中起主要作用(Elmore,S.(2007),《毒理学病理学(Toxicologic pathology)》35,495-516;Larsen,B.D.和
Figure BDA0003775417990000251
C.S.(2017),《欧洲生物化学联合会杂志(The FEBSJournal)》284,1160-1170)。酶表征研究已经表明,DFFB在开放的核小体间DNA区产生钝性双链断裂,并且偏好A和G核苷酸(嘌呤)(Larsen,B.D.和
Figure BDA0003775417990000252
C.S.(2017),欧洲生物化学联合会杂志》284,1160-1170;Widlak,P.和Garrard,W.T.(2005),《细胞生物化学杂志(Journal of cellular biochemistry)》94,1078-1087;Widlak,P.等人,(2000),《细胞生物化学杂志》275,8226-8232)。这种仅在核小体间接头区处钝性双链切割的生物学将解释A<>A、A<>G和A<>C片段中的核小体模式,例如,如图16B所例示的。
在这项工作中,还证明了在温育前获得的血浆中的典型cfDNA在所有片段大小中主要以C为末端;这种C末端过度代表在整个基因组的多个不同区中是一致的。由于cfDNA的典型曲线与新鲜cfDNA如此不同,可以推断:1)一种或多种其它核酸酶(即,除DFFB之外)创建了此曲线;2)这种核酸酶或这些核酸酶在典型cfDNA中主导切割过程;以及3)此过程主要发生在(例如,从DFFB)生成新鲜A末端片段之后。
由于此C末端优势在Dnase1l3缺陷小鼠中丢失,认为负责产生这种C末端片段过度代表的一种核酸酶是DNASE1L3。虽然没有现有的酶学研究来研究DNASE1L3的特定核苷酸切割偏好,但已知DNASE1L3在没有蛋白水解帮助的情况下高效地将染色质切割到几乎不可检测的水平(Napirei,M.等人,(2009),《欧洲生物化学联合会杂志》276,1059-1073;Sisirak,V.等人(2016),《细胞》166,88-101)。所有片段大小中C末端片段的相当一致的丰度表明DNASE1L3可以有效地切割所有DNA,甚至是核小体内DNA。
DNASE1L3具有有趣的性质:它在内质网中表达,作为主要的血清核酸酶之一在细胞外分泌,并且在诱导细胞凋亡之后,它在其内质网靶向基序被切割之后转移到细胞核(Errami,Y.等人(2013),《生物化学杂志(The Journal of biological chemistry)》288,3460-3468;Napirei,M.等人,(2005),《生物化学杂志(The Biochemical journal)》389,355-364)。在其作为凋亡细胞内内切核酸酶的作用中,已表明DNASE1L3在DNA断裂中与DFFB协作(Errami,Y.等人(2013),《生物化学杂志》288,3460-3468;Koyama,R.等人,(2016),《基因到细胞(Genes to Cells)》21,1150-1163)。当比较新鲜cfDNA(例如,在图16B中)与Dnase1l3缺陷小鼠(例如,在图16A中)的片段末端曲线时,A末端片段,并且尤其是在A<>C片段的周期性明显衰减。怀疑此衰减是由于WT对Dnase1l3缺陷小鼠中在从细胞凋亡中产生新鲜断裂的DNA期间DNASE1L3和DFFB的共存细胞内活性所致。
作为血浆核酸酶,DNASE1L3将有助于消化在细胞凋亡之后逃脱吞噬作用的循环中的DNA。因此,DNASE1L3可能会在已经发生细胞内断裂之后对断裂的cfDNA发挥作用。在两步骤过程中,抑制第二步骤应该揭示第一步骤的通常短暂的结果(即,细胞内断裂)。Dnase1l3缺陷小鼠的血浆将抑制DNASE1L3作用的此第二步骤,并且暴露第一步骤的cfDNA曲线,即细胞凋亡引起的细胞内DNA断裂。这正是所发现的,其中Dnase1l3缺陷小鼠的cfDNA片段曲线(例如,图16A)与在新鲜产生的cfDNA(例如,图16B)中发现的非常类似。因此,血浆内的DNASE1L3消化将是导致典型稳态cfDNA的后续步骤。
虽然先前发现来自Dnase1缺陷小鼠的cfDNA的大小曲线似乎与WT小鼠的大小曲线没有显著差异(图17A),但已知DNASE1倾向于切割“裸”DNA,并且仅可以在体内蛋白水解帮助下切割染色质(Cheng,T.H.T.等人,(2018),《临床化学(Clin Chem)》64,406-408;Napirei,M.等人,(2009),《欧洲生物化学联合会杂志》276,1059-1073))。用肝素代替体内蛋白酶的功能来增强DNASE1活性,已经证明DNASE1倾向于将DNA切割成T末端片段(图18B与图18A比较)。在肝素温育的情况下,T末端片段的增加主要是亚核小体大小的(50-150bp),这表明DNASE1在产生<150bp的短片段中起作用(图18A)。知道DNASE1倾向于将裸DNA切割成T末端片段,可以从典型cfDNA曲线中推断出50-150bp和250-300bp范围内的T末端片段峰值可能大部分是裸的。
肝素温育和末端分析的使用也提供了对10bp周期性的起源的独特见解。由于每种片段类型都表现出10bp的周期性(图21A),表明没有一种特定的核酸酶对短片段中的10bp周期性完全负责。相反,证明了对于所有片段类型,当使用肝素时,10bp的周期性被消除(图21B)。除了增强DNASE1活性外,肝素还会破坏核小体结构(Villeponteau,B.(1992),《生物化学杂志》288(Pt 3),953-958),如图23A中示出的。虽然许多人已经假设10bp周期性来源于完整核小体结构内的DNA切割,但相信这项工作提供了支持性证据,表明在存在被破坏的核小体的情况下不会发生10bp周期性。
最近,Watanabe等人在Dnase1L3和Dffb缺陷小鼠中用对乙酰氨基酚用药过量和抗Fas抗体治疗诱导了体内肝细胞坏死和凋亡(Watanabe,T.等人,(2019),《生物化学与生物物理学研究通讯(Biochemical and biophysical research communications)》516,790-795)。虽然Watanabe等人声称已经证明cfDNA是由DNASE1L3和DFFB产生的,但其数据仅表明Dnase1l3和Dffb双敲除小鼠的肝细胞损伤后血清cfDNA似乎没有增加。即便如此,即使在野生型中,来自他们的方法的肝细胞损伤程度也存在很大差异,其中在其凋亡抗Fas抗体实验中,与cfDNA量的相关性低得惊人。除了这些不一致导致他们的基因敲除小鼠中诱导的细胞凋亡程度的不确定性之外,他们没有关于本研究中提供的片段末端的细节。
在本研究中,已经证明典型cfDNA片段可以通过以下两个主要步骤来创建:1)由DFFB、细胞内DNASE1L3和其它凋亡核酸酶进行的细胞内DNA断裂,以及2)由血清DNASE1L3进行细胞外DNA断裂。然后,DNASE1可以可能通过体内蛋白水解进一步将cfDNA降解为短T末端片段(比较图18A与18B之间T末端图的差异)。相信此第一模型包含了参与cfDNA生成的许多关键核酸酶,但所述模型在未来可以进一步完善。例如,其它潜在凋亡核酸酶包含内切核酸酶G、AIF、拓扑异构酶II和亲环蛋白,可能还有更多有待发现(Nagata,S.(2018),《免疫学年度评论(Annual review of immunology)》36,489-517;Samejima,K.和Earnshaw,W.C.(2005),《自然综述:分子细胞生物学(Nature Reviews:Molecular Cell Biology)》6,677-688;Yang,W.(2011),《生物物理学季评(Quarterly reviews of biophysics)》44,1-93)。对这些具有双敲除模型的核酸酶的进一步研究将进一步完善此模型,并且可以揭示具有G末端偏好的核酸酶。在这项工作中,明确地将不同核酸酶的作用与cfDNA片段末端曲线联系起来。
随着核酸酶生物学与cfDNA生理学之间建立了此联系,对cfDNA领域有许多重要且实际的意义。首先,具有病理后果的核酸酶生物学异常可以反映在异常的cfDNA曲线中(Al-Mayouf等人(2011),《自然遗传学(Nat Genet)》43,1186-1188;Jimenez-Alcazar,M.等人(2017),《科学(Science)》(纽约州纽约市)358,1202-1206;Ozcakar,Z.B.等人,(2013),《关节炎与风湿病(Arthritis Rheum 65,2183-2189)。其次,血浆末端基序分析是用于研究cfDNA生物学的强大方法,并且可以具有诊断应用。并且最后,当挖掘cfDNA以获得表观遗传和遗传信息时,如抗凝剂类型和血液分离时间延迟等分析前变量是需要牢记的重要混杂因素。下文描述了此类cfDNA曲线的示例应用。
另外,尽管提供了小鼠的数据,此类生物学功能对于所有具有血液或其它无细胞样品的生物体来说都是共同的。
VI.用于检测核酸酶遗传病症的方法
如上文所描述的,各种技术可以用于检测遗传病症,例如,与核酸酶相关的病症。遗传病症可以涉及对应于特定基因的核酸酶的突变(例如,缺失)。此类突变可以导致核酸酶不存在或以不正常方式发挥作用。当不存在遗传病症时,可以测定正常/参考cfDNA曲线(例如,通过片段末端和/或通过大小),并且可以对新样品进行比较。正常/参考cfDNA曲线可以根据其它受试者或同一受试者测定,但条件不同(例如,在较早时间采集的样品或具有不同温育量的样品)。在以下流程图中描述了此类方法的实例。针对一个流程图描述的技术适用于其它流程图,并且为简洁起见不再赘述。
A.使用温育随时间推移检测遗传病症
取决于是否存在遗传病症,样品的不同量的温育可以导致不同的cfDNA曲线。由于特定的cfDNA曲线行为可以取决于特定核酸酶是否正常表达和发挥作用,因此这种行为与正常相比发生了变化可以指示存在遗传病症。
图27示出了根据本公开的实施例的展示用于使用包含游离DNA的生物样品检测与核酸酶相关联的基因的遗传病症的方法2700的流程图。方法2700和本文中的其它方法可以用计算机系统完全或部分地执行,包含由计算机系统控制。作为实例,基因可以通过编码核酸酶、具有用于其转录的表观遗传标志物、使其RNA转录物存在、具有可变剪接的RNA或使其RNA可变地翻译而与核酸酶相关联。遗传病症可能仅在某些组织(例如,肿瘤组织)中。因此,遗传病症的检测可以用于确定癌症的水平。
在框2710处,接收通过对受试者的第一生物样品中的第一游离DNA片段进行测序获得的第一序列读段。本文提供了示例性生物样品,例如,血液、血浆、血清、尿液和唾液。测序可以以多种方式进行,例如,如本文所述。示例测序技术包含大规模平行测序或下一代测序、使用单分子测序和/或使用双链或单链DNA测序文库制备方案。技术人员将了解可以使用的各种测序技术。作为测序的一部分,所得序列读段中的一些序列读段可能与细胞核酸对应。
所述测序可以是如本文所描述的靶向测序。例如,生物样品可以富集来自如CTCF区、TSS区、Dnase超敏位点或Pol II区等特定区的DNA片段。富集可以包含使用捕获探针,所述捕获探针与例如通过参考基因组定义的基因组的一部分或整个基因组结合。作为另一个实例,富集可以使用引物来扩增(例如,通过PCR、滚环扩增或多重置换扩增(MDA))基因组的某些区。
可以使用抗凝剂处理第一生物样品并温育持续第一时间长度。温育可以在特定温度或更高温度下,例如,高于5摄氏度、10摄氏度、15摄氏度、20摄氏度、25摄氏度或30摄氏度。在较低温度下储存可能不算作温育时间的一部分。所述第一时间长度可以为零。在其它实施方案中,将第一生物样品温育持续第一时间长度而不使用抗凝剂进行处理。作为实例,抗凝剂可以是EDTA或肝素。EDTA可以帮助抑制血浆核酸酶(例如,DNASE1和DNASE1L3)以保存cfDNA以供分析。
在框2720处,第一序列读段用于测定以特定碱基结尾的第一游离DNA片段的第一量。特定碱基可以通过鉴定对应于片段末端的第一序列读段的末端来测定,对于配对的末端序列,可以使用读段的定向来测定特定碱基(例如,经测序的第一碱基)。可以使用特定片段末端,例如,5'末端或3'末端。可以针对包含特定碱基的特定末端基序来测定第一量。因此,第一量可以针对可能针对多于一个碱基的特定终止序列。第一量是参数值的实例。
在一些实施例中,第一量可以用于在片段的一个末端处具有第一末端基序(例如,第一碱基)并且在片段的另一个末端处具有第二末端基序(例如,第二碱基)的DNA片段。
在一些实施方案中,在测定第一量之前过滤第一游离DNA片段,例如,仅来自特定区(例如,CTCF)的片段可以用于测定第一量。可以将第一序列读段与参考基因组进行比对。然后可以鉴定第一组序列读段,所述第一组序列读段在参考基因组中的特定位置处或在与所述特定位置相距指定距离处结束,其中所述特定位置对应于参考基因组中的特定坐标或具有指定性质的基因组定位。第一量可以然后被测定为以特定碱基结尾的第一组序列读段的量。所述基因组定位可以是CTCF区的中心。作为其它实例,基因组定位可以与开放染色质区、Pol II区、TSS区和/或特定酶(例如,特定DNase)的超敏位点相关联。
在框2730处,接收通过对受试者的第二生物样品中的第二游离DNA片段进行测序获得的第二序列读段。可以用抗凝剂处理第二生物样品并且温育持续第二时间长度,所述第二时间长度大于所述第一时间长度。在其它实施方案中,第二生物样品可以在没有由抗凝剂进行处理的情况下温育。时间长度可以包含温度因子,例如,较高的温度可以作为加权因子乘以时间单位以获得时间长度。以此方式,由于在较高温度下温育,在样品/更短时间量中可以发生更大/相同量的细胞死亡。
在框2740处,第二序列读段用于测定以所述特定碱基结尾的第二游离DNA片段的第二量。在一些实施方案中,所述第一量和所述第二量是两个末端具有所述特定碱基的游离DNA片段的量。也可以针对包含特定碱基的特定末端基序来测定第二量。因此,第二量可以针对可能针对多于一个碱基的特定终止序列。在一些实施例中,第一量可以用于在片段的一个末端处具有第一末端基序(例如,第一碱基)并且在片段的另一个末端处具有第二末端基序(例如,第二碱基)的DNA片段。
所述量可以测定为百分比,在本文中也被称为碱基含量或频率。在其它实施方案中,所述量可以是没有使用(例如,除以)测得的DNA片段的量(例如,如通过序列读段测得的)直接归一化的原始量。相反,间接归一化可以通过使用相同大小的样品或通过对两个样品的相同数量的DNA片段进行测序而发生。
所述量可以与DNA片段的大小有关。例如,第一序列读段可以用于测定以特定碱基或更大末端基序结尾的第一游离DNA片段的第一大小。可以使用第一组具有特定大小的第一游离DNA片段来测定第一量。第二序列读段可以用于测定以特定碱基或更大末端基序结尾的第二游离DNA片段的第二大小。可以使用第二组具有特定大小的第二游离DNA片段来测定第二量。特定大小可以是大小范围。大小的示例使用可以在相对于图10B的图10A以及其它类似的图中找到。
在框2750处,将第一量与第二量进行比较以确定基因是否表现出受试者的遗传病症的分类。在一些实施方案中,将第一量与第二量进行比较包含测定第一量是否与第二量相差至少一个阈值量,并且可以包含当存在统计学上的显著差异或其它分离值时哪个量大于另一个量。因此,分类可以是当第一量在第二量的阈值内时存在遗传病症。
在一些实施例中,量的比较可以包含测定第一量与第二量之间的分离值。可以将分离值与参考值(例如,截止值)进行比较以确定分类。参考值可以是使用校准(参考)样品测定的校准值,所述校准(参考)样品具有已知的分类并且可以共同分析以测定参考值或校准函数(例如,当分类是连续变量时)。第一量和第二量是可以与参考/校准值进行比较的参数值的实例。此类技术可以用于本文的所有方法,并且在其它部分中提供了进一步细节。
分类可以是病症的水平或严重程度,例如,根据核酸酶的编码基因是否在两条染色体中丢失、仅在一条染色体中丢失、仅在某些组织中丢失或者突变减少了表达但并未消除核酸酶的存在。当突变(例如,缺失)仅在某些组织中或当突变在支持区内时,例如,在影响核酸酶表达水平的如miRNA等非编码区内时,可以发生核酸酶表达中的此类部分减少。遗传病症的不同水平或严重程度,作为相对于参考水平不同量的差异的结果。可以使用多个参考水平来测定差异分类。
在一些实例中,当第一量在第二量的阈值内时,分类可以是存在遗传病症,例如,如图10B所示。如图10B中示出的,任何终止碱基的片段的量都不存在显著差异,但是对于图10A中示出的WT,所有碱基都存在显著差异。在各个实施方案中,可以针对所有大小或针对特定大小集合来聚合量,或者可以聚合每个大小的差异。例如,200个碱基处的A末端片段的阈值量可以为约5%,因为针对WT的差异为约10%,并且针对Dffb-/-的差异在约一定百分比内。在图8A与图11C的比较中也可以发现具有特定末端基序的某些DNA片段的量缺少变化的实例,说明可以使用片段的两个末端。在图12A-12D和13与图4B和4C的比较中也可以发现具有特定末端基序的某些DNA片段的量缺少变化的另一个实例,说明分析可以具有针对特定类型区中的并且甚至在特定类型区内的特定定位处的DNA片段(序列读段)。
在其它示例中,当第二量比第一量小至少一个阈值时(例如,针对T末端),分类可以是存在遗传病症,例如,如图24A-24B所示,相比之下WT的针对T末端的第二量更大(图23B和23C)。在其它实例中,分类可以是当第二量更大时(例如,针对A末端)存在遗传病症,例如,如图24A-24B所示,相比之下WT的第一量和第二量大致相同,例如,如图23A和23B所示。
在其它实例中,WT和突变两者都可以导致具有特定末端基序的DNA片段的相同变化(例如,增加或减少),但变化的量可能不同。例如,图16A和16B示出在20bp处,WT的A<>G片段的增加比Dnase1l3-/-的A<>G片段的增加更大。
正在测试的遗传病症的类型可以提供用于确定是否存在病症的标准的类型,因为cfDNA行为将有所不同。
例如,遗传病症可以包含基因缺失。例如,基因可以是DFFB、DNASE1L3或DNASE1。核酸酶可以是切割细胞内DNA,例如,DFFB或DNASE1L3的核酸酶。核酸酶可以是切割细胞外DNA,例如,DNASE1或DNASE1L3的核酸酶。
B.使用参考值检测遗传病症
如上文所描述的,进行不同温育的样品之间特定碱基含量的差异或其它分离值(例如,是否小或大)可以用于对与核酸酶相关联的基因的遗传病症进行分类。可替代地,可以将测得的特定碱基的量与参考值进行比较。此类参考值可以对应于在健康受试者中测得的特定碱基的量。
例如,图12A(DFFB缺陷)的EDTA 0小时与图2C(WT)的EDTA 0小时的比较示出Dffb缺陷小鼠的随机区中的A末端含量减少。因此,可以将Dffb缺陷中测得的A末端含量与WT的参考值进行比较,其中当测得的量比参考值低统计学上显著的量时,测定病症。此类差异在没有任何温育的情况下就存在。CTCF区(图12B对图2E)、TSS区(图13A对图3B)和Pol II区(图13C对图3D)存在类似差异。G末端含量的减少也被认为是DFFB缺陷的结果。
在图15中可以看到另一个实例。DNASE1L3缺陷导致T末端片段和C末端片段减少,并且导致A末端片段和G末端片段增加。一个实施方案可以使用WT的参考T末端含量(例如,针对所有大小或仅特定大小范围)并确定测得的T末端含量是否在统计学上较低,这将提供DNASE1L3的病症的分类。图16A提供了此类差异的另外的实例;在此情况下,实例针对量针对两个末端的情况。图14B提供了另一个实例。
图28示出了根据本公开的实施例的展示用于使用包含游离DNA的生物样品检测与核酸酶相关联的基因的遗传病症的方法2800的流程图。用于方法2700的类似技术可以用于方法2800。作为实例,基因是DNASE1L3、DFFB或DNASE1。
在框2810处,接收通过对受试者的第一生物样品中的第一游离DNA片段进行测序获得的第一序列读段。测序可以以多种方式进行,例如,如本文所述。可以用抗凝剂处理第一生物样品并温育持续至少一个指定的时间量,例如,如相对于图18A针对图18B所描述的。用于框2710的类似技术可以用于框2810。
在框2820处,第一序列读段用于测定以特定碱基结尾的第一游离DNA片段的第一量。用于框2720的类似技术可以用于框2820。例如,某些大小的序列读段可以用于测定以特定碱基结尾的量。作为另一个实例,可以针对包含特定碱基的特定末端基序来测定所述量。
在框2830处,将第一量与参考值进行比较以确定基因是否表现出受试者的遗传病症的分类。在各个实施例中,将第一量与第二量进行比较可以包含:(1)测定第一量是否与参考值相差至少一个阈值量或差值是否小于所述阈值量;(2)测定第一量是否比参考值小至少一个阈值量;或(3)测定第一量是否比参考值大至少一个阈值量。第一量是参数值的实例,并且参考值可以是校准值或根据校准样品的校准值来测定。提供了其它方法的进一步细节,但同样适用于方法2800。
C.使用大小检测遗传病症
如上文所描述的,特定大小的片段可以用于测定具有特定碱基的序列读段的量。在一些实施方案中,可以在没有测定碱基含量或以特定碱基结尾的片段的其它测得的量的情况下使用大小。图17A和17B中示出了此类实例,所述实例包含用抗凝剂(例如,肝素)温育。患有遗传病症(在此情况下为不同水平的DNASE1缺陷)的受试者的特定大小的DNA片段的频率不同。例如,从50bp到150bp,WT(参考值)的频率高于Dnase1+/-受试者的频率,而Dnase1+/-受试者的频率又高于Dnase1-/-受试者的频率。在150-230bp大小范围内的DNA片段的频率存在相反的关系。
图29示出了根据本公开的实施例的展示用于使用包含游离DNA的生物样品检测与核酸酶相关联的基因的遗传病症的方法2900的流程图。用于方法2700和2800的类似技术可以用于方法2900。
在框2910处,接收通过对受试者的第一生物样品中的第一游离DNA片段进行测序获得的第一序列读段。可以用抗凝剂处理生物样品并温育持续至少一个指定的时间量。作为实例,抗凝剂可以是肝素。
在框2920处,第一序列读段可以用于测定具有特定大小的第一游离DNA片段的第一量,例如,如图17A和17B中所描述。特定大小可以是范围。例如,大小范围可以大于或小于大小截止值,例如,100bp、150bp或200bp。作为其它实例,大小范围可以通过最小和最大大小来指定,例如,50-80个、50-100个、50-150个、100-150个、100-200个、150-200个、150-230个、200-300个或300-400个碱基,以及其它范围。大小范围的宽度可以变化,例如,为50个、100个、150个或200个碱基。作为实例,第一量可以是原始计数或被归一化,例如,作为使用经分析的序列读段或DNA片段的总数的频率。
在框2930处,将第一量与参考值进行比较以确定基因是否表现出受试者的遗传病症的分类。可以在第一量与参考值之间测定分离值。在一个实例中,基因是DNASE1。方法2900的分类可以与针对其它方法所描述的分类相同,例如,为遗传病症的不同水平或严重程度,作为不同于相对于参考水平的差异的量的结果。可以使用多个参考水平来测定差异分类。
第一量是参数值的实例。参考值可以是根据一个或多个校准样品测定的校准数据点的一部分,所述校准样品对参数的给定测量结果(例如,对给定校准值)具有已知的功效。如稍后所描述的,可以使用血液凝结测试来测定已知的功效。
在方法2700-2900的各个实施例中,其中参考值可以根据不具有遗传病症的一个或多个参考样品来测定和/或根据具有遗传病症的一个或多个参考样品来测定。
VII.测定抗凝剂剂量的功效
使用抗凝剂对一些人进行治疗,例如,用于导致一些静脉中的血栓的深贪污血栓形成(DVT)。一种治疗是肝素。一些实施例可以确定抗凝剂是否起作用。作为实例,随着cfDNA数量的增加和/或DNASE1活性的增加和/或短片段的增加,可以看到肝素的作用。这可以从大小曲线或中值大小的变化或特定大小(例如,小于150bp)的片段的增加中看出。
A.使用片段末端处特定碱基的量测定功效
在一些实施例中,可以使用片段末端处特定碱基的量(例如,碱基含量)来测定功效。
图30示出了根据本公开的实施例的展示用于测定对患有血液病症的受试者进行的治疗的功效的方法3000的流程图。用于其它方法的类似技术可以用于方法3000。
在框3010处,接收通过对受试者的血液样品中的游离DNA片段进行测序获得的序列读段。所述血液样品是在受试者被施用第一剂量的抗凝剂之后获得的。抗凝剂可以是肝素。方法3000可以包含向受试者施用第一剂量的抗凝剂。
在接收序列读段之前,可以从受试者获得血液样品,并且可以对血液样品中的游离DNA片段进行测序以获得序列读段。
在框3020处,序列读段可以用于测定以特定碱基结尾的游离DNA片段的量。作为实例,所述量可以处于特定大小(例如,如图18B中示出的)或处于(或邻近)具有特定性质的特定坐标或基因组定位,例如,如图7B-7D中示出的。可以在图18A中看到抗凝剂对片段末端处的特定碱基的量的影响。例如,预计A末端片段的总量以及对于某些大小范围会增加。与其它方法一样,特定碱基可以是例如2聚体、3聚体等较大末端基序的一部分。进一步地,可以要求特定碱基位于DNA片段的两个末端上,或者一对特定的不同末端基序可以用于选择一组特定的DNA片段。
除了以特定碱基结尾的游离DNA片段的量之外,也可以测定和使用cfDNA的总量(即,对于任何末端),例如,如稍后在图32A中示出的。此方法和其它方法中测得的量可以归一化,例如,使用样品的性质(例如,样品的体积或质量)或使用满足特定标准的游离DNA片段或序列读段的另一个量(例如,样品中DNA片段的总量或具有不同末端基序的片段的数量)。
在框3030处,将所述量与参考值进行比较以确定治疗的功效的分类。可以以各种方式测定参考值,例如,如本文所描述的。例如,可以为如期望做出应答的患者测定预期量。量与参考值之间一定量的差异可以提供分类。如果差异足够小(例如,小于截止值),则可以将第一剂量归类为有效。如果差异大于截止值,则可以将第一剂量测定为无效。可以存在不同水平的无效剂量,例如,中等或大的无效,这可以通过使用一个或多个另外的截止值来测定。
如果量与参考值不匹配(例如,在参考值的特定范围内),则可以基于比较向受试者施用第二剂量的抗凝剂,所述第二剂量大于所述第一剂量。在其它实例中,第二剂量可以小于第一剂量,例如,如果量超过参考值。
量是参数值的实例。参考值可以是根据一个或多个校准样品测定的校准数据点的一部分,所述校准样品对参数的给定测量结果(例如,对给定校准值)具有已知的功效。如稍后所描述的,可以使用血液凝结测试来测定已知的功效。提供了其它方法和部分的进一步细节,但同样适用于方法3000。
作为一实例,参考值可以对应于先前在施用抗凝剂之前在受试者中执行的测量。来自先前测量的量的变化可以指示抗凝剂的剂量的功效。在另一个实施方案中,参考值可以对应于在健康受试者中测得的量。有效剂量可以是使所述量在健康受试者的参考值的阈值内的剂量。在又另一个实施方案中,参考值可以对应于在患有血液病症的受试者中测得的量(例如,如可以是先前在施用抗凝剂之前在受试者中测得的或在患有血液病症的另一个受试者中测得的)。
B.使用片段的大小测定功效
在一些实施例中,可以使用片段末端的大小来测定功效。
图31示出了根据本公开的实施例的展示用于测定对患有血液病症的受试者进行的治疗的功效的方法3100的流程图。用于其它方法的类似技术可以用于方法3100。
在框3110处,接收通过对受试者的血液样品中的游离DNA片段进行测序获得的序列读段。所述血液样品是在受试者被施用第一剂量的抗凝剂之后获得的。抗凝剂可以是肝素。方法3100可以包含向受试者施用第一剂量的抗凝剂。
在框3120处,序列读段可以用于测定具有特定大小的游离DNA片段的量。可以以与方法1100中的框1120类似的方式执行框3120。对大小的影响可以如图17A和17B中展示的。
在框3130处,将所述量与参考值进行比较以确定治疗的功效的分类。可以以与方法3000类似的方式测定参考值。第一量是参数值的实例,并且参考值可以是校准值或根据校准样品的校准值来测定。提供了其它方法的进一步细节,但同样适用于方法3100。
如果量与参考值不匹配(例如,在参考值的特定范围内),则可以基于比较向受试者施用第二剂量的抗凝剂,所述第二剂量大于所述第一剂量。在其它实例中,第二剂量可以小于第一剂量,例如,如果量超过参考值。
C.结果
图32A示出了根据本公开的实施例的用肝素治疗的四个病例的表3200。每列对应于不同患者。第一行标识了四位患者中每一位患者的止血障碍。ITP是免疫性血小板减少性紫癜:免疫介导的血小板破坏导致出血倾向。DVT是深静脉血栓形成。ATIII是抗凝血酶III缺陷:凝血级联中没有抗凝血酶III,对凝血酶、因子IXa、因子Xa等无抑制作用,从而导致血栓形成(凝块形成)倾向(即,DVT)。除了被给予肝素外,Seq4有未知的临床病例细节。
第二行列出了用于测定血浆样品中cfDNA的浓度的方法。第三行示出了以GE/ml为单位的游离DNA的浓度。第四行示出了根据3,844个未使用抗凝剂治疗且没有血液病症的参考样品测定的参考值。第五行和第六行示出了第二行中的测得值与第三行中的参考值的差异。可以看出有显著增加。最后一行示出了与游离DNA数量的平均值的显著偏差,这表明肝素的剂量正在影响游离DNA的量,从而导致显著增加。
如第五行和第六行中示出的,当肝素起到防止凝血的作用时,游离DNA的量显著增加。因此,DNA的总量可以用于测定剂量的功效。如下文所描述的,可以测定cfDNA的绝对或倍数减少并且与目标比较以确定当前剂量的功效和/或确定剂量应增加或减少多少。如果参数过高,则可以减少剂量以达到目标。
图32B-32C示出了根据本公开的实施例的为用肝素治疗的DVT患者在不同时间采集的两个样品的数据。不同的时间由妊娠的周和天指定。图32B-32C示出了受试者相对于参考的频率对大小的图。如可以在图32B-32C中看到的,受试者的大小分布向更小的大小变化,指示肝素的作用,与图17A一致。其它实施例可以使用其它抗凝剂,如华法林(Warfarin)或因子Xa抑制剂(例如,用于心房颤动)。
血液凝结测试可以用作使用特定剂量的抗凝剂的每个受试者的校准数据,以鉴定量或大小的哪些变化与量/大小的有效变化相关。例如,在被给予抗凝剂的一组患者(例如,DVT患者)中完成的相关性研究可以测定cfDNA的总量的倍数变化、具有特定末端基序的量的变化或者可能导致DVT凝块的最佳清除速度的大小曲线的变化。测得的变化(绝对或倍数)可以对应于与目标或测量性质(例如,最佳清除速度)相对应的校准值。量/大小的此值或值的范围可以是用于监测疗法的治疗的目标。可以允许受试者的血液在体外经历凝血,并且然后可以在体外以抗凝剂有效剂量滴定抗凝剂。可以在凝块溶解后测量样品中的cfDNA量/大小,并且这些值或一系列值可以作为受试者的治疗目标。例如,凝血测试可以鉴定受试者正在以适当的量凝血,并且对应的量/大小可以用作参考(校准)值,所述参考(校准)值可以用于对当前剂量的功效进行分类。
剂量可以因人而异,以实现有效的变化,这就是为什么此类技术可以是有利的,因为它们允许对产生的变化进行测量。此类片段大小或量的变化可以测量身体内的实际影响,而不是仅仅期望每个人对相同剂量的反应方式相同。
VIII.监测核酸酶的活性
一些实施例可以用于监测核酸酶,例如,DFFB、DNASE1和DNASE1L3的活性。此类活性可以来自内部核酸酶(即,作为身体的自然过程)和/或来自添加核酸酶,例如,DNASE1的结果。此类监测可以用于测定遗传病症的变化以获得治疗功效。例如,DNASE1可以用于治疗受试者。可以通过分析T末端片段百分比或大小来测量治疗效果。在一些实施例中,DNASE1(例如,外源添加的)可以用于治疗自身免疫病状,如SLE。根据对活性的测定,可以改变核酸酶的治疗剂量。
对异常核酸酶活性的测定(例如,高于或低于对应于正常/健康值的参考值)可以单独或与其它因素组合指示病理水平。病理可以是癌症。
A.向样品中添加DNASE1的效果
图33示出了根据本公开的实施例的针对不同DNASE1剂量的片段的不同末端的含量百分比对大小的图。碱基含量百分比在右侧竖直轴上,并且水平轴是每bp的大小。绿色线3311对应于A末端片段的频率。红色线3312对应于T末端片段的频率。蓝色线3313对应于C末端片段的频率。灰色线3314对应于G末端片段的频率。DNASE1在体外施用。
图33还示出了根据本公开的实施例的所有片段大小的频率图。频率在左竖直轴上。黄色线3305对应于所有片段的大小。为每个样品提供了以GE/ml为单位的浓度。这些图是针对1U/ml(单位每ml)、10U/ml和20U/ml三种不同剂量施用DNASE1的,在从受试者获得血浆之后,在体外将所述DNASE1添加到样品中。
T末端片段3312随DNASE1剂量增加。如图所示,红色线3312从左到右随更高剂量而增加。碱基含量(总计或每大小)对核酸酶活性的此依赖性可以允许将测试样品分类为具有特定活性。可以使用T末端的总量或在特定大小或大小范围内的特定量。本公开其它地方所描述的并且取决于核酸酶活性的特征中的任何特征可以用于(例如,某些大小或跨所有片段大小的其它碱基的含量)测量核酸酶活性,例如,使用在具有已知分类的其它样品中测定的参考值。
大小曲线3305也可以反映DNASE1活性。例如,较小DNA片段的增加可以示出DNASE1活性的增加。较小DNA片段的数量随DNASE1的更高剂量而增加,如可以在图中从左到右的进展中看到的,其中在最高剂量20U/ml的情况下有更多的小DNA片段。
来自这些图中的任何图的数据中的任何数据都可以用作参考值或与参考值进行比较。例如,可以针对剂量中的每个剂量测定特定大小范围(包含特定大小)的DNA片段的频率。然后,可以将新样品的测量结果与这些参考值中的每个参考值进行比较,以测定测试样品中活性的相对量。此类核酸酶活性分类可以是定性的(例如,低、中等或高)或定量的(特定数值)。由于这些样品对应于已知活性,因此它们可以充当用于测定测试样品中的活性的校准值。如果需要的话,可以使用插值或回归来估计测试样品中测得值的特定活性。
图34A示出了根据本公开的实施例的用DNASE1处理的血清的大小曲线(在9和6小时处)与未处理的和EDTA处理的比较。添加的DNASE1越多,向较小DNA片段的改变就越大。这也示出了大小对核酸酶活性的依赖性,与图33一致。图34B示出了在血浆中的类似效果。如图34A和34B所示,普通血浆是放入到普通(无抗凝剂)falcon管中并且在4℃下立即分离的血液。相比之下,允许血清样品在无抗凝剂的falcon管中凝结>1小时。
图35示出了根据本公开的实施例的6小时之后不同剂量的DNASE1对血清的影响。在图例中,“未处理(untx'd)”对应于“未处理(untreated)”。对大小的影响示出更明显的大小曲线向较小DNA片段的变化。图35示出当存在温育时,存在对大小的依赖性。由于效果大于没有温育(0小时)的情况,所以从每个样品获得的参考值的差异可能更大,由此允许更大的分类(区分)准确度,因为具有已知分类的样品的参考值的差异将更大。
B.尿液中的DNASE1活性
其它无细胞样品可以用于本文所描述的方法中的任何方法。作为实例,可以使用尿液。血浆中核酸酶的量可能与血液中核酸酶的量不同,从而导致不同的cfDNA曲线,变化大小。
图36示出了根据本公开的实施例的尿液样品中的频率对大小和碱基含量对大小。由于DNASE1必须切割T末端的偏好,T末端是最高的。与血液相比,尿液中的高T普遍性指示尿液中DNASE1的相对活性高于血液中DNASE1的相对活性。
图37示出了不同组织的DNASE1表达。与血细胞相比,肾表达相对较高。肾细胞的较高表达会在尿液中表现出来。这说明了DNASE1活性和T末端频率的相关性。
C.使用片段末端处特定碱基的量进行监测
因此,一些实施例可以使用末端处具有特定碱基的DNA片段的量来监测核酸酶活性。本文中的各种图示出了针对控诉一个或多个受试者的样品的此类监测的示例数据。
图38示出了根据本公开的实施例的展示用于使用包含游离DNA的生物样品监测核酸酶的活性的方法3800的流程图。方法3800的各方面可以以与本文所描述的其它方法类似的方式执行。
在框3810处,接收序列读段。可以通过对受试者的生物样品中的游离DNA片段进行测序获得序列读段。
在框3820处,使用序列读段测定以特定碱基结尾的游离DNA片段的量。与其它方法一样,特定碱基可以是例如2聚体、3聚体等较大末端基序的一部分。进一步地,可以要求特定碱基位于DNA片段的两个末端上,或者一对特定的不同末端基序可以用于选择一组特定的DNA片段。
量是参数值的实例。此方法和其它方法中测得的量可以归一化,例如,使用样品的性质(例如,样品的体积或质量)或使用满足特定标准的游离DNA片段或序列读段的另一个量(例如,样品中DNA片段的总量或具有不同末端基序的片段的数量)。可以对本文所描述的量(参数)中的任何量(参数)执行此类归一化。
在框3830处,将所述量与参考值进行比较以确定核酸酶的活性的分类。在一些实施例中,如果活性低于参考值,则可以将受试者分类为患有病症。在此类情况下,可以例如,如本文所描述的对受试者进行治疗。分类可以是数值分类值,可以将所述数值分类值与截止值进行比较以确定与核酸酶相关联的基因是否表现出受试者的遗传病症的第二分类。
参考值可以是使用校准(参考)样品测定的校准值,所述校准(参考)样品具有已知的分类并且可以共同分析以测定参考值或校准函数(例如,当分类是连续变量时)。例如,核酸酶活性可以是连续变量,并且可以通过将量输入到校准函数来测定量与参考值的比较,例如,如本文所描述的。
D.使用片段的大小进行监测
实施例还可以使用特定大小范围(包含特定大小值)的DNA片段的量来提供监测核酸酶活性。本文中的各种图示出了针对控诉一个或多个受试者的样品的此类监测的示例数据。
图39示出了根据本公开的实施例的展示用于使用包含游离DNA的生物样品监测核酸酶的活性的方法的流程图。方法3800的各方面可以以与本文所描述的其它方法类似的方式执行。
在框3910处,接收序列读段。可以通过对受试者的生物样品中的游离DNA片段进行测序获得序列读段。可以用抗凝剂处理生物样品并温育持续至少一个指定的时间量。
在框3920处,使用序列读段测定具有特定大小的游离DNA片段的量。与其它方法一样,特定碱基可以是例如2聚体、3聚体等较大末端基序的一部分。进一步地,可以要求特定碱基位于DNA片段的两个末端上,或者一对特定的不同末端基序可以用于选择一组特定的DNA片段。量是参数值的实例。
在框3930处,将所述量与参考值进行比较以确定核酸酶的活性的分类。在一些实施例中,如果活性低于参考值,则可以将受试者分类为患有病症。在此类情况下,可以例如,如本文所描述的对受试者进行治疗。
无论特定碱基的量或大小的使用,可以根据具有核酸酶的活性的第一分类的校准样品来测定参考值。如果所述量与参考值类似,则生物样品(以及所述生物样品所获得自的受试者)可以被鉴定为具有核酸酶活性的第一分类。作为实例,第一分类可以是正常的、增加的或减少的。
在各个实施例中,将所述量与参考值进行比较可以包含测定量是否与参考值相差至少一个阈值量。将所述量与参考值进行比较包含测定量是否比参考值小至少一个阈值量。将所述量与参考值进行比较包含测定量是否比参考值大至少一个阈值量。
作为实例,核酸酶可以是DFFB、DNASE1L3或DNASE1。生物样品可以从用核酸酶治疗的受试者中获得。所述方法可以进一步包含基于所述量与参考值的比较来测定治疗的功效的分类。
IX.分类的校准
如本文所描述的,可以使用具有已知分类的一个或多个参考(校准)样品来测定参考值。例如,可以已知参考样品是健康的或已知患有遗传病症。作为其它实例,对于给定校准值(例如,包含本文所描述的量中的任何量的参数),参考/校准样品可以具有已知或测得的核酸酶活性或功效值。
一个或多个校准值可以是一个或多个参考值或用于测定参考值。参考值可以对应于分类的特定数值。例如,可以通过插值或回归来分析校准数据点(校准值和测得的性质,如核酸酶活性或功效的水平)以测定校准函数(例如,线性函数)。然后,可以使用校准函数的点将数值分类测定为基于测得的量或其它参数的输入(例如,两个量之间或测得的量与参考值之间的分离值)的输入。此类技术可以应用于本文描述的方法中的任何方法。
对于方法3000和3100的实例,可以使用具有已知或测得的治疗功效分类的一个或多个参考样品来测定参考值。可以通过对一个或多个参考样品执行凝血测试来测定对所述一个或多个参考样品进行的治疗的功效。可以在一个或多个参考样品中测量对应的量(例如,框3020或3120中的量),由此提供包括参考/校准样品的两个测量结果的校准数据点。一个或多个参考样品可以是多个参考样品。可以例如通过插值或回归来测定校准函数,所述校准函数近似对应于多个参考样品的测得的功效和测得的量的校准数据点。
对于方法3800和3900的实例,可以使用具有已知或测得的核酸酶活性分类的一个或多个参考样品来测定参考值。可以如本文所描述的测量一个或多个参考样品的核酸酶活性,例如,cfDNA数量的荧光或分光光度测量,所述测量可以单独完成或在添加含核酸酶的样品之前、之后和/或与其一起实时完成。另一个实例是使用径向酶扩散方法。可以在一个或多个参考样品中测量对应的量(例如,框3820或3920中的量),由此提供包括参考/校准样品的两个测量结果的校准数据点。一个或多个参考样品可以是多个参考样品。可以例如通过插值或回归来测定校准函数,所述校准函数近似对应于多个参考样品的测得的活性和测得的量的校准数据点。
X.治疗
实施例可以进一步包含在测定受试者的分类之后治疗患者的遗传病症或低核酸酶活性(例如,低于阈值)。治疗后受试者的分类可以涉及或者可以不涉及在体内或在体外添加抗凝剂以增强cfDNA末端曲线。进一步地,当当前剂量具有低功效时,治疗可以被测定为当前治疗(例如,抗凝剂)的替代性方案,例如,可以使用增加剂量或不同的抗凝剂。可以根据测定的病症水平、任何经鉴定的突变和/或起源组织来提供治疗。例如,可以用特定药物或化学疗法靶向经鉴定的突变(例如,对于多态性实施方案)。起源组织可以用于指导手术或任何其它形式的治疗。并且,病症水平可以用于确定任何类型的治疗的积极程度,这也可以根据病症的水平来确定。可以通过化学疗法、药物、饮食、疗法和/或外科手术治疗病症(例如,癌症)。在一些实施例中,参数的值(例如,量或大小)超过参考值越多,治疗可能越积极。
治疗可以包含经尿道膀胱肿瘤切除术(TURBT)。此程序用于诊断、分期和治疗。在TURBT期间,外科医生将膀胱镜通过尿道插入到膀胱中。然后使用带有小丝环、激光或高能电的工具去除肿瘤。对于患有NMIBC的患者,TURBT可以用于治疗或消除癌症。另一种治疗可以包含根治性膀胱切除术和淋巴结清扫术。根治性膀胱切除术是清除整个膀胱以及可能的周围组织和器官。
治疗可以包含化学疗法,即使用药物破坏癌细胞,通常通过阻止癌细胞生长和分裂。药物可以包含例如但不限于用于膀胱内化疗的丝裂霉素-C(可作为仿制药)、吉西他滨(gemcitabine)(健择(Gemzar))和噻替派(thiotepa/Tepadina)。全身化疗可以涉及例如但不限于顺铂(cisplatin)、吉西他滨、甲氨蝶呤(methotrexate/Rheumatrex/Trexall)、长春碱(vinblastine/Velban)、多柔比星(doxorubicin)和顺铂。
在一些实施例中,治疗可以包含免疫疗法。免疫疗法可以包含阻断被称为PD-1的蛋白质的免疫检查点抑制剂。抑制剂可以包含但不限于阿特朱单抗(atezolizumab)(特森特里克(Tecentriq))、纳武单抗(nivolumab)(欧狄沃(Opdivo))、阿维鲁单抗(avelumab)(巴文西亚(Bavencio))、德瓦鲁单抗(durvalumab)(因芬齐(Imfinzi))和派姆单抗(pembrolizumab)(可瑞达(Keytruda))。
治疗实施例还可以包含靶向疗法。靶向疗法是靶向促成癌症生长和存活的癌症的特定基因和/或蛋白质的治疗方法。例如,厄达替尼(erdafitinib)是口服给予的药物,其被批准用于治疗患有具有FGFR3或FGFR2基因突变且癌细胞持续生长或扩散的局部晚期或转移性尿路上皮癌患者。
一些治疗可以包含放射疗法。放射疗法是使用高能X射线或其它粒子来破坏癌细胞。除了每个单独的治疗之外,可以使用本文所描述的这些治疗的组合。在一些实施例中,当参数的值超过阈值时,并且阈值本身就超过参考值,可以使用治疗的组合。参考文献中关于治疗的信息通过引用并入本文。
XI.实验模型和受试者细节
A.小鼠
Dnase1l3-/-小鼠的血浆DNA数据是从欧洲基因组-表型组档案(EGA;登录号EGAS00001003174)中检索的(Serpas,L.等人(2019),《美国国家科学院院刊》116,641-649)。以B6为背景的携带Dnase1的靶向等位基因的小鼠[Dnase1tm1.1(KOMP)Vlcg]和携带Dffb的靶向等位基因的小鼠[DffbC57BL/6N-Dffbem1Wtsi]两者从加州大学戴维斯分校的敲除小鼠项目储库(Knockout Mouse Project Repository)中获得。参见“关键资源表”以获得细节。所述小鼠维持在香港中文大学(CUHK)的实验动物中心中。所有实验程序均经CUHK的动物实验伦理委员会批准,并且按照国立卫生研究院(National Institutes of Health)制定的“实验动物护理和使用指南(Guide for the Care and Use of Laboratory Animals)”(第8版,2011)进行。13-17周的雄性和雌性小鼠用于实验。由于所述小鼠的血液样品被合并,因此没有对性和性别对结果的影响进行分析。
B.鼠类样品采集
通过心脏穿刺杀死小鼠并放血。汇集来自每只小鼠的血液并且立即均匀分配到实验条件中:EDTA温育0小时和EDTA温育6小时或者肝素温育0小时和肝素温育6小时。对于Dffb-/-实验,创建了5个血液池,每个血液池含有来自2-4只小鼠的血液,总共使用14只WT小鼠和14只Dffb-/-小鼠。对于Dnase1-/-实验,对来自总计12只WT小鼠、12只Dnase1+/-小鼠和11只Dnase1-/-小鼠的每个基因型创建一个池。EDTA管是商业购买的1.3mL K3E微管(莎斯特公司(Sarstedt))。肝素管是2mL微量离心管,其中每mL血液添加18IU肝素(西格玛-奥德里奇公司(Sigma-Aldrich)。在室温(12-20℃)在摇杆上完成温育。
在室温(RT)温育时间完成之后,通过双离心方案(在4℃下以1,600x g持续10分钟,然后将血浆在4℃下以16,000x g再离心10分钟)分离血液样品(Chiu,R.W.K.等人,(2001),《临床化学(Clinical Chemistry)》47,1607-1613)。采集所得血浆,在每个条件和时间点产生0.4-1.5mL血浆。
C.血浆DNA提取和文库制备
根据制造商的方案,用QIAamp循环核酸试剂盒(凯杰公司(Qiagen))提取血浆DNA。根据制造商的说明书,使用TruSeq DNA Nano文库制备试剂盒构建索引的血浆DNA文库。衔接子连接的DNA用8个PCR循环富集,并且在安捷伦4200TapeStation(安捷伦科技公司(Agilent Technologies)上使用用于质量控制和基于凝胶的大小测定的高灵敏度D1000ScreenTape系统(安捷伦科技公司)进行分析。在测序之前通过Qubit dsDNA高灵敏度测定试剂盒(赛默飞世尔科技公司(Thermo Fisher Scientific))对文库进行量化。
D.DNA测序和比对
在NextSeq 500平台(依诺米那公司(Illumina))上对多重DNA文库进行2×75bp配对末端读段测序。基于所述文库的六碱基索引序列将序列分配给其对应的样品。使用短寡核苷酸比对程序2(SOAP2),将来自小鼠血浆的配对末端读段与参考小鼠基因组(NCBI版本37/UCSC mm9;非重复序列掩蔽的)进行比对(Li,R.等人,(2009),《生物信息学(Bioinformatics)》25,1966-1967)。允许至多两个核苷酸错配。仅保留以正确定向与同一染色体比对并跨越<600bp的插入大小的配对末端读段用于下游分析。共享相同起始和结束基因组坐标的配对末端读段被视为PCR重复,并且从下游分析中丢弃。
图40总结了根据本公开的实施例的针对每个条件获得的非重复片段的数量。经比对末端的基因组坐标用于推断经测序的cfDNA的整个片段的大小。分别在Dnase1-/-和Dffb-/-小鼠数据中比对后观察到Dnase1和Dffb基因的缺失。
图41A-41B示出了WT(蓝色)、Dnase1-/-小鼠(A,红色)和Dffb-/-小鼠(池1-5)(B,红色)的血浆的经测序读段覆盖率。敲除区以黄色突出显示。图41A示出了两个拷贝的Dnase1基因缺失(Dnase1-/-)。WT位于第一行,并给示出了与Dnase1基因区比对的序列读段的常规计数。第二行示出了具有缺失的样品缺少序列读段。图41B示出了两个拷贝中Dffb基因的缺失。Dffb基因区中缺少读段计数由竖直条标记。
E.碱基末端分析和片段类型分析
CTCF和Pol II区是从小鼠ENCODE项目下载的(Shen,Y.等人(2012),《自然(Nature)》488,116-120)。参考小鼠基因组UCSC mm9中所有基因的转录起始位点(TSS)都是从UCSC下载的。通过BEDTools(v2.27.1)在整个基因组中随机选择了10,000个长度为10,000bp的随机非重叠区(Quinlan,A.R.和Hall,I.M.(2010),《生物信息学》26,841-842)。使用的窗口大小为±500bp。对于末端密度分析,CTCF区的±1500bp窗口的末端密度通过±3000bp CTCF区中的中值末端计数进行归一化。
对于随机、CTCF和Pol II区,仅使用定向在沃森链方向上的cfDNA片段进行分析。对于TSS区,仅使用定向在与TSS区一样的方向上的cfDNA片段。在这些区中的每个定位处,鉴定每个片段的5'末端的第一个核苷酸并计算碱基末端百分比(例如,A末端片段/所有片段,其中所有片段包含A末端、G末端、C末端和T末端片段)。为了按片段大小分析碱基末端百分比,每片段将cfDNA片段的两个5'末端(在相应的沃森链或克里克链上)计数,并计算每个大小的碱基末端百分比。
对于片段类型分析,基于每个片段的两个终止核苷酸将所述每个片段分配到一个片段类型。鉴定出两个末端的这些片段用其末端核苷酸以及在中间的符号<>表示,使得两个末端为A的片段将被指定为A<>A。所有片段包含A<>A、A<>G、A<>C、A<>T、C<>C、C<>G、C<>T、G<>G、G<>T、T<>T片段。计算每种片段类型的百分比(例如A<>A片段百分比=A<>A片段/所有片段)。
F.cfDNA量化
发现肝素对Qubit dsDNA高灵敏度测定(赛默飞世尔科技公司)有显著的正干扰(数据未示出)。相反,Bio-Rad QX200液滴数字PCR(ddPCR)平台用于所有cfDNA定量,因为ddPCR的反应分配可以改善DNA靶分子的肝素干扰(Dingle,T.C.等人,(2013),《临床化学》59,1670-1672)。将肝素样品稀释5倍,并且每个样品做至少四个孔。通过靶向转铁蛋白受体基因(Tfrc)的小鼠TaqMan拷贝数参考测定(赛默飞世尔科技公司)对小鼠cfDNA进行量化。
G.定量和统计分析
使用以Python和R语言编写的定制程序执行分析。除非另有说明,否则使用曼-惠特尼U检验计算统计差异。小于0.05的P值被认为具有统计学意义,并且所有概率都是双尾的。
XII.示例系统
图42展示了根据本公开的实施例的测量系统4200。如图所示的系统包含样品4205,如测定装置4210内的游离DNA分子,其中可以对样品4205执行测定4208。例如,样品4205可以与测定4208的试剂接触以提供物理特性4215的信号。测定装置的实例可以是包含测定物的探针和/或引物的流动池或液滴移动通过的管(其中液滴包含测定)。检测器4220检测来自样品的物理特性4215(例如,荧光强度、电压或电流)。检测器4220可以以一定间隔(例如,周期间隔)来进行测量,以便获得组成数据信号的数据点。在一个实施例中,模数转换器多次将来自检测器的模拟信号转换为数字形式。测定装置4210和检测器4220可以形成测定系统,例如,根据本文所描述的实施例执行测序的测序系统。将数据信号4225从检测器4220发送到逻辑系统4230。例如,数据信号4225可以用于测定DNA分子的参考基因组中的序列和/或位置。数据信号4225可以包含同时进行的各种测量,例如,不同颜色的荧光染料或样品4205的不同分子的不同电信号,并且因此数据信号4225可以对应于多个信号。数据信号4225可以存储在本地存储器4235、外部存储器4240或存储装置4245中。
逻辑系统4230可以是或可以包含计算机系统、ASIC、微处理器等。其还可以包含显示器(例如,监视器、LED显示器等)和用户输入装置(例如,鼠标、键盘、按钮等)或与之耦接。逻辑系统4230和其它组件可以是独立的或网络连接的计算机系统的一部分,或者逻辑系统可以直接连接到或并入在包含检测器4220和/或测定装置4210的装置(例如,测序装置)中。逻辑系统4230还可以包含在处理器4250中执行的软件。逻辑系统4230可以包含存储用于控制测量系统4200以执行本文所描述的任何方法的指令的计算机可读介质。例如,逻辑系统4230可以向包含测定装置4210的系统提供命令,使得测序或其它物理操作得以执行。可以按特定的顺序执行此类物理操作,例如,按特定的顺序添加和去除试剂。此类物理操作可以由机器人系统(例如,包含机械臂的机器人系统)执行,其可以用于获取样品并执行测定。
测量系统4200还可以包含治疗装置4260,所述治疗装置可以为受试者提供治疗。治疗装置4260可以确定治疗和/或用于执行治疗。此类治疗的实例可以包含外科手术、放射疗法、化学疗法、免疫疗法、靶向疗法、激素疗法和干细胞移植。逻辑系统4230可以连接到治疗装置4260,例如,以提供本文所描述方法的结果。治疗装置可以从其它装置接收输入,如成像装置和用户输入(例如,以控制治疗,如控制机器人系统)。
本文提到的计算机系统中的任何计算机系统都可以使用任何合适数量的子系统。在图43中,在计算机系统10中示出了此类子系统的实例。在一些实施例中,计算机系统包含单个计算机设备,其中子系统可以是计算机设备的组件。在其它实施例中,计算机系统可以包含具有内部组件的多个计算机设备,每个计算机设备是子系统。计算机系统可以包含台式计算机和膝上型计算机、平板电脑、移动电话和其它移动装置。
图43中示出的子系统通过系统总线75互连。示出了如打印机74、键盘78、一个或多个存储装置79、耦接到显示适配器82的监测器76(例如,显示屏,如LED)等另外的子系统以及其它子系统。可以通过本领域中已知的任何数量的如输入/输出(I/O)端口77(例如,USB、
Figure BDA0003775417990000461
)等装置来将耦接到I/O控制器71的外围设备和输入/输出(I/O)装置连接到计算机系统。例如,I/O端口77或外部接口81(例如,以太网、Wi-Fi等)可以用于将计算机系统10连接到如互联网等广域网、鼠标输入装置或扫描仪。通过系统总线75的互连允许中央处理器73与每个子系统通信并控制来自系统存储器72或一个或多个存储装置79(例如,如硬盘驱动器或光盘等固定盘)的多个指令的执行、以及子系统之间信息的交换。系统存储器72和/或一个或多个存储装置79可以体现为计算机可读介质。另一个子系统是数据收集装置85,如相机、麦克风、加速计等。本文提及的数据中的任何数据可以从一个组件输出到另一个组件且可以输出到用户。
计算机系统可以包含多个相同的组件或子系统,例如通过外部接口81、通过内部接口或通过可以从一个组件连接到另一个组件并且从一个组件去除的可移除存储装置连接在一起。在一些实施例中,计算机系统、子系统或设备可以通过网络进行通信。在此类情况下,一个计算机可以视为客户端且另一个计算机视为服务器,其中每一个可以是同一个计算机系统的一部分。客户端和服务器可以各自包含多个系统、子系统或组件。
实施例的各个方面可以使用硬件电路系统(例如,专用集成电路或现场可编程门阵列)和/或使用具有以模块化或集成方式的一般可编程处理器的计算机软件以控制逻辑的形式实施。如本文所使用的,处理器可以包含单核处理器、在同一集成芯片上的多核处理器或者在单个电路板上或联网的多个处理单元,以及专用硬件。基于本文提供的公开和教导,本领域的普通技术人员将了解和理解使用硬件以及硬件和软件的组合实施本发明的实施例的其它方式和/或方法。
本申请中描述的任何软件组件或功能可以实施为被处理器使用任何合适的计算机语言,例如Java、C、C++、C#、Objective-C、Swift或如Perl或Python等脚本语言使用例如,常规或面向对象的技术执行的软件代码。软件代码可以存储为计算机可读介质上用于存储和/或传输的一系列指令或命令。合适的非暂时性计算机可读介质可以包含随机存取存储器(RAM)、只读存储器(ROM)、如硬盘驱动器或软盘等磁介质或如光盘(CD)或DVD(数字通用光盘)或蓝光光盘等光学介质、闪存等。计算机可读介质可以是这类存储或传输装置的任何组合。
也可以使用适于通过符合各种协议的有线、光学和/或无线网络(包含因特网)传输的载波信号来编码和传输此类程序。因此,计算机可读介质可以使用以这类程序编码的数据信号产生。用程序代码编码的计算机可读介质可以与兼容装置打包在一起或与其它装置分开提供(例如,通过因特网下载)。任何此类计算机可读介质可以驻留在单个计算机产品(例如,硬盘驱动器、CD或整个计算机系统)上或内,并且可以存在于系统或网络内的不同计算机产品上或内。计算机系统可以包含监测器、打印机或用于向用户提供本文提及的任何结果的其它合适的显示器。
本文所述的任何方法可以用包含一个或多个处理器的计算机系统完全或部分地执行,所述计算机系统可以被配置成执行步骤。因此,实施例可以涉及被配置成执行本文所述的任何方法的步骤的计算机系统,所述计算机系统可能具有执行相应步骤或相应步骤组的不同组件。尽管以编号的步骤呈现,但本文的方法的步骤可以在同一时间或在不同时间或以不同顺序执行。另外,这些步骤的部分可以与其它方法的其它步骤的部分一起使用。而且,步骤的全部或部分可以是任选的。另外,任何方法的任何步骤可以用模块、单元、电路或用于执行这些步骤的系统的其它装置来执行。
在不脱离本发明的实施例的精神和范围的情况下,可以以任何合适的方式组合特定实施例的具体细节。然而,本发明的其它实施例可以涉及与每个单独方面或这些单独方面的特定组合相关的特定实施例。
出于说明和描述的目的,已经呈现了本公开的示例实施例的以上描述。以上描述并非旨在是详尽的或将本公开限制于所描述的精确形式,并且根据上述教导,许多修改和变化均是可能的。
除非特别指出相反的情况,否则对“一个/一种(a/an)”或“所述(the)”的叙述旨在表示“一个或多个”。除非特别指出相反的情况,否则“或”的使用旨在表示“包含性的或”而不是“排除性的或”。对“第一”组件的引用未必要求提供第二组件。此外,除非明确说明,否则对“第一”或“第二”组件的引用并不将所引用的组件限制到特定位置。术语“基于”旨在表示“至少部分地基于”。
本文所提及的所有专利、专利申请、出版物和描述出于所有目的通过引用整体并入本文。不承认任何内容为现有技术。
XIII.参考文献
Al-Mayouf,S.M.,Sunker,A.,Abdwani,R.,Abrawi,S.A.,Almurshedi,F.,Alhashmi,N.,Al Sonbul,A.,Sewairi,W.,Qari,A.,Abdallah,E.,et al.(2011).Loss-of-function variant in DNASE1L3 causes a familial form of systemic lupuserythematosus.Nat Genet 43,1186-1188.
Chan,K.C.A.,Woo,J.K.S.,King,A.,Zee,B.C.Y.,Lam,W.K.J.,Chan,S.L.,Chu,S.W.I.,Mak,C.,Tse,I.O.L.,Leung,S.Y.M.,et al.(2017).Analysis of PlasmaEpstein–Barr Virus DNA to Screen for Nasopharyngeal Cancer.New EnglandJournal of Medicine 377,513-522.
Chandrananda,D.,Thorne,N.P.,and Bahlo,M.(2015).High-resolutioncharacterization of sequence signatures due to non-random cleavage of cell-free DNA.BMC Medical Genomics 8,29.
Cheng,T.H.T.,Lui,K.O.,Peng,X.L.,Cheng,S.H.,Jiang,P.,Chan,K.C.A.,Chiu,R.W.K.,and Lo,Y.M.D.(2018).DNase1 Does Not Appear to Play a Major Role in theFragmentation of Plasma DNA in a Knockout Mouse Model.Clin Chem 64,406-408.
Chiu,R.W.K.,Chan,K.C.A.,Gao,Y.,Lau,V.Y.M.,Zheng,W.,Leung,T.Y.,Foo,C.H.F.,Xie,B.,Tsui,N.B.Y.,Lun,F.M.F.,et al.(2008).Noninvasive prenataldiagnosis of fetal chromosomal aneuploidy by massively parallel genomicsequencing of DNA in maternal plasma.Proceedings of the National Academy ofSciences of the United States of America 105,20458-20463.
Chiu,R.W.K.,Poon,L.L.M.,Lau,T.K.,Leung,T.N.,Wong,E.M.C.,and Lo,Y.M.D.(2001).Effects of Blood-Processing Protocols on Fetal and Total DNAQuantification in Maternal Plasma.Clinical Chemistry 47,1607-1613.
Dingle,T.C.,Sedlak,R.H.,Cook,L.,and Jerome,K.R.(2013).Tolerance ofdroplet-digital PCR vs real-time quantitative PCR to inhibitorysubstances.Clin Chem 59,1670-1672.
Elmore,S.(2007).Apoptosis:a review of programmed celldeath.Toxicologic pathology 35,495-516.
Errami,Y.,Naura,A.S.,Kim,H.,Ju,J.,Suzuki,Y.,El-Bahrawy,A.H.,Ghonim,M.A.,Hemeida,R.A.,Mansy,M.S.,Zhang,J.,et al.(2013).Apoptotic DNAfragmentation may be a cooperative activity between caspase-activateddeoxyribonuclease and the poly(ADP-ribose)
polymerase-regulated DNAS1L3,an endoplasmic reticulum-localizedendonuclease that translocates to the nucleus during apoptosis.The Journal ofbiological chemistry 288,3460-3468.
Ivanov,M.,Baranova,A.,Butler,T.,Spellman,P.,and Mileyko,V.(2015).Non-random fragmentation patterns in circulating cell-free DNA reflect epigeneticregulation.BMC genomics 16,S1.
Jimenez-Alcazar,M.,Rangaswamy,C.,Panda,R.,Bitterling,J.,Simsek,Y.J.,Long,A.T.,Bilyy,R.,Krenn,V.,Renne,C.,Renne,T.,et al.(2017).Host DNasesprevent vascular occlusion by neutrophil extracellular traps.Science(NewYork,NY)358,1202-1206.
Klug,A.,and Lutter,L.C.(1981).The helical periodicity of DNA on thenucleosome.Nucleic Acids Res 9,4267-4283.
Koyama,R.,Arai,T.,Kijima,M.,Sato,S.,Miura,S.,Yuasa,M.,Kitamura,D.,andMizuta,R.(2016).DNaseγ,DNase I and caspase-activated DNase cooperate todegrade dead cells.Genes to Cells 21,1150-1163.
Larsen,B.D.,and
Figure BDA0003775417990000491
C.S.(2017).The caspase-activated DNase:apoptosis and beyond.The FEBS Journal 284,1160-1170.
Li,R.,Yu,C.,Li,Y.,Lam,T.-W.,Yiu,S.-M.,Kristiansen,K.,and Wang,J.(2009).SOAP2:an improved ultrafast tool for short readalignment.Bioinformatics 25,1966-1967.
Lo,Y.M.D.,Chan,K.C.A.,Sun,H.,Chen,E.Z.,Jiang,P.,Lun,F.M.F.,Zheng,Y.W.,Leung,T.Y.,Lau,T.K.,Cantor,C.R.,et al.(2010).Maternal Plasma DNASequencing Reveals the Genome-Wide Genetic and Mutational Profile of theFetus.Science Translational Medicine 2,61ra91-61ra91.
Lo,Y.M.D.,Corbetta,N.,Chamberlain,P.F.,Rai,V.,Sargent,I.L.,Redman,C.W.G.,and Wainscoat,J.S.(1997).Presence of fetal DNA in maternal plasma andserum.The Lancet 350,485-487.
Manaster,J.,Chezar,J.,Shurtz-Swirski,R.,Shapiro,G.,Tendler,Y.,Kristal,B.,Shasha,S.M.,and Sela,S.(1996).Heparin induces apoptosis in humanperipheral blood neutrophils.British Journal of Haematology 94,48-52.
Nagata,S.(2018).Apoptosis and Clearance of Apoptotic Cells.Annualreview of immunology 36,489-517.
Napirei,M.,Ludwig,S.,Mezrhab,J.,
Figure BDA0003775417990000503
T.,and Mannherz,H.G.(2009).Murine serum nucleases–contrasting effects of plasmin and heparin on theactivities of DNase1 and DNase1-like 3(DNase1l3).The FEBS Journal 276,1059-1073.
Napirei,M.,Wulf,S.,Eulitz,D.,Mannherz,H.G.,and Kloeckl,T.(2005).Comparative characterization of rat deoxyribonuclease 1(Dnase1)and murinedeoxyribonuclease 1-like 3(Dnase1l3).The Biochemical journal 389,355-364.
Ozcakar,Z.B.,Foster,J.,2nd,Diaz-Horta,O.,Kasapcopur,O.,Fan,Y.S.,Yalcinkaya,F.,and Tekin,M.(2013).DNASE1L3 mutations in hypocomplementemicurticarial vasculitis syndrome.Arthritis Rheum 65,2183-2189.
Quinlan,A.R.,and Hall,I.M.(2010).BEDTools:a flexible suite ofutilities for comparing genomic features.Bioinformatics 26,841-842.
Samejima,K.,and Earnshaw,W.C.(2005).Trashing the genome:the role ofnucleases during apoptosis.Nature Reviews:Molecular Cell Biology 6,677-688.
Serpas,L.,Chan,R.W.Y.,Jiang,P.,Ni,M.,Sun,K.,Rashidfarrokhi,A.,Soni,C.,Sisirak,V.,Lee,W.-S.,Cheng,S.H.,et al.(2019).Dnase1l3 deletion causesaberrations in length and end-motif frequencies in plasma DNA.Proceedings ofthe National Academy of Sciences 116,641-649.
Shen,Y.,Yue,F.,McCleary,D.F.,Ye,Z.,Edsall,L.,Kuan,S.,Wagner,U.,Dixon,J.,Lee,L.,Lobanenkov,V.V.,et al.(2012).A map of the cis-regulatory sequencesin the mouse genome.Nature 488,116-120.
Sisirak,V.,Sally,B.,D’Agati,V.,Martinez-Ortiz,W.,
Figure BDA0003775417990000502
Z.B.,David,J.,Rashidfarrokhi,A.,Yeste,A.,Panea,C.,Chida,Asiya S.,et al.(2016).Digestionof Chromatin in Apoptotic Cell Microparticles Prevents Autoimmunity.Cell 166,88-101.
Snyder,M.W.,Kircher,M.,Hill,A.J.,Daza,R.M.,and Shendure,J.(2016).Cell-free DNA Comprises an In Vivo Nucleosome Footprint that Informs ItsTissues-Of-Origin.Cell 164,57-68.
Sun,K.,Jiang,P.,Cheng,S.H.,Cheng,T.H.T.,Wong,J.,Wong,V.W.S.,Ng,S.S.M.,Ma,B.B.Y.,Leung,T.Y.,Chan,S.L.,et al.(2019).Orientation-aware plasmacell-free DNA fragmentation analysis in open chromatin regions informs tissueof origin.Genome Research 29,418-427.
Villeponteau,B.(1992).Heparin increases chromatin accessibility bybinding the trypsin-sensitive basic residues in histones.The Biochemicaljournal 288(Pt 3),953-958.
Watanabe,T.,Takada,S.,and Mizuta,R.(2019).Cell-free DNA in bloodcirculation is generated by DNase1L3 and caspase-activated DNase.Biochemicaland biophysical research communications 516,790-795.
Widlak,P.,and Garrard,W.T.(2005).Discovery,regulation,and action ofthe major apoptotic nucleases DFF40/CAD and endonuclease G.Journal ofcellular biochemistry 94,1078-1087.
Widlak,P.,Li,P.,Wang,X.,and Garrard,W.T.(2000).Cleavage preferencesof the apoptotic endonuclease DFF40(caspase-activated DNase or nuclease)onnaked DNA and chromatin substrates.The Journal of biological chemistry 275,8226-8232.
Yang,W.(2011).Nucleases:diversity of structure,function andmechanism.Quarterly reviews of biophysics 44,1-93

Claims (57)

1.一种用于使用受试者的包含游离DNA的生物样品检测与核酸酶相关联的基因的遗传病症的方法,所述方法包括:
接收通过对所述受试者的所述生物样品中的游离DNA片段进行测序获得的序列读段;
使用所述序列读段测定以特定碱基结尾的游离DNA片段的第一量;以及
将所述第一量与参考值进行比较以确定所述基因是否表现出所述受试者的所述遗传病症的分类。
2.根据权利要求1所述的方法,其中所述生物样品用抗凝剂处理并温育持续至少一个指定的时间量。
3.一种用于使用包含游离DNA的生物样品检测与核酸酶相关联的基因的遗传病症的方法,所述方法包括:
接收通过对受试者的第一生物样品中的第一游离DNA片段进行测序获得的第一序列读段,所述第一生物样品用抗凝剂处理并温育持续第一时间长度;
使用所述第一序列读段测定以特定碱基结尾的所述第一游离DNA片段的第一量;
接收通过对所述受试者的第二生物样品中的第二游离DNA片段进行测序获得的第二序列读段,所述第二生物样品用所述抗凝剂处理并温育持续大于所述第一时间长度的第二时间长度;
使用所述第二序列读段测定以所述特定碱基结尾的所述第二游离DNA片段的第二量;以及
将所述第一量与所述第二量进行比较以确定所述基因是否表现出所述受试者的所述遗传病症的分类。
4.根据权利要求1和3中任一项所述的方法,其中所述第一量和所述第二量是针对包含所述特定碱基的特定末端基序测定的。
5.根据权利要求1和3中任一项所述的方法,其进一步包括:
将所述第一序列读段与参考基因组进行比对;以及
鉴定第一组序列读段,所述第一组序列读段在所述参考基因组中的特定位置处或在与所述特定位置相距指定距离处结束,所述特定位置对应于所述参考基因组中的特定坐标或具有指定性质的基因组定位,
其中所述第一量对应于以所述特定碱基结尾的所述第一组序列读段的量。
6.根据权利要求5所述的方法,其中所述基因组定位是CTCF区的中心。
7.根据权利要求3所述的方法,其中将所述第一量与所述第二量进行比较包含测定所述第一量是否与所述第二量相差至少一个阈值量。
8.根据权利要求3所述的方法,其中所述分类是当所述第一量在所述第二量的阈值内时存在所述遗传病症。
9.根据权利要求3所述的方法,其中所述分类是当所述第二量比所述第一量小至少一个阈值时存在所述遗传病症。
10.根据权利要求3所述的方法,其中所述第一量和所述第二量是两个末端具有所述特定碱基的游离DNA片段的量。
11.根据权利要求3所述的方法,其进一步包括:
使用所述第一序列读段测定以所述特定碱基结尾的所述第一游离DNA片段的第一大小;以及
使用所述第二序列读段测定以所述特定碱基结尾的所述第二游离DNA片段的第二大小,
其中所述第一量是使用第一组具有特定大小的所述第一游离DNA片段测定的,并且
其中所述第二量是使用第二组具有所述特定大小的所述第二游离DNA片段测定的。
12.根据权利要求11所述的方法,其中所述特定大小是大小范围。
13.根据权利要求3所述的方法,其中所述第一时间长度为零。
14.一种用于使用受试者的包含游离DNA的生物样品检测与核酸酶相关联的基因的遗传病症的方法,所述方法包括:
接收通过对所述受试者的所述生物样品中的第一游离DNA片段进行测序获得的第一序列读段,所述生物样品用抗凝剂处理并温育持续至少一个指定的时间量;
使用所述第一序列读段测定具有特定大小的所述第一游离DNA片段的第一量;以及
将所述第一量与参考值进行比较以确定所述基因是否表现出所述受试者的所述遗传病症的分类。
15.根据权利要求1和14中任一项所述的方法,其中将所述第一量与所述参考值进行比较包含测定所述第一量是否与所述参考值相差至少一个阈值量。
16.根据权利要求1和14中任一项所述的方法,其中将所述第一量与所述参考值进行比较包含测定所述第一量是否比所述参考值小至少一个阈值量。
17.根据权利要求1和14中任一项所述的方法,其中将所述第一量与所述参考值进行比较包含测定所述第一量是否比所述参考值大至少一个阈值量。
18.根据权利要求1和14中任一项所述的方法,其中所述参考值是根据不具有所述遗传病症的一个或多个参考样品测定的。
19.根据权利要求1和14中任一项所述的方法,其中所述参考值是根据具有所述遗传病症的一个或多个参考样品测定的。
20.根据权利要求3和14中任一项所述的方法,其中所述抗凝剂是肝素。
21.根据权利要求3和14中任一项所述的方法,其中所述抗凝剂是EDTA。
22.根据权利要求1、3和14中任一项所述的方法,其中所述基因是DNASE1。
23.根据权利要求1、3和14中任一项所述的方法,其中所述基因是DFFB。
24.根据权利要求1、3和14中任一项所述的方法,其中所述基因是DNASE1L3。
25.根据权利要求1、3和14中任一项所述的方法,其中所述核酸酶切割细胞内DNA。
26.根据权利要求1、3和14中任一项所述的方法,其中所述遗传病症包含所述基因的缺失。
27.根据权利要求1、3和14中任一项所述的方法,其中所述第一量被归一化。
28.根据权利要求1、3和14中任一项所述的方法,其进一步包括:
基于所述遗传病症的所述分类治疗所述受试者。
29.一种用于测定对患有血液病症的受试者进行的治疗的功效的方法,所述方法包括:
接收通过对所述受试者的血液样品中的游离DNA片段进行测序获得的序列读段,所述血液样品在所述受试者被施用第一剂量的抗凝剂之后获得;
使用所述序列读段测定以特定碱基结尾的所述游离DNA片段的量;以及
将所述量与参考值进行比较以确定所述治疗的所述功效的分类。
30.一种用于测定对患有血液病症的受试者进行的治疗的功效的方法,所述方法包括:
接收通过对所述受试者的血液样品中的游离DNA片段进行测序获得的序列读段,所述血液样品在所述受试者被施用第一剂量的抗凝剂之后获得;
使用所述序列读段测定具有特定大小的所述游离DNA片段的量;以及
将所述量与参考值进行比较以确定所述治疗的所述功效的分类。
31.根据权利要求29和30中任一项所述的方法,其进一步包括:
从所述受试者获得所述血液样品;以及
对所述血液样品中的所述游离DNA片段进行测序以获得所述序列读段。
32.根据权利要求29和30中任一项所述的方法,其进一步包括:
向所述受试者施用所述第一剂量的所述抗凝剂。
33.根据权利要求29和30中任一项所述的方法,其进一步包括:
基于所述比较向所述受试者施用第二剂量的所述抗凝剂,所述第二剂量大于所述第一剂量。
34.根据权利要求29和30中任一项所述的方法,其中所述抗凝剂是肝素。
35.根据权利要求29和30中任一项所述的方法,其中所述参考值是使用一个或多个参考样品测定的,所述一个或多个参考样品具有所述治疗的所述功效的已知或测得的分类。
36.根据权利要求35所述的方法,其进一步包括:
通过对所述一个或多个参考样品执行凝血测试来测量对所述一个或多个参考样品进行的所述治疗的所述功效;以及
测量所述一个或多个参考样品中的所述量。
37.根据权利要求36所述的方法,其中所述一个或多个参考样品是多个参考样品,所述方法进一步包括:
测定校准函数,所述校准函数近似对应于所述多个参考样品的测得的功效和测得的量的校准数据点。
38.一种用于使用受试者的包含游离DNA的生物样品监测核酸酶的活性的方法,所述方法包括:
接收通过对所述受试者的所述生物样品中的游离DNA片段进行测序获得的序列读段;
使用所述序列读段测定以特定碱基结尾的所述游离DNA片段的量;以及
将所述量与参考值进行比较以确定所述核酸酶的活性的第一分类。
39.一种用于使用受试者的包含游离DNA的生物样品监测核酸酶的活性的方法,所述方法包括:
接收通过对所述受试者的所述生物样品中的游离DNA片段进行测序获得的序列读段;
使用所述序列读段测定具有特定大小的所述游离DNA片段的量;以及
将所述量与参考值进行比较以确定所述核酸酶的活性的第一分类。
40.根据权利要求38或39中任一项所述的方法,其中所述第一分类是数值分类值,所述方法进一步包括:
将所述数值分类值与截止值进行比较以确定与所述核酸酶相关联的基因是否表现出所述受试者的遗传病症的第二分类。
41.根据权利要求38或39中任一项所述的方法,所述生物样品用抗凝剂处理并温育持续至少一个指定的时间量。
42.根据权利要求38或39中任一项所述的方法,其中所述参考值是根据具有所述核酸酶的所述活性的特定分类的校准样品测定的。
43.根据权利要求42所述的方法,其中所述特定分类是正常的、增加的或减少的。
44.根据权利要求38或39中任一项所述的方法,其中将所述量与所述参考值进行比较包含测定所述量是否与所述参考值相差至少一个阈值量。
45.根据权利要求38或39中任一项所述的方法,其中将所述量与所述参考值进行比较包含测定所述量是否比所述参考值小至少一个阈值量。
46.根据权利要求38或39中任一项所述的方法,其中将所述量与所述参考值进行比较包含测定所述量是否比所述参考值大至少一个阈值量。
47.根据权利要求38或39中任一项所述的方法,其中所述核酸酶是DFFB、DNASE1L3或DNASE1。
48.根据权利要求38或39中任一项所述的方法,其中在获得所述生物样品之前,已经为所述受试者提供了使用所述核酸酶的治疗。
49.根据权利要求48所述的方法,其进一步包括:
基于所述量与所述参考值的所述比较确定使用所述核酸酶进行的所述治疗的功效的第二分类。
50.根据权利要求38或39中任一项所述的方法,其中所述参考值是使用一个或多个参考样品测定的,所述一个或多个参考样品具有所述核酸酶的所述活性的已知或测得的分类。
51.根据权利要求50所述的方法,其进一步包括:
测量所述一个或多个参考样品的所述核酸酶的所述活性;以及
测量所述一个或多个参考样品中的所述量。
52.根据权利要求51所述的方法,其中所述一个或多个参考样品是多个参考样品,所述方法进一步包括:
测定校准函数,所述校准函数近似对应于所述多个参考样品的测得的活性和测得的量的校准数据点。
53.一种计算机产品,其包括非暂时性计算机可读介质,所述非暂时性计算机可读介质存储用于控制计算机系统执行根据前述权利要求中任一项所述的方法的多个指令。
54.一种系统,其包括;
根据权利要求53所述的计算机产品;以及
一个或多个处理器,所述一个或多个处理器用于执行存储在所述非暂时性计算机可读介质上的指令。
55.一种系统,其包括用于执行上述方法中的任何方法的装置。
56.一种系统,其包括一个或多个处理器,所述一个或多个处理器被配置成执行上述方法中的任何方法。
57.一种系统,其包括分别执行上述方法中的任何方法的步骤的模块。
CN202080095302.5A 2019-12-18 2020-12-18 游离dna断裂和核酸酶 Pending CN115298324A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962949867P 2019-12-18 2019-12-18
US62/949,867 2019-12-18
US202062958651P 2020-01-08 2020-01-08
US62/958,651 2020-01-08
PCT/CN2020/137516 WO2021121368A1 (en) 2019-12-18 2020-12-18 Cell-free dna fragmentation and nucleases

Publications (1)

Publication Number Publication Date
CN115298324A true CN115298324A (zh) 2022-11-04

Family

ID=76439147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080095302.5A Pending CN115298324A (zh) 2019-12-18 2020-12-18 游离dna断裂和核酸酶

Country Status (7)

Country Link
US (1) US20210189494A1 (zh)
EP (1) EP4077721A4 (zh)
JP (1) JP2023506560A (zh)
CN (1) CN115298324A (zh)
AU (1) AU2020409879A1 (zh)
CA (1) CA3161683A1 (zh)
WO (1) WO2021121368A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022214051A1 (en) * 2021-04-08 2022-10-13 The Chinese University Of Hong Kong Cell-free dna methylation and nuclease-mediated fragmentation

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2902401T3 (es) * 2012-05-21 2022-03-28 Sequenom Inc Métodos y procesos para la evaluación no invasiva de variaciones genéticas
US20170211143A1 (en) * 2014-07-25 2017-07-27 University Of Washington Methods of determining tissues and/or cell types giving rise to cell-free dna, and methods of identifying a disease or disorder using same
US9783799B2 (en) * 2014-10-24 2017-10-10 Abbott Molecular Inc. Enrichment of small nucleic acids
WO2017012592A1 (en) * 2015-07-23 2017-01-26 The Chinese University Of Hong Kong Analysis of fragmentation patterns of cell-free dna
US10095831B2 (en) * 2016-02-03 2018-10-09 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
CN109415727A (zh) * 2016-06-13 2019-03-01 格里尔公司 富集突变的无细胞核酸以供癌症检测的方法
WO2018031808A1 (en) * 2016-08-10 2018-02-15 Cirina, Inc. Methods of analyzing nucleic acid fragments
CN111954720A (zh) * 2018-01-12 2020-11-17 克拉雷特生物科学有限责任公司 用于分析核酸的方法和组合物

Also Published As

Publication number Publication date
EP4077721A4 (en) 2024-01-17
US20210189494A1 (en) 2021-06-24
AU2020409879A1 (en) 2022-06-23
EP4077721A1 (en) 2022-10-26
JP2023506560A (ja) 2023-02-16
WO2021121368A1 (en) 2021-06-24
CA3161683A1 (en) 2021-06-24

Similar Documents

Publication Publication Date Title
CN108026572B (zh) 游离dna的片段化模式的分析
US11193175B2 (en) Normalizing tumor mutation burden
US20220396838A1 (en) Cell-free dna methylation and nuclease-mediated fragmentation
US20210238668A1 (en) Biterminal dna fragment types in cell-free samples and uses thereof
WO2020192680A1 (en) Determining linear and circular forms of circulating nucleic acids
JP2020521216A (ja) 挿入および欠失を検出するための方法およびシステム
WO2022012504A1 (en) Nuclease-associated end signature analysis for cell-free nucleic acids
KR20210132139A (ko) 대립유전자 빈도에 기초한 기능 손실의 컴퓨터 모델링
WO2021121368A1 (en) Cell-free dna fragmentation and nucleases
KR20240049800A (ko) 비정상적으로 메틸화된 단편을 갖는 체세포 변이 동시 발생
WO2024114678A1 (en) Fragmentomics in urine and plasma
CN117500938A (zh) 无细胞dna甲基化和核酸酶介导的片段化
JP2024512372A (ja) オフターゲットポリヌクレオチド配列決定データに基づく腫瘍の存在の検出

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40082567

Country of ref document: HK