CN110998738A - Dna修复分析及其方法 - Google Patents

Dna修复分析及其方法 Download PDF

Info

Publication number
CN110998738A
CN110998738A CN201880051383.1A CN201880051383A CN110998738A CN 110998738 A CN110998738 A CN 110998738A CN 201880051383 A CN201880051383 A CN 201880051383A CN 110998738 A CN110998738 A CN 110998738A
Authority
CN
China
Prior art keywords
genes
data
dna
repair
dna damage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201880051383.1A
Other languages
English (en)
Inventor
派翠克·松吉翁
沙赫鲁兹·拉比扎德
卡伊万·尼亚兹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nant Holdings IP LLC
Original Assignee
Nant Holdings IP LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nant Holdings IP LLC filed Critical Nant Holdings IP LLC
Publication of CN110998738A publication Critical patent/CN110998738A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

预期了使用DNA修复基因的各种组学数据评估个体的健康相关参数的系统和方法。

Description

DNA修复分析及其方法
本申请要求2017年8月7日提交的序列号为62/542281的共同待定的美国临时申请的优先权。
技术领域
本发明的领域是组学数据的分析,因为其涉及DNA修复,特别涉及全球健康指标的生成,以及涉及抵消与年龄相关的病症和疾病的预防性和治疗性方法和组合物。
发明背景
以下描述包括对理解本发明可能有用的信息。不承认本文提供的任何信息是现有技术或与当前要求保护的发明有关,或明确或隐含引用的任何出版物为现有技术。
除了各种DNA聚合酶固有的易错性外,哺乳动物DNA经常受到化学、物理和代谢挑战,这些挑战可能引起化学变化、碱基丢失以及DNA单链和双链断裂。实际上,据估计人体内约1013个细胞的每一个每天都会引起成千上万的DNA损伤事件(例如,参见Lindahl T,Barnes DE(2000)Repair of endogenous DNA damage.Cold Spring Harb Symp QuantBiol 65:127–133)。本文所认定的所有出版物和专利申请都以相同的程度地通过引用并入,如同每个单独的出版物或专利申请均被明确地和单独地指出通过引用并入一样。当在并入的参考文献中术语的定义或使用与本文提供的术语的定义不一致或相反时,适用本文提供的术语的定义,而不适用参考文献中术语的定义。
尽管此类损伤通常会导致基因组不稳定性和细胞死亡,但许多此类病变也会对DNA造成结构损伤,并且可以改变或消除基本的细胞过程,例如DNA复制或转录。为了消除DNA损伤的有害影响,细胞具有各种DNA修复系统,包括碱基切除修复、错配修复、核苷酸切除修复和双链断裂修复,这包括同源重组和非同源末端连接。
先前关于在DNA修复基因方面具有缺陷的动物的实验数据通常显示出寿命缩短和癌症发病率增加。例如,缺乏显性NHEJ(非同源末端连接)途径和端粒维持机制的小鼠容易出现淋巴瘤和感染,并且寿命通常比野生型小鼠更短。以类似的方式,缺乏使DNA螺旋解旋的关键修复和转录蛋白的小鼠通常会提前出现与年龄相关的疾病,并缩短寿命。但是,DNA修复缺陷的影响不容易预测:缺乏NER途径的小鼠倾向于出现寿命缩短,而无相应地更高的突变率。关于癌症,各种已知的DNA修复基因突变与增加的癌症风险有关。例如,遗传性非息肉病性结直肠癌(HNPCC)与DNA错配修复途径中的特定突变密切相关,而BRCA1和BRCA2在乳腺癌中与大量DNA修复途径相关,特别是与NHEJ和同源重组相关。最近,DNA修复基因的突变也与癌症转移有关(参见,例如Radiation Research 181,111–130(2014))。然而,对于可用于预测特定DNA修复途径的活性增加或降低的效果的DNA修复基因,不存在可辨别的模式。
因此,尽管已知许多关于DNA修复基因和途径的实验细节,但是在评估健康和治疗建议时仍缺乏系统的理解和对DNA修复基因和途径的利用。
发明内容
本发明的主题提供了系统和方法,其中使用针对患者样品的各种DNA修复基因的多个组学数据以得到一个或多于一个健康相关的参数。例如,优选的组学数据包括DNA序列数据、RNA序列数据,特别是转录强度和/或蛋白质活性或蛋白质数量,而特别优选的健康相关的参数包括健康状态、错误状态和治疗建议。此外,各种DNA修复基因的表达水平(转录强度)可用于评估DNA修复系统的实时状态,以指出总体健康状况、DNA损伤(由于环境因素或药物干预)的存在和/或严重程度,并因此可以用于监测对治疗的响应或预测疾病的复发。
在本发明的一个方面,发明人预期了一种分析组学数据的方法,该方法包括获得多个DNA损伤修复基因的组学数据的步骤,其中组学数据包括DNA序列数据、RNA序列数据、转录强度、和蛋白质活性或数量中的至少两种。在另一个步骤中,随后将组学数据与健康状态、组学错误状态、年龄、疾病、预防性建议和/或治疗性建议相关联。在期望的情况下,预期的方法可以进一步包括根据组学数据计算得分从而获得健康得分的步骤。
关于DNA序列数据,预期该数据可包括突变数据、拷贝数数据重复、杂合性数据的丢失和/或表观遗传状态,而RNA序列数据可包括mRNA序列数据和剪接变体数据,该RNA序列数据可以从实体组织、血细胞和/或循环无细胞RNA中获得。此外,通常优选将转录强度表示为损伤修复基因的转录物/百万个转录物,和/或使用质谱法(例如,使用选择性反应监测方法)确定蛋白质活性或数量。
健康状态通常可以包括健康状态、诊断患有与年龄相关的疾病和诊断患有癌症。预期的预防性建议将包括用调节多个DNA损伤修复基因中至少一个的表达的试剂治疗个体的建议,而治疗性建议可包括用DNA损伤剂治疗患者的建议。合适的DNA损伤修复基因将包括碱基切除修复基因、错配修复基因、核苷酸切除修复基因、同源重组基因和非同源末端连接基因中的一种或多于一种,并且示例性的DNA损伤修复基因列在下面的表1至表3中。
将组学数据与状态相关联的预期步骤可以包括组学数据中的至少一个的加权得分,并且还预期这种方法可以进一步包括将组学错误状态与阈值进行比较从而确定风险得分的步骤。
因此,从不同的角度来看,发明人还预期了一种计算健康指标的方法,该方法包括获得多个DNA损伤修复基因的组学数据的步骤,其中组学数据包括DNA序列数据、RNA序列数据、转录强度和蛋白质活性或数量中的至少两种。然后将由此确定的组学数据用于生成指示个人健康的健康复合得分。
如上所述,预期的方法还可以包括将复合得分与阈值进行比较从而确定治疗选项的步骤。例如,治疗选项可以是复合得分低于阈值的预防性治疗,治疗选项可以使用调节多个DNA损伤修复基因中至少一个的表达的药物,或者治疗选项可以使用引起DNA损伤的药物。
在本发明主题的另一个方面,发明人还预期了一种治疗个体的方法,该方法包括获得多个DNA损伤修复基因的组学数据的步骤,其中组学数据包括DNA序列数据、RNA序列数据、转录强度和蛋白质活性或数量中的至少两种,以及鉴定至少一个DNA损伤修复基因相对于相应的健康对照为失调的其他步骤。在另一个步骤中,施用抵消至少一个失调的DNA损伤修复基因的试剂。
最典型地,DNA序列数据选自突变数据、拷贝数数据重复、杂合性数据的丢失和/或表观遗传状态,而RNA序列数据可包括mRNA序列数据和剪接变体数据。如所指出的,RNA序列数据可以从实体组织、血细胞和/或循环无细胞RNA中获得。最典型地,转录强度表示为损伤修复基因的转录物/百万个转录物,和/或使用质谱法确定蛋白质活性或数量。关于DNA损伤修复基因,预期DNA损伤修复基因为碱基切除修复基因、错配修复基因、核苷酸切除修复基因、同源重组基因和/或非同源末端连接基因中的一种或多于一种。例如,表1、表2和表3中列出了合适的DNA损伤修复基因。
因此,发明人还预期了一种针对对象进行测试的方法,该方法包括从对象获得血液样品的步骤,以及使用血液样品以获得多个DNA损伤修复基因的组学数据的另一个步骤,其中组学数据包括DNA序列数据、RNA序列数据、转录强度和蛋白质活性或数量中的至少两种。最优选地,从血液样品的无细胞部分和/或血液样品的含细胞部分获得组学数据。在预期方法的另一个步骤中,在血液样品中鉴定至少一个DNA损伤修复基因相对于相应的健康对照为失调。
最典型地,RNA序列数据选自mRNA序列数据和剪接变体数据,且RNA序列数据可以从实体组织、血细胞和/或循环无细胞RNA中获得。转录强度优选表示为损伤修复基因的转录物/百万个转录物。如上所述,优选的DNA损伤修复基因选自碱基切除修复基因、错配修复基因、核苷酸切除修复基因、同源重组基因和非同源末端连接基因。例如,示例性的DNA损伤修复基因包括表1、表2和表3中列出的那些。
由以下优选实施方案的详细描述以及附图,本发明主题的各种目的、特征、方面和优点将变得更加明显,在附图中相同的数字表示相同的组件。
附图说明
图1是DNA损伤、产生的病变和抵消这种损伤的修复途径的各种模式的示例性说明。
具体实施方式
发明人现已发现,可以使用与DNA修复相关的每个基因的一种或多于一种组学数据来创建用于所有DNA修复基因的库或参考数据库,并且当组学数据与一种或多于一种健康参数相关联时,这种库特别有用。当定量DNA损伤修复基因的表达水平和/或当检测到突变(特别是影响DNA修复的突变),且当这种数量和检测到的突变与特定的健康状态相关联时,这种库或参考数据库可能特别有用。
从不同的角度来看,发明人预期可以鉴定来自DNA修复相关基因的组学数据的特征,该特征是患者内错误状态所特有的,其进而可以指示一种或多于一种健康相关的病症。同样,即使在患病组织中可以观察到实际损伤之前,这些特征也可以预测DNA损伤。如将容易理解的,特征可以被确定一次(例如,在疾病的迹象或症状明显之前的常规访视期间),或对单个患者随时间跟踪,这在通常评估健康、或监测疾病或治疗的情况下特别有用。
尽管传统的DNA修复研究通常集中在单个DNA修复途径中相关的特定基因的表达存在或表达强度上,但发明人现在预期这种分析不足以获得相对于健康状况或可能的治疗结果具有预测或甚至分析能力的指标。为此,发明人发现不仅可以分析DNA修复基因的存在与否,而且全面的组学分析将考虑多个基因的多个方面。更具体地,发明人预期库或参考数据库不仅对DNA修复相关基因的DNA序列数据进行分类,而且还对多个DNA修复相关基因的相应的RNA序列数据、相应的转录强度、以及相应的蛋白质活性和/或数量进行分类,从而提供DNA修复活性的动态图像。
有利地,特别是在将DNA修复相关基因的预期特征(例如,一个或多于一个DNA修复相关基因的表达水平)与来自患病组织的组学数据相组合的情况下,可以将患病组织中的突变模式与特征相关联,以确认治疗以及预测治疗结果。此外,在DNA修复相关基因的预期特征包括针对DNA修复相关基因中的基因损伤的分析的情况下,由于缺乏有效的修复系统,这种突变损伤可以预测肿瘤基因组中的高频突变。
因此,DNA序列数据将不仅包括与DNA修复相关的基因的存在或不存在,而且还考虑到修复相关基因突变情况下的突变数据、拷贝数(例如,以鉴定重复、等位基因的缺失或杂合性),甚至表观遗传状态(例如,甲基化、组蛋白磷酸化、核小体定位等)。关于RNA序列数据,应注意,预期的RNA序列数据包括mRNA序列数据、剪接变体数据、聚腺苷酸化信息等。此外,通常优选RNA序列数据还包括转录强度的度量(例如,损伤修复基因的转录物数量/百万个总转录物、损伤修复基因转录物数量/肌动蛋白或其他看家基因RNA的转录物数量等)。应该注意的是,这种转录强度信息在随时间测量转录强度以检测特定类型的DNA损伤的增加时是特别有用的。类似地,通常优选地,预期的分析还可以包括一种或多于一种度量,该度量可以量化与DNA修复相关的特定基因的蛋白质活性和/或蛋白质数量。例如,可以使用已知的酶测定法和/或各种质谱法,特别是选择的反应监测方法例如多反应监测和平行反应监测,来确定合适的蛋白质活性或数量。
当然,应该注意的是,可以以多种方式和多种来源获得组学数据,并且特别优选的来源材料包括全血和其含细胞和无细胞的部分、以及来自个体的患病和/或健康器官的组织活检。例如,DNA和RNA可以从实体组织、血细胞和/或从循环无细胞RNA库中获得。在其他实例中,DNA、RNA和/或蛋白质可从组织活检(例如,新鲜的、冷冻的或FFPE)中获得,其可与相应的健康组织的样品一起收集。在其他优选的方面,组学数据也可以由单细胞测序获得。此外并且如前所述的,组学数据可以从多于一个组织或来源并在多个时间点获得。例如,组学数据可以最初从患病组织的活检材料和相同患者的其他未患病样品(例如,皮肤、血液等)中获得。替代地或另外地,组学数据可以最初单独地或与来自健康和/或患病组织的组学数据组合地从抽血或其他生物流体的循环核酸(特别是cfRNA(循环无细胞RNA))中获得。
有利地,应该注意的是,组学数据也可以在治疗(甚至诊断)之前、治疗期间和/或治疗之后的时间点获得。类似地,组学数据可以在暴露于特定环境之前或之后(例如,进入化学或放射学污染的区域之前)或暴露于特定DNA损伤条件(例如,日照、RF暴露等)之前或之后获得。如将容易理解的,重复获取组学数据将允许鉴定触发或维持DNA损伤反应的趋势,这进而具体地指示细胞应激的类型和严重性。
此外,预期与DNA修复相关的基因的组学数据可以与对患病组织特异性的非修复相关基因的组学数据并行(或在其他时间)获得。例如,常规核酸分析将通常仅鉴定肿瘤组织相对于正常组织的突变。相反,预期的分析可以包括与DNA修复相关的基因的组学数据以及对患病组织具有特异性的非修复相关基因的组学数据(基因表达中的肿瘤特异性突变或肿瘤特异性改变)。当将非修复相关基因的组学数据用于途径分析时,这种分析特别有用,因为这种组合的数据不仅可以鉴定与DNA修复相关的基因的活性和状态,还可以鉴定在DNA修复背景下相关的生理活性。例如,途径分析可以揭示当与DNA修复相关的基因的活性增加时,激活某些途径(例如,细胞凋亡或其他与细胞死亡相关的途径),这可以指示治疗成功。另一方面,当与DNA修复相关的基因的活性增加时,可以激活其他途径(例如,与EMT相关的途径),这可以指示潜在的治疗失败。因此,预期的组合分析将在细胞应激和DNA修复的背景下增加细胞的其他功能性信息。
还应该容易理解的是,组学数据的类型将有相当大的变化,并且将通常取决于所使用样品的类型、组学参数(例如,基因组学数据、转录组学数据、蛋白质组学数据等)、和/或所需的组学数据特性(例如,突变信息、转录强度、蛋白质活性、途径活性等)。因此,合适的组学数据包括作为原始数据(例如,FASTQ)、差异数据(例如,在BAMBAM分析之后的)、各种经处理的数据(例如,VCF格式),甚至使用途径分析(例如,使用PARADIGM)进行分析后的数据。
因此,并且从不同的角度来看,应该理解的是,关于针对与DNA修复相关的多个基因的组学分析,库将提供关于DNA修复相关基因和途径的完整性和/或活性的详细见解,从而允许对基因组的总体突变状态进行定量分析,特别是对患者或其他个体中DNA修复机制的突变和功能性状态进行定量分析。
关于与DNA修复相关的预期基因,表1提供了本文呈现的主要DNA修复基因及其相关的修复途径的示例性集合,并且与DNA修复相关的典型库将包括表1的至少两类修复类别中的一种或两种、或三种或四种或多于四种。
表1
Figure BDA0002380699350000071
Figure BDA0002380699350000081
然而,应该认识到的是,本文还明确考虑了与DNA修复和修复途径相关的许多其他基因,表2和表3说明了用于分析的其他示例性基因及其在DNA修复中的相关功能。
表2
Figure BDA0002380699350000082
Figure BDA0002380699350000091
Figure BDA0002380699350000101
Figure BDA0002380699350000111
Figure BDA0002380699350000121
Figure BDA0002380699350000131
Figure BDA0002380699350000141
表3
Figure BDA0002380699350000142
Figure BDA0002380699350000151
Figure BDA0002380699350000161
Figure BDA0002380699350000171
Figure BDA0002380699350000181
Figure BDA0002380699350000191
Figure BDA0002380699350000201
Figure BDA0002380699350000211
Figure BDA0002380699350000221
Figure BDA0002380699350000231
Figure BDA0002380699350000241
因此,应该理解,可以对表1至表3中以上基因中的任一个或多于一个的突变(可以将其进一步分类或评估为影响功能或沉默突变的突变)、拷贝数和/或表达强度,以及RNA剪接变体和聚腺苷酸化的差异或影响转录物稳定性或半衰期的其他参数进行评估。同样地,可以使用质谱法或本领域众所周知的体外测定来确定表1至表3的基因编码的相应蛋白质的蛋白质数量和/或蛋白质活性。因此,可以使用多种修复机制的组学数据来评估细胞的修复状态。由此,DNA修复基因相对于正常情况的一种或多于一种缺陷(功能性缺陷和/或数量减少)可指示患病细胞或缺乏修复能力,这进而可指示使用DNA损伤剂的治疗成功。另一方面,一个或多于一个DNA修复基因的过度活性或过表达(相对于相同个体的健康细胞)可能指示DNA损伤、或DNA损伤环境或损伤剂的存在或在DNA损伤环境或损伤剂中的暴露。此外,DNA修复基因中的功能性缺陷可能指示高频突变的倾向。
如将容易理解的,通过组学数据评估的DNA修复功能可以与存在的或可以预期的损伤模式相关联。因此,还预期了结合本文提出的教导的突变特征的分析(参见例如URL:cancer.sanger.ac.uk/cosmic/signatures)。例如,突变特征2和13已归因于胞苷脱氨酶的AID/APOBEC家族的活性,而特征4显示出对于C>A突变的转录链偏好,这与通过转录偶联的核苷酸切除修复来修复对鸟嘌呤的损伤的观点相吻合。突变特征26与缺陷性DNA错配修复相关。最典型地,观察到的或预期的突变特征通常将与DNA相应的修复基因的活性的降低或升高、肿瘤类型和/或暴露于DNA损伤剂(环境性的或药物相关的DNA损伤剂)相关联。
当然,应该理解的是,本文呈现的分析可以在特定和多样化的人群中进行,从而获得对于特定人群的参考值,例如跨越各种健康相关状态(例如,健康的、诊断患有特定疾病和/或疾病状态,其可能会或可能不会被遗传,或者可能会或可能不会与受损的DNA修复相关)、特定年龄或年龄段、可能会或可能不会与长寿或高发病率/死亡率相关的特定种族(例如,冲绳的日本人、尼泊尔人、斯里兰卡人等)和/或药物治疗(例如,用DNA烷基化剂、DNA交联剂、DNA嵌入剂或铂加合物治疗)。当然,也可以从具有已知组学信息,特别是来自癌症患者的可公开获得的组学信息的数据库(例如,TCGA、COSMIC等)和从可能健康或诊断患有疾病的大量个体的专有数据库中招募群体。同样地,应该理解的是,也可以随时间为相同个体或个体组编制群体记录,这有利地允许检测与RNA修复相关的基因和途径的变化或改变。
因此,应该认识到,预期的系统和方法允许用于DNA修复基因活性的大截面数据库,这进而允许生成可以基于个体DNA修复基因得分、比率得分、总和得分、差分得分的风险矩阵。在特别优选的方面,可以预期的是,可以为一种或多于一种DNA修复基因建立错误得分,并且该得分可以反映或甚至预示至少部分由于DNA修复基因和/或途径的突变而导致的各种疾病。例如,特别合适的错误得分可以涉及与一种或多于一种DNA修复类型(例如,碱基切除修复、同源重组修复等)相关联的一种或多于一种基因相对于可能与或可能不与一种DNA修复类型(例如,TP53、Fas、bcl-2、CHK2、非同源末端连接修复基因等)相关联的另一种基因的得分。在另一个实例中,预期的错误得分可以涉及与一种或多于一种DNA修复类型(例如,碱基切除修复、同源重组修复等)相关联的一种或多于一种基因相对于总突变率的得分,以更好地鉴定DNA修复相关的突变超过“背景”突变。在其他实例中,一些DNA修复基因中的突变可能是“领先指标”或激活其他DNA修复机制(例如p53介导的修复)的触发剂。这种触发剂的鉴定可以有利地允许对修复事件的早期诊断,或者可以用于触发修复事件。
应该注意的是,基于组学数据的特定定量和/或分析,可以进行各种计算。例如,组学数据可用于生成针对个体(或个体内的肿瘤)的一般错误状态,或用于与DNA修复基因改变的数量和/或类型相关联,以鉴定针对一种或多于一种DNA修复基因突变的“临界点”,在临界点之后一般突变率迅速上升。例如,在ERCC1和其他DNA修复基因中突变率或突变数量可能仅具有微小的系统性后果的情况下,向TP53添加更多突变可能导致突变率的灾难性增加。因此,并且从不同的角度来看,与DNA相关的基因中的突变可以用于估计基于DNA损伤的疾病,特别是癌症和与年龄相关的疾病的发生风险。在进一步预期的用途中,可以在一种或多于一种途径分析算法(例如,PARADIGM)中分析如此获得的组学信息,从而鉴定受影响的途径,并因此有可能在使用DNA损伤剂的治疗中调整治疗。途径分析算法也可以用于计算机调节一种或多于一种DNA修复基因的表达,这可能导致期望的或甚至是出乎意料的计算机治疗结果,该结果可以转化为临床。同样地,可以使用各种机器学习算法以将疾病参数(例如,疾病类型、疾病阶段、疾病对特定药物的可治疗性)与与DNA修复相关的基因的组学数据相关联,从而鉴定与特定条件或药物敏感性相关的特定突变模式。
在进一步预期的方面,应该理解的是,一旦已经鉴定出与DNA修复相关的一种或多于一种基因是失调的(例如,过表达的、表达不足的、突变的、截短的、存在剪接变体的,等等),则药物可以被鉴定以用于抵消失调的基因。如上所述,可以使用大型小分子库、计算方法和/或来自公共领域的数据来鉴定这些药物。此外,可以利用使用途径模型的计算机模拟来鉴定这些药物。因此,应该理解的是,预期的系统和方法不仅可以具有诊断价值,而且还可以用于鉴定和使用抵消与突变相关的疾病,特别是抵消癌症和与年龄相关的疾病的药物。在这种系统中,可以将一种或多于一种药物施用于个体以抵消DNA修复活性和/或治疗以DNA修复特征为特征的特定细胞群体。
因此,预期的组学分析对于监测受药物干预的患者的治疗也是特别有用的。这样的监测将有利地包括检测和/或定量具有特定修复特征的患病细胞、检测在用DNA损伤剂治疗期间在健康组织中触发DNA修复、检测具有特定修复特征的抗治疗性克隆群体的发育、以及检测患病细胞具有特定修复特征的疾病复发。从不同的角度来看,这些特征还可以用于鉴定细胞群体是否可能对使用DNA损伤剂的治疗敏感。类似地,特征也可以用于组合治疗中,其中个体接受使用DNA损伤剂的治疗,同时接收一种或多于一种药剂,该药剂抑制用于修复DNA损伤剂所带来的损伤的相应的DNA修复基因。使用预期的组学测试可以很容易地监测这种策略。因此,从另一个角度来看,可以采用预期的方法来特异性鉴定然后靶向DNA修复机制(例如,使用PARP抑制剂、Chk1-2抑制剂、WEE-1抑制剂或ATR抑制剂),可以通过细胞来使用该机制以抵消使用DNA损伤剂的治疗。
实施例1
提供全血样品并将其分成两等份。如下所述,第一等分试样用于分离无细胞RNA、cfRNA(以及所需的无细胞DNA、cfDNA)。但是,其他各种体液也被认为是合适的,只要cfRNA存在于这些体液中。合适的体液包括唾液、腹水、脊髓液、尿液等,这些体液可以是新鲜的、经化学保存的、冷藏的或冷冻的。例如,可以将样本取为10ml全血,抽取到分别含有RNA或DNA稳定剂的市售的无细胞RNA
Figure BDA0002380699350000271
管或无细胞DNA
Figure BDA0002380699350000272
管(Streck,7002S.109街,奥马哈,内布拉斯加州68128)中。有利地,cfRNA在无细胞RNA BCT管的全血中稳定7天,而cfDNA在无细胞DNA BCT管的全血中稳定14天,这允许有时间从世界各地运送患者样品而不会降解cfRNA或cfDNA。此外,通常优选使用不会或基本上不会(例如,等于或小于1%、或等于或小于0.1%、或等于或小于0.01%、或等于或小于0.001%)溶解血细胞的RNA稳定剂来分离cfRNA。从不同的角度来看,在试剂与血液混合后,RNA稳定剂不会导致血清或血浆中RNA量的显著增加(例如,总RNA的增加不超过10%、或不超过5%、或不超过2%、或不超过1%)。
最典型地,但非必要地,在RNA酶抑制剂、防腐剂、代谢抑制剂和螯合剂的存在下对第一等分试样进行离心。此外,通常优选在保持细胞成分完整性的条件下进行全血离心步骤。例如,第一RCF可以为700至2500(例如1600),和/或第二RCF可以为7000至25000(例如16000),其中在第一RCF下进行离心15至25分钟(例如20分钟),并且在第二RCF下进行离心5至15分钟(例如10分钟)。如果期望或需要,cfRNA可以存储在-80℃下和/或由cfRNA制备的cDNA可以存储在-4℃下。
全血样品的第二等分试样可以在抽空的采血管中离心,以使细胞与血清/血浆分离。一经分离,可以在等渗的林格液中洗涤细胞,然后使用一种或多于一种市售的检测试剂盒(例如Qiagen DNA血液微型试剂盒、Qiagen RNA血液微型试剂盒)对其进行裂解以制备DNA和RNA。
对于两种分析,均进行DNA和RNA测序。此外,定量RNA分析用于获得转录组学信息。在可用的情况下,使用选定的反应监测对与DNA修复相关的至少2种或至少4种、至少10种或至少20种不同的蛋白质进行蛋白质组学分析。可以使用途径分析(特别是使用PARADIGM)来处理如此获得的组学信息,以鉴定任何突变对DNA修复途径的任何影响。
实施例2
如以上实施例1所述,从诊断患有癌症的患者中提取全血样品并进行处理。此外,获得了新鲜的肿瘤活检并进行了完整的组学分析,其中DNA测序是对于DNA和RNA至少20倍深度的全基因组测序。此外,定量的RNA分析用于获得转录组学信息。在可用的情况下,使用选定的反应监测对与DNA修复相关的至少2种或至少4种、至少10种或至少20种不同的蛋白质进行蛋白质组学分析。在期望的情况下,使用选定的反应监测对与DNA修复相关的至少2种或至少4种、至少10种或至少20种不同的蛋白质进行蛋白质组学分析。可以使用途径分析(特别是使用PARADIGM)来处理如此获得的组学信息,以鉴定任何突变对DNA修复途径的任何影响。
实施例3
一旦结束对(例如,实施例2的)患者样品的组学分析,相对于年龄匹配的健康个体的组学数据的DNA、RNA和蛋白质(活性)的变化便被记录下来。在未观察到与已知疾病模式的统计关联性,或者变化可能与疾病特征性模式相关时,这些变化可以被标记为是特异质的。如上所述,分析可包括对与DNA修复相关的单个基因的观察,或对单独地的或处于各种关系(例如比率、总和等)的多个基因的观察。
实施例4
从个体获得肿瘤活检和相应的非肿瘤组织(或血液样品)的活检。然后对肿瘤活检进行DNA测序,并使用定量肿瘤细胞中所表达的RNA来进行RNAseq。确定活检样品和相应的非肿瘤组织的所有DNA修复基因的突变状态以及转录强度。确定修复状态的差异并开始进行使用DNA破坏剂(例如,使用交联剂、嵌入剂等)的治疗。然后如上所述通过对肿瘤进行再次活检或通过对DNA修复基因的cfDNA和cfRNA进行分离和分析来监测治疗。当肿瘤样品中发现DNA修复基因表达增加时,可以施用DNA修复抑制剂。此外,可以使用组学数据来进行途径分析(例如,使用PARADIGM),以鉴定将会选择性干扰肿瘤DNA修复的其他治疗选项。在这样的随访期间,可以获得肿瘤的修复特征,以鉴定克隆发育、抗性的进化和/或肿瘤状态。得出结论后,可以获得修复特征(通常从无细胞DNA和无细胞RNA中获得以检测肿瘤特异性修复特征,这可能指示复发)。
在一些实施方案中,用于描述和请求保护本发明的某些实施方案的表示成分数量、性质(例如浓度)、反应条件等的数字应理解为在一些情况下被术语“约”修饰。因此,在一些实施方案中,在书面描述和所附权利要求中叙述的数字参数是近似值,其可以根据特定实施方案试图获得的期望性质而变化。在一些实施方案中,应该根据报告的有效数字的数目并通过应用普通的舍入技术来解释数字参数。尽管叙述本发明的一些实施方案的宽范围的数值范围和参数是近似值,但是在具体实施例中叙述的数值被尽可能精确地报告。在本发明的一些实施方案中呈现的数值可能包含某些误差,这些误差不可避免地由它们各自的测试测量中发现的标准偏差所引起。除非上下文相反地规定,否则本文叙述的所有范围应解释为包括其端点,并且开放范围应解释为仅包括商业上的实用值。同样地,除非上下文相反地规定,否则所有值的列表都应视为包括中间值。
如本文说明书中以及随后的整个权利要求中所使用的,除非上下文另外明确规定,无数量词包括复数参照物。而且,如本文说明书中所使用的,除非上下文另外明确规定,“在”的含义包括“在...中”和“在...上”。
对于本领域技术人员明显的是,除了已经描述的修改之外,还可以进行更多修改而不偏离本文的发明构思。因此,除了所附权利要求的精神之外,本发明的主题不受限制。此外,在解释说明书和权利要求时,应以与上下文一致的尽可能宽的方式解释所有术语。特别地,术语“包括”和“包含”应被解释为以非排斥性的方式指代要素、组分或步骤,表明所引用的要素、组分或步骤可以存在、被利用或与其他未明确引用的要素、组分或步骤组合。当说明书和权利要求中涉及至少一种事物选自A、B、C…和N时,文本应被解释为仅需组中的一种要素,而不是A加N或B加N等。

Claims (37)

1.一种分析组学数据的方法,其包括:
获得多个DNA损伤修复基因的组学数据,其中所述组学数据包括DNA序列数据、RNA序列数据、转录强度、和蛋白质活性或数量中的至少两种;和
将所述组学数据与健康状态、组学错误状态、年龄、疾病、预防性建议和治疗性建议中的至少一种相关联。
2.根据权利要求1所述的方法,其还包括根据组学数据计算得分从而获得健康得分的步骤。
3.根据前述权利要求中任一项所述的方法,其中所述DNA序列数据选自突变数据、拷贝数数据重复、杂合性数据的丢失和表观遗传状态。
4.根据前述权利要求中任一项所述的方法,其中所述RNA序列数据选自mRNA序列数据和剪接变体数据。
5.根据前述权利要求中任一项所述的方法,其中所述RNA序列数据从由来自实体组织的RNA、来自血细胞的RNA和循环无细胞RNA组成的组中获得。
6.根据前述权利要求中任一项所述的方法,其中所述转录强度表示为损伤修复基因的转录物/百万个转录物。
7.根据前述权利要求中任一项所述的方法,其中使用质谱法确定所述蛋白质活性或数量。
8.根据前述权利要求中任一项所述的方法,其中所述健康状态选自健康的、诊断患有与年龄相关的疾病的和诊断患有癌症的。
9.根据前述权利要求中任一项所述的方法,其中所述预防性建议包括用调节所述多个DNA损伤修复基因中至少一个的表达的试剂治疗个体的建议。
10.根据前述权利要求中任一项所述的方法,其中所述治疗性建议包括使用DNA损伤剂治疗患者的建议。
11.根据前述权利要求中任一项所述的方法,其中所述多个DNA损伤修复基因选自碱基切除修复基因、错配修复基因、核苷酸切除修复基因、同源重组基因和非同源末端连接基因中的至少一种。
12.根据前述权利要求中任一项所述的方法,其中所述多个DNA损伤修复基因选自碱基切除修复基因、错配修复基因、核苷酸切除修复基因、同源重组基因和非同源末端连接基因中的至少两种。
13.根据前述权利要求中任一项所述的方法,其中所述多个DNA损伤修复基因选自碱基切除修复基因、错配修复基因、核苷酸切除修复基因、同源重组基因和非同源末端连接基因中的至少三种。
14.根据前述权利要求中任一项所述的方法,其中所述多个DNA损伤修复基因选自碱基切除修复基因、错配修复基因、核苷酸切除修复基因、同源重组基因和非同源末端连接基因。
15.根据前述权利要求中任一项所述的方法,其中所述多个DNA损伤修复基因为选自表1、表2和表3中列出的基因的至少两种基因。
16.根据前述权利要求中任一项所述的方法,其中相关联的步骤包括至少一种组学数据的加权得分。
17.根据前述权利要求中任一项所述的方法,其还包括将所述组学错误状态与阈值进行比较从而确定风险得分(“临界点”)的步骤。
18.一种计算健康指标的方法,其包括:
获得多个DNA损伤修复基因的组学数据,其中所述组学数据包括DNA序列数据、RNA序列数据、转录强度、和蛋白质活性或数量中的至少两种;和
使用所述多个DNA损伤修复基因的组学数据生成指示个人健康的健康复合得分。
19.根据权利要求18所述的方法,其还包括将复合得分与阈值进行比较从而确定治疗选项的步骤。
20.根据权利要求19所述的方法,其中所述治疗选项是所述复合得分低于所述阈值的预防性治疗。
21.根据权利要求19所述的方法,其中所述治疗选项使用调节所述多个DNA损伤修复基因中至少一个的表达的药物。
22.根据权利要求19所述的方法,其中所述治疗选项使用引起DNA损伤的药物。
23.一种治疗个体的方法,其包括:
获得多个DNA损伤修复基因的组学数据,其中所述组学数据包括DNA序列数据、RNA序列数据、转录强度、和蛋白质活性或数量中的至少两种;
鉴定至少一个DNA损伤修复基因相对于相应的健康对照为失调的步骤;和
施用抵消至少一个失调的DNA损伤修复基因的试剂。
24.根据权利要求23所述的方法,其中所述DNA序列数据选自突变数据、拷贝数数据重复、杂合性数据的丢失和表观遗传状态。
25.根据权利要求23至24中任一项所述的方法,其中所述RNA序列数据选自mRNA序列数据和剪接变体数据。
26.根据权利要求23至25中任一项所述的方法,其中所述RNA序列数据从由来自实体组织的RNA、来自血细胞的RNA和循环无细胞RNA组成的组中获得。
27.根据权利要求23至26中任一项所述的方法,其中所述转录强度表示为损伤修复基因的转录物/百万个转录物。
28.根据权利要求23至27中任一项所述的方法,其中使用质谱法确定所述蛋白质活性或数量。
29.根据权利要求23至28中任一项所述的方法,其中所述DNA损伤修复基因的至少一个选自碱基切除修复基因、错配修复基因、核苷酸切除修复基因、同源重组基因和非同源末端连接基因。
30.根据权利要求23至28中任一项所述的方法,其中所述多个DNA损伤修复基因为选自表1、表2和表3中列出的基因的至少两种基因。
31.一种针对对象进行测试的方法,其包括:
从对象获得血液样品;
使用血液样品以获得多个DNA损伤修复基因的组学数据,其中所述组学数据包括DNA序列数据、RNA序列数据、转录强度、和蛋白质活性或数量中的至少两种;
其中从所述血液样品的无细胞部分和所述血液样品的含细胞部分的至少一种中获得所述组学数据;
鉴定血液样品中至少一个DNA损伤修复基因相对于相应的健康对照为失调的。
32.根据权利要求31所述的方法,其中从所述血液样品的所述无细胞部分获得所述组学数据。
33.根据权利要求31至32中任一项所述的方法,其中所述RNA序列数据选自mRNA序列数据和剪接变体数据。
34.根据权利要求31至33中任一项所述的方法,其中所述RNA序列数据从由来自实体组织的RNA、来自血细胞的RNA和循环无细胞RNA组成的组中获得。
35.根据权利要求31至34中任一项所述的方法,其中所述转录强度表示为损伤修复基因的转录物/百万个转录物。
36.根据权利要求31至35中任一项所述的方法,其中所述DNA损伤修复基因的至少一个选自碱基切除修复基因、错配修复基因、核苷酸切除修复基因、同源重组基因和非同源末端连接基因。
37.根据权利要求31至35中任一项所述的方法,其中所述多个DNA损伤修复基因为选自表1、表2和表3中列出的基因的至少两种基因。
CN201880051383.1A 2017-08-07 2018-08-07 Dna修复分析及其方法 Withdrawn CN110998738A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762542281P 2017-08-07 2017-08-07
US62/542,281 2017-08-07
PCT/US2018/045654 WO2019032608A2 (en) 2017-08-07 2018-08-07 DNA REPAIR PROFILING AND ASSOCIATED METHODS

Publications (1)

Publication Number Publication Date
CN110998738A true CN110998738A (zh) 2020-04-10

Family

ID=65271585

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880051383.1A Withdrawn CN110998738A (zh) 2017-08-07 2018-08-07 Dna修复分析及其方法

Country Status (8)

Country Link
US (1) US20200234790A1 (zh)
EP (1) EP3665687A2 (zh)
JP (1) JP2020533663A (zh)
KR (1) KR20200031171A (zh)
CN (1) CN110998738A (zh)
AU (1) AU2018313789A1 (zh)
CA (1) CA3071674A1 (zh)
WO (1) WO2019032608A2 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210375395A1 (en) * 2018-12-06 2021-12-02 Nantomics Omics Detection of Nonhomologous End Joining Repair Site Signatures
EP3885453A1 (en) * 2020-03-23 2021-09-29 Koninklijke Philips N.V. Prediction of radiotherapy response for prostate cancer subject based on dna repair genes

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6482606B1 (en) * 1994-01-27 2002-11-19 Human Genome Sciences, Inc. Human DNA mismatch repair polynucleotides

Also Published As

Publication number Publication date
CA3071674A1 (en) 2019-02-14
EP3665687A2 (en) 2020-06-17
WO2019032608A3 (en) 2019-06-27
US20200234790A1 (en) 2020-07-23
WO2019032608A2 (en) 2019-02-14
JP2020533663A (ja) 2020-11-19
AU2018313789A1 (en) 2020-03-19
KR20200031171A (ko) 2020-03-23

Similar Documents

Publication Publication Date Title
Knisbacher et al. Molecular map of chronic lymphocytic leukemia and its impact on outcome
Hall et al. Ionizing radiation biomarkers in epidemiological studies–an update
US20150315645A1 (en) Methods of identifying biomarkers associated with or causative of the progression of disease
EP2066809A2 (en) Gene expression profiling for identification, monitoring and treatment of transplant rejection
US20170037479A1 (en) Markers for ovarian cancer and the uses thereof
CN111213209A (zh) 根据生物体液的评估用癌症评分和反应预测
US20190018930A1 (en) Method for building a database
EP3776558A2 (en) Improved classification and prognosis of prostate cancer
JP2020072741A (ja) 個人の喫煙ステータスを予測するためのシステムおよび方法
CN113462775B (zh) 用于结直肠癌预后评估的基因标志物
Hu et al. Microarray meta-analysis identifies acute lung injury biomarkers in donor lungs that predict development of primary graft failure in recipients
US20190185937A1 (en) Rna editing as biomarkers for mood disorders test
CN110998738A (zh) Dna修复分析及其方法
WO2008091708A2 (en) Gene expression profiling for identification, monitoring, and treatment of lupus erythematosus
TWI671653B (zh) 三陰性乳癌的次分類及方法
US20230348983A1 (en) Biomarkers
Yoshino et al. Variants of Uncertain Significances in Hereditary Breast and Ovarian Cancer
Grandt et al. Computation and comparison of gene expression variability in fibroblasts of long-term survivors of childhood cancer and cancer-free controls in response to ionizing and sham-irradiation: the KiKme study
Chen et al. Identification of biomarkers for prostate cancer prognosis using a novel two-step cluster analysis
GB2547406A (en) Apparatus and methods of using of biomarkers for predicting TNF-inhibitor response
Ruotsalainen Evaluation of Formalin-Fixed Paraffin-Embedded Tissue Samples for Germline DNA Analyses
WO2024064814A1 (en) Apparatus and methods for determining sensitivity to osimertinib
US20210375395A1 (en) Omics Detection of Nonhomologous End Joining Repair Site Signatures
CN111492435A (zh) 替莫唑胺反应预测因子和方法
Ahmed Identification of potential biomarkers in lung cancer as possible diagnostic agents using bioinformatics and molecular approaches

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20200410