CN114829624A - 基因组瘢痕测定和相关方法 - Google Patents
基因组瘢痕测定和相关方法 Download PDFInfo
- Publication number
- CN114829624A CN114829624A CN202080086602.7A CN202080086602A CN114829624A CN 114829624 A CN114829624 A CN 114829624A CN 202080086602 A CN202080086602 A CN 202080086602A CN 114829624 A CN114829624 A CN 114829624A
- Authority
- CN
- China
- Prior art keywords
- genomic dna
- amplicons
- copy number
- segments
- hrrd
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 150
- 238000003556 assay Methods 0.000 title claims abstract description 55
- 231100000241 scar Toxicity 0.000 title abstract description 41
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 85
- 201000011510 cancer Diseases 0.000 claims abstract description 63
- 238000011269 treatment regimen Methods 0.000 claims abstract description 8
- 108091093088 Amplicon Proteins 0.000 claims description 150
- 108020004414 DNA Proteins 0.000 claims description 97
- 238000012163 sequencing technique Methods 0.000 claims description 47
- 238000007403 mPCR Methods 0.000 claims description 45
- 239000000203 mixture Substances 0.000 claims description 39
- 230000003321 amplification Effects 0.000 claims description 34
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 34
- 238000003752 polymerase chain reaction Methods 0.000 claims description 31
- 238000011282 treatment Methods 0.000 claims description 26
- 239000000523 sample Substances 0.000 claims description 23
- 210000000349 chromosome Anatomy 0.000 claims description 20
- 238000011161 development Methods 0.000 claims description 20
- 108700028369 Alleles Proteins 0.000 claims description 19
- 239000012472 biological sample Substances 0.000 claims description 19
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 claims description 18
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 claims description 18
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 18
- 230000000392 somatic effect Effects 0.000 claims description 17
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical group [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 claims description 16
- 206010033128 Ovarian cancer Diseases 0.000 claims description 14
- 206010061535 Ovarian neoplasm Diseases 0.000 claims description 14
- 239000012661 PARP inhibitor Substances 0.000 claims description 13
- 229940121906 Poly ADP ribose polymerase inhibitor Drugs 0.000 claims description 13
- 210000001519 tissue Anatomy 0.000 claims description 13
- 108090000623 proteins and genes Proteins 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 11
- 239000012623 DNA damaging agent Substances 0.000 claims description 10
- 229940123780 DNA topoisomerase I inhibitor Drugs 0.000 claims description 10
- 238000002944 PCR assay Methods 0.000 claims description 10
- 239000000365 Topoisomerase I Inhibitor Substances 0.000 claims description 10
- 229940045799 anthracyclines and related substance Drugs 0.000 claims description 10
- 230000007547 defect Effects 0.000 claims description 10
- 238000009826 distribution Methods 0.000 claims description 10
- 230000005855 radiation Effects 0.000 claims description 10
- 210000004027 cell Anatomy 0.000 claims description 9
- 239000013611 chromosomal DNA Substances 0.000 claims description 9
- 239000002773 nucleotide Substances 0.000 claims description 9
- 125000003729 nucleotide group Chemical group 0.000 claims description 9
- 238000012408 PCR amplification Methods 0.000 claims description 8
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 claims description 8
- 229910052697 platinum Inorganic materials 0.000 claims description 8
- 102000000872 ATM Human genes 0.000 claims description 7
- 108010004586 Ataxia Telangiectasia Mutated Proteins Proteins 0.000 claims description 7
- 101700002522 BARD1 Proteins 0.000 claims description 7
- 108700020463 BRCA1 Proteins 0.000 claims description 7
- 102000036365 BRCA1 Human genes 0.000 claims description 7
- 101150072950 BRCA1 gene Proteins 0.000 claims description 7
- 102100028048 BRCA1-associated RING domain protein 1 Human genes 0.000 claims description 7
- 108700020462 BRCA2 Proteins 0.000 claims description 7
- 102000052609 BRCA2 Human genes 0.000 claims description 7
- 101150008921 Brca2 gene Proteins 0.000 claims description 7
- 102100038111 Cyclin-dependent kinase 12 Human genes 0.000 claims description 7
- 102100033934 DNA repair protein RAD51 homolog 2 Human genes 0.000 claims description 7
- 102100034484 DNA repair protein RAD51 homolog 3 Human genes 0.000 claims description 7
- 102100034483 DNA repair protein RAD51 homolog 4 Human genes 0.000 claims description 7
- 108010067741 Fanconi Anemia Complementation Group N protein Proteins 0.000 claims description 7
- 102000016627 Fanconi Anemia Complementation Group N protein Human genes 0.000 claims description 7
- 102100034553 Fanconi anemia group J protein Human genes 0.000 claims description 7
- 101000785776 Homo sapiens Artemin Proteins 0.000 claims description 7
- 101000884345 Homo sapiens Cyclin-dependent kinase 12 Proteins 0.000 claims description 7
- 101000712511 Homo sapiens DNA repair and recombination protein RAD54-like Proteins 0.000 claims description 7
- 101001132271 Homo sapiens DNA repair protein RAD51 homolog 3 Proteins 0.000 claims description 7
- 101001132266 Homo sapiens DNA repair protein RAD51 homolog 4 Proteins 0.000 claims description 7
- 101000848171 Homo sapiens Fanconi anemia group J protein Proteins 0.000 claims description 7
- 101000981336 Homo sapiens Nibrin Proteins 0.000 claims description 7
- 101000777293 Homo sapiens Serine/threonine-protein kinase Chk1 Proteins 0.000 claims description 7
- 101000777277 Homo sapiens Serine/threonine-protein kinase Chk2 Proteins 0.000 claims description 7
- 102100024403 Nibrin Human genes 0.000 claims description 7
- 101710018890 RAD51B Proteins 0.000 claims description 7
- 102100031081 Serine/threonine-protein kinase Chk1 Human genes 0.000 claims description 7
- 102100031075 Serine/threonine-protein kinase Chk2 Human genes 0.000 claims description 7
- 102100023931 Transcriptional regulator ATRX Human genes 0.000 claims description 7
- -1 anthracyclines Substances 0.000 claims description 7
- 239000003112 inhibitor Substances 0.000 claims description 7
- 102000009095 Fanconi Anemia Complementation Group A protein Human genes 0.000 claims description 6
- 108010087740 Fanconi Anemia Complementation Group A protein Proteins 0.000 claims description 6
- 102000052930 Fanconi Anemia Complementation Group L protein Human genes 0.000 claims description 6
- 108700026162 Fanconi Anemia Complementation Group L protein Proteins 0.000 claims description 6
- 101100119754 Homo sapiens FANCL gene Proteins 0.000 claims description 6
- 230000007812 deficiency Effects 0.000 claims description 3
- 210000001082 somatic cell Anatomy 0.000 claims description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 claims description 2
- 239000011541 reaction mixture Substances 0.000 claims description 2
- 208000032544 Cicatrix Diseases 0.000 abstract description 3
- 230000037387 scars Effects 0.000 abstract description 3
- 201000010099 disease Diseases 0.000 abstract description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 2
- 239000013615 primer Substances 0.000 description 35
- 230000006801 homologous recombination Effects 0.000 description 12
- 238000002744 homologous recombination Methods 0.000 description 12
- 230000018109 developmental process Effects 0.000 description 11
- FAQDUNYVKQKNLD-UHFFFAOYSA-N olaparib Chemical compound FC1=CC=C(CC2=C3[CH]C=CC=C3C(=O)N=N2)C=C1C(=O)N(CC1)CCN1C(=O)C1CC1 FAQDUNYVKQKNLD-UHFFFAOYSA-N 0.000 description 11
- 229960000572 olaparib Drugs 0.000 description 11
- 238000007481 next generation sequencing Methods 0.000 description 10
- 230000015654 memory Effects 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000008439 repair process Effects 0.000 description 7
- 238000002512 chemotherapy Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 101000616456 Homo sapiens MEF2-activating motif and SAP domain-containing transcriptional regulator Proteins 0.000 description 5
- 102100021795 MEF2-activating motif and SAP domain-containing transcriptional regulator Human genes 0.000 description 5
- 238000003491 array Methods 0.000 description 5
- 230000037361 pathway Effects 0.000 description 5
- 230000000306 recurrent effect Effects 0.000 description 5
- 230000037390 scarring Effects 0.000 description 5
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000003252 repetitive effect Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 208000031448 Genomic Instability Diseases 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000126 in silico method Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000004043 responsiveness Effects 0.000 description 3
- BPPVUXSMLBXYGG-UHFFFAOYSA-N 4-[3-(4,5-dihydro-1,2-oxazol-3-yl)-2-methyl-4-methylsulfonylbenzoyl]-2-methyl-1h-pyrazol-3-one Chemical compound CC1=C(C(=O)C=2C(N(C)NC=2)=O)C=CC(S(C)(=O)=O)=C1C1=NOCC1 BPPVUXSMLBXYGG-UHFFFAOYSA-N 0.000 description 2
- 241001091551 Clio Species 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 238000011319 anticancer therapy Methods 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 239000012188 paraffin wax Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000002203 pretreatment Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000003007 single stranded DNA break Effects 0.000 description 2
- 238000009097 single-agent therapy Methods 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 108091007743 BRCA1/2 Proteins 0.000 description 1
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 101001024425 Mus musculus Ig gamma-2A chain C region secreted form Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 208000035199 Tetraploidy Diseases 0.000 description 1
- 239000007997 Tricine buffer Substances 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 230000033590 base-excision repair Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 208000037819 metastatic cancer Diseases 0.000 description 1
- 208000011575 metastatic malignant neoplasm Diseases 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 210000003765 sex chromosome Anatomy 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/143—Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/16—Assays for determining copy number or wherein the copy number is of special importance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/165—Mathematical modelling, e.g. logarithm, ratio
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Public Health (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Biophysics (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Primary Health Care (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
本公开文本提供了用于检测或预测基因组瘢痕、用于诊断测定领域和用于选择针对人类疾病如癌症的治疗方案的方法。
Description
相关申请的交叉引用
本申请要求2019年12月16日提交的标题为“基因组瘢痕测定”(“GenomicScarring Assays”)的美国临时申请序列号62/948,640的权益,将其通过引用以其整体明确并入本文。
技术领域
本公开文本总体上涉及用于检测或预测基因组瘢痕、用于诊断测定领域和用于选择针对人类疾病(例如癌症)的治疗方案的方法。
背景技术
同源重组(HR)是参与修复双链DNA断裂(DSB)的主要机制之一。当细胞中的HR途径被破坏时,双链断裂可能无法有效修复(或根本无法修复),从而导致基因组不稳定性(例如,突变、拷贝数改变和结构重排)。由HR修复缺陷导致的基因组不稳定性(也称为“基因组瘢痕”)进而与各种类型的癌症相关。例如,拷贝数改变可能会由于基因的额外拷贝的存在而导致基因的过表达,或者由于杂合性丢失而导致低表达或无表达。在许多类型的癌症中已观察到HR修复缺陷(HRRD)。
聚(ADP-核糖)聚合酶(PARP)已知在各种细胞过程(包括复制、重组、染色质重塑和DNA修复)中发挥重要作用。已经发现几种类型的肿瘤(例如,BRCA1/2突变体)具有缺陷型HR修复途径,并且因此依赖于PARP介导的碱基切除修复来存活。鉴于这些发现,PARP抑制已经作为一种通过使互补DNA修复途径失活来选择性杀死癌细胞的潜在策略出现。然而,鉴于PARP抑制剂通常仅对具有HR修复缺陷的癌症有效,因此在施用此疗法之前确定患者是否患有HR修复缺陷型癌症非常重要。目前存在至少两种可商购的基因组瘢痕测定,即MyriadGenetics,Inc.提供的CDx测定和Foundation Medicine,Inc.提供的FoundationFocusTM CDx BRCA LOH测定。然而,这两种测定均需要显著量的测序数据作为先决条件,例如,myChoice测定需要对50,000个单核苷酸多态性(SNP)靶标进行测序,并且99%的碱基必须具有平均覆盖率超过500x的100个读段,并且FoundationFocus测定需要>99%的外显子覆盖率为>100x的>500x中值覆盖率。这种对大量测序数据的需求增加了成本和处理时间,限制了这些测定的有用性。
发明内容
在通用方面,本公开文本提供了用于检测或预测同源重组修复缺陷(“HRRD”)的方法。在一些方面,此类方法可用于为有需要的受试者选择癌症治疗。与如本文所述的已知方法相比,此类方法提供了多种优点。例如,在一些方面,本发明方法需要较少的测序容量,并且因此比已知方法便宜。此外,本发明方法的实施允许使用标准聚合酶链式反应(PCR)设备检测HRRD,并且与多种样品类型(例如,从新鲜冷冻组织或福尔马林固定的石蜡包埋组织中提取的DNA,以及无细胞DNA)相容。在一些方面,本发明方法可以使用由靶向大约5,000个或更少的SNP的多重PCR测定产生的测序数据来进行。此类方法可以例如作为单管PCR测定来进行,从而节省时间和资源。
在一方面,本公开文本涉及一种用于预测HRRD的方法,所述方法包括以下步骤:a)提供获自人类受试者的生物样本,其中所述样本包含基因组DNA;b)对所述基因组DNA进行多重聚合酶链式反应(PCR)测定以产生扩增产物,其中所述PCR测定被配置为扩增多个扩增子;c)对所述扩增产物的至少一部分进行测序以产生测序结果;以及d)基于所述测序结果,确定所述生物样本的一组参数,其中所述参数组包括:i)区段大小参数,ii)每单位长度的断点计数参数,以及iii)拷贝数参数。
在一些方面,所述方法进一步包括:e)基于所确定的参数组,预测所述生物样本是否获自具有HRRD的细胞、组织或肿瘤。在一些方面,所述方法进一步包括:基于所确定的参数组,为提供生物样本的人类受试者选择治疗。在一些方面,所述方法进一步包括:基于所确定的参数组,预测所述人类受试者对包含以下的癌症治疗方案的反应:DNA损伤剂、蒽环类、拓扑异构酶I抑制剂、辐射和/或PARP抑制剂。在一些方面,所述方法可以进一步包括此段落中所述的步骤的任何组合。在一些方面,所述区段大小参数、所述每单位长度的断点计数参数和所述拷贝数参数可以聚合(例如,使用加法或更复杂的算法)以产生单个度量或得分,然后进行本文所述的预测或选择步骤中的任一个。
在一些方面,所述区段大小参数是通过以下方式确定的:鉴定多个区段,其中区段被定义为由至少3个含有杂合多态位置的连续扩增子组成的基因组DNA的一部分,所述连续扩增子具有相同的拷贝数;确定所鉴定的多个区段的区段大小分布;以及计算描述所述区段大小的混合组分的后验概率,所述后验概率是通过对开发组的混合建模确定的。在一些方面,所述区段大小参数是通过以下方式确定的:鉴定多个区段,其中区段被定义为由至少3个含有杂合多态位置的连续扩增子组成的基因组DNA的一部分,所述连续扩增子具有相同的拷贝数;以及计算所鉴定的多个区段的平均区段大小。在一些方面,所述多个区段包含大小在5-50兆碱基对(MBp)范围内的区段。在一些方面,所述区段各自在1-10、10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90或90-100MBp的长度范围内。在一些方面,所述区段可以更长(例如,任何长度直至完整的染色体臂的长度)。在一些方面,所述区段各自为至少5、10、15、20、25、30、35、40、45、50、60、70、80、90或100MBp的长度。在一些方面,所述区段各自为小于5、10、15、20、25、30、35、40、45、50、60、70、80、90或100MBp的长度。
在一些方面,所述每单位长度的断点计数参数是通过计算每5、6、7、8、9、10、11、12、13、14、15Mb的基因组DNA的断点数确定的。在一些方面,可以针对基因组DNA的一部分计算所述每单位长度的断点计数(例如可以针对存在于所述基因组DNA内的一条或多条染色体或染色体臂进行计算)。在一些方面,所述每单位长度的断点计数参数是通过计算描述断点数的混合组分的后验概率确定的,所述后验概率是通过对开发组进行混合建模确定的。
在一些方面,所述拷贝数参数是通过计算所述基因组DNA的一个或多个区段的拷贝数确定的,其中区段被定义为由至少3个含有杂合多态位置的连续扩增子组成的基因组DNA的一部分,所述连续扩增子具有相同的拷贝数。在其他方面,本文公开的任何方法所需的区段可以被定义为这样的基因组DNA的一部分,所述基因组DNA的一部分由至少1、2、3、4、5、6、7、8、9、10个(或任何其他任意数量的)含有杂合多态性位置的连续扩增子作出,所述连续扩增子具有相同的拷贝数。在一些方面,所述拷贝数参数可以基于所述基因组的多个区段(例如,至少5、10、15、20、25、30、35、40、45、50、100、150、200、250或500个区段)来计算。在一些方面,一个或多个区段中的每一个的拷贝数可以选自:接近二倍体、接近四倍体、接近六倍体、接近八倍体或接近任何其他倍数。在一些方面,拷贝数可以用数字表示,例如,所述拷贝数参数可以包含所述基因组DNA的多个区段的数值平均值或中值拷贝数。在一些方面,所述拷贝数参数是:a)基于所述基因组DNA的多个区段,并且通过确定描述所述多个区段的拷贝数的混合组分的后验概率计算,所述后验概率是通过对开发组的混合建模确定的;和/或b)至少部分基于所述多个区段的分类,所述分类基于它们各自的倍性值。
在一些方面,所述生物样本获自人类组织、肿瘤或细胞。所述生物样本可以获自健康的人类受试者或获自已经被诊断患有或怀疑患有癌症的人类受试者。
在一些方面,所述基因组DNA包含整倍体基因组,并且所述PCR测定被配置为扩增至少1,000;2,000;3,000;4,000;5,000;6,000;7,000;或8,000个扩增子。
在一些方面,每个扩增子含有至少一个多态性位置,所述至少一个多态性位置具有至少0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%或25%的次要等位基因的平均群体频率。
在另一个通用方面,本公开文本提供了一种用于检测HRRD的方法,所述方法包括以下步骤:a)对获自人类受试者的基因组DNA进行多重聚合酶链式反应(PCR)测定,以产生包含多个含有单核苷酸多态性(SNP)的扩增子的扩增产物;b)确定每个所述SNP的β等位基因频率(BAF)和拷贝数参数;c)使用ASCAT算法,基于每个所述SNP的BAF和拷贝数参数,鉴定多个基因组区段;d)使用所述基因组区段,确定混合模型的三种组分的后验概率,其中所述组分包括区段大小、每单位长度的断点计数和拷贝数;以及e)基于所述混合模型的三种组分的后验概率,使用线性模型计算HRRD得分。
在一些方面,所述方法进一步包括步骤f)基于所述HRRD得分,预测所述基因组DNA是否获自具有HRRD的细胞、组织或肿瘤。在其他方面,步骤f)可以包括基于所述HRRD得分,预测所述人类受试者对包含以下的癌症治疗方案的反应:DNA损伤剂、蒽环类、拓扑异构酶I抑制剂、辐射、和/或聚ADP-核糖聚合酶(PARP)抑制剂。
在一些方面,区段大小组分是通过以下方式确定的:鉴定多个区段,其中区段被定义为由至少3个含有杂合多态位置的连续扩增子组成的基因组DNA的一部分,所述连续扩增子具有相同的拷贝数;确定所鉴定的多个区段的区段大小分布;以及计算描述所述区段大小的混合组分的后验概率,所述后验概率是通过对开发组的混合建模确定的。
在一些方面,所述多个区段包含各自具有以下的区段:a)在5-50兆碱基对(MBp)范围内的大小;b)在1-10、10-20、20-30、30-40或40-50Mbp长度范围内的大小;c)至少5、10、15、20、25、30、35、40、45或50MBp的大小。
在一些方面,所述基因组DNA是从采取自以下的生物样本中提取的:a)健康的人类受试者或b)已经被诊断患有或怀疑患有癌症的人类受试者。所述基因组DNA可以包含例如整倍体基因组,并且所述PCR测定被配置为扩增至少1,000;2,000;3,000;4,000;5,000;6,000;7,000;或8,000个扩增子。在一些方面,每个扩增子含有至少一个多态性位置,所述至少一个多态性位置具有至少10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%或25%的次要等位基因的平均群体频率。
在另一个通用方面,本公开文本提供了一种用于预测HRRD的方法,所述方法包括:a)提供包含一个或多个处理器的电子设备;b)通过所述电子设备接收扩增产物的测序结果,所述扩增产物是使用获自人类受试者的基因组DNA通过多重PCR产生的,其中所述测序结果包含多个含有SNP的扩增子的序列;c)通过所述电子设备确定每个所述SNP的β等位基因频率(BAF)和拷贝数参数;d)使用ASCAT算法,基于每个所述SNP的BAF和拷贝数参数,通过所述电子设备鉴定多个基因组区段;e)基于所述基因组区段,通过所述电子设备确定混合模型的三种组分的后验概率,其中所述组分包括区段大小、每单位长度的断点计数和拷贝数;以及f)基于所述混合模型的三种组分的后验概率,使用线性模型,通过所述电子设备计算HRRD得分。
在另一个通用方面,本公开文本提供了一种用于预测HRRD的系统,所述系统包括:包含一个或多个处理器的电子设备,所述电子设备被配置为:接收扩增产物的测序结果,所述扩增产物是使用获自人类受试者的基因组DNA通过多重PCR产生的,其中所述测序结果包含多个含有SNP的扩增子的序列;确定每个所述SNP的β等位基因频率(BAF)和拷贝数参数;使用ASCAT算法,基于每个所述SNP的BAF和拷贝数参数,鉴定多个基因组区段;基于所述基因组区段,确定混合模型的三种组分的后验概率,其中所述组分包括区段大小、每单位长度的断点计数和拷贝数;以及基于所述混合模型的三种组分的后验概率,使用线性模型计算HRRD得分。在一些方面,本公开文本提供了一种包含一个或多个处理器的电子设备,所述一个或多个处理器被配置为执行本文所述的任何方法的一个或多个步骤。
在另一个通用方面,本公开文本提供了扩增基因组DNA的方法,所述方法包括:a)从获自已知患有或怀疑患有癌症的人类受试者的样本中获得基因组DNA;以及b)通过使用所述基因组DNA进行多重PCR来扩增多个含有单SNP的扩增子;其中所述多重PCR是使用被配置为扩增跨所有22条人类体细胞染色体的至少5,000个扩增子的一组PCR引物进行的,其中每个扩增子包含SNP。在一些方面,每个扩增子包含100bp的最大长度。在一些方面,平均扩增子密度是1个扩增子/400-600kb体细胞染色体DNA。在一些方面,所述多个扩增子包括以下基因的每一种的一个或多个部分:BRCA1、BRCA2、BRIP1、RAD51C、RAD51D、ATM、BARD1、CHEK1、CHEK2、FANCA、FANCL、NBN、PALB2、RAD51B、RAD54L、CDK12和TP53。
在另一个通用方面,本公开文本提供了产生PCR扩增产物的方法,所述方法包括:a)从获自人类受试者(例如,已知患有或怀疑患有癌症)的样本中获得基因组DNA;以及b)通过使用所述基因组DNA进行多重PCR扩增多个各自含有单核苷酸多态性(SNP)的扩增子,产生所述PCR扩增产物;其中所述多重PCR是使用被配置为扩增跨所有22条人类体细胞染色体的至少5,000个扩增子的一组PCR引物进行的。在一些方面,每个扩增子包含100bp的最大长度。在一些方面,平均扩增子密度是1个扩增子/400-600kb体细胞染色体DNA。在一些方面,所述多个扩增子包括以下基因的每一种的一个或多个部分:BRCA1、BRCA2、BRIP1、RAD51C、RAD51D、ATM、BARD1、CHEK1、CHEK2、FANCA、FANCL、NBN、PALB2、RAD51B、RAD54L、CDK12和TP53。
在另一个通用方面,本公开文本提供了治疗癌症的方法,所述方法包括:a)通过电子设备接收扩增产物的测序结果,所述扩增产物是使用获自在人类受试者中发现的肿瘤的基因组DNA通过多重PCR产生的,其中所述测序结果包含多个含有SNP的扩增子的序列;b)通过所述电子设备确定每个所述SNP的BAF和拷贝数参数;c)使用ASCAT算法,基于每个所述SNP的BAF和拷贝数参数,通过所述电子设备鉴定多个基因组区段;d)基于所述基因组区段,通过所述电子设备确定混合模型的三种组分的后验概率,其中所述组分包括区段大小、每单位长度的断点计数和拷贝数;以及e)基于所述混合模型的三种组分的后验概率,使用线性模型,通过所述电子设备计算HRRD得分;以及f)基于所述HRRD,为所述受试者选择和/或施用癌症治疗。在其他方面,本公开文本提供了一种基于本文所述的任何预测方法来治疗癌症的方法。
在一些方面,所述癌症治疗是施用DNA损伤剂、蒽环类、拓扑异构酶I抑制剂、辐射、和/或PARP抑制剂。在一些方面,所选择的癌症治疗是当所述HRRD得分高于(或低于)预选择的阈值时,施用PARP抑制剂。
在一些方面,根据本公开文本的治疗癌症的方法包括:a)从获自已知患有或怀疑患有癌症的人类受试者的样本中获得基因组DNA;以及b)使用所述基因组DNA通过进行多重PCR扩增多个含有单核苷酸多态性(SNP)的扩增子,其中所述多重PCR是使用被配置为扩增跨所有22条人类体细胞染色体的至少5,000个扩增子的一组PCR引物进行的,其中每个扩增子包含SNP;c)基于所述多个扩增子的序列,确定所述人类受试者的HRRD得分;以及d)基于所述HRRD,为所述受试者选择和/或施用癌症治疗。在一些方面,所述癌症是卵巢癌,例如,铂敏感性卵巢癌或铂耐药性卵巢癌。
在再另外的方面,本公开文本提供了用于使用多重PCR测定来扩增基因组DNA的试剂盒,其中所述试剂盒包含a)PCR反应混合物;b)DNA聚合酶;以及c)一组PCR引物,其中所述PCR引物组被配置为扩增跨所有22条人类体细胞染色体的至少5,000个扩增子,其中每个扩增子包含SNP和100bp的最大长度。
在一些方面,平均扩增子密度是1个扩增子/400-600kb、300-700kb或500-560kb体细胞染色体DNA。在一些方面,所述扩增子扩增以下基因的每一种的一个或多个部分:BRCA1、BRCA2、BRIP1、RAD51C、RAD51D、ATM、BARD1、CHEK1、CHEK2、FANCA、FANCL、NBN、PALB2、RAD51B、RAD54L、CDK12和TP53。
鉴于本公开文本的全部内容,另外的方面对于技术人员将是易于清楚的。
附图说明
图1是示出了根据本公开文本的用于预测HRRD的示例性方法的流程图。
图2是示出了可以与本文所述的方法一起使用的一组示例性扩增子位置的图,所述扩增子位置是跨人类基因组的22条常染色体作图的。
图3是示出了一组示例性样品的图,这些样品是基于它们的基因组瘢痕得分和提供的突变信息分类的。基因组瘢痕得分沿x轴从左到右增加。
图4示出了对于用根据本发明方法的基因组瘢痕测定相比于用SNP阵列分析的样品,比较拷贝数(归一化值,logR)和β等位基因频率(BAF)的一组图。
图5示出了将使用本发明方法产生的预测HRRD得分与使用SNP阵列确定的基因组瘢痕的已知度量进行比较的一组三个图表。
图6是示出了在患有复发性卵巢癌的患者群组中与同源重组修复途径基因突变状态相关的HRRD得分,以及对奥拉帕尼单一疗法的最佳确认反应的图表。
图7展示了可以在其上实现所公开的系统和方法的通用计算机系统的例子。
具体实施方式
本公开文本提供了用于确定或预测HRRD的各种方法。在一些方面,所述方法可以包括以下步骤:a)提供获自人类受试者的生物样本,其中所述样本包含基因组DNA;b)对所述基因组DNA进行多重PCR测定以产生扩增产物,其中所述PCR测定被配置为扩增多个扩增子;c)对所述扩增产物的至少一部分进行测序以产生测序结果;以及d)基于所述测序结果,确定所述生物样本的一组参数。在一些方面,所述参数组包括:i)区段大小参数、ii)每单位长度的断点计数参数、和iii)拷贝数参数。在其他方面,所述方法包括对来自获自人类受试者的生物样本的基因组DNA进行多重PCR测定以产生扩增产物,其中所述PCR测定被配置为扩增多个扩增子;对所述扩增产物的至少一部分进行测序以产生测序结果;以及基于所述测序结果确定所述生物标本的一组参数。与已知的基因组瘢痕测定相比,本发明方法提供了多个优点,包括减少了成本和处理时间(例如,由于较低的测序要求)、以及提供了可以使用标准PCR设备进行的对HRRD的临床上有用的诊断。
在一些方面,所述参数组包括:i)区段大小参数、ii)每单位长度的断点计数参数、和iii)拷贝数参数。在一些方面,这三个参数可以通过添加或使用更复杂的算法来聚合以产生单个得分(例如,代表基因组瘢痕的水平)。在任一情况下,个体参数或基于个体参数的聚合参数可用作用以预测人类受试者对用抗癌疗法治疗的反应性或用以选择抗癌治疗的诊断指标。
在一些方面,根据本公开文本的方法可以基于多重PCR测定,所述多重PCR测定包括遍布在22对人类常染色体中多个上的扩增子。图3中示出了映射到人类基因组的一组示例性扩增子。在一些方面,所述扩增子可以靶向特定基因或染色体区域。在其他方面,所述扩增子可以随机遍布在22条常染色体上。在一些方面,所述测定也可以包括能够扩增人类性染色体上的DNA的一个或多个扩增子。在一些方面,所述扩增子的大小范围可以为70-90个碱基对(bp)。然而,所述扩增子的大小可以根据需要针对给定实施方式而变化。例如,所述扩增子大小可以是1-50bp、50-100bp、100-150bp、150-200bp、200-250bp、250-300bp、300-350bp、350-400bp、400-450bp、450-500bp、或>500bp。在一些方面,所述扩增子大小可以在通过从任何上述值中选择最小和最大大小而形成的范围内。在一些方面,一些或所有选择的扩增子将含有至少一个多态性位置。在一些方面,扩增子分辨率可以是至少或大约100、150、200、250、300、350、400、450、500、550、600、650、700、750或800kb。在一些方面,可以选择用于多重PCR测定的引物以在单管PCR反应中相容。可以使用本领域已知的任何设备(如通过测序仪器(例如,NextSeq系统))对所得的PCR产物进行测序。
必须分析测序的输出以确定同源重组(HR)缺陷的水平。在一些方面,分析过程可以由四个步骤组成:1)数据预处理,2)覆盖率归一化和偏倚校正,3)区段化,以及4)确定HRRD得分。然而,应理解,此组织仅仅是非限制性例子。在其他方面,分析过程可以省略这些步骤中的任一个,添加另外的步骤,和/或合并这四个步骤中的一个或多个。
数据预处理步骤可以包括基于初始测序结果(例如,一个或多个FastQ文件)生成覆盖文件(含有原始读段计数)和SNP文件(含有B等位基因频率,“BAF”/扩增子)。
覆盖率归一化和偏倚校正步骤可以包括a)确定每个扩增子的归一化读段计数(用量商,“DQ”)值,并且然后(如果需要)b)产生校正的DQ值,所述值说明与样品类型相关的测序偏倚。例如,福尔马林固定的石蜡包埋样品可展示出可通过已知算法校正的测序长度偏倚。
区段化步骤可以包括使用在覆盖率归一化和偏倚校正步骤期间产生的BAF值和DQ(或校正的DQ)值来确定拷贝数区段。可以使用Van Loo等人“Allele-specific copynumber analysis of tumors.”PNAS 107.39(2010):16910-16915中所述的ASCAT算法计算区段化,将其通过引用以其整体并入本文。例如,可以对使用本文所述的试剂盒之一产生的多重PCR扩增产物进行测序和分析,以确定每个SNP或扩增子的β等位基因频率(BAF)和拷贝数参数。BAF和拷贝数参数可以用作ASCAT算法的输入,以鉴定基因组区段。在本文所述的方法的一些方面,区段被定义为由至少3个含有杂合多态位置的连续扩增子组成的基因组DNA的一部分,所述连续扩增子具有相同的拷贝数。在其他方面,区段的定义可以基于不同数量的连续扩增子,例如,至少1、2、4、5、6、7、8、9、10(或任何其他任意数量)个连续扩增子。拷贝数区段的大小范围可以例如为大约5-50MBp。
HRRD得分的确定可以包括基于在区段化步骤中鉴定的区段确定给定的生物样品的单个整数得分。此过程可以从通过混合建模确定拷贝数区段的几个参数的潜在分布开始,所述参数包括1)区段大小,2)每单位长度(例如,10Mbp)的断点计数,和3)拷贝数。这些潜在分布称为组分。可以汇编后验矩阵的和(样品x组分),然后使用非负矩阵分解来降维,允许针对这些参数中的每一个产生值,从而提供关于HRRD的信息。
这三个参数的值可以聚合以形成指示HR修复缺陷的水平的单一得分,这进而可以用作用以预测反应性或选择治疗方案的临床诊断指标。图3展示了使用根据本公开文本的方法测定的一组示例性生物样品,根据它们的HRRD得分按顺序排列。在一些方面,此HRRD得分可用于确定是否应将PARP抑制剂施用于患有或怀疑患有癌症的人类受试者,以预测对抗癌治疗剂的反应性,或用于本文所述的其他目的。
在一些方面,根据本公开文本的基因组瘢痕测定可以开始于对获自人类受试者的基因组DNA进行多重PCR测定,以产生包含多个含有SNP的扩增子的扩增产物,随后对扩增产物进行测序和分析以确定HRRD得分。可以分析测序结果以确定每个SNP的β等位基因频率(BAF)和拷贝数参数。这些BAF和拷贝数参数可以进而用于使用如Loo等人所述的ASCAT算法将基因组DNA划分成多个基因组区段,如上所述。然后可以针对与这些基因组区段相关的一个或多个特征导出拷贝数特征分布,如区段大小、每单位长度(例如,每10mb)的断点计数或拷贝数。可以使用Macintyre等人“Copy number signatures and mutational processesin ovarian carcinoma,”Nature Genetics 50.9(2018):1262-1270(本文中,“Macintyre”)中所述的方法进行这些拷贝数特征中的任一种的分析和计算,将其全部内容通过引用并入本文。例如,混合建模可用于确定每个组分的潜在分布,如例如Macintyre中所述。可以汇编后验矩阵的和(样品x组分),然后使用非负矩阵分解来降维,允许针对这些组分中的每一个产生值。可以将所得的值拟合到广义线性模型(例如,基于具有已知临床结局的群体的HRRD得分产生),以便得出给定样本的聚合HRRD得分。
广义线性模型可以以Macintyre中所述或本领域中已知的其他方式构建。用户可以根据需要针对给定应用(例如,基于癌症类型/阶段或患者人口统计因素)选择所需的开发组。例如,可以使用获自具有已知临床结局的患者的约250个卵巢癌样品的开发组来构建根据本公开文本的基因组瘢痕测定的广义线性模型。此特定的开发组产生了具有以下公式的广义线性模型:HRRD得分=a+(b×区段大小)+(c×每单位长度(10mb)的断点计数)+(d×拷贝数),其中“a”=77465.2750;“b”=-1.1178;“c”=-515.7440;并且“d”=-1.8780。如上所述,这些组分中的每一个的值可以针对给定样品进行计算,并且将其插入到此广义线性公式中以计算所述样品的HRRD得分。如下文提供的例子中进一步详细描述的,HRRD得分可以针对获自具有已知临床结局的受试者的一组样品进行计算,以便确定用于将样品分类为HRRD阳性或HRRD阴性的适当截止值。可以理解,此截止值可以根据需要针对给定类型的癌症凭经验确定。
在其他方面,本公开文本提供了一种治疗癌症的方法,所述方法包括基于本文所述的方法,将癌症治疗施用于已经被诊断具有HRRD的人类受试者。在特定方面,所述方法进一步包括施用DNA损伤剂、蒽环类、拓扑异构酶I抑制剂、辐射、和/或聚ADP-核糖聚合酶(PARP)抑制剂。
根据本公开文本的治疗癌症的另外的方法可以包括:a)通过电子设备接收扩增产物的测序结果,所述扩增产物是使用获自在人类受试者中发现的肿瘤的基因组DNA通过多重PCR产生的,其中所述测序结果包含多个含有SNP的扩增子的序列;b)通过所述电子设备确定每个所述SNP的BAF和拷贝数参数;c)使用ASCAT算法,基于每个所述SNP的BAF和拷贝数参数,通过所述电子设备鉴定多个基因组区段;d)基于所述基因组区段,通过所述电子设备确定混合模型的三种组分的后验概率,其中所述组分包括区段大小、每单位长度的断点计数和拷贝数;e)基于所述混合模型的三种组分的后验概率,使用线性模型,通过所述电子设备计算HRRD得分;以及f)基于所述HRRD得分,为所述受试者选择和/或施用癌症治疗。
根据本公开文本的治疗癌症的其他方法可以包括a)从获自已知患有或怀疑患有癌症的人类受试者的样本中获得基因组DNA;以及b)使用所述基因组DNA通过进行多重PCR扩增多个含有SNP的扩增子,其中所述多重PCR是使用被配置为扩增跨所有22条人类体细胞染色体的至少5,000个扩增子的一组PCR引物进行的,其中每个扩增子包含SNP;c)基于所述多个扩增子的序列,确定所述人类受试者的HRRD得分;以及d)基于所述HRRD得分,为所述受试者选择和/或施用癌症治疗。
在一些方面,所述癌症治疗可以包括施用DNA损伤剂、蒽环类、拓扑异构酶I抑制剂、辐射、和/或PARP抑制剂(如奥拉帕尼)。如本文所述,用户可以选择HRRD得分截止阈值用于分类样品(例如,肿瘤的样品)是HRRD阳性还是HRRD阴性。此阈值可以基于获自可获得已知临床结局的受试者的样品(例如,肿瘤的样品)的HRRD得分概况ECI得分。因此,在一些方面,所选择的癌症治疗是当所述HRRD得分高于或低于预选择的阈值时,施用PARP抑制剂。癌症可以是卵巢癌(例如,PSOC或PROC),或HRRD得分与临床结局相关的任何其他癌症。应理解,人们可以通过分析获自可获得已知临床结局的患者的HRRD得分来确定HRRD得分是否可用作临床结局和/或治疗有效性的诊断指标。
在另一个通用方面,本公开文本提供了一种用于预测HRRD的系统,所述系统包括:包含一个或多个处理器的电子设备,所述电子设备被配置为:接收扩增产物的测序结果,所述扩增产物是使用获自人类受试者的基因组DNA通过多重PCR产生的,其中所述测序结果包含多个含有SNP的扩增子的序列;确定每个所述SNP的β等位基因频率(BAF)和拷贝数参数;使用ASCAT算法,基于每个所述SNP的BAF和拷贝数参数,鉴定多个基因组区段;基于所述基因组区段,确定混合模型的三种组分的后验概率,其中所述组分包括区段大小、每单位长度的断点计数和拷贝数;以及基于所述混合模型的三种组分的后验概率,使用线性模型计算HRRD得分。所述电子设备可以是具有一个或多个处理器的计算机(例如,台式个人计算机)或基于云的服务器,所述一个或多个处理器被配置为执行用于进行本文所述的任何方法(或其步骤)的指令。例如,此类系统可以被配置为接收多重PCR扩增产物的测序结果,并且执行如本文所述计算HRRD得分所需的所有下游分析。在一些方面,所述软件可以被配置为允许用户选择或修改用于计算HRRD得分的广义线性模型(例如,通过选择与给定类型的癌症相关的得分)。
在另一个通用方面,本公开文本提供了扩增基因组DNA或产生扩增产物(例如,使用本文所述的试剂盒)的方法。例如,扩增基因组DNA的方法可以包括:a)从获自人类受试者(例如,已知患有或怀疑患有癌症)的样本中获得基因组DNA;以及b)通过使用所述基因组DNA进行多重PCR来扩增多个含有SNP的扩增子;其中所述多重PCR是使用被配置为扩增跨所有22条人类体细胞染色体的至少5,000个扩增子的一组PCR引物进行的,其中每个扩增子包含SNP。
一种产生PCR扩增产物的方法可以类似地包括:a)从获自人类受试者(例如,已知患有或怀疑患有癌症)的样本中获得基因组DNA;以及b)通过使用所述基因组DNA进行多重PCR扩增多个各自含有单核苷酸多态性(SNP)的扩增子,产生PCR扩增产物;其中所述多重PCR是使用被配置为扩增跨所有22条人类体细胞染色体的至少5,000个扩增子的一组PCR引物进行的。
在此类方法的一些方面,每个扩增子可以包含100-300bp(例如,100bp)的最大长度,和/或平均扩增子密度可以是1个扩增子/400-600kb体细胞染色体DNA。多个扩增子还可以包括与HR修复途径相关的基因的一个或多个部分,所述基因例如BRCA1、BRCA2、BRIP1、RAD51C、RAD51D、ATM、BARD1、CHEK1、CHEK2、FANCA、FANCL、NBN、PALB2、RAD51B、RAD54L、CDK12和/或TP53。
将通过以下实施例说明根据本公开文本的示例性基因组瘢痕测定的开发、验证和使用。
实施例1:根据本公开文本的基因组瘢痕测定的开发
在一些方面,本公开文本提供了一种全基因组的、基于多重PCR的瘢痕测定,所述测定利用了考虑杂合性丢失(LOH)和拷贝数特征的方法。此类测定可以有利地设计为用于检测基因组瘢痕的基于MASTR的通用单重测试。MASTR(用于重测序的特定靶标多重扩增)测定能够在有限数量的PCR反应中对目的基因的所有必需编码序列进行多重PCR扩增。MASTR测定及当代下一代测序(NGS)技术对DNA扩增子的进一步下游汇集和对单独样品的条形码化允许出于研究和诊断两种目的进行简单、高通量和有成本效益的测序。
此示例性基因组瘢痕的开发过程开始于选择用于跨所有人类常染色体进行多重PCR扩增的引物,其中分辨率大约为500kb,对应于大约6,000个扩增子。每个扩增子进一步需要含有SNP和100bp的最大扩增子长度(用于cfDNA相容)。理想情况下,所有引物都应相容以允许单重扩增。
为此,使用计算机技术来选择用于此示例性基因组瘢痕测定的一组引物。至此,重复区域(例如,UCSC基因组浏览器中定义的重复区域、重复掩蔽区域和简单重复序列)在人类基因组中被掩蔽。然后,为了强制围绕流行的SNP设计扩增子(以允许计算肿瘤组织分数和LOH二者),以阶梯方法从1,000个基因组的数据库中提取掩蔽区域之外的SNP。SNP流行率是根据全球人口流行率确定的。在选择适用的SNP后,从人类参考基因组中提取此SNP周围的DNA序列,并且设计推定的PCR引物,从而允许扩增含有SNP的扩增子(“SNP扩增子”)。
总之,确定了3批SNP扩增子和伴随的推定引物,包含大约2,000,000个SNP扩增子。接下来,使用修改的PCR多重化算法执行计算机单重设计,所述修改的PCR多重化算法开始于选择一个初始高流行的SNP作为单重第一个扩增子,并且随着SNP频率流行率的降低依序添加2,000,000个推定的SNP扩增子中的每一个,并且检查所述扩增子与已经在计算机中单重存在的扩增子的相容性。由于从计算方面上对大型单重PCR反应多重化在时间空间中是高度非线性过程,因为找到相容引物对的机会随着处理时间的推移而降低,从而导致按照添加的引物对而言的处理时间更长。总之,需要大约100个计算日才能将2,000,000个推定序列从计算方面上有效地多重化到单管PCR反应中。为了加快这种基因组瘢痕测定的开发,验证并且优化计算机多重化结果的工作并行进行,同时进行这种计算机多重化模拟。
在对第一批大约300,000个SNP扩增子进行计算机多重化后,订购了3,421个引物对并且等摩尔混合在一起(引物混合),然后进行PCR扩增和NGS。初始PCR扩增条件(缓冲液组成和循环条件)与用于Clarigo的条件相同。允许基于NGS的分析来确定哪些引物导致引物二聚体(PD)(随后从引物混合物中去除)形成。通过将来自第二计算机设计批次的1,852个引物对添加到拆分PD的引物混合物中来重复此过程,并且再次扩增、测序和分析形成PD的引物。这是第三次用设计用于填补前两批空位的引物进行的。该第三批引物含有756个引物,并且将其添加到来自第一次和第二次设计的拆分PD的引物混合物中。再次对完成的引物混合物进行测序并且分析形成PD的引物。接下来,从最终的引物混合物中去除所有形成PD的引物,重新制作完整的引物混合物,测序并且分析导致扩增子呈现不足或呈现过度并且显示杂合SNP的显著扩增偏倚的引物对。具体地,将覆盖率高于5x平均覆盖率的扩增子、归一化覆盖率低于50x平均覆盖率的扩增子和平均杂合等位基因频率在40%-60%范围之外的扩增子排除并且从所述测定中物理去除。这导致含有分布在所有常染色体上的5,201个扩增子(平均密度为1个扩增子/531kb)的最终基因组瘢痕测定。图2展示了SNP扩增子在常染色体上的分布。在计算机上设计并且排序了总共6,029个引物对,其中5,201个(86%)被保留在最终的基因组瘢痕MASTR测定中。
实施例2:根据本公开文本的基因组瘢痕测定的验证
实施例1中开发的基因组瘢痕测定的性能是通过使用先前用SNP阵列分析的参考样品测试所述测定来验证的。SNP阵列是含有固定的等位基因特异性寡核苷酸探针的微阵列。如图4所展示,每个SNP的β等位基因频率(BAF)和拷贝数参数(使用log比率值归一化)的图案与SNP阵列得到的图案高度相似,但事实是SNP阵列的数据点密度是基因组瘢痕测定的160分之一。
还测试了基因组瘢痕测定与一组FFT(新鲜冷冻组织)、FFPE(福尔马林固定石蜡包埋)和cfDNA(无细胞DNA)样品的相容性。首先,使用基因组瘢痕测定扩增了62个HGSOC FFT样品的组。使用NGS对扩增产物进行测序。对于所有这些样品,TAI、LST和HRRD-LOH得分可用作参考数据。如上所述计算瘢痕得分,与基于SNP阵列数据计算的得分相关。图5示出了可以分类为良好的每个得分的相关性。
其次,用基因组瘢痕测定分析了55个高分级浆液性卵巢癌(HGSOC)FFPE样品,其中39个样品与第一项研究的FFT样品匹配。此数据证实了可以成功计算源自FFPE的DNA样品的基因组瘢痕得分。
第三,使用基因组瘢痕测定分析来自CLIO研究(NCT02822157)的50个cfDNA样品和来自复发性肿瘤活检物的匹配HGSOC FFT样品。每位患者都可获得来自原发肿瘤的FFPE组织。在包括的154名患者中,103名被随机分配到奥拉帕尼群组(并且接受了这种PARP抑制剂),并且51名被分配在化疗群组中。在后一个群组中,32名患者接受了奥拉帕尼的交叉治疗,这意味着135名患者可获得奥拉帕尼反应数据(总体客观反应,主要终点)。对于所有包括的患者,可以获得疗法前和试验期间每月的血浆样品。在135名具有奥拉帕尼反应数据的患者的这一群组中,提取了105个治疗前cfDNA样品、105个匹配的种系DNA样品和50个源自治疗前活检物的匹配FFT DNA样品。这是一个高度独特的临床数据集,并且也是同类中最大的数据集之一。我们的结果表明在cfDNA样品与匹配的FFT肿瘤样品之间的瘢痕得分具有良好的相关性,条件是存在20%的最小肿瘤组织含量。
实施例3:使用基因组瘢痕测定来预测患有铂耐药性或铂敏感性卵巢癌的患者对
PARP抑制剂的反应性
CLIO试验NCT 02822154在一组随机分组的患有复发性卵巢癌的患者中评价了奥拉帕尼单一疗法(PARP抑制剂)与化学疗法。PARP抑制剂治疗被批准作为响应铂敏感性复发性卵巢癌(PSOC)的维持。在此研究中,患有PSOC的患者被随机分配到两个初始群组中的一组,并且用奥拉帕尼或化学疗法治疗。平行地,第二组患有铂耐药性复发性卵巢癌(PROC)的患者被随机分配到奥拉帕尼或化学疗法治疗群组。随后选择两个化学疗法群组的亚组用于奥拉帕尼治疗;这种交叉设计提供了关于化学疗法和奥拉帕尼治疗的组合的另外的见解。
源自FFPE的原发性肿瘤DNA获自大多数患者,并且用于使用根据本公开文本的基因组瘢痕测定产生每个患者的HRRD得分。在这种情况下,使用基于对来自UZ Leuven肿瘤库的207例HGSOC病例的分析产生的混合模型确定区段大小、每单位长度的断点计数和拷贝数组分的后验概率。将HRRD得分与随访评价时观察到的患者结局进行比较。如图6所展示,对FFPE样品的基于SNP扩增子的基因组瘢痕测定可预测关于PSOC群组的患者对奥拉帕尼的反应。例如,图6示出了PSOC群组中HRRD得分高的患者更有可能经历完全或部分缓解(分别为CR或PR)。对于此研究,30的截止得分可用于对HRRD阳性与HRRD阴性样品进行分类。应理解,此截止得分可以由基因组瘢痕测定的用户选择。在一些情况下,截止值可基于对具有已知临床结局的癌症患者的HRRD得分的先前经验研究。因此,HRRD截止值可部分基于给定癌症的分期类型、患者的人口统计学或其他因素。
实施例4:根据本公开文本的用于基因组瘢痕测定的试剂盒
如上所述,本文所述的基因组瘢痕测定可用于分析使用基于MASTR的单重测试产生的测序数据。为此,SureMASTR HRRD Scar试剂盒被开发为这样的分子测定,所述分子测定用于半定量评估从来自原发性或转移性癌症的福尔马林固定的石蜡包埋(FFPE)或新鲜冷冻(FF)的肿瘤组织中分离的基因组DNA中的肿瘤基因组不稳定性。SureMASTR HRRD Scar试剂盒可用于与Illumina NGS系统试剂盒的drMID组合,以允许基于通用PCR掺入使用SureMASTR HRRD Scar试剂盒产生的所有扩增子的分子标识符(MID)或条形码以及下一代测序(NGS)特异性衔接子。SureMASTR HRRD Scar试剂盒和用于一个或多个Illumina NGS系统试剂盒的drMID可用作在Illumina MiSeq或NextSeq上序列分析的前端扩增测试。所述技术基于靶向重测序,并且依赖于多重PCR扩增和NGS。
SureMASTR HRRD Scar试剂盒包括在含有BSA、KCl和MgCl2的tricine缓冲液(pH8.0)中包含特定寡核苷酸引物和dNTP的PCR混合物;Taq DNA聚合酶和扩增试剂1。用户可以使用所述试剂盒使用单管多重PCR扩增从FFPE或FFT样品提取的基因组DNA,或cfDNA(例如,分离自血浆)。然后可以使用本文所述的方法对所得的扩增产物进行测序和分析,以确定从中提取基因组DNA的样品的HRRD得分,和/或以为人类受试者作出诊断或为人类受试者选择治疗(例如,以确定PARP抑制剂是否可能有效)。
在一些方面,本文所述的方法可以使用通用计算机系统全部或部分地执行。例如,对于给定样品获得的测序结果可以通过实现产生HRRD得分所需的ASCAT算法和/或其他处理步骤的软件进行分析,如本文所述。
图7展示了可以在其上实现所公开的系统和方法的通用计算机系统(其可以是个人计算机或服务器)的例子。如所示,所述计算机系统包括中央处理单元21、系统存储器22和连接各种系统部件(包括与中央处理单元21相关联的存储器)的系统总线23。系统总线23像现有技术中已知的任何总线结构一样实现,进而含有总线存储器或总线存储器控制器、外围总线和能够与任何其他总线架构交互的局部总线。系统存储器包括永久存储器(ROM)24和随机存取存储器(RAM)25。基本输入/输出系统(BIOS)26包括确保在个人计算机20的元件之间传输信息的基本程序,如使用ROM 24加载操作系统时的那些。
进而,个人计算机20包括用于读取和写入数据的硬盘27、用于在可移动磁盘29上读取和写入的磁盘驱动器28以及用于在可移动光盘31上读取和写入的光驱30,如CD-ROM、DVD-ROM和其他光信息介质。硬盘27、磁盘驱动器28和光驱30分别通过硬盘接口32、磁盘接口33和光驱接口34与系统总线23连接。驱动器和相应的计算机信息介质是独立于电源的模块,用于存储个人计算机20的计算机指令、数据结构、程序模块和其他数据。
本公开文本提供了使用硬盘27、可移动磁盘29和可移动光盘31的系统的实现,但是应当理解,可以采用能够以计算机可读形式存储数据的其他类型的计算机信息介质56(固态驱动器、闪存卡、数字磁盘、随机存取存储器(RAM)等),所述计算机信息介质经由控制器55与系统总线23连接。
计算机20具有文件系统36,其中保存了记录的操作系统35、以及另外的程序应用37、其他程序模块38和程序数据39。用户能够通过使用输入设备(键盘40、鼠标42)将命令和信息输入个人计算机20中。可以使用其他输入设备(未显示):麦克风、操纵杆、游戏控制器、扫描仪等。此类输入设备通常通过串行端口46插入计算机系统20中,进而与系统总线连接,但是也可以以其他方式(例如借助并行端口、游戏端口或通用串行总线(USB))连接。监视器47或其他类型的显示设备也通过接口如视频适配器48与系统总线23连接。除了监视器47外,个人计算机还可以配备有其他外围输出设备(未显示),如扬声器、打印机等。
个人计算机20能够使用与一台或多台远程计算机49的网络连接在网络环境中运行。一台远程计算机(或多台计算机)49也是在描述个人计算机20的性质方面具有上述元件(如图7所示)的大部分或全部的个人计算机或服务器。其他设备也可以存在于计算机网络中,如路由器、网络站、对等设备或其他网络节点。
网络连接可以形成局域计算机网络(LAN)50和广域计算机网络(WAN)。此类网络用于公司计算机网络和公司内部网络,并且它们通常可以访问因特网。在LAN或WAN网络中,个人计算机20通过网络适配器或网络接口51与局域网络50连接。当使用网络时,个人计算机20可以采用调制解调器54或其他模块来提供与广域计算机网络(如因特网)的通信。调制解调器54是内部或外部设备,通过串行端口46与系统总线23连接。需要注意的是,网络连接只是例子,并且不需要描绘网络的确切配置,即实际上存在通过技术通信模块建立一台计算机与另一台计算机的连接的其他方式。
在各个方面,本文所述的系统和方法可以在硬件、软件、固件或其任何组合中实现。如果在软件中实现,所述方法可以作为一个或多个指令或代码存储在非瞬态计算机可读介质上。计算机可读介质包括数据存储器。举例来说而非限制,此类计算机可读介质可以包含RAM、ROM、EEPROM、CD-ROM、闪存或其他类型的电、磁或光存储介质,或可用于以指令或数据结构的形式携带或存储所需的程序代码并且可以由通用计算机的处理器访问的任何其他介质。
引用本公开文本的原理、方面和实施方案以及其具体实施例的所有本文陈述旨在涵盖其结构和功能等效物二者。另外,此类等效物旨在包括当前已知的等效物和将来开发的等效物,即,所开发的执行相同功能的任何元件,而不管结构如何。因此,本公开文本的范围不旨在受限于本文示出并描述的示例性实施方案。相反,本公开文本的范围和精神由所附权利要求体现。
将在本说明书中引用的所有出版物和专利均通过引用并入本文,就好像每个单独的出版物或专利被具体且单独地指出通过引用并入本文,并且通过引用并入本文以公开和描述出版物所引用的相关的方法和/或材料。对任何出版物的引用是针对其在申请日之前的披露内容,并且不应被解释为承认本发明因为先前的发明而不能获得比这种出版物更早的申请日。另外,所提供的出版物的日期可能不同于实际出版日期,实际出版日期可能需要独立确认。
Claims (70)
1.一种用于预测同源重组修复缺陷(HRRD)的方法,所述方法包括以下步骤:
a)提供获自人类受试者的生物样本,其中所述样本包含基因组DNA;
b)对所述基因组DNA进行多重聚合酶链式反应(PCR)测定以产生扩增产物,其中所述PCR测定被配置为扩增多个扩增子;
c)对所述扩增产物的至少一部分进行测序以产生测序结果;以及
d)基于所述测序结果,确定所述生物样本的一组参数,其中所述参数组包括:
i)区段大小参数,
ii)每单位长度的断点计数参数,以及
iii)拷贝数参数。
2.根据权利要求1所述的方法,所述方法进一步包括:步骤e)基于所确定的参数组,预测所述生物样本是否获自具有HRRD的细胞、组织或肿瘤。
3.根据权利要求1所述的方法,所述方法进一步包括步骤e)基于所确定的参数组,为提供所述生物样本的人类受试者选择治疗。
4.根据权利要求1所述的方法,所述方法进一步包括步骤e)基于所确定的参数组,预测所述人类受试者对包含以下的癌症治疗方案的反应:DNA损伤剂、蒽环类、拓扑异构酶I抑制剂、辐射和/或聚ADP-核糖聚合酶(PARP)抑制剂。
5.根据权利要求2-4中任一项所述的方法,其中在步骤e)之前,将所述区段大小参数、所述每单位长度的断点计数参数和所述拷贝数参数合并以产生聚合得分。
6.根据权利要求1-5中任一项所述的方法,其中所述区段大小参数是通过以下方式确定的:
鉴定多个区段,其中区段被定义为由至少3个含有杂合多态位置的连续扩增子组成的基因组DNA的一部分,所述连续扩增子具有相同的拷贝数;
确定所鉴定的多个区段的区段大小分布;以及
计算描述所述区段大小的混合组分的后验概率,所述后验概率是通过对开发组的混合建模确定的。
7.根据权利要求1-6中任一项所述的方法,其中所述多个区段包含各自具有以下的区段:
a)在5-50兆碱基对(MBp)范围内的大小;
b)在1-10、10-20、20-30、30-40或40-50MBp长度范围内的大小;
c)至少5、10、15、20、25、30、35、40、45或50MBp长度的大小,或
d)小于5、10、15、20、25、30、35、40、45或50MBp长度的大小。
8.根据权利要求1-7中任一项所述的方法,其中所述每单位长度的断点计数参数是通过计算描述断点数的混合组分的后验概率确定的,所述后验概率是通过对开发组进行混合建模确定的。
9.根据权利要求8所述的方法,其中针对基因组DNA的一部分计算每单位长度的断点计数,其中所述部分由存在于所述基因组DNA内的一条或多条染色体或染色体臂组成。
10.根据权利要求1-9中任一项所述的方法,其中所述拷贝数参数是通过计算所述基因组DNA的一个或多个区段的拷贝数确定的,其中区段被定义为由至少3个含有杂合多态位置的连续扩增子组成的基因组DNA的一部分,所述连续扩增子具有相同的拷贝数。
11.根据权利要求10所述的方法,其中所述拷贝数参数是基于所述基因组DNA的多个区段计算的。
12.根据权利要求11所述的方法,其中所述拷贝数参数是基于至少5、10、15、20、25、30、35、40、45、50、100、150、200、250或500个区段计算的。
13.根据权利要求11所述的方法,其中所述拷贝数参数是:
a)基于所述基因组DNA的多个区段,并且通过确定描述所述多个区段的拷贝数的混合组分的后验概率计算,所述后验概率是通过对开发组的混合建模确定的;和/或
b)至少部分基于所述多个区段的分类,所述分类基于它们各自的倍性值。
14.根据权利要求1-13中任一项所述的方法,其中所述生物样本获自a)健康的人类受试者或b)已经被诊断患有或怀疑患有癌症的人类受试者。
15.根据权利要求1-14中任一项所述的方法,其中所述基因组DNA包含整倍体基因组,并且所述PCR测定被配置为扩增至少1,000;2,000;3,000;4,000;5,000;6,000;7,000;或8,000个扩增子。
16.根据权利要求1-15中任一项所述的方法,其中每个扩增子含有至少一个多态性位置,所述至少一个多态性位置具有至少10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%或25%的次要等位基因的平均群体频率。
17.一种治疗癌症的方法,所述方法包括基于根据权利要求1-16中任一项所述的方法,将癌症治疗施用于已经被诊断具有HRRD的人类受试者。
18.根据权利要求17所述的方法,其中所述癌症治疗是DNA损伤剂、蒽环类、拓扑异构酶I抑制剂、辐射、和/或聚ADP-核糖聚合酶(PARP)抑制剂。
19.一种用于预测同源重组修复缺陷(HRRD)的方法,所述方法包括以下步骤:
a)对获自人类受试者的基因组DNA进行多重聚合酶链式反应(PCR)测定,以产生包含多个含有单核苷酸多态性(SNP)的扩增子的扩增产物;
b)确定每个所述SNP的β等位基因频率(BAF)和拷贝数参数;
c)使用ASCAT算法,基于每个所述SNP的BAF和拷贝数参数,鉴定多个基因组区段;
d)使用所述基因组区段,确定混合模型的三种组分的后验概率,其中所述组分包括区段大小、每单位长度的断点计数和拷贝数;以及
e)基于所述混合模型的三种组分的后验概率,使用线性模型计算HRRD得分。
20.根据权利要求19所述的方法,所述方法进一步包括步骤f)基于所述HRRD得分,预测所述基因组DNA是否获自具有HRRD的细胞、组织或肿瘤。
21.根据权利要求19所述的方法,所述方法进一步包括步骤f)基于所述HRRD得分,预测所述人类受试者对包含以下的癌症治疗方案的反应:DNA损伤剂、蒽环类、拓扑异构酶I抑制剂、辐射、和/或聚ADP-核糖聚合酶(PARP)抑制剂。
22.根据权利要求19-21中任一项所述的方法,其中所述区段大小组分是通过以下方式确定的:
鉴定多个区段,其中区段被定义为由至少3个含有杂合多态位置的连续扩增子组成的基因组DNA的一部分,所述连续扩增子具有相同的拷贝数;
确定所鉴定的多个区段的区段大小分布;以及
计算描述所述区段大小的混合组分的后验概率,所述后验概率是通过对开发组的混合建模确定的。
23.根据权利要求19-22中任一项所述的方法,其中所述多个区段包含各自具有以下的区段:
a)在5-50兆碱基对(MBp)范围内的大小;
b)在1-10、10-20、20-30、30-40或40-50MBp长度范围内的大小;
c)至少5、10、15、20、25、30、35、40、45或50MBp长度的大小,或
d)小于5、10、15、20、25、30、35、40、45或50MBp长度的大小。
24.根据权利要求19-23中任一项所述的方法,其中所述每单位长度的断点计数组分是通过计算描述断点数的混合组分的后验概率确定的,所述后验概率是通过对开发组进行混合建模确定的。
25.根据权利要求24所述的方法,其中针对基因组DNA的一部分计算每单位长度的断点计数,其中所述部分由存在于所述基因组DNA内的一条或多条染色体或染色体臂组成。
26.根据权利要求19-25中任一项所述的方法,其中所述拷贝数组分是通过计算所述基因组DNA的一个或多个区段的拷贝数确定的,其中区段被定义为由至少3个含有杂合多态位置的连续扩增子组成的基因组DNA的一部分,所述连续扩增子具有相同的拷贝数。
27.根据权利要求26所述的方法,其中所述拷贝数组分是基于所述基因组DNA的多个基因组区段计算的。
28.根据权利要求26所述的方法,其中所述拷贝数组分是基于至少5、10、15、20、25、30、35、40、45、50、100、150、200、250或500个基因组区段计算的。
29.根据权利要求26所述的方法,其中所述拷贝数组分是:
a)基于所述基因组DNA的多个基因组区段,并且通过确定描述所述多个基因组区段的拷贝数的混合组分的后验概率计算,所述后验概率是通过对开发组的混合建模确定的;和/或
b)至少部分基于所述多个基因组区段的分类,所述分类基于它们各自的倍性值。
30.根据权利要求19-29中任一项所述的方法,其中所述基因组DNA是从采取自以下的生物样本中提取的:a)健康的人类受试者或b)已经被诊断患有或怀疑患有癌症的人类受试者。
31.根据权利要求19-30中任一项所述的方法,其中所述基因组DNA包含整倍体基因组,并且所述PCR测定被配置为扩增至少1,000;2,000;3,000;4,000;5,000;6,000;7,000;或8,000个扩增子。
32.根据权利要求19-31中任一项所述的方法,其中每个扩增子含有至少一个多态性位置,所述至少一个多态性位置具有至少10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%或25%的次要等位基因的平均群体频率。
33.一种用于预测同源重组修复缺陷(HRRD)的方法,所述方法包括:
a)提供包含一个或多个处理器的电子设备;
b)通过所述电子设备接收扩增产物的测序结果,所述扩增产物是使用获自人类受试者的基因组DNA通过多重PCR产生的,其中所述测序结果包含多个含有SNP的扩增子的序列;
c)通过所述电子设备确定每个所述SNP的β等位基因频率(BAF)和拷贝数参数;
d)使用ASCAT算法,基于每个所述SNP的BAF和拷贝数参数,通过所述电子设备鉴定多个基因组区段;
e)基于所述基因组区段,通过所述电子设备确定混合模型的三种组分的后验概率,其中所述组分包括区段大小、每单位长度的断点计数和拷贝数;以及
f)基于所述混合模型的三种组分的后验概率,使用线性模型,通过所述电子设备计算HRRD得分。
34.根据权利要求33所述的方法,所述方法进一步包括步骤f)基于所述HRRD得分,通过所述电子设备预测所述基因组DNA是否获自具有HRRD的细胞、组织或肿瘤。
35.根据权利要求33所述的方法,所述方法进一步包括步骤f)基于所述HRRD得分,通过所述电子设备预测所述人类受试者对包含以下的癌症治疗方案的反应:DNA损伤剂、蒽环类、拓扑异构酶I抑制剂、辐射、和/或聚ADP-核糖聚合酶(PARP)抑制剂。
36.根据权利要求34-35中任一项所述的方法,其中所述区段大小组分是通过以下方式确定的:
鉴定多个区段,其中区段被定义为由至少3个含有杂合多态位置的连续扩增子组成的基因组DNA的一部分,所述连续扩增子具有相同的拷贝数;
确定所鉴定的多个区段的区段大小分布;以及
计算描述所述区段大小的混合组分的后验概率,所述后验概率是通过对开发组的混合建模确定的。
37.根据权利要求33-36中任一项所述的方法,其中所述多个区段包含各自具有以下的区段:
a)在5-50兆碱基对(MBp)范围内的大小;
b)在1-10、10-20、20-30、30-40或40-50MBp长度范围内的大小;
c)至少5、10、15、20、25、30、35、40、45或50MBp长度的大小,或
d)小于5、10、15、20、25、30、35、40、45或50MBp长度的大小。
38.根据权利要求33-37中任一项所述的方法,其中所述每单位长度的断点计数组分是通过计算描述断点数的混合组分的后验概率确定的,所述后验概率是通过对开发组进行混合建模确定的。
39.根据权利要求38所述的方法,其中针对基因组DNA的一部分计算每单位长度的断点计数,其中所述部分由存在于所述基因组DNA内的一条或多条染色体或染色体臂组成。
40.根据权利要求33-39中任一项所述的方法,其中所述拷贝数组分是通过计算所述基因组DNA的一个或多个区段的拷贝数确定的,其中区段被定义为由至少3个含有杂合多态位置的连续扩增子组成的基因组DNA的一部分,所述连续扩增子具有相同的拷贝数。
41.根据权利要求40所述的方法,其中所述拷贝数组分是基于所述基因组DNA的多个基因组区段计算的。
42.根据权利要求40所述的方法,其中所述拷贝数组分是基于至少5、10、15、20、25、30、35、40、45、50、100、150、200、250或500个基因组区段计算的。
43.根据权利要求40所述的方法,其中所述拷贝数组分是:
a)基于所述基因组DNA的多个基因组区段,并且通过确定描述所述多个基因组区段的拷贝数的混合组分的后验概率计算,所述后验概率是通过对开发组的混合建模确定的;和/或
b)至少部分基于所述多个基因组区段的分类,所述分类基于它们各自的倍性值。
44.根据权利要求33-43中任一项所述的方法,其中所述基因组DNA是从采取自以下的生物样本中提取的:a)健康的人类受试者或b)已经被诊断患有或怀疑患有癌症的人类受试者。
45.根据权利要求33-44中任一项所述的方法,其中所述基因组DNA包含整倍体基因组,并且所述PCR测定被配置为扩增至少1,000;2,000;3,000;4,000;5,000;6,000;7,000;或8,000个扩增子。
46.根据权利要求33-45中任一项所述的方法,其中每个扩增子含有至少一个多态性位置,所述至少一个多态性位置具有至少10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%或25%的次要等位基因的平均群体频率。
47.根据权利要求33-45中任一项所述的方法,其中所述电子设备是计算机。
48.根据权利要求47所述的方法,其中所述电子设备被配置为经由有线或无线网络接收所述测序结果。
49.一种用于预测同源重组修复缺陷(HRRD)的系统,所述系统包括:
包含一个或多个处理器的电子设备,所述电子设备被配置为
接收扩增产物的测序结果,所述扩增产物是使用获自人类受试者的基因组DNA通过多重PCR产生的,其中所述测序结果包含多个含有SNP的扩增子的序列;
确定每个所述SNP的β等位基因频率(BAF)和拷贝数参数;
使用ASCAT算法,基于每个所述SNP的BAF和拷贝数参数,鉴定多个基因组区段;
基于所述基因组区段,确定混合模型的三种组分的后验概率,其中所述组分包括区段大小、每单位长度的断点计数和拷贝数;以及
基于所述混合模型的三种组分的后验概率,使用线性模型计算HRRD得分。
50.一种用于预测同源重组修复缺陷(HRRD)的系统,所述系统包括:
包含一个或多个处理器的电子设备,所述一个或多个处理器被配置为执行根据权利要求1-48中任一项所述的一个或多个步骤。
51.一种用于进行多重PCR测定的试剂盒,所述试剂盒包含:
a)PCR反应混合物;
b)DNA聚合酶;和
c)一组PCR引物,其中所述PCR引物组被配置为扩增跨所有22条人类体细胞染色体的至少5,000个扩增子,其中每个扩增子包含SNP和100bp的最大长度。
52.根据权利要求51所述的方法,其中平均扩增子密度是1个扩增子/400-600kb体细胞染色体DNA。
53.根据权利要求51所述的方法,其中平均扩增子密度是1个扩增子/300-700kb体细胞染色体DNA。
54.根据权利要求51所述的方法,其中平均扩增子密度是1个扩增子/500-560kb体细胞染色体DNA。
55.根据权利要求51所述的方法,其中所述扩增子扩增以下基因的每一种的一个或多个部分:BRCA1、BRCA2、BRIP1、RAD51C、RAD51D、ATM、BARD1、CHEK1、CHEK2、FANCA、FANCL、NBN、PALB2、RAD51B、RAD54L、CDK12和TP53。
56.一种扩增基因组DNA的方法,所述方法包括:
a)从获自已知患有或怀疑患有癌症的人类受试者的样本中获得基因组DNA;以及
b)通过使用所述基因组DNA进行多重PCR来扩增多个含有单核苷酸多态性(SNP)的扩增子;
其中所述多重PCR是使用被配置为扩增跨所有22条人类体细胞染色体的至少5,000个扩增子的一组PCR引物进行的,其中每个扩增子包含SNP。
57.根据权利要求56所述的方法,其中每个扩增子包含100bp的最大长度。
58.根据权利要求56所述的方法,其中平均扩增子密度是1个扩增子/400-600kb体细胞染色体DNA。
59.根据权利要求56所述的方法,其中所述多个扩增子包括以下基因的每一种的一个或多个部分:BRCA1、BRCA2、BRIP1、RAD51C、RAD51D、ATM、BARD1、CHEK1、CHEK2、FANCA、FANCL、NBN、PALB2、RAD51B、RAD54L、CDK12和TP53。
60.一种产生PCR扩增产物的方法,所述方法包括:
a)从获自已知患有或怀疑患有癌症的人类受试者的样本中获得基因组DNA;以及
b)使用所述基因组DNA通过进行多重PCR扩增多个各自含有单核苷酸多态性(SNP)的扩增子,产生所述PCR扩增产物;
其中所述多重PCR是使用被配置为扩增跨所有22条人类体细胞染色体的至少5,000个扩增子的一组PCR引物进行的。
61.根据权利要求60所述的方法,其中每个扩增子包含100bp的最大长度。
62.根据权利要求60所述的方法,其中平均扩增子密度是1个扩增子/400-600kb体细胞染色体DNA。
63.根据权利要求60所述的方法,其中所述多个扩增子包括以下基因的每一种的一个或多个部分:BRCA1、BRCA2、BRIP1、RAD51C、RAD51D、ATM、BARD1、CHEK1、CHEK2、FANCA、FANCL、NBN、PALB2、RAD51B、RAD54L、CDK12和TP53。
64.一种治疗癌症的方法,所述方法包括:
a)通过电子设备接收扩增产物的测序结果,所述扩增产物是使用获自人类受试者中发现的肿瘤的基因组DNA通过多重PCR产生的,其中所述测序结果包含多个含有SNP的扩增子的序列;
b)通过所述电子设备确定每个所述SNP的β等位基因频率(BAF)和拷贝数参数;
c)使用ASCAT算法,基于每个所述SNP的BAF和拷贝数参数,通过所述电子设备鉴定多个基因组区段;
d)基于所述基因组区段,通过所述电子设备确定混合模型的三种组分的后验概率,其中所述组分包括区段大小、每单位长度的断点计数和拷贝数;
e)基于所述混合模型的三种组分的后验概率,使用线性模型,通过所述电子设备计算HRRD得分;以及
f)基于所述HRRD得分,为所述受试者选择和/或施用癌症治疗。
65.根据权利要求64所述的方法,其中所述癌症治疗是施用DNA损伤剂、蒽环类、拓扑异构酶I抑制剂、辐射、和/或聚ADP-核糖聚合酶(PARP)抑制剂。
66.根据权利要求64所述的方法,其中所选择的癌症治疗是当所述HRRD得分高于预选择的阈值时,施用PARP抑制剂。
67.一种治疗癌症的方法,所述方法包括:
a)从获自已知患有或怀疑患有癌症的人类受试者的样本中获得基因组DNA;以及
b)使用所述基因组DNA通过进行多重PCR来扩增多个含有单核苷酸多态性(SNP)的扩增子,其中所述多重PCR是使用被配置为扩增跨所有22条人类体细胞染色体的至少5,000个扩增子的一组PCR引物进行的,其中每个扩增子包含SNP;
c)基于所述多个扩增子的序列,确定所述人类受试者的同源重组修复缺陷(HRRD)得分;以及
d)基于所述HRRD得分,为所述受试者选择和/或施用癌症治疗。
68.根据权利要求67所述的方法,其中所述癌症是卵巢癌。
69.根据权利要求67所述的方法,其中所述癌症是铂敏感性卵巢癌。
70.根据权利要求67所述的方法,其中所述癌症是铂耐药性卵巢癌。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962948640P | 2019-12-16 | 2019-12-16 | |
US62/948,640 | 2019-12-16 | ||
PCT/EP2020/086255 WO2021122620A1 (en) | 2019-12-16 | 2020-12-15 | Genomic scarring assays and related methods |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114829624A true CN114829624A (zh) | 2022-07-29 |
Family
ID=74175737
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080086602.7A Pending CN114829624A (zh) | 2019-12-16 | 2020-12-15 | 基因组瘢痕测定和相关方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230018079A1 (zh) |
EP (1) | EP4077719A1 (zh) |
JP (1) | JP2023506084A (zh) |
CN (1) | CN114829624A (zh) |
WO (1) | WO2021122620A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4141127B1 (en) * | 2021-08-30 | 2024-10-09 | Zentrum Familiärer Brust- und Eierstockkrebs Universitätsklinik Köln | Method for assessing homologous recombination deficiency in ovarian cancer cells |
GB202114203D0 (en) * | 2021-10-04 | 2021-11-17 | Cambridge Entpr Ltd | Method of characterising a dna sample |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014018080A1 (en) * | 2012-07-24 | 2014-01-30 | Natera, Inc. | Highly multiplex pcr methods and compositions |
WO2014165785A2 (en) * | 2013-04-05 | 2014-10-09 | Myriad Genetics, Inc. | Methods and materials for assessing homologous recombination deficiency |
WO2015086473A1 (en) * | 2013-12-09 | 2015-06-18 | Institut Curie | Methods for detecting inactivation of the homologous recombination pathway (brca1/2) in human tumors |
CN107287285A (zh) * | 2017-03-28 | 2017-10-24 | 上海至本生物科技有限公司 | 一种预测同源重组缺失机制及患者对癌症治疗响应的方法 |
WO2017191076A1 (en) * | 2016-05-01 | 2017-11-09 | Genome Research Limited | Method of characterising a dna sample |
-
2020
- 2020-12-15 WO PCT/EP2020/086255 patent/WO2021122620A1/en unknown
- 2020-12-15 US US17/785,300 patent/US20230018079A1/en active Pending
- 2020-12-15 CN CN202080086602.7A patent/CN114829624A/zh active Pending
- 2020-12-15 EP EP20838927.0A patent/EP4077719A1/en active Pending
- 2020-12-15 JP JP2022536811A patent/JP2023506084A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014018080A1 (en) * | 2012-07-24 | 2014-01-30 | Natera, Inc. | Highly multiplex pcr methods and compositions |
CN104685064A (zh) * | 2012-07-24 | 2015-06-03 | 纳特拉公司 | 高度复合pcr方法和组合物 |
WO2014165785A2 (en) * | 2013-04-05 | 2014-10-09 | Myriad Genetics, Inc. | Methods and materials for assessing homologous recombination deficiency |
WO2015086473A1 (en) * | 2013-12-09 | 2015-06-18 | Institut Curie | Methods for detecting inactivation of the homologous recombination pathway (brca1/2) in human tumors |
WO2017191076A1 (en) * | 2016-05-01 | 2017-11-09 | Genome Research Limited | Method of characterising a dna sample |
CN107287285A (zh) * | 2017-03-28 | 2017-10-24 | 上海至本生物科技有限公司 | 一种预测同源重组缺失机制及患者对癌症治疗响应的方法 |
Also Published As
Publication number | Publication date |
---|---|
EP4077719A1 (en) | 2022-10-26 |
JP2023506084A (ja) | 2023-02-14 |
US20230018079A1 (en) | 2023-01-19 |
WO2021122620A1 (en) | 2021-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220195530A1 (en) | Identification and use of circulating nucleic acid tumor markers | |
EP2526415B1 (en) | Partition defined detection methods | |
CN106795562B (zh) | Dna混合物中的组织甲基化模式分析 | |
Wang et al. | Clonal evolution in breast cancer revealed by single nucleus genome sequencing | |
CN112236520A (zh) | 甲基化标记和标靶甲基化探针板 | |
CN105243295B (zh) | 与癌症相关的遗传或分子畸变的检测 | |
TWI636255B (zh) | 癌症檢測之血漿dna突變分析 | |
TWI798718B (zh) | Dna混合物中組織之單倍型甲基化模式分析 | |
CN111278993A (zh) | 从无细胞核酸中检测体细胞单核苷酸变体并应用于微小残留病变监测 | |
AU2016293025A1 (en) | System and methodology for the analysis of genomic data obtained from a subject | |
WO2013086352A1 (en) | Prostate cancer associated circulating nucleic acid biomarkers | |
JP2024119880A (ja) | 合成トレーニングサンプルによるがん分類 | |
EP3310927B1 (en) | Gene signatures predictive of metastatic disease | |
US12106825B2 (en) | Computational modeling of loss of function based on allelic frequency | |
CN113574602A (zh) | 从循环无细胞核酸中灵敏地检测拷贝数变异(cnv) | |
JP2023516633A (ja) | メチル化シークエンシングデータを使用したバリアントをコールするためのシステムおよび方法 | |
EP4095258A1 (en) | Target-enriched multiplexed parallel analysis for assesment of tumor biomarkers | |
US20230018079A1 (en) | Genomic scarring assays and related methods | |
US20230223107A1 (en) | Method for identifying signatures for predicting treatment response | |
Ip et al. | Molecular Techniques in the Diagnosis and Monitoring of Acute and Chronic Leukaemias | |
WO2023097278A1 (en) | Sample contamination detection of contaminated fragments for cancer classification | |
CN118369439A (zh) | 用于评估乳腺癌亚型中同源重组缺陷的方法和材料 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |