JP2021052805A - 無細胞dna分析における遺伝子融合検出の方法および応用 - Google Patents
無細胞dna分析における遺伝子融合検出の方法および応用 Download PDFInfo
- Publication number
- JP2021052805A JP2021052805A JP2021003333A JP2021003333A JP2021052805A JP 2021052805 A JP2021052805 A JP 2021052805A JP 2021003333 A JP2021003333 A JP 2021003333A JP 2021003333 A JP2021003333 A JP 2021003333A JP 2021052805 A JP2021052805 A JP 2021052805A
- Authority
- JP
- Japan
- Prior art keywords
- fusion
- sequence
- sequencing
- read
- gene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000004927 fusion Effects 0.000 title abstract description 265
- 238000000034 method Methods 0.000 title abstract description 137
- 108090000623 proteins and genes Proteins 0.000 title abstract description 109
- 238000001514 detection method Methods 0.000 title description 7
- 238000004458 analytical method Methods 0.000 title description 4
- 238000012163 sequencing technique Methods 0.000 abstract description 94
- 108020004414 DNA Proteins 0.000 abstract description 62
- 210000000349 chromosome Anatomy 0.000 abstract description 44
- 102000053602 DNA Human genes 0.000 abstract description 16
- 238000013507 mapping Methods 0.000 description 51
- 150000007523 nucleic acids Chemical class 0.000 description 46
- 102000039446 nucleic acids Human genes 0.000 description 43
- 108020004707 nucleic acids Proteins 0.000 description 43
- 235000014676 Phragmites communis Nutrition 0.000 description 37
- 238000003776 cleavage reaction Methods 0.000 description 34
- 239000012634 fragment Substances 0.000 description 34
- 239000002773 nucleotide Substances 0.000 description 34
- 125000003729 nucleotide group Chemical group 0.000 description 34
- 230000007017 scission Effects 0.000 description 34
- 238000005520 cutting process Methods 0.000 description 32
- 206010028980 Neoplasm Diseases 0.000 description 29
- 201000011510 cancer Diseases 0.000 description 24
- 239000000523 sample Substances 0.000 description 22
- 230000003321 amplification Effects 0.000 description 19
- 238000003199 nucleic acid amplification method Methods 0.000 description 19
- 244000273256 Phragmites communis Species 0.000 description 13
- 239000011324 bead Substances 0.000 description 13
- 201000010099 disease Diseases 0.000 description 13
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 13
- 210000001519 tissue Anatomy 0.000 description 13
- 210000004027 cell Anatomy 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 12
- 239000003814 drug Substances 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 102000003960 Ligases Human genes 0.000 description 9
- 108090000364 Ligases Proteins 0.000 description 9
- 108091034117 Oligonucleotide Proteins 0.000 description 9
- 239000013611 chromosomal DNA Substances 0.000 description 9
- 229940079593 drug Drugs 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 150000001875 compounds Chemical class 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 239000012530 fluid Substances 0.000 description 8
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 230000036961 partial effect Effects 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 238000013268 sustained release Methods 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 206010060862 Prostate cancer Diseases 0.000 description 5
- 206010039491 Sarcoma Diseases 0.000 description 5
- 239000012472 biological sample Substances 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012165 high-throughput sequencing Methods 0.000 description 5
- 150000002500 ions Chemical class 0.000 description 5
- 108700028369 Alleles Proteins 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 230000000711 cancerogenic effect Effects 0.000 description 4
- 231100000315 carcinogenic Toxicity 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 102000040430 polynucleotide Human genes 0.000 description 4
- 108091033319 polynucleotide Proteins 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 239000012730 sustained-release form Substances 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 238000001712 DNA sequencing Methods 0.000 description 3
- 108060002716 Exonuclease Proteins 0.000 description 3
- 206010025323 Lymphomas Diseases 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 3
- 102000001307 androgen receptors Human genes 0.000 description 3
- 108010080146 androgen receptors Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 102000013165 exonuclease Human genes 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 201000005787 hematologic cancer Diseases 0.000 description 3
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 3
- 229920001519 homopolymer Polymers 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000037452 priming Effects 0.000 description 3
- 238000004393 prognosis Methods 0.000 description 3
- 102000004169 proteins and genes Human genes 0.000 description 3
- 238000012175 pyrosequencing Methods 0.000 description 3
- 238000003753 real-time PCR Methods 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 108700020796 Oncogene Proteins 0.000 description 2
- 101710086015 RNA ligase Proteins 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 208000000453 Skin Neoplasms Diseases 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 239000003599 detergent Substances 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 108091008053 gene clusters Proteins 0.000 description 2
- 238000012268 genome sequencing Methods 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 238000007912 intraperitoneal administration Methods 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 201000005202 lung cancer Diseases 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000001672 ovary Anatomy 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 201000000849 skin cancer Diseases 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 238000000527 sonication Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000002459 sustained effect Effects 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- WEVYNIUIFUYDGI-UHFFFAOYSA-N 3-[6-[4-(trifluoromethoxy)anilino]-4-pyrimidinyl]benzamide Chemical compound NC(=O)C1=CC=CC(C=2N=CN=C(NC=3C=CC(OC(F)(F)F)=CC=3)C=2)=C1 WEVYNIUIFUYDGI-UHFFFAOYSA-N 0.000 description 1
- 229920001621 AMOLED Polymers 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 241001132374 Asta Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 235000007836 Chlorogalum pomeridianum Nutrition 0.000 description 1
- 240000006670 Chlorogalum pomeridianum Species 0.000 description 1
- 241000511343 Chondrostoma nasus Species 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- CMSMOCZEIVJLDB-UHFFFAOYSA-N Cyclophosphamide Chemical compound ClCCN(CCCl)P1(=O)NCCCO1 CMSMOCZEIVJLDB-UHFFFAOYSA-N 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 208000002250 Hematologic Neoplasms Diseases 0.000 description 1
- 101000934888 Homo sapiens Succinate dehydrogenase cytochrome b560 subunit, mitochondrial Proteins 0.000 description 1
- 101000713590 Homo sapiens T-box transcription factor TBX1 Proteins 0.000 description 1
- 101000638154 Homo sapiens Transmembrane protease serine 2 Proteins 0.000 description 1
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 1
- 208000005016 Intestinal Neoplasms Diseases 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 208000003445 Mouth Neoplasms Diseases 0.000 description 1
- BACYUWVYYTXETD-UHFFFAOYSA-N N-Lauroylsarcosine Chemical compound CCCCCCCCCCCC(=O)N(C)CC(O)=O BACYUWVYYTXETD-UHFFFAOYSA-N 0.000 description 1
- 206010028729 Nasal cavity cancer Diseases 0.000 description 1
- 208000034176 Neoplasms, Germ Cell and Embryonal Diseases 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 208000009565 Pharyngeal Neoplasms Diseases 0.000 description 1
- 206010034811 Pharyngeal cancer Diseases 0.000 description 1
- 208000020584 Polyploidy Diseases 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 108700020978 Proto-Oncogene Proteins 0.000 description 1
- 102000052575 Proto-Oncogene Human genes 0.000 description 1
- 108010018070 Proto-Oncogene Proteins c-ets Proteins 0.000 description 1
- 102000004053 Proto-Oncogene Proteins c-ets Human genes 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 235000014548 Rubus moluccanus Nutrition 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 1
- 102100038021 Steryl-sulfatase Human genes 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 102100025393 Succinate dehydrogenase cytochrome b560 subunit, mitochondrial Human genes 0.000 description 1
- 108700019889 TEL-AML1 fusion Proteins 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 102100031989 Transmembrane protease serine 2 Human genes 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- IRLPACMLTUPBCL-FCIPNVEPSA-N adenosine-5'-phosphosulfate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@@H](CO[P@](O)(=O)OS(O)(=O)=O)[C@H](O)[C@H]1O IRLPACMLTUPBCL-FCIPNVEPSA-N 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 210000004100 adrenal gland Anatomy 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 239000009895 amole Substances 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 235000006533 astragalus Nutrition 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 229920002988 biodegradable polymer Polymers 0.000 description 1
- 239000004621 biodegradable polymer Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000002459 blastocyst Anatomy 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 210000000621 bronchi Anatomy 0.000 description 1
- 208000035269 cancer or benign tumor Diseases 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 241000902900 cellular organisms Species 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 210000003679 cervix uteri Anatomy 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 238000013270 controlled release Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 210000002726 cyst fluid Anatomy 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000008482 dysregulation Effects 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 210000003722 extracellular fluid Anatomy 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 230000005669 field effect Effects 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- LIYGYAHYXQDGEP-UHFFFAOYSA-N firefly oxyluciferin Natural products Oc1csc(n1)-c1nc2ccc(O)cc2s1 LIYGYAHYXQDGEP-UHFFFAOYSA-N 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- -1 for example Chemical class 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 210000000232 gallbladder Anatomy 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000003394 haemopoietic effect Effects 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 230000002489 hematologic effect Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 201000002313 intestinal cancer Diseases 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 239000002563 ionic surfactant Substances 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000006101 laboratory sample Substances 0.000 description 1
- 210000000867 larynx Anatomy 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 208000012987 lip and oral cavity carcinoma Diseases 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 235000019689 luncheon sausage Nutrition 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 230000005389 magnetism Effects 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 210000005075 mammary gland Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 108091005763 multidomain proteins Proteins 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000003739 neck Anatomy 0.000 description 1
- 230000001613 neoplastic effect Effects 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 239000002736 nonionic surfactant Substances 0.000 description 1
- 210000001331 nose Anatomy 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- JJVOROULKOMTKG-UHFFFAOYSA-N oxidized Photinus luciferin Chemical compound S1C2=CC(O)=CC=C2N=C1C1=NC(=O)CS1 JJVOROULKOMTKG-UHFFFAOYSA-N 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 238000009595 pap smear Methods 0.000 description 1
- 210000002990 parathyroid gland Anatomy 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 230000003169 placental effect Effects 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 108700004121 sarkosyl Proteins 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000002626 targeted therapy Methods 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 230000005740 tumor formation Effects 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- 239000002569 water oil cream Substances 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Analytical Chemistry (AREA)
- Medical Informatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Data Mining & Analysis (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Bioethics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Pathology (AREA)
- General Physics & Mathematics (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
本出願は、2015年10月10日に出願された米国仮出願番号第62/239,87
9号の利益を主張しており、この仮出願は、その全体が参考として本明細書中に援用され
る。
がん性細胞は、一体に融合した染色体を有しうる。このような染色体をシーケンシング
すれば、ゲノムの2つの異なるゾーン(または同じ染色体もしくは異なる染色体上)にマ
ッピングされうるリードが生成される。遺伝子融合は、遺伝子アーキテクチャーの進化に
おいて役割を果たす。重複、配列分岐、および組換えは、遺伝子進化において作用する主
要な寄与因子である。遺伝子融合が非コード配列領域内で起こる場合、今や別の遺伝子の
シス調節配列の制御下にある遺伝子の発現の調節異常をもたらしうる。遺伝子融合がコー
ド配列内で起こる場合、新たな遺伝子のアセンブリを引き起こしうることから、マルチド
メインタンパク質へと、ペプチドモジュールを追加することにより、新たな機能の出現を
可能とする。
よび逆転写ポリメラーゼ連鎖反応(RT−PCR)は、診断検査室で利用される、一般的
な方法である。これらの方法は全て、がんゲノムの複雑な性格のために、それぞれ別個の
欠点を有する。ハイスループットシーケンシングおよびカスタムDNAマイクロアレイな
ど、近年の発展は、より効率的な方法の導入において有望であるが、いまだに不十分であ
る。ハイスループットゲノムシーケンシング技術は、研究ツールとして使用されており、
現在、診療所にも導入されており、オーダーメイド医療の将来では、全ゲノム配列データ
は、治療的介入を導くのに、重要なツールでありうる。
一態様では、融合染色体DNA分子の、少なくとも一部のシーケンシングデータを含有
する融合リードを決定し;融合リードの少なくとも1つのマッピング部分が切り詰められ
る、ゲノム上の所定の点(切断点)を決定し;2つの切断点(切断点対)からの2つのマ
ッピングリード部分を、潜在的な融合候補として識別し;切断点対に基づき、1または複
数の融合セットを創出し、融合セットを、1または複数の融合クラスターへとクラスタリ
ングし;所定の基準を満たす各融合クラスターを、遺伝子融合として識別することにより
、遺伝子融合を決定するための、システムおよび方法が開示される。
であって、融合染色体DNA分子の、少なくとも一部のシーケンシングデータを含有する
融合リードを決定するステップと;融合リードの少なくとも1つのマッピング部分が切り
詰められる、ゲノム上の所定の点(切断点)を決定するステップと;2つの切断点(切断
点対)からの2つのマッピングリード部分を、潜在的な融合候補として識別するステップ
と;切断点対に基づき、1または複数の融合セットを創出し、融合セットを、1または複
数の融合クラスターへとクラスタリングするステップと;所定の基準を満たす各融合クラ
スターを、遺伝子融合として識別するステップとを含む方法を提示する。
ードへと割り当てるステップを含む。一部の実施形態では、方法は、リードの各マッピン
グ部分を、片側または両側から切り詰めるステップを含む。一部の実施形態では、切断点
は、アイデンティティにおいて、リードから独立しており、符号、染色体、および位置に
より識別される。一部の実施形態では、切断点は、切断点で切り詰められるかまたは分割
された多数のリードおよび分子と、切断点を通り越す、多数の野生型のリードおよび分子
とを含む統計を保持する。一部の実施形態では、方法は、適切な符号を伴う2つの切断点
に属する共通のリードIDを伴うあらゆる2つのマッピングリード部分を、潜在的な融合
候補として選択するステップを含む。一部の実施形態では、マッピングする前における、
元のリード内の、潜在的な融合候補の場所は、リード部分を、元々互いに隣接して位置す
るリード部分として示す。一部の実施形態では、方法は、リード部分が、1つの鎖にマッ
ピングされる場合、切断点の符号の差違について点検するステップを含む。一部の実施形
態では、方法は、融合セット統計を追跡するステップを含む。
子またはリードの数である。一部の実施形態では、方法は、融合クラスター内の、同様の
切断点により、融合セットを群分けするステップを含む。一部の実施形態では、同様の切
断点は、5を超えないヌクレオチド、10を超えないヌクレオチド、または25を超えな
いヌクレオチド離れた切断点である。一部の実施形態では、方法は、ゲノム内の2つの領
域の間で、融合クラスターを規定するステップを含む。一部の実施形態では、方法は、融
合クラスターに関して、各パートナーについて、多数の融合分子を決定するステップを含
む。一部の実施形態では、方法は、融合クラスターに関して、各パートナーについて、融
合リードの数を決定するステップを含む。一部の実施形態では、方法は、融合クラスター
に関して、各パートナーについて、多数の野生型分子を決定するステップを含む。一部の
実施形態では、方法は、融合クラスターに関して、各パートナーについて、多数の野生型
リードまたは野生型分子を決定するステップを含む。一部の実施形態では、方法は、融合
クラスターに関して、各パートナーについて、融合百分率を、各パートナーの、全分子に
対する融合分子の比率として決定するステップを含む。一部の実施形態では、全分子は、
野生型構成要素と、切り詰められた構成要素とを含む。一部の実施形態では、方法は、融
合クラスターに関して、各パートナーについて、遺伝子情報を決定するステップを含む。
一部の実施形態では、方法は、融合クラスターの、下流の遺伝子を決定するステップを含
む。一部の実施形態では、基準は、クラスター内に、1つを超える分子を有すること、ま
たはワトソン−クリック鎖の両方を伴う、少なくとも1つの分子を有することを含む。
と;DNAシーケンサーに結合されたプロセッサーであって、融合染色体DNA分子の一
部のシーケンシングデータを含有する融合リードを決定し;融合リードの少なくとも1つ
のマッピング部分が切り詰められる、ゲノム上の少なくとも1つの所定の点(切断点)を
決定し;2つの切断点(切断点対)からの2つのマッピングリード部分を、潜在的な融合
候補として識別し;切断点対に基づき、1または複数の融合セットを創出し、融合セット
を、1または複数の融合クラスターへとクラスタリングし;所定の基準を満たす各融合ク
ラスターを、遺伝子融合として識別するための命令を含むコンピュータコードを実行して
、試料に由来する遺伝子配列リードデータを処理するプロセッサーとを含むシステムを提
示する。
列のコレクションを生成するステップと;配列のコレクションを、基準ゲノムへとマッピ
ングするステップと;融合リードを、マッピングコレクションから識別するステップであ
って、融合リードが、部分配列を含有し、第1の部分配列が、第1の遺伝子座へとマッピ
ングされ、第2の部分配列が、第2の別個の遺伝子座へとマッピングされる、ステップと
;各融合リードについて、第1の遺伝子座における第1の切断点と、第2の遺伝子座にお
ける第2の切断点とを識別するステップであって、切断点が、融合リードの配列が切り詰
められた基準ゲノム上の点であり、第1の切断点と、第2の切断点とが、切断点対を形成
する、ステップと;融合リードのセットを生成するステップであって、各セットが、同じ
切断点対を有する融合リードを含む、ステップと;融合リードのセットをクラスタリング
するステップであって、各クラスターを、第1の所定のヌクレオチド距離内の、第1の切
断点と、第2の所定のヌクレオチド距離内の、第2の切断点とを有する融合リードのセッ
トから形成する、ステップと;1または複数のクラスターについて、遺伝子融合を決定す
るステップであって、クラスターの遺伝子融合が、第1の融合遺伝子の切断点として、ク
ラスター内の、第1の切断点から選択される切断点を有し、かつ、第2の融合遺伝子の切
断点として、クラスター内の、第2の切断点から選択される切断点を有し、第1の融合遺
伝子切断点と、第2の融合遺伝子切断点とが各々、選択基準に基づき選択される、ステッ
プとを含む方法を提示する。
る遺伝子上に位置する。一部の実施形態では、第1の所定の距離と、第2の所定の距離と
は各々、5を超えないヌクレオチド、10を超えないヌクレオチド、または25を超えな
いヌクレオチドである。一部の実施形態では、選択基準は、クラスター内で、最も多くの
融合リードを有する切断点を含む。一部の実施形態では、方法は、複数の遺伝子クラスタ
ーについて、遺伝子融合を決定するステップを含む。
るステップと;複数の配列の分子の各々を、識別子でタグ付けするステップと;各タグ付
き配列を、基準ゲノムへとマッピングするステップと;切り詰められたリードを、マッピ
ングされたタグ付き配列から識別するステップであって、切り詰められたリードが、マッ
ピング部分と、切り詰められた部分とを含有するタグ付き配列であり、マッピング部分が
、遺伝子座へとマッピングされ、切り詰められた部分が、遺伝子座へとマッピングされな
い、ステップと;各切り詰められたリードの切断点を決定するステップであって、切断点
が、切り詰められたリードの配列が切り詰められた基準ゲノム上の点である、ステップと
;切断点セットを創出するステップであって、各切断点セットが、同じ切断点を有する切
り詰められたリードの識別子を含む、ステップと;切断点セットの対を比較することによ
り、切断点対のセットを創出するステップであって、切断点対の各セットが、切断点セッ
トの比較される対のいずれのメンバーにおいても存在する識別子を含む、ステップと;切
断点対のセットをクラスタリングするステップであって、各クラスターが、第1の所定の
遺伝子距離内にある対の、第1の切断点と、第2の所定の遺伝子距離内にある対の、第2
の切断点とを有する、切断点対のセットを含む、ステップと;クラスターのうちの1また
は複数について、遺伝子融合を決定するステップであって、クラスターの遺伝子融合が、
第1の融合遺伝子の切断点として、クラスター内の、第1の切断点から選択される切断点
を有し、かつ、第2の融合遺伝子の切断点として、クラスター内の、第2の切断点から選
択される切断点を有し、第1の融合遺伝子切断点と、第2の融合遺伝子切断点とが各々、
選択基準に基づき選択される、ステップとを含む方法を提示する。一部の実施形態では、
選択基準は、クラスター内で、最も多くの融合リードを有する切断点を含む。
DNA分子の、少なくとも一部のシーケンシングデータを含有する融合リードを決定する
ステップと;融合リードの少なくとも1つのマッピング部分が切り詰められる、ゲノム上
の所定の点(切断点)を決定するステップと;2つの切断点(切断点対)からの2つのマ
ッピングリード部分を、潜在的な融合候補として識別するステップと;切断点対に基づき
、1または複数の融合セットを創出し、融合セットを、1または複数の融合クラスターへ
とクラスタリングするステップと;所定の基準を満たす各融合クラスターを、遺伝子融合
として識別するステップと;遺伝子融合の切断点を、融合遺伝子切断点として識別するス
テップとを含む方法を提示する。
DNA分子の、少なくとも一部のシーケンシングデータを含有する融合リードを決定する
ステップと;融合リードの少なくとも1つのマッピング部分が切り詰められる、ゲノム上
の所定の点(切断点)を決定するステップと;2つの切断点(切断点対)からの2つのマ
ッピングリード部分を、潜在的な融合候補として識別するステップと;切断点対に基づき
、1または複数の融合セットを創出し、融合セットを、1または複数の融合クラスターへ
とクラスタリングするステップと;所定の基準を満たす各融合クラスターを、遺伝子融合
として識別するステップとを含み、前記遺伝子融合が、状態を指し示す、方法を提示する
。
肉腫、および前立腺がんからなる群から選択される。一部の実施形態では、方法は、処置
を、対象へと投与するステップをさらに含む。
本発明は、例えば、以下の項目を提供する。
(項目1)
試料に由来する遺伝子配列リードデータを処理するための方法であって、
融合染色体DNA分子の少なくとも一部のシーケンシングデータを含有する融合リード
を決定するステップと;
前記融合リードの少なくとも1つのマッピング部分が切り詰められる、ゲノム上の所定
の点(切断点)を決定するステップと;
2つの切断点(切断点対)からの2つのマッピングリード部分を、潜在的な融合候補と
して識別するステップと;
切断点対に基づき、1または複数の融合セットを創出し、前記融合セットを、1または
複数の融合クラスターへとクラスタリングするステップと;
所定の基準を満たす各融合クラスターを、遺伝子融合として識別するステップと
を含む方法。
(項目2)
固有の分子またはリード識別子(リードID)を、各リードへと割り当てるステップを
含む、項目1に記載の方法。
(項目3)
前記リードの各マッピング部分を、片側または両側から切り詰めるステップを含む、項
目1に記載の方法。
(項目4)
前記切断点が、アイデンティティにおいて、前記リードから独立しており、符号、染色
体、および位置により識別される、項目1に記載の方法。
(項目5)
前記切断点が、前記切断点で切り詰められるかまたは分割された多数のリードおよび分
子と、前記切断点を通り越す、多数の野生型のリードおよび分子とを含む統計を保持する
、項目4に記載の方法。
(項目6)
適切な符号を伴う2つの切断点に属する共通のリードIDを伴うあらゆる2つのマッピ
ングリード部分を、潜在的な融合候補として選択するステップを含む、項目2に記載の方
法。
(項目7)
マッピングする前における、元のリード内の、前記潜在的な融合候補の場所が、前記リ
ード部分を、元々互いに隣接して位置するリード部分として示す、項目6に記載の方法。
(項目8)
リード部分が、1つの鎖にマッピングされる場合、前記切断点の符号の差違について点
検するステップを含む、項目6に記載の方法。
(項目9)
融合セット統計を追跡するステップを含む、項目1に記載の方法。
(項目10)
前記融合セット統計が、切断点ID、前記セット内に含有されている、分子またはリー
ドの数である、項目9に記載の方法。
(項目11)
融合クラスター内の、同様の切断点により、融合セットを群分けするステップを含む、
項目1に記載の方法。
(項目12)
前記同様の切断点が、5を超えないヌクレオチド、10を超えないヌクレオチド、また
は25を超えないヌクレオチド離れた切断点である、項目11に記載の方法。
(項目13)
ゲノム内の2つの領域の間で、融合クラスターを規定するステップを含む、項目1に記
載の方法。
(項目14)
前記融合クラスターに関して、各パートナーについて、多数の融合分子を決定するステ
ップを含む、項目1に記載の方法。
(項目15)
前記融合クラスターに関して、各パートナーについて、融合リードの数を決定するステ
ップを含む、項目1に記載の方法。
(項目16)
前記融合クラスターに関して、各パートナーについて、多数の野生型分子を決定するス
テップを含む、項目1に記載の方法。
(項目17)
前記融合クラスターに関して、各パートナーについて、多数の野生型リードまたは野生
型分子を決定するステップを含む、項目1に記載の方法。
(項目18)
前記融合クラスターに関して、各パートナーについて、融合百分率を、各パートナーの
、全分子に対する融合分子の比率として決定するステップを含む、項目1に記載の方法。
(項目19)
前記全分子が、野生型構成要素と、切り詰められた構成要素とを含む、項目1に記載の
方法。
(項目20)
前記融合クラスターに関して、各パートナーについて、遺伝子情報を決定するステップ
を含む、項目18に記載の方法。
(項目21)
前記融合クラスターの、下流の遺伝子を決定するステップを含む、項目1に記載の方法
。
(項目22)
前記基準が、前記クラスター内に、1つを超える分子を有すること、またはワトソン−
クリック鎖の両方を伴う、少なくとも1つの分子を有することを含む、項目1に記載の方
法。
(項目23)
遺伝子情報を解析するシステムであって、
DNAシーケンサーと;
前記DNAシーケンサーに結合されたプロセッサーであって、
融合染色体DNA分子の、一部のシーケンシングデータを含有する融合リードを決定す
ること;
前記融合リードの少なくとも1つのマッピング部分が切り詰められる、ゲノム上の少な
くとも1つの所定の点(切断点)を決定すること;
2つの切断点(切断点対)からの2つのマッピングリード部分を、潜在的な融合候補と
して識別すること;
切断点対に基づき、1または複数の融合セットを創出し、前記融合セットを、1または
複数の融合クラスターへとクラスタリングすること;および
所定の基準を満たす各融合クラスターを、遺伝子融合として識別すること
のための命令を含むコンピュータコードを実行して、試料に由来する遺伝子配列リードデ
ータを処理するプロセッサーと
を含むシステム。
(項目24)
(a)DNA分子を、DNAシーケンサーでシーケンシングして、配列のコレクション
を生成するステップと;
(b)前記配列のコレクションを、基準ゲノムへとマッピングするステップと;
(c)融合リードを、前記マッピングコレクションから識別するステップであって、融
合リードが、部分配列を含有し、第1の部分配列が、第1の遺伝子座へとマッピングされ
、第2の部分配列が、第2の別個の遺伝子座へとマッピングされる、ステップと;
(d)各融合リードについて、前記第1の遺伝子座における第1の切断点と、前記第2
の遺伝子座における第2の切断点とを識別するステップであって、切断点が、融合リード
の配列が切り詰められた前記基準ゲノム上の点であり、前記第1の切断点と、第2の切断
点とが、切断点対を形成する、ステップと;
(e)融合リードのセットを生成するステップであって、各セットが、同じ切断点対を
有する融合リードを含む、ステップと;
(f)融合リードのセットをクラスタリングするステップであって、各クラスターを、
第1の所定のヌクレオチド距離内の、第1の切断点と、第2の所定のヌクレオチド距離内
の、第2の切断点とを有する融合リードのセットから形成する、ステップと;
(g)1または複数のクラスターについて、遺伝子融合を決定するステップであって、
クラスターの遺伝子融合が、第1の融合遺伝子の切断点として、前記クラスター内の、前
記第1の切断点から選択される切断点を有し、かつ、第2の融合遺伝子の切断点として、
前記クラスター内の、前記第2の切断点から選択される切断点を有し、前記第1の融合遺
伝子切断点と、第2の融合遺伝子切断点とが各々、選択基準に基づき選択される、ステッ
プと
を含む方法。
(項目25)
前記別個の遺伝子座が、異なる染色体上、または同じ染色体の、異なる遺伝子上に位置
する、項目24に記載の方法。
(項目26)
前記第1の所定の距離と、第2の所定の距離とが各々、5を超えないヌクレオチド、1
0を超えないヌクレオチド、または25を超えないヌクレオチドである、項目24に記載
の方法。
(項目27)
前記選択基準が、前記クラスター内で、最も多くの融合リードを有する切断点を含む、
項目24に記載の方法。
(項目28)
複数の遺伝子クラスターについて、遺伝子融合を決定するステップを含む、項目24に
記載の方法。
(項目29)
(a)複数のDNA分子を、DNAシーケンサーでシーケンシングするステップと;
(b)複数の配列の分子の各々を、識別子でタグ付けするステップと;
(c)各タグ付き配列を、基準ゲノムへとマッピングするステップと;
(d)切り詰められたリードを、前記マッピングされたタグ付き配列から識別するステ
ップであって、切り詰められたリードが、マッピング部分と、切り詰められた部分とを含
有するタグ付き配列であり、前記マッピング部分が、遺伝子座へとマッピングされ、前記
切り詰められた部分が、前記遺伝子座へとマッピングされない、ステップと;
(e)各切り詰められたリードの切断点を決定するステップであって、切断点が、切り
詰められたリードの配列が切り詰められた前記基準ゲノム上の点である、ステップと;
(f)切断点セットを創出するステップであって、各切断点セットが、同じ切断点を有
する切り詰められたリードの識別子を含む、ステップと;
(g)切断点セットの対を比較することにより、切断点対のセットを創出するステップ
であって、切断点対の各セットが、切断点セットの比較される対のいずれのメンバーにお
いても存在する識別子を含む、ステップと;
(h)切断点対のセットをクラスタリングするステップであって、各クラスターが、第
1の所定の遺伝子距離内にある前記対の、第1の切断点と、第2の所定の遺伝子距離内に
ある前記対の、第2の切断点とを有する、切断点対のセットを含む、ステップと;
(i)前記クラスターのうちの1または複数について、遺伝子融合を決定するステップ
であって、クラスターの遺伝子融合が、第1の融合遺伝子の切断点として、前記クラスタ
ー内の、前記第1の切断点から選択される切断点を有し、かつ、第2の融合遺伝子の切断
点として、前記クラスター内の、前記第2の切断点から選択される切断点を有し、前記第
1の融合遺伝子切断点と、第2の融合遺伝子切断点とは各々、選択基準に基づき選択され
る、ステップと
を含む方法。
(項目30)
前記選択基準が、前記クラスター内で、最も多くの融合リードを有する切断点を含む、
項目29に記載の方法。
(項目31)
融合遺伝子切断点を識別するための方法であって、
(a)融合染色体DNA分子の、少なくとも一部のシーケンシングデータを含有する融
合リードを決定するステップと;
(b)前記融合リードの少なくとも1つのマッピング部分が切り詰められる、ゲノム上
の所定の点(切断点)を決定するステップと;
(c)2つの切断点(切断点対)からの2つのマッピングリード部分を、潜在的な融合
候補として識別するステップと;
(d)切断点対に基づき、1または複数の融合セットを創出し、前記融合セットを、1
または複数の融合クラスターへとクラスタリングするステップと;
(e)所定の基準を満たす各融合クラスターを、遺伝子融合として識別するステップと
;
(f)前記遺伝子融合の切断点を、前記融合遺伝子切断点として識別するステップと
を含む方法。
(項目32)
対象における状態を診断するための方法であって、
(a)融合染色体DNA分子の、少なくとも一部のシーケンシングデータを含有する融
合リードを決定するステップと;
(b)前記融合リードの少なくとも1つのマッピング部分が切り詰められる、ゲノム上
の所定の点(切断点)を決定するステップと;
(c)2つの切断点(切断点対)からの2つのマッピングリード部分を、潜在的な融合
候補として識別するステップと;
(d)切断点対に基づき、1または複数の融合セットを創出し、前記融合セットを、1
または複数の融合クラスターへとクラスタリングするステップと;
(e)所定の基準を満たす各融合クラスターを、遺伝子融合として識別するステップと
を含み、
前記遺伝子融合が、前記状態を指し示す、方法。
(項目33)
前記状態が、がんである、項目32に記載の方法。
(項目34)
前記がんが、血液がん、肉腫、および前立腺がんからなる群から選択される、項目33
に記載の方法。
(項目35)
処置を、前記対象へと投与するステップをさらに含む、項目34に記載の方法。
本明細書で言及される全ての刊行物、特許、および特許出願は、各個別の刊行物、特許
、または特許出願が、参照により組み込まれることが、具体的、かつ、個別に指し示され
た場合と同じ程度に、参照により本明細書に組み込まれる。
特色および利点についての、より良好な理解は、本発明の原理が用いられる、例示的な実
施形態を明示する、以下の詳細な説明と、添付の図面とを参照することにより得られる。
本発明は、遺伝子融合を検出するためのシステムおよび方法に関する。
ーと、融合遺伝子のアライメントの困難は、切断点をマッピングしようと試みる場合に遭
遇する困難のうちの2つに過ぎない。本明細書で記載されるシステムおよび方法は、以下
の利点のうちの1または複数をもたらしうる。システムは、非融合遺伝子より活性がはる
かに大きい異常なタンパク質をもたらしうるため腫瘍の形成に寄与しうる融合遺伝子を識
別しうる。融合遺伝子(これらは、BCR−ABL、TEL−AML1(全て、t(12
;21)を伴う)、AML1−ETO(t(8;21)を伴う、M2 AML)、および
前立腺がんにおいて生じることが多い、第21染色体の間質欠失を伴う、TMPRSS2
−ERGを含む)は、がんを引き起こすがん遺伝子であるので、システムは、がんの存在
を、正確に決定する。TMPRSS2−ERGの場合、アンドロゲン受容体(AR)によ
るシグナル伝達を破壊し、発がん性のETS転写因子によって、ARの発現を阻害するこ
とにより、融合産物は、前立腺がんを調節する。融合遺伝子の大部分は、血液がん、肉腫
、および前立腺がんから見出される。発がん性の融合遺伝子は、2つの融合パートナーに
由来する、新たな機能または異なる機能を伴う、遺伝子産物をもたらしうる。代替的に、
原がん遺伝子が、強力なプロモーターと融合し、これにより、発がん性の機能が、上流の
融合パートナーの強力なプロモーターにより引き起こされる上方調節を介して、機能し始
める。後者は、リンパ腫において一般的であり、そこでは、がん遺伝子が、免疫グロブリ
ン遺伝子のプロモーターと並置される。発がん性の融合転写物はまた、トランススプライ
シングまたはリードスルーイベントによっても引き起こされうる。これらの遺伝子融合に
ついての、ゲノム配列およびゲノム構造の視点からの解析は、改善されたがんの診断法お
よび標的化された療法の開発を導くのに、関連するデータをもたらしうるであろう。
データを、シーケンサーから捕捉し、その挿入サイズが、2つのリード長の合計より小さ
い、シーケンシングされたペアエンドリードをアライメントし、接続する、マージング法
を適用し、マージングの後で、固有のリード識別子(リードID)を、各リードへと割り
当てる(12)。次に、工程は、全ての切断点を抽出し、融合候補を位置特定する(16
)。次いで、工程は、切断点対に基づき、融合セットを形成し、融合クラスターのための
統計を決定する(20)。次いで、所定の基準に合致させることにより、融合クラスター
を、検出された融合として識別する(24)。
しうる。このような染色体をシーケンシングすれば、ゲノムの2つの異なるゾーン(また
は同じ染色体もしくは異なる染色体)へとマッピングされうるリードが生成されるであろ
う。この挙動を用いて、融合を検出する。
リードへと割り当てると、1または複数のFASTQファイル内のリードヘッダー中にコ
ードされるであろう。代替的に、固有のバーコードを含むオリゴヌクレオチドのような、
固有の分子を、リードIDの代わりに使用することもできる。FASTQファイルをマッ
ピングしたら、このコードされたリードIDを読み出し、どのヒットが、同じ元のリード
に由来するのかを、容易に示すことができる。次に、工程は、全ての切断点を抽出する:
融合リード(リードは、融合染色体に由来する、部分的なDNA分子のシーケンシングデ
ータを含有する)を、全体として、ゲノムへとマッピングすることはできず、マッピング
装置は、それらの異なる部分を、ゲノム上の異なる場所へとマッピングする。これは、従
来型の技法を使用して、切断点マッピングを試みる場合に難題を提示する。このようなリ
ードの各マッピング部分は、片側または両側から切り詰められる(clipped)。切
断点は、融合リードの、少なくとも1つのマッピング部分が切り詰められたゲノム上の点
である。切断点は、それらのアイデンティティにおいて、リードから独立しており、それ
らの符号、染色体、および位置により識別される。+/−の切断点は、それぞれ、左/右
から切り詰められたリード部分を有する。ある位置の同じ側から切り詰められるかまたは
分割された全てのリードは、関連する切断点リードリストに列挙される。切断点はまた、
切断点で切り詰められるかもしくは分割されたリードおよび分子の数;または切断点を通
り越す野生型リードおよび野生型分子の数のような、他の統計も保持しうる。また、切断
点位置における遺伝子情報も提供される。クラスタリングを伴うかまたは伴わずに、切断
点を割り当てることにより、本明細書で記載される方法およびシステムを使用して、遺伝
子融合が生じた遺伝子座を、正確に決定することができる。
IDを伴うあらゆる2つのマッピングリード部分は、潜在的な融合候補である。それらを
真の融合候補とみなすには、それらが、リード部分が元々互いに隣接して位置したことを
示す正しい断片の順序(マッピングする前における、元のリード内のそれらの場所)を有
することも必要とされる。加えて、結果として得られる融合は、配列鎖に関して、生物学
的に可能でなければならない。これは単純に、リード部分が、同じ鎖(いずれも5’鎖、
またはいずれも3’鎖)へとマッピングされる場合、切断点の符号は、一致してはならず
、逆もまた成り立つことを意味する。この例を、図2に示す。
また、切断点ID、ならびにセット内に含有される分子およびリードの数などの統計も保
持しうる。これらの統計は、追跡することができる。
合クラスターに群分けされ得る。結果として、融合クラスターは、ゲノム内の2つの領域
の間で規定される。本開示はまた、融合クラスターに関して、各パートナーについて、多
数の融合分子を決定するか、各パートナーについて、融合リードの数を決定するか、各パ
ートナーについて、多数の野生型分子を決定するか、各パートナーについて、多数の野生
型リードまたは野生型分子を決定するか、または各パートナーについて、融合百分率を、
各パートナーの、全分子に対する融合分子の比率として決定することも提示する。
、遺伝子融合は、各染色体の一部を含有する。交差点を、切断点と称する。無細胞DNA
では、融合リード1、融合リード2、および融合リード3など、DNA断片は、切断点を
横切ってマッピングされうる。
各配列をマークする。ソフトウェアまた、これらの結果として得られる配列も、基準ゲノ
ムへとマッピングする。図6は、融合リード1の、基準ゲノムへの仮説的なマッピングを
示す。マッピングソフトウェアは、融合リードの配列を、基準ゲノム内のいずれの場所で
あれ、十分な相同性が見出される場所へとマッピングする。あいまいな配列は、基準ゲノ
ム内の複数の場所にマッピングされうる。
型的には、融合リードの配列を、各染色体へと1回ずつの2回にわたりマッピングする。
しかし、各場合に、マッピングソフトウェアは、配列の一部(部分配列)を、基準ゲノム
へと、適正にマッピングしえない。したがって、マッピング配列は、基準ゲノムへとマッ
ピングされる部分配列、および相同性が小さい結果として、同じ遺伝子座へとマッピング
されない部分配列の両方を含む。このような部分配列を、「切り詰められた(clipp
ed)」配列と称する。リードが切り詰められた基準ゲノム上の点が、切断点である。
同一なタグに起因して、同じ元の配列に由来するものとして識別することができる。こう
して、例えば、十分な相同性を有する配列の部分配列は、染色体Aへとマッピングされ、
不十分な相同性を有する配列の部分配列は、切り詰められる。同様に、マッピングソフト
ウェアは、配列を、染色体Bへとマッピングし、相同性が不十分な場合、配列を切り詰め
る。
いくつかの因子の結果として、融合遺伝子の切断点を含むDNA断片が、基準染色体の各
々上の切断点遺伝子座へと、正確にマッピングされないことがある。例えば、マッピング
ソフトウェアは、配列の切断点を、実際の切断点のやや上流に識別する場合もあり、やや
下流に識別する場合もある。
同一なタグに起因して、同じ元の配列に由来するものとして識別することができる。こう
して、例えば、十分な相同性を有する配列の部分配列は、染色体Aへとマッピングされ、
不十分な相同性を有する配列の部分配列は、切り詰められる。同様に、マッピングソフト
ウェアは、配列を、染色体Bへとマッピングし、相同性が不十分である場合、配列を切り
詰める。
、いくつかの因子の結果として、融合遺伝子の切断点を含むDNA断片が、基準染色体の
各々における切断点遺伝子座へと、正確にマッピングされないことがある。例えば、マッ
ピングソフトウェアは、配列の切断点を、実際の切断点のやや上流に識別する場合もあり
、やや下流に識別する場合もある。これらのエラーは、例えば、正確な遺伝子融合情報に
依存する、がんの診断法の精度に影響を及ぼしうる。
ングされ、切断点は、基準染色体内で、切断点A1および切断点B1(第1の切断点およ
び第2の切断点)として表示される。この融合リードは、切断点対A1−B1を有する。
融合リード2は、不適正にマッピングされ、染色体Aについての切断点は上流、切断点A
2(第1の切断点)にあると決定されている。しかし、染色体B内の切断点は、切断点B
1(第2の切断点)に正しくマッピングされている。この融合リードは、切断点対A2−
B1を有する。融合リード3もまた、不適正にマッピングされ、染色体Aについての切断
点は、切断点A1(第1の切断点)に正しくマッピングされているが、染色体Bについて
の切断点は下流、切断点B2(第2の切断点)にあると決定されている。この融合リード
は、切断点対A1−B2を有する。このような状況下では、ソフトウェアは、融合遺伝子
について、いくつかの切断点を識別している。
共通の切断点対に基づき、セットへと群分けし、次いで、基準ゲノム内で、所定の塩基距
離内にある切断点に基づき、クラスターへと群分けする。
配列は、基準ゲノム染色体AおよびBへとマッピングされる。融合の両側における切断点
が、配列は、セットへと群分けされる。例では、融合リード1と、融合リード4とは、切
断点対A1およびB1を共有し、セットIへと群分けされる。融合リード2と、融合リー
ド5とは、切断点対A2およびB1を共有し、セットIIへと群分けされる。融合リード
3と、融合リード6とは、切断点対A1およびB2を共有し、セットIIIへと群分けさ
れる。
)内にあり、切断点B1と、切断点B2とは、所定の遺伝子距離B内にある。したがって
、セットI、II、およびIIIは、クラスターへと群分けされる。
の実施形態では、基準は、クラスター内に、1つを超える分子を有すること、および/ま
たはワトソン−クリック鎖の両方を伴う、少なくとも1つの分子を有することを含む。一
方法では、全ての切断点の間で、最も多くの関連する融合リード(the most associate
d fused reads)を有する切断点を、融合遺伝子切断点としてコールする投票法により
、各染色体内の切断点を決定する。他の方法では、品質アルゴリズムを使用して、異なる
配列の切断点に重みづけすることができる。図8の例では、染色体Aでは、切断点A1が
、4つの融合リードと関連するのに対し、切断点A2は、2つの融合リードと関連する。
したがって、第1の遺伝子融合切断点は、A1にあるとコールされる。染色体Bでは、切
断点B1が、4つの融合リードと関連するのに対し、切断点B2は、2つの融合リードと
関連する。したがって、第2の遺伝子融合切断点は、B1にあるとコールされる。
Aシーケンシングシステムを使用して、DNA分子をシーケンシングする。配列を解析し
て、コレクション内の、元の分子コンセンサス配列を生成することができる。生成された
配列のコレクションに、固有の識別子でタグ付けする(この場合、1〜7)。配列は、基
準ゲノムへとマッピングされる。この例では、配列は各々、基準ゲノム内の、2つの異な
る場所へとマッピングされる。マッピングされた部分を、バーとして描示するのに対し、
切り詰められた部分は、破線として描示する。全ての配列の切断点を識別する。この例で
は、染色体A上の切断点は、A1、A2、およびA3である。染色体B上の切断点は、B
1、B2、およびB3である。マッピングされたリードを、共通の切断点に基づき、セッ
トへと組織化する。切断点対を、各染色体上で、同じ識別子および同じ切断点を有する配
列の対として決定する。染色体上の、クラスター切断点への所定の距離を決定する。この
例では、クラスターは、切断点A1およびA2、ならびにB1およびB2を含む。切断点
A3およびB3は、所定の距離外にあり、したがって、クラスター内に含まれない。選択
された基準に基づき、元の分子内の切断点対がコールされる。この例では、基準は、投票
に基づく。したがって、切断点A1およびB1は、クラスター内の大部分の分子を有する
ことに基づき、切断点対としてコールされる。
イメントを取り扱いうる。それらのアライメントを確認するために、融合点の周りでは、
より長い配列を得ることができる。偽陽性率を低減するために、リード数フィルター、配
列類似性フィルター、リード位置分布フィルターを含む、一連のフィルターを使用して、
特異性の大きな結果をもたらすことができる。加えて、キメラ転写物の存在度を推定する
のに、発現推定ツールである、RSEM(RNA−Seq by Expectatio
n Maximization)を使用してEM(Expectation Maxim
ization)アルゴリズムを、まばら度最適化と共に適用することができる。さらに
、この存在度の定量化により、識別の精度を増大させることもできる。まとめると、これ
らの特色は、遺伝子融合イベントについて、より完全に検討するシステムを可能とする。
ォーマットで得ることと、重複する配列リードのセットを識別することと、重複する配列
リードの各セットについて、1つのリードだけを保存することとを包含しうる。適切なフ
ァイルフォーマットは、FASTAファイルフォーマットおよびFASTQファイルフォ
ーマットを含む。FASTAと、FASTQとは、ハイスループットシーケンシングから
の生配列リードを保存するのに使用される、共通のファイルフォーマットである。FAS
TQファイルは、各配列リードのための識別子、配列、および各リードの品質スコアスト
リングを保存する。FASTAファイルは、識別子および配列だけを保存する。これらの
2つのファイルフォーマットは、多くの共通のシーケンシングアライメントアルゴリズム
およびアセンブリアルゴリズムへの入力である。本発明は、FASTQファイルおよびF
ASTAファイルのためのリード配列情報が、試料内および試料間で、高度に冗長である
かまたは重複する傾向にあることを認識する。このことは、配列リードの多くが、同じ配
列からなることを意味する。本発明の方法は、この冗長性を利用して、ファイルサイズの
、何分の1もの低減を達成し、保存されたデータの読出しは無損失である。例えば、本発
明は、試料と関連するFASTA/FASTQファイルを読み取り、マスターのリード配
列ファイル内の固有のリード配列だけを保存するのに使用されうる。
子などのメタ情報を収集することもさらに包含する。次いで、このメタ情報を、メタ情報
を元のFASTA/FASTQファイル内で識別された固有の配列リードと相関させる、
試料についてのファイルへと書き込み、この時点で、マスターリード配列ファイル内に保
存することができる。この新たなファイルは、元のファイル内で見出される重複情報を含
有しないため、元のファイルより小さく、転送が容易である。さらに、圧縮ファイルは、
任意の実際の配列データを含有する必要がまったくない。ある特定の態様では、圧縮ファ
イルは、マスターファイル内に保存された固有の配列へとインデックスづけされた、配列
リードについての識別子だけを含有しうる。
ーを含むコンピュータシステムを使用して)により、圧縮することができる。各配列リー
ドは、配列ストリングのほか、メタ情報も含みうる。配列リードは、例えば、記載行(「
>」記号を先行させた)と、任意選択で、FASTQの場合には、品質スコアとを含むメ
タ情報を伴う、1または複数のFASTAファイルまたはFASTQファイルのフォーマ
ットで提示することができる。配列ストリングは、例えば、IUPACヌクレオチドコー
ドを使用する、ヌクレオチド配列データを表すことが好ましい。固有のエントリーだけを
含有する配列ストリングのサブセットが識別される。次いで、本発明のシステムおよび方
法を使用して、識別されたサブセットと、その配列リードについての(複数の配列リード
の各々についての)メタ情報とを、その配列リードを表すサブセット内の固有のエントリ
ーについての指標と共に含む出力を書き込む。
テキストファイルでありうる、マスターリードファイルへと書き込む。ファイルが、人間
に読取り可能であり、さらなる処理(例えば、PerlまたはPythonなどのスクリ
プト言語を使用して)を、容易に実施しうるように、IUPACヌクレオチドコードを使
用して、固有の配列リードを、マスターリードファイル内に表示することが好ましい。メ
タ情報は、入力のFASTAファイルまたはFASTQファイルに対応する、圧縮出力フ
ァイルへと書き込むことができる。
特定の実施形態では、読出しは、無損失であり、なお、完全に無損失でもある。すなわち
、複数の配列リードを含む、新たなFASTAファイルまたはFASTQファイルを創出
するように、出力を処理することができる。読出しが無損失である場合、新たなFAST
AファイルまたはFASTQファイルは、FASTAファイルまたはFASTQファイル
と同じ情報を含有する。
およびFASTQファイルに加えて、配列リードはまた、VCF(Variant Ca
ll Format)ファイルでも捕捉することができる。ハイスループットシーケンシ
ングの進歩により、複数のシーケンシング施設が、ヒトゲノム内の変異体を検出し、それ
らを、これらのVCFファイルを介して報告することが一般的である。本発明は、異なる
情報源に由来する変異体情報を、研究者が、複雑な、対立遺伝子レベル、試料レベル、お
よび集団レベルの検索を、施設を越えて実施することを可能とする形で、VCFファイル
内に保存する、統一データベースの開発を容易としうる。統一データベースは、1つの汎
用の対立遺伝子表上に、あらゆる固有の対立遺伝子(例えば、固有の配列リード)を保存
し、これらの固有の対立遺伝子の、関連する試料および試料レベルのメタデータへの照会
を保存することにより、変異体情報を、異なる試料に由来するVCFファイルに統合しう
る。
リードを得るステップ(不揮発性メモリに結合されたプロセッサーを含むコンピュータシ
ステムを使用して)であって、各配列リードが、配列ストリングおよびメタ情報を含む、
ステップと;固有のエントリーだけを含有する配列ストリングのサブセットを識別するス
テップと;サブセットと、その配列リードについての(複数の配列リードの各々について
の)メタ情報とを、その配列リードを表すサブセット内の固有のエントリーについての指
標と共に含む出力を書き込むステップとを含む。出力は、IUPACヌクレオチドコード
を使用して、サブセットを保存する、1または複数のテキストファイルを含むことが好ま
しい。出力は、プレーンテキストとして保存することが好ましい(例えば。これはテキス
トエディタープログラムを使用して開くことができ、人間がスクリーン上で読み取ること
ができる)。好ましい実施形態では、配列リードデータは、損失を伴わずに保存される。
方法は、複数の配列リードを含む、新たなFASTAファイルまたはFASTQファイル
を創出するように、出力を処理するステップを含みうる。複数の配列リードは、FAST
AファイルまたはFASTQファイルとして得ることができ、新たなFASTAファイル
またはFASTQファイルは、FASTAファイルまたはFASTQファイルと同じ情報
を含有しうる。一部の実施形態では、出力が占有するディスクスペースは、得られた複数
の配列リードを保存するのに要求されるディスクスペースの%未満である。
ドを生成するための方法、および多様な種類のシーケンシングについて記載する。これら
の例示的な方法は、限定的なものではなく、当業者の必要に応じて改変しうることを理解
されたい。
リードを生成することを含みうる。下記で詳細に説明する通り、複数の配列リードを得る
ステップはまた、シーケンシングデータを、シーケンサーから受信することも含みうる。
試料中の核酸は、例えば、組織試料中のゲノムDNA、検査室試料中の特定の標的から増
幅されたcDNA、または複数の生物から混合されたDNAを含む、任意の核酸でありう
る。一部の実施形態では、試料は、一倍体生物または二倍体生物に由来する、ホモ接合性
のDNAを含む。例えば、試料は、希少な劣性対立遺伝子についてホモ接合性の患者に由
来するゲノムDNAを含みうる。他の実施形態では、試料は、2つの類縁の核酸が、50
または100%以外の対立遺伝子頻度、すなわち、20%、5%、1%、0.1%、また
は他の任意の対立遺伝子頻度で存在するように、体細胞突然変異を伴う、二倍体生物また
は倍数性生物に由来する、ヘテロ接合性の遺伝子素材を含む。
、および非鋳型核酸など、他の様々な構成要素を含有する生物学的試料から単離する。核
酸鋳型分子は、動物、植物、細菌、真菌、または他の任意の細胞性生物から得られる、任
意の細胞素材から得ることができる。本発明における使用のための生物学的試料はまた、
ウイルス粒子またはウイルス調製物も含む。核酸鋳型分子は、生物から直接得ることもで
き、生物から得られる生物学的試料、例えば、血液、血清、血漿、尿、脳脊髄液、唾液、
糞便、リンパ液、滑液、嚢胞液、腹水、胸水、羊水、絨毛膜絨毛試料、着床前胚に由来す
る流体、胎盤試料、子宮頸部/膣洗浄液および子宮頸部/膣液、間質液、口腔スワブ試料
、痰、気管支洗浄液、パップスメア試料、または眼液から得ることもできる。任意の組織
検体または体液検体(例えば、ヒト組織検体またはヒト体液検体)を、本発明において使
用するための核酸の供給源として使用することができる。核酸鋳型分子はまた、初代細胞
培養物または細胞株などの培養細胞からも単離することができる。鋳型核酸が得られる細
胞または組織には、ウイルスまたは他の細胞内病原体を感染させることができる。試料は
また、生物学的検体から抽出された全RNA、cDNAライブラリー、ウイルスDNA、
またはゲノムDNAでもありうる。試料はまた、非細胞由来のDNAからも単離すること
ができる。
ができる。鋳型核酸は、様々な、機械的方法、化学的方法、および/または酵素的方法を
使用して、所望の長さへと、断片化またはせん断処理することができる。DNAは、例え
ば、Covaris(Woburn、Mass.)により販売されている超音波処理機を
使用する超音波処理を介してランダムにせん断処理することもでき、短時間にわたる、D
Nアーゼへの曝露により断片化することもでき、1もしくは複数の制限酵素の混合物、ま
たはトランスポザーゼもしくはニッキング酵素を使用して断片化することもできる。RN
Aは、短時間にわたる、RNアーゼへの曝露により断片化することもでき、熱に加えた磁
気により断片化することもでき、せん断処理によりにより断片化することもできる。RN
Aは、cDNAへと転換することができる。断片化を利用する場合、断片化の前または後
で、RNAを、cDNAへと転換することができる。一実施形態では、核酸を、超音波処
理により断片化する。別の実施形態では、核酸を、流体せん断装置により断片化する。一
般に、個々の核酸鋳型分子は、約2kb〜約40kbでありうる。特定の実施形態では、
核酸は、約6kb〜10kbの断片である。核酸分子は、一本鎖の場合もあり、二本鎖の
場合もあり、一本鎖領域を伴う二本鎖(例えば、ステムループ構造)の場合もある。
こともでき、ホモジナイズすることもでき、分画することもできる。適切な界面活性剤は
、イオン性界面活性剤(例えば、ドデシル硫酸ナトリウムまたはN−ラウロイルサルコシ
ン)を含む場合もあり、非イオン性界面活性剤を含む場合もある。核酸は、試料から抽出
または単離したら、増幅することができる。
PCR)または当技術分野で公知の他の技術を使用して実行する。増幅反応は、PCRな
ど、核酸分子を増幅する、当技術分野で公知の、任意の増幅反応でありうる。他の増幅反
応は、ネステッドPCR、PCR−一本鎖コンフォメーション多型、リガーゼ連鎖反応、
鎖置換増幅、および制限断片長多型、転写ベースの増幅システム、ローリングサークル増
幅、および超分枝型ローリングサークル増幅、定量的PCR、定量的蛍光PCR(QF−
PCR)、マルチプレックス蛍光PCR(MF−PCR)、リアルタイムPCR(RTP
CR)、制限断片長多型PCR(PCR−RFLP)、in situローリングサーク
ル増幅(RCA)、ブリッジPCR、ピコ滴定PCR、エマルジョンPCR、転写増幅、
自己持続配列複製、コンセンサス配列プライミングPCR、任意プライミングPCR、オ
リゴヌクレオチドプライミングPCR、および核酸ベースの配列増幅(NABSA)を含
む。使用しうる増幅法は、米国特許第5,242,794号;同第5,494,810号
;同第4,988,617号;および同第6,582,938号において記載されている
増幅法を含む。ある特定の実施形態では、増幅反応は、例えば、参照により本明細書に組
み込まれる、米国特許第4,683,195号;および米国特許第4,683,202号
において記載されているPCRである。PCR、シーケンシング、および他の方法のため
のプライマーは、クローニング、直接化学合成、および当技術分野で公知の他の方法によ
り調製することができる。プライマーはまた、Eurofins MWG Operon
(Huntsville、Ala.)またはLife Technologies(Ca
rlsbad、Calif.)などの販売元から得ることもできる。
grated DNA Technologies(Coralville、Iowa)
などから、市販品を購入することができる。ある特定の実施形態では、アダプター配列は
、酵素により、鋳型核酸分子へと接合させる。酵素は、リガーゼまたはポリメラーゼであ
りうる。リガーゼは、オリゴヌクレオチド(RNAまたはDNA)を、鋳型核酸分子へと
ライゲーションすることが可能な、任意の酵素でありうる。適切なリガーゼは、T4 D
NAリガーゼおよびT4 RNAリガーゼを含み、New England Biola
bs(Ipswich、Mass.)から市販されている。当技術分野では、リガーゼを
使用するための方法が周知である。ポリメラーゼは、ヌクレオチドを、鋳型核酸分子の3
’末端および5’末端へと付加することが可能な、任意の酵素でありうる。
ライゲーションの場合もある。ある特定の実施形態では、断片の末端は、平滑末端を形成
するように、断片化に続き、修復することもでき、トリミングすることもでき(例えば、
エクソヌクレアーゼを使用して)、充填することもできる(例えば、ポリメラーゼおよび
dNTPを使用して)。一部の実施形態では、Epicentre Biotechno
logies(Madison、Wis.)から市販されているキットなど、市販のキッ
トを使用して、平滑末端の5’リン酸化核酸末端を作出するように、末端修復を実施する
。平滑末端を作出したら、断片の3’末端および5’末端への、鋳型非依存的な付加を形
成し、これにより、単一のA突出を作製するように、末端を、ポリメラーゼおよびdAT
Pで処理することができる。T−Aクローニングと称する方法では、この単一のAを使用
して、断片の、5’末端からの単一のT突出とのライゲーションを導く。代替的に、制限
消化の後で、制限酵素により残される、突出の可能な組合せは公知であるため、末端は、
そのまま放置する、すなわち、粘着末端とすることもできる。ある特定の実施形態では、
相補的な突出末端を伴う、二本鎖オリゴヌクレオチドを使用する。
定の実施形態では、バーコードを、各断片へと接合させる。他の実施形態では、複数のバ
ーコード、例えば、2つのバーコードを、各断片へと接合させる。バーコード配列は一般
に、配列を、シーケンシング反応において有用とする、ある特定の特色を含む。例えば、
バーコード配列は、バーコード配列内に、最小限のホモポリマー領域(すなわち、AAま
たはCCCなど、連続で2つまたはこれを超える同じ塩基)を有するか、またはホモポリ
マー領域を有さないようにデザインされる。バーコード配列はまた、1塩基ずつのシーケ
ンシングを実施する場合に、それらが、塩基付加順序(base addition o
rder)から、少なくとも1編集距離隔たっているようにデザインして、最初の塩基お
よび最後の塩基が、予測される配列の塩基とマッチしないことを確実にする。
ードが、それらが由来した部分へと戻る形でそれと相関させることが可能となる。ある特
定の実施形態では、バーコード配列は、約5ヌクレオチド〜約15ヌクレオチドの範囲で
ある。特定の実施形態では、バーコード配列は、約4ヌクレオチド〜約7ヌクレオチドの
範囲である。バーコード配列は、鋳型核酸に沿ってシーケンシングされるので、接合させ
た鋳型核酸に由来する最長のリードを許容するように、オリゴヌクレオチドの長さは、最
小限の長さであるものとする。例えば、複数のDNAバーコードは、多様な数のヌクレオ
チド配列を含みうる。ある特定の実施形態では、バーコード配列は、2、3、4、5、6
、7、8、9、10、11、12、13、14、15、16、17、18、19、20、
21、22、23、24、25、26、27、28、29、30、またはこれを超えるヌ
クレオチドを含む。ポリヌクレオチドの一方だけの末端へと接合させる場合、複数のDN
Aバーコードは、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、11、12
、13、14、15、16、17、18、19、20、21、22、23、24、25、
26、27、28、29、30、またはこれを超える異なる識別子をもたらしうる。代替
的に、ポリヌクレオチドの両方の末端へと接合させる場合、複数のDNAバーコードは、
4つ、9つ、16、25、36、49、64、81、100、121、144、169、
196、225、256、289、324、361、400、またはこれを超える異なる
識別子(DNAバーコードを、ポリヌクレオチドの一方だけの末端へと接合させる場合の
2乗個の識別子である)をもたらしうる。
ー的な組合せを最小化する)。ある特定の実施形態では、バーコード配列を、鋳型核酸分
子へと、例えば、酵素により接合させる。酵素は、下記で論じられる通り、リガーゼまた
はポリメラーゼでありうる。
らの組合せを、断片化核酸へと接合させることができる。このような分子は、Integ
rated DNA Technologies(Coralville、Iowa)な
どから、市販品を購入することができる。ある特定の実施形態では、このような配列を、
リガーゼなどの酵素により、鋳型核酸分子へと接合させる。適切なリガーゼは、New
England Biolabs(Ipswich、Mass.)から市販されている、
T4 DNAリガーゼおよびT4 RNAリガーゼを含む。ライゲーションは、平滑末端
ライゲーションの場合もあり、相補的な突出末端の使用を介するイゲーションの場合もあ
る。ある特定の実施形態では、断片の末端は、平滑末端を形成するように、断片化に続き
、修復することもでき、トリミングすることもでき(例えば、エクソヌクレアーゼを使用
して)、充填することもできる(例えば、ポリメラーゼおよびdNTPを使用して)。一
部の実施形態では、Epicentre Biotechnologies(Madis
on、Wis.)から市販されているキットなど、市販のキットを使用して、平滑末端の
5’リン酸化核酸末端を作出するように、末端修復を実施する。平滑末端を作出したら、
断片の3’末端および5’末端への、鋳型非依存的な付加を形成し、これにより、単一の
A突出を作製するように、末端を、ポリメラーゼおよびdATPで処理することができる
。T−Aクローニングと称する方法では、この単一のAにより、断片の、5’末端からの
単一のT突出とのライゲーションを導くことができる。代替的に、制限消化の後で、制限
酵素により残される、突出の可能な組合せは公知であるため、末端は、そのまま放置する
、すなわち、粘着末端とすることもできる。ある特定の実施形態では、相補的な突出末端
を伴う、二本鎖オリゴヌクレオチドを使用する。
ップ、増幅ステップ、またはバーコード処理するステップ)の後、核酸をシーケンシング
することができる。
DNAシーケンシング技法は、標識ターミネーターまたはプライマーと、スラブまたはキ
ャピラリーによるゲル分離とを使用する、古典的なジデオキシシーケンシング反応(サン
ガー法)、可逆的に終結させた標識ヌクレオチドを使用する合成によるシーケンシング、
パイロシーケンシング、454シーケンシング、Illumina/Solexaシーケ
ンシング、標識オリゴヌクレオチドプローブのライブラリーへの、対立遺伝子特異的ハイ
ブリダイゼーション、ライゲーションに続く、標識クローンのライブラリーへの、対立遺
伝子特異的ハイブリダイゼーションを使用する合成によるシーケンシング、重合化ステッ
プにおける、標識ヌクレオチドの組込みの、リアルタイムのモニタリング、ポロニーシー
ケンシング、SOLiDシーケンシング、標的化されたシーケンシング、一分子リアルタ
イムシーケンシング、エクソンシーケンシング、電子顕微鏡ベースのシーケンシング、パ
ネルシーケンシング、トランジスター媒介型シーケンシング、直接シーケンシング、ラン
ダムショットガンシーケンシング、全ゲノムシーケンシング、ハイブリダイゼーションに
よるシーケンシング、キャピラリー電気泳動、ゲル電気泳動、デュプレックスシーケンシ
ング、サイクルシーケンシング、一塩基伸長シーケンシング、固相シーケンシング、ハイ
スループットシーケンシング、超並列署名シーケンシング、エマルジョンPCR、低変性
温度における共増幅PCR(COLD−PCR)、マルチプレックスPCR、可逆的色素
ターミネーターによるシーケンシング、ペアドエンドシーケンシング、短期シーケンシン
グ、エクソヌクレアーゼシーケンシング、ライゲーションによるシーケンシング、短リー
ドシーケンシング、一分子シーケンシング、リアルタイムシーケンシング、リバースター
ミネーターシーケンシング、ナノ小孔シーケンシング、MS−PETシーケンシング、お
よびこれらの組合せを含む。一部の実施形態では、シーケンシング法は、超並列シーケン
シング、すなわち、少なくとも100、1000、10,000、100,000、10
0万、1000万、1億、または10億のポリヌクレオチド分子のうちのいずれかを、同
時に(または間断なく)シーケンシングすることである。一部の実施形態では、シーケン
シングは、例えば、IlluminaまたはApplied Biosystemsから
市販されている遺伝子解析器などの遺伝子解析器により実施することができる。より近年
では、ポリメラーゼまたはリガーゼを使用する逐次的伸長反応または単一の伸長反応のほ
か、プローブライブラリーとの、単一の示差的ハイブリダイゼーションまたは逐次的な示
差的ハイブリダイゼーションによっても、個別分子のシーケンシングが裏付けられている
。シーケンシングは、DNAシーケンサー(例えば、シーケンシング反応を実施するよう
にデザインされたマシン)により実施することができる。
を含む。第1のステップでは、DNAを、約300〜800塩基対の断片へとせん断処理
し、断片を平滑末端処理する。次いで、オリゴヌクレオチドアダプターを、断片の末端へ
とライゲーションする。アダプターは、断片の増幅およびシーケンシングのためのプライ
マーとして用いられる。断片を、DNA捕捉ビーズ、例えば、5’ビオチンタグを含有す
る、アダプターBを使用する、例えば、ストレプトアビジンコーティングビーズへと接合
させることができる。ビーズへと接合させた断片を、油−水エマルジョンの液滴内でPC
R増幅する。結果は、各ビーズ上でクローン増幅されたDNA断片の複数のコピーである
。第2のステップでは、ビーズを、ウェル(ピコリットルサイズの)内に捕捉する。各D
NA断片上で並行して、パイロシーケンシングを実施する。1または複数のヌクレオチド
の付加は、光シグナルを発生させ、これは、シーケンシング装置内のCCDカメラにより
記録される。シグナルの強度は、組み込まれるヌクレオチドの数に比例する。パイロシー
ケンシングは、ヌクレオチド付加時に放出されるピロリン酸(PPi)を使用する。PP
iは、アデノシン5’ホスホ硫酸の存在下で、ATPスルフリラーゼにより、ATPへと
転換される。ルシフェラーゼは、ATPを使用して、ルシフェリンを、オキシルシフェリ
ンへと転換し、この反応は、光を発生させ、これを検出および解析する。
s Corporation(Carlsbad、Calif.)からのApplied
BiosystemsによるSOLiD技術である。SOLiDシーケンシングでは、
ゲノムDNAを、断片へとせん断処理し、アダプターを、断片の5’末端および3’末端
へと接合させて、断片ライブラリーを生成する。代替的に、アダプターを、断片の5’末
端および3’末端へとライゲーションし、断片を環状化させ、環状化させた断片を消化し
て、内部アダプターを作出し、アダプターを、結果として得られる断片の5’末端および
3’末端へと接合させて、メイトペアドライブラリーを生成することにより、内部アダプ
ターを導入することもできる。次に、クローンビーズ集団を、ビーズ、プライマー、鋳型
、およびPCR構成要素を含有するマイクロリアクター内で調製する。PCRに続き、鋳
型を変性させ、ビーズを濃縮して、鋳型を伸長させたビーズを分離する。選択されたビー
ズ上の鋳型を、3’修飾にかけ、これにより、スライドガラスへの結合を可能とする。配
列は、部分的にランダムなオリゴヌクレオチドの、決定される中心塩基(または塩基対)
であって、特異的フルオロフォアにより識別される塩基との、逐次的なハイブリダイゼー
ションおよびライゲーションにより決定することができる。色を記録した後で、ライゲー
ションされたオリゴヌクレオチドを除去し、次いで、処理を反復する。
ogies(South San Francisco、Calif.)下のIon T
orrentにより、ION TORRENTの商品名で販売されているシステムを使用
する、イオン半導体シーケンシングである。イオン半導体シーケンシングは、例えば、そ
れらの各々の内容が、参照によりそれらの全体において組み込まれる、Rothbergら、An
integrated semiconductor device enabling non-optical genome sequencing、Na
ture、475巻:348〜352頁(2011年);米国公開第2010/030498
2号;米国公開第2010/0301398号;米国公開第2010/0300895号
;米国公開第2010/0300559号;および米国公開第2009/0026082
号において記載されている。
Illuminaシーケンシングは、フォールドバックPCRと、アンカリングプライマ
ーとを使用する、固体表面上のDNAの増幅に基づく。ゲノムDNAを断片化し、アダプ
ターを、断片の5’末端および3’末端へと付加する。フローセルチャネルの表面へと接
合させたDNA断片を伸長させ、ブリッジ増幅する。断片は二本鎖となり、二本鎖分子を
変性させる。複数サイクルの固相増幅に続き、変性は、フローセルの各チャネル内の同じ
鋳型の一本鎖DNA分子の約1,000コピーの何百万ものクラスターを創出しうる。プ
ライマー、DNAポリメラーゼ、および4つのフルオロフォアで標識された可逆的終結ヌ
クレオチドを使用して、逐次的シーケンシングを実施する。ヌクレオチド組込みの後、レ
ーザーを使用して、フルオロフォアを励起し、画像を捕捉し、第1の塩基が何かを記録す
る。組み込まれた各塩基から、3’ターミネーターおよびフルオロフォアを除去し、組込
みステップ、検出ステップ、および識別ステップを反復する。この技術に従いシーケンシ
ングについては、それらの各々が、参照によりそれらの全体において組み込まれる、米国
特許第7,960,120号;米国特許第7,835,871号;米国特許第7,232
,656号;米国特許第7,598,035号;米国特許第6,911,345号;米国
特許第6,833,246号;米国特許第6,828,100号;米国特許第6,306
,597号;米国特許第6,210,891号;米国公開第2011/0009278号
;米国公開第2007/0114362号;米国公開第2006/0292611号;お
よび米国公開第2006/0024681号において記載されている。
(Menlo Park、Calif.)の一分子リアルタイム(SMRT)技術を含む
。SMRTでは、4つのDNA塩基の各々を、4つの異なる蛍光色素のうちの1つへと接
合させる。これらの色素は、リン酸基に連結されている。単一のDNAポリメラーゼを、
鋳型である一本鎖DNAの単一の分子と共に、ゼロモードウェーブガイド(ZMW)の底
部に固定化させる。ヌクレオチドを、成長する鎖へと組み込むには、数ミリ秒を要する。
この時間中に、蛍光標識が励起され、蛍光シグナルをもたらし、蛍光タグが切り離される
。色素の対応する蛍光の検出は、どの塩基が組み込まれたのかを指し示す。処理を反復す
る。
er、2007年、Progress toward ultrafast DNA sequence using solid-state
nanopores、Clin Chem、53巻(11号):1996〜2001頁)である。ナノ小孔
とは、直径を1ナノメートルのオーダーとする小孔である。ナノ小孔を、導電性流体中に
浸漬し、これにわたって電位をかける結果として、ナノ小孔を介するイオンの導電に起因
して、わずかな電流がもたらされる。流れる電流の量は、ナノ小孔のサイズを感知する。
DNA分子がナノ小孔を通過するとき、DNA分子上の各ヌクレオチドは、ナノ小孔を、
異なる程度に閉塞させる。したがって、DNA分子が、ナノ小孔を通過するときの、ナノ
小孔を通過する電流の変化は、DNA配列の読取りを表す。
emFET)アレイを使用して、DNAをシーケンシングすること(例えば、米国公開第
2009/0026082号において記載されている通りに)を伴う。技法の1つの例で
は、DNA分子を、反応チャンバーに入れ、鋳型分子を、ポリメラーゼに結合させたシー
ケンシングプライマーとハイブリダイズさせることができる。1または複数の三リン酸の
、シーケンシングプライマーの3’末端における、新たな核酸鎖への組込みは、chem
FETにより、電流の変化を介して検出することができる。アレイは、複数のchemF
ETセンサーを有しうる。別の例では、単一の核酸を、ビーズへと接合させ、核酸を、ビ
ーズ上で増幅し、個々のビーズを、chemFETアレイ上の、個々の反応チャンバーで
あって、各チャンバーがchemFETセンサーを有する、反応チャンバーへと移し、核
酸をシーケンシングすることができる。
r M.、Base sequence determination in nucleic acids with the electron m
icroscope、III. Chemistry and microscopy of guanine-labeled DNA、PNAS、5
3巻:564〜71頁(1965年)により記載されている通りに、電子顕微鏡を使用す
ることを伴う。技法の1つの例では、個々のDNA分子を、電子顕微鏡を使用して識別可
能な、金属標識を使用して標識する。次いで、これらの分子を、平面上に展開し、電子顕
微鏡を使用してイメージングして、配列を定める。
ードは一般に、約150塩基未満の長さ、または約90塩基未満の長さのヌクレオチド配
列のデータを含む。ある特定の実施形態では、リードは、約80〜約90塩基の間、例え
ば、約85塩基の長さである。一部の実施形態では、本発明の方法を、極めて短いリード
、すなわち、約50塩基または約30塩基未満の長さのリードへと適用する。配列リード
データは、配列データのほか、メタ情報も含みうる。配列リードデータは、任意の適切な
ファイルフォーマットであって、例えば、当業者に公知の、VCFファイル、FASTA
ファイル、またはFASTQファイルを含むフォーマットで保存することができる。
り、FASTAという名称はまた、標準的なファイルフォーマットも指す。Pearsonおよ
びLipman、1988年、Improved tools for biological sequence comparison、PN
AS、85巻:2444〜2448頁を参照されたい。FASTAフォーマットの配列は、
1行の記載で始まり、配列データ行が続く。記載行は、第1列の大なり(「>」)記号に
より、配列データと区別される。「>」記号に続く語は、配列の識別子であり、行の残り
は、記載である(いずれも、任意選択である)。「>」と、識別子の第1の文字との間に
は、スペースを置かないものとする。テキストの全ての行は、80文字より短いことが推
奨される。「>」で始まる別の行が現れたら、配列は終了し、これは、別の配列の開始を
指し示す。
応する品質スコアの両方を保存するための、テキストベースのフォーマットである。FA
STQフォーマットは、FASTAフォーマットと類似するが、配列データに品質スコア
を後続させている。配列文字および品質スコアのいずれも、簡略のために、単一のASC
II記号でコードされている。FASTQフォーマットは、Illumina Geno
me Analyzerなど、ハイスループットシーケンシング装置の出力を保存するた
めの、事実上の標準フォーマットである(Cock ら、2009年、The Sanger FASTQ
file format for sequences with quality scores, and the Solexa/Illumina
FASTQ variants、Nucleic Acids Res、38巻(6号):1767〜1771頁)。
列データ行は含まない。一部の実施形態では、FASTQファイルでは、メタ情報は、品
質スコアを含む。FASTAファイルおよびFASTQファイルでは、配列データは、記
載行の後で始まり、典型的に、任意選択で、「−」を伴うIUPACの両義性コードの何
らかのサブセットを使用して提示される。好ましい実施形態では、配列データは、必要に
応じて、任意選択で、「−」またはU(例えば、ギャップまたはウラシルを表す)を含む
、A、T、C、G、およびNの記号を使用する。
ルを、プレーンテキストファイル(例えば、ASCII;ISO/IEC646;EBC
DIC;UTF−8;またはUTF−16などのコード法を使用する)として保存する。
本発明により提供されるコンピュータシステムは、プレーンテキストファイルを開くこと
が可能な、テキストエディタープログラムを含みうる。テキストエディタープログラムと
は、テキストファイル(プレーンテキストファイルなど)のコンテンツを、コンピュータ
スクリーン上に提示し、人間が、テキストを編集する(例えば、モニター、キーボード、
およびマウスを使用して)ことが可能なコンピュータプログラムを指す場合がある。例示
的なテキストエディターは、限定なしに述べると、Microsoft Word、em
acs、pico、vi、BBEdit、およびTextWranglerを含む。好ま
しくは、テキストエディタープログラムは、プレーンテキストファイルを、コンピュータ
スクリーン上に表示し、メタ情報および配列リードを、人間に読取り可能なフォーマット
(例えば、バイナリーコード化せず、印字による人間の書記において使用される英数字記
号を使用する)で示すことが可能である。
たが、本発明の方法およびシステムは、例えば、VCF(Variant Call F
ormat)フォーマットによるファイルを含む、任意の適切な配列ファイルフォーマッ
トを圧縮するのに使用することができる。典型的なVCFファイルは、ヘッダーセクショ
ンおよびデータセクションを含むであろう。ヘッダーは、各々が「##」記号で始まり、
タブで区切られたフィールド定義行が、単一の「#」記号で始まる、任意の数のメタ情報
行を含有する。フィールド定義行は、8つの必須の列に名付け、本文セクションは、フィ
ールド定義行により定義される列に投入される、データの行を含有する。VCFフォーマ
ットについては、Danecekら、2011年、The variant call format and VCF too
ls、Bioinformatics、27巻(15号):2156〜2158頁において記載されている
。ヘッダーセクションは、圧縮ファイルへと書き込むメタ情報として取り扱うことができ
、データセクションは、固有である場合に限り、それらの各々がマスターファイル内に保
存される、行として取り扱うことができる。
よるアセンブリでは、例えば、リードを、互いに照らして、または基準に照らしてアライ
メントする。転じて、各リードを、基準ゲノムに照らしてアライメントすることにより、
リードの全てを、互いとの関係で位置づけて、アセンブリを創出する。加えて、配列リー
ドを、基準配列に照らしてアライメントするか、または基準配列へとマッピングすること
はまた、配列リード内の変異体配列を識別するのにも使用することができる。変異体配列
の識別を、本明細書で記載される方法およびシステムと組み合わせて使用して、さらに、
疾患もしくは状態の診断もしくは予後診断の一助とするか、または処置の決定を導くこと
もできる。
代替的に、本発明の方法は、全体的または部分的に、1または複数の専用プログラムであ
って、例えば、各々が、任意選択で、C++などのコンパイラー言語で書き込まれ、次い
で、バイナリー言語としてコンパイルおよび分散される、専用プログラムにより具体化す
ることができる。本発明の方法は、全体的または部分的に、既存の配列解析プラットフォ
ーム内のモジュールとして実装することもでき、既存の配列解析プラットフォーム内で機
能を呼び出すことにより実装することもできる。ある特定の実施形態では、本発明の方法
は、単一の開始キュー(例えば、人間の活動、別のコンピュータプログラム、またはマシ
ンから供給される誘起イベントの1つまたは組合せ)に自動的に応答して呼び出される全
てのステップである、多数のステップを含む。したがって、本発明は、ステップのうちの
いずれか、またはステップの任意の組合せが、キューに自動的に応答して起動しうる方法
を提供する。自動的にとは一般に、人間による入力、影響、または相互作用を介在しない
こと(すなわち、元の人間活動またはキュー以前の人間活動だけに応答すること)を意味
する。
力も包含する。読出しの出力は、コンピュータファイルのフォーマットで提供することが
できる。ある特定の実施形態では、出力は、FASTAファイル、FASTQファイル、
またはVCFファイルである。出力は、基準ゲノムの配列に照らしてアライメントされた
核酸配列などの配列データを含有する、テキストファイルまたはXMLファイルを作製す
るように処理することができる。他の実施形態では、処理は、対象核酸における、基準ゲ
ノムと比べた、1または複数の突然変異について記載する、座標またはストリングを含有
する出力をもたらす。当技術分野で公知のアライメントストリングは、SUGAR(Si
mple UnGapped Alignment Report)、VULGAR(V
erbose Useful Labeled Gapped Alignment R
eport)、およびCIGAR(Compact Idiosyncratic Ga
pped Alignment Report)(Ning, Z.ら、Genome Research、1
1巻(10号):1725〜9頁(2001年))を含む。これらのストリングは、例え
ば、European Bioinformatics Institute(Hinx
ton、UK)製の、Exonerate配列アライメントソフトウェアに実装されてい
る。
(sequence alignment map)ファイルまたはBAM(binar
y alignment map)ファイルなど)を作製する(SAMフォーマットにつ
いては、例えば、Liら、The Sequence Alignment/Map format and SAM tools、Bio
informatics、2009年、25巻(16号):2078〜9頁において記載されている
)。一部の実施形態では、CIGARは、1行当たり1つずつのギャップ処理アライメン
トを、表示するかまたは含む。CIGARとは、CIGARストリングとして報告される
、対応のある、圧縮アライメントフォーマットである。CIGARストリングは、対応の
ある、長い(例えば、ゲノム)アライメントを表すのに有用である。CIGARストリン
グは、リードのアライメントを、基準ゲノム配列に照らして表すように、SAMフォーマ
ットで使用される。
トの塩基カウントをもたらす。使用される文字は、M、I、D、N、およびS(M=マッ
チ;I=挿入;D=欠失;N=ギャップ;S=置換)を含みうる。CIGARストリング
は、マッチ/ミスマッチおよび欠失(またはギャップ)の配列を規定する。例えば、CI
GARストリングである、2MD3M2D2Mは、アライメントが、2つのマッチ、1つ
の欠失(数字1は、幾分のスペースを節約するために省略する)、3つのマッチ、2つの
欠失、および2つのマッチを含有することを意味するであろう。
ファームウェア、配線、またはこれらの任意の組合せを含む、本発明のシステムを使用し
て実装することができる。機能を実装するフィーチャはまた、機能のうちの一部を、異な
る物理的な場所で実装するように、分散させることを含め、物理的に多様な位置に配置す
ることもできる。
り、本発明のコンピュータシステムまたはマシンは、バスを介して互いと連絡する、1ま
たは複数のプロセッサー(例えば、中央処理装置(CPU)、グラフィックスプロセシン
グユニット(GPU)、またはこれらの両方)、メインメモリ、およびスタティックメモ
リを含む。
示される通り、システム701は、サーバーコンピュータ705、ターミナル715、シ
ーケンサー715、シーケンサーコンピュータ721、コンピュータ749、またはこれ
らの任意の組合せのうちの1または複数を含みうる。このような各コンピュータデバイス
は、ネットワーク709を介して連絡しうる。シーケンサー725は、任意選択で、それ
自身の、例えば、専用のシーケンサーコンピュータ721(任意の入力/出力機構(I/
O)、プロセッサー、およびメモリを含む)を含むか、またはこれと作動可能に結合する
ことができる。加えて、または代替的に、シーケンサー725は、ネットワーク709を
介して、サーバー705またはコンピュータ749(例えば、ラップトップ、デスクトッ
プ、またはタブレット)と作動可能に結合することができる。コンピュータ749は、1
または複数のプロセッサー、メモリ、およびI/Oを含む。本発明の方法が、クライアン
ト/サーバー型アーキテクチャーを利用する場合、本発明の方法の任意のステップは、プ
ロセッサー、メモリ、およびI/Oのうちの1または複数を含み、データ、命令などを得
るか、またはインターフェースモジュールを介して、結果を提示するか、またはファイル
として結果を提示することが可能なサーバー705を使用して実施することができる。サ
ーバー705は、コンピュータ749またはターミナル715を介して、ネットワーク7
09にわたり関与する場合もあり、またはサーバー705は、ターミナル715へと、直
接接続することもできる。ターミナル515は、コンピュータデバイスであることが好ま
しい。本発明に従うコンピュータは、I/O機構およびメモリに結合された1または複数
のプロセッサーを含むことが好ましい。
複数を含む、1または複数のプロセッサーにより用意することができる。I/O機構は、
ビデオディスプレイユニット(例えば、液晶ディスプレイ(LCD)またはブラウン管(
CRT))、英数字入力デバイス(例えば、キーボード)、カーソル制御デバイス(例え
ば、マウス)、ディスクドライブユニット、信号発生デバイス(例えば、スピーカー)、
加速度計、マイクロフォン、セル型ラジオ周波数アンテナ、およびネットワークインター
フェースデバイス(例えば、ネットワークインターフェースカード(NIC)、Wi−F
iカード、セル型モデム、データジャック、イーサーネットポート、モデムジャック、H
DMI(登録商標)ポート、ミニHDMI(登録商標)ポート、USBポート)、タッチ
スクリーン(例えば、CRT、LCD、LED、AMOLED、Super AMOLE
D)、ポインティングデバイス、トラックパッド、ライト(例えば、LED)、ライト/
画像投影デバイス、またはこれらの組合せを含みうる。本発明に従うメモリは、本明細書
で記載される方法または機能のうちの、任意の1または複数を果たす命令の、1または複
数のセット(例えば、ソフトウェア)を保存する、1または複数のマシン読取り型メディ
アを含むことが好ましい、1または複数の有形デバイスにより用意される、不揮発性メモ
リを指す。ソフトウェアはまた、システム701内のコンピュータ、それらもまた、マシ
ン読取り型メディアを構成する、メインメモリ、およびプロセッサーによるその実行時に
、メインメモリ内、プロセッサー内、またはこれらの両方の中にも、完全に、または少な
くとも部分的に存在しうる。ソフトウェアはさらに、ネットワークインターフェースデバ
イスを介して、ネットワークにわたり、送信または受信することもできる。
マシン読取り型メディア」という用語は、1または複数の命令のセットを保存する、単一
のメディアまたは複数のメディア(例えば、集中型もしくは分散型データベース、ならび
に/または関連するキャッシュおよびサーバー)を含むように理解されるものとする。「
マシン読取り型メディア」という用語はまた、マシンによる実行のための命令のセットを
保存するか、コードするか、または保有することが可能であり、マシンに、本発明の方法
のうちの、任意の1または複数を実施させる任意のメディアも含むように理解されるもの
とする。メモリは、例えば、ハードディスクドライブ、ソリッドステートドライブ(SS
D)、光ディスク、フラッシュメモリ、ジップディスク、テープドライブ、「クラウド」
保存ロケーションのうちの1もしくは複数、またはこれらの組合せでありうる。ある特定
の実施形態では、本発明のデバイスは、メモリのための、有形、不揮発性のコンピュータ
読取り型メディアを含む。メモリとしての使用のための例示的なデバイスは、半導体メモ
リデバイス(例えば、EPROMデバイス、EEPROMデバイス、ソリッドステートド
ライブ(SSD)デバイス、およびフラッシュメモリデバイス、例えば、SDカード、マ
イクロSDカード、SDXCカード、SDIOカード、SDHCカード);磁気ディスク
(例えば、内部ハードディスクまたはリムーバブルディスク);および光ディスク(例え
ば、CDディスクおよびDVDディスク)を含む。
ば、がんを診断することができる。本明細書で使用される「診断」という用語は、患者が
、所与の疾患または状態を患っているのか否かを、当業者が推定および/または決定する
方法を指す。一部の実施形態では、本発明の方法を、疾患または状態、例えば、がんの予
後診断において使用することができる。本明細書で使用される「予後診断」という用語は
、疾患または状態の再発を含む、疾患または状態の進行の可能性を指す。一部の実施形態
では、本発明の方法を使用して、疾患または状態、例えば、がんを発症する危険性を評価
することができる。例えば、本明細書で記載される方法およびシステムを使用して、疾患
または状態の発症についての、特定の診断、予後診断、または疾患もしくは状態を発症す
る危険性と関連する、切断点または遺伝子融合を識別することができる。さらに、本明細
書で記載される方法およびシステムを使用して、予測される治療転帰と関連する、切断点
または遺伝子融合を識別することができる。したがって、方法およびシステムを使用して
、疾患または状態の処置を導く(例えば、化合物または薬剤を、対象へと投与することに
より)こともでき、疾患または状態を処置するための医薬の調製を導くこともできる。
益なまたは所望の結果を得るように、方策を講じることを指す。有益な臨床結果または所
望の臨床結果は、疾患または状態と関連する、1または複数の症状の緩和または軽快を含
むがこれらに限定されない。本明細書で使用される、化合物もしくは薬剤を、対象へと「
投与すること」、または化合物もしくは薬剤の、対象への「投与」は、当業者に公知の様
々な方法のうちの1つを使用して実行することができる。例えば、化合物または薬剤は、
静脈内投与、動脈内投与、皮内投与、筋内投与、腹腔内投与、静脈内投与、皮下投与、眼
内投与、舌下投与、経口(服用による)投与、鼻腔内(吸入による)投与、脊髄内投与、
脳内投与、および経皮(例えば、皮膚導管を介する吸収による)投与することができる。
化合物または薬剤はまた、充電式デバイスもしくは生体分解性ポリマーデバイス、または
他のデバイス、例えば、化合物または薬剤の、持続放出、徐放、または制御放出をもたら
す、パッチおよびポンプ、または製剤によっても適切に導入することができる。投与する
ことはまた、例えば、単回で実施することもでき、複数回で実施することもでき、および
/または1もしくは複数の期間にわたり実施することもできる。一部の態様では、投与は
、自己投与を含む直接投与、および薬物を処方する行為を含む間接的投与の両方を含む。
例えば、本明細書で使用される通り、患者が薬物を自己投与するか、もしくは別の医師が
薬物を投与するように指示する医師、および/または患者に薬物についての処方を施す医
師は、患者へと、薬物を投与している。一部の実施形態では、化合物または薬剤を、例え
ば、対象へと、服用により経口投与するか、または例えば、対象へと、注射により静脈内
投与する。一部の実施形態では、経口投与される化合物または薬剤は、持続放出製剤もし
くは徐放製剤であるか、またはこのような徐放もしくは持続放出のためのデバイスを使用
して投与される。
可能性があり、異なる部位へと転移しうる、多様な種類の悪性新生物を含むがこれらに限
定されない(例えば、全ての目的で、参照によりその全体において本明細書に組み込まれ
る、PDR Medical Dictionary、1版(1995年)を参照されたい)。「新生物」およ
び「腫瘍」という用語は、細胞の増殖により、正常組織より迅速に増殖し、増殖を誘発し
た刺激が解除された後でも増殖し続ける異常組織を指す。このような異常組織は、構造的
な組織化、および正常組織との機能的な協調の、部分的または完全な欠如であって、良性
(良性腫瘍など)または悪性(悪性腫瘍など)でありうる欠如を示す。がんの一般的な類
型の例は、癌腫(例えば、乳がん、前立腺がん、肺がん、および結腸がんの共通の形態な
ど、上皮細胞に由来する悪性腫瘍)、肉腫(結合組織または間葉細胞に由来する悪性腫瘍
)、リンパ腫(造血細胞に由来する悪性腫瘍)、白血病(造血細胞に由来する悪性腫瘍)
、および生殖細胞腫瘍(全能性細胞に由来する腫瘍であって、成人では、精巣内または卵
巣内に見出されることが最も多く;胎児、乳児、および若齢小児では、体内の正中線上、
特に、鼻骨の先端に見出されることが最も多い腫瘍)、芽球性腫瘍(典型的に、未成熟組
織または胚性組織に酷似する悪性腫瘍)などを含むがこれらに限定されない。本発明によ
り包含されることが意図される新生物の種類の例は、神経組織、造血組織、乳腺、皮膚、
骨、前立腺、卵巣、子宮、子宮頸部、肝臓、肺、脳、喉頭、胆嚢、膵臓、直腸、副甲状腺
、甲状腺、副腎、免疫系、頭頚部、結腸、胃、気管支、および/または腎臓のがんと関連
する新生物を含むがこれらに限定されない。特定の実施形態では、検出されうるがんの種
類および数は、血液がん、脳がん、肺がん、皮膚がん、鼻腔がん、咽頭がん、肝臓がん、
骨がん、リンパ腫、膵臓がん、皮膚がん、腸がん、直腸がん、甲状腺がん、膀胱がん、腎
臓がん、口腔がん、胃がん、充実性腫瘍、異種性腫瘍、同種性腫瘍などを含むがこれらに
限定されない。特定の実施形態では、がんは、血液がん、肉腫、または前立腺がんである
。
、このような実施形態は、例だけを目的として提示されることが明らかであろう。本発明
から逸脱することなく、当業者は今や、多数の変形形態、変更形態、および代用に想到す
るであろう。本明細書で記載される、本発明の実施形態に対する、多様な代替物を、本発
明の実施において利用しうることを理解されたい。以下の特許請求の範囲は、本発明の範
囲を規定するものであり、これらの特許請求の範囲の範囲内にある方法および構造、なら
びにそれらの均等物は、その対象となることが意図される。
Claims (1)
- 明細書に記載の発明。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022076998A JP2022109297A (ja) | 2015-10-10 | 2022-05-09 | 無細胞dna分析における遺伝子融合検出の方法および応用 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562239879P | 2015-10-10 | 2015-10-10 | |
US62/239,879 | 2015-10-10 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018517871A Division JP6824973B2 (ja) | 2015-10-10 | 2016-10-10 | 無細胞dna分析における遺伝子融合検出の方法および応用 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022076998A Division JP2022109297A (ja) | 2015-10-10 | 2022-05-09 | 無細胞dna分析における遺伝子融合検出の方法および応用 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021052805A true JP2021052805A (ja) | 2021-04-08 |
JP7072091B2 JP7072091B2 (ja) | 2022-05-19 |
Family
ID=58488688
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018517871A Active JP6824973B2 (ja) | 2015-10-10 | 2016-10-10 | 無細胞dna分析における遺伝子融合検出の方法および応用 |
JP2021003333A Active JP7072091B2 (ja) | 2015-10-10 | 2021-01-13 | 無細胞dna分析における遺伝子融合検出の方法および応用 |
JP2022076998A Pending JP2022109297A (ja) | 2015-10-10 | 2022-05-09 | 無細胞dna分析における遺伝子融合検出の方法および応用 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018517871A Active JP6824973B2 (ja) | 2015-10-10 | 2016-10-10 | 無細胞dna分析における遺伝子融合検出の方法および応用 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022076998A Pending JP2022109297A (ja) | 2015-10-10 | 2022-05-09 | 無細胞dna分析における遺伝子融合検出の方法および応用 |
Country Status (7)
Country | Link |
---|---|
US (2) | US20180300449A1 (ja) |
EP (2) | EP3359695B1 (ja) |
JP (3) | JP6824973B2 (ja) |
CN (2) | CN117012283A (ja) |
ES (1) | ES2796501T3 (ja) |
HK (1) | HK1259281A1 (ja) |
WO (1) | WO2017062970A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114822700A (zh) * | 2022-04-25 | 2022-07-29 | 至本医疗科技(上海)有限公司 | 用于呈现重排或融合结构亚型的方法、设备和介质 |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9476095B2 (en) | 2011-04-15 | 2016-10-25 | The Johns Hopkins University | Safe sequencing system |
CN104956225B (zh) | 2012-10-29 | 2018-10-02 | 约翰·霍普金斯大学 | 卵巢和子宫内膜癌的帕帕尼科拉乌测试 |
US11286531B2 (en) | 2015-08-11 | 2022-03-29 | The Johns Hopkins University | Assaying ovarian cyst fluid |
ES2796501T3 (es) | 2015-10-10 | 2020-11-27 | Guardant Health Inc | Métodos y aplicaciones de la detección de fusión de genes en el análisis de ADN sin células |
AU2016353133B2 (en) | 2015-11-11 | 2022-12-08 | Resolution Bioscience, Inc. | High efficiency construction of dna libraries |
BR112019003704A2 (pt) | 2016-08-25 | 2019-05-28 | Resolution Bioscience Inc | métodos para a detecção de alterações na cópia genômica em amostras de dna |
KR20210158870A (ko) | 2016-09-30 | 2021-12-31 | 가던트 헬쓰, 인크. | 무세포 핵산의 다중-해상도 분석 방법 |
US9850523B1 (en) | 2016-09-30 | 2017-12-26 | Guardant Health, Inc. | Methods for multi-resolution analysis of cell-free nucleic acids |
WO2018213814A1 (en) * | 2017-05-19 | 2018-11-22 | Guardant Health, Inc. | Methods and systems for detecting insertions and deletions |
US10964410B2 (en) * | 2017-05-25 | 2021-03-30 | Koninklijke Philips N.V. | System and method for detecting gene fusion |
GB201709675D0 (en) | 2017-06-16 | 2017-08-02 | Inivata Ltd | Method for detecting genomic rearrangements |
EP3665308A1 (en) | 2017-08-07 | 2020-06-17 | The Johns Hopkins University | Methods and materials for assessing and treating cancer |
CN110021346B (zh) * | 2018-01-09 | 2023-06-30 | 上海交通大学医学院附属瑞金医院 | 基于RNAseq数据的基因融合与突变检测方法及系统 |
CN108304693B (zh) * | 2018-01-23 | 2022-02-25 | 元码基因科技(北京)股份有限公司 | 利用高通量测序数据分析基因融合的方法 |
WO2019200328A1 (en) * | 2018-04-13 | 2019-10-17 | Guardant Health, Inc. | Methods for detecting and suppressing alignment errors caused by fusion events |
AU2019351130A1 (en) | 2018-09-27 | 2021-04-08 | Grail, Llc | Methylation markers and targeted methylation probe panel |
CN113166806A (zh) * | 2018-10-17 | 2021-07-23 | 奎斯特诊断投资有限责任公司 | 基因组测序选择系统 |
WO2020092807A1 (en) * | 2018-10-31 | 2020-05-07 | Guardant Health, Inc. | Methods, compositions and systems for calibrating epigenetic partitioning assays |
GB2596233B (en) * | 2018-12-20 | 2023-10-11 | Veracyte Inc | Methods and systems for detecting genetic fusions to identify a lung disorder |
CN109777864A (zh) * | 2018-12-29 | 2019-05-21 | 武汉康圣达医学检验所有限公司 | 一种检测bcr-abl融合基因abl激酶区突变的方法 |
JP2022519045A (ja) | 2019-01-31 | 2022-03-18 | ガーダント ヘルス, インコーポレイテッド | 無細胞dnaを単離するための組成物および方法 |
EP3956897A1 (en) * | 2019-04-18 | 2022-02-23 | Life Technologies Corporation | Methods for context based compression of genomic data for immuno-oncology biomarkers |
US11211147B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing |
US11475981B2 (en) | 2020-02-18 | 2022-10-18 | Tempus Labs, Inc. | Methods and systems for dynamic variant thresholding in a liquid biopsy assay |
US11211144B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Methods and systems for refining copy number variation in a liquid biopsy assay |
CN113106149B (zh) * | 2021-04-26 | 2023-01-17 | 福建和瑞基因科技有限公司 | 融合基因检测参考品的制备方法及融合基因检测参考品的应用 |
CN113862344A (zh) * | 2021-09-09 | 2021-12-31 | 成都齐碳科技有限公司 | 基因融合的检测方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090202999A1 (en) * | 2007-06-01 | 2009-08-13 | Monoquant Pty Ltd | method for dna breakpoint analysis |
US20150142328A1 (en) * | 2013-11-18 | 2015-05-21 | Electronics And Telecommunications Research Institute | Calculation method for interchromosomal translocation position |
CN104894271A (zh) * | 2015-06-10 | 2015-09-09 | 天津诺禾致源生物信息科技有限公司 | 一种检测基因融合的方法及装置 |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5242794A (en) | 1984-12-13 | 1993-09-07 | Applied Biosystems, Inc. | Detection of specific sequences in nucleic acids |
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US4988617A (en) | 1988-03-25 | 1991-01-29 | California Institute Of Technology | Method of detecting a nucleotide change in nucleic acids |
US5494810A (en) | 1990-05-03 | 1996-02-27 | Cornell Research Foundation, Inc. | Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease |
US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
US6156504A (en) * | 1996-03-15 | 2000-12-05 | The Penn State Research Foundation | Detection of extracellular tumor-associated nucleic acid in blood plasma or serum using nucleic acid amplification assays |
GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
US6054276A (en) | 1998-02-23 | 2000-04-25 | Macevicz; Stephen C. | DNA restriction site mapping |
US6787308B2 (en) | 1998-07-30 | 2004-09-07 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
GB9901475D0 (en) | 1999-01-22 | 1999-03-17 | Pyrosequencing Ab | A method of DNA sequencing |
US6818395B1 (en) | 1999-06-28 | 2004-11-16 | California Institute Of Technology | Methods and apparatus for analyzing polynucleotide sequences |
US6849403B1 (en) * | 1999-09-08 | 2005-02-01 | Exact Sciences Corporation | Apparatus and method for drug screening |
US6586177B1 (en) * | 1999-09-08 | 2003-07-01 | Exact Sciences Corporation | Methods for disease detection |
EP1218543A2 (en) | 1999-09-29 | 2002-07-03 | Solexa Ltd. | Polynucleotide sequencing |
US6582938B1 (en) | 2001-05-11 | 2003-06-24 | Affymetrix, Inc. | Amplification of nucleic acids |
DE60328193D1 (de) * | 2003-10-16 | 2009-08-13 | Sequenom Inc | Nicht invasiver Nachweis fötaler genetischer Merkmale |
EP2202322A1 (en) | 2003-10-31 | 2010-06-30 | AB Advanced Genetic Analysis Corporation | Methods for producing a paired tag from a nucleic acid sequence and methods of use thereof |
US9109256B2 (en) * | 2004-10-27 | 2015-08-18 | Esoterix Genetic Laboratories, Llc | Method for monitoring disease progression or recurrence |
WO2007145612A1 (en) | 2005-06-06 | 2007-12-21 | 454 Life Sciences Corporation | Paired end sequencing |
US7329860B2 (en) | 2005-11-23 | 2008-02-12 | Illumina, Inc. | Confocal imaging methods and apparatus |
US7754429B2 (en) | 2006-10-06 | 2010-07-13 | Illumina Cambridge Limited | Method for pair-wise sequencing a plurity of target polynucleotides |
US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
WO2008092150A1 (en) | 2007-01-26 | 2008-07-31 | Illumina, Inc. | Nucleic acid sequencing system and method |
WO2008148072A2 (en) * | 2007-05-24 | 2008-12-04 | The Brigham And Women's Hospital, Inc. | Disease-associated genetic variations and methods for obtaining and using same |
CN101918586A (zh) * | 2007-10-22 | 2010-12-15 | 新加坡科技研究局 | 融合基因 |
US8546128B2 (en) | 2008-10-22 | 2013-10-01 | Life Technologies Corporation | Fluidics system for sequential delivery of reagents |
US20100301398A1 (en) | 2009-05-29 | 2010-12-02 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
US8574835B2 (en) | 2009-05-29 | 2013-11-05 | Life Technologies Corporation | Scaffolded nucleic acid polymer particles and methods of making and using |
US8673627B2 (en) | 2009-05-29 | 2014-03-18 | Life Technologies Corporation | Apparatus and methods for performing electrochemical reactions |
EP3660165B1 (en) * | 2009-12-22 | 2023-01-04 | Sequenom, Inc. | Processes and kits for identifying aneuploidy |
CN101886119A (zh) * | 2010-02-11 | 2010-11-17 | 王宏伟 | 一种检测基因断裂融合的方法 |
US20140222443A1 (en) * | 2011-06-07 | 2014-08-07 | Kathleen Danenberg | Molecular profiling for cancer |
WO2013097257A1 (zh) * | 2011-12-31 | 2013-07-04 | 深圳华大基因科技有限公司 | 一种检验融合基因的方法及系统 |
AU2013295805B2 (en) * | 2012-07-24 | 2019-05-02 | The Trustees Of Columbia University In The City Of New York | Fusion proteins and methods thereof |
CN105518151B (zh) * | 2013-03-15 | 2021-05-25 | 莱兰斯坦福初级大学评议会 | 循环核酸肿瘤标志物的鉴别和用途 |
ES2796501T3 (es) | 2015-10-10 | 2020-11-27 | Guardant Health Inc | Métodos y aplicaciones de la detección de fusión de genes en el análisis de ADN sin células |
-
2016
- 2016-10-10 ES ES16854550T patent/ES2796501T3/es active Active
- 2016-10-10 CN CN202310985498.0A patent/CN117012283A/zh active Pending
- 2016-10-10 WO PCT/US2016/056314 patent/WO2017062970A1/en active Application Filing
- 2016-10-10 EP EP16854550.7A patent/EP3359695B1/en active Active
- 2016-10-10 CN CN201680071449.4A patent/CN108368546B/zh active Active
- 2016-10-10 JP JP2018517871A patent/JP6824973B2/ja active Active
- 2016-10-10 US US15/766,733 patent/US20180300449A1/en active Pending
- 2016-10-10 EP EP20163383.1A patent/EP3693459A1/en active Pending
-
2017
- 2017-02-27 US US15/442,990 patent/US20170240972A1/en not_active Abandoned
-
2019
- 2019-01-30 HK HK19101642.9A patent/HK1259281A1/zh unknown
-
2021
- 2021-01-13 JP JP2021003333A patent/JP7072091B2/ja active Active
-
2022
- 2022-05-09 JP JP2022076998A patent/JP2022109297A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090202999A1 (en) * | 2007-06-01 | 2009-08-13 | Monoquant Pty Ltd | method for dna breakpoint analysis |
US20150142328A1 (en) * | 2013-11-18 | 2015-05-21 | Electronics And Telecommunications Research Institute | Calculation method for interchromosomal translocation position |
CN104894271A (zh) * | 2015-06-10 | 2015-09-09 | 天津诺禾致源生物信息科技有限公司 | 一种检测基因融合的方法及装置 |
Non-Patent Citations (1)
Title |
---|
SCHRODER, JAN: "Socrates: identification of genomic rearrangements in tumour genomes by re-aligning soft clipped rea", BIOINFORMATICS, vol. 30, no. 8, JPN6020048297, 2 January 2014 (2014-01-02), GB, pages 1064 - 1072, XP055233373, ISSN: 0004745851, DOI: 10.1093/bioinformatics/btt767 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114822700A (zh) * | 2022-04-25 | 2022-07-29 | 至本医疗科技(上海)有限公司 | 用于呈现重排或融合结构亚型的方法、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
JP6824973B2 (ja) | 2021-02-03 |
EP3693459A1 (en) | 2020-08-12 |
EP3359695B1 (en) | 2020-04-15 |
CN108368546A (zh) | 2018-08-03 |
JP2022109297A (ja) | 2022-07-27 |
HK1259281A1 (zh) | 2019-11-29 |
US20180300449A1 (en) | 2018-10-18 |
ES2796501T3 (es) | 2020-11-27 |
JP7072091B2 (ja) | 2022-05-19 |
WO2017062970A1 (en) | 2017-04-13 |
EP3359695A4 (en) | 2019-06-26 |
JP2018535481A (ja) | 2018-11-29 |
CN117012283A (zh) | 2023-11-07 |
EP3359695A1 (en) | 2018-08-15 |
CN108368546B (zh) | 2023-08-01 |
US20170240972A1 (en) | 2017-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7072091B2 (ja) | 無細胞dna分析における遺伝子融合検出の方法および応用 | |
US11193175B2 (en) | Normalizing tumor mutation burden | |
WO2013184643A1 (en) | Determining the clinical significance of variant sequences | |
CN111357054A (zh) | 用于区分体细胞变异和种系变异的方法和系统 | |
JP2024056984A (ja) | エピジェネティック区画アッセイを較正するための方法、組成物およびシステム | |
US20240141425A1 (en) | Correcting for deamination-induced sequence errors | |
US20200232010A1 (en) | Methods, compositions, and systems for improving recovery of nucleic acid molecules | |
CN114746560A (zh) | 改进甲基化多核苷酸结合的方法、组合物和系统 | |
KR20210052501A (ko) | 샘플 사이의 오염을 검출하기 위한 방법 및 시스템 | |
Frio | High-Throughput Technologies: DNA and RNA sequencing strategies and potential | |
EP4172357A1 (en) | Methods and compositions for analyzing nucleic acid | |
JP2021534803A (ja) | 無細胞核酸試料におけるアレル不均衡を検出するための方法およびシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210212 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220407 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220509 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7072091 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |