JP2023126874A - 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法 - Google Patents
無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法 Download PDFInfo
- Publication number
- JP2023126874A JP2023126874A JP2023108348A JP2023108348A JP2023126874A JP 2023126874 A JP2023126874 A JP 2023126874A JP 2023108348 A JP2023108348 A JP 2023108348A JP 2023108348 A JP2023108348 A JP 2023108348A JP 2023126874 A JP2023126874 A JP 2023126874A
- Authority
- JP
- Japan
- Prior art keywords
- sequencing
- loci
- locus
- probe
- dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title abstract description 115
- 108090000623 proteins and genes Proteins 0.000 title description 55
- 206010028980 Neoplasm Diseases 0.000 title description 26
- 238000004458 analytical method Methods 0.000 title description 2
- 239000000523 sample Substances 0.000 abstract description 243
- 238000012163 sequencing technique Methods 0.000 abstract description 222
- 238000012937 correction Methods 0.000 abstract description 65
- 230000002068 genetic effect Effects 0.000 abstract description 56
- 210000001124 body fluid Anatomy 0.000 abstract description 33
- 210000004881 tumor cell Anatomy 0.000 abstract description 20
- 102000053602 DNA Human genes 0.000 description 149
- 108020004414 DNA Proteins 0.000 description 149
- NOIRDLRUNWIUMX-UHFFFAOYSA-N 2-amino-3,7-dihydropurin-6-one;6-amino-1h-pyrimidin-2-one Chemical compound NC=1C=CNC(=O)N=1.O=C1NC(N)=NC2=C1NC=N2 NOIRDLRUNWIUMX-UHFFFAOYSA-N 0.000 description 67
- 125000003729 nucleotide group Chemical group 0.000 description 61
- 239000002773 nucleotide Substances 0.000 description 59
- 150000007523 nucleic acids Chemical class 0.000 description 46
- 102000040430 polynucleotide Human genes 0.000 description 42
- 108091033319 polynucleotide Proteins 0.000 description 42
- 239000002157 polynucleotide Substances 0.000 description 42
- 102000039446 nucleic acids Human genes 0.000 description 39
- 108020004707 nucleic acids Proteins 0.000 description 39
- 239000012634 fragment Substances 0.000 description 32
- 239000010839 body fluid Substances 0.000 description 31
- 210000004027 cell Anatomy 0.000 description 27
- 230000000295 complement effect Effects 0.000 description 26
- 230000009466 transformation Effects 0.000 description 24
- 238000009396 hybridization Methods 0.000 description 23
- 230000015654 memory Effects 0.000 description 22
- 238000003860 storage Methods 0.000 description 18
- 201000011510 cancer Diseases 0.000 description 16
- 230000008569 process Effects 0.000 description 16
- 108700028369 Alleles Proteins 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 14
- 239000013074 reference sample Substances 0.000 description 14
- 230000003321 amplification Effects 0.000 description 13
- 239000011324 bead Substances 0.000 description 13
- 238000003199 nucleic acid amplification method Methods 0.000 description 13
- 238000003752 polymerase chain reaction Methods 0.000 description 13
- 238000013507 mapping Methods 0.000 description 12
- 108091028043 Nucleic acid sequence Proteins 0.000 description 11
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 239000002751 oligonucleotide probe Substances 0.000 description 11
- 230000004075 alteration Effects 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- 230000000977 initiatory effect Effects 0.000 description 9
- 239000007787 solid Substances 0.000 description 9
- 210000002381 plasma Anatomy 0.000 description 8
- 241000282414 Homo sapiens Species 0.000 description 7
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000035772 mutation Effects 0.000 description 7
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 210000004602 germ cell Anatomy 0.000 description 6
- 229910052739 hydrogen Inorganic materials 0.000 description 6
- 239000001257 hydrogen Substances 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 210000002700 urine Anatomy 0.000 description 6
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- 238000010348 incorporation Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- -1 DNA) sequence data Chemical class 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 239000012530 fluid Substances 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 229910052700 potassium Inorganic materials 0.000 description 4
- 229920002477 rna polymer Polymers 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 210000002966 serum Anatomy 0.000 description 4
- 230000004544 DNA amplification Effects 0.000 description 3
- 102100023600 Fibroblast growth factor receptor 2 Human genes 0.000 description 3
- 101710182389 Fibroblast growth factor receptor 2 Proteins 0.000 description 3
- 102100024185 G1/S-specific cyclin-D2 Human genes 0.000 description 3
- 102100030708 GTPase KRas Human genes 0.000 description 3
- 101000980741 Homo sapiens G1/S-specific cyclin-D2 Proteins 0.000 description 3
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 102000043276 Oncogene Human genes 0.000 description 3
- 108700020796 Oncogene Proteins 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000001574 biopsy Methods 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 229940104302 cytosine Drugs 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 3
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 210000003754 fetus Anatomy 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 238000012417 linear regression Methods 0.000 description 3
- 230000008774 maternal effect Effects 0.000 description 3
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 102000054765 polymorphisms of proteins Human genes 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012175 pyrosequencing Methods 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 238000004448 titration Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 102100033793 ALK tyrosine kinase receptor Human genes 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- ZEOWTGPWHLSLOG-UHFFFAOYSA-N Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F Chemical compound Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F ZEOWTGPWHLSLOG-UHFFFAOYSA-N 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 108010058546 Cyclin D1 Proteins 0.000 description 2
- 108010025464 Cyclin-Dependent Kinase 4 Proteins 0.000 description 2
- 108010025468 Cyclin-Dependent Kinase 6 Proteins 0.000 description 2
- 102100036252 Cyclin-dependent kinase 4 Human genes 0.000 description 2
- 102100026804 Cyclin-dependent kinase 6 Human genes 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 102100023593 Fibroblast growth factor receptor 1 Human genes 0.000 description 2
- 101710182386 Fibroblast growth factor receptor 1 Proteins 0.000 description 2
- 102100027842 Fibroblast growth factor receptor 3 Human genes 0.000 description 2
- 101710182396 Fibroblast growth factor receptor 3 Proteins 0.000 description 2
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 102100024165 G1/S-specific cyclin-D1 Human genes 0.000 description 2
- 102100037858 G1/S-specific cyclin-E1 Human genes 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 102100035108 High affinity nerve growth factor receptor Human genes 0.000 description 2
- 101000779641 Homo sapiens ALK tyrosine kinase receptor Proteins 0.000 description 2
- 101000967216 Homo sapiens Eosinophil cationic protein Proteins 0.000 description 2
- 101000738568 Homo sapiens G1/S-specific cyclin-E1 Proteins 0.000 description 2
- 101000596894 Homo sapiens High affinity nerve growth factor receptor Proteins 0.000 description 2
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 description 2
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 description 2
- 101000686031 Homo sapiens Proto-oncogene tyrosine-protein kinase ROS Proteins 0.000 description 2
- 101000712530 Homo sapiens RAF proto-oncogene serine/threonine-protein kinase Proteins 0.000 description 2
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 2
- 102000048850 Neoplasm Genes Human genes 0.000 description 2
- 108700019961 Neoplasm Genes Proteins 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 description 2
- 102100023347 Proto-oncogene tyrosine-protein kinase ROS Human genes 0.000 description 2
- 102100033479 RAF proto-oncogene serine/threonine-protein kinase Human genes 0.000 description 2
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine group Chemical group [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C=NC=2C(N)=NC=NC12 OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 238000001493 electron microscopy Methods 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 210000003722 extracellular fluid Anatomy 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000001605 fetal effect Effects 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 238000007672 fourth generation sequencing Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009022 nonlinear effect Effects 0.000 description 2
- 239000013610 patient sample Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000037452 priming Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 208000011581 secondary neoplasm Diseases 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 102100034580 AT-rich interactive domain-containing protein 1A Human genes 0.000 description 1
- 102000000872 ATM Human genes 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 208000003200 Adenoma Diseases 0.000 description 1
- 102100034540 Adenomatous polyposis coli protein Human genes 0.000 description 1
- 102100040149 Adenylyl-sulfate kinase Human genes 0.000 description 1
- 101100455868 Arabidopsis thaliana MKK2 gene Proteins 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 108010004586 Ataxia Telangiectasia Mutated Proteins Proteins 0.000 description 1
- 102000036365 BRCA1 Human genes 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 102000052609 BRCA2 Human genes 0.000 description 1
- 108700020462 BRCA2 Proteins 0.000 description 1
- 101150008921 Brca2 gene Proteins 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 102100028914 Catenin beta-1 Human genes 0.000 description 1
- 108091007854 Cdh1/Fizzy-related Proteins 0.000 description 1
- 102000038594 Cdh1/Fizzy-related Human genes 0.000 description 1
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 102000009512 Cyclin-Dependent Kinase Inhibitor p15 Human genes 0.000 description 1
- 108010009356 Cyclin-Dependent Kinase Inhibitor p15 Proteins 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 102100038595 Estrogen receptor Human genes 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 101710105178 F-box/WD repeat-containing protein 7 Proteins 0.000 description 1
- 102100028138 F-box/WD repeat-containing protein 7 Human genes 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- 102100027541 GTP-binding protein Rheb Human genes 0.000 description 1
- 102100025477 GTP-binding protein Rit1 Human genes 0.000 description 1
- 102100029974 GTPase HRas Human genes 0.000 description 1
- 102100039788 GTPase NRas Human genes 0.000 description 1
- 102100025334 Guanine nucleotide-binding protein G(q) subunit alpha Human genes 0.000 description 1
- 102100032610 Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Human genes 0.000 description 1
- 102100031561 Hamartin Human genes 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 102100022057 Hepatocyte nuclear factor 1-alpha Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000924266 Homo sapiens AT-rich interactive domain-containing protein 1A Proteins 0.000 description 1
- 101000924577 Homo sapiens Adenomatous polyposis coli protein Proteins 0.000 description 1
- 101000916173 Homo sapiens Catenin beta-1 Proteins 0.000 description 1
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 description 1
- 101000574654 Homo sapiens GTP-binding protein Rit1 Proteins 0.000 description 1
- 101000584633 Homo sapiens GTPase HRas Proteins 0.000 description 1
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 1
- 101000857888 Homo sapiens Guanine nucleotide-binding protein G(q) subunit alpha Proteins 0.000 description 1
- 101001014590 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Proteins 0.000 description 1
- 101001014594 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms short Proteins 0.000 description 1
- 101000795643 Homo sapiens Hamartin Proteins 0.000 description 1
- 101001045751 Homo sapiens Hepatocyte nuclear factor 1-alpha Proteins 0.000 description 1
- 101000599886 Homo sapiens Isocitrate dehydrogenase [NADP], mitochondrial Proteins 0.000 description 1
- 101001014610 Homo sapiens Neuroendocrine secretory protein 55 Proteins 0.000 description 1
- 101001109719 Homo sapiens Nucleophosmin Proteins 0.000 description 1
- 101001126417 Homo sapiens Platelet-derived growth factor receptor alpha Proteins 0.000 description 1
- 101000797903 Homo sapiens Protein ALEX Proteins 0.000 description 1
- 101000579425 Homo sapiens Proto-oncogene tyrosine-protein kinase receptor Ret Proteins 0.000 description 1
- 101000779418 Homo sapiens RAC-alpha serine/threonine-protein kinase Proteins 0.000 description 1
- 101000742859 Homo sapiens Retinoblastoma-associated protein Proteins 0.000 description 1
- 101000628562 Homo sapiens Serine/threonine-protein kinase STK11 Proteins 0.000 description 1
- 101000799466 Homo sapiens Thrombopoietin receptor Proteins 0.000 description 1
- 101000819111 Homo sapiens Trans-acting T-cell-specific transcription factor GATA-3 Proteins 0.000 description 1
- 101000997832 Homo sapiens Tyrosine-protein kinase JAK2 Proteins 0.000 description 1
- 101000934996 Homo sapiens Tyrosine-protein kinase JAK3 Proteins 0.000 description 1
- 101001087416 Homo sapiens Tyrosine-protein phosphatase non-receptor type 11 Proteins 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 102100037845 Isocitrate dehydrogenase [NADP], mitochondrial Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- 102100025725 Mothers against decapentaplegic homolog 4 Human genes 0.000 description 1
- 101710143112 Mothers against decapentaplegic homolog 4 Proteins 0.000 description 1
- 108010026664 MutL Protein Homolog 1 Proteins 0.000 description 1
- 102000013609 MutL Protein Homolog 1 Human genes 0.000 description 1
- 108010071382 NF-E2-Related Factor 2 Proteins 0.000 description 1
- 206010061309 Neoplasm progression Diseases 0.000 description 1
- 102100023181 Neurogenic locus notch homolog protein 1 Human genes 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108010029755 Notch1 Receptor Proteins 0.000 description 1
- 102100031701 Nuclear factor erythroid 2-related factor 2 Human genes 0.000 description 1
- 102100022678 Nucleophosmin Human genes 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 1
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- 102100030485 Platelet-derived growth factor receptor alpha Human genes 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 102100028286 Proto-oncogene tyrosine-protein kinase receptor Ret Human genes 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 102100033810 RAC-alpha serine/threonine-protein kinase Human genes 0.000 description 1
- 101150020518 RHEB gene Proteins 0.000 description 1
- 101150111584 RHOA gene Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102100038042 Retinoblastoma-associated protein Human genes 0.000 description 1
- 235000014548 Rubus moluccanus Nutrition 0.000 description 1
- 102000001332 SRC Human genes 0.000 description 1
- 108060006706 SRC Proteins 0.000 description 1
- 102100026715 Serine/threonine-protein kinase STK11 Human genes 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- 102100034196 Thrombopoietin receptor Human genes 0.000 description 1
- 102100021386 Trans-acting T-cell-specific transcription factor GATA-3 Human genes 0.000 description 1
- 102100022387 Transforming protein RhoA Human genes 0.000 description 1
- 208000026487 Triploidy Diseases 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- 102100033444 Tyrosine-protein kinase JAK2 Human genes 0.000 description 1
- 102100025387 Tyrosine-protein kinase JAK3 Human genes 0.000 description 1
- 102100033019 Tyrosine-protein phosphatase non-receptor type 11 Human genes 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- IRLPACMLTUPBCL-FCIPNVEPSA-N adenosine-5'-phosphosulfate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@@H](CO[P@](O)(=O)OS(O)(=O)=O)[C@H](O)[C@H]1O IRLPACMLTUPBCL-FCIPNVEPSA-N 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000003398 denaturant Substances 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 210000001723 extracellular space Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000005669 field effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- LIYGYAHYXQDGEP-UHFFFAOYSA-N firefly oxyluciferin Natural products Oc1csc(n1)-c1nc2ccc(O)cc2s1 LIYGYAHYXQDGEP-UHFFFAOYSA-N 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 230000037442 genomic alteration Effects 0.000 description 1
- 210000003731 gingival crevicular fluid Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 235000019689 luncheon sausage Nutrition 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 238000012803 optimization experiment Methods 0.000 description 1
- JJVOROULKOMTKG-UHFFFAOYSA-N oxidized Photinus luciferin Chemical compound S1C2=CC(O)=CC=C2N=C1C1=NC(=O)CS1 JJVOROULKOMTKG-UHFFFAOYSA-N 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 102000016914 ras Proteins Human genes 0.000 description 1
- 108010014186 ras Proteins Proteins 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 230000005751 tumor progression Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000002569 water oil cream Substances 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6809—Methods for determination or identification of nucleic acids involving differential detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B99/00—Subject matter not provided for in other groups of this subclass
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Pathology (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
Abstract
【課題】無細胞体液に由来する試料由来の腫瘍細胞におけるコピー数変異を検出する改善された方法を提供する。【解決手段】一態様では(a)被験体の無細胞体液試料のDNA分子の配列決定リードを得るステップと、(b)配列リードから、複数の遺伝子座における遺伝子座毎に配列決定リードカバレッジ(「リードカバレッジ」)に関連する定量的尺度を含む第1のデータセットを生成するステップと、(c)飽和平衡補正およびプローブ効率補正を遂行することにより、第1のデータセットを補正するステップと、(d)第1のデータセットについてベースラインリードカバレッジを決定するステップであって、ベースラインリードカバレッジが、飽和平衡およびプローブ効率に関連する、ステップと、(e)ベースラインリードカバレッジと比べた複数の遺伝子座における遺伝子座毎のコピー数状態を決定するステップとを含む方法を提供する。【選択図】図15
Description
相互参照
この出願は、2015年12月17日に出願された米国仮出願第62/269,051号(これは、その全体が参考として本明細書に援用される)に対する優先権を主張する。
この出願は、2015年12月17日に出願された米国仮出願第62/269,051号(これは、その全体が参考として本明細書に援用される)に対する優先権を主張する。
がんは、個体の正常細胞内の突然変異の蓄積に起因し、この突然変異の少なくとも一部は、不適切に調節された細胞分裂をもたらす。かかる突然変異は一般的に、腫瘍ゲノム内の遺伝子のコピーの数が被験体の非がん性細胞と比べて増加または減少した、コピー数変異を含む。
腫瘍細胞におけるコピー数変異の検出および特徴付けは、腫瘍進行のモニタリング、患者の転帰の予測および処置選択の緻密化に使用される。しかし、従来方法は、痛みを伴いかつ時間がかかる生検によって得られることが多い、細胞試料において遂行される。かかる生検はまた、多くの場合、被験体内の腫瘍細胞のごく僅かしか試験できず、よって、必ずしも腫瘍細胞の集団を代表するとは限らない。細胞生検、蛍光in situハイブリダイゼーション(FISH)、比較ゲノムハイブリダイゼーションアレイまたは定量的蛍光ポリメラーゼ連鎖反応(PCR)アッセイを要求しない、腫瘍におけるコピー数変異のためのより単純でより迅速な検査の必要がある。
配列決定データを使用した、コピー数変異の決定における特に困難な課題とは、真のコピー数とは無関係な理由から、遺伝子座が、そのカバレッジ(coverage)の深度において変動(variance)を示すことである。例えば、増幅効率、PCR効率およびグアニン-シトシン含量は、同じコピー数の試料に存在する個々の遺伝子座であっても、カバレッジの異なる深度を引き起こし得る。かかる効果によるバイアスを除去する改善された方法が、コピー数検出の改善に必要とされる。
無細胞体液に由来する試料由来の腫瘍細胞におけるコピー数変異を検出する改善された方法が相当に必要とされている。本発明は、この必要に取り組み、追加的な利点を提供する。一態様では、本開示は、(a)被験体の無細胞体液試料のデオキシリボ核酸(DNA)分子の配列決定リードを得るステップと、(b)配列リードから、複数の遺伝子座における遺伝子座毎に配列決定リードカバレッジ(「リードカバレッジ」)に関連する定量的尺度を含む第1のデータセットを生成するステップと、(c)飽和平衡補正(saturation equilibrium correction)およびプローブ効率補正(probe efficiency correction)を遂行することにより、第1のデータセットを補正するステップと、(d)第1のデータセットについてベースラインリードカバレッジを決定するステップであって、ベースラインリードカバレッジが、飽和平衡およびプローブ効率に関連する、ステップと、(e)ベースラインリードカバレッジと比べた複数の遺伝子座における遺伝子座毎のコピー数状態を決定するステップとを含む方法を提供する。一部の実施形態では、第1のデータセットは、複数の遺伝子座における遺伝子座毎に、(i)遺伝子座のグアニン-シトシン含量(「GC含量」)に関連する定量的尺度を含む。一部の実施形態では、本方法は、(c)に先立ち、第1のデータセットから、高変動遺伝子座である遺伝子座を除去するステップを含み、除去するステップは、(i)グアニン-シトシン含量に関連する定量的尺度および遺伝子座の配列決定リードカバレッジの定量的尺度に関連するモデルを適合させるステップと、(ii)遺伝子座から、遺伝子座の少なくとも10%を除去するステップであって、この遺伝子座を除去するステップは、モデルと最も異なる遺伝子座を除去し、これにより、ベースライン化遺伝子座(baselining genetic locus)の第1のデータセットを提供することを含む、ステップとを含む。一部の実施形態では、本方法は、遺伝子座の少なくとも45%を除去するステップを含む。
一部の実施形態では、飽和平衡補正を遂行するステップは、(i)ベースライン化遺伝子座の第1のデータセット由来の遺伝子座毎に、遺伝子座に由来する試料由来のDNA分子の鎖が、配列決定リード内に表される確率に関連する定量的尺度を決定し、(ii)ベースライン化遺伝子座の第1のデータセットのリードカバレッジを、ベースライン化遺伝子座の第1のデータセットのGC含量、およびベースライン化遺伝子座の第1のデータセットにおける各座位に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度の両方に関連付けることにより、リードカバレッジのための第1の変換を決定し、(iii)ベースライン化遺伝子座の第1のデータセット由来の各遺伝子座のリードカバレッジに第1の変換を適用して、ベースライン化遺伝子座の第1のデータセットの変換されたリードカバレッジの第1のセットを含む、飽和補正されたデータセットを提供することにより、ベースライン化データ遺伝子座の第1のデータセットを飽和補正されたデータセットに変換するステップを含む。
一部の実施形態では、第1の変換を決定するステップは、(i)ベースライン化遺伝子座の第1のデータセットのリードカバレッジの中心傾向(central tendency)に関連する尺度を決定するステップと、(ii)遺伝子座のGC含量に基づくベースライン化遺伝子座の第1のデータセットのリードカバレッジの中心傾向に関連する尺度、および遺伝子座に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度を適合させる関数を決定するステップと、(iii)ベースライン化遺伝子座の第1のデータセットの遺伝子座毎に、関数によって予測されるリードカバレッジおよびリードカバレッジの間の差を決定するステップであって、差が、変換されたリードカバレッジである、ステップとを含む。一部の実施形態では、関数は、表面近似(surface approximation)である。本明細書に提供される一部の実施形態では、表面近似は、二次元二次多項式である。
一部の実施形態では、プローブ効率補正を遂行するステップは、(i)飽和補正されたデータセットから、変換されたリードカバレッジの第1のセットに関して高変動遺伝子座である遺伝子座を除去し、これにより、ベースライン化遺伝子座の第2のデータセットを提供し、(ii)ベースライン化遺伝子座の第2のデータセットのプローブ効率に関連する変換されたリードカバレッジの第1のセットのための第2の変換を決定し、(iii)第2の変換を用いて、ベースライン化遺伝子座の第2のデータセットの変換されたリードカバレッジの第1のセットを変換し、これにより、ベースライン化遺伝子座の第2のデータセットの変換されたリードカバレッジの第2のセットを含む、プローブ効率補正されたデータセットを提供することにより、飽和補正されたデータセットをプローブ効率補正されたデータセットへと変換するステップを含む。一部の実施形態では、第1のデータセットから、高変動遺伝子座である遺伝子座を除去するステップは、(i)GC含量および飽和補正されたデータセットの変換されたリードカバレッジの第1のセットに関連するモデルを適合させるステップと、(ii)飽和補正されたデータセットから、遺伝子座の少なくとも10%を除去するステップであって、この遺伝子座を除去するステップは、モデルと最も異なる遺伝子座を除去し、これにより、ベースライン化遺伝子座の第2のデータセットを提供するステップを含む、ステップとを含む。本明細書に提供される一部の実施形態では、除去は、遺伝子座の少なくとも45%である。
一部の実施形態では、プローブ効率は、1種または複数の参照試料において飽和平衡補正を遂行することにより決定され、プローブ効率は、飽和平衡補正を遂行することにより得られる変換されたリードカバレッジである。一部の実施形態では、1種または複数の参照試料は、がんを有しない被験体由来の無細胞体液試料である。本明細書に提供される一部の実施形態では、1種または複数の参照試料は、がんを有する被験体由来の無細胞体液試料であり、対応する遺伝子座は、コピー数変更を起こしていない。
一部の実施形態では、第2の変換を決定するステップは、(i)1種または複数の参照試料由来の遺伝子座について決定されたプローブ効率を、ベースライン化遺伝子座の第2のデータセット由来のリードカバレッジの第1のセットに適合させるステップと、(ii)ベースライン化遺伝子座の第2のデータセットの各遺伝子座の変換されたリードカバレッジを、(i)の適合に基づき予測されるプローブ効率で割るステップとを含む。一部の実施形態では、本方法は、(f)ベースライン化遺伝子座の第2のデータセットの変換されたリードカバレッジを、ベースライン化遺伝子座の第2のデータセットのGC含量、およびベースライン化遺伝子座の第2のデータセットにおける各座位に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度の両方に関連付けることにより、変換されたリードカバレッジの第2のセットのための第3の変換を決定するステップと、(g)第3の変換を、変換されたリードカバレッジの第2のセットに適用して、変換された定量的リードカバレッジの第3のセットを含む、第4のデータセットを提供するステップとをさらに含む。
一部の実施形態では、無細胞体液試料のDNAは、遺伝子座のセット由来の遺伝子座の少なくとも一部分に相補的な1種または複数のオリゴヌクレオチドプローブを使用して、遺伝子座のセットについて濃縮される。一部の実施形態では、遺伝子座のセット由来の各遺伝子座のGC含量は、遺伝子座のセット由来の遺伝子座の少なくとも一部分に相補的な1種または複数のオリゴヌクレオチドプローブのグアニン-シトシン含量の中心傾向に関連する尺度である。一部の実施形態では、遺伝子座のリードカバレッジは、1種または複数のオリゴヌクレオチドプローブに対応する遺伝子座の領域のリードカバレッジの中心傾向に関連する尺度である。一部の実施形態では、飽和平衡補正を遂行するステップおよびプローブ効率補正を遂行するステップは、ラングミュアモデルを適合させるステップを含み、ラングミュアモデルは、プローブ効率(K)および飽和平衡定数(Isat)を含む。一部の実施形態では、KおよびIsatは、1種または複数のオリゴヌクレオチドプローブにおけるオリゴヌクレオチドプローブ毎に経験的に決定される。一部の実施形態では、飽和平衡補正を遂行するステップおよびプローブ補正を遂行するステップは、遺伝子座のリードカバレッジを、遺伝子座が同一コピー数状態で存在することを仮定してラングミュアモデルに適合させ、これにより、ベースラインリードカバレッジを提供するステップを含む。一部の実施形態では、同一コピー数状態は、二倍体である。一部の実施形態では、ベースラインリード(rad)カバレッジは、プローブ効率および飽和平衡に依存する関数である。
一部の実施形態では、コピー数状態を決定するステップは、遺伝子座のリードカバレッジをベースラインリードカバレッジと比較するステップを含む。一部の実施形態では、無細胞体液は、血清、血漿、尿および脳脊髄液からなる群より選択される。一部の実施形態では、リードカバレッジは、配列決定リードを参照ゲノムにマッピングすることにより決定される。一部の実施形態では、配列決定リードを得るステップは、被験体由来の無細胞体液由来のDNA分子にアダプターをライゲーションするステップを含む。一部の実施形態では、DNA分子は、二重鎖DNA分子であり、各アダプターが、DNA分子の相補鎖を異なる形でタグ付けして、タグ付けされた鎖を提供するように、アダプターは、二重鎖DNA分子にライゲーションされる。一部の実施形態では、遺伝子座に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度を決定するステップは、配列決定リードを、対になったリードおよび対にならないリードへと選別するステップを含み、(i)各対になったリードは、前記セットにおける二本鎖ポリヌクレオチド分子に由来する第1のタグ付けされた鎖および第2の異なる形でタグ付けされた相補鎖から生成された配列リードに対応し、(ii)各対にならないリードは、配列リードの前記セットにおける前記配列リード中に表される二本鎖ポリヌクレオチド分子に由来する第2の異なる形でタグ付けされた相補鎖を有しない第1のタグ付けされた鎖を表す。一部の実施形態では、本方法は、1種または複数の遺伝子座のそれぞれにマッピングする、(i)前記対になったリードおよび(ii)前記対にならないリードの定量的尺度を決定して、各座位にマッピングする対になったリードおよび対にならないリードに関連する前記定量的尺度に基づき、前記1種または複数の遺伝子座のそれぞれにマッピングする、前記試料における総二本鎖DNA分子に関連する定量的尺度を決定するステップをさらに含む。一部の実施形態では、アダプターは、バーコード配列を含む。
一部の実施形態では、リードカバレッジを決定するステップは、参照ゲノムへの配列決定リードのマッピングの位置およびバーコード配列に基づき配列決定リードを折り畳む(collapsing)ステップを含む。一部の実施形態では、遺伝子座は、1種または複数の癌遺伝子を含む。一部の実施形態では、方法は、被験体の生殖系列ゲノムがヘテロ接合性であるベースライン化遺伝子座内のバリアントの相対量を決定することにより、ベースライン化遺伝子座の少なくともサブセットが、被験体の腫瘍細胞においてコピー数変更を起こしたことを決定するステップを含む。一部の実施形態では、バリアントの相対量は、ほぼ等しいわけではない。一部の実施形態では、バリアントの相対量がほぼ等しいわけではないベースライン化遺伝子座は、ベースライン化遺伝子座から除去され、これにより、アレル頻度補正されたベースライン化遺伝子座を提供する。一部の実施形態では、アレル頻度補正されたベースライン化遺伝子座は、先行する請求項のいずれか一項に記載の方法におけるベースライン化座位として使用される。
別の態様では、本開示は、メモリに、被験体の無細胞体液試料のデオキシリボ核酸(DNA)分子の配列決定リードを受け取るステップと、コンピュータプロセッサを用いてコードを実行して、次のステップ:配列リードから、複数の遺伝子座における遺伝子座毎に配列決定リードカバレッジ(「リードカバレッジ」)に関連する定量的尺度を含む第1のデータセットを生成するステップと;飽和平衡補正およびプローブ効率補正を遂行することにより、第1のデータセットを補正するステップと;第1のデータセットについてベースラインリードカバレッジを決定するステップであって、ベースラインリードカバレッジが、飽和平衡およびプローブ効率に関連する、ステップと;ベースラインリードカバレッジと比べた複数の遺伝子座における遺伝子座毎のコピー数状態を決定するステップとを遂行するステップとを含む方法を提供する。
別の態様では、本開示は、ネットワークと、ネットワークに接続された核酸(例えば、DNA)配列データを記憶するように構成されたコンピュータメモリを含むデータベースと、コンピュータメモリおよび1個または複数のコンピュータプロセッサを含むバイオインフォマティクスコンピュータであって、ネットワークに接続されたコンピュータとを含むシステムであって、コンピュータが、1個または複数のコンピュータプロセッサによって実行されると、データベースに記憶された核酸(例えば、DNA)配列データをコピーし、コピーされたデータを、バイオインフォマティクスコンピュータにおけるメモリに書き出し、核酸(例えば、DNA)配列データから、複数の遺伝子座における遺伝子座毎に配列決定リードカバレッジ(「リードカバレッジ」)に関連する定量的尺度を含む第1のデータセットを生成するステップと;飽和平衡補正およびプローブ効率補正を遂行することにより、第1のデータセットを補正するステップと;第1のデータセットについてベースラインリードカバレッジを決定するステップであって、ベースラインリードカバレッジが、飽和平衡およびプローブ効率に関連する、ステップと;ベースラインリードカバレッジと比べた複数の遺伝子座における遺伝子座毎のコピー数状態を決定するステップとを含むステップを遂行する、機械実行可能なコードをさらに含む、システムを提供する。一部の実施形態では、データベースは、DNAシーケンサーに接続される。
参照による組込み
本明細書において言及されているあらゆる刊行物、特許および特許出願は、あたかも個々の刊行物、特許または特許出願が、参照により組み込まれていると特にかつ個々に示されているのと同じ程度まで、参照により本明細書に組み込まれている。
本明細書において言及されているあらゆる刊行物、特許および特許出願は、あたかも個々の刊行物、特許または特許出願が、参照により組み込まれていると特にかつ個々に示されているのと同じ程度まで、参照により本明細書に組み込まれている。
本発明の新規特色は、添付の特許請求の範囲において詳細に明記されている。本発明の特色および利点のより十分な理解は、本発明の原理が利用される説明的実施形態を明記する次の詳細な説明および添付の図面を参照することにより得られるであろう。
定義
用語「遺伝的バリアント」は、本明細書において、被験体の核酸試料またはゲノムにおける変更、バリアントまたは多型を一般に指す。かかる変更、バリアントまたは多型は、被験体または他の個体の参照ゲノムであり得る参照ゲノムに関するものであり得る。一塩基多型(SNP)は、多型の一形態である。一部の例では、1個または複数の多型は、1個または複数の一塩基変異(SNV)、挿入、欠失、反復、小規模な挿入、小規模な欠失、小規模な反復、構造的バリアント接合部、可変長タンデム反復および/または隣接配列を含む。コピー数バリアント(CNV)、トランスバージョンおよび他の再編成も、遺伝的変異の形態である。ゲノム変更(alternation)は、塩基変化、挿入、欠失、反復、コピー数変異またはトランスバージョンであり得る。
用語「遺伝的バリアント」は、本明細書において、被験体の核酸試料またはゲノムにおける変更、バリアントまたは多型を一般に指す。かかる変更、バリアントまたは多型は、被験体または他の個体の参照ゲノムであり得る参照ゲノムに関するものであり得る。一塩基多型(SNP)は、多型の一形態である。一部の例では、1個または複数の多型は、1個または複数の一塩基変異(SNV)、挿入、欠失、反復、小規模な挿入、小規模な欠失、小規模な反復、構造的バリアント接合部、可変長タンデム反復および/または隣接配列を含む。コピー数バリアント(CNV)、トランスバージョンおよび他の再編成も、遺伝的変異の形態である。ゲノム変更(alternation)は、塩基変化、挿入、欠失、反復、コピー数変異またはトランスバージョンであり得る。
用語「ポリヌクレオチド」は、本明細書において、1個または複数の核酸サブユニットを含む分子を一般に指す。ポリヌクレオチドは、アデノシン(A)、シトシン(C)、グアニン(G)、チミン(T)およびウラシル(U)またはこれらのバリアントから選択される1個または複数のサブユニットを含むことができる。ヌクレオチドは、A、C、G、TもしくはUまたはこれらのバリアントを含むことができる。ヌクレオチドは、伸びている核酸鎖に取り込まれ得るいずれかのサブユニットを含むことができる。かかるサブユニットは、A、C、G、TまたはU、あるいは1個もしくは複数の相補的A、C、G、TもしくはUに特異的な、またはプリン(すなわち、AもしくはGまたはこれらのバリアント)もしくはピリミジン(すなわち、C、TもしくはUまたはこれらのバリアント)に相補的な、他のいずれかのサブユニットであり得る。サブユニットは、個々の核酸塩基または塩基群(例えば、AA、TA、AT、GC、CG、CT、TC、GT、TG、AC、CAまたはそれらのウラシル対応物)を分解することを可能にすることができる。一部の例では、ポリヌクレオチドは、デオキシリボ核酸(DNA)もしくはリボ核酸(RNA)またはこれらの誘導体である。ポリヌクレオチドは、一本鎖または二本鎖であり得る。
用語「被験体」は、本明細書にいて、哺乳動物種(例えば、ヒト)もしくは鳥類(例えば、トリ)種等の動物、または植物等の他の生物を一般に指す。より具体的には、被験体は、脊椎動物、哺乳動物、マウス、霊長類、サルまたはヒトであり得る。動物として、家畜、競技用動物(sport animal)およびペットが挙げられるがこれらに限定されない。被験体は、健康個体、疾患もしくは疾患素因を有するもしくはこれを有すると疑われる個体、または治療を必要とするもしくは治療を必要とすると疑われる個体であり得る。被験体は、患者であり得る。
用語「ゲノム」は、生物の遺伝情報の全体を一般に指す。ゲノムは、DNAまたはRNAのいずれかにおいてコードされ得る。ゲノムは、タンパク質をコードするコード領域と共に非コード領域を含むことができる。ゲノムは、生物における全染色体の配列を一体に含むことができる。例えば、ヒトゲノムは、総計46本の染色体を有する。これら全ての配列が一体に、ヒトゲノムを構成する。
用語「アダプター(複数可)」、「アダプター(複数可)」および「タグ(複数可)」は、本明細書を通して同義に使用されている。アダプターまたはタグは、ライゲーション、ハイブリダイゼーションまたは他のアプローチを含むいずれかのアプローチによって「タグ付け」されるように、ポリヌクレオチド配列にカップリングすることができる。
用語「ライブラリーアダプター」または「ライブラリーアダプター」は、本明細書において、その正体(例えば、配列)を使用して、生体試料(本明細書において同様に「試料」)におけるポリヌクレオチドを区別することができる分子(例えば、ポリヌクレオチド)を一般に指す。
用語「配列決定アダプター」は、本明細書において、配列決定機器が、配列決定を可能にするよう標的ポリヌクレオチドと相互作用すること等によって、標的ポリヌクレオチドを配列決定することを可能にするように適応された分子(例えば、ポリヌクレオチド)を一般に指す。配列決定アダプターは、標的ポリヌクレオチドが、配列決定機器によって配列決定されることを可能にする。一例では、配列決定アダプターは、フローセル等、配列決定システムの固体支持体に取り付けられた捕捉ポリヌクレオチドにハイブリダイズまたは結合するヌクレオチド配列を含む。別の例では、配列決定アダプターは、ポリヌクレオチドにハイブリダイズまたは結合して、標的ポリヌクレオチドが、配列決定システムによって配列決定されることを可能にするヘアピンループを生成するヌクレオチド配列を含む。配列決定アダプターは、他の分子(例えば、ポリヌクレオチド)のフローセル配列に相補的で、配列決定システムによる標的ポリヌクレオチドの配列決定に使用可能なヌクレオチド配列であり得るシーケンサーモチーフを含むことができる。シーケンサーモチーフは、合成による配列決定等、配列決定における使用のためのプライマー配列を含むこともできる。シーケンサーモチーフは、配列決定システムへのライブラリーアダプターのカップリングおよび標的ポリヌクレオチドの配列決定に必要とされる配列(複数可)を含むことができる。
本明細書において、用語「少なくとも」、「多くても」または「約」は、他のことが特定されていなければ、あるシリーズに先行する場合、このシリーズの各メンバーを指す。
参照数値に関する用語「約」およびその文法上の等価物は、該値から最大プラスまたはマイナス10%の値の範囲を含むことができる。例えば、「約10」の量は、9~11の量を含むことができる。他の実施形態では、参照数値に関する用語「約」は、該値からプラスまたはマイナス10%、9%、8%、7%、6%、5%、4%、3%、2%または1%の値の範囲を含むことができる。
参照数値に関する用語「少なくとも」およびその文法上の等価物は、参照数値および該値を超えるものを含むことができる。例えば、「少なくとも10」の量は、10の値、ならびに11、100および1,000等、10を上回るいずれかの数値を含むことができる。
参照数値に関する用語「多くても」およびその文法上の等価物は、参照数値および該値に満たないものを含むことができる。例えば、「多くても10」の量は、10の値、ならびに9、8、5、1、0.5および0.1等、10を下回るいずれかの数値を含むことができる。
用語「定量的尺度」は、絶対および相対尺度を含む、量のいずれかの尺度を指す。定量的尺度は、例えば、数(例えば、計数)、パーセンテージ、程度または閾値であり得る。
用語「リードカバレッジ」は、生の配列リードから推論される特有の分子計数等、生の配列リードまたは加工済の配列リードによるカバレッジを指す。
用語「ベースラインリードカバレッジ」は、GC含量、プローブ効率、ライゲーション効率またはプルダウン効率等、所与のプローブパラメータに基づく二倍体ゲノム環境を含む試料におけるプローブの予想されるリードカバレッジを指す。
「プローブ」は、本明細書において、機能性を含むポリヌクレオチドを指す。機能性は、検出可能標識(蛍光)、結合部分(ビオチン)または固体支持体(磁気により誘引可能な粒子またはチップ)であり得る。
「相補性」は、伝統的ワトソン・クリックまたは他の非伝統的な型のいずれかにより別の核酸配列と水素結合(複数可)を形成する核酸の能力を指す。パーセント相補性は、第2の核酸配列と水素結合を形成(ワトソン・クリック塩基対形成)し得る核酸分子における残基のパーセンテージを示す(10のうち5、6、7、8、9、10は、それぞれ50%、60%、70%、80%、90%および100%相補的である)。「完全に相補的」は、核酸配列の近接残基が全て、第2の核酸配列における同数の近接残基と水素結合するであろうことを意味する。
「実質的に相補的」は、本明細書において、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50個もしくはそれよりも多いヌクレオチドの領域にわたり少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%もしくは100%である相補性の程度を指す、またはストリンジェントな条件下でハイブリダイズする2種の核酸を指す。パーセント相補性を評価する目的のため等、配列同一性は、Needleman-Wunschアルゴリズム(例えば、任意選択でデフォルト設定による、ワールド・ワイド・ウェブサイト:ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.htmlで入手できるEMBOSS Needleアライナ(aligner)を参照)、BLASTアルゴリズム(例えば、任意選択でデフォルト設定による、blast.ncbi.nlm.nih.gov/Blast.cgiで入手できるBLASTアラインメントツールを参照)またはSmith-Watermanアルゴリズム(例えば、任意選択でデフォルト設定による、ワールド・ワイド・ウェブサイト:ebi.ac.uk/Tools/psa/emboss_water/nucleotide.htmlで入手できるEMBOSS Waterアライナを参照)が挙げられるがこれらに限定されない、いずれか適したアラインメントアルゴリズムによって測定することができる。最適なアラインメントは、デフォルトパラメータを含む、選択されたアルゴリズムのいずれか適したパラメータを使用して評価することができる。
「ハイブリダイゼーション」は、1個または複数のポリヌクレオチドが反応して、ヌクレオチド残基の塩基間の水素結合により安定化される複合体を形成する反応を指す。水素結合は、ワトソン・クリック塩基対形成、フーグスティーン(Hoogstein)結合によって、または塩基相補性に従った他のいずれかの配列特異的様式で生じ得る。複合体は、二重鎖構造を形成する2本の鎖、多重鎖複合体を形成する3本またはそれよりも多い鎖、単一の自己ハイブリダイズする鎖、またはこれらのいずれかの組合せを含むことができる。ハイブリダイゼーション反応は、PCRの開始またはエンドヌクレアーゼによるポリヌクレオチドの酵素切断等、より大規模なプロセスにおけるステップを構成することができる。第1の配列に相補的な第2の配列は、第1の配列の「相補体」と称される。ポリヌクレオチドに適用される用語「ハイブリダイズ可能」は、ハイブリダイゼーション反応におけるヌクレオチド残基の塩基間の水素結合により安定化される複合体を形成するポリヌクレオチドの能力を指す。
用語「ストリンジェントなハイブリダイゼーション条件」は、ポリヌクレオチドが、その標的部分配列(subsequence)に優先的にハイブリダイズし、他の配列により少ない程度でハイブリダイズするまたは全くハイブリダイズしないであろう条件を指す。核酸ハイブリダイゼーション実験の文脈における「ストリンジェントなハイブリダイゼーション」は、配列依存性であり、異なる環境パラメータ下で異なる。核酸のハイブリダイゼーションに対する広範なガイドは、Tijssen(1993年)Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes、第I部、第2章「Overview of principles of hybridization and the strategy of nucleic acid probe assays」、Elsevier、New Yorkに見出される。
一般に、高度にストリンジェントなハイブリダイゼーションおよび洗浄条件は、規定のイオン強度およびpHにおける特異的配列のための熱の融点(Tm)よりも約5℃低くなるように選択される。Tmは、標的配列の50%が、完全にマッチしたプローブにハイブリダイズする温度(規定のイオン強度およびpH下における)である。非常にストリンジェントな条件は、特定のプローブのためのTmに等しくなるように選択される。
ストリンジェントなハイブリダイゼーション条件は、水、バッファー(pH6~9またはpH7~8におけるリン酸、tris、SSPEまたはSSCバッファー)、塩(ナトリウムまたはカリウム)および変性剤(SDS、ホルムアミドまたはtween)を含むバッファー、ならびに37℃~70℃、60℃~65℃の温度を含む。
サザンまたはノーザンブロットのフィルターにおける100個を超える相補的残基を有する相補的核酸のハイブリダイゼーションのためのストリンジェントなハイブリダイゼーション条件の例は、42℃における50%ホルマリンと1mgのヘパリンであり、ハイブリダイゼーションは一晩行われる。高度にストリンジェントな洗浄条件の例は、72℃における約15分間の0.15M NaClである。ストリンジェントな洗浄条件の例は、65℃における15分間の0.2×SSC洗浄である(SSCバッファーの記載についてはSambrookらを参照)。多くの場合、高ストリンジェンシー洗浄に先行して低ストリンジェンシー洗浄が行われて、バックグラウンドプローブシグナルを除去する。100個を超えるヌクレオチドの二重鎖のための中間ストリンジェンシー洗浄の例は、45℃における15分間の1×SSCである。例えば、100個を超えるヌクレオチドの二重鎖のための低ストリンジェンシー洗浄の例は、40℃における15分間の4~6×SSCである。一般に、特定のハイブリダイゼーションアッセイにおける無関係のプローブに観察されるものの2×(またはそれよりも高い)のシグナル・ノイズ比は、特異的ハイブリダイゼーションの検出を示す。
一態様では、本開示は、(a)被験体の無細胞体液試料のデオキシリボ核酸(DNA)分子に由来する配列決定リードを得るステップと、(b)複数の遺伝子座における遺伝子座毎に、(i)遺伝子座のグアニン-シトシン含量に関連する定量的尺度および(ii)配列決定リード由来の遺伝子座の配列決定リードカバレッジに関連する定量的尺度を含む第1のデータセットを生成するステップと、(c)(i)第1のデータセットから、配列決定リードカバレッジに関連する定量的尺度に関する高変動遺伝子座である遺伝子座を除去し、これにより、残っている遺伝子座の第1のセットを提供し、(ii)残っている遺伝子座の第1のセット由来の遺伝子座毎に、遺伝子座に由来する試料由来のDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度を決定し、(iii)残っている遺伝子座の第1のセットの配列決定リードカバレッジに関連する定量的尺度を、残っている遺伝子座の第1のセットのGC含量に関連する定量的尺度および残っている遺伝子座の第1のセットにおける各座位に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度の両方に関連付けることにより、配列決定リードカバレッジに関連する定量的尺度のための第1の変換を決定し、(iv)残っている遺伝子座の第1のセット由来の各遺伝子座の配列リードカバレッジに第1の変換を適用して、残っている遺伝子座の第1のセットの配列決定リードカバレッジの変換された定量的尺度の第1のセットを含む、第2のデータセットを提供することによって、第1のデータセットを第2のデータセットへと変換するステップとを含む方法を提供する。
一部の実施形態では、本方法は、(d)第2のデータセットから、配列決定リードカバレッジの変換された定量的尺度の第1のセットに関して高変動遺伝子座である遺伝子座を除去し、これにより、残っている遺伝子座の第2のセットを提供し、(e)残っている遺伝子座の第2のセットの効率に関連する配列決定リードカバレッジの変換された定量的尺度の第1のセットのための第2の変換を決定し、(f)第2の変換を用いて、残っている遺伝子座の第2のセットの配列決定リードカバレッジの変換された定量的尺度の第1のセットを変換し、これにより、(d、i)の残っている遺伝子座の第2のセットの配列決定リードカバレッジに関連する変換された定量的尺度の第2のセットを含む、第3のデータセットを提供することにより、第2のデータセットを第3のデータセットへと変換するステップをさらに含む。
被験体由来の無細胞体液のDNA分子から配列決定リードを得るステップ
被験体の無細胞体液のDNA分子から配列決定リードを得るステップは、無細胞体液を得るステップを含むことができる。例示的な無細胞体液は、血清、血漿、血液、唾液、尿、滑液、全血、リンパ液、腹水、間質液もしくは細胞外液、歯肉溝滲出液(gingival crevicular fluid)、骨髄、脳脊髄液、唾液、粘液、痰、精液、汗、尿を含む細胞間の空間における流体、または他のいずれかの体液であるまたはこれに由来し得る。無細胞体液は、血漿、尿または脳脊髄液からなる群より選択され得る。無細胞体液は、血漿であり得る。無細胞体液は、尿であり得る。無細胞体液は、脳脊髄液であり得る。
被験体の無細胞体液のDNA分子から配列決定リードを得るステップは、無細胞体液を得るステップを含むことができる。例示的な無細胞体液は、血清、血漿、血液、唾液、尿、滑液、全血、リンパ液、腹水、間質液もしくは細胞外液、歯肉溝滲出液(gingival crevicular fluid)、骨髄、脳脊髄液、唾液、粘液、痰、精液、汗、尿を含む細胞間の空間における流体、または他のいずれかの体液であるまたはこれに由来し得る。無細胞体液は、血漿、尿または脳脊髄液からなる群より選択され得る。無細胞体液は、血漿であり得る。無細胞体液は、尿であり得る。無細胞体液は、脳脊髄液であり得る。
DNA分子を含む核酸分子は、無細胞体液から抽出することができる。DNA分子は、ゲノムDNAであり得る。DNA分子は、被験体の健康組織の細胞に由来し得る。DNA分子は、体細胞突然変異を起こした非がん性細胞に由来し得る。DNA分子は、母体試料における胎児に由来し得る。当業者は、DNA分子が母体試料における胎児に由来する実施形態では、被験体は、試料が母体であっても胎児を指すことができることを理解するであろう。DNA分子は、被験体の前がん性細胞に由来し得る。DNA分子は、被験体のがん性細胞に由来し得る。DNA分子は、被験体の原発性腫瘍内の細胞に由来し得る。DNA分子は、被験体の続発性腫瘍に由来し得る。DNA分子は、循環DNAであり得る。循環DNAは、循環腫瘍DNA(ctDNA)を含むことができる。DNA分子は、二本鎖または一本鎖であり得る。あるいは、DNA分子は、二本鎖部分および一本鎖部分の組合せを含むことができる。DNA分子は、無細胞である必要はない。一部の事例では、DNA分子は、試料から単離することができる。例えば、DNA分子は、体液、例えば、血清または血漿から単離された無細胞DNAであり得る。
試料は、様々な量のゲノム当量の核酸分子を含むことができる。例えば、約30ng DNAの試料は、約10,000一倍体ヒトゲノム当量を含有することができ、cfDNAの場合、約2千億個の個々のポリヌクレオチド分子を含有することができる。同様に、約100ngのDNAの試料は、約30,000一倍体ヒトゲノム当量を含有することができ、cfDNAの場合、約6千億個の個々の分子を含有することができる。
無細胞DNA分子は、本技術分野で公知の種々の技法を使用して、体液から単離および抽出することができる。一部の事例では、無細胞核酸は、Qiagen Qiamp(登録商標)循環核酸キットプロトコール等、市販のキットを使用して、単離、抽出および調製することができる。他の例では、Qiagen Qubit(商標)dsDNA HSアッセイキットプロトコール、Agilent(商標)DNA 1000キットまたはTruSeq(商標)配列決定ライブラリー調製物;ロースループット(LT)プロトコールを使用して、核酸を定量化することができる。無細胞核酸は、起源が胎児であり得る(妊娠中の被験体から採取された流体を介して)、または被験体自身の組織に由来することができる。無細胞核酸は、新生物(例えば、腫瘍または腺腫)に由来することができる。
一般に、無細胞核酸は、溶液中に存在する無細胞核酸が、細胞および体液の他の不溶性構成成分から分離される、分配ステップにより体液から抽出および単離される。分配として、遠心分離または濾過等の技法を挙げることができるがこれらに限定されない。他の事例では、細胞は、先ず無細胞核酸から分配されるのではなく、溶解される。一例では、インタクト細胞のゲノムDNAは、選択的沈殿により分配される。DNAを含む無細胞核酸は、可溶性のまま残ることができ、不溶性ゲノムDNAから分離し、抽出することができる。一般に、異なるキットに特異的なバッファーの添加および他の洗浄ステップ後に、イソプロパノール沈殿を使用して核酸を沈殿することができる。シリカベースのカラム等、さらに別の浄化ステップを使用して、夾雑物または塩を除去することができる。一般ステップは、特異的な適用のために最適化することができる。例えば、収量等、手順のある特定の態様を最適化するための反応を通して、非特異的バルク担体核酸を添加することができる。
無細胞DNA分子は、多くても500ヌクレオチドの長さ、多くても400ヌクレオチドの長さ、多くても300ヌクレオチドの長さ、多くても250ヌクレオチドの長さ、多くても225ヌクレオチドの長さ、多くても200ヌクレオチドの長さ、多くても190ヌクレオチドの長さ、多くても180ヌクレオチドの長さ、多くても170ヌクレオチドの長さ、多くても160ヌクレオチドの長さ、多くても150ヌクレオチドの長さ、多くても140ヌクレオチドの長さ、多くても130ヌクレオチドの長さ、多くても120ヌクレオチドの長さ、多くても110ヌクレオチドの長さまたは多くても100ヌクレオチドの長さであり得る。
無細胞DNA分子は、少なくとも500ヌクレオチドの長さ、少なくとも400ヌクレオチドの長さ、少なくとも300ヌクレオチドの長さ、少なくとも250ヌクレオチドの長さ、少なくとも225ヌクレオチドの長さ、少なくとも200ヌクレオチドの長さ、少なくとも190ヌクレオチドの長さ、少なくとも180ヌクレオチドの長さ、少なくとも170ヌクレオチドの長さ、少なくとも160ヌクレオチドの長さ、少なくとも150ヌクレオチドの長さ、少なくとも140ヌクレオチドの長さ、少なくとも130ヌクレオチドの長さ、少なくとも120ヌクレオチドの長さ、少なくとも110ヌクレオチドの長さまたは少なくとも100ヌクレオチドの長さであり得る。特に、無細胞核酸は、140~180の間のヌクレオチドの長さであり得る。
無細胞DNAは、様々な量の健康組織および腫瘍由来のDNA分子を含むことができる。腫瘍由来無細胞DNAは、試料における無細胞DNAの総量の少なくとも0.1%、試料における無細胞DNAの総量の少なくとも0.2%、試料における無細胞DNAの総量の少なくとも0.5%、試料における無細胞DNAの総量の少なくとも0.7%、試料における無細胞DNAの総量の少なくとも1%、試料における無細胞DNAの総量の少なくとも2%、試料における無細胞DNAの総量の少なくとも3%、試料における無細胞DNAの総量の少なくとも4%、試料における無細胞DNAの総量の少なくとも5%、試料における無細胞DNAの総量の少なくとも10%、試料における無細胞DNAの総量の少なくとも15%、試料における無細胞DNAの総量の少なくとも20%、試料における無細胞DNAの総量の少なくとも25%もしくは試料における無細胞DNAの総量の少なくとも30%、またはそれよりも多くなり得る。
一部の事例では、DNA分子は、抽出プロセスの際に剪断されてよく、100~400の間のヌクレオチドの長さの断片を含む。一部の事例では、核酸は、抽出後に剪断されてよく、100~400の間のヌクレオチドの長さのヌクレオチドを含むことができる。一部の事例では、DNA分子は既に100~400の間のヌクレオチドの長さであり、追加的な剪断は意図的に実施されない。
被験体は、動物であり得る。被験体は、イヌ、ウマ、ネコ、マウス、ラットまたはヒト等、哺乳動物であり得る。被験体は、ヒトであり得る。被験体は、がんを有すると疑われ得る。被験体は、がん診断を以前に受けていてよい。被験体のがん状態は、不明であり得る。被験体は、雄または雌であり得る。被験体は、少なくとも20歳、少なくとも30歳、少なくとも40歳、少なくとも50歳、少なくとも60歳または少なくとも70歳であり得る。
配列決定は、本技術分野で公知のいずれかの方法によって為すことができる。例えば、配列決定技法は、古典的技法(例えば、標識されたターミネーターまたはプライマーおよびスラブまたはキャピラリーにおけるゲル分離を使用した、ジデオキシ配列決定反応(サンガーの方法))および次世代技法を含む。例示的な技法は、可逆的に終結された標識されたヌクレオチドを使用した合成による配列決定、パイロシークエンシング、454配列決定、Illumina/Solexa配列決定、標識されたオリゴヌクレオチドプローブのライブラリーへのアレル特異的ハイブリダイゼーション、標識されたクローンのライブラリーへのアレル特異的ハイブリダイゼーションに続くライゲーションを使用した合成による配列決定、重合ステップにおける標識されたヌクレオチドの取り込みのリアルタイムモニタリング、ポロニー配列決定、SOLiD配列決定 標的化配列決定、単一分子リアルタイム配列決定、エクソン配列決定、電子顕微鏡に基づく配列決定、パネル配列決定、トランジスタ媒介性配列決定、直接的配列決定、ランダムショットガン配列決定、全ゲノム配列決定、ハイブリダイゼーションによる配列決定、キャピラリー電気泳動、ゲル電気泳動、二重鎖配列決定、サイクル配列決定、単一塩基伸長配列決定、固相配列決定、ハイスループット配列決定、超並列シグネチャー配列決定、エマルションPCR、低変性温度-PCR(COLD-PCR)における同時増幅、マルチプレックスPCR、可逆的ダイターミネーターによる配列決定、ペアードエンド配列決定、ニアターム(near-term)配列決定、エキソヌクレアーゼ配列決定、ライゲーションによる配列決定、ショートリード(short-read)配列決定、単一分子配列決定、リアルタイム配列決定、リバースターミネーター配列決定、ナノポア配列決定、MS-PET配列決定およびこれらの組合せを含む。一部の実施形態では、配列決定方法は、超並列配列決定である、すなわち、少なくとも100、1000、10,000、100,000、百万、1千万、1億または十億個のポリヌクレオチド分子のいずれかを同時に(または素早く連続して)配列決定する。一部の実施形態では、配列決定は、例えば、IlluminaまたはApplied Biosystemsから市販されている遺伝子分析器等、遺伝子分析器によって遂行することができる。分離された分子の配列決定は、ポリメラーゼまたはリガーゼを使用した逐次または単一の伸長反応や、プローブのライブラリーとの単一または逐次の差次的ハイブリダイゼーションによって、つい最近になって実証された。配列決定は、DNAシーケンサー(例えば、配列決定反応を遂行するように設計された機械)によって遂行することができる。一部の実施形態では、DNAシーケンサーは、例えば、DNA配列データを含有するデータベースを含むことができる、またはこれに接続されてよい。
使用することができる配列決定技法は、例えば、合成による配列決定システムの使用を含む。第1のステップにおいて、DNAは、ほぼ300~800塩基対の断片へと剪断され、断片は、平滑末端にされる。次に、オリゴヌクレオチドアダプターが、断片の末端にライゲーションされる。アダプターは、断片の増幅および配列決定のためのプライマーとして機能する。断片は、例えば、5’-ビオチンタグを含有するアダプターBを使用して、DNA捕捉ビーズ、例えば、ストレプトアビジンコーティングされたビーズに取り付けることができる。ビーズに取り付けられた断片は、油-水エマルションの液滴内でPCR増幅される。その結果は、各ビーズにおける、複数コピーのクローン的に増幅されたDNA断片である。第2のステップにおいて、ビーズは、ウェル(ピコリットルサイズの)内に捕捉される。パイロシークエンシングは、各DNA断片において並行して遂行される。1個または複数のヌクレオチドの付加は、光シグナルを生成し、これは、配列決定機器におけるCCDカメラによって記録される。シグナル強度は、取り込まれたヌクレオチドの数に比例する。パイロシークエンシングは、ヌクレオチド付加により放出されるピロホスフェート(PPi)を活用する。PPiは、アデノシン5’ホスホスルフェートの存在下において、ATPスルフリラーゼによってATPに変換される。ルシフェラーゼは、ルシフェリンからオキシルシフェリンへの変換にATPを使用し、この反応は光を生成し、この光が検出および分析される。
使用することができるDNA配列決定技法の別の例は、Life Technologies Corporation(Carlsbad、Calif.)のApplied
BiosystemsによるSOLiD技術である。SOLiD配列決定において、ゲノムDNAは、断片へと剪断され、アダプターが、断片の5’および3’端に取り付けられて、断片ライブラリーを生成する。あるいは、断片の5’および3’端にアダプターをライゲーションし、断片を環状化し、環状化された断片を消化して、内部アダプターを生成し、得られた断片の5’および3’端にアダプターを取り付けることにより、内部アダプターを導入することができ、メイトペアのライブラリーを生成する。次に、ビーズ、プライマー、鋳型およびPCR構成成分を含有するマイクロリアクタにおいてクローンのビーズ集団が調製される。PCR後に、鋳型が変性され、ビーズが濃縮されて、伸長した鋳型を有するビーズを分離する。選択されたビーズにおける鋳型は、スライドグラスへの結合を可能にする3’修飾に付される。特異的フルオロフォアによって同定される中心決定塩基(または塩基のペア)を有する部分的にランダムなオリゴヌクレオチドの逐次ハイブリダイゼーションおよびライゲーションによって、配列を決定することができる。色が記録された後に、ライゲーションされたオリゴヌクレオチドが除去され、次いでこのプロセスが反復される。
BiosystemsによるSOLiD技術である。SOLiD配列決定において、ゲノムDNAは、断片へと剪断され、アダプターが、断片の5’および3’端に取り付けられて、断片ライブラリーを生成する。あるいは、断片の5’および3’端にアダプターをライゲーションし、断片を環状化し、環状化された断片を消化して、内部アダプターを生成し、得られた断片の5’および3’端にアダプターを取り付けることにより、内部アダプターを導入することができ、メイトペアのライブラリーを生成する。次に、ビーズ、プライマー、鋳型およびPCR構成成分を含有するマイクロリアクタにおいてクローンのビーズ集団が調製される。PCR後に、鋳型が変性され、ビーズが濃縮されて、伸長した鋳型を有するビーズを分離する。選択されたビーズにおける鋳型は、スライドグラスへの結合を可能にする3’修飾に付される。特異的フルオロフォアによって同定される中心決定塩基(または塩基のペア)を有する部分的にランダムなオリゴヌクレオチドの逐次ハイブリダイゼーションおよびライゲーションによって、配列を決定することができる。色が記録された後に、ライゲーションされたオリゴヌクレオチドが除去され、次いでこのプロセスが反復される。
使用することができるDNA配列決定技法の別の例は、例えば、Life Technologies(South San Francisco、Calif.)のIon TorrentによってION TORRENTの商標で売られているシステムを使用したイオン半導体配列決定である。イオン半導体配列決定は、例えば、これらそれぞれの内容がその全体が参照により本明細書に組み込まれる、Rothbergら、An integrated semiconductor device enabling non-optical genome sequencing、Nature 475巻:348~352頁(2011年);米国特許出願公開第2010/0304982号;米国特許出願公開第2010/0301398号;米国特許出願公開第2010/0300895号;米国特許出願公開第2010/0300559号;および米国特許出願公開第2009/0026082号に記載されている。
使用することができる配列決定技術の別の例は、Illumina配列決定である。Illumina配列決定は、フォールドバック(fold-back)PCRおよび係留プライマーを使用した、固体表面におけるDNAの増幅に基づく。ゲノムDNAが断片化され、断片の5’および3’端にアダプタが付加される。フローセルチャネルの表面に取り付けられたDNA断片は、伸長および架橋増幅される。断片は二本鎖になり、二本鎖分子は変性される。複数サイクルの固相増幅と続く変性は、フローセルの各チャネルにおける同じ鋳型の、数百万クラスターのほぼ1,000コピーの一本鎖DNA分子を作製することができる。プライマー、DNAポリメラーゼおよび4種のフルオロフォア標識された可逆的に終結するヌクレオチドが使用されて、逐次配列決定を遂行する。ヌクレオチド取り込み後に、レーザーが使用されてフルオロフォアを励起し、画像が捕捉され、第1の塩基の正体が記録される。3’ターミネーターおよび各取り込まれた塩基のフルオロフォアが除去され、取り込み、検出および同定ステップが反復される。本技術に従った配列決定は、これらそれぞれがその全体が参照により本明細書に組み込まれる、米国特許第7,960,120号;米国特許第7,835,871号;米国特許第7,232,656号;米国特許第7,598,035号;米国特許第6,911,345号;米国特許第6,833,246号;米国特許第6,828,100号;米国特許第6,306,597号;米国特許第6,210,891号;米国特許出願公開第2011/0009278号;米国特許出願公開第2007/0114362号;米国特許出願公開第2006/0292611号;および米国特許出願公開第2006/0024681号に記載されている。
使用することができる配列決定技術の別の例は、Pacific Biosciences(Menlo Park、Calif.)の単一分子、リアルタイム(SMRT)技術を含む。SMRTにおいて、4種のDNA塩基のそれぞれは、4種の異なる蛍光色素のうちの1種に取り付けられる。これらの色素は、リン酸連結されている。単一のDNAポリメラーゼが、ゼロ・モード導波管(ZMW)の底における鋳型一本鎖DNAの単一分子により固定化される。伸びている鎖にヌクレオチドを取り込むには数ミリ秒を要する。この時間において、蛍光標識が励起され、蛍光シグナルを産生し、蛍光タグが切断除去される。色素の対応する蛍光の検出は、どの塩基が取り込まれたかを示す。このプロセスが反復される。
使用することができる配列決定技法の別の例は、ナノポア配列決定である(SoniおよびMeller、2007年、Progress toward ultrafast
DNA sequence using solid-state nanopores、Clin Chem 53巻(11号):1996~2001年)。ナノポアは、直径が1ナノメートルのオーダーの小孔である。伝導流体へのナノポアの浸漬およびこれを横切る電位の印加は、ナノポアを通したイオンの伝導による僅かな電流をもたらす。流れる電流の量は、ナノポアのサイズに対して感受性である。DNA分子が、ナノポアを通過する際に、DNA分子における各ヌクレオチドが、異なる程度までナノポアを閉塞する。よって、DNA分子がナノポアを通過する際の、ナノポアを通過する電流の変化は、DNA配列の読み取りを表す。
DNA sequence using solid-state nanopores、Clin Chem 53巻(11号):1996~2001年)。ナノポアは、直径が1ナノメートルのオーダーの小孔である。伝導流体へのナノポアの浸漬およびこれを横切る電位の印加は、ナノポアを通したイオンの伝導による僅かな電流をもたらす。流れる電流の量は、ナノポアのサイズに対して感受性である。DNA分子が、ナノポアを通過する際に、DNA分子における各ヌクレオチドが、異なる程度までナノポアを閉塞する。よって、DNA分子がナノポアを通過する際の、ナノポアを通過する電流の変化は、DNA配列の読み取りを表す。
使用することができる配列決定技法の別の例は、DNAを配列決定するための化学的感受性電界効果トランジスタ(chemFET)アレイの使用が関与する(例えば、米国特許出願公開第2009/0026082号に記載の通り)。本技法の一例では、DNA分子は、反応チャンバ内に置くことができ、鋳型分子は、ポリメラーゼに結合した配列決定プライマーにハイブリダイズさせることができる。配列決定プライマーの3’端における新たな核酸鎖への1個または複数のトリホスフェートの取り込みは、chemFETによる電流の変化によって検出することができる。アレイは、複数のchemFETセンサを有することができる。別の例では、単一の核酸は、ビーズに取り付けることができ、核酸は、ビーズにおいて増幅することができ、個々のビーズは、chemFETアレイにおける個々の反応チャンバに移すことができ、各チャンバは、chemFETセンサを有し、核酸を配列決定することができる。
使用することができる配列決定技法の別の例は、例えば、Moudrianakis,
E. N.およびBeer M.、Base sequence determination in nucleic acids with the electron microscope, III内、Chemistry and microscopy of guanine-labeled DNA、PNAS 53巻:564~71頁(1965年)によって記載されている通り、電子顕微鏡の使用が関与する。本技法の一例では、個々のDNA分子は、電子顕微鏡を使用して区別可能な金属性標識を使用して標識される。次いで、これらの分子は、平坦な表面上に伸展され、電子顕微鏡を使用して撮像されて、配列を測定する。
E. N.およびBeer M.、Base sequence determination in nucleic acids with the electron microscope, III内、Chemistry and microscopy of guanine-labeled DNA、PNAS 53巻:564~71頁(1965年)によって記載されている通り、電子顕微鏡の使用が関与する。本技法の一例では、個々のDNA分子は、電子顕微鏡を使用して区別可能な金属性標識を使用して標識される。次いで、これらの分子は、平坦な表面上に伸展され、電子顕微鏡を使用して撮像されて、配列を測定する。
配列決定に先立ち、アダプター配列は、核酸分子に取り付けることができ、核酸は、特定の目的の配列を濃縮させることができる。配列濃縮は、アダプター配列の取り付けの前または後に行うことができる。
核酸分子または濃縮された核酸分子は、本明細書に開示されているいずれかの配列決定プラットフォームにおける使用に適したいずれかの配列決定アダプターに取り付けることができる。例えば、配列アダプターは、フローセル配列、試料バーコードまたはその両方を含むことができる。別の例では、配列アダプターは、ヘアピン形のアダプター、Y字形のアダプター、フォーク形のアダプターであり得る、および/または試料バーコードを含み得る。一部の事例では、アダプターは、配列決定プライマー領域を含まない。一部の事例では、アダプターが取り付けられたDNA分子は増幅され、増幅産物は、本明細書に記載されている特異的配列について濃縮される。一部の事例では、DNA分子は、配列決定ライブラリーの調製後に特異的配列について濃縮される。アダプターは、バーコード配列を含むことができる。異なるバーコードは、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25個またはそれよりも多い(本明細書を通して記載されているまたはいずれかの長さ)核酸塩基、例えば、7塩基であり得る。バーコードは、ランダム配列、縮重配列、半縮重(semi-degenerate)配列または規定の配列であり得る。一部の事例では、実質的に各核酸分子(例えば、その少なくとも70%、少なくとも80%、少なくとも90%または少なくとも99%)が異なるバーコード配列によりタグ付けされる、バーコードの十分な多様性が存在する。一部の事例では、特定の遺伝子座由来の実質的に各核酸分子(例えば、その少なくとも70%、少なくとも80%、少なくとも90%または少なくとも99%)が異なるバーコード配列によりタグ付けされる、バーコードの十分な多様性が存在する。
配列決定アダプターは、1種または複数の配列決定プライマーにハイブリダイズすることができる配列を含むことができる。配列決定アダプターは、固体支持体にハイブリダイズする配列、例えば、フローセル配列をさらに含むことができる。例えば、配列決定アダプターは、フローセルアダプターであり得る。配列決定アダプターは、ポリヌクレオチド断片の一端または両端に取り付けることができる。別の例では、配列決定アダプターは、ヘアピン形であり得る。例えば、ヘアピン形のアダプターは、相補的二本鎖部分およびループ部分を含むことができ、二本鎖部分は、二本鎖ポリヌクレオチドに取り付ける(例えば、ライゲーションする)ことができる。ヘアピン形の配列決定アダプターは、ポリヌクレオチド断片の両端に取り付けて、複数回配列決定され得る環状分子を生成することができる。
一部の事例では、ライブラリーアダプターのうち、試料同定モチーフ(または試料分子バーコード)を含有するものはない。かかる試料同定モチーフは、配列決定アダプターを介して提供することができる。試料同定モチーフは、他の試料由来のポリヌクレオチド分子から、所与の試料由来のポリヌクレオチド分子の同定を可能にする、少なくとも4、5、6、7、8、9、10、20、30または40ヌクレオチド塩基のシーケンサーを含むことができる。例えば、これは、2つの被験体由来のポリヌクレオチド分子が、同じプールにおいて配列決定され、被験体の配列リードがその後に同定されることを可能にすることができる。
シーケンサーモチーフは、配列決定システムへのライブラリーアダプターのカップリングおよびライブラリーアダプターにカップリングされた標的ポリヌクレオチドの配列決定に必要とされるヌクレオチド配列(複数可)を含む。シーケンサーモチーフは、フローセル配列に相補的な配列と、配列決定における使用のためのプライマー(またはプライミング配列)に選択的にハイブリダイズされ得る配列(配列決定開始配列)とを含むことができる。例えば、かかる配列決定開始配列は、合成による配列決定(例えば、Illumina)における使用に用いられるプライマーに相補的であり得る。かかるプライマーは、配列決定アダプターに含まれてよい。配列決定開始配列は、プライマーハイブリダイゼーション部位であり得る。
一部の事例では、ライブラリーアダプターのうち、完全シーケンサーモチーフを含有するものはない。ライブラリーアダプターは、部分的シーケンサーモチーフを含有することができるまたはシーケンサーモチーフを含有しない。一部の事例では、ライブラリーアダプターは、配列決定開始配列を含む。ライブラリーアダプターは、配列決定開始配列を含むことができるが、フローセル配列は含まない。配列開始配列は、配列決定のためのプライマーに相補的であり得る。プライマーは、配列特異的プライマーまたはユニバーサルプライマーであり得る。かかる配列決定開始配列は、ライブラリーアダプターの一本鎖部分に位置することができる。代案として、かかる配列決定開始配列は、ポリメラーゼが、配列決定の際にライブラリーアダプターにカップリングすることを可能にする、プライミング部位(例えば、キンク(kink)またはニック)であり得る。
アダプターは、ライゲーションによってDNA分子に取り付けることができる。一部の事例では、アダプターは、各アダプターが、DNA分子の相補鎖を異なる形でタグ付けするように、二重鎖DNA分子にライゲーションすることができる。一部の事例では、アダプター配列は、PCRによって取り付けることができ、一本鎖DNAの第1の部分は、標的配列に相補的であり、第2の部分は、アダプター配列を含む。
特定の目的の配列の濃縮は、配列捕捉方法によって遂行することができる。配列捕捉は、目的の標的にハイブリダイズする、固定化されたプローブを使用して遂行することができる。配列捕捉は、特異的配列にハイブリダイズされたプローブが、プルダウンによって試料から濃縮されることを可能にする、官能基、例えば、ビオチンに取り付けられたプローブを使用して遂行することができる。一部の事例では、官能化されたプローブへのハイブリダイゼーションに先立ち、非特異的またはオフターゲット結合を低下させるために、相補的な、官能化されていないポリヌクレオチド配列を断片にアニールすることにより、ライブラリー断片由来のアダプター配列等、特異的配列をマスクすることができる。配列プローブは、特異的遺伝子を標的とすることができる。配列捕捉プローブは、特異的遺伝子座または遺伝子を標的とすることができる。かかる遺伝子は、癌遺伝子であり得る。捕捉プローブによって標的化される例示的な遺伝子は、図1に示す遺伝子を含む。点突然変異(SNV)を有する例示的な遺伝子として、AKT1、ATM、CCNE1、CTNNB1、FGFR1、GNAS、JAK3、MLH1、NPM1、PTPN11、RIT1、TERT、ALK、BRAF、CDH1、EGFR、FGFR2、HNF1A、KIT
MPL、NRAS、RAF1、ROS1、TP53、APC、BRCA1、CDK4、ERBB2、FGFR3、HRAS、KRAS、MYC、NTRK1、RB1、SMAD4、TSC1、AR、BRCA2、CDK6、ESR1、GATA3、IDH2、MAP2K2、NFE2L2、PIK3CA、RHEB、SRC、ARID1A、CCND2、CDKN2B、FBXW7、GNAQ、JAK2、MET、NOTCH1、PTEN、RHOAおよびSTK11が挙げられるがこれらに限定されない。コピー数変異を有する例示的な遺伝子として、AR、CCNE1、CDK6、ERBB2、FGFR2、KRAS、MYC、PIK3CA、BRAF、CDK4、EGFR、FGFR1、KIT、MET、PDGFRAおよびRAF1が挙げられるがこれらに限定されない。遺伝子融合を有する例示的な遺伝子として、ALK、FGFR2、FGFR3、NTRK1、RETおよびROS1が挙げられるがこれらに限定されない。インデルを有する例示的な遺伝子として、EGFR(例えば、エクソン19および20における)、ERBB2(例えば、エクソン19および20における)およびMET(例えば、エクソン14のスキッピング)が挙げられるがこれらに限定されない。例示的な標的は、CCND1およびCCND2を含むことができる。配列捕捉プローブは、遺伝子にわたり敷き詰める(tile)ことができる(例えば、プローブは、重複領域を標的とすることができる)。配列プローブは、非重複領域を標的とすることができる。配列プローブは、長さ、融解温度および二次構造に関して最適化され得る。
MPL、NRAS、RAF1、ROS1、TP53、APC、BRCA1、CDK4、ERBB2、FGFR3、HRAS、KRAS、MYC、NTRK1、RB1、SMAD4、TSC1、AR、BRCA2、CDK6、ESR1、GATA3、IDH2、MAP2K2、NFE2L2、PIK3CA、RHEB、SRC、ARID1A、CCND2、CDKN2B、FBXW7、GNAQ、JAK2、MET、NOTCH1、PTEN、RHOAおよびSTK11が挙げられるがこれらに限定されない。コピー数変異を有する例示的な遺伝子として、AR、CCNE1、CDK6、ERBB2、FGFR2、KRAS、MYC、PIK3CA、BRAF、CDK4、EGFR、FGFR1、KIT、MET、PDGFRAおよびRAF1が挙げられるがこれらに限定されない。遺伝子融合を有する例示的な遺伝子として、ALK、FGFR2、FGFR3、NTRK1、RETおよびROS1が挙げられるがこれらに限定されない。インデルを有する例示的な遺伝子として、EGFR(例えば、エクソン19および20における)、ERBB2(例えば、エクソン19および20における)およびMET(例えば、エクソン14のスキッピング)が挙げられるがこれらに限定されない。例示的な標的は、CCND1およびCCND2を含むことができる。配列捕捉プローブは、遺伝子にわたり敷き詰める(tile)ことができる(例えば、プローブは、重複領域を標的とすることができる)。配列プローブは、非重複領域を標的とすることができる。配列プローブは、長さ、融解温度および二次構造に関して最適化され得る。
グアニン-シトシン(GC)含量の定量的尺度
グアニン-シトシン含量は、グアニンまたはシトシンのいずれかである、DNA分子の窒素含有塩基のパーセンテージである。遺伝子座のGC含量に関連する定量的尺度は、遺伝子座全体のGC含量であり得る。遺伝子座のGC含量に関連する定量的尺度は、遺伝子のエクソン領域のGC含量であり得る。遺伝子座のGC含量に関連する定量的尺度は、遺伝子座にマッピングするリードによって被覆される領域のGC含量であり得る。GC含量に関連する定量的尺度は、遺伝子座に対応する配列捕捉プローブのGC含量であり得る。遺伝子座のGC含量に関連する定量的尺度は、遺伝子座に対応する配列捕捉プローブのGC含量の中心傾向に関連する尺度であり得る。中心傾向に関連する尺度は、平均、中央値またはモード等、中心傾向のいずれかの尺度であり得る。中心傾向に関連する尺度は、中央値であり得る。所与の領域のGC含量は、該領域にわたるグアノシンおよびシトシン塩基の数を塩基の総数で割ることにより測定することができる。
グアニン-シトシン含量は、グアニンまたはシトシンのいずれかである、DNA分子の窒素含有塩基のパーセンテージである。遺伝子座のGC含量に関連する定量的尺度は、遺伝子座全体のGC含量であり得る。遺伝子座のGC含量に関連する定量的尺度は、遺伝子のエクソン領域のGC含量であり得る。遺伝子座のGC含量に関連する定量的尺度は、遺伝子座にマッピングするリードによって被覆される領域のGC含量であり得る。GC含量に関連する定量的尺度は、遺伝子座に対応する配列捕捉プローブのGC含量であり得る。遺伝子座のGC含量に関連する定量的尺度は、遺伝子座に対応する配列捕捉プローブのGC含量の中心傾向に関連する尺度であり得る。中心傾向に関連する尺度は、平均、中央値またはモード等、中心傾向のいずれかの尺度であり得る。中心傾向に関連する尺度は、中央値であり得る。所与の領域のGC含量は、該領域にわたるグアノシンおよびシトシン塩基の数を塩基の総数で割ることにより測定することができる。
配列決定リードカバレッジの定量的尺度
配列決定リードカバレッジに関連する定量的尺度は、遺伝子座に対応するDNA分子に由来するリードの数を示す尺度である(例えば、参照ゲノム由来の特定の位置、塩基、領域、遺伝子または染色体)。リードを遺伝子座に関連付けるために、リードは、参照にマッピングまたは整列することができる。マッピングまたは整列を遂行するためのソフトウェア(例えば、Bowtie、BWA、mrsFAST、BLAST、BLAT)は、配列決定リードを遺伝子座と関連付けることができる。マッピングプロセスにおいて、特定のパラメータを最適化することができる。マッピングプロセスの最適化の非限定例は、反復領域のマスク;マッピング品質(例えば、MAPQ)スコアカットオフの利用;アラインメントを生成するための異なるシード長の使用;およびゲノムの位置間の編集距離の限定を含むことができる。
配列決定リードカバレッジに関連する定量的尺度は、遺伝子座に対応するDNA分子に由来するリードの数を示す尺度である(例えば、参照ゲノム由来の特定の位置、塩基、領域、遺伝子または染色体)。リードを遺伝子座に関連付けるために、リードは、参照にマッピングまたは整列することができる。マッピングまたは整列を遂行するためのソフトウェア(例えば、Bowtie、BWA、mrsFAST、BLAST、BLAT)は、配列決定リードを遺伝子座と関連付けることができる。マッピングプロセスにおいて、特定のパラメータを最適化することができる。マッピングプロセスの最適化の非限定例は、反復領域のマスク;マッピング品質(例えば、MAPQ)スコアカットオフの利用;アラインメントを生成するための異なるシード長の使用;およびゲノムの位置間の編集距離の限定を含むことができる。
配列決定リードカバレッジに関連した定量的尺度は、遺伝子座に関連したリードの計数を含むことができる。一部の事例では、計数は、新たな測定基準へと変換されて、異なる配列決定深度、ライブラリー複雑性または遺伝子座のサイズの効果を軽減する。例示的な測定基準は、百万単位当たりのキロベース当たりのリード(Read Per Kilobase per Million)、百万単位当たりのキロベース当たりの断片(Fragments Per Kilobase per Million)(FPKM)、M値のトリム平均(TMM)(Trimmed Mean of M values)、変動安定化された生の計数(variance stabilized raw counts)、および対数変換された生の計数である。特定の適用に使用することができる他の変換も、当業者にとって公知である。
定量的尺度は、折り畳まれたリードを使用して決定することができ、各折り畳まれたリードは、初期鋳型DNA分子に対応する。リードファミリーを折り畳むおよび定量化するための方法は、これらそれぞれがその全体が参照により本明細書に組み込まれる、PCT/US2013/058061およびPCT/US2014/000048に見出される。特に、バーコードおよび配列決定リードからの配列情報を使用する折り畳み方法を用いて、各ファミリーが、バーコード配列、および配列決定リード配列の少なくとも一部分を共有するように、リードをファミリーへと折り畳むことができる。次いで、各ファミリーは、ファミリーの大部分に関して、単一の初期鋳型DNA分子から導出される。ファミリー由来の配列のマッピングに由来する計数は、「特有の分子計数」(UMC)と称することができる。一部の事例では、配列決定リードカバレッジに関連する定量的尺度を決定するステップは、ライブラリーサイズに関連する測定基準によってUMCを正規化して、正規化されたUMC(「正規化されたUMC」)を提供するステップを含む。例示的な方法は、遺伝子座のUMCを全UMCの和で割ること;遺伝子座のUMCを全常染色体UMCの和で割ることである。複数の配列決定リードのデータセットを比較する場合、UMCは、例えば、2個の配列決定リードのデータセットの遺伝子座の中央値UMCによって正規化することができる。一部の事例では、配列決定リードカバレッジに関連する定量的尺度は、次の通りにさらに正規化される正規化されたUMCであり得る:(i)正規化されたUMCは、トレーニング試料に由来する配列決定リード由来の対応する遺伝子座について決定される;(ii)遺伝子座毎に、試料の正規化されたUMCは、対応する座位におけるトレーニング試料の正規化されたUMCの中央値によって正規化され、これにより、遺伝子座の相対的存在量(RA)を提供する。
コンセンサス配列は、例えば、最初の5、10、15、20または25塩基内の同一配列に基づき配列決定リードを折り畳むことにより、その配列に基づき同定することができる。一部の事例では、折り畳みは、それ以外は同一であるリードにおける1個の差、2個の差、3個の差、4個の差または5個の差を可能にする。一部の事例では、折り畳みは、リードのマッピング位置、例えば、配列決定リードの初期塩基のマッピング位置を使用する。一部の事例では、折り畳みは、バーコードを使用し、バーコード配列を共有する配列決定リードは、コンセンサス配列へと折り畳まれる。一部の事例では、折り畳みは、バーコードおよび初期鋳型分子の配列の両方を使用する。例えば、バーコードを共有し、参照ゲノムにおける同じ位置にマッピングする全リードを折り畳むことができる。別の例では、バーコードおよび初期鋳型分子の配列(または初期鋳型分子の配列に対するパーセンテージ同一性)を共有する全リードを折り畳むことができる。
一部の事例では、配列決定リードカバレッジの定量的尺度は、ゲノムの特異的な部分領域について決定される。領域は、ビン、目的の遺伝子、エクソン、配列プローブに対応する領域、プライマー増幅産物に対応する領域、またはプライマー結合部位に対応する領域であり得る。一部の事例では、ゲノムの部分領域は、配列捕捉プローブに対応する領域である。リードの少なくとも一部分が、配列捕捉プローブに対応する領域の少なくとも一部分をマッピングする場合、リードは、配列捕捉プローブに対応する領域にマッピングすることができる。リードの少なくとも一部分が、配列捕捉プローブに対応する領域の大部分にマッピングする場合、リードは、配列捕捉プローブに対応する領域にマッピングすることができる。リードの少なくとも一部分が、配列捕捉プローブに対応する領域の中心点にわたってマッピングする場合、リードは、配列捕捉プローブに対応する領域にマッピングすることができる。一部の事例では、遺伝子座の配列決定リードカバレッジに関連する定量的尺度は、遺伝子座内のゲノム位置に対応するプローブのRAの中央値である。例えば、KRASが、2、3および5のRAを有する3種のプローブによって被覆される場合、遺伝子座のRAは、3となるであろう。
「飽和平衡」補正
一般に、本明細書に記載されている方法を使用して、核酸試料におけるバリアントコール(variant calling)(例えば、コピー数バリアントの検出)の特異性および感度を増加させることができる。例えば、本方法は、データ試料におけるノイズまたは歪みの量を減少させ、検出される偽陽性バリアントの数を低下させることができる。ノイズおよび/または歪みが減少するにつれて、特異性および感度が増加する。ノイズは、シグナルへの望まれないランダムな付加であると考えることができる。歪みは、シグナルまたはシグナルの一部の大きさの変更であると考えることができる。
一般に、本明細書に記載されている方法を使用して、核酸試料におけるバリアントコール(variant calling)(例えば、コピー数バリアントの検出)の特異性および感度を増加させることができる。例えば、本方法は、データ試料におけるノイズまたは歪みの量を減少させ、検出される偽陽性バリアントの数を低下させることができる。ノイズおよび/または歪みが減少するにつれて、特異性および感度が増加する。ノイズは、シグナルへの望まれないランダムな付加であると考えることができる。歪みは、シグナルまたはシグナルの一部の大きさの変更であると考えることができる。
ノイズは、ポリヌクレオチドのコピーおよび/または読み取りにおけるエラーにより導入され得る。例えば、配列決定プロセスにおいて、単一のポリヌクレオチドを先ず、増幅に付すことができる。増幅されたポリヌクレオチドのサブセットが、特定の座位に、該座位における本来の塩基と同じではない塩基を含有し得るように、増幅は、エラーを導入し得る。さらに、読み取りプロセスにおいて、いずれか特定の座位における塩基は、不正確に読み取られることがある。結果として、配列リードの収集物は、本来の塩基と同じではない、ある一定のパーセンテージの塩基コールを座位に含むことができる。典型的な配列決定技術において、このエラー率は、1桁、例えば、2%~3%となり得る。全て同じ配列を有すると推定される分子の収集物が配列決定される場合、このノイズは、十分に小さいため、本来の塩基を高い信頼度で同定することができる。
しかし、親ポリヌクレオチドの収集物が、特定の座位に配列バリアントを有するポリヌクレオチドのサブセットを含む場合、ノイズは、著しい問題となり得る。例えば、無細胞DNAが、生殖系列DNAのみならず、胎児DNAまたはがん細胞由来のDNA等、別の供給源由来のDNAも含む場合、これが現実のものとなり得る。この場合、配列バリアントを有する分子の頻度が、配列決定プロセスによって導入されるエラーの頻度と同じ範囲内である場合、真の配列バリアントは、ノイズから区別不能である場合がある。このことは、例えば、試料における配列バリアントの検出に干渉し得る。
歪みは、配列決定プロセスにおいて、シグナル強度の差として、例えば、同じ頻度における親集団における分子によって産生される配列リードの総数として、顕在化され得る。歪みは、例えば、増幅バイアス、GCバイアスまたは配列決定バイアスにより導入され得る。これは、試料におけるコピー数変異の検出に干渉し得る。GCバイアスは、配列読み取りにおいてGC含量が豊富なまたは乏しい区域の不均等な表示をもたらす。
本明細書に開示されている方法は、データセットから、配列決定リードカバレッジに関連する定量的尺度または配列決定リードカバレッジに関連する変換された定量的尺度が、予測モデルとは最も異なる遺伝子座を除去し(本明細書において、高変動遺伝子座の除去と称することができる)、これにより、残っている遺伝子座の第1のセットを提供することにより、ベースラインの決定における使用のための遺伝子座の初期セットを決定するステップを含む。一部の実例では、これらの遺伝子座の除去は、配列決定リードカバレッジに関連する定量的尺度を、遺伝子座のGC含量に関連する定量的尺度に関連付けるモデルの適合を含む。例えば、予測モデルは、遺伝子座のRAを、座位のGC含量に関連付けることができる。一部の事例では、予測モデルは、LOESSおよびLOWESS回帰モデル等、ノンパラメトリック回帰モデルを含む回帰モデルである。一部の事例では、ベースライン化は、予測モデルから最も逸脱する遺伝子座の5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%または70%を除去することにより遂行される。一部の事例では、ベースライン化は、予測モデルから最も逸脱する遺伝子座の少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%または少なくとも70%を除去することにより遂行される。一部の事例では、逸脱は、モデルと比べた遺伝子座の残部を測定することにより決定される。正確なカットオフを選択して、残っている遺伝子座からの特異的な量の変動の除外を提供することができる。
遺伝子座に由来する試料由来のDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度を決定するための方法は、その全体が参照により本明細書に組み込まれる、PCT/US2014/072383に開示されている。定量的尺度の決定は、試料に存在した座位に由来する初期鋳型DNA分子の数の推定を含むことができる。二本鎖ポリヌクレオチドが配列リードを生成しない確率は、初期鋳型DNA分子の両方の鎖を表すリードおよび初期鋳型DNA分子の一本鎖のみを表すリードの相対数に基づき決定することができる。
試料における検出されない初期鋳型DNA分子の数は、初期鋳型DNA分子の両方の鎖を表すリードおよび初期鋳型DNA分子の一本鎖のみを表すリードの相対数に基づき推定することができる。例として、特定の遺伝子座、座位Aの計数が記録され、そこでは、1000分子が対になり(例えば、両方の鎖が検出される)、1000分子が対にならない(例えば、一本鎖のみが検出される)。用語「対になった」および「対にならない」が、本明細書において、分子の両端が配列決定されたかまたは分子の単一端が配列決定されたかを示すように配列決定リードに適用されることがある用語とは異なることに留意されたい。個々のワトソン・クリック鎖が、変換に引き続くプロセスを成し遂げる一様な確率pを仮定すると、次の通りに、プロセスを成し遂げることができない(見出されない)分子の比率を計算することができる:R、対になった分子の対にならない分子に対する比=1000/1000=1、したがって、R=1=p2/(2p(1-p))。これは、p=2/3であり、失われた分子の量が、(1-p)2=1/9に等しいことを暗示する。よって、この例において、変換された分子のほぼ11%が失われており、検出されない。二項分布の使用に加えて、見出されない分子の数を推定する他の方法は、観察される配列リードの冗長性に基づく、指数関数、ベータ、ガンマまたは経験的分布を含む。後者の場合、対になったおよび対にならない分子のリード計数の分布は、かかる冗長性に由来して、特定の座位における本来のポリヌクレオチド分子の根底にある分布を推論することができる。これは多くの場合、見出されない分子の数のより優れた推定をもたらし得る。一部の事例では、pは、遺伝子座に由来する試料由来のDNAの鎖が、配列決定リードにおいて表される確率に関連する定量的尺度である。一部の事例では、pは、同様に導き出されるが、リード分布の異なるモデルが使用される(例えば、二項、ポアソン、ベータ、ガンマおよび負の二項分布)。
配列決定リードカバレッジに関連する定量的尺度のための変換は、除去された高変動遺伝子座を有する遺伝子座のセット由来の定量的尺度または変換された配列決定リードカバレッジを、GC含量に関連する定量的尺度および遺伝子座に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度に関連付けることにより決定することができる。一部の事例では、残っている遺伝子座は、二倍体である、および/または同じコピー数で存在すると仮定される。一部の実例では、変換は、GC含量に関連する定量的尺度および遺伝子座に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度によって、残っている遺伝子座の配列決定リードカバレッジに関連する定量的尺度の中心傾向に関連する尺度を適合させることにより決定される。変換は、例えば、(i)GC含量に関連する定量的尺度および遺伝子座に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度の両方によって、高変動遺伝子座の除去後に残っている遺伝子座の配列決定リードカバレッジの定量的尺度の中心傾向を適合させることができる。一部の実例では、残っている座位の配列決定リードカバレッジの定量的尺度の中心傾向に関連する尺度は、残っている遺伝子座のUMCの中心傾向である。一部の実例では、表面近似が使用されて、(i)GC含量に関連する定量的尺度および(ii)遺伝子座に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度によって、残っている遺伝子座のUMCの表面または残っている遺伝子座のUMCの中心傾向を適合させる。例えば、表面近似は、GC含量およびpの定量的尺度による、初期鋳型DNA分子に関連する尺度(例えば、UMC)の二次元二次多項式表面適合であり得る。一部の事例では、配列決定カバレッジに関連する変換された定量的尺度は、(i)GC含量に関連する定量的尺度および(ii)遺伝子座に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度から計算される、上で決定された変換に基づき予想される値である。一部の事例では、配列決定カバレッジに関連する変換された定量的尺度は、各遺伝子座の残部である(例えば、試料における表面近似および遺伝子座の配列決定リードカバレッジに関連する観察される定量的尺度に基づく、座位の配列決定リードカバレッジに関連する予想される定量的尺度の差または商)。任意選択で、配列決定カバレッジに関連する変換された定量的尺度が決定された後で、上に記載されている通り、配列決定リードカバレッジの新たな変換された定量的尺度に基づき、高変動遺伝子座を再度除去することができる。
「プローブ効率」補正
参照試料を使用して遺伝子座のバイアスを決定および除去する方法が、本明細書に開示されている。一部の事例では、参照試料は、がんを有しない被験体由来の無細胞DNA由来の配列決定リードである。一部の事例では、参照試料は、目的の遺伝子座にコピー数変異を実質的に欠くがん細胞を有する被験体由来の無細胞DNA由来の配列決定リードである。一部の事例では、参照試料は、がんを有する被験体由来の無細胞DNA由来の配列決定リードであり、この場合、コピー数変異を起こしたと疑われる領域が、分析から除外されている。一部の事例では、参照試料は、がんを有しない被験体由来の血漿試料である。一部の事例では、参照試料は、がんを有する被験体由来の血漿試料である。
参照試料を使用して遺伝子座のバイアスを決定および除去する方法が、本明細書に開示されている。一部の事例では、参照試料は、がんを有しない被験体由来の無細胞DNA由来の配列決定リードである。一部の事例では、参照試料は、目的の遺伝子座にコピー数変異を実質的に欠くがん細胞を有する被験体由来の無細胞DNA由来の配列決定リードである。一部の事例では、参照試料は、がんを有する被験体由来の無細胞DNA由来の配列決定リードであり、この場合、コピー数変異を起こしたと疑われる領域が、分析から除外されている。一部の事例では、参照試料は、がんを有しない被験体由来の血漿試料である。一部の事例では、参照試料は、がんを有する被験体由来の血漿試料である。
参照試料の遺伝子座のそれぞれは、上の「飽和平衡補正」に記載されている通りに処理して、配列決定リードカバレッジの変換された定量的尺度を提供することができる。一部の事例では、配列決定カバレッジに関連する変換された定量的尺度は、(i)GC含量に関連する定量的尺度および(ii)参照遺伝子座由来の遺伝子座に由来するDNAの鎖が、配列決定リード内に表される確率に関連する定量的尺度から計算される、上で決定された変換に基づき予想される値である。一部の事例では、配列決定カバレッジに関連する変換された定量的尺度は、各参照遺伝子座の残部である(例えば、参照試料における表面近似および遺伝子座の配列決定リードカバレッジに関連する観察される定量的尺度に基づく、座位の配列決定リードカバレッジに関連する予想される定量的尺度の差または商)。参照試料における遺伝子座の配列決定リードカバレッジに関連する変換された定量的尺度は、遺伝子座の「効率」であると考えることができる。例えば、非効率的に増幅された遺伝子座は、非常に効率的に増幅された遺伝子座(試料において同じコピー数で存在)よりも低いUMCを有するであろう。
試料の配列決定リードカバレッジに関連する変換された定量的尺度は、参照試料(複数可)由来の遺伝子座の決定された効率に基づき補正することができる。この補正は、ライゲーション効率、プルダウン効率、PCR効率、フローセルクラスタリング損失、逆多重化(demultiplexing)損失、折り畳み損失およびアラインメント損失に関係し得る、試料から配列決定リードを産生するプロセスによって、試料に導入された変動を低下させることができる。一実施形態では、補正は、試料の配列決定カバレッジの飽和後変換された定量的尺度を、配列決定カバレッジに関連する予測される飽和後変換された定量的尺度で割るまたは引くことを含む。一部の実例では、遺伝子座の配列決定カバレッジに関連する予測される飽和後変換された定量的尺度は、試料由来の遺伝子座の配列決定カバレッジに関連する飽和後変換された定量的尺度および参照の配列決定リードカバレッジに関連する飽和後変換された定量的尺度の間の関係性を適合させることにより決定される。一部の事例では、適合は、参照の配列決定リードカバレッジに関連する飽和後変換された定量的尺度における、試料由来の遺伝子座の配列決定カバレッジに関連する飽和後変換された定量的尺度の局所回帰(例えば、LOESSまたはLOWESS)またはロバスト線形回帰の遂行を含む。一部の事例では、適合は、線形回帰、非線形回帰またはノンパラメトリック回帰であり得る。
任意選択で、プローブ効率補正由来の変換された定量的尺度は、低下された変動を有する配列決定リードカバレッジに関連する第3のさらに変換された定量的尺度を産生するための「飽和平衡補正」変換への入力となり得る。一般に、配列決定リードカバレッジの変換された定量的尺度内の変動をさらに低下させるために、配列決定カバレッジの変換された定量的尺度は、本明細書に開示されている方法のいずれかを追加的な回数使用して変換され得る。
遺伝子レベル概要
推論されるコピー数の遺伝子レベル概要は、本明細書に開示されている通りに決定される、配列決定リードカバレッジの変換された定量的尺度に基づき決定することができる。コピー数は、高変動遺伝子座を破棄することにより上述の操作において選択されたベースラインと比べて推論することができる。例えば、残っている遺伝子座が、試料において二倍体であると推論される場合、配列決定カバレッジに関連する変換された定量的尺度が、ベースラインとは異なる遺伝子座は、腫瘍細胞においてコピー数変更を起こしたと推論される。一部の実例では、遺伝子レベルz-スコアは、プローブシグナルの観察される遺伝子レベル中央値、ならびに遺伝子および全ゲノム正常二倍体プローブシグナル標準偏差における観察されるプローブレベル標準偏差推定値を使用して計算される推定標準偏差を使用して計算される。
推論されるコピー数の遺伝子レベル概要は、本明細書に開示されている通りに決定される、配列決定リードカバレッジの変換された定量的尺度に基づき決定することができる。コピー数は、高変動遺伝子座を破棄することにより上述の操作において選択されたベースラインと比べて推論することができる。例えば、残っている遺伝子座が、試料において二倍体であると推論される場合、配列決定カバレッジに関連する変換された定量的尺度が、ベースラインとは異なる遺伝子座は、腫瘍細胞においてコピー数変更を起こしたと推論される。一部の実例では、遺伝子レベルz-スコアは、プローブシグナルの観察される遺伝子レベル中央値、ならびに遺伝子および全ゲノム正常二倍体プローブシグナル標準偏差における観察されるプローブレベル標準偏差推定値を使用して計算される推定標準偏差を使用して計算される。
マイナーアレル頻度ベースライン最適化
配列決定リードにおけるバリアントのマイナーアレル頻度を使用して、本明細書に記載されているコピー数の遺伝子レベル概要におけるエラーを検出し、エラーを補正する方法が、本明細書に提供される。無細胞体液由来の核酸由来の配列決定リードの10%~90%の間、20%~80%の間、30%~70%の間、40%~60%の間またはほぼ50%で存在する配列バリアントは、被験体の生殖系列配列に存在するヘテロ接合性バリアントであり得る。一部の実例では、遺伝子座は、上に記載されている通り、増幅を起こしたと決定された。バリアントの量は、推論されるコピー数と比較されて、バリアント頻度が、推論されるコピー数と一致しないかどうかを決定する。一例では、ヘテロ接合性遺伝子座は、ベースラインコピー数の決定に使用された遺伝子座(例えば、高変動遺伝子座の除外後に残っている遺伝子座)において試験することができる。一部の事例では、試料における多数の遺伝子座が増幅されており、このベースラインは誤同定され得る。このような場合、ヘテロ接合性は、1:1比から逸脱することがあり、不正確なベースライン化が検出および補正される。第2の例では、遺伝子座は、配列決定リードカバレッジに関連する変換された定量的尺度に基づき三倍体コピー数で存在すると推論することができる。被験体の生殖系列ゲノムが、遺伝子座の第1のアレルを有する一方の染色体を有し、第2の染色体が、第2のアレルを有した場合、第1または第2のアレルは、がん細胞において重複した可能性がある。
配列決定リードにおけるバリアントのマイナーアレル頻度を使用して、本明細書に記載されているコピー数の遺伝子レベル概要におけるエラーを検出し、エラーを補正する方法が、本明細書に提供される。無細胞体液由来の核酸由来の配列決定リードの10%~90%の間、20%~80%の間、30%~70%の間、40%~60%の間またはほぼ50%で存在する配列バリアントは、被験体の生殖系列配列に存在するヘテロ接合性バリアントであり得る。一部の実例では、遺伝子座は、上に記載されている通り、増幅を起こしたと決定された。バリアントの量は、推論されるコピー数と比較されて、バリアント頻度が、推論されるコピー数と一致しないかどうかを決定する。一例では、ヘテロ接合性遺伝子座は、ベースラインコピー数の決定に使用された遺伝子座(例えば、高変動遺伝子座の除外後に残っている遺伝子座)において試験することができる。一部の事例では、試料における多数の遺伝子座が増幅されており、このベースラインは誤同定され得る。このような場合、ヘテロ接合性は、1:1比から逸脱することがあり、不正確なベースライン化が検出および補正される。第2の例では、遺伝子座は、配列決定リードカバレッジに関連する変換された定量的尺度に基づき三倍体コピー数で存在すると推論することができる。被験体の生殖系列ゲノムが、遺伝子座の第1のアレルを有する一方の染色体を有し、第2の染色体が、第2のアレルを有した場合、第1または第2のアレルは、がん細胞において重複した可能性がある。
ラングミュア様飽和モデル
理論に制約されないが、歴史的臨床データの探索および合成スパイクインモデルシステムが関与する標的化実験に基づき、ベイト-cfDNA相互作用の支配機構であると仮定されるラングミュア様飽和モデルが、本明細書に開示されている。したがって、干渉するアッセイ効果(例えば、ライゲーション効率、PCR増幅バイアス、配列決定アーティファクト等)の非存在下で、ベイトプルダウンプロセスは、次の通りに表すことができる。
理論に制約されないが、歴史的臨床データの探索および合成スパイクインモデルシステムが関与する標的化実験に基づき、ベイト-cfDNA相互作用の支配機構であると仮定されるラングミュア様飽和モデルが、本明細書に開示されている。したがって、干渉するアッセイ効果(例えば、ライゲーション効率、PCR増幅バイアス、配列決定アーティファクト等)の非存在下で、ベイトプルダウンプロセスは、次の通りに表すことができる。
この記載におけるKは、ベイト配列特徴、および標的化ベイト位置のゲノム近傍におけるDNA断片とのその相互作用に依存するベイト効率である。Isatは、総ベイトプール濃度および複製計数の関数である、プルダウン反応における限定された初期ベイト計数によって駆動される飽和パラメータである。複製計数は、本明細書において、存在する配列捕捉プローブの相対量または絶対量を指す。例えば、配列捕捉アレイは、アレイにおける異なるモル量のプローブを提供して、異なるプローブ効率を説明することができる。図8は、ベイト効率Kおよび飽和パラメータIsatに基づく、真のコピー数および特有の分子計数に関連するモデルを例示する。
ベイト効率Kは、大部分は、GC含量によって駆動される一方、Isatは、特有の分子計数 対 総リード計数の相互作用を研究することによって大雑把に調べられ得る、より複雑なベイト消耗機構およびRNA二次構造相互作用によって駆動される。非線形プルダウン反応とは別に、プローブシグナルは、次の仮定が関与する乗法モデルによってさらにモデル化することができる:ナイーブモデル(naive model)の下で、cfDNA断片は、ゲノム位置によって均一に分布され、確率的標本抽出プロセスは、カバレッジ変異に寄与する優勢な因子である。次いで、コピー数シグナル(例えば、UMC)は、観察されるUMCを試料における真の分子計数に関連付けることによりモデル化することができ、根底にある位置的cfDNAプロファイル、ライゲーション効率、プルダウン効率、PCR効率、フローセルクラスタリング損失、逆多重化損失、折り畳み損失およびアラインメント損失の効果を考慮に入れる。
非線形プルダウン反応とは別に、プローブシグナルは、次の仮定が関与する単純乗法モデルによってさらにモデル化することができる。ナイーブモデルの下で、cfDNA断片は、ゲノム位置によって均一に分布され、確率的標本抽出プロセスは、カバレッジ変異に寄与する優勢な因子である。次いで、コピー数シグナル、すなわち、所与のプローブに関連するリード計数は、次の通りにモデル化することができる:
観察されるUMC=真のUMC×根底にある位置的cfDNAプロファイル(ベイト、cfDNA断片)×ライゲーション効率(位置、サイズ、cfDNA断片)×プルダウン効率(プローブ、cfDNA断片)×PCR効率(DNA断片)×フローセルクラスタリング損失×逆多重化損失および折り畳み損失×アラインメント損失(cfDNA断片配列)。
このモデルは、上述のモデルの乗法性質を仮定する。根底にあるベイト特異的コピー数シグナルは、本明細書に開示されているベースライン決定方法等、一連のステップによる確立されたベースラインに関して、観察されるUMC(例えば、所与の配列捕捉プローブのUMC)から推論することができる。
本明細書に開示されている方法は、試料およびトレーニングセットからプローブ効率およびベイト飽和を推定するためのアプローチを提供する。代わりに、かかるパラメータは、UMCに対する、変動する標的配列濃度の効果がプローブ毎に観察される、1セットのベイトタイトレーション実験を遂行することにより推論することができる。K、IsatおよびUMCが既知の場合、コピー数変異を起こしていない腫瘍細胞に対応するUMC値または範囲を決定することが可能である。例えば、遺伝子座の大部分が、コピー数変更を起こしていないという仮定において、観察されるUMCは、大部分は、二倍体試料に由来するであろう。コピー数変異を起こした試料は、UMCが、その対応するKおよびIsat値を有するプローブの予想される範囲から外れる遺伝子座となるであろう。一部の事例では、例えば、UMC値または範囲は、各プローブのKおよびIsatに依存した関数となるであろう。例えば、二倍体コピー数に対応するUMCは、2種のプローブ間で異なる場合がある。
コンピュータ制御システム
本開示は、本開示の方法を実施するようにプログラムされたコンピュータ制御システムを提供する。図12は、本開示の方法を実施するようにプログラムされたまたは他の仕方で構成されたコンピュータシステム1201を示す。コンピュータシステム1201は、シングルコアもしくはマルチコアプロセッサ、または並列処理のための複数のプロセッサとなり得る、中央処理装置(CPU、本明細書において同様に「プロセッサ」および「コンピュータプロセッサ」)1205を含む。コンピュータシステム1201は、メモリまたはメモリ位置1210(例えば、ランダムアクセスメモリ、リードオンリーメモリ、フラッシュメモリ)、電子記憶装置1215(例えば、ハードディスク)、1個または複数の他のシステムと通信するための通信インターフェース1220(例えば、ネットワークアダプタ)、ならびにキャッシュ、他のメモリ、データ記憶および/または電子ディスプレイアダプタ等の周辺機器1225も含む。メモリ1210、記憶装置1215、インターフェース1220および周辺機器1225は、マザーボード等、通信バス(実線)を介してCPU 1205と通信している。記憶装置1215は、データを記憶するためのデータ記憶装置(またはデータレポジトリ)であり得る。コンピュータシステム1201は、通信インターフェース1220を活用してコンピュータネットワーク(「ネットワーク」)1230に作動可能にカップリングされ得る。ネットワーク1230は、インターネット、インターネットおよび/もしくはエクストラネット、またはインターネットと通信したイントラネットおよび/もしくはエクストラネットであり得る。ネットワーク1230は、一部の事例では、遠隔通信および/またはデータネットワークである。ネットワーク1230は、ローカルエリアネットワークを含むことができる。ネットワーク1230は、クラウドコンピューティング等、分散型コンピューティングを可能にすることができる1個または複数のコンピュータサーバーを含むことができる。ネットワーク1230は、一部の事例では、コンピュータシステム1201を活用して、コンピュータシステム1201にカップリングされたデバイスが、クライアントまたはサーバーとして運転することを可能にし得るピアツーピア(peer-to-peer)ネットワークを実施することができる。
本開示は、本開示の方法を実施するようにプログラムされたコンピュータ制御システムを提供する。図12は、本開示の方法を実施するようにプログラムされたまたは他の仕方で構成されたコンピュータシステム1201を示す。コンピュータシステム1201は、シングルコアもしくはマルチコアプロセッサ、または並列処理のための複数のプロセッサとなり得る、中央処理装置(CPU、本明細書において同様に「プロセッサ」および「コンピュータプロセッサ」)1205を含む。コンピュータシステム1201は、メモリまたはメモリ位置1210(例えば、ランダムアクセスメモリ、リードオンリーメモリ、フラッシュメモリ)、電子記憶装置1215(例えば、ハードディスク)、1個または複数の他のシステムと通信するための通信インターフェース1220(例えば、ネットワークアダプタ)、ならびにキャッシュ、他のメモリ、データ記憶および/または電子ディスプレイアダプタ等の周辺機器1225も含む。メモリ1210、記憶装置1215、インターフェース1220および周辺機器1225は、マザーボード等、通信バス(実線)を介してCPU 1205と通信している。記憶装置1215は、データを記憶するためのデータ記憶装置(またはデータレポジトリ)であり得る。コンピュータシステム1201は、通信インターフェース1220を活用してコンピュータネットワーク(「ネットワーク」)1230に作動可能にカップリングされ得る。ネットワーク1230は、インターネット、インターネットおよび/もしくはエクストラネット、またはインターネットと通信したイントラネットおよび/もしくはエクストラネットであり得る。ネットワーク1230は、一部の事例では、遠隔通信および/またはデータネットワークである。ネットワーク1230は、ローカルエリアネットワークを含むことができる。ネットワーク1230は、クラウドコンピューティング等、分散型コンピューティングを可能にすることができる1個または複数のコンピュータサーバーを含むことができる。ネットワーク1230は、一部の事例では、コンピュータシステム1201を活用して、コンピュータシステム1201にカップリングされたデバイスが、クライアントまたはサーバーとして運転することを可能にし得るピアツーピア(peer-to-peer)ネットワークを実施することができる。
CPU 1205は、プログラムまたはソフトウェアにおいて具体化され得る機械可読指示のシーケンスを実行することができる。指示は、メモリ1210等、メモリ位置において記憶され得る。指示は、CPU 1205に方向づけることができ、これはその後に、本開示の方法を実施するようにCPU 1205をプログラムするまたは他の仕方で構成することができる。CPU 1205によって遂行される操作の例は、フェッチ、デコード、実行およびライトバックを含むことができる。
CPU 1205は、集積回路等、回路の一部となり得る。システム1201の1個または複数の他の構成成分が、回路に含まれてよい。一部の事例では、回路は、特定用途向け集積回路(ASIC)である。
記憶装置1215は、ドライバ、ライブラリーおよび保存されたプログラム等、ファイルを記憶することができる。記憶装置1215は、ユーザーデータ、例えば、ユーザー嗜好およびユーザープログラムを記憶することができる。コンピュータシステム1201は、一部の事例では、イントラネットまたはインターネットを介してコンピュータシステム1201と通信するリモートサーバーに位置する等、コンピュータシステム1201に対して外部である1個または複数の追加的なデータ記憶装置を含むことができる。
コンピュータシステム1201は、ネットワーク1230を介して1個または複数のリモートコンピュータシステムと通信することができる。例えば、コンピュータシステム1201は、ユーザーのリモートコンピュータシステムと通信することができる。リモートコンピュータシステムの例として、パーソナルコンピュータ(例えば、ポータブルPC)、スレートもしくはタブレットPC(例えば、Apple(登録商標)iPad(登録商標)、Samsung(登録商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone(登録商標)、Android対応デバイス、Blackberry(登録商標))または携帯情報端末が挙げられる。ユーザーは、ネットワーク1230経由でコンピュータシステム1201にアクセスすることができる。
本明細書に記載されている方法は、例えば、メモリ1210または電子記憶装置1215等、コンピュータシステム1201の電子記憶位置に記憶された機械(例えば、コンピュータプロセッサ)実行可能なコードとして実施することができる。機械実行可能または機械可読コードは、ソフトウェアの形態で提供され得る。使用の際に、コードは、プロセッサ1205によって実行することができる。一部の事例では、プロセッサ1205による容易なアクセスのため、コードは、記憶装置1215から読み出し、メモリ1210に記憶することができる。場合によっては、電子記憶装置1215が排除されることがあり、機械実行可能な指示はメモリ1210に記憶される。
コードは、コードを実行するように適応されたプロセッサ(processer)を有する機械による使用のために事前にコンパイルおよび構成され得る、またはランタイムにおいてコンパイルされ得る。コードは、コードが、事前にコンパイルされたまたはその場でコンパイルされる(as-compiled)様式で実行することを可能にするように選択され得るプログラミング言語で供給され得る。
コンピュータシステム1201等、本明細書に提供されるシステムおよび方法の態様は、プログラミングにおいて具体化することができる。本技術の様々な態様は、典型的には、ある種の機械可読媒体において保持されるまたは具体化される、機械(またはプロセッサ)実行可能なコードおよび/または関連するデータの形態の「製品」または「製造品」であると考えることができる。機械実行可能なコードは、メモリ(例えば、リードオンリーメモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスク等、電子記憶装置において記憶され得る。「記憶」型の媒体は、ソフトウェアプログラミングのいかなる時点においても非一過性記憶を提供し得る、様々な半導体メモリ、テープドライブ、ディスクドライブ等、コンピュータ、プロセッサその他の有形メモリまたはその関連するモジュールのいずれかまたは全てを含むことができる。ソフトウェアの全体または部分は、時には、インターネットまたは様々な他の遠隔通信ネットワークを介して通信することができる。かかる通信は、例えば、あるコンピュータまたはプロセッサから別のコンピュータまたはプロセッサへの、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームへのソフトウェアのローディングを可能にすることができる。よって、ソフトウェアエレメントを有することができる別の種類の媒体は、有線および光地上通信線(landline)ネットワークを介してならびに様々なエアリンク(air-link)にわたってローカルデバイス間の物理インターフェースを越えて使用される等、光波、電波および電磁波を含む。有線または無線リンク、光リンク等、かかる波を運ぶ物理的エレメントは、ソフトウェアを有する媒体として考慮することもできる。本明細書において、非一過性、有形「記憶」媒体に制限されない限り、コンピュータまたは機械「可読媒体」等の用語は、実行のためのプロセッサへの指示の提供に関与するいずれかの媒体を指す。
したがって、コンピュータ実行可能なコード等、機械可読媒体は、有形記憶媒体、搬送波媒体または物理的伝送媒体が挙げられるがこれらに限定されない、多くの形態を採ることができる。不揮発性記憶媒体は、例えば、図面に示す通り、データベース等の実施に使用され得るもの等、いずれかのコンピュータ(複数可)等における記憶デバイスのいずれか等、光または磁気ディスクを含む。揮発性記憶媒体は、かかるコンピュータプラットフォームのメインメモリ等、ダイナミックメモリを含む。有形伝送媒体は、コンピュータシステム内にバスを含むワイヤを含む、同軸ケーブル;銅線および光ファイバを含む。搬送波伝送媒体は、ラジオ周波数(RF)および赤外(IR)データ通信において生成されるもの等、電気もしくは電磁シグナルまたは音もしくは光の波の形態を採ることができる。したがって、コンピュータ可読媒体の共通形態は、例えば:フロッピーディスク(登録商標)、フレキシブルディスク、ハードディスク、磁気テープ、他のいずれかの磁気媒体、CD-ROM、DVDもしくはDVD-ROM、他のいずれかの光学媒体、パンチカード穿孔テープ(paper tape)、孔のパターンによる他のいずれかの物理的記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH-EPROM、他のいずれかのメモリチップもしくはカートリッジ、搬送波輸送データもしくは指示、かかる搬送波を輸送するケーブルもしくはリンク、またはコンピュータがプログラミングコードおよび/もしくはデータを読み取ることができる他のいずれかの媒体を含む。コンピュータ可読媒体のこれらの形態の多くは、1個または複数の指示の1個または複数のシーケンスを、実行のためのプロセッサに運ぶことに関与することができる。
コンピュータシステム1201は、例えば、報告を提供するためのユーザーインターフェース(UI)1240を含む電子ディスプレイ1235を含むことができるまたはこれと通信することができる。UIの例は、グラフィカルユーザーインターフェース(GUI)およびウェブに基づくユーザーインターフェースを、限定することなく含む。
本開示の方法およびシステムは、1種または複数のアルゴリズムによって実施することができる。アルゴリズムは、中央処理装置1205による実行の際にソフトウェアによって実施することができる。
(実施例1)
以前に生成されたコピー数変異スパイクインデータの試験は、生のリード計数およびUMC、ならびに根底にあるコピー数変化に対するプローブ/遺伝子レベルコピー数シグナル応答の両方における有意なプローブ間のシグナル変異を明らかにした。図2を参照されたい。図3は、試料におけるベイトの量に対する正規化カバレッジの非線形応答を実証する、3種の遺伝子(CCND1、CCND2およびERBB2)の推論的コピー数 対 理論的コピー数を例示する。これらの結果は、プルダウンにおけるベイト枯渇を示唆し、これは、特有の分子計数に相当に大きい差を有する同じ遺伝子内の隣接するプローブにおける次のベイトタイトレーション効果によって確認された(これにより、高い初期UMCを有するプローブに対するより速い特有の分子計数飽和を観察する)。
以前に生成されたコピー数変異スパイクインデータの試験は、生のリード計数およびUMC、ならびに根底にあるコピー数変化に対するプローブ/遺伝子レベルコピー数シグナル応答の両方における有意なプローブ間のシグナル変異を明らかにした。図2を参照されたい。図3は、試料におけるベイトの量に対する正規化カバレッジの非線形応答を実証する、3種の遺伝子(CCND1、CCND2およびERBB2)の推論的コピー数 対 理論的コピー数を例示する。これらの結果は、プルダウンにおけるベイト枯渇を示唆し、これは、特有の分子計数に相当に大きい差を有する同じ遺伝子内の隣接するプローブにおける次のベイトタイトレーション効果によって確認された(これにより、高い初期UMCを有するプローブに対するより速い特有の分子計数飽和を観察する)。
図4Aは、各プローブに関連するUMCが、プローブpに関する非線形応答を有することを例示する。図4Bは、各プローブに関連するUMCが、プローブGC含量に関する非線形応答を有することを例示する。
図5は、飽和補正もプローブ効率補正も遂行しない、プローブのUMCを例示する。図6は、飽和補正後の同じ試料を示す。図7は、プローブ効率補正後の同じ試料を示す。ゲノム位置内の変動は、各ステージにおいて低下され、現れる腫瘍細胞の根底にあるコピー数変異のより明らかな像をもたらす。中央値のプローブのプローブ効率補正後シグナルが1.2を上回る図7における遺伝子は、コピー数変異を起こしたとコールされる。プローブ効率補正後シグナルの異なるレベルは、腫瘍不均一性または続発性腫瘍によるものである可能性がある。
図9は、飽和補正およびプローブ効率補正後の、ベースライン化遺伝子座プローブシグナルノイズ低下の典型的進行を示す。
図10Aは、x軸における参照試料(複数可)のプローブ効率および腫瘍細胞にコピー数変異を有しない被験体由来の試料の飽和補正後のシグナルのプロットを例示する。関係性はほぼ線形である。図10Bは、腫瘍細胞にコピー数変異を有する被験体由来の同様のプロットを例示する。応答は、図10Aほど線形ではない。参照試料(複数可)由来のプローブ効率およびベースライン化遺伝子座の飽和補正後のUMC(黒色で示す)の間の関係性の決定によって推論される予測される効率による補正は、腫瘍細胞においてコピー数増幅を起こしたと推定される遺伝子座(灰色のドット)における異なるプローブ効率による変異を低下させるであろう。図11は、飽和およびプローブ効率補正後のUMCおよびMAF最適化されたベースライン化に基づく患者試料由来のコピー数変異の例示的な報告を例示する。星印は、被験体の腫瘍細胞にコピー数変異を起こした遺伝子座に属すると示されるポイントを示す。
(実施例2)
無細胞DNAを、がんを有する被験体から得、バーコード化配列決定ライブラリーを調製し、プローブセットによる配列捕捉によって癌遺伝子のパネルを濃縮し、バーコード化配列決定ライブラリーを配列決定する。配列決定リードを、参照ゲノムにマッピングし、そのバーコード配列およびマッピング位置に基づきファミリーへと折り畳む。プローブセット由来のプローブの中点に対応するゲノム座標毎に、該中点に及ぶリードファミリーの数を計数して、プローブ当たりのUMCを得る。中央値のプローブ当たりのUMCを遺伝子毎に決定する。「飽和平衡補正」を遂行するために、遺伝子をその中央値のプローブ当たりのGC含量によってグループ化する。中央値のプローブ当たりのUMCが、同様の中央値のプローブ当たりのGC含量を有する遺伝子と有意に異なる遺伝子を除去する。
無細胞DNAを、がんを有する被験体から得、バーコード化配列決定ライブラリーを調製し、プローブセットによる配列捕捉によって癌遺伝子のパネルを濃縮し、バーコード化配列決定ライブラリーを配列決定する。配列決定リードを、参照ゲノムにマッピングし、そのバーコード配列およびマッピング位置に基づきファミリーへと折り畳む。プローブセット由来のプローブの中点に対応するゲノム座標毎に、該中点に及ぶリードファミリーの数を計数して、プローブ当たりのUMCを得る。中央値のプローブ当たりのUMCを遺伝子毎に決定する。「飽和平衡補正」を遂行するために、遺伝子をその中央値のプローブ当たりのGC含量によってグループ化する。中央値のプローブ当たりのUMCが、同様の中央値のプローブ当たりのGC含量を有する遺伝子と有意に異なる遺伝子を除去する。
プローブ毎に、本明細書に記載されている通りに、pおよびGC含量を決定する。以前のステップ由来の残っている遺伝子を使用して、プローブpおよびGC含量に対する中央値の遺伝子レベルUMCの二次元二次多項式表面適合を遂行する。pおよびGC含量を予想されるUMCに関連付ける関数を使用して、予想されるプローブ当たりのUMCを決定する。観察されるプローブ当たりのUMCを予想されるプローブ当たりのUMCで割ることにより、データセットの残部を決定する。各プローブの残部UMCは、配列決定カバレッジの変換された定量的尺度である。
遺伝子をその中央値のプローブ当たりのGC含量によって再度グループ化し、その中央値のプローブ当たりの残部UMCが、同様の中央値のプローブ当たりのGC含量を有する遺伝子とは有意に異なる遺伝子を除去する。次いで、先行する段落に記載されている通り、参照試料(複数可)の残部UMCを得ることにより、「プローブ効率」補正を遂行する。次いで、試料由来の各プローブの残部UMCを、参照(複数可)由来の各対応するプローブの残部UMCで割って、プローブ効率補正後のUMCを得る。
上述の飽和平衡補正と同様に、残っている遺伝子を使用して、プローブpおよびGC含量に対するプローブ効率補正後のUMCの二次元二次多項式表面適合を遂行する。pおよびGC含量を予想されるプローブ効率補正後のUMCに関連付ける関数を使用して、予想されるプローブ当たりのプローブ効率補正後のUMCを決定する。観察されるプローブ当たりのプローブ効率補正後のUMCを予想されるプローブ当たりのプローブ効率補正後のUMCで割ることにより、データセットの残部を決定する。各プローブの残部のプローブ効率補正後のUMCは、プローブGC補正後のシグナル(post-probe GC-corrected signal)である。
残っている遺伝子をその中央値のプローブ当たりのGC含量によってグループ化し、その中央値のプローブGC補正後のシグナルが、同様の中央値のプローブ当たりのGC含量を有する遺伝子とは有意に異なる遺伝子を除去する。
初期UMCの代わりに開始入力としてのプローブGC補正後のシグナルにより、本実施例のプロセスを反復する。
遺伝子毎に、プローブGC補正後のシグナルの中央値を使用して、各遺伝子を要約する。その中央値のプローブGC補正後のシグナルが、他の遺伝子とは有意に異なる遺伝子は、腫瘍細胞に遺伝子増幅または欠失を起こした候補とみなされる。
遺伝子毎に、生殖系列ヘテロ接合性アレルを決定し、各アレルの相対頻度を定量化する。ベースライン化に使用する遺伝子座は、ほぼ1:1比のアレルを有することが判明し、ベースライン化遺伝子座の選択を検証する。
全ゲノム正常二倍体プローブシグナル由来の遺伝子レベルでの中央値のプローブGC補正後のシグナルおよび推定標準偏差に基づき、Z-スコアを遺伝子毎に決定する。カットオフよりも高いZ-スコアを有する遺伝子が、腫瘍細胞に遺伝子増幅を起こしたと報告される。
(実施例3)
本明細書に記載されている方法は、対照方法に対する本開示の方法において、ERBB2コピー数を測定することにより検証された。本開示の方法は、観察されるコピー数(CN) 対 理論的コピー数の線形応答を産生し、偽陽性CNV結果は、正常(健康)コホートで観察されない。図13を参照されたい。図13は、推論される遺伝子コピー数 対
理論的コピー数推定値を示し、黒塗りのドットは、ほぼ2の観察されるコピー数を表し(二倍体試料)、白抜きのドットは、検出される増幅事象を表し、太い水平破線は、平均遺伝子CNカットオフをマークする。図14も参照されたい。図14は、四角形によって対照データが表された、図13のデータを描写する。全CNVは、2.15コピーに下落する予想されるタイトレーション傾向に従った。さらに、本開示の方法は、変動の低下により、データにおける観察される「ノイズ」を減少させ、対照方法と比較してCNVが容易に識別されることを可能にした。図15の最も右側を参照されたい;三角形が本開示の方法を表す一方、Xは対照方法を表す。
本明細書に記載されている方法は、対照方法に対する本開示の方法において、ERBB2コピー数を測定することにより検証された。本開示の方法は、観察されるコピー数(CN) 対 理論的コピー数の線形応答を産生し、偽陽性CNV結果は、正常(健康)コホートで観察されない。図13を参照されたい。図13は、推論される遺伝子コピー数 対
理論的コピー数推定値を示し、黒塗りのドットは、ほぼ2の観察されるコピー数を表し(二倍体試料)、白抜きのドットは、検出される増幅事象を表し、太い水平破線は、平均遺伝子CNカットオフをマークする。図14も参照されたい。図14は、四角形によって対照データが表された、図13のデータを描写する。全CNVは、2.15コピーに下落する予想されるタイトレーション傾向に従った。さらに、本開示の方法は、変動の低下により、データにおける観察される「ノイズ」を減少させ、対照方法と比較してCNVが容易に識別されることを可能にした。図15の最も右側を参照されたい;三角形が本開示の方法を表す一方、Xは対照方法を表す。
本発明の好まれる実施形態を本明細書に示し記載してきたが、当業者であれば、かかる実施形態が、単なる例として提供されていることが明らかであろう。本発明が、本明細書内に提供される具体例によって限定されることを意図しない。上述の明細書を参照しつつ本発明を記載してきたが、本明細書における実施形態の記載および例示は、限定的な意味で解釈されることを目的としない。ここで、当業者であれば、本発明から逸脱することなく、多数の変異、変化および代用を思い付く。さらに、本発明のあらゆる態様が、種々の条件および変数に依存する、本明細書に明記されている特異的な描写、構成または相対比率に限定されないことが理解されるものとする。本明細書に記載されている本発明の実施形態の様々な代替を本発明の実施に用いることができることを理解されたい。したがって、本発明が、いかなるかかる代替、修飾、変異または均等物も網羅するべきであることが企図される。次の特許請求の範囲が、本発明の範囲を規定し、これにより、特許請求の範囲内の方法および構造ならびにこれらの均等物が網羅されることが意図される。
本発明は、例えば、以下の項目を提供する。
(項目1)
(a)被験体の無細胞体液試料のデオキシリボ核酸(DNA)分子の配列決定リードを得るステップと、
(b)前記配列リードから、複数の遺伝子座における遺伝子座毎に配列決定リードカバレッジ(「リードカバレッジ」)に関連する定量的尺度を含む第1のデータセットを生成するステップと、
(c)飽和平衡補正およびプローブ効率補正を遂行することにより、前記第1のデータセットを補正するステップと、
(d)前記第1のデータセットについてベースラインリードカバレッジを決定するステップであって、前記ベースラインリードカバレッジが、飽和平衡およびプローブ効率に関連する、ステップと、
(e)前記ベースラインリードカバレッジと比べた前記複数の遺伝子座における遺伝子座毎のコピー数状態を決定するステップと
を含む、方法。
(項目2)
前記第1のデータセットが、複数の遺伝子座における遺伝子座毎に、前記遺伝子座のグアニン-シトシン含量(「GC含量」)に関連する定量的尺度を含む、項目1に記載の方法。
(項目3)
(c)に先立ち、前記第1のデータセットから、高変動遺伝子座である遺伝子座を除去するステップを含み、除去するステップが、
(i)グアニン-シトシン含量に関連する前記定量的尺度および前記遺伝子座の配列決定リードカバレッジの前記定量的尺度に関連するモデルを適合させるステップと、
(ii)前記第1のデータセットから、前記遺伝子座の少なくとも10%を除去するステップであって、前記モデルと最も異なる前記遺伝子座の少なくとも10%を除去し、これにより、ベースライン化遺伝子座の前記第1のデータセットを提供するステップを含む、ステップと
を含む、項目2に記載の方法。
(項目4)
前記遺伝子座の少なくとも45%を除去するステップを含む、項目3に記載の方法。
(項目5)
飽和平衡補正を遂行するステップが、
(i)ベースライン化遺伝子座の前記第1のデータセット由来の遺伝子座毎に、前記遺伝子座に由来する前記試料由来のDNA分子の鎖が、前記配列決定リード内に表される確率に関連する定量的尺度を決定し、
(ii)ベースライン化遺伝子座の前記第1のデータセットにおける前記リードカバレッジを、ベースライン化遺伝子座の前記第1のデータセットの前記GC含量、およびベースライン化遺伝子座の前記第1のデータセットにおける各座位に由来するDNAの鎖が、前記配列決定リード内に表される確率に関連する前記定量的尺度の両方に関連付けることにより前記リードカバレッジのための第1の変換を決定し、
(iii)前記第1の変換を、ベースライン化遺伝子座の前記第1のデータセット由来の各遺伝子座の前記リードカバレッジに適用して、ベースライン化遺伝子座の前記第1のデータセットの変換されたリードカバレッジの第1のセットを含む、飽和補正されたデータセットを提供する
ことにより、ベースライン化遺伝子座の前記第1のデータセットを前記飽和補正されたデータセットへと変換するステップを含む、項目3に記載の方法。
(項目6)
前記第1の変換を決定するステップが、(i)ベースライン化遺伝子座の前記第1のデータセットの前記リードカバレッジの中心傾向に関連する尺度を決定するステップと、(ii)前記遺伝子座の前記GC含量、および前記遺伝子座に由来するDNAの鎖が、前記配列決定リード内に表される確率に関連する前記定量的尺度に基づき、ベースライン化遺伝子座の前記第1のデータセットの前記リードカバレッジの前記中心傾向に関連する尺度を適合させる関数を決定するステップと、(iii)ベースライン化遺伝子座の前記第1のデータセットの遺伝子座毎に、前記関数によって予測されるリードカバレッジおよび前記リードカバレッジの間の差を決定するステップであって、前記差が、前記変換されたリードカバレッジである、ステップとを含む、項目5に記載の方法。
(項目7)
前記関数が、表面近似である、項目6に記載の方法。
(項目8)
前記表面近似が、二次元二次多項式である、項目7に記載の方法。
(項目9)
プローブ効率補正を遂行するステップが、
(i)前記飽和補正されたデータセットから、変換されたリードカバレッジの前記第1のセットに関して高変動遺伝子座である遺伝子座を除去し、これにより、ベースライン化遺伝子座の第2のデータセットを提供し、
(ii)ベースライン化遺伝子座の前記第2のデータセットの前記プローブ効率に関連する変換されたリードカバレッジの前記第1のセットのための第2の変換を決定し、
(iii)前記第2の変換を用いて、ベースライン化遺伝子座の前記第2のデータセットの変換されたリードカバレッジの前記第1のセットを変換し、これにより、ベースライン化遺伝子座の前記第2のデータセットの変換されたリードカバレッジの第2のセットを含む、プローブ効率補正されたデータセットを提供する
ことにより、前記飽和補正されたデータセットを前記プローブ効率補正されたデータセットへと変換するステップを含む、項目5に記載の方法。
(項目10)
前記第1のデータセットから、高変動遺伝子座である遺伝子座を除去するステップが、
(i)前記GC含量および前記飽和補正されたデータセットの変換されたリードカバレッジの前記第1のセットに関連するモデルを適合させるステップと、
(ii)飽和補正されたデータセットから、前記遺伝子座の少なくとも10%を除去するステップであって、前記モデルと最も異なる遺伝子座を除去し、これにより、ベースライン化遺伝子座の前記第2のデータセットを提供するステップを含む、ステップと
を含む、項目9に記載の方法。
(項目11)
前記遺伝子座の少なくとも45%を除去するステップを含む、項目10に記載の方法。
(項目12)
前記プローブ効率が、1種または複数の参照試料において前記飽和平衡補正を遂行することにより決定され、前記プローブ効率が、前記飽和平衡補正を遂行することにより得られる前記変換されたリードカバレッジである、項目9に記載の方法。
(項目13)
前記1種または複数の参照試料が、がんを有しない被験体由来の無細胞体液試料である、項目12に記載の方法。
(項目14)
前記1種または複数の参照試料が、がんを有する被験体由来の無細胞体液試料であり、対応する遺伝子座が、コピー数変更を起こしていない、項目12に記載の方法。
(項目15)
前記第2の変換を決定するステップが、(i)前記1種または複数の参照試料由来の前記遺伝子座について決定された前記プローブ効率を、ベースライン化遺伝子座の前記第2のデータセット由来のリードカバレッジの前記第1のセットに適合させるステップと、(ii)ベースライン化遺伝子座の前記第2のデータセットの各遺伝子座の前記変換されたリードカバレッジを、(i)の前記適合に基づき予測されるプローブ効率で割るステップとを含む、項目12に記載の方法。
(項目16)
(g)ベースライン化遺伝子座の前記第2のデータセットの前記変換されたリードカバレッジを、ベースライン化遺伝子座の前記第2のデータセットの前記GC含量、およびベースライン化遺伝子座の前記第2のデータセットにおける前記各座位に由来するDNAの鎖が、前記配列決定リード内に表される確率に関連する前記定量的尺度の両方に関連付けることにより、変換されたリードカバレッジの前記第2のセットのための第3の変換を決定するステップと、
(h)前記第3の変換を、変換されたリードカバレッジの前記第2のセットに適用して、変換された定量的リードカバレッジの第3のセットを含む、第4のデータセットを提供するステップと
をさらに含む、項目5に記載の方法。
(項目17)
前記無細胞体液試料の前記DNAが、遺伝子座の前記セット由来の前記遺伝子座の少なくとも一部分に相補的な1種または複数のオリゴヌクレオチドプローブを使用して、遺伝子座の前記セットについて濃縮される、項目1に記載の方法。
(項目18)
遺伝子座の前記セット由来の各遺伝子座の前記GC含量が、遺伝子座の前記セット由来の前記遺伝子座の少なくとも一部分に相補的な前記1種または複数のオリゴヌクレオチドプローブのグアニン-シトシン含量の中心傾向に関連する尺度である、項目17に記載の方法。
(項目19)
前記遺伝子座の前記リードカバレッジが、前記1種または複数のオリゴヌクレオチドプローブに対応する前記遺伝子座の領域の前記リードカバレッジの中心傾向に関連する尺度である、項目17に記載の方法。
(項目20)
飽和平衡補正を遂行する前記ステップおよびプローブ効率補正を遂行する前記ステップが、ラングミュアモデルを適合させるステップを含み、前記ラングミュアモデルが、プローブ効率(K)および飽和平衡定数(Isat)を含む、項目17に記載の方法。
(項目21)
KおよびIsatが、前記1種または複数のオリゴヌクレオチドプローブにおけるオリゴヌクレオチドプローブ毎に経験的に決定される、項目20に記載の方法。
(項目22)
飽和平衡補正を遂行するステップおよびプローブ補正を遂行するステップが、前記遺伝子座の前記リードカバレッジを、前記遺伝子座が同一コピー数状態で存在することを仮定して前記ラングミュアモデルに適合させ、これにより、ベースラインリードカバレッジを提供するステップを含む、項目21に記載の方法。
(項目23)
前記同一コピー数状態が、二倍体である、項目22に記載の方法。
(項目24)
前記ベースラインリードカバレッジが、前記プローブ効率および前記飽和平衡に依存する関数である、項目22に記載の方法。
(項目25)
コピー数状態を決定するステップが、前記遺伝子座の前記リードカバレッジを前記ベースラインリードカバレッジと比較するステップを含む、項目22に記載の方法。
(項目26)
前記無細胞体液が、血清、血漿、尿および脳脊髄液からなる群より選択される、先行する項目のいずれか一項に記載の方法。
(項目27)
前記リードカバレッジが、前記配列決定リードを参照ゲノムにマッピングすることにより決定される、先行する項目のいずれか一項に記載の方法。
(項目28)
前記配列決定リードを得るステップが、アダプターを、前記被験体由来の前記無細胞体液由来の前記DNA分子にライゲーションするステップを含む、先行する項目のいずれか一項に記載の方法。
(項目29)
前記DNA分子が、二重鎖DNA分子であり、各アダプターが、前記DNA分子の相補鎖を異なる形でタグ付けして、タグ付けされた鎖を提供するように、前記アダプターが、前記二重鎖DNA分子にライゲーションされる、項目28に記載の方法。
(項目30)
前記遺伝子座に由来するDNAの鎖が、前記配列決定リード内に表される確率に関連する前記定量的尺度を決定するステップが、配列決定リードを対になったリードおよび対にならないリードへと選別するステップを含み、(i)各対になったリードが、前記セットにおける二本鎖ポリヌクレオチド分子に由来する第1のタグ付けされた鎖および第2の異なる形でタグ付けされた相補鎖から生成される配列リードに対応し、(ii)各対にならないリードが、配列リードの前記セットにおける前記配列リードの中に表される二本鎖ポリヌクレオチド分子に由来する第2の異なる形でタグ付けされた相補鎖を有しない第1のタグ付けされた鎖を表す、項目29に記載の方法。
(項目31)
1種または複数の遺伝子座のそれぞれにマッピングする、(i)前記対になったリードおよび(ii)前記対にならないリードの定量的尺度を決定して、各座位にマッピングする対になったリードおよび対にならないリードに関連する前記定量的尺度に基づき、前記1種または複数の遺伝子座のそれぞれにマッピングする、前記試料における総二本鎖DNA分子に関連する定量的尺度を決定するステップをさらに含む、項目30に記載の方法。
(項目32)
前記アダプターが、バーコード配列を含む、項目28に記載の方法。
(項目33)
前記リードカバレッジを決定するステップが、前記参照ゲノムへの前記配列決定リードの前記マッピングの位置および前記バーコード配列に基づき、前記配列決定リードを折り畳むステップを含む、項目32に記載の方法。
(項目34)
前記遺伝子座が、1種または複数の癌遺伝子を含む、先行する項目のいずれか一項に記載の方法。
(項目35)
前記被験体の生殖系列ゲノムがヘテロ接合性である前記ベースライン化遺伝子座内におけるバリアントの相対量を決定することにより、前記ベースライン化遺伝子座の少なくともサブセットが、前記被験体の前記腫瘍細胞においてコピー数変更を起こしたことを決定するステップをさらに含む、先行する項目のいずれか一項に記載の方法。
(項目36)
前記バリアントの前記相対量が、ほぼ等しいわけではない、項目35に記載の方法。
(項目37)
前記バリアントの前記相対量がほぼ等しいわけではない前記ベースライン化遺伝子座が、前記ベースライン化遺伝子座から除去され、これにより、アレル頻度補正されたベースライン化遺伝子座を提供する、項目36に記載の方法。
(項目38)
前記アレル頻度補正されたベースライン化遺伝子座が、先行する項目のいずれか一項に記載の方法において前記ベースライン化座位として使用される、項目37に記載の方法。
(項目39)
(a)メモリに、被験体の無細胞体液試料のデオキシリボ核酸(DNA)分子の配列決定リードを受け取るステップと、
(b)コンピュータプロセッサを用いてコードを実行して、次のステップ:
(i)前記配列リードから、複数の遺伝子座における遺伝子座毎に配列決定リードカバレッジ(「リードカバレッジ」)に関連する定量的尺度を含む第1のデータセットを生成するステップと、
(ii)飽和平衡補正およびプローブ効率補正を遂行することにより、前記第1のデータセットを補正するステップと、
(iii)前記第1のデータセットについてベースラインリードカバレッジを決定するステップであって、前記ベースラインリードカバレッジが、飽和平衡およびプローブ効率に関連する、ステップと、
(iv)前記ベースラインリードカバレッジと比べた前記複数の遺伝子座における遺伝子座毎のコピー数状態を決定するステップと
を遂行するステップと
を含む、方法。
(項目40)
(a)ネットワークと、
(b)前記ネットワークに接続された、核酸配列データを記憶するように構成されたコンピュータメモリを含むデータベースと、
(c)前記ネットワークに接続された、コンピュータメモリおよび1個または複数のコンピュータプロセッサを含むバイオインフォマティクスコンピュータと
を含むシステムであって、
前記コンピュータが、前記1個または複数のコンピュータプロセッサによって実行されると、前記データベースに記憶された前記核酸配列データをコピーし、前記コピーされたデータを前記バイオインフォマティクスコンピュータにおけるメモリに書き出し、以下:
(i)前記核酸配列データから、複数の遺伝子座における遺伝子座毎に配列決定リードカバレッジ(「リードカバレッジ」)に関連する定量的尺度を含む第1のデータセットを生成するステップと、
(ii)飽和平衡補正およびプローブ効率補正を遂行することにより、前記第1のデータセットを補正するステップと、
(iii)前記第1のデータセットについてベースラインリードカバレッジを決定するステップであって、前記ベースラインリードカバレッジが、飽和平衡およびプローブ効率に関連する、ステップと、
(iv)前記ベースラインリードカバレッジと比べた前記複数の遺伝子座における遺伝子座毎のコピー数状態を決定するステップと
を含むステップを遂行する、機械実行可能なコードをさらに含む、システム。
(項目41)
前記データベースが、核酸シーケンサーに接続されている、項目40に記載のシステム。
本発明は、例えば、以下の項目を提供する。
(項目1)
(a)被験体の無細胞体液試料のデオキシリボ核酸(DNA)分子の配列決定リードを得るステップと、
(b)前記配列リードから、複数の遺伝子座における遺伝子座毎に配列決定リードカバレッジ(「リードカバレッジ」)に関連する定量的尺度を含む第1のデータセットを生成するステップと、
(c)飽和平衡補正およびプローブ効率補正を遂行することにより、前記第1のデータセットを補正するステップと、
(d)前記第1のデータセットについてベースラインリードカバレッジを決定するステップであって、前記ベースラインリードカバレッジが、飽和平衡およびプローブ効率に関連する、ステップと、
(e)前記ベースラインリードカバレッジと比べた前記複数の遺伝子座における遺伝子座毎のコピー数状態を決定するステップと
を含む、方法。
(項目2)
前記第1のデータセットが、複数の遺伝子座における遺伝子座毎に、前記遺伝子座のグアニン-シトシン含量(「GC含量」)に関連する定量的尺度を含む、項目1に記載の方法。
(項目3)
(c)に先立ち、前記第1のデータセットから、高変動遺伝子座である遺伝子座を除去するステップを含み、除去するステップが、
(i)グアニン-シトシン含量に関連する前記定量的尺度および前記遺伝子座の配列決定リードカバレッジの前記定量的尺度に関連するモデルを適合させるステップと、
(ii)前記第1のデータセットから、前記遺伝子座の少なくとも10%を除去するステップであって、前記モデルと最も異なる前記遺伝子座の少なくとも10%を除去し、これにより、ベースライン化遺伝子座の前記第1のデータセットを提供するステップを含む、ステップと
を含む、項目2に記載の方法。
(項目4)
前記遺伝子座の少なくとも45%を除去するステップを含む、項目3に記載の方法。
(項目5)
飽和平衡補正を遂行するステップが、
(i)ベースライン化遺伝子座の前記第1のデータセット由来の遺伝子座毎に、前記遺伝子座に由来する前記試料由来のDNA分子の鎖が、前記配列決定リード内に表される確率に関連する定量的尺度を決定し、
(ii)ベースライン化遺伝子座の前記第1のデータセットにおける前記リードカバレッジを、ベースライン化遺伝子座の前記第1のデータセットの前記GC含量、およびベースライン化遺伝子座の前記第1のデータセットにおける各座位に由来するDNAの鎖が、前記配列決定リード内に表される確率に関連する前記定量的尺度の両方に関連付けることにより前記リードカバレッジのための第1の変換を決定し、
(iii)前記第1の変換を、ベースライン化遺伝子座の前記第1のデータセット由来の各遺伝子座の前記リードカバレッジに適用して、ベースライン化遺伝子座の前記第1のデータセットの変換されたリードカバレッジの第1のセットを含む、飽和補正されたデータセットを提供する
ことにより、ベースライン化遺伝子座の前記第1のデータセットを前記飽和補正されたデータセットへと変換するステップを含む、項目3に記載の方法。
(項目6)
前記第1の変換を決定するステップが、(i)ベースライン化遺伝子座の前記第1のデータセットの前記リードカバレッジの中心傾向に関連する尺度を決定するステップと、(ii)前記遺伝子座の前記GC含量、および前記遺伝子座に由来するDNAの鎖が、前記配列決定リード内に表される確率に関連する前記定量的尺度に基づき、ベースライン化遺伝子座の前記第1のデータセットの前記リードカバレッジの前記中心傾向に関連する尺度を適合させる関数を決定するステップと、(iii)ベースライン化遺伝子座の前記第1のデータセットの遺伝子座毎に、前記関数によって予測されるリードカバレッジおよび前記リードカバレッジの間の差を決定するステップであって、前記差が、前記変換されたリードカバレッジである、ステップとを含む、項目5に記載の方法。
(項目7)
前記関数が、表面近似である、項目6に記載の方法。
(項目8)
前記表面近似が、二次元二次多項式である、項目7に記載の方法。
(項目9)
プローブ効率補正を遂行するステップが、
(i)前記飽和補正されたデータセットから、変換されたリードカバレッジの前記第1のセットに関して高変動遺伝子座である遺伝子座を除去し、これにより、ベースライン化遺伝子座の第2のデータセットを提供し、
(ii)ベースライン化遺伝子座の前記第2のデータセットの前記プローブ効率に関連する変換されたリードカバレッジの前記第1のセットのための第2の変換を決定し、
(iii)前記第2の変換を用いて、ベースライン化遺伝子座の前記第2のデータセットの変換されたリードカバレッジの前記第1のセットを変換し、これにより、ベースライン化遺伝子座の前記第2のデータセットの変換されたリードカバレッジの第2のセットを含む、プローブ効率補正されたデータセットを提供する
ことにより、前記飽和補正されたデータセットを前記プローブ効率補正されたデータセットへと変換するステップを含む、項目5に記載の方法。
(項目10)
前記第1のデータセットから、高変動遺伝子座である遺伝子座を除去するステップが、
(i)前記GC含量および前記飽和補正されたデータセットの変換されたリードカバレッジの前記第1のセットに関連するモデルを適合させるステップと、
(ii)飽和補正されたデータセットから、前記遺伝子座の少なくとも10%を除去するステップであって、前記モデルと最も異なる遺伝子座を除去し、これにより、ベースライン化遺伝子座の前記第2のデータセットを提供するステップを含む、ステップと
を含む、項目9に記載の方法。
(項目11)
前記遺伝子座の少なくとも45%を除去するステップを含む、項目10に記載の方法。
(項目12)
前記プローブ効率が、1種または複数の参照試料において前記飽和平衡補正を遂行することにより決定され、前記プローブ効率が、前記飽和平衡補正を遂行することにより得られる前記変換されたリードカバレッジである、項目9に記載の方法。
(項目13)
前記1種または複数の参照試料が、がんを有しない被験体由来の無細胞体液試料である、項目12に記載の方法。
(項目14)
前記1種または複数の参照試料が、がんを有する被験体由来の無細胞体液試料であり、対応する遺伝子座が、コピー数変更を起こしていない、項目12に記載の方法。
(項目15)
前記第2の変換を決定するステップが、(i)前記1種または複数の参照試料由来の前記遺伝子座について決定された前記プローブ効率を、ベースライン化遺伝子座の前記第2のデータセット由来のリードカバレッジの前記第1のセットに適合させるステップと、(ii)ベースライン化遺伝子座の前記第2のデータセットの各遺伝子座の前記変換されたリードカバレッジを、(i)の前記適合に基づき予測されるプローブ効率で割るステップとを含む、項目12に記載の方法。
(項目16)
(g)ベースライン化遺伝子座の前記第2のデータセットの前記変換されたリードカバレッジを、ベースライン化遺伝子座の前記第2のデータセットの前記GC含量、およびベースライン化遺伝子座の前記第2のデータセットにおける前記各座位に由来するDNAの鎖が、前記配列決定リード内に表される確率に関連する前記定量的尺度の両方に関連付けることにより、変換されたリードカバレッジの前記第2のセットのための第3の変換を決定するステップと、
(h)前記第3の変換を、変換されたリードカバレッジの前記第2のセットに適用して、変換された定量的リードカバレッジの第3のセットを含む、第4のデータセットを提供するステップと
をさらに含む、項目5に記載の方法。
(項目17)
前記無細胞体液試料の前記DNAが、遺伝子座の前記セット由来の前記遺伝子座の少なくとも一部分に相補的な1種または複数のオリゴヌクレオチドプローブを使用して、遺伝子座の前記セットについて濃縮される、項目1に記載の方法。
(項目18)
遺伝子座の前記セット由来の各遺伝子座の前記GC含量が、遺伝子座の前記セット由来の前記遺伝子座の少なくとも一部分に相補的な前記1種または複数のオリゴヌクレオチドプローブのグアニン-シトシン含量の中心傾向に関連する尺度である、項目17に記載の方法。
(項目19)
前記遺伝子座の前記リードカバレッジが、前記1種または複数のオリゴヌクレオチドプローブに対応する前記遺伝子座の領域の前記リードカバレッジの中心傾向に関連する尺度である、項目17に記載の方法。
(項目20)
飽和平衡補正を遂行する前記ステップおよびプローブ効率補正を遂行する前記ステップが、ラングミュアモデルを適合させるステップを含み、前記ラングミュアモデルが、プローブ効率(K)および飽和平衡定数(Isat)を含む、項目17に記載の方法。
(項目21)
KおよびIsatが、前記1種または複数のオリゴヌクレオチドプローブにおけるオリゴヌクレオチドプローブ毎に経験的に決定される、項目20に記載の方法。
(項目22)
飽和平衡補正を遂行するステップおよびプローブ補正を遂行するステップが、前記遺伝子座の前記リードカバレッジを、前記遺伝子座が同一コピー数状態で存在することを仮定して前記ラングミュアモデルに適合させ、これにより、ベースラインリードカバレッジを提供するステップを含む、項目21に記載の方法。
(項目23)
前記同一コピー数状態が、二倍体である、項目22に記載の方法。
(項目24)
前記ベースラインリードカバレッジが、前記プローブ効率および前記飽和平衡に依存する関数である、項目22に記載の方法。
(項目25)
コピー数状態を決定するステップが、前記遺伝子座の前記リードカバレッジを前記ベースラインリードカバレッジと比較するステップを含む、項目22に記載の方法。
(項目26)
前記無細胞体液が、血清、血漿、尿および脳脊髄液からなる群より選択される、先行する項目のいずれか一項に記載の方法。
(項目27)
前記リードカバレッジが、前記配列決定リードを参照ゲノムにマッピングすることにより決定される、先行する項目のいずれか一項に記載の方法。
(項目28)
前記配列決定リードを得るステップが、アダプターを、前記被験体由来の前記無細胞体液由来の前記DNA分子にライゲーションするステップを含む、先行する項目のいずれか一項に記載の方法。
(項目29)
前記DNA分子が、二重鎖DNA分子であり、各アダプターが、前記DNA分子の相補鎖を異なる形でタグ付けして、タグ付けされた鎖を提供するように、前記アダプターが、前記二重鎖DNA分子にライゲーションされる、項目28に記載の方法。
(項目30)
前記遺伝子座に由来するDNAの鎖が、前記配列決定リード内に表される確率に関連する前記定量的尺度を決定するステップが、配列決定リードを対になったリードおよび対にならないリードへと選別するステップを含み、(i)各対になったリードが、前記セットにおける二本鎖ポリヌクレオチド分子に由来する第1のタグ付けされた鎖および第2の異なる形でタグ付けされた相補鎖から生成される配列リードに対応し、(ii)各対にならないリードが、配列リードの前記セットにおける前記配列リードの中に表される二本鎖ポリヌクレオチド分子に由来する第2の異なる形でタグ付けされた相補鎖を有しない第1のタグ付けされた鎖を表す、項目29に記載の方法。
(項目31)
1種または複数の遺伝子座のそれぞれにマッピングする、(i)前記対になったリードおよび(ii)前記対にならないリードの定量的尺度を決定して、各座位にマッピングする対になったリードおよび対にならないリードに関連する前記定量的尺度に基づき、前記1種または複数の遺伝子座のそれぞれにマッピングする、前記試料における総二本鎖DNA分子に関連する定量的尺度を決定するステップをさらに含む、項目30に記載の方法。
(項目32)
前記アダプターが、バーコード配列を含む、項目28に記載の方法。
(項目33)
前記リードカバレッジを決定するステップが、前記参照ゲノムへの前記配列決定リードの前記マッピングの位置および前記バーコード配列に基づき、前記配列決定リードを折り畳むステップを含む、項目32に記載の方法。
(項目34)
前記遺伝子座が、1種または複数の癌遺伝子を含む、先行する項目のいずれか一項に記載の方法。
(項目35)
前記被験体の生殖系列ゲノムがヘテロ接合性である前記ベースライン化遺伝子座内におけるバリアントの相対量を決定することにより、前記ベースライン化遺伝子座の少なくともサブセットが、前記被験体の前記腫瘍細胞においてコピー数変更を起こしたことを決定するステップをさらに含む、先行する項目のいずれか一項に記載の方法。
(項目36)
前記バリアントの前記相対量が、ほぼ等しいわけではない、項目35に記載の方法。
(項目37)
前記バリアントの前記相対量がほぼ等しいわけではない前記ベースライン化遺伝子座が、前記ベースライン化遺伝子座から除去され、これにより、アレル頻度補正されたベースライン化遺伝子座を提供する、項目36に記載の方法。
(項目38)
前記アレル頻度補正されたベースライン化遺伝子座が、先行する項目のいずれか一項に記載の方法において前記ベースライン化座位として使用される、項目37に記載の方法。
(項目39)
(a)メモリに、被験体の無細胞体液試料のデオキシリボ核酸(DNA)分子の配列決定リードを受け取るステップと、
(b)コンピュータプロセッサを用いてコードを実行して、次のステップ:
(i)前記配列リードから、複数の遺伝子座における遺伝子座毎に配列決定リードカバレッジ(「リードカバレッジ」)に関連する定量的尺度を含む第1のデータセットを生成するステップと、
(ii)飽和平衡補正およびプローブ効率補正を遂行することにより、前記第1のデータセットを補正するステップと、
(iii)前記第1のデータセットについてベースラインリードカバレッジを決定するステップであって、前記ベースラインリードカバレッジが、飽和平衡およびプローブ効率に関連する、ステップと、
(iv)前記ベースラインリードカバレッジと比べた前記複数の遺伝子座における遺伝子座毎のコピー数状態を決定するステップと
を遂行するステップと
を含む、方法。
(項目40)
(a)ネットワークと、
(b)前記ネットワークに接続された、核酸配列データを記憶するように構成されたコンピュータメモリを含むデータベースと、
(c)前記ネットワークに接続された、コンピュータメモリおよび1個または複数のコンピュータプロセッサを含むバイオインフォマティクスコンピュータと
を含むシステムであって、
前記コンピュータが、前記1個または複数のコンピュータプロセッサによって実行されると、前記データベースに記憶された前記核酸配列データをコピーし、前記コピーされたデータを前記バイオインフォマティクスコンピュータにおけるメモリに書き出し、以下:
(i)前記核酸配列データから、複数の遺伝子座における遺伝子座毎に配列決定リードカバレッジ(「リードカバレッジ」)に関連する定量的尺度を含む第1のデータセットを生成するステップと、
(ii)飽和平衡補正およびプローブ効率補正を遂行することにより、前記第1のデータセットを補正するステップと、
(iii)前記第1のデータセットについてベースラインリードカバレッジを決定するステップであって、前記ベースラインリードカバレッジが、飽和平衡およびプローブ効率に関連する、ステップと、
(iv)前記ベースラインリードカバレッジと比べた前記複数の遺伝子座における遺伝子座毎のコピー数状態を決定するステップと
を含むステップを遂行する、機械実行可能なコードをさらに含む、システム。
(項目41)
前記データベースが、核酸シーケンサーに接続されている、項目40に記載のシステム。
Claims (1)
- 図面に記載の発明。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562269051P | 2015-12-17 | 2015-12-17 | |
US62/269,051 | 2015-12-17 | ||
JP2018531350A JP2019507585A (ja) | 2015-12-17 | 2016-12-16 | 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法 |
PCT/US2016/067356 WO2017106768A1 (en) | 2015-12-17 | 2016-12-16 | Methods to determine tumor gene copy number by analysis of cell-free dna |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018531350A Division JP2019507585A (ja) | 2015-12-17 | 2016-12-16 | 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023126874A true JP2023126874A (ja) | 2023-09-12 |
Family
ID=59057742
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018531350A Withdrawn JP2019507585A (ja) | 2015-12-17 | 2016-12-16 | 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法 |
JP2021064099A Pending JP2021101732A (ja) | 2015-12-17 | 2021-04-05 | 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法 |
JP2023108348A Pending JP2023126874A (ja) | 2015-12-17 | 2023-06-30 | 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018531350A Withdrawn JP2019507585A (ja) | 2015-12-17 | 2016-12-16 | 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法 |
JP2021064099A Pending JP2021101732A (ja) | 2015-12-17 | 2021-04-05 | 無細胞dnaの分析による腫瘍遺伝子コピー数を決定するための方法 |
Country Status (7)
Country | Link |
---|---|
US (3) | US20170240973A1 (ja) |
EP (1) | EP3390668A4 (ja) |
JP (3) | JP2019507585A (ja) |
CN (2) | CN108603228B (ja) |
CA (1) | CA3008651A1 (ja) |
SG (1) | SG11201805119QA (ja) |
WO (1) | WO2017106768A1 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK3246416T3 (da) | 2011-04-15 | 2024-09-02 | Univ Johns Hopkins | Sikkert sekventeringssystem |
US9892230B2 (en) | 2012-03-08 | 2018-02-13 | The Chinese University Of Hong Kong | Size-based analysis of fetal or tumor DNA fraction in plasma |
CN109457030B (zh) | 2012-10-29 | 2022-02-18 | 约翰·霍普金斯大学 | 卵巢和子宫内膜癌的帕帕尼科拉乌测试 |
US10364467B2 (en) | 2015-01-13 | 2019-07-30 | The Chinese University Of Hong Kong | Using size and number aberrations in plasma DNA for detecting cancer |
US11286531B2 (en) | 2015-08-11 | 2022-03-29 | The Johns Hopkins University | Assaying ovarian cyst fluid |
US20190287645A1 (en) * | 2016-07-06 | 2019-09-19 | Guardant Health, Inc. | Methods for fragmentome profiling of cell-free nucleic acids |
US9850523B1 (en) | 2016-09-30 | 2017-12-26 | Guardant Health, Inc. | Methods for multi-resolution analysis of cell-free nucleic acids |
AU2017336153B2 (en) | 2016-09-30 | 2023-07-13 | Guardant Health, Inc. | Methods for multi-resolution analysis of cell-free nucleic acids |
EP3559841A1 (en) * | 2016-12-22 | 2019-10-30 | Grail, Inc. | Base coverage normalization and use thereof in detecting copy number variation |
SG11202001010UA (en) | 2017-08-07 | 2020-03-30 | Univ Johns Hopkins | Methods and materials for assessing and treating cancer |
CN111278993A (zh) * | 2017-09-15 | 2020-06-12 | 加利福尼亚大学董事会 | 从无细胞核酸中检测体细胞单核苷酸变体并应用于微小残留病变监测 |
AU2019249422A1 (en) | 2018-04-02 | 2020-10-15 | Grail, Llc | Methylation markers and targeted methylation probe panels |
EP3801623A4 (en) | 2018-06-01 | 2022-03-23 | Grail, LLC | NEURAL CONVOLUTIONAL NETWORK SYSTEMS AND DATA CLASSIFICATION METHODS |
CA3111887A1 (en) | 2018-09-27 | 2020-04-02 | Grail, Inc. | Methylation markers and targeted methylation probe panel |
SG11202103486YA (en) * | 2018-10-31 | 2021-05-28 | Guardant Health Inc | Methods, compositions and systems for calibrating epigenetic partitioning assays |
CN110232951B (zh) * | 2018-12-06 | 2023-08-01 | 苏州金唯智生物科技有限公司 | 判断测序数据饱和的方法、计算机可读介质和应用 |
US11581062B2 (en) | 2018-12-10 | 2023-02-14 | Grail, Llc | Systems and methods for classifying patients with respect to multiple cancer classes |
WO2020160414A1 (en) | 2019-01-31 | 2020-08-06 | Guardant Health, Inc. | Compositions and methods for isolating cell-free dna |
EP3938534A4 (en) * | 2019-03-13 | 2023-03-29 | Grail, LLC | SYSTEMS AND METHODS FOR ENRICHMENT OF CANCER DERIVED FRAGMENTS USING FRAGMENT SIZE |
US11211147B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing |
US11211144B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Methods and systems for refining copy number variation in a liquid biopsy assay |
US11475981B2 (en) | 2020-02-18 | 2022-10-18 | Tempus Labs, Inc. | Methods and systems for dynamic variant thresholding in a liquid biopsy assay |
WO2023282916A1 (en) | 2021-07-09 | 2023-01-12 | Guardant Health, Inc. | Methods of detecting genomic rearrangements using cell free nucleic acids |
EP4407042A3 (en) | 2020-07-10 | 2024-09-18 | Guardant Health, Inc. | Methods of detecting genomic rearrangements using cell free nucleic acids |
EP4205126A1 (en) | 2020-08-25 | 2023-07-05 | Guardant Health, Inc. | Methods and systems for predicting an origin of a variant |
JP2024512372A (ja) | 2021-03-09 | 2024-03-19 | ガーダント ヘルス, インコーポレイテッド | オフターゲットポリヌクレオチド配列決定データに基づく腫瘍の存在の検出 |
WO2023023402A2 (en) | 2021-08-20 | 2023-02-23 | Guardant Health, Inc. | Methods for simultaneous molecular and sample barcoding |
WO2023150633A2 (en) | 2022-02-02 | 2023-08-10 | Guardant Health, Inc. | Multifunctional primers for paired sequencing reads |
US20240052419A1 (en) * | 2022-08-10 | 2024-02-15 | Guardant Health, Inc. | Methods and systems for detecting genetic variants |
Family Cites Families (287)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4725536A (en) | 1985-09-19 | 1988-02-16 | Genetics Institute, Inc. | Reagent polynucleotide complex with multiple target binding regions, and kit and methods |
US6150517A (en) | 1986-11-24 | 2000-11-21 | Gen-Probe | Methods for making oligonucleotide probes for the detection and/or quantitation of non-viral organisms |
US5149625A (en) | 1987-08-11 | 1992-09-22 | President And Fellows Of Harvard College | Multiplex analysis of DNA |
US4942124A (en) | 1987-08-11 | 1990-07-17 | President And Fellows Of Harvard College | Multiplex sequencing |
US5124246A (en) | 1987-10-15 | 1992-06-23 | Chiron Corporation | Nucleic acid multimers and amplified nucleic acid hybridization assays using same |
US5656731A (en) | 1987-10-15 | 1997-08-12 | Chiron Corporation | Nucleic acid-amplified immunoassay probes |
US5143854A (en) | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
US5744101A (en) | 1989-06-07 | 1998-04-28 | Affymax Technologies N.V. | Photolabile nucleoside protecting groups |
US6551784B2 (en) | 1989-06-07 | 2003-04-22 | Affymetrix Inc | Method of comparing nucleic acid sequences |
US6040138A (en) | 1995-09-15 | 2000-03-21 | Affymetrix, Inc. | Expression monitoring by hybridization to high density oligonucleotide arrays |
US5925525A (en) | 1989-06-07 | 1999-07-20 | Affymetrix, Inc. | Method of identifying nucleotide differences |
US5800992A (en) | 1989-06-07 | 1998-09-01 | Fodor; Stephen P.A. | Method of detecting nucleic acids |
US5424186A (en) | 1989-06-07 | 1995-06-13 | Affymax Technologies N.V. | Very large scale immobilized polymer synthesis |
US5871928A (en) | 1989-06-07 | 1999-02-16 | Fodor; Stephen P. A. | Methods for nucleic acid analysis |
US6309822B1 (en) | 1989-06-07 | 2001-10-30 | Affymetrix, Inc. | Method for comparing copy number of nucleic acid sequences |
US5200314A (en) | 1990-03-23 | 1993-04-06 | Chiron Corporation | Polynucleotide capture assay employing in vitro amplification |
DE69132843T2 (de) | 1990-12-06 | 2002-09-12 | Affymetrix, Inc. (N.D.Ges.D.Staates Delaware) | Identifizierung von Nukleinsäuren in Proben |
US6582908B2 (en) | 1990-12-06 | 2003-06-24 | Affymetrix, Inc. | Oligonucleotides |
US5981179A (en) | 1991-11-14 | 1999-11-09 | Digene Diagnostics, Inc. | Continuous amplification reaction |
US5424413A (en) | 1992-01-22 | 1995-06-13 | Gen-Probe Incorporated | Branched nucleic acid probes |
US5573905A (en) | 1992-03-30 | 1996-11-12 | The Scripps Research Institute | Encoded combinatorial chemical libraries |
US6020124A (en) | 1992-04-27 | 2000-02-01 | Trustees Of Dartmouth College | Detection of soluble gene sequences in biological fluids |
US5981176A (en) | 1992-06-17 | 1999-11-09 | City Of Hope | Method of detecting and discriminating between nucleic acid sequences |
JP3954092B2 (ja) | 1993-06-25 | 2007-08-08 | アフィメトリックス インコーポレイテッド | 核酸配列のハイブリダイゼーションと配列決定 |
US5500356A (en) | 1993-08-10 | 1996-03-19 | Life Technologies, Inc. | Method of nucleic acid sequence selection |
US6309823B1 (en) | 1993-10-26 | 2001-10-30 | Affymetrix, Inc. | Arrays of nucleic acid probes for analyzing biotransformation genes and methods of using the same |
US5681697A (en) | 1993-12-08 | 1997-10-28 | Chiron Corporation | Solution phase nucleic acid sandwich assays having reduced background noise and kits therefor |
CH686982A5 (fr) | 1993-12-16 | 1996-08-15 | Maurice Stroun | Méthode pour le diagnostic de cancers. |
US20030017081A1 (en) | 1994-02-10 | 2003-01-23 | Affymetrix, Inc. | Method and apparatus for imaging a sample on a device |
US5714330A (en) | 1994-04-04 | 1998-02-03 | Lynx Therapeutics, Inc. | DNA sequencing by stepwise ligation and cleavage |
US5846719A (en) | 1994-10-13 | 1998-12-08 | Lynx Therapeutics, Inc. | Oligonucleotide tags for sorting and identification |
US5604097A (en) | 1994-10-13 | 1997-02-18 | Spectragen, Inc. | Methods for sorting polynucleotides using oligonucleotide tags |
US5695934A (en) | 1994-10-13 | 1997-12-09 | Lynx Therapeutics, Inc. | Massively parallel sequencing of sorted polynucleotides |
US6013445A (en) | 1996-06-06 | 2000-01-11 | Lynx Therapeutics, Inc. | Massively parallel signature sequencing by ligation of encoded adaptors |
US6600996B2 (en) | 1994-10-21 | 2003-07-29 | Affymetrix, Inc. | Computer-aided techniques for analyzing biological sequences |
EP0709466B1 (en) | 1994-10-28 | 2006-09-27 | Gen-Probe Incorporated | Compositions and methods for the simultaneous detection and quantification of multiple specific nucleic acid sequences |
US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
US5648245A (en) | 1995-05-09 | 1997-07-15 | Carnegie Institution Of Washington | Method for constructing an oligonucleotide concatamer library by rolling circle replication |
US5968740A (en) | 1995-07-24 | 1999-10-19 | Affymetrix, Inc. | Method of Identifying a Base in a Nucleic Acid |
GB9516636D0 (en) | 1995-08-14 | 1995-10-18 | Univ London | In-situ nucleic acid amplification and detection |
US5763175A (en) | 1995-11-17 | 1998-06-09 | Lynx Therapeutics, Inc. | Simultaneous sequencing of tagged polynucleotides |
US5854033A (en) | 1995-11-21 | 1998-12-29 | Yale University | Rolling circle replication reporter systems |
WO1997034015A1 (en) | 1996-03-15 | 1997-09-18 | The Penn State Research Foundation | Detection of extracellular tumor-associated nucleic acid in blood plasma or serum using nucleic acid amplification assays |
DE69739909D1 (de) | 1996-03-26 | 2010-07-29 | Michael S Kopreski | Methoden aus plasma oder serum extrahierte extrazelluraere rna zur diagnoseüberwachung oder evaluation von krebs verwenden |
US6458530B1 (en) | 1996-04-04 | 2002-10-01 | Affymetrix Inc. | Selecting tag nucleic acids |
US6300077B1 (en) | 1996-08-14 | 2001-10-09 | Exact Sciences Corporation | Methods for the detection of nucleic acids |
GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
US5935793A (en) | 1996-09-27 | 1999-08-10 | The Chinese University Of Hong Kong | Parallel polynucleotide sequencing method using tagged primers |
US6124092A (en) | 1996-10-04 | 2000-09-26 | The Perkin-Elmer Corporation | Multiplex polynucleotide capture methods and compositions |
US6117631A (en) | 1996-10-29 | 2000-09-12 | Polyprobe, Inc. | Detection of antigens via oligonucleotide antibody conjugates |
US6046005A (en) | 1997-01-15 | 2000-04-04 | Incyte Pharmaceuticals, Inc. | Nucleic acid sequencing with solid phase capturable terminators comprising a cleavable linking group |
CA2291180A1 (en) | 1997-05-23 | 1998-11-26 | Lynx Therapeutics, Inc. | System and apparatus for sequential processing of analytes |
WO1999028505A1 (en) | 1997-12-03 | 1999-06-10 | Curagen Corporation | Methods and devices for measuring differential gene expression |
US6054276A (en) | 1998-02-23 | 2000-04-25 | Macevicz; Stephen C. | DNA restriction site mapping |
US6787308B2 (en) | 1998-07-30 | 2004-09-07 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
AU5584999A (en) | 1998-08-28 | 2000-03-21 | Invitrogen Corporation | System for the rapid manipulation of nucleic acid sequences |
WO2000014282A1 (en) | 1998-09-04 | 2000-03-16 | Lynx Therapeutics, Inc. | Method of screening for genetic polymorphism |
US6503718B2 (en) | 1999-01-10 | 2003-01-07 | Exact Sciences Corporation | Methods for detecting mutations using primer extension for detecting disease |
GB9901475D0 (en) | 1999-01-22 | 1999-03-17 | Pyrosequencing Ab | A method of DNA sequencing |
US6573053B1 (en) | 1999-02-05 | 2003-06-03 | Amersham Biosciences Uk Limited | Analysis method |
US6629040B1 (en) | 1999-03-19 | 2003-09-30 | University Of Washington | Isotope distribution encoded tags for protein identification |
JP2002539849A (ja) | 1999-03-26 | 2002-11-26 | ホワイトヘッド インスチチュート フォアー バイオメディカル リサーチ | ユニバーサルアレイ |
ES2269129T3 (es) | 1999-04-09 | 2007-04-01 | Exact Sciences Corporation | Procedimientos para detectar acidos nucleicos reveladores de cancer. |
US6355431B1 (en) | 1999-04-20 | 2002-03-12 | Illumina, Inc. | Detection of nucleic acid amplification reactions using bead arrays |
EP1046717B1 (en) | 1999-04-20 | 2010-10-06 | National Institute of Advanced Industrial Science and Technology | Method and probes for determining a concentration of target nucleic acid molecules and method for analyzing data obtained by the method |
US6242186B1 (en) | 1999-06-01 | 2001-06-05 | Oy Jurilab Ltd. | Method for detecting a risk of cancer and coronary heart disease and kit therefor |
US6818395B1 (en) | 1999-06-28 | 2004-11-16 | California Institute Of Technology | Methods and apparatus for analyzing polynucleotide sequences |
US6326148B1 (en) | 1999-07-12 | 2001-12-04 | The Regents Of The University Of California | Detection of copy number changes in colon cancer |
US6440706B1 (en) | 1999-08-02 | 2002-08-27 | Johns Hopkins University | Digital amplification |
US6849403B1 (en) | 1999-09-08 | 2005-02-01 | Exact Sciences Corporation | Apparatus and method for drug screening |
US6586177B1 (en) | 1999-09-08 | 2003-07-01 | Exact Sciences Corporation | Methods for disease detection |
WO2001023610A2 (en) | 1999-09-29 | 2001-04-05 | Solexa Ltd. | Polynucleotide sequencing |
US7368233B2 (en) | 1999-12-07 | 2008-05-06 | Exact Sciences Corporation | Methods of screening for lung neoplasm based on stool samples containing a nucleic acid marker indicative of a neoplasm |
US6489114B2 (en) | 1999-12-17 | 2002-12-03 | Bio Merieux | Process for labeling a ribonucleic acid, and labeled RNA fragments which are obtained thereby |
DK1259643T3 (da) | 2000-02-07 | 2009-02-23 | Illumina Inc | Fremgangsmåde til detektion af nukleinsyre ved anvendelse af universel priming |
GB2364054B (en) | 2000-03-24 | 2002-05-29 | Smithkline Beecham Corp | Method of amplifying quinolone-resistance-determining-regions and identifying polymorphic variants thereof |
US20030207300A1 (en) | 2000-04-28 | 2003-11-06 | Matray Tracy J. | Multiplex analytical platform using molecular tags |
EP1158055A1 (fr) | 2000-05-26 | 2001-11-28 | Xu Qi University of Teaxs Laboratoire de Leucémie Chen | Méthode pour le diagnostic de cancers |
ATE380883T1 (de) | 2000-10-24 | 2007-12-15 | Univ Leland Stanford Junior | Direkte multiplex charakterisierung von genomischer dna |
US20020142345A1 (en) | 2000-12-22 | 2002-10-03 | Nelsen Anita J. | Methods for encoding and decoding complex mixtures in arrayed assays |
US20030049616A1 (en) | 2001-01-08 | 2003-03-13 | Sydney Brenner | Enzymatic synthesis of oligonucleotide tags |
JP5073888B2 (ja) | 2001-03-28 | 2012-11-14 | 花王株式会社 | 静電荷像現像用トナー |
CA2344599C (en) | 2001-05-07 | 2011-07-12 | Bioneer Corporation | Selective polymerase chain reaction of dna of which base sequence is completely unknown |
US7406385B2 (en) | 2001-10-25 | 2008-07-29 | Applera Corporation | System and method for consensus-calling with per-base quality values for sample assemblies |
DK1342794T3 (da) | 2002-03-05 | 2006-04-24 | Epigenomics Ag | Fremgangsmåde og anordning til at bestemme vævsspecificitet af fritflydende DNA i legemsvæsker |
US20030186251A1 (en) | 2002-04-01 | 2003-10-02 | Brookhaven Science Associates, Llc | Genome sequence tags |
US7727720B2 (en) | 2002-05-08 | 2010-06-01 | Ravgen, Inc. | Methods for detection of genetic disorders |
CA2505472A1 (en) | 2002-11-11 | 2004-05-27 | Affymetrix, Inc. | Methods for identifying dna copy number changes |
US10229244B2 (en) | 2002-11-11 | 2019-03-12 | Affymetrix, Inc. | Methods for identifying DNA copy number changes using hidden markov model based estimations |
US7822555B2 (en) | 2002-11-11 | 2010-10-26 | Affymetrix, Inc. | Methods for identifying DNA copy number changes |
US7704687B2 (en) | 2002-11-15 | 2010-04-27 | The Johns Hopkins University | Digital karyotyping |
US20040209299A1 (en) | 2003-03-07 | 2004-10-21 | Rubicon Genomics, Inc. | In vitro DNA immortalization and whole genome amplification using libraries generated from randomly fragmented DNA |
US20040259118A1 (en) | 2003-06-23 | 2004-12-23 | Macevicz Stephen C. | Methods and compositions for nucleic acid sequence analysis |
EP1641809B2 (en) | 2003-07-05 | 2018-10-03 | The Johns Hopkins University | Method and compositions for detection and enumeration of genetic variations |
DE60328193D1 (de) | 2003-10-16 | 2009-08-13 | Sequenom Inc | Nicht invasiver Nachweis fötaler genetischer Merkmale |
DE10348407A1 (de) | 2003-10-17 | 2005-05-19 | Widschwendter, Martin, Prof. | Prognostische und diagnostische Marker für Zell-proliferative Erkrankungen von Brustgeweben |
US20070111233A1 (en) | 2003-10-30 | 2007-05-17 | Bianchi Diana W | Prenatal diagnosis using cell-free fetal DNA in amniotic fluid |
EP2202322A1 (en) | 2003-10-31 | 2010-06-30 | AB Advanced Genetic Analysis Corporation | Methods for producing a paired tag from a nucleic acid sequence and methods of use thereof |
EP1709203A2 (en) | 2004-01-23 | 2006-10-11 | Lingvitae AS | Improving polynucleotide ligation reactions |
ATE451478T1 (de) | 2004-02-12 | 2009-12-15 | Population Genetics Technologi | Genetische analyse mittels sequenzspezifischem sortieren |
US20060046258A1 (en) | 2004-02-27 | 2006-03-02 | Lapidus Stanley N | Applications of single molecule sequencing |
US20100216153A1 (en) | 2004-02-27 | 2010-08-26 | Helicos Biosciences Corporation | Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities |
US20050250147A1 (en) | 2004-05-10 | 2005-11-10 | Macevicz Stephen C | Digital profiling of polynucleotide populations |
US7276720B2 (en) | 2004-07-19 | 2007-10-02 | Helicos Biosciences Corporation | Apparatus and methods for analyzing samples |
US20060035258A1 (en) | 2004-08-06 | 2006-02-16 | Affymetrix, Inc. | Methods for identifying DNA copy number changes |
US7937225B2 (en) | 2004-09-03 | 2011-05-03 | New York University | Systems, methods and software arrangements for detection of genome copy number variation |
EP1647600A3 (en) | 2004-09-17 | 2006-06-28 | Affymetrix, Inc. (A US Entity) | Methods for identifying biological samples by addition of nucleic acid bar-code tags |
WO2006047787A2 (en) | 2004-10-27 | 2006-05-04 | Exact Sciences Corporation | Method for monitoring disease progression or recurrence |
US7424371B2 (en) | 2004-12-21 | 2008-09-09 | Helicos Biosciences Corporation | Nucleic acid analysis |
US7393665B2 (en) | 2005-02-10 | 2008-07-01 | Population Genetics Technologies Ltd | Methods and compositions for tagging and identifying polynucleotides |
ITRM20050068A1 (it) | 2005-02-17 | 2006-08-18 | Istituto Naz Per Le Malattie I | Metodo per la rivelazione di acidi nucleici di agenti patogeni batterici o di parassiti nelle urine. |
EP1856293A2 (en) | 2005-03-16 | 2007-11-21 | Compass Genetics, Llc | Methods and compositions for assay readouts on multiple analytical platforms |
EP2518161A1 (en) | 2005-03-18 | 2012-10-31 | Fluidigm Corporation | Method for detection of mutant alleles |
EP1712639B1 (en) | 2005-04-06 | 2008-08-27 | Maurice Stroun | Method for the diagnosis of cancer by detecting circulating DNA and RNA |
WO2007145612A1 (en) | 2005-06-06 | 2007-12-21 | 454 Life Sciences Corporation | Paired end sequencing |
US20070020640A1 (en) | 2005-07-21 | 2007-01-25 | Mccloskey Megan L | Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis |
US7666593B2 (en) | 2005-08-26 | 2010-02-23 | Helicos Biosciences Corporation | Single molecule sequencing of captured nucleic acids |
EP1929039B2 (en) | 2005-09-29 | 2013-11-20 | Keygene N.V. | High throughput screening of mutagenized populations |
US7329860B2 (en) | 2005-11-23 | 2008-02-12 | Illumina, Inc. | Confocal imaging methods and apparatus |
US7537897B2 (en) | 2006-01-23 | 2009-05-26 | Population Genetics Technologies, Ltd. | Molecular counting |
US20070172839A1 (en) | 2006-01-24 | 2007-07-26 | Smith Douglas R | Asymmetrical adapters and methods of use thereof |
US8383338B2 (en) | 2006-04-24 | 2013-02-26 | Roche Nimblegen, Inc. | Methods and systems for uniform enrichment of genomic regions |
US7702468B2 (en) | 2006-05-03 | 2010-04-20 | Population Diagnostics, Inc. | Evaluating genetic disorders |
IL282783B2 (en) | 2006-05-18 | 2023-09-01 | Caris Mpi Inc | A system and method for determining a personalized medical intervention for a disease stage |
WO2008111990A1 (en) | 2006-06-14 | 2008-09-18 | Cellpoint Diagnostics, Inc. | Rare cell analysis using sample splitting and dna tags |
FR2904833A1 (fr) | 2006-08-11 | 2008-02-15 | Bioquanta Sarl | Procede de dosage d'acide nuclieque par fluorescence |
US7754429B2 (en) | 2006-10-06 | 2010-07-13 | Illumina Cambridge Limited | Method for pair-wise sequencing a plurity of target polynucleotides |
US8603749B2 (en) | 2006-11-15 | 2013-12-10 | Biospherex, LLC | Multitag sequencing ecogenomics analysis-US |
WO2008070144A2 (en) | 2006-12-06 | 2008-06-12 | Duke University | Imprinted genes and disease |
US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
CN101711284A (zh) | 2007-01-25 | 2010-05-19 | 达娜-法勃肿瘤研究所 | 抗egfr抗体在治疗egfr突变体介导的疾病中的用途 |
ATE521948T1 (de) | 2007-01-26 | 2011-09-15 | Illumina Inc | System und verfahren zur nukleinsäuresequenzierung |
TW200902553A (en) | 2007-03-13 | 2009-01-16 | Amgen Inc | K-ras mutations and anti-EGFr antibody therapy |
WO2008148072A2 (en) | 2007-05-24 | 2008-12-04 | The Brigham And Women's Hospital, Inc. | Disease-associated genetic variations and methods for obtaining and using same |
CN101720359A (zh) | 2007-06-01 | 2010-06-02 | 454生命科学公司 | 从多重混合物中识别个别样本的系统和方法 |
EP2155855B1 (en) | 2007-06-06 | 2016-10-12 | Pacific Biosciences of California, Inc. | Methods and processes for calling bases in sequence by incorporation methods |
US20100112590A1 (en) | 2007-07-23 | 2010-05-06 | The Chinese University Of Hong Kong | Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment |
EA035451B9 (ru) | 2007-07-23 | 2020-09-09 | Те Чайниз Юниверсити Ов Гонконг | Способ диагностики рака с использованием геномного секвенирования |
US20090053719A1 (en) | 2007-08-03 | 2009-02-26 | The Chinese University Of Hong Kong | Analysis of nucleic acids by digital pcr |
BRPI0816393A2 (pt) | 2007-09-07 | 2015-03-03 | Fluidigm Corp | Método para determinar o número de cópias relativo de uma sequência de polinucleotídeo alvo em um genoma de um indivíduo |
WO2009085473A2 (en) | 2007-11-21 | 2009-07-09 | Cosmosid Inc. | Genome identification system |
MX2010008820A (es) | 2008-02-12 | 2010-09-07 | Novartis Ag | Metodo para aislar acidos nucleicos fetales o apoptoticos libres de celulas. |
US8216789B2 (en) | 2008-02-27 | 2012-07-10 | University Of Washington | Diagnostic panel of cancer antibodies and methods for use |
AU2009228312B2 (en) | 2008-03-26 | 2015-05-21 | Sequenom, Inc. | Restriction endonuclease enhanced polymorphic sequence detection |
EP2274449B1 (en) | 2008-03-28 | 2015-12-23 | Pacific Biosciences of California, Inc. | Methods for nucleic acid sequencing |
WO2009143379A2 (en) | 2008-05-21 | 2009-11-26 | Fred Hutchinson Cancer Research Center | Use of extracellular rna to measure disease |
US20090298709A1 (en) | 2008-05-28 | 2009-12-03 | Affymetrix, Inc. | Assays for determining telomere length and repeated sequence copy number |
DE102008025656B4 (de) | 2008-05-28 | 2016-07-28 | Genxpro Gmbh | Verfahren zur quantitativen Analyse von Nukleinsäuren, Marker dafür und deren Verwendung |
US20100041048A1 (en) | 2008-07-31 | 2010-02-18 | The Johns Hopkins University | Circulating Mutant DNA to Assess Tumor Dynamics |
US20100062494A1 (en) | 2008-08-08 | 2010-03-11 | President And Fellows Of Harvard College | Enzymatic oligonucleotide pre-adenylation |
US20100069250A1 (en) | 2008-08-16 | 2010-03-18 | The Board Of Trustees Of The Leland Stanford Junior University | Digital PCR Calibration for High Throughput Sequencing |
US8583380B2 (en) | 2008-09-05 | 2013-11-12 | Aueon, Inc. | Methods for stratifying and annotating cancer drug treatment options |
US8383345B2 (en) | 2008-09-12 | 2013-02-26 | University Of Washington | Sequence tag directed subassembly of short sequencing reads into long sequencing reads |
EP2952589B1 (en) | 2008-09-20 | 2018-02-14 | The Board of Trustees of The Leland Stanford Junior University | Noninvasive diagnosis of fetal aneuploidy by sequencing |
US20100301398A1 (en) | 2009-05-29 | 2010-12-02 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
US8546128B2 (en) | 2008-10-22 | 2013-10-01 | Life Technologies Corporation | Fluidics system for sequential delivery of reagents |
WO2010075188A2 (en) | 2008-12-23 | 2010-07-01 | Illumina Inc. | Multibase delivery for long reads in sequencing by synthesis protocols |
US20100323348A1 (en) | 2009-01-31 | 2010-12-23 | The Regents Of The University Of Colorado, A Body Corporate | Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process |
US20120165202A1 (en) | 2009-04-30 | 2012-06-28 | Good Start Genetics, Inc. | Methods and compositions for evaluating genetic markers |
WO2010127186A1 (en) | 2009-04-30 | 2010-11-04 | Prognosys Biosciences, Inc. | Nucleic acid constructs and methods of use |
US8673627B2 (en) | 2009-05-29 | 2014-03-18 | Life Technologies Corporation | Apparatus and methods for performing electrochemical reactions |
US8574835B2 (en) | 2009-05-29 | 2013-11-05 | Life Technologies Corporation | Scaffolded nucleic acid polymer particles and methods of making and using |
US20130143747A1 (en) | 2011-12-05 | 2013-06-06 | Myriad Genetics, Incorporated | Methods of detecting cancer |
US9524369B2 (en) | 2009-06-15 | 2016-12-20 | Complete Genomics, Inc. | Processing and analysis of complex nucleic acid sequence data |
RU2539032C2 (ru) | 2009-06-25 | 2015-01-10 | Фред Хатчинсон Кансэр Рисёч Сентер | Способ измерения искусственного иммунитета |
EP2456885A2 (en) | 2009-07-20 | 2012-05-30 | Bar Harbor Biotechnology, Inc. | Methods for assessing disease risk |
ES2564656T3 (es) | 2009-10-26 | 2016-03-28 | Lifecodexx Ag | Medios y métodos para el diagnóstico no invasivo de la aneuploidía cromosómica |
US9361426B2 (en) | 2009-11-12 | 2016-06-07 | Esoterix Genetic Laboratories, Llc | Copy number analysis of genetic locus |
US9023769B2 (en) | 2009-11-30 | 2015-05-05 | Complete Genomics, Inc. | cDNA library for nucleic acid sequencing |
US9752187B2 (en) | 2009-12-11 | 2017-09-05 | Nucleix | Categorization of DNA samples |
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
US9315857B2 (en) | 2009-12-15 | 2016-04-19 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse label-tags |
DK2516680T3 (en) | 2009-12-22 | 2016-05-02 | Sequenom Inc | Method and kits to identify aneuploidy |
AU2011207544A1 (en) | 2010-01-19 | 2012-09-06 | Verinata Health, Inc. | Identification of polymorphic sequences in mixtures of genomic DNA by whole genome sequencing |
US9260745B2 (en) | 2010-01-19 | 2016-02-16 | Verinata Health, Inc. | Detecting and classifying copy number variation |
US10388403B2 (en) | 2010-01-19 | 2019-08-20 | Verinata Health, Inc. | Analyzing copy number variation in the detection of cancer |
EP2848704B1 (en) | 2010-01-19 | 2018-08-29 | Verinata Health, Inc | Sequencing methods for prenatal diagnoses |
US20110177512A1 (en) | 2010-01-19 | 2011-07-21 | Predictive Biosciences, Inc. | Method for assuring amplification of an abnormal nucleic acid in a sample |
US20120100548A1 (en) * | 2010-10-26 | 2012-04-26 | Verinata Health, Inc. | Method for determining copy number variations |
US20120010085A1 (en) | 2010-01-19 | 2012-01-12 | Rava Richard P | Methods for determining fraction of fetal nucleic acids in maternal samples |
WO2011103236A2 (en) | 2010-02-18 | 2011-08-25 | The Johns Hopkins University | Personalized tumor biomarkers |
EP2547698B1 (en) | 2010-03-14 | 2015-07-29 | The Translational Genomics Research Institute | Methods of determining susceptibility of tumors to tyrosine kinase inhibitors |
CN101967517B (zh) | 2010-03-19 | 2012-11-07 | 黄乐群 | 一种无需借助pcr的基因检测方法 |
PL2558854T3 (pl) | 2010-04-16 | 2019-04-30 | Chronix Biomedical | Biomarkery będące krążącymi kwasami nukleinowymi związanymi z rakiem piersi |
WO2011140510A2 (en) | 2010-05-06 | 2011-11-10 | Bioo Scientific Corporation | Oligonucleotide ligation, barcoding and methods and compositions for improving data quality and throughput using massively parallel sequencing |
PL2576837T3 (pl) | 2010-06-04 | 2018-04-30 | Chronix Biomedical | Krążeniowe biomarkery typu kwasu nukleinowego związane z rakiem prostaty |
EP2580351B1 (en) | 2010-06-09 | 2018-08-29 | Keygene N.V. | Combinatorial sequence barcodes for high throughput screening |
EP2400035A1 (en) | 2010-06-28 | 2011-12-28 | Technische Universität München | Methods and compositions for diagnosing gastrointestinal stromal tumors |
WO2012006291A2 (en) | 2010-07-06 | 2012-01-12 | Life Technologies Corporation | Systems and methods to detect copy number variation |
US20120053073A1 (en) | 2010-07-23 | 2012-03-01 | President And Fellows Of Harvard College | Methods for Detecting Signatures of Disease or Conditions in Bodily Fluids |
CN104759297B (zh) | 2010-07-29 | 2018-02-23 | Toto株式会社 | 光催化剂涂装体和光催化剂涂覆液 |
EP2601609B1 (en) | 2010-08-02 | 2017-05-17 | Population Bio, Inc. | Compositions and methods for discovery of causative mutations in genetic disorders |
US11031095B2 (en) | 2010-08-06 | 2021-06-08 | Ariosa Diagnostics, Inc. | Assay systems for determination of fetal copy number variation |
US20120034603A1 (en) | 2010-08-06 | 2012-02-09 | Tandem Diagnostics, Inc. | Ligation-based detection of genetic variants |
EP2426217A1 (en) | 2010-09-03 | 2012-03-07 | Centre National de la Recherche Scientifique (CNRS) | Analytical methods for cell free nucleic acids and applications |
CA2811000A1 (en) | 2010-09-09 | 2012-03-15 | Traxxsson, Llc | Combination methods of diagnosing cancer in a patient |
EP2623613B8 (en) | 2010-09-21 | 2016-09-07 | Population Genetics Technologies Ltd. | Increasing confidence of allele calls with molecular counting |
WO2012042374A2 (en) | 2010-10-01 | 2012-04-05 | Anssi Jussi Nikolai Taipale | Method of determining number or concentration of molecules |
WO2012048341A1 (en) | 2010-10-08 | 2012-04-12 | President And Fellows Of Harvard College | High-throughput single cell barcoding |
US8725422B2 (en) | 2010-10-13 | 2014-05-13 | Complete Genomics, Inc. | Methods for estimating genome-wide copy number variations |
HUE039766T2 (hu) | 2010-10-22 | 2019-02-28 | Cold Spring Harbor Laboratory | Nukleinsavak változatainak megszámlálása genom kópiaszám információ megszerzésére |
WO2012066451A1 (en) | 2010-11-15 | 2012-05-24 | Pfizer Inc. | Prognostic and predictive gene signature for colon cancer |
KR102185244B1 (ko) | 2010-11-30 | 2020-12-02 | 더 차이니즈 유니버시티 오브 홍콩 | 암과 연관된 유전적 또는 분자적 이상들의 검출 |
AU2011348267A1 (en) | 2010-12-23 | 2013-08-01 | Sequenom, Inc. | Fetal genetic variation detection |
US9163281B2 (en) | 2010-12-23 | 2015-10-20 | Good Start Genetics, Inc. | Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction |
EP2659003A4 (en) | 2010-12-30 | 2014-05-21 | Foundation Medicine Inc | OPTIMIZATION OF MULTIGENIC ANALYSIS OF TUMOR SAMPLES |
US20140011694A1 (en) | 2011-01-11 | 2014-01-09 | Via Genomes, Inc. | Methods, systems, databases, kits and arrays for screening for and predicting the risk of an identifying the presence of tumors and cancers |
US20120190021A1 (en) | 2011-01-25 | 2012-07-26 | Aria Diagnostics, Inc. | Detection of genetic abnormalities |
WO2012106559A1 (en) | 2011-02-02 | 2012-08-09 | Translational Genomics Research Institute | Biomarkers and methods of use thereof |
JP6153874B2 (ja) | 2011-02-09 | 2017-06-28 | ナテラ, インコーポレイテッド | 非侵襲的出生前倍数性呼び出しのための方法 |
WO2012109500A2 (en) * | 2011-02-09 | 2012-08-16 | Bio-Rad Laboratories, Inc. | Analysis of nucleic acids |
US20120238464A1 (en) | 2011-03-18 | 2012-09-20 | Baylor Research Institute | Biomarkers for Predicting the Recurrence of Colorectal Cancer Metastasis |
WO2012129363A2 (en) | 2011-03-24 | 2012-09-27 | President And Fellows Of Harvard College | Single cell nucleic acid detection and analysis |
AU2012236200B2 (en) | 2011-03-30 | 2015-05-14 | Verinata Health, Inc. | Method for verifying bioassay samples |
US9411937B2 (en) | 2011-04-15 | 2016-08-09 | Verinata Health, Inc. | Detecting and classifying copy number variation |
DK3246416T3 (da) | 2011-04-15 | 2024-09-02 | Univ Johns Hopkins | Sikkert sekventeringssystem |
WO2012149042A2 (en) | 2011-04-25 | 2012-11-01 | Bio-Rad Laboratories, Inc. | Methods and compositions for nucleic acid analysis |
JP6669430B2 (ja) | 2011-05-06 | 2020-03-18 | ニユー・イングランド・バイオレイブス・インコーポレイテツド | ライゲーションの促進 |
SG10201605049QA (en) | 2011-05-20 | 2016-07-28 | Fluidigm Corp | Nucleic acid encoding reactions |
US9752176B2 (en) | 2011-06-15 | 2017-09-05 | Ginkgo Bioworks, Inc. | Methods for preparative in vitro cloning |
WO2013019075A2 (ko) | 2011-08-01 | 2013-02-07 | 연세대학교산학협력단 | 핵산분자의 제조방법 |
US10704164B2 (en) | 2011-08-31 | 2020-07-07 | Life Technologies Corporation | Methods, systems, computer readable media, and kits for sample identification |
WO2013033721A1 (en) | 2011-09-02 | 2013-03-07 | Atreca, Inc. | Dna barcodes for multiplexed sequencing |
US8712697B2 (en) | 2011-09-07 | 2014-04-29 | Ariosa Diagnostics, Inc. | Determination of copy number variations using binomial probability calculations |
US20130079241A1 (en) | 2011-09-15 | 2013-03-28 | Jianhua Luo | Methods for Diagnosing Prostate Cancer and Predicting Prostate Cancer Relapse |
US10424394B2 (en) | 2011-10-06 | 2019-09-24 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US9367663B2 (en) | 2011-10-06 | 2016-06-14 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
WO2013052907A2 (en) | 2011-10-06 | 2013-04-11 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US20130102485A1 (en) | 2011-10-19 | 2013-04-25 | Inhan Lee | Method of Determining a Diseased State in a Subject |
EP2768985B1 (en) | 2011-10-21 | 2019-03-20 | Chronix Biomedical | Colorectal cancer associated circulating nucleic acid biomarkers |
NO3051026T3 (ja) | 2011-10-21 | 2018-07-28 | ||
US20130122499A1 (en) | 2011-11-14 | 2013-05-16 | Viomics, Inc. | System and method of detecting local copy number variation in dna samples |
US10214775B2 (en) | 2011-12-07 | 2019-02-26 | Chronix Biomedical | Prostate cancer associated circulating nucleic acid biomarkers |
KR101906254B1 (ko) | 2011-12-08 | 2018-10-10 | 파이브3 제노믹스, 엘엘씨 | Mdm2-포함 이중 소염색체들 및 그의 방법들 |
EP2802666B1 (en) | 2012-01-13 | 2018-09-19 | Data2Bio | Genotyping by next-generation sequencing |
SI3363901T1 (sl) | 2012-02-17 | 2021-04-30 | Fred Hutchinson Cancer Research Center | Sestavki in postopki za natančno identifikacijo mutacij |
US11177020B2 (en) | 2012-02-27 | 2021-11-16 | The University Of North Carolina At Chapel Hill | Methods and uses for molecular tags |
GB2513024B (en) | 2012-02-27 | 2016-08-31 | Cellular Res Inc | A clonal amplification method |
EP2820155B1 (en) | 2012-02-28 | 2017-07-26 | Population Genetics Technologies Ltd. | Method for attaching a counter sequence to a nucleic acid sample |
WO2013130791A1 (en) | 2012-02-29 | 2013-09-06 | Dana-Farber Cancer Institute, Inc. | Compositions, kits, and methods for the identification, assessment, prevention, and therapy of cancer |
US9892230B2 (en) | 2012-03-08 | 2018-02-13 | The Chinese University Of Hong Kong | Size-based analysis of fetal or tumor DNA fraction in plasma |
WO2013138510A1 (en) | 2012-03-13 | 2013-09-19 | Patel Abhijit Ajit | Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing |
WO2013142213A1 (en) | 2012-03-20 | 2013-09-26 | Wake Forest University Health Sciences | Methods, systems, and computer readable media for tracking and verifying receipt of contents of a delivery within an organization |
PT2828218T (pt) | 2012-03-20 | 2020-11-11 | Univ Washington Through Its Center For Commercialization | Métodos para baixar a taxa de erro da sequenciação paralela massiva de adn utilizando sequenciação duplex de consensus |
US10053729B2 (en) | 2012-03-26 | 2018-08-21 | The Johns Hopkins University | Rapid aneuploidy detection |
US8209130B1 (en) | 2012-04-04 | 2012-06-26 | Good Start Genetics, Inc. | Sequence assembly |
CN107435070A (zh) * | 2012-04-12 | 2017-12-05 | 维里纳塔健康公司 | 拷贝数变异的检测和分类 |
EP3741871A3 (en) | 2012-04-19 | 2021-02-17 | The Medical College of Wisconsin, Inc. | Highly sensitive surveillance using detection of cell free dna |
CN104428425A (zh) * | 2012-05-04 | 2015-03-18 | 考利达基因组股份有限公司 | 测定复杂肿瘤全基因组绝对拷贝数变异的方法 |
US20150132754A1 (en) | 2012-05-14 | 2015-05-14 | Cb Biotechnologies, Inc. | Method for increasing accuracy in quantitative detection of polynucleotides |
WO2013181170A1 (en) | 2012-05-31 | 2013-12-05 | Board Of Regents, The University Of Texas System | Method for accurate sequencing of dna |
WO2013188471A2 (en) | 2012-06-11 | 2013-12-19 | Sequenta, Inc. | Method of sequence determination using sequence tags |
US11261494B2 (en) | 2012-06-21 | 2022-03-01 | The Chinese University Of Hong Kong | Method of measuring a fractional concentration of tumor DNA |
WO2014004726A1 (en) | 2012-06-26 | 2014-01-03 | Caifu Chen | Methods, compositions and kits for the diagnosis, prognosis and monitoring of cancer |
WO2014014497A1 (en) | 2012-07-20 | 2014-01-23 | Verinata Health, Inc. | Detecting and classifying copy number variation in a cancer genome |
US20140066317A1 (en) | 2012-09-04 | 2014-03-06 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
EP2893040B1 (en) | 2012-09-04 | 2019-01-02 | Guardant Health, Inc. | Methods to detect rare mutations and copy number variation |
US20160040229A1 (en) | 2013-08-16 | 2016-02-11 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
WO2014093330A1 (en) | 2012-12-10 | 2014-06-19 | Clearfork Bioscience, Inc. | Methods for targeted genomic analysis |
US20140337052A1 (en) | 2013-01-05 | 2014-11-13 | Foundation Medicine, Inc. | System and method for outcome tracking and analysis |
EP3939614A1 (en) | 2013-01-18 | 2022-01-19 | Foundation Medicine, Inc. | Methods of treating cholangiocarcinoma |
WO2014152990A1 (en) | 2013-03-14 | 2014-09-25 | University Of Rochester | System and method for detecting population variation from nucleic acid sequencing data |
CA3156663A1 (en) | 2013-03-15 | 2014-09-18 | Verinata Health, Inc. | Generating cell-free dna libraries directly from blood |
GB2584364A (en) | 2013-03-15 | 2020-12-02 | Abvitro Llc | Single cell bar-coding for antibody discovery |
US20160032396A1 (en) | 2013-03-15 | 2016-02-04 | The Board Of Trustees Of The Leland Stanford Junior University | Identification and Use of Circulating Nucleic Acid Tumor Markers |
WO2014151511A2 (en) | 2013-03-15 | 2014-09-25 | Abbott Molecular Inc. | Systems and methods for detection of genomic copy number changes |
CN105408496A (zh) | 2013-03-15 | 2016-03-16 | 夸登特健康公司 | 检测稀有突变和拷贝数变异的系统和方法 |
CN105074009B (zh) | 2013-03-19 | 2017-09-26 | 凸版印刷株式会社 | Egfr抑制剂的敏感性的预测方法 |
LT2981921T (lt) * | 2013-04-03 | 2023-02-27 | Sequenom, Inc. | Neinvazinio genetinių variacijų vertinimo būdai ir procesai |
EP4321628A3 (en) | 2013-05-23 | 2024-04-24 | The Board of Trustees of the Leland Stanford Junior University | Transposition into native chromatin for personal epigenomics |
JP2015096049A (ja) | 2013-11-15 | 2015-05-21 | 凸版印刷株式会社 | Vegf阻害剤長期奏功性予測方法 |
JP6571665B2 (ja) * | 2013-12-28 | 2019-09-04 | ガーダント ヘルス, インコーポレイテッド | 遺伝的バリアントを検出するための方法およびシステム |
CN106574296B (zh) | 2014-04-14 | 2021-03-02 | 耶路撒冷希伯来大学伊森姆研究发展公司 | 用于测定dna的组织或细胞来源的方法和试剂盒 |
EP3143163B1 (en) | 2014-05-13 | 2020-11-25 | Board of Regents, The University of Texas System | Gene mutations and copy number alterations of egfr, kras and met |
US10318704B2 (en) * | 2014-05-30 | 2019-06-11 | Verinata Health, Inc. | Detecting fetal sub-chromosomal aneuploidies |
AU2015292311B2 (en) | 2014-07-25 | 2022-01-20 | University Of Washington | Methods of determining tissues and/or cell types giving rise to cell-free DNA, and methods of identifying a disease or disorder using same |
SG11201700602WA (en) | 2014-07-25 | 2017-03-30 | Bgi Genomics Co Ltd | Method and device for determining a ratio of free nucleic acids in a biological sample and use thereof |
US20160053301A1 (en) | 2014-08-22 | 2016-02-25 | Clearfork Bioscience, Inc. | Methods for quantitative genetic analysis of cell free dna |
MX2017003189A (es) | 2014-09-10 | 2017-10-16 | Pathway Genomics Corp | Metodos de gestion de salud y bienestar y sistemas utiles para la practica de los mismos. |
US11085084B2 (en) | 2014-09-12 | 2021-08-10 | The Board Of Trustees Of The Leland Stanford Junior University | Identification and use of circulating nucleic acids |
EP3567120B1 (en) | 2014-12-12 | 2020-08-19 | Verinata Health, Inc. | Using cell-free dna fragment size to determine copy number variations |
ES2828279T3 (es) | 2014-12-31 | 2021-05-25 | Guardant Health Inc | Detección y tratamiento de enfermedades que muestran heterogeneidad celular de enfermedad y sistemas y métodos para comunicar los resultados de las pruebas |
US10364467B2 (en) | 2015-01-13 | 2019-07-30 | The Chinese University Of Hong Kong | Using size and number aberrations in plasma DNA for detecting cancer |
KR20170125044A (ko) | 2015-02-10 | 2017-11-13 | 더 차이니즈 유니버시티 오브 홍콩 | 암 스크리닝 및 태아 분석을 위한 돌연변이 검출법 |
US10844428B2 (en) | 2015-04-28 | 2020-11-24 | Illumina, Inc. | Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS) |
PT3387152T (pt) | 2015-12-08 | 2022-04-19 | Twinstrand Biosciences Inc | Adaptadores, métodos e composições melhorados para sequenciamento duplex |
WO2017181146A1 (en) | 2016-04-14 | 2017-10-19 | Guardant Health, Inc. | Methods for early detection of cancer |
-
2016
- 2016-12-16 WO PCT/US2016/067356 patent/WO2017106768A1/en active Application Filing
- 2016-12-16 CA CA3008651A patent/CA3008651A1/en active Pending
- 2016-12-16 CN CN201680081723.6A patent/CN108603228B/zh active Active
- 2016-12-16 CN CN202311131468.XA patent/CN117174167A/zh active Pending
- 2016-12-16 EP EP16876854.7A patent/EP3390668A4/en active Pending
- 2016-12-16 JP JP2018531350A patent/JP2019507585A/ja not_active Withdrawn
- 2016-12-16 SG SG11201805119QA patent/SG11201805119QA/en unknown
-
2017
- 2017-02-27 US US15/442,993 patent/US20170240973A1/en not_active Abandoned
-
2020
- 2020-01-08 US US16/737,819 patent/US11242569B2/en active Active
-
2021
- 2021-04-05 JP JP2021064099A patent/JP2021101732A/ja active Pending
- 2021-12-16 US US17/552,728 patent/US20220356527A1/en active Pending
-
2023
- 2023-06-30 JP JP2023108348A patent/JP2023126874A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2017106768A1 (en) | 2017-06-22 |
JP2021101732A (ja) | 2021-07-15 |
SG11201805119QA (en) | 2018-07-30 |
EP3390668A4 (en) | 2020-04-01 |
CA3008651A1 (en) | 2017-06-22 |
CN117174167A (zh) | 2023-12-05 |
US20200140960A1 (en) | 2020-05-07 |
EP3390668A1 (en) | 2018-10-24 |
JP2019507585A (ja) | 2019-03-22 |
US20220356527A1 (en) | 2022-11-10 |
CN108603228B (zh) | 2023-09-01 |
CN108603228A (zh) | 2018-09-28 |
US20170240973A1 (en) | 2017-08-24 |
US11242569B2 (en) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11242569B2 (en) | Methods to determine tumor gene copy number by analysis of cell-free DNA | |
CN111534580B (zh) | 用于检测遗传变异的方法和系统 | |
KR102393608B1 (ko) | 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법 | |
CN110914450B (zh) | 无细胞dna的体细胞来源或种系来源的鉴定 | |
JP7242644B2 (ja) | 体細胞および生殖細胞系統バリアントを鑑別するための方法およびシステム | |
US20240029890A1 (en) | Computational modeling of loss of function based on allelic frequency | |
JP2024056984A (ja) | エピジェネティック区画アッセイを較正するための方法、組成物およびシステム | |
EP4219763A2 (en) | Method for quantifying gene fusion dna | |
JP2024056939A (ja) | 生体試料のフィンガープリンティングのための方法 | |
JP2023060046A (ja) | 脱アミノ化に誘導される配列エラーの補正 | |
US20200075124A1 (en) | Methods and systems for detecting allelic imbalance in cell-free nucleic acid samples | |
US20220068433A1 (en) | Computational detection of copy number variation at a locus in the absence of direct measurement of the locus | |
WO2024173265A1 (en) | Characterization of whole genome duplication in a genomic cohort of over 14000 cell free dna samples | |
Uziela | Making microarray and RNA-seq gene expression data comparable |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240412 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240710 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240911 |