ES2893000T3 - Materiales de referencia celulares multiplex - Google Patents
Materiales de referencia celulares multiplex Download PDFInfo
- Publication number
- ES2893000T3 ES2893000T3 ES16871194T ES16871194T ES2893000T3 ES 2893000 T3 ES2893000 T3 ES 2893000T3 ES 16871194 T ES16871194 T ES 16871194T ES 16871194 T ES16871194 T ES 16871194T ES 2893000 T3 ES2893000 T3 ES 2893000T3
- Authority
- ES
- Spain
- Prior art keywords
- exon
- kmt2a
- nucleic acid
- subsequence
- cells
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000012925 reference material Substances 0.000 title claims description 38
- 230000001413 cellular effect Effects 0.000 title description 6
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 243
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 181
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 181
- 239000002773 nucleotide Substances 0.000 claims abstract description 166
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 162
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 133
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 102
- 210000004027 cell Anatomy 0.000 claims description 315
- 102100022103 Histone-lysine N-methyltransferase 2A Human genes 0.000 claims description 104
- 101001045846 Homo sapiens Histone-lysine N-methyltransferase 2A Proteins 0.000 claims description 104
- 102100033793 ALK tyrosine kinase receptor Human genes 0.000 claims description 72
- 101710168331 ALK tyrosine kinase receptor Proteins 0.000 claims description 72
- 239000000203 mixture Substances 0.000 claims description 70
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 53
- 108090000740 RNA-binding protein EWS Proteins 0.000 claims description 40
- 102000004229 RNA-binding protein EWS Human genes 0.000 claims description 40
- 102100035108 High affinity nerve growth factor receptor Human genes 0.000 claims description 33
- 101000596894 Homo sapiens High affinity nerve growth factor receptor Proteins 0.000 claims description 33
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 claims description 32
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 claims description 32
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 claims description 30
- 102100027842 Fibroblast growth factor receptor 3 Human genes 0.000 claims description 28
- 101710182396 Fibroblast growth factor receptor 3 Proteins 0.000 claims description 28
- 102100033080 Tropomyosin alpha-3 chain Human genes 0.000 claims description 26
- 101710091952 Tropomyosin alpha-3 chain Proteins 0.000 claims description 26
- 108700024394 Exon Proteins 0.000 claims description 24
- 101000813738 Homo sapiens Transcription factor ETV6 Proteins 0.000 claims description 24
- 102100039580 Transcription factor ETV6 Human genes 0.000 claims description 24
- 102100022927 Nuclear receptor coactivator 4 Human genes 0.000 claims description 22
- 239000012188 paraffin wax Substances 0.000 claims description 22
- 101001124571 Homo sapiens NT-3 growth factor receptor Proteins 0.000 claims description 21
- 102100029166 NT-3 growth factor receptor Human genes 0.000 claims description 21
- 102100022678 Nucleophosmin Human genes 0.000 claims description 21
- 108010025568 Nucleophosmin Proteins 0.000 claims description 21
- 108700039143 HMGA2 Proteins 0.000 claims description 20
- 102100028999 High mobility group protein HMGI-C Human genes 0.000 claims description 20
- 101150073387 Hmga2 gene Proteins 0.000 claims description 20
- 101001050559 Homo sapiens Kinesin-1 heavy chain Proteins 0.000 claims description 20
- 102100023422 Kinesin-1 heavy chain Human genes 0.000 claims description 20
- 102100030595 HLA class II histocompatibility antigen gamma chain Human genes 0.000 claims description 19
- 101001082627 Homo sapiens HLA class II histocompatibility antigen gamma chain Proteins 0.000 claims description 19
- 101000800847 Homo sapiens Protein TFG Proteins 0.000 claims description 18
- 102100033661 Protein TFG Human genes 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 17
- 206010028980 Neoplasm Diseases 0.000 claims description 16
- 108020004999 messenger RNA Proteins 0.000 claims description 16
- 108020004414 DNA Proteins 0.000 claims description 15
- 101000691578 Homo sapiens Zinc finger protein PLAG1 Proteins 0.000 claims description 14
- 102100026200 Zinc finger protein PLAG1 Human genes 0.000 claims description 14
- 239000013612 plasmid Substances 0.000 claims description 13
- 102100039563 ETS translocation variant 1 Human genes 0.000 claims description 12
- 101000813729 Homo sapiens ETS translocation variant 1 Proteins 0.000 claims description 12
- 101000997832 Homo sapiens Tyrosine-protein kinase JAK2 Proteins 0.000 claims description 12
- 102100033444 Tyrosine-protein kinase JAK2 Human genes 0.000 claims description 12
- -1 ribonucleotide triphosphates Chemical class 0.000 claims description 12
- 210000005260 human cell Anatomy 0.000 claims description 11
- 101150098999 pax8 gene Proteins 0.000 claims description 11
- 102100039578 ETS translocation variant 4 Human genes 0.000 claims description 10
- 101000813747 Homo sapiens ETS translocation variant 4 Proteins 0.000 claims description 10
- 101000601664 Homo sapiens Paired box protein Pax-8 Proteins 0.000 claims description 10
- 101000837845 Homo sapiens Transcription factor E3 Proteins 0.000 claims description 10
- 101000643895 Homo sapiens Ubiquitin carboxyl-terminal hydrolase 6 Proteins 0.000 claims description 10
- 108010016731 PPAR gamma Proteins 0.000 claims description 10
- 102100037502 Paired box protein Pax-8 Human genes 0.000 claims description 10
- 108091007568 SLC45A3 Proteins 0.000 claims description 10
- 102100037253 Solute carrier family 45 member 3 Human genes 0.000 claims description 10
- 102100028507 Transcription factor E3 Human genes 0.000 claims description 10
- 102100021015 Ubiquitin carboxyl-terminal hydrolase 6 Human genes 0.000 claims description 10
- 210000002381 plasma Anatomy 0.000 claims description 10
- 102000004169 proteins and genes Human genes 0.000 claims description 10
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 claims description 8
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 claims description 8
- 101000967216 Homo sapiens Eosinophil cationic protein Proteins 0.000 claims description 8
- 101001109689 Homo sapiens Nuclear receptor subfamily 4 group A member 3 Proteins 0.000 claims description 8
- 101000712530 Homo sapiens RAF proto-oncogene serine/threonine-protein kinase Proteins 0.000 claims description 8
- 101000638154 Homo sapiens Transmembrane protease serine 2 Proteins 0.000 claims description 8
- 102100022673 Nuclear receptor subfamily 4 group A member 3 Human genes 0.000 claims description 8
- 102100033479 RAF proto-oncogene serine/threonine-protein kinase Human genes 0.000 claims description 8
- 102100031989 Transmembrane protease serine 2 Human genes 0.000 claims description 8
- 208000020816 lung neoplasm Diseases 0.000 claims description 8
- 210000004698 lymphocyte Anatomy 0.000 claims description 7
- 241000894007 species Species 0.000 claims description 7
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 6
- ZEOWTGPWHLSLOG-UHFFFAOYSA-N Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F Chemical compound Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F ZEOWTGPWHLSLOG-UHFFFAOYSA-N 0.000 claims description 6
- 102100023593 Fibroblast growth factor receptor 1 Human genes 0.000 claims description 6
- 101710182386 Fibroblast growth factor receptor 1 Proteins 0.000 claims description 6
- 101000990005 Homo sapiens CLIP-associating protein 1 Proteins 0.000 claims description 6
- 101001018259 Homo sapiens Microtubule-associated serine/threonine-protein kinase 1 Proteins 0.000 claims description 6
- 101001071233 Homo sapiens PHD finger protein 1 Proteins 0.000 claims description 6
- 101000613490 Homo sapiens Paired box protein Pax-3 Proteins 0.000 claims description 6
- 101000642815 Homo sapiens Protein SSXT Proteins 0.000 claims description 6
- 102100033268 Microtubule-associated serine/threonine-protein kinase 1 Human genes 0.000 claims description 6
- 102100036879 PHD finger protein 1 Human genes 0.000 claims description 6
- 102100040891 Paired box protein Pax-3 Human genes 0.000 claims description 6
- 102100035586 Protein SSXT Human genes 0.000 claims description 6
- 239000001226 triphosphate Substances 0.000 claims description 6
- 235000011178 triphosphate Nutrition 0.000 claims description 6
- 208000031261 Acute myeloid leukaemia Diseases 0.000 claims description 5
- 208000011691 Burkitt lymphomas Diseases 0.000 claims description 5
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 5
- 206010029260 Neuroblastoma Diseases 0.000 claims description 5
- 201000005202 lung cancer Diseases 0.000 claims description 5
- 201000001441 melanoma Diseases 0.000 claims description 5
- 208000002154 non-small cell lung carcinoma Diseases 0.000 claims description 5
- QYAPHLRPFNSDNH-MRFRVZCGSA-N (4s,4as,5as,6s,12ar)-7-chloro-4-(dimethylamino)-1,6,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4,4a,5,5a-tetrahydrotetracene-2-carboxamide;hydrochloride Chemical compound Cl.C1=CC(Cl)=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(=O)C(C(N)=O)=C(O)[C@@]4(O)C(=O)C3=C(O)C2=C1O QYAPHLRPFNSDNH-MRFRVZCGSA-N 0.000 claims description 4
- 102100025007 14-3-3 protein epsilon Human genes 0.000 claims description 4
- 102100024381 AF4/FMR2 family member 4 Human genes 0.000 claims description 4
- 108010080691 Alcohol O-acetyltransferase Proteins 0.000 claims description 4
- 102100035080 BDNF/NT-3 growth factors receptor Human genes 0.000 claims description 4
- 206010006187 Breast cancer Diseases 0.000 claims description 4
- 208000026310 Breast neoplasm Diseases 0.000 claims description 4
- 102100026127 Clathrin heavy chain 1 Human genes 0.000 claims description 4
- 102100033601 Collagen alpha-1(I) chain Human genes 0.000 claims description 4
- 102100029145 DNA damage-inducible transcript 3 protein Human genes 0.000 claims description 4
- 102100038415 ELKS/Rab6-interacting/CAST family member 1 Human genes 0.000 claims description 4
- 102100039577 ETS translocation variant 5 Human genes 0.000 claims description 4
- 241000588724 Escherichia coli Species 0.000 claims description 4
- 108010009306 Forkhead Box Protein O1 Proteins 0.000 claims description 4
- 102100035427 Forkhead box protein O1 Human genes 0.000 claims description 4
- 102100035416 Forkhead box protein O4 Human genes 0.000 claims description 4
- 102100033295 Glial cell line-derived neurotrophic factor Human genes 0.000 claims description 4
- 101000760079 Homo sapiens 14-3-3 protein epsilon Proteins 0.000 claims description 4
- 101000833170 Homo sapiens AF4/FMR2 family member 4 Proteins 0.000 claims description 4
- 101000596896 Homo sapiens BDNF/NT-3 growth factors receptor Proteins 0.000 claims description 4
- 101000912851 Homo sapiens Clathrin heavy chain 1 Proteins 0.000 claims description 4
- 101001100208 Homo sapiens ELKS/Rab6-interacting/CAST family member 1 Proteins 0.000 claims description 4
- 101000813745 Homo sapiens ETS translocation variant 5 Proteins 0.000 claims description 4
- 101000877683 Homo sapiens Forkhead box protein O4 Proteins 0.000 claims description 4
- 101001056560 Homo sapiens Juxtaposed with another zinc finger protein 1 Proteins 0.000 claims description 4
- 101000605528 Homo sapiens Kallikrein-2 Proteins 0.000 claims description 4
- 101001064542 Homo sapiens Liprin-beta-1 Proteins 0.000 claims description 4
- 101001005667 Homo sapiens Mastermind-like protein 2 Proteins 0.000 claims description 4
- 101001012669 Homo sapiens Melanoma inhibitory activity protein 2 Proteins 0.000 claims description 4
- 101001018300 Homo sapiens Microtubule-associated serine/threonine-protein kinase 2 Proteins 0.000 claims description 4
- 101001122114 Homo sapiens NUT family member 1 Proteins 0.000 claims description 4
- 101000973211 Homo sapiens Nuclear factor 1 B-type Proteins 0.000 claims description 4
- 101000602930 Homo sapiens Nuclear receptor coactivator 2 Proteins 0.000 claims description 4
- 101000584499 Homo sapiens Polycomb protein SUZ12 Proteins 0.000 claims description 4
- 101000610107 Homo sapiens Pre-B-cell leukemia transcription factor 1 Proteins 0.000 claims description 4
- 101000880769 Homo sapiens Protein SSX1 Proteins 0.000 claims description 4
- 101000822459 Homo sapiens Protein transport protein Sec31A Proteins 0.000 claims description 4
- 101000632314 Homo sapiens Septin-6 Proteins 0.000 claims description 4
- 102100025727 Juxtaposed with another zinc finger protein 1 Human genes 0.000 claims description 4
- 102100038356 Kallikrein-2 Human genes 0.000 claims description 4
- 102100031961 Liprin-beta-1 Human genes 0.000 claims description 4
- 206010025323 Lymphomas Diseases 0.000 claims description 4
- 102100025130 Mastermind-like protein 2 Human genes 0.000 claims description 4
- 102100029778 Melanoma inhibitory activity protein 2 Human genes 0.000 claims description 4
- 102100027383 Methyl-CpG-binding domain protein 1 Human genes 0.000 claims description 4
- 102100033253 Microtubule-associated serine/threonine-protein kinase 2 Human genes 0.000 claims description 4
- 108010018525 NFATC Transcription Factors Proteins 0.000 claims description 4
- 102100027086 NUT family member 1 Human genes 0.000 claims description 4
- 102100022165 Nuclear factor 1 B-type Human genes 0.000 claims description 4
- 102100037226 Nuclear receptor coactivator 2 Human genes 0.000 claims description 4
- 102100030702 Polycomb protein SUZ12 Human genes 0.000 claims description 4
- 102100040171 Pre-B-cell leukemia transcription factor 1 Human genes 0.000 claims description 4
- 102100037687 Protein SSX1 Human genes 0.000 claims description 4
- 102100022484 Protein transport protein Sec31A Human genes 0.000 claims description 4
- 108091028664 Ribonucleotide Proteins 0.000 claims description 4
- 102100027982 Septin-6 Human genes 0.000 claims description 4
- 208000024770 Thyroid neoplasm Diseases 0.000 claims description 4
- 108010057666 Transcription Factor CHOP Proteins 0.000 claims description 4
- FHHZHGZBHYYWTG-INFSMZHSSA-N [(2r,3s,4r,5r)-5-(2-amino-7-methyl-6-oxo-3h-purin-9-ium-9-yl)-3,4-dihydroxyoxolan-2-yl]methyl [[[(2r,3s,4r,5r)-5-(2-amino-6-oxo-3h-purin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-hydroxyphosphoryl] phosphate Chemical compound N1C(N)=NC(=O)C2=C1[N+]([C@H]1[C@@H]([C@H](O)[C@@H](COP([O-])(=O)OP(O)(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=C(C(N=C(N)N4)=O)N=C3)O)O1)O)=CN2C FHHZHGZBHYYWTG-INFSMZHSSA-N 0.000 claims description 4
- 108010029483 alpha 1 Chain Collagen Type I Proteins 0.000 claims description 4
- 210000003719 b-lymphocyte Anatomy 0.000 claims description 4
- 208000029742 colonic neoplasm Diseases 0.000 claims description 4
- 238000007865 diluting Methods 0.000 claims description 4
- 210000002950 fibroblast Anatomy 0.000 claims description 4
- 206010073071 hepatocellular carcinoma Diseases 0.000 claims description 4
- 239000011541 reaction mixture Substances 0.000 claims description 4
- 239000002336 ribonucleotide Substances 0.000 claims description 4
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 claims description 3
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 claims description 3
- 206010005003 Bladder cancer Diseases 0.000 claims description 3
- 108091005539 Brain-specific angiogenesis inhibitors Proteins 0.000 claims description 3
- 206010009944 Colon cancer Diseases 0.000 claims description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 claims description 3
- 241000258955 Echinodermata Species 0.000 claims description 3
- 101000581507 Homo sapiens Methyl-CpG-binding domain protein 1 Proteins 0.000 claims description 3
- 101001134861 Homo sapiens Pericentriolar material 1 protein Proteins 0.000 claims description 3
- 208000008839 Kidney Neoplasms Diseases 0.000 claims description 3
- 102000010638 Kinesin Human genes 0.000 claims description 3
- 108010063296 Kinesin Proteins 0.000 claims description 3
- 102100021794 Microtubule-associated protein 4 Human genes 0.000 claims description 3
- 101710093519 Microtubule-associated protein 4 Proteins 0.000 claims description 3
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 claims description 3
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 claims description 3
- 206010060862 Prostate cancer Diseases 0.000 claims description 3
- 208000000236 Prostatic Neoplasms Diseases 0.000 claims description 3
- 206010038389 Renal cancer Diseases 0.000 claims description 3
- 102000000941 Sodium-dependent phosphate transport proteins Human genes 0.000 claims description 3
- 108050007883 Sodium-dependent phosphate transport proteins Proteins 0.000 claims description 3
- 208000032383 Soft tissue cancer Diseases 0.000 claims description 3
- 208000005718 Stomach Neoplasms Diseases 0.000 claims description 3
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 claims description 3
- 208000006593 Urologic Neoplasms Diseases 0.000 claims description 3
- 230000002378 acidificating effect Effects 0.000 claims description 3
- 208000035269 cancer or benign tumor Diseases 0.000 claims description 3
- 201000007455 central nervous system cancer Diseases 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 206010017758 gastric cancer Diseases 0.000 claims description 3
- 201000010982 kidney cancer Diseases 0.000 claims description 3
- 201000011061 large intestine cancer Diseases 0.000 claims description 3
- 239000007788 liquid Substances 0.000 claims description 3
- 208000014018 liver neoplasm Diseases 0.000 claims description 3
- 150000003839 salts Chemical class 0.000 claims description 3
- 201000011549 stomach cancer Diseases 0.000 claims description 3
- 201000002510 thyroid cancer Diseases 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 claims description 3
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 claims description 3
- 201000005112 urinary bladder cancer Diseases 0.000 claims description 3
- 102100026152 1-acyl-sn-glycerol-3-phosphate acyltransferase epsilon Human genes 0.000 claims description 2
- OGHAROSJZRTIOK-KQYNXXCUSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7-methylpurin-9-ium-6-olate Chemical compound C12=NC(N)=NC([O-])=C2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-N 0.000 claims description 2
- DIDGPCDGNMIUNX-UUOKFMHZSA-N 2-amino-9-[(2r,3r,4s,5r)-5-(dihydroxyphosphinothioyloxymethyl)-3,4-dihydroxyoxolan-2-yl]-3h-purin-6-one Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=S)[C@@H](O)[C@H]1O DIDGPCDGNMIUNX-UUOKFMHZSA-N 0.000 claims description 2
- 102100027324 2-hydroxyacyl-CoA lyase 1 Human genes 0.000 claims description 2
- 102100038697 24-hydroxycholesterol 7-alpha-hydroxylase Human genes 0.000 claims description 2
- 102100040084 A-kinase anchor protein 9 Human genes 0.000 claims description 2
- 102100024379 AF4/FMR2 family member 1 Human genes 0.000 claims description 2
- 102100024387 AF4/FMR2 family member 3 Human genes 0.000 claims description 2
- 102100034580 AT-rich interactive domain-containing protein 1A Human genes 0.000 claims description 2
- 102100035623 ATP-citrate synthase Human genes 0.000 claims description 2
- 102100028247 Abl interactor 1 Human genes 0.000 claims description 2
- 102100028221 Abl interactor 2 Human genes 0.000 claims description 2
- 102100039382 Abscission/NoCut checkpoint regulator Human genes 0.000 claims description 2
- 102100022094 Acid-sensing ion channel 2 Human genes 0.000 claims description 2
- 102100033568 Acyl-CoA-binding domain-containing protein 6 Human genes 0.000 claims description 2
- 102100036775 Afadin Human genes 0.000 claims description 2
- 102100032959 Alpha-actinin-4 Human genes 0.000 claims description 2
- 102100030287 Arfaptin-1 Human genes 0.000 claims description 2
- 102100021247 BCL-6 corepressor Human genes 0.000 claims description 2
- 108091005625 BRD4 Proteins 0.000 claims description 2
- 102100021693 BTB/POZ domain-containing protein 18 Human genes 0.000 claims description 2
- 102100037674 Bis(5'-adenosyl)-triphosphatase Human genes 0.000 claims description 2
- 102100033642 Bromodomain-containing protein 3 Human genes 0.000 claims description 2
- 102100029895 Bromodomain-containing protein 4 Human genes 0.000 claims description 2
- 102100028737 CAP-Gly domain-containing linker protein 1 Human genes 0.000 claims description 2
- 102100024080 CASP8-associated protein 2 Human genes 0.000 claims description 2
- 102100033849 CCHC-type zinc finger nucleic acid binding protein Human genes 0.000 claims description 2
- 101710116319 CCHC-type zinc finger nucleic acid binding protein Proteins 0.000 claims description 2
- 102100021975 CREB-binding protein Human genes 0.000 claims description 2
- 102100040775 CREB-regulated transcription coactivator 1 Human genes 0.000 claims description 2
- 102100040755 CREB-regulated transcription coactivator 3 Human genes 0.000 claims description 2
- 102100024155 Cadherin-11 Human genes 0.000 claims description 2
- 102100038700 Calcium-responsive transactivator Human genes 0.000 claims description 2
- 102100031761 Cancer/testis antigen family 45 member A2 Human genes 0.000 claims description 2
- 102100028914 Catenin beta-1 Human genes 0.000 claims description 2
- 102100025705 Centrosomal protein of 170 kDa protein B Human genes 0.000 claims description 2
- 102100034794 Centrosomal protein of 89 kDa Human genes 0.000 claims description 2
- 101710192994 Centrosomal protein of 89 kDa Proteins 0.000 claims description 2
- 206010008342 Cervix carcinoma Diseases 0.000 claims description 2
- 102100040509 Chromatin modification-related protein MEAF6 Human genes 0.000 claims description 2
- 102100031048 Coiled-coil domain-containing protein 6 Human genes 0.000 claims description 2
- 102100023689 Coiled-coil-helix-coiled-coil-helix domain-containing protein 7 Human genes 0.000 claims description 2
- 102100036213 Collagen alpha-2(I) chain Human genes 0.000 claims description 2
- 102100026359 Cyclic AMP-responsive element-binding protein 1 Human genes 0.000 claims description 2
- 102100039297 Cyclic AMP-responsive element-binding protein 3-like protein 1 Human genes 0.000 claims description 2
- 102100039299 Cyclic AMP-responsive element-binding protein 3-like protein 2 Human genes 0.000 claims description 2
- 102000009506 Cyclin-Dependent Kinase Inhibitor p19 Human genes 0.000 claims description 2
- 108010009361 Cyclin-Dependent Kinase Inhibitor p19 Proteins 0.000 claims description 2
- 102100021902 Cysteine protease ATG4C Human genes 0.000 claims description 2
- 102100028202 Cytochrome c oxidase subunit 6C Human genes 0.000 claims description 2
- 102100033934 DNA repair protein RAD51 homolog 2 Human genes 0.000 claims description 2
- 102100040401 DNA topoisomerase 3-alpha Human genes 0.000 claims description 2
- 102100033672 Deleted in azoospermia-like Human genes 0.000 claims description 2
- 101100226017 Dictyostelium discoideum repD gene Proteins 0.000 claims description 2
- 102100028571 Disabled homolog 2-interacting protein Human genes 0.000 claims description 2
- 102100029721 DnaJ homolog subfamily B member 1 Human genes 0.000 claims description 2
- 102100036654 Dynactin subunit 1 Human genes 0.000 claims description 2
- 102100038912 E3 SUMO-protein ligase RanBP2 Human genes 0.000 claims description 2
- 102100037038 E3 ubiquitin-protein ligase CCNB1IP1 Human genes 0.000 claims description 2
- 102100021183 E3 ubiquitin-protein ligase RNF130 Human genes 0.000 claims description 2
- 102100034830 E3 ubiquitin-protein ligase RNF216 Human genes 0.000 claims description 2
- 102100029505 E3 ubiquitin-protein ligase TRIM33 Human genes 0.000 claims description 2
- 102100033594 E3 ubiquitin-protein ligase makorin-1 Human genes 0.000 claims description 2
- 101150039757 EIF3E gene Proteins 0.000 claims description 2
- 101150073788 EIF3K gene Proteins 0.000 claims description 2
- 101150105460 ERCC2 gene Proteins 0.000 claims description 2
- 102100029994 ERO1-like protein alpha Human genes 0.000 claims description 2
- 102100023792 ETS domain-containing protein Elk-4 Human genes 0.000 claims description 2
- 102100038969 EZH inhibitory protein Human genes 0.000 claims description 2
- 102100028401 Endophilin-A2 Human genes 0.000 claims description 2
- 102100031948 Enhancer of polycomb homolog 1 Human genes 0.000 claims description 2
- 102100039369 Epidermal growth factor receptor substrate 15 Human genes 0.000 claims description 2
- 102100039623 Epithelial splicing regulatory protein 1 Human genes 0.000 claims description 2
- 102100033132 Eukaryotic translation initiation factor 3 subunit E Human genes 0.000 claims description 2
- 102100037110 Eukaryotic translation initiation factor 3 subunit K Human genes 0.000 claims description 2
- 102100040651 F-BAR and double SH3 domains protein 1 Human genes 0.000 claims description 2
- 102100040674 F-box only protein 38 Human genes 0.000 claims description 2
- 102100027728 F-box/LRR-repeat protein 18 Human genes 0.000 claims description 2
- 102100027867 FH2 domain-containing protein 1 Human genes 0.000 claims description 2
- 102100034334 Fatty acid CoA ligase Acsl3 Human genes 0.000 claims description 2
- 102100040684 Fermitin family homolog 2 Human genes 0.000 claims description 2
- 108010009307 Forkhead Box Protein O3 Proteins 0.000 claims description 2
- 102100035421 Forkhead box protein O3 Human genes 0.000 claims description 2
- 102100030334 Friend leukemia integration 1 transcription factor Human genes 0.000 claims description 2
- 108010062427 GDP-mannose 4,6-dehydratase Proteins 0.000 claims description 2
- 102000002312 GDPmannose 4,6-dehydratase Human genes 0.000 claims description 2
- 102100037759 GRB2-associated-binding protein 2 Human genes 0.000 claims description 2
- 102100035924 Gamma-aminobutyric acid type B receptor subunit 2 Human genes 0.000 claims description 2
- 102100035184 General transcription and DNA repair factor IIH helicase subunit XPD Human genes 0.000 claims description 2
- 102100040870 Glycine amidinotransferase, mitochondrial Human genes 0.000 claims description 2
- 102100036675 Golgi-associated PDZ and coiled-coil motif-containing protein Human genes 0.000 claims description 2
- 102100041032 Golgin subfamily A member 5 Human genes 0.000 claims description 2
- 102100031493 Growth arrest-specific protein 7 Human genes 0.000 claims description 2
- 102100034155 Guanine nucleotide-binding protein G(i) subunit alpha-1 Human genes 0.000 claims description 2
- 102100034473 H(+)/Cl(-) exchange transporter 6 Human genes 0.000 claims description 2
- 102100028972 HLA class I histocompatibility antigen, A alpha chain Human genes 0.000 claims description 2
- 108010075704 HLA-A Antigens Proteins 0.000 claims description 2
- 108010081348 HRT1 protein Hairy Proteins 0.000 claims description 2
- 102100021881 Hairy/enhancer-of-split related with YRPW motif protein 1 Human genes 0.000 claims description 2
- 102100035616 Heterogeneous nuclear ribonucleoproteins A2/B1 Human genes 0.000 claims description 2
- 102100024229 High affinity cAMP-specific and IBMX-insensitive 3',5'-cyclic phosphodiesterase 8B Human genes 0.000 claims description 2
- 101710145025 High affinity cAMP-specific and IBMX-insensitive 3',5'-cyclic phosphodiesterase 8B Proteins 0.000 claims description 2
- 102100038885 Histone acetyltransferase p300 Human genes 0.000 claims description 2
- 102100031672 Homeobox protein CDX-1 Human genes 0.000 claims description 2
- 101000691569 Homo sapiens 1-acyl-sn-glycerol-3-phosphate acyltransferase epsilon Proteins 0.000 claims description 2
- 101001009252 Homo sapiens 2-hydroxyacyl-CoA lyase 1 Proteins 0.000 claims description 2
- 101000957683 Homo sapiens 24-hydroxycholesterol 7-alpha-hydroxylase Proteins 0.000 claims description 2
- 101000890598 Homo sapiens A-kinase anchor protein 9 Proteins 0.000 claims description 2
- 101000833180 Homo sapiens AF4/FMR2 family member 1 Proteins 0.000 claims description 2
- 101000833166 Homo sapiens AF4/FMR2 family member 3 Proteins 0.000 claims description 2
- 101000924266 Homo sapiens AT-rich interactive domain-containing protein 1A Proteins 0.000 claims description 2
- 101000782969 Homo sapiens ATP-citrate synthase Proteins 0.000 claims description 2
- 101000724225 Homo sapiens Abl interactor 1 Proteins 0.000 claims description 2
- 101000724231 Homo sapiens Abl interactor 2 Proteins 0.000 claims description 2
- 101000961199 Homo sapiens Abscission/NoCut checkpoint regulator Proteins 0.000 claims description 2
- 101000901079 Homo sapiens Acid-sensing ion channel 2 Proteins 0.000 claims description 2
- 101000801610 Homo sapiens Acyl-CoA-binding domain-containing protein 6 Proteins 0.000 claims description 2
- 101000928246 Homo sapiens Afadin Proteins 0.000 claims description 2
- 101000797282 Homo sapiens Alpha-actinin-4 Proteins 0.000 claims description 2
- 101000792706 Homo sapiens Arfaptin-1 Proteins 0.000 claims description 2
- 101100165236 Homo sapiens BCOR gene Proteins 0.000 claims description 2
- 101000896701 Homo sapiens BTB/POZ domain-containing protein 18 Proteins 0.000 claims description 2
- 101000871851 Homo sapiens Bromodomain-containing protein 3 Proteins 0.000 claims description 2
- 101000767052 Homo sapiens CAP-Gly domain-containing linker protein 1 Proteins 0.000 claims description 2
- 101000910382 Homo sapiens CASP8-associated protein 2 Proteins 0.000 claims description 2
- 101000896987 Homo sapiens CREB-binding protein Proteins 0.000 claims description 2
- 101000891939 Homo sapiens CREB-regulated transcription coactivator 1 Proteins 0.000 claims description 2
- 101000891906 Homo sapiens CREB-regulated transcription coactivator 3 Proteins 0.000 claims description 2
- 101000762236 Homo sapiens Cadherin-11 Proteins 0.000 claims description 2
- 101000957728 Homo sapiens Calcium-responsive transactivator Proteins 0.000 claims description 2
- 101000940805 Homo sapiens Cancer/testis antigen family 45 member A2 Proteins 0.000 claims description 2
- 101000916173 Homo sapiens Catenin beta-1 Proteins 0.000 claims description 2
- 101000983874 Homo sapiens Centrosomal protein of 170 kDa protein B Proteins 0.000 claims description 2
- 101000817406 Homo sapiens Chromatin modification-related protein MEAF6 Proteins 0.000 claims description 2
- 101000777370 Homo sapiens Coiled-coil domain-containing protein 6 Proteins 0.000 claims description 2
- 101000906984 Homo sapiens Coiled-coil-helix-coiled-coil-helix domain-containing protein 7 Proteins 0.000 claims description 2
- 101000875067 Homo sapiens Collagen alpha-2(I) chain Proteins 0.000 claims description 2
- 101000855516 Homo sapiens Cyclic AMP-responsive element-binding protein 1 Proteins 0.000 claims description 2
- 101000745631 Homo sapiens Cyclic AMP-responsive element-binding protein 3-like protein 1 Proteins 0.000 claims description 2
- 101000745624 Homo sapiens Cyclic AMP-responsive element-binding protein 3-like protein 2 Proteins 0.000 claims description 2
- 101000753453 Homo sapiens Cysteine protease ATG4C Proteins 0.000 claims description 2
- 101000861049 Homo sapiens Cytochrome c oxidase subunit 6C Proteins 0.000 claims description 2
- 101000611068 Homo sapiens DNA topoisomerase 3-alpha Proteins 0.000 claims description 2
- 101000871280 Homo sapiens Deleted in azoospermia-like Proteins 0.000 claims description 2
- 101000915396 Homo sapiens Disabled homolog 2-interacting protein Proteins 0.000 claims description 2
- 101000866018 Homo sapiens DnaJ homolog subfamily B member 1 Proteins 0.000 claims description 2
- 101000929626 Homo sapiens Dynactin subunit 1 Proteins 0.000 claims description 2
- 101000737896 Homo sapiens E3 ubiquitin-protein ligase CCNB1IP1 Proteins 0.000 claims description 2
- 101000734278 Homo sapiens E3 ubiquitin-protein ligase RNF216 Proteins 0.000 claims description 2
- 101000634991 Homo sapiens E3 ubiquitin-protein ligase TRIM33 Proteins 0.000 claims description 2
- 101001018965 Homo sapiens E3 ubiquitin-protein ligase makorin-1 Proteins 0.000 claims description 2
- 101001010853 Homo sapiens ERO1-like protein alpha Proteins 0.000 claims description 2
- 101001048716 Homo sapiens ETS domain-containing protein Elk-4 Proteins 0.000 claims description 2
- 101000882130 Homo sapiens EZH inhibitory protein Proteins 0.000 claims description 2
- 101000632553 Homo sapiens Endophilin-A2 Proteins 0.000 claims description 2
- 101000920634 Homo sapiens Enhancer of polycomb homolog 1 Proteins 0.000 claims description 2
- 101000812517 Homo sapiens Epidermal growth factor receptor substrate 15 Proteins 0.000 claims description 2
- 101000814084 Homo sapiens Epithelial splicing regulatory protein 1 Proteins 0.000 claims description 2
- 101000892423 Homo sapiens F-BAR and double SH3 domains protein 1 Proteins 0.000 claims description 2
- 101000892310 Homo sapiens F-box only protein 38 Proteins 0.000 claims description 2
- 101000862204 Homo sapiens F-box/LRR-repeat protein 18 Proteins 0.000 claims description 2
- 101001060553 Homo sapiens FH2 domain-containing protein 1 Proteins 0.000 claims description 2
- 101000780194 Homo sapiens Fatty acid CoA ligase Acsl3 Proteins 0.000 claims description 2
- 101000892677 Homo sapiens Fermitin family homolog 2 Proteins 0.000 claims description 2
- 101001062996 Homo sapiens Friend leukemia integration 1 transcription factor Proteins 0.000 claims description 2
- 101001024902 Homo sapiens GRB2-associated-binding protein 2 Proteins 0.000 claims description 2
- 101001000703 Homo sapiens Gamma-aminobutyric acid type B receptor subunit 2 Proteins 0.000 claims description 2
- 101000926140 Homo sapiens Gem-associated protein 2 Proteins 0.000 claims description 2
- 101000893303 Homo sapiens Glycine amidinotransferase, mitochondrial Proteins 0.000 claims description 2
- 101001072499 Homo sapiens Golgi-associated PDZ and coiled-coil motif-containing protein Proteins 0.000 claims description 2
- 101001039330 Homo sapiens Golgin subfamily A member 5 Proteins 0.000 claims description 2
- 101000923044 Homo sapiens Growth arrest-specific protein 7 Proteins 0.000 claims description 2
- 101001070526 Homo sapiens Guanine nucleotide-binding protein G(i) subunit alpha-1 Proteins 0.000 claims description 2
- 101000710240 Homo sapiens H(+)/Cl(-) exchange transporter 6 Proteins 0.000 claims description 2
- 101000854026 Homo sapiens Heterogeneous nuclear ribonucleoproteins A2/B1 Proteins 0.000 claims description 2
- 101000777808 Homo sapiens Homeobox protein CDX-1 Proteins 0.000 claims description 2
- 101001035137 Homo sapiens Homocysteine-responsive endoplasmic reticulum-resident ubiquitin-like domain member 1 protein Proteins 0.000 claims description 2
- 101001021527 Homo sapiens Huntingtin-interacting protein 1 Proteins 0.000 claims description 2
- 101000975421 Homo sapiens Inositol 1,4,5-trisphosphate receptor type 2 Proteins 0.000 claims description 2
- 101001033770 Homo sapiens Integrator complex subunit 4 Proteins 0.000 claims description 2
- 101001077835 Homo sapiens Interferon regulatory factor 2-binding protein 2 Proteins 0.000 claims description 2
- 101000599048 Homo sapiens Interleukin-6 receptor subunit alpha Proteins 0.000 claims description 2
- 101001090172 Homo sapiens Kinectin Proteins 0.000 claims description 2
- 101000605496 Homo sapiens Kinesin light chain 1 Proteins 0.000 claims description 2
- 101000971521 Homo sapiens Kinetochore scaffold 1 Proteins 0.000 claims description 2
- 101000981546 Homo sapiens LHFPL tetraspan subfamily member 6 protein Proteins 0.000 claims description 2
- 101001023330 Homo sapiens LIM and SH3 domain protein 1 Proteins 0.000 claims description 2
- 101001063456 Homo sapiens Leucine-rich repeat-containing G-protein coupled receptor 5 Proteins 0.000 claims description 2
- 101001017855 Homo sapiens Leucine-rich repeats and immunoglobulin-like domains protein 3 Proteins 0.000 claims description 2
- 101001042362 Homo sapiens Leukemia inhibitory factor receptor Proteins 0.000 claims description 2
- 101000957316 Homo sapiens Lysophospholipid acyltransferase 2 Proteins 0.000 claims description 2
- 101001059427 Homo sapiens MAP/microtubule affinity-regulating kinase 4 Proteins 0.000 claims description 2
- 101000615509 Homo sapiens MBT domain-containing protein 1 Proteins 0.000 claims description 2
- 101000653360 Homo sapiens Methylcytosine dioxygenase TET1 Proteins 0.000 claims description 2
- 101000962664 Homo sapiens Microtubule-associated protein RP/EB family member 1 Proteins 0.000 claims description 2
- 101001074975 Homo sapiens Molybdopterin molybdenumtransferase Proteins 0.000 claims description 2
- 101000651236 Homo sapiens NCK-interacting protein with SH3 domain Proteins 0.000 claims description 2
- 101000583057 Homo sapiens NGFI-A-binding protein 2 Proteins 0.000 claims description 2
- 101000604452 Homo sapiens NUT family member 2A Proteins 0.000 claims description 2
- 101000604453 Homo sapiens NUT family member 2B Proteins 0.000 claims description 2
- 101001111328 Homo sapiens Nuclear factor 1 A-type Proteins 0.000 claims description 2
- 101000979347 Homo sapiens Nuclear factor 1 X-type Proteins 0.000 claims description 2
- 101001107586 Homo sapiens Nuclear pore complex protein Nup107 Proteins 0.000 claims description 2
- 101000602926 Homo sapiens Nuclear receptor coactivator 1 Proteins 0.000 claims description 2
- 101000633310 Homo sapiens Nuclear receptor-interacting protein 3 Proteins 0.000 claims description 2
- 101000958669 Homo sapiens Nucleus accumbens-associated protein 2 Proteins 0.000 claims description 2
- 101001094700 Homo sapiens POU domain, class 5, transcription factor 1 Proteins 0.000 claims description 2
- 101001072590 Homo sapiens POZ-, AT hook-, and zinc finger-containing protein 1 Proteins 0.000 claims description 2
- 101000586632 Homo sapiens PWWP domain-containing protein 2A Proteins 0.000 claims description 2
- 101000601724 Homo sapiens Paired box protein Pax-5 Proteins 0.000 claims description 2
- 101000601661 Homo sapiens Paired box protein Pax-7 Proteins 0.000 claims description 2
- 101000583474 Homo sapiens Phosphatidylinositol-binding clathrin assembly protein Proteins 0.000 claims description 2
- 101001133640 Homo sapiens Phosphofurin acidic cluster sorting protein 1 Proteins 0.000 claims description 2
- 101000701522 Homo sapiens Phospholipid-transporting ATPase ID Proteins 0.000 claims description 2
- 101001094868 Homo sapiens Plexin-D1 Proteins 0.000 claims description 2
- 101000730580 Homo sapiens Polycystic kidney disease protein 1-like 1 Proteins 0.000 claims description 2
- 101001003584 Homo sapiens Prelamin-A/C Proteins 0.000 claims description 2
- 101000952113 Homo sapiens Probable ATP-dependent RNA helicase DDX5 Proteins 0.000 claims description 2
- 101000611614 Homo sapiens Proline-rich protein PRCC Proteins 0.000 claims description 2
- 101000718497 Homo sapiens Protein AF-10 Proteins 0.000 claims description 2
- 101000892360 Homo sapiens Protein AF-17 Proteins 0.000 claims description 2
- 101000959489 Homo sapiens Protein AF-9 Proteins 0.000 claims description 2
- 101000892338 Homo sapiens Protein AF1q Proteins 0.000 claims description 2
- 101000766826 Homo sapiens Protein CIP2A Proteins 0.000 claims description 2
- 101000948324 Homo sapiens Protein CutA Proteins 0.000 claims description 2
- 101000925651 Homo sapiens Protein ENL Proteins 0.000 claims description 2
- 101000882133 Homo sapiens Protein FAM131B Proteins 0.000 claims description 2
- 101000866633 Homo sapiens Protein Hook homolog 3 Proteins 0.000 claims description 2
- 101000579580 Homo sapiens Protein LSM14 homolog A Proteins 0.000 claims description 2
- 101000979748 Homo sapiens Protein NDRG1 Proteins 0.000 claims description 2
- 101001136768 Homo sapiens Protein PRRC1 Proteins 0.000 claims description 2
- 101000716750 Homo sapiens Protein SCAF11 Proteins 0.000 claims description 2
- 101000880770 Homo sapiens Protein SSX2 Proteins 0.000 claims description 2
- 101000880774 Homo sapiens Protein SSX4 Proteins 0.000 claims description 2
- 101000893493 Homo sapiens Protein flightless-1 homolog Proteins 0.000 claims description 2
- 101000931682 Homo sapiens Protein furry homolog-like Proteins 0.000 claims description 2
- 101001026852 Homo sapiens Protein kinase C epsilon type Proteins 0.000 claims description 2
- 101000643431 Homo sapiens Protein phosphatase Slingshot homolog 2 Proteins 0.000 claims description 2
- 101000825949 Homo sapiens R-spondin-2 Proteins 0.000 claims description 2
- 101000825960 Homo sapiens R-spondin-3 Proteins 0.000 claims description 2
- 101000668165 Homo sapiens RNA-binding motif, single-stranded-interacting protein 1 Proteins 0.000 claims description 2
- 101001062098 Homo sapiens RNA-binding protein 14 Proteins 0.000 claims description 2
- 101000683518 Homo sapiens RRP15-like protein Proteins 0.000 claims description 2
- 101000591201 Homo sapiens Receptor-type tyrosine-protein phosphatase kappa Proteins 0.000 claims description 2
- 101001091984 Homo sapiens Rho GTPase-activating protein 26 Proteins 0.000 claims description 2
- 101000927774 Homo sapiens Rho guanine nucleotide exchange factor 12 Proteins 0.000 claims description 2
- 101000685956 Homo sapiens SAP domain-containing ribonucleoprotein Proteins 0.000 claims description 2
- 101000702544 Homo sapiens SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily A member 5 Proteins 0.000 claims description 2
- 101001126009 Homo sapiens Secretory phospholipase A2 receptor Proteins 0.000 claims description 2
- 101000739577 Homo sapiens Selenocysteine-specific elongation factor Proteins 0.000 claims description 2
- 101000654668 Homo sapiens Septin-2 Proteins 0.000 claims description 2
- 101000654740 Homo sapiens Septin-5 Proteins 0.000 claims description 2
- 101000632054 Homo sapiens Septin-8 Proteins 0.000 claims description 2
- 101000632056 Homo sapiens Septin-9 Proteins 0.000 claims description 2
- 101000644537 Homo sapiens Sequestosome-1 Proteins 0.000 claims description 2
- 101000703745 Homo sapiens Shootin-1 Proteins 0.000 claims description 2
- 101000826125 Homo sapiens Single-stranded DNA-binding protein 2 Proteins 0.000 claims description 2
- 101000609920 Homo sapiens Sister chromatid cohesion protein PDS5 homolog A Proteins 0.000 claims description 2
- 101000910249 Homo sapiens Soluble calcium-activated nucleotidase 1 Proteins 0.000 claims description 2
- 101000629638 Homo sapiens Sorbin and SH3 domain-containing protein 2 Proteins 0.000 claims description 2
- 101000617805 Homo sapiens Staphylococcal nuclease domain-containing protein 1 Proteins 0.000 claims description 2
- 101000648196 Homo sapiens Striatin Proteins 0.000 claims description 2
- 101000648543 Homo sapiens Sushi domain-containing protein 1 Proteins 0.000 claims description 2
- 101000643620 Homo sapiens Synaptonemal complex protein 1 Proteins 0.000 claims description 2
- 101000740519 Homo sapiens Syndecan-4 Proteins 0.000 claims description 2
- 101001099181 Homo sapiens TATA-binding protein-associated factor 2N Proteins 0.000 claims description 2
- 101000728490 Homo sapiens Tether containing UBX domain for GLUT4 Proteins 0.000 claims description 2
- 101000795185 Homo sapiens Thyroid hormone receptor-associated protein 3 Proteins 0.000 claims description 2
- 101000835720 Homo sapiens Transcription elongation factor A protein 1 Proteins 0.000 claims description 2
- 101001041525 Homo sapiens Transcription factor 12 Proteins 0.000 claims description 2
- 101000596772 Homo sapiens Transcription factor 7-like 1 Proteins 0.000 claims description 2
- 101000596771 Homo sapiens Transcription factor 7-like 2 Proteins 0.000 claims description 2
- 101000909637 Homo sapiens Transcription factor COE1 Proteins 0.000 claims description 2
- 101000666382 Homo sapiens Transcription factor E2-alpha Proteins 0.000 claims description 2
- 101000657352 Homo sapiens Transcriptional adapter 2-alpha Proteins 0.000 claims description 2
- 101000836154 Homo sapiens Transforming acidic coiled-coil-containing protein 1 Proteins 0.000 claims description 2
- 101000663031 Homo sapiens Transmembrane and coiled-coil domains protein 1 Proteins 0.000 claims description 2
- 101000830781 Homo sapiens Tropomyosin alpha-4 chain Proteins 0.000 claims description 2
- 101000652492 Homo sapiens Tubulin-specific chaperone cofactor E-like protein Proteins 0.000 claims description 2
- 101000765743 Homo sapiens Type-1 angiotensin II receptor-associated protein Proteins 0.000 claims description 2
- 101000823316 Homo sapiens Tyrosine-protein kinase ABL1 Proteins 0.000 claims description 2
- 101000761737 Homo sapiens Ubiquitin-conjugating enzyme E2 L3 Proteins 0.000 claims description 2
- 101000583031 Homo sapiens Unconventional myosin-Va Proteins 0.000 claims description 2
- 101001070761 Homo sapiens Vasculin-like protein 1 Proteins 0.000 claims description 2
- 101000621459 Homo sapiens Vesicle transport through interaction with t-SNAREs homolog 1A Proteins 0.000 claims description 2
- 101000771664 Homo sapiens WD repeat and FYVE domain-containing protein 2 Proteins 0.000 claims description 2
- 101000771640 Homo sapiens WD repeat and coiled-coil-containing protein Proteins 0.000 claims description 2
- 101000665937 Homo sapiens Wnt inhibitory factor 1 Proteins 0.000 claims description 2
- 101000781865 Homo sapiens Zinc finger CCCH domain-containing protein 7B Proteins 0.000 claims description 2
- 101000788847 Homo sapiens Zinc finger CCHC domain-containing protein 8 Proteins 0.000 claims description 2
- 101000723833 Homo sapiens Zinc finger E-box-binding homeobox 2 Proteins 0.000 claims description 2
- 101000785562 Homo sapiens Zinc finger and SCAN domain-containing protein 30 Proteins 0.000 claims description 2
- 101000964718 Homo sapiens Zinc finger protein 384 Proteins 0.000 claims description 2
- 101000782464 Homo sapiens Zinc finger protein 444 Proteins 0.000 claims description 2
- 101000723630 Homo sapiens Zinc finger protein 700 Proteins 0.000 claims description 2
- 101000723661 Homo sapiens Zinc finger protein 703 Proteins 0.000 claims description 2
- 101000634977 Homo sapiens Zinc finger protein RFP Proteins 0.000 claims description 2
- 101000994496 Homo sapiens cAMP-dependent protein kinase catalytic subunit alpha Proteins 0.000 claims description 2
- 101001026573 Homo sapiens cAMP-dependent protein kinase type I-alpha regulatory subunit Proteins 0.000 claims description 2
- 101000614798 Homo sapiens cAMP-dependent protein kinase type II-alpha regulatory subunit Proteins 0.000 claims description 2
- 102100039923 Homocysteine-responsive endoplasmic reticulum-resident ubiquitin-like domain member 1 protein Human genes 0.000 claims description 2
- 102100035957 Huntingtin-interacting protein 1 Human genes 0.000 claims description 2
- 108090000320 Hyaluronan Synthases Proteins 0.000 claims description 2
- 102000003918 Hyaluronan Synthases Human genes 0.000 claims description 2
- 108010007666 IMP cyclohydrolase Proteins 0.000 claims description 2
- 102100020796 Inosine 5'-monophosphate cyclohydrolase Human genes 0.000 claims description 2
- 102100024037 Inositol 1,4,5-trisphosphate receptor type 2 Human genes 0.000 claims description 2
- 102100039134 Integrator complex subunit 4 Human genes 0.000 claims description 2
- 102100025356 Interferon regulatory factor 2-binding protein 2 Human genes 0.000 claims description 2
- 102100037792 Interleukin-6 receptor subunit alpha Human genes 0.000 claims description 2
- 206010061252 Intraocular melanoma Diseases 0.000 claims description 2
- 101710029140 KIAA1549 Proteins 0.000 claims description 2
- 102100034751 Kinectin Human genes 0.000 claims description 2
- 102100038306 Kinesin light chain 1 Human genes 0.000 claims description 2
- 102100021464 Kinetochore scaffold 1 Human genes 0.000 claims description 2
- 102100024116 LHFPL tetraspan subfamily member 6 protein Human genes 0.000 claims description 2
- 102100035118 LIM and SH3 domain protein 1 Human genes 0.000 claims description 2
- 102100031036 Leucine-rich repeat-containing G-protein coupled receptor 5 Human genes 0.000 claims description 2
- 102100033284 Leucine-rich repeats and immunoglobulin-like domains protein 3 Human genes 0.000 claims description 2
- 102100021747 Leukemia inhibitory factor receptor Human genes 0.000 claims description 2
- 102100038805 Lysophospholipid acyltransferase 2 Human genes 0.000 claims description 2
- 102100028913 MAP/microtubule affinity-regulating kinase 4 Human genes 0.000 claims description 2
- 102100021282 MBT domain-containing protein 1 Human genes 0.000 claims description 2
- 102100030819 Methylcytosine dioxygenase TET1 Human genes 0.000 claims description 2
- 102100039560 Microtubule-associated protein RP/EB family member 1 Human genes 0.000 claims description 2
- 102000009645 Mitochondrial Aldehyde Dehydrogenase Human genes 0.000 claims description 2
- 108010009513 Mitochondrial Aldehyde Dehydrogenase Proteins 0.000 claims description 2
- 102100035971 Molybdopterin molybdenumtransferase Human genes 0.000 claims description 2
- CZSLEMCYYGEGKP-UHFFFAOYSA-N N-(2-chlorobenzyl)-1-(2,5-dimethylphenyl)benzimidazole-5-carboxamide Chemical compound CC1=CC=C(C)C(N2C3=CC=C(C=C3N=C2)C(=O)NCC=2C(=CC=CC=2)Cl)=C1 CZSLEMCYYGEGKP-UHFFFAOYSA-N 0.000 claims description 2
- 102100027673 NCK-interacting protein with SH3 domain Human genes 0.000 claims description 2
- 102100030391 NGFI-A-binding protein 2 Human genes 0.000 claims description 2
- 102100038690 NUT family member 2A Human genes 0.000 claims description 2
- 102100038709 NUT family member 2B Human genes 0.000 claims description 2
- 102000009065 Netrin-1 Human genes 0.000 claims description 2
- 108010074223 Netrin-1 Proteins 0.000 claims description 2
- 102000048238 Neuregulin-1 Human genes 0.000 claims description 2
- 108090000556 Neuregulin-1 Proteins 0.000 claims description 2
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 claims description 2
- 102100024006 Nuclear factor 1 A-type Human genes 0.000 claims description 2
- 102100023049 Nuclear factor 1 X-type Human genes 0.000 claims description 2
- 108020005497 Nuclear hormone receptor Proteins 0.000 claims description 2
- 102100021976 Nuclear pore complex protein Nup107 Human genes 0.000 claims description 2
- 102100037223 Nuclear receptor coactivator 1 Human genes 0.000 claims description 2
- 102100029561 Nuclear receptor-interacting protein 3 Human genes 0.000 claims description 2
- 102100038140 Nucleus accumbens-associated protein 2 Human genes 0.000 claims description 2
- 206010033128 Ovarian cancer Diseases 0.000 claims description 2
- 206010061535 Ovarian neoplasm Diseases 0.000 claims description 2
- 102100035423 POU domain, class 5, transcription factor 1 Human genes 0.000 claims description 2
- 102100036665 POZ-, AT hook-, and zinc finger-containing protein 1 Human genes 0.000 claims description 2
- 108010047613 PTB-Associated Splicing Factor Proteins 0.000 claims description 2
- 102100029733 PWWP domain-containing protein 2A Human genes 0.000 claims description 2
- 102100037504 Paired box protein Pax-5 Human genes 0.000 claims description 2
- 102100037503 Paired box protein Pax-7 Human genes 0.000 claims description 2
- 208000000821 Parathyroid Neoplasms Diseases 0.000 claims description 2
- 102100031014 Phosphatidylinositol-binding clathrin assembly protein Human genes 0.000 claims description 2
- 102100034078 Phosphofurin acidic cluster sorting protein 1 Human genes 0.000 claims description 2
- 102100030474 Phospholipid-transporting ATPase ID Human genes 0.000 claims description 2
- 102100040990 Platelet-derived growth factor subunit B Human genes 0.000 claims description 2
- 102100035380 Plexin-D1 Human genes 0.000 claims description 2
- 102100032580 Polycystic kidney disease protein 1-like 1 Human genes 0.000 claims description 2
- 102100031243 Polypyrimidine tract-binding protein 3 Human genes 0.000 claims description 2
- 101710132760 Polypyrimidine tract-binding protein 3 Proteins 0.000 claims description 2
- 102100026531 Prelamin-A/C Human genes 0.000 claims description 2
- 102100037434 Probable ATP-dependent RNA helicase DDX5 Human genes 0.000 claims description 2
- 102100040829 Proline-rich protein PRCC Human genes 0.000 claims description 2
- 102100026286 Protein AF-10 Human genes 0.000 claims description 2
- 102100040638 Protein AF-17 Human genes 0.000 claims description 2
- 102100039686 Protein AF-9 Human genes 0.000 claims description 2
- 102100040665 Protein AF1q Human genes 0.000 claims description 2
- 102100028634 Protein CIP2A Human genes 0.000 claims description 2
- 102100036046 Protein CutA Human genes 0.000 claims description 2
- 102100033813 Protein ENL Human genes 0.000 claims description 2
- 102100038972 Protein FAM131B Human genes 0.000 claims description 2
- 102100031717 Protein Hook homolog 3 Human genes 0.000 claims description 2
- 102100028259 Protein LSM14 homolog A Human genes 0.000 claims description 2
- 102100024980 Protein NDRG1 Human genes 0.000 claims description 2
- 102100036553 Protein PRRC1 Human genes 0.000 claims description 2
- 102100020876 Protein SCAF11 Human genes 0.000 claims description 2
- 102100037686 Protein SSX2 Human genes 0.000 claims description 2
- 102100037727 Protein SSX4 Human genes 0.000 claims description 2
- 102100020916 Protein furry homolog-like Human genes 0.000 claims description 2
- 102100037339 Protein kinase C epsilon type Human genes 0.000 claims description 2
- 108010019674 Proto-Oncogene Proteins c-sis Proteins 0.000 claims description 2
- 102100022763 R-spondin-2 Human genes 0.000 claims description 2
- 102100022766 R-spondin-3 Human genes 0.000 claims description 2
- 101710018890 RAD51B Proteins 0.000 claims description 2
- 102100039692 RNA-binding motif, single-stranded-interacting protein 1 Human genes 0.000 claims description 2
- 102100029250 RNA-binding protein 14 Human genes 0.000 claims description 2
- 108091007333 RNF130 Proteins 0.000 claims description 2
- 102100023534 RRP15-like protein Human genes 0.000 claims description 2
- 102100034089 Receptor-type tyrosine-protein phosphatase kappa Human genes 0.000 claims description 2
- 102100021280 Regulator of G-protein signaling 22 Human genes 0.000 claims description 2
- 101710148116 Regulator of G-protein signaling 22 Proteins 0.000 claims description 2
- 102100035744 Rho GTPase-activating protein 26 Human genes 0.000 claims description 2
- 102100033193 Rho guanine nucleotide exchange factor 12 Human genes 0.000 claims description 2
- 102100023361 SAP domain-containing ribonucleoprotein Human genes 0.000 claims description 2
- 102100028029 SCL-interrupting locus protein Human genes 0.000 claims description 2
- 108091006744 SLC22A1 Proteins 0.000 claims description 2
- 108091006517 SLC26A6 Proteins 0.000 claims description 2
- 108091006576 SLC34A2 Proteins 0.000 claims description 2
- 102100037375 SLIT-ROBO Rho GTPase-activating protein 3 Human genes 0.000 claims description 2
- 101150083405 SRGAP3 gene Proteins 0.000 claims description 2
- 108010011005 STAT6 Transcription Factor Proteins 0.000 claims description 2
- 102100031028 SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily A member 5 Human genes 0.000 claims description 2
- 101100279491 Schizosaccharomyces pombe (strain 972 / ATCC 24843) int6 gene Proteins 0.000 claims description 2
- 102100029392 Secretory phospholipase A2 receptor Human genes 0.000 claims description 2
- 102100037498 Selenocysteine-specific elongation factor Human genes 0.000 claims description 2
- 102100032744 Septin-5 Human genes 0.000 claims description 2
- 102100028025 Septin-8 Human genes 0.000 claims description 2
- 102100028024 Septin-9 Human genes 0.000 claims description 2
- 102100020814 Sequestosome-1 Human genes 0.000 claims description 2
- 102100031975 Shootin-1 Human genes 0.000 claims description 2
- 102100023980 Signal transducer and activator of transcription 6 Human genes 0.000 claims description 2
- 102100023007 Single-stranded DNA-binding protein 2 Human genes 0.000 claims description 2
- 102100039166 Sister chromatid cohesion protein PDS5 homolog A Human genes 0.000 claims description 2
- 102100038437 Sodium-dependent phosphate transport protein 2B Human genes 0.000 claims description 2
- 102100024397 Soluble calcium-activated nucleotidase 1 Human genes 0.000 claims description 2
- 102100032416 Solute carrier family 22 member 1 Human genes 0.000 claims description 2
- 102100035281 Solute carrier family 26 member 6 Human genes 0.000 claims description 2
- 102100026901 Sorbin and SH3 domain-containing protein 2 Human genes 0.000 claims description 2
- 102100027780 Splicing factor, proline- and glutamine-rich Human genes 0.000 claims description 2
- 102100021996 Staphylococcal nuclease domain-containing protein 1 Human genes 0.000 claims description 2
- 102100028898 Striatin Human genes 0.000 claims description 2
- 102100028856 Sushi domain-containing protein 1 Human genes 0.000 claims description 2
- 102100036234 Synaptonemal complex protein 1 Human genes 0.000 claims description 2
- 102100037220 Syndecan-4 Human genes 0.000 claims description 2
- 108091007283 TRIM24 Proteins 0.000 claims description 2
- 102100029773 Tether containing UBX domain for GLUT4 Human genes 0.000 claims description 2
- 102100029689 Thyroid hormone receptor-associated protein 3 Human genes 0.000 claims description 2
- 102100026430 Transcription elongation factor A protein 1 Human genes 0.000 claims description 2
- 102100021123 Transcription factor 12 Human genes 0.000 claims description 2
- 102100035101 Transcription factor 7-like 2 Human genes 0.000 claims description 2
- 102100024207 Transcription factor COE1 Human genes 0.000 claims description 2
- 102100038313 Transcription factor E2-alpha Human genes 0.000 claims description 2
- 102100025171 Transcription initiation factor TFIID subunit 12 Human genes 0.000 claims description 2
- 102100022011 Transcription intermediary factor 1-alpha Human genes 0.000 claims description 2
- 102100034777 Transcriptional adapter 2-alpha Human genes 0.000 claims description 2
- 102100027049 Transforming acidic coiled-coil-containing protein 1 Human genes 0.000 claims description 2
- 102100037718 Transmembrane and coiled-coil domains protein 1 Human genes 0.000 claims description 2
- 102100024944 Tropomyosin alpha-4 chain Human genes 0.000 claims description 2
- 102100030286 Tubulin-specific chaperone cofactor E-like protein Human genes 0.000 claims description 2
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 claims description 2
- 102100026563 Type-1 angiotensin II receptor-associated protein Human genes 0.000 claims description 2
- 102100022596 Tyrosine-protein kinase ABL1 Human genes 0.000 claims description 2
- 102100022865 UPF0606 protein KIAA1549 Human genes 0.000 claims description 2
- 102100024861 Ubiquitin-conjugating enzyme E2 L3 Human genes 0.000 claims description 2
- 102100030409 Unconventional myosin-Va Human genes 0.000 claims description 2
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 claims description 2
- 201000005969 Uveal melanoma Diseases 0.000 claims description 2
- 102100034167 Vasculin-like protein 1 Human genes 0.000 claims description 2
- 102100023019 Vesicle transport through interaction with t-SNAREs homolog 1A Human genes 0.000 claims description 2
- 102100029471 WD repeat and FYVE domain-containing protein 2 Human genes 0.000 claims description 2
- 102100029476 WD repeat and coiled-coil-containing protein Human genes 0.000 claims description 2
- 102100038258 Wnt inhibitory factor 1 Human genes 0.000 claims description 2
- 108700031763 Xeroderma Pigmentosum Group D Proteins 0.000 claims description 2
- 108010016200 Zinc Finger Protein GLI1 Proteins 0.000 claims description 2
- 102100036643 Zinc finger CCCH domain-containing protein 7B Human genes 0.000 claims description 2
- 102100025400 Zinc finger CCHC domain-containing protein 8 Human genes 0.000 claims description 2
- 102100026582 Zinc finger and SCAN domain-containing protein 30 Human genes 0.000 claims description 2
- 102100040731 Zinc finger protein 384 Human genes 0.000 claims description 2
- 102100035868 Zinc finger protein 444 Human genes 0.000 claims description 2
- 102100027850 Zinc finger protein 700 Human genes 0.000 claims description 2
- 102100028376 Zinc finger protein 703 Human genes 0.000 claims description 2
- 102100035535 Zinc finger protein GLI1 Human genes 0.000 claims description 2
- 102100029504 Zinc finger protein RFP Human genes 0.000 claims description 2
- 108010005713 bis(5'-adenosyl)triphosphatase Proteins 0.000 claims description 2
- 239000000872 buffer Substances 0.000 claims description 2
- 102100032791 cAMP-dependent protein kinase catalytic subunit alpha Human genes 0.000 claims description 2
- 102100037490 cAMP-dependent protein kinase type I-alpha regulatory subunit Human genes 0.000 claims description 2
- 102100021204 cAMP-dependent protein kinase type II-alpha regulatory subunit Human genes 0.000 claims description 2
- 201000010881 cervical cancer Diseases 0.000 claims description 2
- 230000003081 coactivator Effects 0.000 claims description 2
- 208000026045 malignant tumor of parathyroid gland Diseases 0.000 claims description 2
- 102000006255 nuclear receptors Human genes 0.000 claims description 2
- 108020004017 nuclear receptors Proteins 0.000 claims description 2
- 201000002575 ocular melanoma Diseases 0.000 claims description 2
- 108010062219 ran-binding protein 2 Proteins 0.000 claims description 2
- 101000579425 Homo sapiens Proto-oncogene tyrosine-protein kinase receptor Ret Proteins 0.000 claims 22
- 102100028286 Proto-oncogene tyrosine-protein kinase receptor Ret Human genes 0.000 claims 22
- 102000012132 Peroxisome proliferator-activated receptor gamma Human genes 0.000 claims 9
- 101710115516 Nuclear receptor coactivator 4 Proteins 0.000 claims 8
- 101150044182 8 gene Proteins 0.000 claims 2
- 102000002673 NFATC Transcription Factors Human genes 0.000 claims 2
- 239000002777 nucleoside Substances 0.000 claims 2
- 150000003833 nucleoside derivatives Chemical class 0.000 claims 2
- 101100408329 Caenorhabditis elegans pcm-1 gene Proteins 0.000 claims 1
- 101150092859 Cd74 gene Proteins 0.000 claims 1
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 claims 1
- 239000012062 aqueous buffer Substances 0.000 claims 1
- 208000024207 chronic leukemia Diseases 0.000 claims 1
- 230000004927 fusion Effects 0.000 description 86
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 27
- 101000974343 Homo sapiens Nuclear receptor coactivator 4 Proteins 0.000 description 14
- 238000007481 next generation sequencing Methods 0.000 description 14
- 102100038825 Peroxisome proliferator-activated receptor gamma Human genes 0.000 description 12
- 101000741790 Homo sapiens Peroxisome proliferator-activated receptor gamma Proteins 0.000 description 11
- 238000001890 transfection Methods 0.000 description 11
- 238000003556 assay Methods 0.000 description 10
- 201000011510 cancer Diseases 0.000 description 10
- 238000002360 preparation method Methods 0.000 description 10
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 9
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 9
- 238000010790 dilution Methods 0.000 description 9
- 239000012895 dilution Substances 0.000 description 9
- 201000010099 disease Diseases 0.000 description 9
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 9
- 238000012163 sequencing technique Methods 0.000 description 9
- 238000004520 electroporation Methods 0.000 description 8
- 239000012634 fragment Substances 0.000 description 8
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 6
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 5
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 5
- 210000004072 lung Anatomy 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 4
- 201000009030 Carcinoma Diseases 0.000 description 4
- ZRALSGWEFCBTJO-UHFFFAOYSA-N Guanidine Chemical compound NC(N)=N ZRALSGWEFCBTJO-UHFFFAOYSA-N 0.000 description 4
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000001851 biosynthetic effect Effects 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- QPJVMBTYPHYUOC-UHFFFAOYSA-N methyl benzoate Chemical compound COC(=O)C1=CC=CC=C1 QPJVMBTYPHYUOC-UHFFFAOYSA-N 0.000 description 4
- 210000004940 nucleus Anatomy 0.000 description 4
- 238000003753 real-time PCR Methods 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 210000001685 thyroid gland Anatomy 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- 208000017604 Hodgkin disease Diseases 0.000 description 3
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 3
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 3
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 3
- 208000034578 Multiple myelomas Diseases 0.000 description 3
- CTQNGGLPUBDAKN-UHFFFAOYSA-N O-Xylene Chemical compound CC1=CC=CC=C1C CTQNGGLPUBDAKN-UHFFFAOYSA-N 0.000 description 3
- 206010035226 Plasma cell myeloma Diseases 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 3
- 239000000834 fixative Substances 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 239000002953 phosphate buffered saline Substances 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 239000008096 xylene Substances 0.000 description 3
- 101150084750 1 gene Proteins 0.000 description 2
- 101150028074 2 gene Proteins 0.000 description 2
- 201000003076 Angiosarcoma Diseases 0.000 description 2
- 244000300022 Bauhinia malabarica Species 0.000 description 2
- 235000018906 Bauhinia malabarica Nutrition 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 208000001976 Endocrine Gland Neoplasms Diseases 0.000 description 2
- 208000000527 Germinoma Diseases 0.000 description 2
- SXRSQZLOMIGNAQ-UHFFFAOYSA-N Glutaraldehyde Chemical compound O=CCCCC=O SXRSQZLOMIGNAQ-UHFFFAOYSA-N 0.000 description 2
- 208000001258 Hemangiosarcoma Diseases 0.000 description 2
- 210000005131 Hürthle cell Anatomy 0.000 description 2
- 208000018142 Leiomyosarcoma Diseases 0.000 description 2
- 208000006644 Malignant Fibrous Histiocytoma Diseases 0.000 description 2
- 101100091501 Mus musculus Ros1 gene Proteins 0.000 description 2
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 2
- CHJJGSNFBQVOTG-UHFFFAOYSA-N N-methyl-guanidine Natural products CNC(N)=N CHJJGSNFBQVOTG-UHFFFAOYSA-N 0.000 description 2
- 108010065868 RNA polymerase SP6 Proteins 0.000 description 2
- 206010039491 Sarcoma Diseases 0.000 description 2
- 201000010208 Seminoma Diseases 0.000 description 2
- 208000015778 Undifferentiated pleomorphic sarcoma Diseases 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical group O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- COQLPRJCUIATTQ-UHFFFAOYSA-N Uranyl acetate Chemical compound O.O.O=[U]=O.CC(O)=O.CC(O)=O COQLPRJCUIATTQ-UHFFFAOYSA-N 0.000 description 2
- 229960000583 acetic acid Drugs 0.000 description 2
- 229940022682 acetone Drugs 0.000 description 2
- 208000009956 adenocarcinoma Diseases 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 239000004202 carbamide Substances 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 239000002738 chelating agent Substances 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 201000010902 chronic myelomonocytic leukemia Diseases 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 239000007857 degradation product Substances 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- SWSQBOPZIKWTGO-UHFFFAOYSA-N dimethylaminoamidine Natural products CN(C)C(N)=N SWSQBOPZIKWTGO-UHFFFAOYSA-N 0.000 description 2
- 201000011523 endocrine gland cancer Diseases 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 201000003115 germ cell cancer Diseases 0.000 description 2
- 201000010985 invasive ductal carcinoma Diseases 0.000 description 2
- 201000005992 juvenile myelomonocytic leukemia Diseases 0.000 description 2
- 206010024627 liposarcoma Diseases 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 229940095102 methyl benzoate Drugs 0.000 description 2
- 208000009091 myxoma Diseases 0.000 description 2
- 229910000489 osmium tetroxide Inorganic materials 0.000 description 2
- 201000010198 papillary carcinoma Diseases 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 229940075930 picrate Drugs 0.000 description 2
- OXNIZHLAWKMVMX-UHFFFAOYSA-M picrate anion Chemical compound [O-]C1=C([N+]([O-])=O)C=C([N+]([O-])=O)C=C1[N+]([O-])=O OXNIZHLAWKMVMX-UHFFFAOYSA-M 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 2
- 239000003161 ribonuclease inhibitor Substances 0.000 description 2
- 201000000849 skin cancer Diseases 0.000 description 2
- 208000000587 small cell lung carcinoma Diseases 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 206010041823 squamous cell carcinoma Diseases 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 208000030901 thyroid gland follicular carcinoma Diseases 0.000 description 2
- 206010044412 transitional cell carcinoma Diseases 0.000 description 2
- 208000010576 undifferentiated carcinoma Diseases 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 229940074411 xylene Drugs 0.000 description 2
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 206010001197 Adenocarcinoma of the cervix Diseases 0.000 description 1
- 208000034246 Adenocarcinoma of the cervix uteri Diseases 0.000 description 1
- 102100032157 Adenylate cyclase type 10 Human genes 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 206010004146 Basal cell carcinoma Diseases 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 206010048832 Colon adenoma Diseases 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102100030012 Deoxyribonuclease-1 Human genes 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000775498 Homo sapiens Adenylate cyclase type 10 Proteins 0.000 description 1
- 101000843809 Homo sapiens Hydroxycarboxylic acid receptor 2 Proteins 0.000 description 1
- 101001057159 Homo sapiens Melanoma-associated antigen C3 Proteins 0.000 description 1
- 101000883798 Homo sapiens Probable ATP-dependent RNA helicase DDX53 Proteins 0.000 description 1
- 101001000119 Homo sapiens Unconventional myosin-If Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 102000009664 Microtubule-Associated Proteins Human genes 0.000 description 1
- 108010020004 Microtubule-Associated Proteins Proteins 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 101100058191 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) bcp-1 gene Proteins 0.000 description 1
- 102100034404 Nuclear factor of activated T-cells, cytoplasmic 1 Human genes 0.000 description 1
- 102100034400 Nuclear factor of activated T-cells, cytoplasmic 2 Human genes 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- 102100038236 Probable ATP-dependent RNA helicase DDX53 Human genes 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000052575 Proto-Oncogene Human genes 0.000 description 1
- 108700020978 Proto-Oncogene Proteins 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical group O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 1
- 102100035825 Unconventional myosin-If Human genes 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 238000010923 batch production Methods 0.000 description 1
- 201000009036 biliary tract cancer Diseases 0.000 description 1
- 208000020790 biliary tract neoplasm Diseases 0.000 description 1
- 201000008275 breast carcinoma Diseases 0.000 description 1
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 108091092328 cellular RNA Proteins 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 201000006662 cervical adenocarcinoma Diseases 0.000 description 1
- 201000010897 colon adenocarcinoma Diseases 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 208000035250 cutaneous malignant susceptibility to 1 melanoma Diseases 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000018044 dehydration Effects 0.000 description 1
- 238000006297 dehydration reaction Methods 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 229940071106 ethylenediaminetetraacetate Drugs 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 201000006585 gastric adenocarcinoma Diseases 0.000 description 1
- 208000014829 head and neck neoplasm Diseases 0.000 description 1
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010039 intracellular degradation Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 201000005243 lung squamous cell carcinoma Diseases 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 208000026037 malignant tumor of neck Diseases 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000001921 nucleic acid quantification Methods 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 201000005825 prostate adenocarcinoma Diseases 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 208000020352 skin basal cell carcinoma Diseases 0.000 description 1
- 201000008261 skin carcinoma Diseases 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007711 solidification Methods 0.000 description 1
- 230000008023 solidification Effects 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000007482 whole exome sequencing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0634—Cells from the blood or the immune system
- C12N5/0635—B lymphocytes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0652—Cells of skeletal and connective tissues; Mesenchyme
- C12N5/0656—Adult fibroblasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N1/00—Sampling; Preparing specimens for investigation
- G01N1/28—Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
- G01N1/30—Staining; Impregnating ; Fixation; Dehydration; Multistep processes for preparing samples of tissue, cell or nucleic acid material and the like for analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N1/00—Sampling; Preparing specimens for investigation
- G01N1/28—Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
- G01N1/36—Embedding or analogous mounting of samples
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/112—Disease subtyping, staging or classification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/166—Oligonucleotides used as internal standards, controls or normalisation probes
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N1/00—Sampling; Preparing specimens for investigation
- G01N1/28—Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
- G01N1/30—Staining; Impregnating ; Fixation; Dehydration; Multistep processes for preparing samples of tissue, cell or nucleic acid material and the like for analysis
- G01N2001/305—Fixative compositions
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Pathology (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Cell Biology (AREA)
- General Physics & Mathematics (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Hematology (AREA)
- Rheumatology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Rod-Shaped Construction Members (AREA)
- Road Signs Or Road Markings (AREA)
Abstract
Un ácido nucleico, que comprende una pluralidad de secuencias de nucleótidos, en donde: cada secuencia de nucleótidos de la pluralidad comprende una primera subsecuencia y una segunda subsecuencia; la primera subsecuencia comprende una secuencia 3' de un primer exón; la segunda subsecuencia comprende una secuencia 5' de un segundo exón; la primera subsecuencia y la segunda subsecuencia son secuencias adyacentes en el ácido nucleico; la primera subsecuencia y la segunda subsecuencia tienen cada una al menos 20 nucleótidos de longitud; la primera subsecuencia está en 5' con respecto a la segunda subsecuencia en el ácido nucleico; el primer exón es un exón de un primer gen; el segundo exón es un exón de un segundo gen; el primer gen y el segundo gen son genes diferentes; y cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos comprende una secuencia 3' de un primer exón que es diferente de cada otro primer exón de las secuencias de nucleótidos de la pluralidad o una secuencia 5' de un segundo exón que es diferente de cada otro segundo exón de las secuencias de nucleótidos de la pluralidad.
Description
DESCRIPCIÓN
Materiales de referencia celulares multiplex
SOLICITUDES RELACIONADAS
La presente solicitud reivindica el beneficio de prioridad para la Solicitud de Patente Provisional de Estados Unidos N.° 62/261.514, presentada el 1 de diciembre de 2015, y la Solicitud de Patente Provisional de Estados Unidos N.° 62/323.659, presentada el 16 de abril de 2016.
LISTADO DE SECUENCIAS
La presente solicitud contiene un listado de secuencias que se ha enviado electrónicamente en formato ASCII. Dicha copia ASCII, creada el 8 de agosto de 2016, se denomina SCX-007_26_SL.txt y tiene un tamaño de 40.863 bytes.
ANTECEDENTES
Los materiales de referencia basados en células son útiles como controles de proceso para analizar muestras o validar métodos. Sin embargo, los materiales de referencia son limitados en el sentido de que puede ser necesaria una colección de controles para analizar una muestra con características desconocidas. Por ejemplo, ciertos ensayos de cáncer criban una serie de biomarcadores diferentes, y cada biomarcador puede requerir un material de referencia diferente, lo que complica el análisis. Por lo tanto, son deseables enfoques simplificados para analizar muestras con características desconocidas.
Waibhav et al., 2014, BMC Genomics 15 (1): 824 desvela datos de secuencia de ARNm de adición sintética de acceso abierto para fusiones génicas de cáncer.
El documento de patente CN 103468813 B desvela un kit de ensayo de PCR (reacción en cadena de la polimerasa) cuantitativa fluorescente del gen de fusión EML4-ALK (proteína similar a 4 asociada a microtúbulos de equinodermoquinasa de linfoma anaplásico).
El documento de patente WO 2015/073080 A1 desvela una pluralidad de secuencias de ácidos nucleicos que comprenden múltiples variantes de una secuencia de referencia; y plásmidos, células, métodos y kits que comprenden los mismos.
SUMARIO
Los aspectos de la invención se refieren a ácidos nucleicos que comprenden una pluralidad de secuencias de nucleótidos, donde cada secuencia de nucleótidos corresponde a un genotipo. Las realizaciones de la invención se presentan en las reivindicaciones. Los ácidos nucleicos son útiles para desarrollar materiales de referencia biológicos que comprenden una serie de genotipos diferentes. Estos materiales de referencia tienen muchas ventajas. Por ejemplo, cada genotipo de un ácido nucleico aparecerá en un material de referencia con la misma frecuencia, lo que simplifica la preparación del material de referencia. Además, se pueden combinar diferentes ácidos nucleicos para permitir combinaciones mayores de diferentes genotipos con respecto al de las colecciones de ácidos nucleicos que comprenden cada una un solo genotipo.
BREVE DESCRIPCIÓN DE LAS FIGURAS
La Figura 1 muestra dos realizaciones de la invención, etiquetadas como "Constructo de ARN N.° 1" y "Constructo de ARN N.° 2." Cada constructo comprende una protección 5' [m7G(5')ppp(5')G], etiquetada como "protección 5'", y una cola de poli-A. Cada constructo comprende seis secuencias de nucleótidos que consisten en dos subsecuencias cada una, en donde cada secuencia de nucleótidos está asociada a cáncer. Por ejemplo, la primera secuencia de nucleótidos del Constructo de ARN N.° 1 consiste en una subsecuencia del exón 13 de e ML4 y una subsecuencia del exón 20 de ALK, para servir como control para una fusión exón 13 de EML4-exón 20 de ALK, que está asociada a cáncer de pulmón no microcítico. Los constructos son ejemplos de materiales de referencia de oncología multiplex. La Figura 1 también muestra un diagrama de flujo para construir materiales de referencia a partir de los constructos o a partir de otros ácidos nucleicos multiplexados. La Figura 1 también desvela dos casos de SEQ ID NO: 13.
La Figura 2 muestra resultados de secuenciación de nueva generación para una colección de ARN preparada a partir de ácidos nucleicos extraídos de células fijadas con formalina que comprenden el Constructo N.° 1 diluido con células no transfectadas. Los resultados de la secuenciación identificaron correctamente cada fusión génica en el constructo.
Figure 3 muestra resultados de secuenciación de nueva generación para una colección de ARN preparada a partir de ácidos nucleicos extraídos de células fijadas con formalina que comprenden el Constructo N.° 2 diluido con células no transfectadas. Los resultados de la secuenciación identificaron correctamente cada fusión génica en el constructo.
La Figura 4 es un gráfico que muestra el número de lecturas a través de cada unión que abarca una fusión génica del Constructo N.° 1, que se transfectó en células humanas que se fijaron con formalina y se diluyó con células no transfectadas.
La Figura 5 es un gráfico que muestra el número de lecturas a través de cada unión que abarca una fusión génica del Constructo N.° 2, que se transfectó en células humanas que se fijaron con formalina y se diluyó con células no transfectadas.
La Figura 6 es un gráfico que muestra el número de lecturas a través de cada unión que abarca una fusión génica del Constructo N.° 1, que se transfectó en células humanas que se fijaron con formalina y se diluyó con células no transfectadas.
La Figura 7 es un gráfico que muestra el número de lecturas a través de cada unión que abarca una fusión génica del Constructo N.° 2, que se transfectó en células humanas que se fijaron con formalina y se diluyó con células no transfectadas.
La Figura 8 es un gráfico que muestra el número de lecturas a través de cada unión que abarca una fusión génica de (1) una muestra embebida en parafina y fijada con formalina diluida a una proporción de constructo de fusión con respecto a célula de 1:1.000 que se describe en el Ejemplo 4 ("FFPE Medio") y (2) una muestra preparada de forma similar con aproximadamente cinco veces más de células que se describe en el Ejemplo 5 ("102380").
La Figura 9 es un gráfico que muestra la distribución de tamaño de ARN extraído del material de referencia 102380, que se describe en los Ejemplos 5 y 6.
DESCRIPCIÓN DETALLADA
Los aspectos de la invención se refieren a ácidos nucleicos que comprenden una serie de genotipos diferentes para uso en la producción de materiales de referencia biológicos. Un material de referencia biológico puede comprender, por ejemplo, una célula que comprende tal ácido nucleico. Un ácido nucleico que comprenda varios genotipos diferentes de interés se puede usar para transfectar un grupo de células para generar un material de referencia que comprenda cada genotipo del ácido nucleico. El formato de ácido nucleico único es deseable por muchas razones. Por ejemplo, tener una serie de genotipos en un solo ácido nucleico simplifica la cuantificación del ácido nucleico porque es necesario cuantificar con precisión un ácido nucleico solo una vez. Este formato también permite "mega" mezclas (mezclas de múltiples ácidos nucleicos, cada uno portando múltiples genotipos diferentes) lo que permite incorporar cientos de genotipos en el mismo control, por ejemplo, permitiendo de ese modo un control biosintético que imita múltiples variantes heterocigóticas. Además, los ácidos nucleicos que comprenden una serie de genotipos diferentes permiten transfectar cuantitativamente cada genotipo en una célula a la misma concentración. Algunas ventajas para los usuarios finales incluyen la confirmación de que los genotipos se evaluaron en un ensayo de secuenciación del exoma completo (ensayo de WES) y la confirmación de que se detectaron genotipos difíciles de secuenciar en una serie de secuenciación usando el material de referencia como control positivo. Por último, los controles multiplexados son más baratos que las colecciones de numerosos controles de un solo mutante.
I. ÁCIDOS NUCLEICOS
En algunos aspectos, la invención se refiere a un ácido nucleico, que comprende una pluralidad de secuencias de nucleótidos, en donde cada secuencia de nucleótidos de la pluralidad está asociada a una enfermedad o afección. El ácido nucleico puede ser ADN o ARN. Cuando el término se refiere a ARN, cada timina T de una secuencia de nucleótidos se puede sustituir con uracilo U. Un ácido nucleico como se describe en el presente documento se puede denominar "ácido nucleico de longitud completa" con fines de claridad, por ejemplo, para diferenciar un ácido nucleico y fragmento del mismo.
Cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos puede comprender una primera subsecuencia y una segunda subsecuencia, en donde la primera subsecuencia comprende una secuencia 3' de un primer exón, la segunda subsecuencia comprende una secuencia 5' de un segundo exón, y la primera subsecuencia y la segunda subsecuencia son secuencias adyacentes en el ácido nucleico (y en la secuencia de nucleótidos). La primera subsecuencia puede estar en 5' con respecto a la segunda subsecuencia, es decir, la primera subsecuencia puede aparecer primero en la secuencia de nucleótidos y seguida inmediatamente por la segunda subsecuencia. El primer exón puede ser de un primer gen, y el segundo exón puede ser de un segundo gen, por ejemplo, en donde el primer gen y el segundo gen son genes diferentes. Por lo tanto, cada secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos puede replicar una fusión génica, por ejemplo, de un ARNm procesado incorrectamente, en donde el ARNm procesado incorrectamente contiene exones de dos genes diferentes. Cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos puede comprender una secuencia 3' de un primer exón diferente y/o una secuencia 5' de un segundo exón diferente.
El ARNm que comprende una fusión génica se produce a menudo en células enfermas, incluyendo células cancerosas, y una secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos puede, por lo tanto, ser una secuencia de nucleótidos de origen natural. Sin embargo, no se conocer si en la naturaleza se produce la combinación de múltiples fusiones génicas en un solo ácido nucleico de acuerdo con diversas realizaciones de la invención. La primera subsecuencia y la segunda subsecuencia pueden estar adyacentes "en marco" de modo que la traducción de la secuencia de nucleótidos que comprende la primera subsecuencia y la segunda subsecuencia
podría dar como resultado un polipéptido.
Una secuencia de nucleótidos puede estar asociada a una enfermedad o afección si un sujeto que tiene la secuencia presenta mayor riesgo de desarrollar la enfermedad o afección. Una secuencia de nucleótidos puede estar asociada a una enfermedad o afección si su presencia o ausencia se correlaciona con la progresión o gravedad de una enfermedad o afección. Por ejemplo, ciertas secuencias de nucleótidos están correlacionadas con la agresividad de diversas neoplasias tales como adenocarcinomas, carcinomas de células transicionales, neuroblastomas, AML, CML, CMML, JMML, ALL, linfoma de Burkitt, linfoma de Hodgkin, mieloma de células plasmáticas, carcinoma hepatocelular, carcinoma de pulmón macrocítico, carcinoma de pulmón no microcítico, carcinoma de células escamosas, neoplasia pulmonar, adenocarcinomas ductales, tumores endocrinos, carcinoma de células basales, melanomas malignos, angiosarcoma, leiomiosarcoma, liposarcoma, rabdomiosarcoma, mixoma, histiocitoma fibroso maligno-sarcoma pleomórfico, germinoma, seminoma, carcinoma anaplásico, carcinoma folicular, carcinoma papilar, y carcinoma de células de Hurthle. Por ejemplo, se sabe que en diversos cánceres se producen fusiones génicas, que incluyen cáncer de pulmón, cáncer de pulmón no microcítico, cáncer de tejido blando, cáncer linfoide, leucemia linfoide aguda, leucemia mieloide aguda, leucemia mielógena crónica, linfoma no Hodgkin, linfoma de Burkitt, melanoma, melanoma intraocular, cáncer del sistema nervioso central, neuroblastoma, cáncer de tiroides, cáncer de paratiroides, cáncer hepatocelular, cáncer de estómago, cáncer de intestino grueso, cáncer de colon, cáncer del tracto urinario, cáncer de vejiga, cáncer de riñón, cáncer de próstata, cáncer de cuello uterino, cáncer de ovario, o cáncer de mama.
Una pluralidad de secuencias de nucleótidos puede comprender al menos 2 secuencias de nucleótidos, por ejemplo, al menos 2 secuencias de nucleótidos que no superponen sobre el ácido nucleico. Una pluralidad de secuencias de nucleótidos puede comprender al menos 3, al menos 4, al menos 5, al menos 6, al menos 7, al menos 8, al menos 9, o al menos 10 secuencias de nucleótidos. Una pluralidad de secuencias de nucleótidos puede comprender de 2 a 1.000 secuencias de nucleótidos (por ejemplo, de 2 a 1.000 secuencias de nucleótidos que no se superponen). Una pluralidad de secuencias de nucleótidos puede comprender de 2 a 100 secuencias de nucleótidos, tal como de 2 a 50, de 2 a 20, de 2 a 12, de 3 a 1.000, de 3 a 100, de 3 a 50, de 3 a 20, de 3 a 12, de 4 a 1.000, de 4 a 100, de 4 a 50, de 4 a 20, de 4 a 12, de 5 a 1.000, de 5 a 100, de 5 a 50, de 5 a 20, de 5 a 12, de 6 a 1.000, de 6 a 100, de 6 a 50, de 6 a 20, de 6 a 12, de 7 a 1.000, de 7 a 100, de 7 a 50, de 7 a 20, de 7 a 12, de 8 a 1.000, de 8 a 100, de 8 a 50, de 8 a 20, de 8 a 12, de 9 a 1.000, de 9 a 100, de 9 a 50, de 9 a 20, de 9 a 12, de 10 a 1.000, de 10 a 100, de 10 a 50, de 10 a 20, de 10 a 16, o de 10 a 12 secuencias de nucleótidos. Una pluralidad de secuencias de nucleótidos puede consistir en 2, 3, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, o 200 secuencias de nucleótidos diferentes.
En ciertas realizaciones, cada secuencia de nucleótidos de una pluralidad es la secuencia de nucleótidos de un gen o ARNm de origen natural (por ejemplo, un gen o ARNm que está asociado a una enfermedad o a una afección de interés) o una subsecuencia de los mismos. Un gen o ARNm de origen natural incluye genotipos sanos y genotipos que están asociados a una enfermedad o afección. El término "genotipo" se refiere a un rasgo genético, tal como una variante de corte y empalme o fusión génica. Por ejemplo, una secuencia de nucleótidos puede comprender una subsecuencia de una fusión génica, y en tales realizaciones, la subsecuencia puede comprender una parte de cada gen de la fusión génica. En ciertas realizaciones, cada secuencia de nucleótidos de una pluralidad comprende un genotipo, por ejemplo, una unión de una fusión génica. Una secuencia de nucleótidos de una pluralidad puede comprender un genotipo sano en una secuencia de nucleótidos en donde se sabe que se producen variantes de corte y empalme o fusiones génicas perjudiciales. Una secuencia de nucleótidos de una pluralidad puede comprender un exón de un gen o una subsecuencia de un exón. Una secuencia de nucleótidos puede consistir en un exón de un primer gen, o una subsecuencia del mismo, y un exón de un segundo gen, o una subsecuencia del mismo.
Una secuencia de nucleótidos puede comprender más de un exón de un primer gen (por ejemplo, cualquiera de dos exones consecutivos, completos o un exón completo y una subsecuencia de un segundo exón, consecutivo), y un exón de un segundo gen, o una subsecuencia del mismo. Una secuencia de nucleótidos puede comprender un exón de un primer gen o una subsecuencia del mismo, y más de un exón de un segundo gen (por ejemplo, cualquiera de dos exones consecutivos, completos o un exón completo y una subsecuencia de un segundo exón, consecutivo). Una secuencia de nucleótidos puede comprender más de un exón del mismo gen, por ejemplo, cuando un solo exón no es lo suficientemente largo para su identificación de manera fiable mediante secuenciación de nueva generación.
En ciertas realizaciones, cada secuencia de nucleótidos de una pluralidad es lo suficientemente larga para su identificación mediante secuenciación de ácidos nucleicos, por ejemplo, secuenciación de nueva generación (NGS). En ciertas realizaciones, una secuencia de nucleótidos de una pluralidad comprende un genotipo de interés en una
posición que pueda ser identificada mediante secuenciación de ácidos nucleicos, por ejemplo, el genotipo de interés, tal como una fusión génica (por ejemplo, punto de ruptura de fusión génica), puede estar ubicado en o cerca de la mitad de la secuencia de nucleótidos.
Un ácido nucleico puede tener de 1.000 nucleótidos a aproximadamente 100.000 nucleótidos de longitud, tal como de aproximadamente 3.000 a aproximadamente 60.000 nucleótidos de longitud, de aproximadamente 5.000 a aproximadamente 50.000 nucleótidos de longitud, o de aproximadamente 8.000 a aproximadamente 20.000 nucleótidos de longitud.
Una secuencia de nucleótidos de una pluralidad puede tener al menos 20 nucleótidos (o pares de bases) de longitud, tal como al menos 20, 30, 40, 50, 60, 70, 80, 90, 100, 120, 150, 200, o al menos 250 nucleótidos (o pares de bases) de longitud. Una secuencia de nucleótidos de una pluralidad puede ten .000 nucleótidos (o pares de bases) de longitud, tal como de 20 a 5.000, de 20 a 2.000, de 20 a 1.00 de 30 a 5.000, de
30 a 2.000, de 30 a 1.000, de 30 a 500, de 40 a 5.000, 2.000, de 40 a 1.000, de 4 50 a 2.000, de 50 a 1.000, de 500, 60 a 5.000, 2.000, de 60 a 1.000, de 6 70 a 2.000, de 70 a 1.000, de 70 a 500, de 80 a 5.000, 2.000, de 80 a 1.000, de 8 90 a 2.000, de 90 a 1.000, de 90 a 500, de 100 a 5.000, de 100 a 2.000, de 1.000, de 100 a 500, de 120 5.000, de 120 a 2.000, de 120 a 1.000, de 120 a 500, de 150 a 5.000, de 150 a 2.0 000, de 150 a 500, de 200 a 5.000, de 200 a 2.000, de 200 a 1.000, o de 200 a 500 nucleótidos (o pares de bases) de longitud.
Una subsecuencia de una secuencia de nucleótidos (por ejemplo, primera subsecuencia o segunda subsecuencia) puede tener al menos 20 nucleótidos (o pares de bases) de longitud, tal como al menos 25, 30, 40, 50, 60, 70, 80,
90, 100, 120, 150, 200, o al menos 250 nucleótidos (o pares de bases) de longitud. Una subsecuencia de una secuencia de nucleótidos (por ejemplo, primera subsecuencia o segunda subsecuencia) puede tener de 20 a 10.000 nucleótidos (o pares de bases) de longitud, tal como de 20 a 5.000, de 20 a 2.000, de 20 a 1.000, de 20 a 500, de 25 a 5.000, de 25 a 2.000, de 25 a 1.000, de 25 a 500, de 25 a 250, de 30 a 5.000, de 30 a 2.000, de 30 a 1.000, de 30 a 500, de 30 a 250, de 30 a 5.000, de 40 a 2.000, de 40 a 1.000, de 40 a 500, de 40 a 250, de 50 a 5.000, 2.000, de 50 a 1.000, de 50 a 500, de 50 a 250, de 60 a 5.000, de 60 a 2.000, de 60 a 1.000, de 60 a 500, de 60 a 250, de 70 a 5.000, de 70 a 2.000, de 70 a 1.000, de 70 a 500, de 70 a 250, de 80 a 5.000, de 80 a 2.000, de 80 a
1.000, de 80 a 500, de 80 a 250, de 90 a 5.000, de 90 a 2.000, de 90 a 1.000, de 90 a 500, de 90 a 250, de 100 a 5.000, de 100 a 2.000, de 100 a 1.000, de 100 a 500, de 100 a 250, de 120 a 5.000, de 120 a 2.000, de 120 a 1.000, de 120 a 500, de 120 a 250, de 150 a 5.000, de 150 a 2.000, de 150 a 1.000, de 150 a 500, de 150 a 250, de 200 a
5.000, de 200 a 2.000, de 200 a 1.000, de 200 a 500, o de 200 a 250 nucleótidos (o pares de bases) de longitud.
Una secuencia de nucleótidos de una pluralidad puede comprender un genotipo de interés (por ejemplo, punto de ruptura de fusión génica) en una posición que tiene al menos 20 nucleótidos (o pares de bases) desde el extremo 5' y/o el extremo 3' de la secuencia de nucleótidos, tal como al menos 25, 30, 40, 50, 60, 70, 80, 90, 100, 120, 150,
200, o 250 nucleótidos (o pares de bases) desde el extremo 5' y/o el extremo 3' de la secuencia de nucleótidos. Una secuencia de nucleótidos de una pluralidad puede comprender un genotipo de interés (por ejemplo, punto de ruptura
de fusión génica) en una posición que tiene 20 a 5.000 nucleótidos (o pares de bases) desde el extremo 5' y/o el extremo 3' de la secuencia de nucleótidos, tal como 25 a 5.000, de 30 a 5.000, de 40 a 5.000, de 50 a 5.000, de 60 a
5.000, de 70 a 5.000, de 80 a 5.000, de 90 a 5.000, de 100 a 5.000, de 120 a 5.000, de 150 a 5.000, de 200 a 5.000, de 250 a 5.000, de 25 a 2.000, de 30 a 2.000, de 40 a 2.000, de 50 a 2.000, de 60 a 2.000, de 70 a 2.000, de 80 a
2.000, de 90 a 2.000, de 100 a 2.000, de 120 a 2.000, de 150 a 2.000, de 200 a 2.000, de 250 a 2.000, de 25 a
1.000, de 30 a 1.000, de 40 a 1.000, de 50 a 1.000, de 60 a 1.000, de 70 a 1.000, de 80 a 1.000, de 90 a 1.000, de
100 a 1.000, de 120 a 1.000, de 150 a 1.000, de 200 a 1.000, de 250 a 1.000, de 25 a 750, de 30 a 750, de 40 a
750, de 50 a 750, de 60 a 750, de 70 a 750, de 80 a 750, de 90 a 750, de 100 a 750, de 120 a 750, de 150 a 750, de
200 a 750, de 250 a 750, de 25 a 500, de 30 a 500, de 40 a 500, de 50 a 500, de 60 a 500, de 70 a 500, de 80 a
500, de 90 a 500, de 100 a 500, de 120 a 500, de 150 a 500, de 200 a 500, o de 250 a 500 nucleótidos (o pares de bases) desde el extremo 5' y/o el extremo 3' de la secuencia de nucleótidos.
En algunas realizaciones, una secuencia de nucleótidos de una pluralidad comprende una fusión génica. Por ejemplo, una secuencia de nucleótidos de una pluralidad puede comprender una primera subsecuencia y una segunda subsecuencia, en donde la primera subsecuencia comprende una secuencia 3' de un primer exón y la segunda subsecuencia comprende la secuencia 5' de un segundo exón. La primera subsecuencia y la segunda subsecuencia pueden ser secuencias adyacentes en la secuencia de nucleótidos, y la primera subsecuencia puede estar en 5' con respecto a la segunda subsecuencia. Por lo tanto, el extremo 3' de la primera subsecuencia, que consiste en el extremo 3' del primer exón, puede estar unido al extremo 5' de la segunda subsecuencia, que consiste
en el extremo 5' del segundo exón, replicando de ese modo la unión de una fusión génica. En algunas realizaciones, cada secuencia de nucleótidos de una pluralidad comprende una fusión génica. Por ejemplo, cada secuencia de nucleótidos de la pluralidad puede comprender una primera subsecuencia de un primer exón y una segunda subsecuencia de un segundo exón. En ciertas realizaciones, cada secuencia de nucleótidos de la pluralidad comprende una secuencia 3' de un primer exón diferente o una secuencia 5' de un segundo exón diferente.
Una secuencia de nucleótidos puede comprender un exón hacia arriba (5') del primer exón, en donde el exón hacia arriba y el primer exón son exones consecutivos en el mismo gen y el exón hacia arriba y el primer exón están
unidos como en un ARNm maduro, de origen natural del gen. Una secuencia de nucleótidos puede comprender un exón hacia abajo (3') del segundo exón, en donde el exón hacia abajo y el segundo exón son exones consecutivos en el mismo gen y el exón hacia abajo y el segundo exón están unidos como en un ARNm maduro, de origen natural del gen. Un exón hacia arriba o un exón hacia abajo puede ser útil, por ejemplo, cuando el primer exón o el segundo exón, respectivamente, es más corto que 200 nucleótidos de longitud (tal como más corto que 180, 160, 150, 140, 130, 120, 120, o 100 nucleótidos de longitud) porque puede ser más difícil identificar los exones cortos en ausencia de secuencia adicional del gen a partir del que se originó el exón. Por ejemplo, una primera subsecuencia puede comprender dos o más exones, en donde el primer exón de la primera subsecuencia tiene menos de 250 nucleótidos de longitud (tal como menos de 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, o 50 nucleótidos de longitud), por ejemplo, y la suma de las longitudes de los dos o más exones es al menos 50 nucleótidos de longitud (tal como al menos 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, o 250 nucleótidos de longitud). Del mismo modo, una segunda subsecuencia puede comprender dos o más exones, en donde el segundo exón de la segunda subsecuencia tiene menos de 250 nucleótidos de longitud (tal como menos de 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, o 50 nucleótidos de longitud), por ejemplo, y la suma de las longitudes de los dos o más exones es al menos 50 nucleótidos de longitud (tal como al menos 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, o 250 nucleótidos de longitud).
En algunas realizaciones, una secuencia de nucleótidos de una pluralidad comprende una fusión génica, unión compleja, corte y empalme ilegítimo, omisión de exón o unión génica compleja. Una secuencia de nucleótidos de una pluralidad puede comprender una primera subsecuencia y una segunda subsecuencia, en donde la primera subsecuencia comprende una secuencia 3' de un primer gen y la segunda subsecuencia comprende la secuencia 5' de un segundo gen. La primera subsecuencia y la segunda subsecuencia pueden ser secuencias adyacentes en la secuencia de nucleótidos, y la primera subsecuencia puede estar en 5' con respecto a la segunda subsecuencia. Por lo tanto, el extremo 3' de la primera subsecuencia, que consiste en el extremo 3' del primer gen, puede estar unido al extremo 5' de la segunda subsecuencia, que consiste en el extremo 5' del segundo gen, por ejemplo, replicando de ese modo la unión de una fusión génica. El primer gen y el segundo gen pueden ser el mismo gen o un gen diferente. En realizaciones de la invención en donde el primer gen y el segundo gen son el mismo gen, la primera subsecuencia puede aparecer hacia arriba (5') o hacia abajo (3') de la segunda subsecuencia en un genoma. La primera subsecuencia y/o segunda subsecuencia puede ser una subsecuencia de un intrón y/o exón.
Un ácido nucleico puede comprender una secuencia de nucleótidos que comprende un intrón, por ejemplo, en donde la secuencia de nucleótidos está diseñada para replicar una fusión génica o corte y empalme ilegítimo. Una secuencia de nucleótidos que comprende un intrón puede ser parte de la pluralidad de secuencias de nucleótidos o puede existir independientemente de la pluralidad de secuencias de nucleótidos. Una secuencia de nucleótidos que comprende un intrón puede comprender una primera subsecuencia y una segunda subsecuencia, en donde la primera subsecuencia comprende una secuencia 3' de un primer intrón o exón, la segunda subsecuencia comprende una secuencia 5' de un segundo intrón o exón, y la primera subsecuencia se une a la segunda subsecuencia en el ácido nucleico y en la secuencia de nucleótidos. Cualquiera de la primera subsecuencia, la segunda subsecuencia, o tanto la primera subsecuencia como la segunda subsecuencia pueden comprender un intrón. Cualquiera de la primera subsecuencia, la segunda subsecuencia, o tanto la primera subsecuencia como la segunda subsecuencia pueden comprender un exón. La primera subsecuencia puede aparecer hacia arriba (5') con respecto a la segunda subsecuencia en la secuencia de nucleótidos y ácido nucleico. Dado que la secuencia de nucleótidos comprende un intrón, puede que la secuencia de nucleótidos completa no sea capaz de traducirse en un polipéptido, por ejemplo, porque el intrón puede comprender codones de parada o codones de baja eficacia en marco con los exones de la secuencia de nucleótidos. El primer gen y el segundo gen pueden ser el mismo gen o diferentes genes.
En algunas realizaciones, un ácido nucleico puede comprender poliadenosina, por ejemplo, una cola de poliadenosina en 3' (cola de poli-A). Cualquiera de ADN o ARN puede comprender poliadenosina. Si el ADN comprende poliadenosina, el ADN puede ser bicatenario, de modo que una secuencia de poli-timidina complementaria se transcribe en ARNm que comprende una cola de poliadenosina.
Un ácido nucleico puede estar metilado o básicamente exento de nucleósidos metilados. En ciertas realizaciones, un ácido nucleico es ARN, y el ácido nucleico comprende una protección en 5'. Por ejemplo, un ARN puede comprender 7-metil guanosina, por ejemplo, en una protección de 5' [m7G(5')ppp(5')G].
En algunas realizaciones, el ácido nucleico comprende un promotor, por ejemplo, cuando el ácido nucleico es ADN. Un promotor se une a una ARN polimerasa, tal como ARN polimerasa SP6. Un promotor puede ser un promotor SP6. La secuencia de nucleótidos de un promotor puede ser de una especie diferente (por ejemplo, virus, bacteria, levadura) a una secuencia de nucleótidos de una pluralidad, por ejemplo, para transcripción in vitro de la pluralidad de secuencias de nucleótidos, que pueden ser secuencias de nucleótidos humanos). La secuencia de nucleótidos de un promotor puede ser de una especie diferente (por ejemplo, virus, bacteria, levadura) a cada secuencia de nucleótidos de una pluralidad.
En algunas realizaciones, el ácido nucleico es un plásmido, tal como un plásmido superenrollado, plásmido circular relajado, o plásmido lineal. En algunas realizaciones, el ácido nucleico comprende un origen de replicación. El origen de la replicación puede permitir la clonación y/o la producción por lotes del ácido nucleico. El origen de replicación
puede ser un origen de replicación de levadura (por ejemplo, Saccharomyces cerevisiae) o bacteria (por ejemplo, Escherichia coli), por ejemplo, de modo que el ácido nucleico se pueda clonar y/o producir en levadura (por ejemplo, Saccharomyces cerevisiae) o bacteria (por ejemplo, Escherichia coli).
En el presente documento se desvela una pluralidad de fragmentos de ácido nucleico, en donde cada ácido nucleico de la pluralidad de fragmentos de ácido nucleico es un fragmento de un ácido nucleico de longitud completa como se ha descrito en el presente documento, anteriormente, y cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos del ácido nucleico de longitud completa está codificada por al menos un fragmento de ácido nucleico de la pluralidad de fragmentos de ácido nucleico. Se puede obtener una pluralidad de fragmentos de ácido nucleico, por ejemplo, mediante procesamiento de múltiples copias de un el ácido nucleico de ARN de longitud completa, único que comprende una pluralidad de secuencias de nucleótidos, por ejemplo, mediante la transfección de células con el ácido nucleico de a Rn de longitud completa, único (por ejemplo, mediante electroporación), fijando las células (por ejemplo, con formalina), embebiendo las células (por ejemplo, en parafina), y/o extrayendo ácidos nucleicos (por ejemplo, ARN) de las células. El procesamiento de múltiples copias de un ácido nucleico de ARN de longitud completa, único que corresponde a uno de los ácidos nucleicos que se han descrito en el presente documento, mencionado anteriormente puede degradar el ácido nucleico de ARN de longitud completa, único en fragmentos de ARN más pequeños, por ejemplo, una pluralidad de fragmentos de ácido nucleico. Esta pluralidad de fragmentos de ácido nucleico puede comprender la misma pluralidad de secuencias de nucleótidos que el ácido nucleico de ARN único, pero cualquier secuencia de nucleótidos dada de la pluralidad de secuencias de nucleótidos puede aparecen en diferentes fragmentos de ácido nucleico de la pluralidad de fragmentos de ácido nucleico en lugar de en el mismo fragmento de ácido nucleico. La secuenciación de nueva generación se puede usar para identificar secuencias de nucleótidos que se producen en dos o más fragmentos de ácido nucleico de una pluralidad de fragmentos de ácido nucleico. Por lo tanto, la secuenciación de una pluralidad de fragmentos de ácido nucleico debería identificar la misma pluralidad de secuencias de nucleótidos que la secuenciación del ácido nucleico de ARN de longitud completa, único a partir del que se originó la pluralidad de fragmentos de ácido nucleico. Una pluralidad de fragmentos de ácido nucleico se pueden mezclar con ácidos nucleicos celulares (por ejemplo, ARN y/o ADN) a partir de células transfectadas con el ácido nucleico de ARN de longitud completa, único y/o células no transfectadas (por ejemplo, células no transfectadas añadidas a un material de referencia, véase a continuación). Por lo tanto, una pluralidad de fragmentos de ácido nucleico se pueden mezclar una pluralidad de fragmentos de ácido nucleico con ARN celular, tal como un transcriptoma y/o ARN ribosómico.
En algunos aspectos, la invención se refiere a un método para preparar un ácido nucleico como se describe en el presente documento. El método puede comprender incubar una mezcla de reacción que comprende un molde de ADN, ARN polimerasa, y ribonucleótido trifosfatos (por ejemplo, a una temperatura a la que la ARN polimerasa muestra actividad de polimerasa), produciendo de ese modo un ácido nucleico de ARN. El molde de ADN también puede ser un ácido nucleico como se describe en el presente documento. La ARN polimerasa puede ser de una especie diferente a las secuencias de nucleótidos de la pluralidad de secuencias de nucleótidos. Por ejemplo, la a Rn polimerasa puede ser de un virus (por ejemplo, ARN polimerasa T7; ARN polimerasa SP6), bacteria, o levadura y las secuencias de nucleótidos de la pluralidad de secuencias de nucleótidos pueden ser humanas. La ARN polimerasa puede ser ARN polimerasa II.
En el presente documento se desvela una mezcla de reacción que comprende un ácido nucleico como se describe en el presente documento, una polimerasa, y cualquiera de ribonucleótido trifosfatos o desoxirribonucleótido trifosfatos. La polimerasa puede ser una ADN polimerasa (por ejemplo, para uso con desoxirribonucleótidos trifosfatos) o una ARN polimerasa (por ejemplo, para uso con ribonucleótidos trifosfatos). La polimerasa puede ser de una especie diferente a una secuencia de nucleótidos de una pluralidad. La mezcla de reacción puede comprender un inhibidor de ARNasa, por ejemplo, de una especie diferente a una secuencia de nucleótidos de una pluralidad.
Un ácido nucleico puede comprender secuencias de nucleótidos de cualquier origen, tal como de origen viral, bacterial, protista, fúngico, vegetal o animal. En ciertas realizaciones, las secuencias de nucleótidos de una pluralidad son secuencias de nucleótidos humanos.
En algunos casos, la divulgación se refiere a una composición que comprende un ácido nucleico como se describe en el presente documento y ADN genómico. En ciertos casos, la proporción de (a) el número de copias de una secuencia de nucleótidos que corresponde a un gen en el ácido nucleico con respecto a (b) el número de copias del gen en el ADN genómico es de aproximadamente 1:15.000 a aproximadamente 500:1 en la composición, tal como de aproximadamente 1:10.000 a aproximadamente 1:500, de aproximadamente 1:5.000 a aproximadamente 500:1, de aproximadamente 1:2.000 a aproximadamente 500:1, de aproximadamente 1:1.000 a aproximadamente 500:1, de aproximadamente 1:500 a aproximadamente 500:1, de 1:5.000 a aproximadamente 100:1, de aproximadamente 1:2.000 a aproximadamente 100:1, de aproximadamente 1:1.000 a aproximadamente 100:1, de aproximadamente 1:500 a aproximadamente 100:1, de aproximadamente 1:250 a aproximadamente 100:1, de aproximadamente 1:200 a aproximadamente 100:1, de aproximadamente 1:100 a aproximadamente 100:1, de aproximadamente 1:50 a aproximadamente 50:1, de aproximadamente 1:25 a aproximadamente 25:1, de aproximadamente 1:20 a aproximadamente 20:1, o de aproximadamente 1:10 a aproximadamente 10:1 en la composición. En ciertos casos, la proporción de (a) el número de copias de una secuencia de nucleótidos que corresponde a un gen en el ácido
nucleico con respecto a (b) el número de copias del gen en el ADN genómico es aproximadamente 6:1, 4:1, aproximadamente 3:1, aproximadamente 2:1, aproximadamente 1:1, aproximadamente 1:2, aproximadamente 1:3, aproximadamente 1:4, o aproximadamente 1:6 en la composición; en ciertas realizaciones la proporción es aproximadamente 1:1.
Una composición puede comprender al menos dos ácidos nucleicos como se describe en el presente documento, por ejemplo, en donde al menos dos de los ácidos nucleicos comprenden diferentes pluralidades de secuencias de nucleótidos. Por ejemplo, una composición puede comprender una pluralidad de ácidos nucleicos como se describe en el presente documento, en donde de 2 a 50, de 2 a 40, de 2 a 30, de 2 a 20, de 2 a 10, de 2 a 9, de 2 a 8, de 2 a 7, de 2 a 6, de 2 a 5, o de 2 a 4 ácidos nucleicos de la pluralidad cada uno comprende diferentes pluralidades de secuencias de nucleótidos.
Un ácido nucleico puede comprender secuencias de nucleótidos de genes que se producen en diferentes cromosomas. Una pluralidad de secuencias de nucleótidos pueden comprender secuencias de nucleótidos de genes que se producen en 2, 3, 4, 5, 6, 7, 8, 9, o 10 diferentes cromosomas humanos.
Un ácido nucleico puede comprender la secuencia de nucleótidos que se presenta en SEQ ID NO: 11 o en SEQ ID NO: 12. Un ácido nucleico puede comprender una secuencia de nucleótidos que tiene al menos aproximadamente un 80 %, aproximadamente un 85 %, aproximadamente un 90 %, aproximadamente un 95 %, aproximadamente un 96 %, aproximadamente un 97 %, aproximadamente un 98 %, o un 99 % de identidad de secuencia con la secuencia que se presenta en SEQ ID NO: 11 o en SEQ ID NO: 12.
II. FUSIONES GÉNICAS PARA MATERIALES DE REFERENCIA DE ONCOLOGÍA
La enfermedad o afección puede ser, por ejemplo, una neoplasia, tal como cáncer. Algunas neoplasias incluyen cáncer de pulmón, cáncer linfoide, leucemia linfoide aguda, leucemia mieloide aguda, leucemia mielógena crónica, linfoma de Burkitt, linfoma de Hodgkin, mieloma de células plasmáticas, cáncer del tracto biliar, cáncer de vejiga, cáncer de hígado, cáncer pancreático, cáncer de próstata, cáncer de piel, cáncer de tiroides, cáncer de estómago, cáncer de intestino grueso, cáncer de colon, cáncer del tracto urinario, cáncer del sistema nervioso central, neuroblastoma, cáncer de riñón, cáncer de mama, cáncer de cuello uterino, cáncer testicular, y cáncer de tejido blando. La enfermedad o afección puede ser adenocarcinoma, carcinoma de células transicionales, carcinoma de mama, adenocarcinoma de cuello uterino, adenocarcinoma de colon, adenoma de colon, neuroblastoma, AML, CML, CMML, JMML, ALL, linfoma de Burkitt, linfoma de Hodgkin, mieloma de células plasmáticas, carcinoma hepatocelular, carcinoma de pulmón macrocítico, carcinoma de pulmón no microcítico, carcinoma de pulmón de células escamosas, neoplasia pulmonar, adenocarcinoma ductal, tumor endocrino, adenocarcinoma de próstata, carcinoma de piel de células basales, carcinoma de piel de células escamosas, melanoma, melanoma maligno, angiosarcoma, leiomiosarcoma, liposarcoma, rabdomiosarcoma, mixoma, histiocitoma fibroso maligno-sarcoma pleomórfico, adenocarcinoma de estómago, germinoma, seminoma, carcinoma anaplásico, carcinoma folicular, carcinoma papilar, o carcinoma de células de Hurthle. Una secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos puede estar asociada a un tumor sólido. Cada secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos puede estar asociada a un tumor sólido.
En algunas realizaciones, una secuencia de nucleótidos de una pluralidad comprende una subsecuencia de un gen seleccionado entre el grupo que consiste en tirosina quinasa receptora de linfoma anaplásico (ALK), proteína 1 similar a proteína 2 asociada al inhibidor 1 de la angiogénesis específico del cerebro (BAIAP2L1), CD74, proteína similar a 4 asociada a microtúbulos de equinodermo (EML4), variante 6 de ETS (ETV6), receptor 3 del factor de crecimiento de fibroblastos (FGFR3), cadena pesada de kinesina 1 (KIF5B), coactivador 4 de receptor nuclear (NCOA4), nucleofosmina (NPM1), receptor neurotrófico de tirosina quinasa 1 (NTRK1), receptor neurotrófico de tirosina quinasa 3 (NTRK3), gen de caja emparejada 8 (Pax8), receptor gamma activado por proliferador de peroxisomas (PPARG), protooncogén r Et (RET), protooncogén 1 de ROS (ROS1), proteína de transporte de fosfato dependiente de sodio SLC34A, proteína 3 que contiene superenrollamiento ácida transformante (TACC3), gen fusionado con TRK (TFG), y tropomiosina 3 (TPM3). En ciertas realizaciones, una secuencia de nucleótidos de la pluralidad comprende una subsecuencia de dos genes seleccionados entre el grupo que consiste en un ALK, BAIAP2L1, CD74, EML4, ETV6, FGFR3, KIF5B, NCOA4, NPM1, NTRK1, NTRK3, Pax8, PPARG, RET, ROS1, SLC34A, TACC3, TFG, y TPM3. Por ejemplo, una secuencia de nucleótidos de la pluralidad puede consistir en una subsecuencia de EML4 y una subsecuencia de ALK. Cada subsecuencia puede consistir en una subsecuencia de un único exón de uno cualquiera de los genes mencionados anteriormente. Por ejemplo, cada secuencia de nucleótidos de la pluralidad puede consistir en una subsecuencia de un exón de EML4 (por ejemplo, una subsecuencia 3') y una subsecuencia de un exón de ALK (por ejemplo, una subsecuencia 5').
En algunas realizaciones, cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de un gen seleccionado entre el grupo que consiste en ALK, BAIAP2L1, CD74, EML4, eTv6, FGFR3, KIF5B, NCOA4, NPM1, NTRK1, NTRK3, Pax8, PPARG, RET, ROS1, SLC34A, TACC3, TFG, y TPM3. En ciertas realizaciones, cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de dos genes seleccionados entre el grupo que consiste en un ALK, BAIAP2L1, CD74, EML4, ETV6, FGFR3, KIF5B, NCOA4, NPM1, NTRK1, NTRK3, Pax8, PPARG, RET, ROS1, SLC34A, TACC3, TFG, y TPM3.
En algunas realizaciones, una secuencia de nucleótidos de la pluralidad comprende una subsecuencia de un exón seleccionado entre el grupo que consiste en exón 20 de ALK, exón 2 de BAIAP2L1, exón 6 de CD74, exón 13 de EML4, exón 5 de ETV6, exón 18 de FGFR3, exón 24 de KIF5B, exón 8 de NCOA4, exón 5 de NPM1, exón NTRK1, exón 13 de NTRK3, exón 8 de Pax8, exón 1 de PPARG, exón 11 de RET, exón 12 de RET, exón 34 de ROS1, exón 4 de SLC34A, exón 11 de TACC3, exón 5 de TFG, y exón 8 de TPM3. En ciertas realizaciones, una secuencia de nucleótidos de la pluralidad comprende una subsecuencia de dos exones seleccionados entre el grupo que consiste en un exón 20 de ALK, exón 2 de BAIAP2L1, exón 6 de CD74, exón 13 de EML4, exón 5 de ETV6, exón 18 de FGFR3, exón 24 de KIF5B, exón 8 de NCOA4, exón 5 de NPM1, exón 10 de NTRK1, exón 13 de NTRK3, exón 8 de Pax8, exón 1 de PPARG, exón 11 de RET, exón 12 de RET, exón 34 de ROS1, exón 4 de SLC34A, exón 11 de TACC3, exón 5 de TFG, y exón 8 de TPM3. Por ejemplo, una secuencia de nucleótidos de la pluralidad puede consistir en una subsecuencia de exón 13 de EML4 y una subsecuencia de exón 20 de ALK.
En algunas realizaciones, cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de un exón seleccionado entre el grupo que consiste en exón 20 de ALK, exón 2 de BAIAP2L1, exón 6 de CD74, exón 13 de EML4, exón 5 de ETV6, exón 18 de FGFR3, exón 24 de KIF5B, exón 8 de NCOA4, exón 5 de NPM1, exón NTRK1, exón 13 de NTRK3, exón 8 de Pax8, exón 1 de PPARG, exón 11 de RET, exón 12 de RET, exón 34 de ROS1, exón 4 de SLC34A, exón 11 de TACC3, exón 5 de TFG, y exón 8 de TPM3. En ciertas realizaciones, cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de dos exones seleccionados entre el grupo que consiste en un exón 20 de ALK, exón 2 de BAIAP2L1, exón 6 de CD74, exón 13 de EML4, exón 5 de ETV6, exón 18 de FGFR3, exón 24 de KIF5B, exón 8 de NCOA4, exón 5 de NPM1, exón 10 de NTRK1, exón 13 de NTRK3, exón 8 de Pax8, exón 1 de PPARG, exón 11 de RET, exón 12 de RET, exón 34 de ROS1, exón 4 de SLC34A, exón 11 de TACC3, exón 5 de TFG, y exón 8 de TPM3.
En algunas realizaciones, una secuencia de nucleótidos de la pluralidad comprende una subsecuencia de dos exones (por ejemplo, una subsecuencia de un primer exón y una subsecuencia de un segundo exón), en donde el primer exón y el segundo exón, respectivamente, se seleccionan entre el grupo que consiste en exón 13 de EML4 y exón 20 de AlK; exón 5 de NPM1 y exón 20 de ALK; exón 24 de KIF5B y exón 11 de RET; exón 8 de NCOA4 y exón 12 de RET; exón 6 de CD74 y exón 34 de ROS1; exón 4 de SLC34A y exón 34 de ROS1; exón 8 de TPM3 y exón 10 de NTRK1; exón 5 de TfG y exón 10 de NTRK1; exón 18 de FGFR3 y exón 2 de BAIAP2L1; exón 18 de FGFR3 y exón 11 de TACC3; exón 8 de PAX8 y exón 1 de PPARG; y exón 5 de ETV6 y exón 13 de NTRK3. En ciertas realizaciones, una subsecuencia incluye el extremo 3' del primer exón. En ciertas realizaciones, una subsecuencia incluye el extremo 5' del segundo exón.
En algunas realizaciones, cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de dos exones (por ejemplo, una subsecuencia de un primer exón y una subsecuencia de un segundo exón), en donde el primer exón y el segundo exón, respectivamente, se seleccionan entre el grupo que consiste en exón 13 de EML4 y exón 20 de ALK; exón 5 de NPM1 y exón 20 de ALK; exón 24 de KIF5B y exón 11 de Ret; exón 8 de NCOA4 y exón
12 de RET; exón 6 de CD74 y exón 34 de Ros 1; exón 4 de SLC34A y exón 34 de Ros 1; exón 8 de TPM3 y exón 10 de NTRK1; exón 5 de TFG y exón 10 de NTRK1; exón 18 de FGFr3 y exón 2 de BAIAP2L1; exón 18 de FGFR3 y exón 11 de TACC3; exón 8 de Pax8 y exón 1 de PPARG; y exón 5 de ETV6 y exón 13 de NTRK3. En ciertas realizaciones, una subsecuencia incluye el extremo 3' del primer exón. En ciertas realizaciones, una subsecuencia incluye el extremo 5' del segundo exón.
En algunas realizaciones, una secuencia de nucleótidos de la pluralidad comprende una subsecuencia de extensión de una secuencia de nucleótidos seleccionada entre el grupo que consiste en SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID
NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, and SEQ ID
NO: 10; en donde la subsecuencia de extensión comprende una primera subsecuencia (por ejemplo, de un primer exón) y una segunda subsecuencia (por ejemplo, de un segundo exón) como se describe en el presente documento.
En algunas realizaciones, cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de extensión de una secuencia de nucleótidos seleccionada entre el grupo que consiste en SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID
NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, Y SEQ ID
NO: 10; en donde la subsecuencia de extensión comprende una primera subsecuencia (por ejemplo, de un primer exón) y una segunda subsecuencia (por ejemplo, de un segundo exón) como se describe en el presente documento.
Una secuencia de nucleótidos de la pluralidad puede comprender la secuencia de nucleótidos que se presenta en
SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID
NO: 8, SEQ ID NO: 9, o SEQ ID NO: 10. Cada secuencia de nucleótidos de la pluralidad puede comprender una secuencia de nucleótidos que se presenta en una de SEQ ID NO: 1, SEQ ID NO: 2, SEQ iD NO: 3, SEQ ID NO: 4,
SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, y SEQ ID NO: 10. Una secuencia de nucleótidos de la pluralidad puede comprender una secuencia de nucleótidos con al menos aproximadamente un
80 %, aproximadamente un 85 %, aproximadamente un 90 %, aproximadamente un 95 %, aproximadamente un
96 %, aproximadamente un 97 %, aproximadamente un 98 %, o un 99 % de identidad de secuencia con la secuencia que se presenta en SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ
ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, o SEQ ID NO: 10. Cada secuencia de nucleótidos de la pluralidad puede comprender una secuencia de nucleótidos con al menos aproximadamente un 80 %, aproximadamente un 85 %,
aproximadamente un 90 %, aproximadamente un 95 %, aproximadamente un 96 %, aproximadamente un 97 %, aproximadamente un 98 %, o un 99 % de identidad de secuencia con una secuencia que se presenta en SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, o SEQ ID NO: 10.
En algunas realizaciones, cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de un primer exón and un segundo exón, en donde el primer exón y el segundo exón, respectivamente, se seleccionan entre el grupo que consiste en un exón de ACBD6 y RRP15; ACSL3 y ETV1; ACTB y GLI1; AGPAT5 y MCPH1; AGTRAP y BRAF; AKAP9 y BRAF; ARFIP1 y FHDC1; ARID1A y MAST2; ASPSCR1 y TFE3; ATG4C y FBXO38; ATIC y ALK; BBS9 y PKD1L1; BCR y ABL1; BCR y JAK2; BRD3 y NUTM1; BRD4 y NUTM1; C2orf44 y ALK; CANT1 y ETV4; CARS y ALK; CCDC6 y RET; CD74 y NRG1; CD74 y ROS1; CDH11 y USP6; CDKN2D y WDFY2; CEP89 y BRAF; CHCHD7 y PLAG1; CIC y DUX4L1; CIC y FOXO4; CLCN6 y BRAF; CLIP1 y ROS1; CLTC y ALK; CLTC y TFE3; CNBP y USP6; COL1A1 y PDGFB; COL1A1 y USP6; COL1A2 y PLAG1; CRTC1 y MAML2; CRTC3 y MAML2; CTAGE5 y SIP1; CTNNB1 y PLAG1; DCTN1 y ALK; DDX5 y ETV4; DNAJB1 y PRKACA; EIF3E y RSPO2; EIF3K y CYP39A1; EML4 y ALK; EPC1 y PHF1; ERC1 y RET; ERC1 y ROS1; ERO1L y FERMT2; ESRP1 y RAF1; ETV6 e ITPR2; ETV6 y JAK2; ETV6 y NTRK3; EWSR1 y ATF1; EWSR1 y CREB1; EWSR1 y DDIT3; EWSR1 y ERG; EWSR1 y ETV1; EWSR1 y ETV4; EWSR1 y FEV; EWSR1 y FLI1; EWSR1 y NFATC1; EWSR1 y NFATC2; EWSR1 y NR4A3; EWSR1 y PATZ1; EWSR1 y PBX1; EWSR1 y POU5F1; EWSR1 y SMARCA5; EWSR1 y SP3; EWSR1 y WT1; EWSR1 y YY1; EWSR1 y ZNF384; EWSR1 y ZNF444; EZR y ROS1; FAM131B y BRAF; FBXL18 y RNF216; FCHSD1 y BRAF; FGFR1 y ZNF703; FGFR1 y PLAG1; FGFR1 y TACC1; FGFR3 y BAIAP2L1; FGFR3 y TACC3; FN1 y ALK; FUS y ATF1; FUS y CREB3L1; FUS y CREB3L2; FUS y DDIT3; FUS y ERG; FUS y FEV; GATM y BRAF; GMDS y PDE8B; GNAI1 y BRAF; GOLGA5 y RET; GOPC y ROS1; GPBP1L1 y MAST2; HACL1 y RAF1; HAS2 y PLAG1; HERPUD1 y BRAF; HEY1 y NCOA2; HIP1 y ALK; HLA-A y ROS1; HMGA2 y ALDH2; HMGA2 y CCNB1IP1; HMGA2 y COX6C; HMGA2 y EBF1; HMGA2 y FHIT; HMGA2 y LHFP; HMGA2 y LPP; HMGA2 y NFIB; HMGA2 y RAD51B; HMGA2 y WIF1; HN1 y USH1G; HNRNPA2B1 y ETV1; HOOK3 y RET; IL6R y ATP8B2; INTS4 y GAB2; IRF2BP2 y CDX1; JAZF1 y PHF1; JAZF1 y SUZ12; KIAA1549 y BRAF; KIAA1598 y ROS1; KIF5B y ALK; KIF5B y RET; KLC1 y ALK; KLK2 y ETV1; KLK2 y ETV4; KMT2A y ABI1; KMT2A y ABI2; KMT2A y ACTN4; KMT2A y AFF1; KMT2A y AFF3; KMT2A y AFF4; KMT2A y ARHGAP26; KMT2A y ARHGEF12; KMT2A y BTBD18; KMT2A y CASC5; KMT2A y CASP8AP2; KMT2A y CBL; KMT2A y CREBBP; KMT2A y CT45A2; KMT2A y DAB2IP; KMT2A y EEFSEC; KMT2A y ELL; KMT2A y EP300; KMT2A y EPS15; KMT2A y FOXO3; KMT2A y FOXO4; KMT2A y FRYL; KMT2A y GAS7; KMT2A y GMPS; KMT2A y GPHN; KMT2A y KIAA0284; KMT2A y KIAA1524; KMT2A y LASP1; KMT2A y LPP; KMT2A y MAPRE1; KMT2A y MLLT1; KMT2A y MLLT10; KMT2A y MLLT11; KMT2A y MLLT3; KMT2A y MLLT4; KMT2A y MLLT6; KMT2A y MYO1F; KMT2A y NCKIPSD; KMT2A y NRIP3; KMT2A y PDS5A; KMT2A y PICALM; KMT2A y PRRC1; KMT2A y SARNP; KMT2A y SEPT2; KMT2A y SEPT5; KMT2A y SEPT6; KMT2A y SEPT9; KMT2A y SH3GL1; KMT2A y SORBS2; KMT2A y TET1; KMT2A y TOP3A; KMT2A y ZFYVE19; KTN1 y RET; LIFR y PLAG1; LMNA y NTRK1; LRIG3 y ROS1; LSM14A y BRAF; MARK4 y ERCC2; MBOAT2 y PRKCE; MBTD1 y CXorf67; MEAF6 y PHF1; MKRN1 y BRAF; MSN y ALK; MYB y NFIB; MYO5A y ROS1; NAB2 y STAT6; NACC2 y NTRK2; NCOA4 y RET; NDRG1 y ERG; NF1 y ACCN1; NFIA y EHF; NFIX y MAST1; NONO y TFE3; NOTCH1 y GABBR2; NPM1 y ALK; NTN1 y ACLY; NUP107 y LGR5; OMD y USP6; PAX3 y FOXO1; PAX3 y NCOA1; PAX3 y NCOA2; PAX5 y JAK2; PAX7 y FOXO1; PAX8 y PPARG; PCM1 y JAK2; PCM1 y RET; PLA2R1 y RBMS1; PLXND1 y TMCC1; PPFIBP1 y ALK; PPFIBP1 y ROS1; PRCC y TFE3; PRKAR1A y RET; PTPRK y RSPO3; PWWP2A y ROS1; QKI y NTRK2; RAF1 y DAZL; RANBP2 y ALK; RBM14 y PACS1; RGS22 y SYCP1; RNF130 y BRAF; SDC4 y ROS1; SEC16A_NM_014866.1 y NOTCH1; SEC31A y ALK; SEC31A y JAK2; SEPT8 y AFF4; SFPQ y TFE3; SLC22A1 y CUTA; SLC26A6 y PRKAR2A; SLC34A2 y ROS1; SLC45A3 y BRAF; SLC45A3 y ELK4; SLC45A3 y ERG; SLC45A3 y ETV1; SLC45A3 y ETV5; SND1 y BRAF; SQSTM1 y ALK; SRGAP3 y RAF1; SS18 y SSX1; SS18 y SSX2; SS18 y SSX4; SS18L1 y SSX1; SSBP2 y JAK2; SSH2 y SUZ12; STIL y TALI; STRN y ALK; SUSD1 y ROD1; TADA2A y MAST1; TAF15 y NR4A3; TCEA1 y PLAG1; TCF12 y NR4A3; TCF3 y PBX1; TECTA y TBCEL; TFG y ALK; TFG y NR4A3; TFG y NTRK1; THRAP3 y USP6; TMPRSS2 y ERG; TMPRSS2 y ETV1; TMPRSS2 y ETV4; TMPRSS2 y ETV5; TP53 y NTRK1; TPM3 y ALK; TPM3 y NTRK1; TPM3 y ROS1; TPM3 y ROS1; TPM4 y ALK; TRIM24 y RET; TRIM27 y RET; TRIM33 y RET; UBE2L3 y KRAS; VCL y ALK; VTI1A y TCF7L2; YWHAE y FAM22A; YWHAE y NUTM2B; ZC3H7B y BCOR; ZCCHC8 y ROS1; ZNF700 y MAST1; y ZSCAN30 y BRAF. Algunas fusiones génicas de los pares de genes mencionados anteriormente que se correlacionan con el cáncer se pueden identificar, por ejemplo, en la base de datos del Catálogo de Mutaciones Somáticas en el Cáncer (COSMIC) (http://cancer.sanger.ac.uk/cosmic/fusion). Cada uno de los pares de genes descritos en este párrafo corresponde a una fusión génica enumerada en la base de datos COSMIC, que se ha identificado como asociada al cáncer. La base de datos COSMIC se puede usar para identificar sinónimos para los nombres de los genes, así como para las secuencias de nucleótidos de los genes y fusiones génicas. Existen otras bases de datos que recogen fusiones génicas asociadas al cáncer, por ejemplo, FusionCancer (http://donglab.ecnu.edu.cn/databases/FusionCancer/index.html) y las bases de datos en las que se basa ArcherDx (http://archerdx.com/software/quiver), y las secuencias de nucleótidos de una pluralidad se pueden seleccionar entre cualquiera de las fusiones génicas enumeradas en estas bases de datos.
III. COMPOSICIONES QUE COMPRENDEN UNA PLURALIDAD DE FRAGMENTOS DE ÁCIDO NUCLEICO
Un solo ácido nucleico multiplexado, sin embargo, se puede fragmentar y/o degradar durante su preparación, almacenamiento y/o procesamiento. Un ácido nucleico multiplexado que comprende múltiples secuencias de
nucleótidos diferentes presenta muchas ventajas para la preparación de materiales de referencia. Sin embargo, la fragmentación y/o la degradación no influyen necesariamente en el rendimiento de un material de referencia, porque las estrategias de secuenciación de nueva generación ensamblan secuencias de nucleótidos relativamente largas a partir de ácidos nucleicos relativamente cortos. Además, la fragmentación y/o la degradación de un único ácido nucleico multiplexado puede ser deseable, por ejemplo, porque los ácidos nucleicos más cortos replican más estrechamente los ARNm de un transcriptoma después de se haya extraído de una célula.
En algunos casos, la divulgación se refiere a una composición que comprende una pluralidad de fragmentos de ácido nucleico. El ensamblaje de secuencias de las secuencias de nucleótidos de la pluralidad de fragmentos de ácido nucleico puede dar como resultado la secuencia de nucleótidos completa de un ácido nucleico de longitud completa tal como se ha descrito en las secciones I y II, mencionadas anteriormente. La expresión "ensamblaje de secuencias" se refiere al alineamiento y fusión de las secuencias de nucleótidos de una pluralidad de fragmentos de ácido nucleico en secuencias de nucleótidos las largas para reconstruir la secuencia de nucleótidos original (véase, por ejemplo, El-Metwally, S. et al., PLoS Computational Biology 9(12): e1003345 (2013); Nagarajan, N. y M. Pop, Nature Reviews Genetics 14(3): 157 (2013); Paszkiewicz, K. y D.J. Studholme, Briefings Bioinformatics 11(5):457 (2010)). El ensamblaje de secuencias de las secuencias de nucleótidos de una pluralidad de fragmentos de ácido nucleico puede dar como resultado menos que la secuencia de nucleótidos completa de un ácido nucleico de longitud completa siempre y cuando cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos del ácido nucleico de longitud completa (por ejemplo, tal como se ha descrito en las secciones I y II) esté codificada por al menos un fragmento de ácido nucleico de la pluralidad de ácidos nucleicos. Por ejemplo, el ensamblaje de secuencias de las secuencias de nucleótidos de los fragmentos de ácido nucleico de la pluralidad puede dar como resultado secuencias ensambladas que están alineadas con al menos un 50 %, un 60 %, un 70 %, un 80 %, un 90 %, un 95 %, un 96 %, un 97 %, un 98 %, o un 99 % de la secuencia de nucleótidos del ácido nucleico de longitud completa. Las secuencias de nucleótidos omitidas pueden incluir, por ejemplo, secuencias de nucleótidos inestables y/o secuencias de nucleótidos específicas que están agotadas de manera intencionada o seleccionadas de otro modo contra (por ejemplo, durante una etapa de hibridación o de amplificación).
Una pluralidad de fragmentos de ácido nucleico se puede producir a partir de un ácido nucleico de longitud completa tal como se ha descrito en las secciones I y II, mencionadas anteriormente (por ejemplo, la pluralidad de fragmentos de ácido nucleico se puede producir a partir de un número de copias del mismo ácido nucleico de longitud completa). La pluralidad de fragmentos de ácido nucleico puede consistir en fragmentos o productos de degradación de un ácido nucleico de longitud completa tal como se ha descrito en las secciones I y II, mencionadas anteriormente (por ejemplo, la pluralidad de fragmentos de ácido nucleico puede consistir en fragmentos o productos de degradación de un número de copias del mismo ácido nucleico de longitud completa).
Cada secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos de un ácido nucleico de longitud completa tal como se ha descrito en las secciones I y II, mencionadas anteriormente, puede estar codificada por al menos un fragmento de ácido nucleico de una pluralidad de fragmentos de ácido nucleico.
Diferentes copias del mismo ácido nucleico se pueden fragmentar/degradar de muchas formas diferentes y, por lo tanto, una pluralidad de fragmentos de ácido nucleico puede o no comprender fragmentos de ácido nucleico idénticos. Además, se pueden perder partes de ácidos nucleicos individuales, por ejemplo, durante una etapa de purificación, o se pueden degradar hasta una longitud que carece de contenido secuenciable. Sin embargo, la secuenciación de nueva generación puede reensamblar la secuencia de nucleótidos del ácido nucleico de longitud completa original, sin fragmentar, de la pluralidad de fragmentos de ácido nucleico siempre y cuando la pluralidad de fragmentos de ácido nucleico contenga suficiente redundancia. Por ejemplo, la pluralidad de fragmentos de ácido nucleico puede comprender de aproximadamente 2x a aproximadamente 1.000.000x de cobertura de la secuencia de nucleótidos de un ácido nucleico de longitud completa original, sin fragmentar, tal como 10x a aproximadamente 100.000x, de aproximadamente 20x a aproximadamente 50.000x, de aproximadamente 100x a aproximadamente 10.000x, o de aproximadamente 100x a aproximadamente 1.000x de cobertura. Por lo tanto, la secuencia de nucleótidos del ácido nucleico de longitud completa original, sin fragmentar, se puede identificar por secuenciación de la pluralidad de fragmentos de ácido nucleico mediante secuenciación de nueva generación.
La pluralidad de fragmentos de ácido nucleico puede comprender de aproximadamente 2x a aproximadamente 1.000.000x de cobertura de cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos de un ácido nucleico de longitud completa original, sin fragmentar, tal como de aproximadamente 10x a aproximadamente 100.000x, de aproximadamente 20x a aproximadamente 50.000x, de aproximadamente 100x a aproximadamente 10.000x, o de aproximadamente 100x a aproximadamente 1.000x de cobertura. Por lo tanto, cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos del ácido nucleico de longitud completa original, sin fragmentar, se puede identificar por secuenciación de la pluralidad de fragmentos de ácido nucleico mediante secuenciación de nueva generación.
Una composición que comprende una pluralidad de fragmentos de ácido nucleico puede comprender además básicamente todo el transcriptoma de una célula. La proporción de la secuencia de nucleótidos del ácido nucleico de longitud completa original, sin fragmentar (por ejemplo, el ácido nucleico a partir del que se originó la pluralidad de fragmentos de ácido nucleico) con respecto a una sola copia del transcriptoma de la célula puede ser de
aproximadamente 1:10 a aproximadamente 1.000:1, tal como de aproximadamente 1:5 a aproximadamente 500:1, de aproximadamente 1:3 a aproximadamente 300:1, de aproximadamente 1:2 a aproximadamente 200:1, o de aproximadamente 1:1 a aproximadamente 100:1 en la composición. La proporción de cada copia de una secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos del ácido nucleico de longitud completa original, sin fragmentar (por ejemplo, el ácido nucleico a partir del que se originó la pluralidad de fragmentos de ácido nucleico) con respecto a una sola copia del transcriptoma de la célula puede ser de aproximadamente 1:10 a aproximadamente 1.000:1, tal como de aproximadamente 1:5 a aproximadamente 500:1, de aproximadamente 1:3 a aproximadamente 300:1, de aproximadamente 1:2 a aproximadamente 200:1, o de aproximadamente 1:1 a aproximadamente 100:1 en la composición. "Una sola copia de un transcriptoma de una célula" se refiere a todo el ARNm de una sola célula, que puede contener múltiples copias del mismo ARNm.
Una composición que comprende una pluralidad de fragmentos de ácido nucleico puede comprender además una célula. La célula puede ser la célula del transcriptoma, mencionado anteriormente, es decir, la composición puede comprender básicamente todo el transcriptoma de una célula porque la composición comprende una célula. La célula puede ser una célula humana. La célula puede ser un fibroblasto o un linfocito, tal como un linfocito B inmortalizado. La célula puede ser GM24385. La célula puede ser cualquiera de las células que se describen en el presente documento, a continuación.
En algunas realizaciones, la composición puede comprender una pluralidad de células. La pluralidad de células puede comprender la célula, mencionado anteriormente, por ejemplo, en donde el transcriptoma de la composición es el transcriptoma de la célula. Cada célula de una pluralidad de células puede comprender básicamente el mismo genoma. "Básicamente el mismo genoma" se refiere a genomas del mismo individuo (por ejemplo, persona), de la misma célula precursora o de la misma línea celular, que pueden contener ligeras diferencias, tal como pequeñas diferencias epigenéticas, mutaciones espontáneas y mutaciones que surgen del procesamiento, tal como transfección y fijación celular (por ejemplo, que puede influir en la integridad del ADN celular).
La pluralidad de fragmentos de ácido nucleico de una composición puede ser fragmentos de ácido nucleico intracelulares, por ejemplo, la pluralidad de fragmentos de ácido nucleico puede existir intracelularmente, por ejemplo, en el citoplasma y/o el núcleo de una célula. La pluralidad de células puede comprender la pluralidad de fragmentos de ácido nucleico de la composición. La pluralidad de fragmentos de ácido nucleico puede haberse introducido en células de la composición (por ejemplo, una pluralidad de células) mediante transfección. "Transfección" se refiere a la introducción de material exógeno en una célula, y el término incluye la introducción de ácidos nucleicos exógenos mediante transformación, transfección, infección (por ejemplo, con un virus recombinante) y electroporación, así como otros métodos conocidos. Un ácido nucleico de longitud completa, tal como se ha descrito en las secciones I y II, mencionadas anteriormente, se puede introducir en las células de la composición mediante transfección, y el ácido nucleico de longitud completa se puede fragmentar y/o degradar en la pluralidad de fragmentos de ácido nucleico durante la transfección o después de la transfección, generando de ese modo la pluralidad de fragmentos de ácido nucleico.
En algunas realizaciones, cada célula de la pluralidad de células está fijada. Los métodos para fijar células se describen en el presente documento, a continuación, e incluyen fijación con formalina. En algunas realizaciones, las células de la composición están embebidas en parafina.
En algunas realizaciones, la composición no comprende células. Por ejemplo, la composición puede comprender simplemente una pluralidad de fragmentos de ácido nucleico generados a partir de un ácido nucleico de longitud completa descrito en las secciones I y II, mencionadas anteriormente. La composición puede comprender ácidos nucleicos extraídos de las células que se han descrito en los párrafos precedentes, por ejemplo, la pluralidad de fragmentos de ácido nucleico se puede extraer de una pluralidad de células como se ha descrito en los párrafos precedentes, por ejemplo, junto con el transcriptoma y/o genomas de la pluralidad de células. Por lo tanto, la pluralidad de fragmentos de ácido nucleico se puede haber extraído de una célula o de una pluralidad de células. La composición puede comprender además urea (por ejemplo, de 100 mM a 8 M de urea), guanidina (por ejemplo, 100 mM a 6 M de guanidina), un inhibidor de RNAsa, un quelante de metales (por ejemplo, etilendiaminotetraacetato), una proteasa (por ejemplo, proteinasa K), una DNAsa (por ejemplo, DNAsa I), etanol (por ejemplo, etanol al 10-99 %), isopropanol (por ejemplo, isopropanol al 10-99 %), y/o una transcriptasa inversa. Se conocen bien algunos métodos para extraer y purificar ARN de las células usando los reactivos mencionados anteriormente. La pluralidad de fragmentos de ácido nucleico puede estar asociada a un soporte sólido, tal como perlas (por ejemplo, perlas magnéticas), para ayudar en la purificación.
IV. CÉLULAS
En algunos aspectos, la invención se refiere a una célula que comprende un ácido nucleico como se describe en el presente documento. En algunas realizaciones, la invención se refiere a una pluralidad de células que comprenden un ácido nucleico como se describe en el presente documento. Un ácido nucleico de la invención puede estar integrado en el genoma de una célula, o puede estar presente en un plásmido o como un ácido nucleico lineal, tal como ARNm o un plásmido lineal. Por ejemplo, una célula puede comprender un ácido nucleico como se describe en
el presente documento, mencionado anteriormente, en donde el ácido nucleico es un ARN monocatenario.
Una célula puede comprender al menos dos ácidos nucleicos como se describe en el presente documento, por ejemplo, en donde al menos dos de los ácidos nucleicos comprenden diferentes pluralidades de secuencias de nucleótidos. Por ejemplo, una célula puede comprender una pluralidad de fragmentos de ácido nucleico como se describe en el presente documento, en donde de 2 a 50, de 2 a 40, de 2 a 30, de 2 a 20, de 2 a 10, de 2 a 9, de 2 a 8, de 2 a 7, de 2 a 6, de 2 a 5, o de 2 a 4 fragmentos de ácido nucleico de la pluralidad cada uno comprende diferentes pluralidades de secuencias de nucleótidos.
Una célula puede comprender más de una copia del mismo ácido nucleico. Por ejemplo, una célula puede comprender 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 150, o 200 copias del mismo ácido nucleico. Una célula puede comprender al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 150, o 200 copias del mismo ácido nucleico. Una célula puede comprender de 1 a 1.000, de 2 a 1.000, de 5 a 1.000, de 10 a 1.000, de 20 a 1.000, de 50 a 1.000, de 100 a 1.000, de 150 a 1.000, de 200 a 1.000, de 250 a 1.000, de 1 a 500, de 2 a 500, de 5 a 500, de 10 a 500, de 20 a 1.000, de 50 a 500, de 100 a 500, de 150 a 500, o de 200 a 500, de 250 a 500, de 1 a 400, de 2 a 400, de 5 a 400, de 10 a 400, de 20 a 400, de 50 a 400, de 100 a 400, de 150 a 400, de 200 a 400, o de 250 a 400 copias del mismo ácido nucleico.
Un ácido nucleico se puede llegar a fragmentar o de otro modo degradar antes, durante, o después de la transfección del ácido nucleico en una célula. Por lo tanto, en algunas realizaciones, una célula puede comprender una pluralidad de fragmentos de ácido nucleico (por ejemplo, que son fragmentos de un único ácido nucleico de longitud completa como se describe en el presente documento, mencionado anteriormente, o fragmentos de múltiples copias de un único ácido nucleico de longitud completa como se describe en el presente documento, mencionado anteriormente). La pluralidad de fragmentos de ácido nucleico se puede mezclar con los ácidos nucleicos de la célula, por ejemplo, ácidos nucleicos citosólicos y/o nucleares. La célula puede comprender múltiples copias de cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos, tal como de 1 a 1.000, de 2 a 1.000, de 5 a 1.000, de 10 a 1.000, de 20 a 1.000, de 50 a 1.000, de 100 a 1.000, de 150 a 1.000, de 200 a 1.000, de 250 a 1.000, de 1 a 500, de 2 a 500, de 5 a 500, de 10 a 500, de 20 a 1.000, de 50 a 500, de 100 a 500, de 150 a 500, o de 200 a 500, de 250 a 500, de 1 a 400, de 2 a 400, de 5 a 400, de 10 a 400, de 20 a 400, de 50 a 400, de 100 a 400, de 150 a 400, de 200 a 400, o de 250 a 400 copias de cada secuencia de nucleótidos. Una célula puede comprender 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 150, o 200 copias de cada secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos como se describe en el presente documento, mencionado anteriormente. Una célula puede comprender al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 150, o 200 copias de cada secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos como se describe en el presente documento, mencionado anteriormente. Cada secuencia de nucleótidos de una pluralidad de secuencias de nucleótidos que se origina a partir del mismo ácido nucleico de longitud completa puede estar presente en una pluralidad de fragmentos de ácido nucleico con aproximadamente el mismo número de copias. Algunas secuencias de nucleótidos son más o menos estables que otras secuencias de nucleótidos, sin embargo, y por lo tanto, una célula puede contener secuencias de nucleótidos diferentes de una pluralidad de secuencias de nucleótidos con diferentes números de copias. Una copia de una secuencia de nucleótidos se puede producir, por ejemplo, en un único fragmento de ácido nucleico de la pluralidad de fragmentos de ácido nucleico.
Una célula puede ser una célula humana. Una célula puede ser un fibroblasto o linfocito. Una célula puede ser la célula de una línea celular. Una célula puede ser una célula adherente o una célula en suspensión.
Una célula se puede seleccionar entre el grupo que consiste en 721, 293T, 721, A172, A253, A2780, A2780ADR, A2780cis, A431, A-549, células BCP-1, BEAS-2B, BR 293, BxPC3, Cal-27, CML T1, COR-L23, COR-L23/5010, COR-L23/CPR, COR-L23/R23, COV-434, DU145, DuCaP, EM2, EM3, FM3, H1299, H69, HCA2, HEK-293, HeLa, HL-60, HMEpC, HT-29, HUVEC, Jurkat, células JY, células K562, células KBM-7, KCL22, KG1, Ku812, KYO1, LNCap, Ma-Mel, MCF-10A, MCF-7, MDA-MB-157, MDA-MB-231, MDA-MB-361, MG63, MONO-MAC 6, MOR/0.2R, MRC5, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, Peer, Raji, células Saos-2, SiHa, SKBR3, SKOV-3, T2, T-47D, T84, U373, U87, U937, VCaP, WM39, WT-49, y células YAR.
Una célula puede ser cualquier célula disponible en la ATCC (por ejemplo, http://www.atcc.org). En ciertas realizaciones, la célula es una célula de mamífero, tal como una célula humana. La célula puede ser una célula de cualquiera de las líneas celulares del repositorio de células genéticas humanas del National Institute of General Medical Sciences (NIGMS) disponibles en el Coriell Institute for Medical Research (https://catalog.coriell.org/1/NIGMS), tal como una línea celular de la colección "aparentemente sana". La célula puede ser un fibroblasto, linfoblasto, o linfocito. La célula se puede transformar, por ejemplo, con el virus Epstein-Barr. La célula puede ser una célula inmortalizada. Por ejemplo, la célula puede ser un linfocito inmortalizado, tal como un linfocito B inmortalizado. La célula puede ser un linfocito transformado con el virus Epstein-Barr, tal como un linfocito B transformado con el virus Epstein-Barr. La célula puede ser GM12878 (véase Zook, J.M. et al., Nature Biotechnology 32: 246 (2014)). La célula puede ser GM12878, GM24149, GM24143, GM24385, GM24631, GM24694, o GM24695 (véase Zook, J.M. et al., Scientific Data 3: 160025 (2016)). En ciertas realizaciones, la célula es GM24385.
Una célula puede ser una célula de bacteria, de levadura, de insecto, de ratón, de rata, de hámster, de perro, o de mono, por ejemplo, para clonación o validación de un constructo. Por ejemplo, la célula puede ser E. coli o Saccharomyces cerevisiae, por ejemplo, para la clonación de un ácido nucleico de la invención.
En algunos aspectos, la invención se refiere una composición que comprende una primera pluralidad de células y una segunda pluralidad de células (denominada "composición que comprende células"). La primera pluralidad de células puede comprender un ácido nucleico de longitud completa como se describe en el presente documento, mencionado anteriormente, o una pluralidad de fragmentos de ácido nucleico, por ejemplo, en donde el ensamblaje de secuencias de las secuencias de nucleótidos de la pluralidad de fragmentos de ácido nucleico da como resultado una secuencia o secuencias de nucleótidos tomadas en conjunto comprenden una pluralidad de secuencias de nucleótidos como se describe en el presente documento, mencionado anteriormente. La segunda pluralidad de células puede consistir en células que no comprenden un ácido nucleico de longitud completa o pluralidad de fragmentos de ácido nucleico como se describe en el presente documento. La primera pluralidad de células y la segunda pluralidad de células pueden ser el mismo tipo de células, por ejemplo, las células de la primera y de la segunda pluralidades pueden ser células humanas, tal como linfocitos inmortalizados, tal como células GM24385. Las células de la primera pluralidad y de la segunda pluralidad se pueden mezclar en la composición. La proporción del número de células de la primera pluralidad con respecto al número de células de la segunda pluralidad puede ser de aproximadamente 1:1 a aproximadamente 1:10.000, tal como de aproximadamente 1:2 a aproximadamente 1:2.000, o de aproximadamente 1:10 a aproximadamente 1:1.000 en la composición. La proporción puede depender en parte del número de copias promedio del ácido nucleico en la primera pluralidad de células o del número de copias promedio de las secuencias de nucleótidos de la pluralidad de secuencias de nucleótidos en la primera pluralidad de células. La proporción del número de células de la primera pluralidad de células con respecto al número de células de la segunda pluralidad de células se puede ajustar, por ejemplo, de modo que la composición comprenda de aproximadamente 0,01 copias del ácido nucleico (o aproximadamente 0,01 copias de cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos) a aproximadamente 100 copias del ácido nucleico (o aproximadamente 100 copias de cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos) por célula de la composición. La proporción se puede ajustar de modo que la composición comprenda de aproximadamente 0,1 a aproximadamente 50 copias, de aproximadamente 0,5 a aproximadamente 20 copias, o de aproximadamente 1 a aproximadamente 10 copias del ácido nucleico por célula de la composición (o de aproximadamente 0,1 a aproximadamente 50 copias, de aproximadamente 0,5 a aproximadamente 20 copias, o de aproximadamente 1 a aproximadamente 10 copias de cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos por célula de la composición).
Una célula, pluralidad de células, o composición que comprende células pueden estar fijadas. En ciertas realizaciones, una célula, pluralidad de células, o composición que comprende células está fijada con formalina. Una célula, pluralidad de células, o composición que comprende células pueden estar fijadas con glutaraldehído, etanol, metanol, acetona, benzoato de metilo, xileno, ácido acético, picrato, fijador HOPE, tetraóxido de osmio, y/o acetato de uranilo.
Una célula, pluralidad de células, o composición que comprende células se puede deshidratar, por ejemplo, usando etanol o un disolvente orgánico.
Una célula, pluralidad de células, o composición que comprende células se puede embeber en parafina. Por ejemplo, una célula, pluralidad de células, o composición que comprende células se puede fijar en formalina y se puede embeber en parafina. Una célula, pluralidad de células, o composición que comprende células se puede montar en un portaobjetos.
En algunos aspectos, la invención se refiere a una sección de parafina que comprende una pluralidad de células o composición que comprende células. La sección de parafina puede comprender de 1 a aproximadamente 1.000.000 células, tal como de aproximadamente 10 a aproximadamente 100.000 células, de aproximadamente 50 a aproximadamente 50.000 células, de aproximadamente 100 a aproximadamente 10.000 células, de aproximadamente 500 a aproximadamente 5.000 células, de aproximadamente 200 a aproximadamente 2.000 células, de aproximadamente 100 a aproximadamente 1.000 células, o de aproximadamente 50 a aproximadamente 1.000 células. La sección de parafina puede ser de aproximadamente 1 pm a aproximadamente 50 pm de grosor, tal como de aproximadamente 2 pm a aproximadamente 25 pm de grosor, o de aproximadamente 5 pm a aproximadamente 20 pm de grosor. La sección de parafina puede tener de aproximadamente 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, o 20 pm de grosor. La sección de parafina puede tener de aproximadamente 1 mm a aproximadamente 100 mm de longitud, ancho, o diámetro, tal como de aproximadamente 5 mm a aproximadamente 50 mm, o de aproximadamente 10 mm a aproximadamente 40 mm. Por ejemplo, una sección de parafina puede tener de aproximadamente 5 mm a aproximadamente 50 mm de longitud, de aproximadamente 5 mm a aproximadamente 50 mm de ancho, y de aproximadamente 5 pm a aproximadamente 20 pm de grosor. Una sección de parafina puede tener de aproximadamente 5 mm a aproximadamente 50 mm de diámetro y de aproximadamente 5 pm a aproximadamente 20 pm de grosor.
Una célula, pluralidad de células, o composición que comprende células puede estar presentes estar presente en un
sedimento celular. Una célula, pluralidad de células, o composición que comprende células puede estar suspendida en plasma sanguíneo, tal como un plasma sanguíneo de mamífero. En ciertos casos, una célula, pluralidad de células, o composición que comprende células puede estar suspendida en plasma sanguíneo humano o una solución diseñada para replicar el plasma sanguíneo humano.
En algunos aspectos, la invención se refiere a un método para preparar un material de referencia biológico, que comprende transfectar una pluralidad de células con un ácido nucleico descrito en el presente documento, una pluralidad de las mismas, o una pluralidad de fragmentos de ácido nucleico como se describe en el presente documento.
Un método puede comprender fijar una pluralidad de células o composición que comprende células. Por ejemplo, el método puede comprender fijar una pluralidad de células o composición que comprende células con formalina. Un método puede comprender fijar una pluralidad de células o composición que comprende células con glutaraldehído, etanol, metanol, acetona, benzoato de metilo, xileno, ácido acético, picrato, fijador HOPE, tetraóxido de osmio, y/o acetato de uranilo.
Un método puede comprender embeber una pluralidad de células o composición que comprende células en parafina. Un método puede comprender seccionar células embebidas en parafina. Un método puede comprender montar una pluralidad de células en un portaobjetos, por ejemplo, células embebidas en parafina o células que no están embebidas en parafina.
Un método puede comprender montar una pluralidad de células o composición que comprende células en un portaobjetos.
En algunos aspectos, la invención se refiere a un material de referencia biológico que comprende una célula, pluralidad de células, o composición que comprende células como se describe en el presente documento.
Un material de referencia biológico puede comprender parafina, por ejemplo, en donde la célula, pluralidad de células, o composición que comprende células están fijadas, y la célula, pluralidad de células, o composición que comprende células están embebidas en la parafina.
Un material de referencia biológico puede comprender además células no transfectadas, por ejemplo, en donde las células no transfectadas no comprenden el ácido nucleico. En ciertas realizaciones, las células no transfectadas son la misma especie que las células de la pluralidad, por ejemplo, las células no transfectadas pueden ser de la misma fuente (por ejemplo, línea celular) que las células de la pluralidad. La proporción de células de la pluralidad de células con respecto a células no transfectadas puede ser de aproximadamente 4:1 a aproximadamente 1:10.000, tal como de aproximadamente 1:1 a aproximadamente 1:5.000, de aproximadamente 1:1 a aproximadamente 1:1.000, de aproximadamente 1:10 a aproximadamente 1:1.000, o de aproximadamente 1:50 a aproximadamente 1:500. La proporción de células de la pluralidad de células con respecto a células no transfectadas puede ser aproximadamente 45:55, aproximadamente 50:50, aproximadamente 55:45, aproximadamente 1:1, aproximadamente 1:2, aproximadamente 1:3, aproximadamente 1:4, aproximadamente 1:5, aproximadamente 1:6, aproximadamente 1:7, aproximadamente 1:8, aproximadamente 1:9, aproximadamente 1:10, aproximadamente 1:20, aproximadamente 1:25, aproximadamente 1:50, aproximadamente 1:100, aproximadamente 1:200, aproximadamente 1:250, aproximadamente 1:500, o aproximadamente 1:1.000.
En algunas realizaciones, la proporción de el número de copias del ácido nucleico con respecto al número de copias de genomas celulares en el material de referencia biológico es de aproximadamente 10:1 a aproximadamente 1:10.000, tal como de aproximadamente 5:1 a aproximadamente 1:1.000, de aproximadamente 2:1 a aproximadamente 1:100, de aproximadamente 1:1 a aproximadamente 1:50, o de aproximadamente 1:2 a aproximadamente 1:20. En general, cada genoma contiene dos copias de un gen (por ejemplo, para genes que se producen en cromosomas diploides, tal como autosomas). El número de copias de un ácido nucleico con respecto al número de copias de un gen en el genoma celular en el material de referencia biológico puede ser de aproximadamente 10:1 a aproximadamente 1:10.000, tal como de aproximadamente 5:1 a aproximadamente 1:1.000, de aproximadamente 1:1 a aproximadamente 1:100, de aproximadamente 1:2 a aproximadamente 1:50, o de aproximadamente 1:4 a aproximadamente 1:40. Por lo tanto, la proporción de un genotipo de un ácido nucleico con respecto al número de copias de un gen en el genoma celular que está asociado al genotipo (por ejemplo, el alelo de tipo natural) en el material de referencia biológico puede ser de aproximadamente 10:1 a aproximadamente 1:10.000, tal como de aproximadamente 5:1 a aproximadamente 1:1.000, de aproximadamente 1:1 a aproximadamente 1:100, de aproximadamente 1:2 a aproximadamente 1:50, o de aproximadamente 1:4 a aproximadamente 1:40.
Un material de referencia biológico puede comprender además un líquido, tal como solución salina, solución salina tamponada con fosfato, o plasma sanguíneo, tal como un plasma sanguíneo de mamífero. Una célula, pluralidad de células, o composición que comprende células de un material de referencia biológico puede estar suspendida en plasma, tal como plasma humano sanguíneo o una solución diseñada para replicar el plasma humano sanguíneo.
Un material de referencia biológico puede ser un sedimento celular, por ejemplo, preparado mediante centrifugación de una pluralidad de células o composición que comprende células como se describe en el presente documento. En algunos aspectos, la invención se refiere a una composición que comprende un ácido nucleico purificado, en donde el ácido nucleico purificado se aísla de un material de referencia biológico como se describe en el presente documento. La composición puede comprender un tampón, tal como tampón tris (es decir, tris(hidroximetil)aminometano o una sal del mismo). La composición puede comprender un agente quelante, tal como ácido etilendiaminotetraacético, o una sal del mismo. La composición puede comprender cantidades traza de formaldehído y/o parafina, aunque la composición puede estar exenta del formaldehído y parafina.
Ejemplos
Ejemplo 1. Diseño de ácido nucleico para dianas de oncología
Se desarrolló un listado de dianas de fusión génica que representan fusiones clínicamente relevantes para las que actualmente se encuentran disponibles ensayos de diagnóstico usando tecnología de secuenciación de nueva generación (NGS) (Tabla 1). Las dianas se seleccionaron basándose en la disponibilidad de ensayos para detectar las fusiones, así como en una revisión de la bibliografía que indica relevancia clínica. El listado favoreció mutaciones en cánceres de pulmón y de tiroides. Los detalles con respecto a las secuencias exactas incluidas se proporcionan en la Tabla 2.
T l 1. Di n f i n ni n l í r m ri l r f r n i
Tabla 2. Secuencias de GenBank usadas para diseñar los constructos de fusión múltiples
Se diseñaron dos constructos de ADN plasmídico diferentes de modo que cada plásmido contuviera 6 de las 12 dianas de fusión. Todas las líneas con números pares de la Tabla 1 se incorporaron en el constructo n.° 1 (SEQ ID NO: 11) y todas las líneas con números impares de la Tabla 1 se incorporaron en el constructo n.° 2 (SEQ ID NO: 12).
La Tabla 1 incluye dos fusiones para ALK, dos fusiones para RET, dos fusiones para ROS1, dos fusiones para NTRK1 y dos fusiones para FGFR3. Las dos fusiones para cada gen se separaron en diferentes plásmidos en parte para evitar que los plásmidos contuvieran tramos significativos de secuencia idéntica, que podrían ser inestables y se podrían someter a recombinación.
Cada fusión en el constructo se diseñó para que incluyera 250 nucleótidos hacia arriba y hacia abajo del punto de ruptura que conecta dos genes diferentes en un par de fusión. Por ejemplo, la fusión EML4-ALK contiene aproximadamente 250 nucleótidos de EML4 unidos a aproximadamente 250 nucleótidos de ALK.
Se colocó un promotor SP6 antes de las dianas de fusión para que el ARN se pudiera transcribir a partir del plásmido.
Una secuencia corta de aproximadamente 125 pares de bases se añadió hacia abajo de las dianas de fusión. Esta secuencia se usó para la validación del constructo mediante un ensayo de PCR en tiempo real basada en TaqMan, que se dirige a la secuencia. La secuencia permitió la cuantificación del ARN transcrito, para aumentar la precisión y la exactitud de las mediciones de ARN para las etapas de transfección posteriores.
Se añadió una cola de poli-A hacia abajo tanto de las dianas de fusión como de la secuencia usada para cuantificación para aumentar la estabilidad del ARN en células transfectadas.
Ejemplo 2. Transfección de células con ARN
El ARN se transcribió usando el kit de transcripción mMessage mMachine SP6 de Thermo Fisher Ambion ahora. Este kit se usó porque incorpora un análogo de protección [m7G(5')ppp(5')G], que se incorpora solo como la primera o G 5' terminal del transcrito, porque su estructura impide su incorporación en cualquier otra posición en la molécula de ARN. Los ARN que carecen de una estructura de protección en 5' se pueden dirigir a rutas de degradación intracelular y, por lo tanto, el kit de transcripción protegido se usó para aumentar la estabilidad del ARN dentro de una célula.
Los ARN se sometieron a electroporación en la línea celular humana GM24385. Esta línea celular es un genoma de referencia de genoma en una botella (Genome in a Bottle) del National Institutes of Standards, que ha sido bien caracterizado por NGS y que se puede usar en productos comerciales.
El ARN se introdujo en las células mediante electroporación. Se usaron 10 pg de ARN para transfectar 40 millones de células. Las condiciones de electroporación fueron las siguientes: 300 Voltios/500 pF/1 pulso/cubeta de 4 mm. Después de la electroporación, se permitió que las células se recuperaran durante 6 horas. A las 6 horas después de la electroporación, las células sedimentaron, el sobrenadante se retiró y se añadió medio nuevo. La retirada de los medios de transfección ayuda a retirar el ARN no incorporado de la muestra.
A las 24 horas después de la electroporación, las células sedimentaron suavemente, y se lavaron usando solución salina tamponada con fosfato. Las células se volvieron a suspender en solución salina tamponada con fosfato a aproximadamente 4,4E+06 células/ml. Se transfirieron 2 ml de las células lavadas a fijador y se fijaron durante 20 minutos en formalina para destruir las células y preservar la estructura celular. A continuación, las células se deshidrataron mediante una serie de lavados en etanol y se almacenaron a la misma concentración (~4,4E+06 células/ml) a -20 °C en etanol al 70 %.
Una alícuota de las células se congeló instantáneamente en lugar de fijarse para verificar que el ARN biosintético se incorporaba de hecho a las células (mediante PCR en tiempo real basada en TaqMan).
Los ácidos nucleicos se extrajeron de las células fijadas usando un Agencourt FormaPure - Extracción de ácido nucleico del Kit tisular FFPE. En los ácidos nucleicos extraídos se realizó PCR en tiempo real TaqMan. Se recuperó ARN de las células fijadas aproximadamente al mismo nivel que de las células no fijadas. Se calculó que el número de copias del ARN multiplex era superior a 250 copias por célula.
Tabla 3. Cuantificación de ARN biosintético dentro de células transfectadas
Dado que parecía haber cientos de copias del ARN biosintético por célula, las células transfectadas se diluyeron con células no transfectadas para reducir la cantidad de ARN de fusión a niveles fisiológicos. Las células transfectadas se diluyeron en las células no transfectadas en diluciones en serie de 10 veces para hacer una dilución 1:10, 1:100 y 1:1.000 de cada constructo.
En experimentos en paralelo, se extrajo ácido nucleico de células transfectadas y de células no transfectadas. El ácido nucleico se normalizó a la misma concentración y a continuación el ácido nucleico de las células transfectadas se diluyó en serie en el ácido nucleico de las células no transfectadas para lograr diluciones 1:10, 1:100 y 1:1.000.
El ácido nucleico total de las células se extrajo usando un kit de extracción FormaPure de acuerdo con las modificaciones al protocolo de extracción FormaPure recomendado por ArcherDx. El ácido nucleico total se usó para la preparación de la colección usando el Kit v2 de reactivo de ARN universal Archer™ para Illumina y el Panel de pulmón y tiroides FusionPlex™ Archer™. La preparación de la colección siguió las instrucciones de ArcherDx y la colección se analizó usando un instrumento MiSeq de Illumina. El software identificó de forma apropiada las fusiones génicas de oncología esperadas (Figuras 2 y 3).
°
T l . N m r l r r v l ni n f i n ni r l n r ^ N.° 2
El número de lecturas a través de cada unión de fusión se representó en gráfico para las diluciones 1:10, 1:100 y 1:1.000 tanto del constructo n.° 1 como del constructo n.° 2 (Figuras 4 y 5). Cuando se representa el nivel de dilución frente al número de lecturas, existe una relación lineal (Figuras 6 y 7). Esto demuestra que un material de referencia se puede ajustar para lograr el número de lecturas deseado simplemente diluyendo las células transfectadas antes de las etapas de procesamiento posteriores. Dado que existe una respuesta lineal, la cantidad de dilución se puede calcular fácilmente.
Las mezclas celulares (diluciones 1:10, 1:100 y 1:1.000) se extrajeron de nuevo usando el kit de extracción Agencourt FormaPure, siguiendo un protocolo para producir ARN puro (es decir, con una etapa de tratamiento con DNasa). El producto de ARN se analizó usando un panel de investigación de cáncer de pulmón de fusión de ARN de Ion AmpliSeq™. Este panel se limita solo a las fusiones de ALK, RET, ROS1 y NTRK1, y se centra solo en las fusiones que se encuentran en el cáncer de pulmón. Por lo tanto, no todas las fusiones contenidas en el material
multiplex se analizaron en el panel. Sin embargo, cada una de las fusiones sometidas a ensayo se detectó en los tres niveles de dilución. Las lecturas totales se muestran en las Tablas 6 y 7.
T l . Nmr l r In Amli r v l nin f i n r l n r N.° 1
T l 7. Nmr l r In Amli rv l nin f i n r l n r N.° 2
Ejemplo 3. Construcciones combinadas
Las células transfectadas fijadas que portan el constructo n.° 1 y las células transfectadas fijadas que portan el constructo n.° 2 se mezclaron y se diluyeron en células no transfectadas a un nivel de dilución de 1:1.000. Los ácidos nucleicos totales se extrajeron usando el kit de extracción FormaPure. El número de lote 102342 se asignó al ácido nucleico total.
La secuenciación de nueva generación se realizó de acuerdo con las instrucciones del panel de pulmón y tiroides Archer Dx FusionPlex. Se detectaron las 12 fusiones y cada fusión pasó todos los filtros de evidencia fuerte. Curiosamente, aunque se identificó la fusión KIF5B-RET, el software Archer no indicó que se conociera la fusión. Por lo tanto, la muestra identificó una discrepancia en el software Archer. El PAX8-PPARG se identificó de manera similar, pero el software Archer no indicó que se conociera la fusión, lo cual se esperaba porque esta fusión no está anotada en el software Archer. Todas las demás fusiones génicas se marcaron como conocidas.
T l . Nmr l r Arh rDx r v l nin f i n r l l 1242
Ejemplo 4. Células embebidas
Las células transfectadas y fijadas que portan el constructo n.° 1 y las células transfectadas fijadas que portan el constructo n.° 2 se mezclaron y se diluyeron en células no transfectadas a niveles de diluciones 1:10, 1:100 y 1:1.000 (muestras de números de copias denominadas "altos", "medios" y "bajos"). Se sedimentó 1 ml de cada mezcla celular y se volvió a suspender en HistoGel. La mezcla de HistoGel/células se transfirió al cilindro de una jeringa de 3 ml y se dejó solidificar. Después de la solidificación, cada uno de los tres "núcleos" (alto, medio y bajo) se recortó y se cortó en dos piezas. Los núcleos se colocaron en formalina al 10 % a 2-8 °C durante 18-24 horas. Después de la fijación durante la noche, los núcleos se deshidrataron mediante incubación con concentraciones crecientes de etanol (50 %, 70 %, 80 %, y 100 %). Después de la deshidratación en etanol, los núcleos se incubaron en nafta (un sustituto del xileno) durante la noche. Al tercer día, la nafta se intercambió varias veces y los núcleos se embebieron en parafina.
Los bloques de parafina se seccionaron en secciones de 10 pm. Basándose en el número de células embebidas, una sección de 10 micrómetros debería contener el equivalente de ADN/ARN de aproximadamente 10.000 células. Cada sección de 10 pm contendría aproximadamente 1.400 células transfectadas en el bloque "Alto", 140 células transfectadas en el bloque "Medio" y 14 células transfectadas en el bloque "Bajo".
Se extrajeron cinco secciones de cada bloque usando el protocolo de extracción de Agencourt FormaPure para obtener el ácido nucleico total (Tabla 9).
Se usaron aproximadamente 125 ng de ácido nucleico total para la preparación de la colección usando el Kit v2 de reactivo de ARNm universal Archer™ para Illumina y el panel de pulmón y tiroides Archer™ FusionPlex™. La preparación de la colección siguió las instrucciones de ArcherDx y cada muestra se analizó con un instrumento Illumina MiSeq. Los resultados de la muestra "Alto" mostraron fusiones fuera de la diana y la muestra "Bajo" no pudo detectar la mayoría de las fusiones esperadas. Sin embargo, la muestra "Medio" detectó 11 de las 12 fusiones esperadas, tal como se muestra en la Tabla 10 que sigue a continuación. Hubo más variabilidad entre el número de lecturas de extensión para las diferentes dianas de fusión cuando se extrajo el ácido nucleico total de FFPE con respecto a las células ligeramente fijadas de los Ejemplos 2 y 3 (Tabla 11).
CD74-ROS1 no se detectó en la muestra "FFPE medio"; sin embargo, se detectó en la muestra de "FFPE alto", lo que indica que constructo se diseñó de manera apropiada. Se desconoce el motivo de las lecturas bajas para CD74-ROS1 y SLC34A2-ROS1; sin embargo, el ARN de ROS1 puede ser susceptible de daño durante la etapa de electroporación o durante la fijación con formalina, de modo que, en esta región del constructo de ARN, se podrían amplificar menos moléculas durante la preparación de la colección.
Tabla 10
Tabla 11. Comparación de lecturas a través de la unión de cada fusión para las muestras del Ejemplo 2 (Serie N.° 1 E m l ri N.° 2 E m l 4 FFPE
El ácido nucleico extraído de las secciones "FFPE medio" se sometió a ensayo en un laboratorio comercial, que usa el Panel de Investigación del Cáncer OncoMine®. Los resultados se muestran en la Tabla 12. No se detectaron NPM1-ALK, ETV6-NTRK3 ni TFG-NTRK1, pero las nueve fusiones restantes en el material de referencia se detectaron de forma positiva. El examen de evidencia de OncoMine sugiere que el ensayo no somete a ensayo NPM1-ALK o TFG-NTRK1, por lo que no se esperaban resultados positivos para estas fusiones. Sin embargo, se esperaba que OncoMine analizara ETV6-NTRK3 y se desconoce la razón exacta por la que no se detectó esta fusión.
Tabla 12
La muestra de FFPE se envió a un segundo laboratorio comercial para su análisis (los datos no se muestran).
A primera vista, parecía haber múltiples discrepancias entre los resultados del análisis de ArcherDx y los otros dos laboratorios. Una inspección más detallada muestra que, en general, no hubo desacuerdo sobre las fusiones de ARN presentes, sino sobre los puntos de ruptura exactos y los exones que se unieron. Por ejemplo, ambas fusiones de fGfR3 se denominaron FGFR3(18)-BAIAP2L1(2) y fGfR3(18)-TACC3(11) en el ensayo Archer, y se diseñaron para que el exón 18 de FGFR3 se fusionara con el otro gen (Tabla 1). Sin embargo, el exón 17 y el exón 18 tienen ambos menos de 200 pb, por lo que ambas secuencias de exón estaban presentes en el constructo. Para un ensayo que depende de la producción de un producto de PCR, tiene sentido que se detecte una fusión con el exón 17. Parece que la fusión NCOA4-RET se puede haber evaluado de forma similar. Este ARN de fusión se diseñó y se detectó en el ensayo Archer como fusión del exón 8 de NCOA4 con el exón 12 de RET, pero en OncoMine, se denomina fusión del exón 7 de NCOA4 con el exón 12 de RET. de nuevo, el exón 7 y el exón 8 de NCOA4 son ambos muy pequeños, por lo que ambos están presentes en el constructo. Es poco probable que la diferencia en el punto de corte exacto influya en la toma de decisiones clínicas. Siempre y cuando los dominios funcionales estén unidos en la proteína de fusión, los efectos hacia abajo serán los mismos.
Ejemplo 5. Materiales de referencia FFPE con mayor concentración celular
Aunque los resultados del bloque "FFPE medio" del Ejemplo 4 fueron generalmente buenos, la retroalimentación de ArcherDx y otros sugirió que la cantidad de ARN extraíble era baja y podría no cumplir con las expectativas del cliente en cuanto a rendimiento de ácido nucleico. Por lo tanto, se preparó un nuevo bloque FFPE usando las mismas células transfectadas fijadas y la misma proporción de mezcla 1:100 que en el bloque "FFPE medio". Para esta nueva preparación, se embebieron ~50 millones de células para dar lugar a un núcleo de ~10 mm de altura (de concentración 5x mayor que anteriormente), que se podría usar para preparar secciones de ~800 x 10 pm en 2 bloques FFPE idénticos.
Los resultados se muestran en la Tabla 13. Mientras que el bloque "FFPE medio" solo produjo aproximadamente 218 ng de ácido nucleico total a partir de cinco secciones de 10 pm, el nuevo bloque (número de lote 102380) produjo aproximadamente esta misma cantidad de una sola sección, lo que indica que el rendimiento fue aproximadamente cinco veces mayor.
El lote 102380 se sometió a ensayo usando el panel de pulmón y tiroides ArcherDx FusionPlex como en los ejemplos anteriores, excepto porque se usaron aproximadamente 250 ng de ácido nucleico de entrada para la preparación de la colección. Es importante destacar que ArcherDx introdujo una actualización importante en su software de análisis Archer, desde la versión 3.3 a la versión 4.0. La principal diferencia entre estas versiones es que 3.3 alineó cada lectura con una secuencia de referencia humana. Las lecturas asignadas a dos ubicaciones distintas admitían las llamadas de fusión. Sin embargo, en la versión 4.0, las lecturas se usan para el ensamblaje de novo. Básicamente, el software puede usar las lecturas para ensamblar a través del constructo de fusión multiplex de SeraCare. Por lo tanto, se observaron fusiones de tres o cuatro genes. Además, la nueva versión del software también enumeró las fusiones por separado, incluso si tenían el mismo punto de ruptura, lo que dio como resultado un informe con llamadas duplicadas (por ejemplo, NCOA4-RET y FGFR3-TACC3 se llamaron dos veces, ambas con el símbolo de la diana, indicando que se conocía el punto de ruptura exacto). Estos problemas son inherentes al software y no específicos del diseño del material de referencia. A pesar de las llamadas adicionales confusas, las 12 fusiones esperadas se detectaron como fusiones de evidencia fuerte, y el número de lecturas de extensión, aunque mayor en esta serie, fue coherente con las del Ejemplo 4 (Figura 8).
Tabla 13
Claims (15)
1. Un ácido nucleico, que comprende una pluralidad de secuencias de nucleótidos, en donde:
cada secuencia de nucleótidos de la pluralidad comprende una primera subsecuencia y una segunda subsecuencia;
la primera subsecuencia comprende una secuencia 3' de un primer exón;
la segunda subsecuencia comprende una secuencia 5' de un segundo exón;
la primera subsecuencia y la segunda subsecuencia son secuencias adyacentes en el ácido nucleico;
la primera subsecuencia y la segunda subsecuencia tienen cada una al menos 20 nucleótidos de longitud; la primera subsecuencia está en 5' con respecto a la segunda subsecuencia en el ácido nucleico;
el primer exón es un exón de un primer gen;
el segundo exón es un exón de un segundo gen;
el primer gen y el segundo gen son genes diferentes; y
cada secuencia de nucleótidos de la pluralidad de secuencias de nucleótidos comprende una secuencia 3' de un primer exón que es diferente de cada otro primer exón de las secuencias de nucleótidos de la pluralidad o una secuencia 5' de un segundo exón que es diferente de cada otro segundo exón de las secuencias de nucleótidos de la pluralidad.
2. El ácido nucleico de la reivindicación 1, en donde:
(a) el ácido nucleico es ADN o ARN; y/o
(b) cada secuencia de nucleótidos de la pluralidad está asociada a una neoplasia, opcionalmente en donde la neoplasia es un cáncer de pulmón, cáncer de pulmón no microcítico, cáncer de tejido blando, cáncer linfoide, leucemia linfoide aguda, leucemia mieloide aguda, leucemia mielógena crónica, linfoma no Hodgkin, linfoma de Burkitt, melanoma, melanoma intraocular, cáncer del sistema nervioso central, neuroblastoma, cáncer de tiroides, cáncer de paratiroides, cáncer hepatocelular, cáncer de estómago, cáncer de intestino grueso, cáncer de colon, cáncer del tracto urinario, cáncer de vejiga, cáncer de riñón, cáncer de próstata, cáncer de cuello uterino, cáncer de ovario, o cáncer de mama.
3. El ácido nucleico de las reivindicaciones 1 o 2, en donde:
(a) cada primer gen y cada segundo gen se seleccionan entre el grupo que consiste en tirosina quinasa receptora de linfoma anaplásico (ALK), proteína 1 similar a proteína 2 asociada al inhibidor 1 de la angiogénesis específico del cerebro (BAIAP2L1), CD74, proteína similar a 4 asociada a microtúbulos de equinodermo (EML4), variante 6 de ETS (ETV6), receptor 3 del factor de crecimiento de fibroblastos (FGFR3), cadena pesada de kinesina 1 (KIF5B), coactivador 4 de receptor nuclear (NCOA4), nucleofosmina (NPM1), receptor neurotrófico de tirosina quinasa 1 (NTRK1), receptor neurotrófico de tirosina quinasa 3 (NTRK3), gen de caja emparejada 8 (Pax8), receptor gamma activado por proliferador de peroxisomas (PPARG), protooncogén RET (RET), protooncogén 1 de ROS (ROS1), proteína de transporte de fosfato dependiente de sodio SLC34A, proteína 3 que contiene superenrollamiento ácida transformante (TACC3), gen fusionado con TRK (TFG), y tropomiosina 3 (TPM3);
opcionalmente en donde cada primer exón y cada segundo exón se seleccionan entre el grupo que consiste en exón 20 de ALK, exón 2 de BAIAP2L1, exón 6 de CD74, exón 13 de EML4, exón 5 de ETV6, exón 18 de FGFR3, exón 24 de KIF5B, exón 8 de NCOA4, exón 5 de NPM1, exón 10 de NTRK1, exón 13 de NTRK3, exón 8 de PAX8, exón 1 de PPARG, exón 11 de RET, exón 12 de RET, exón 34 de ROS1, exón 4 de SLC34A, exón 11 de TACC3, exón 5 de TFG, y exón 8 de TPM3;
opcionalmente en donde el primer exón y el segundo exón de cada secuencia de nucleótidos se seleccionan entre el grupo que consiste en exón 13 de EML4 y exón 20 de ALK; exón 5 de NPM1 y exón 20 de ALK; exón 24 de KIF5B y exón 11 de Ret; exón 8 de NCOA4 y exón 12 de RET; exón 6 de CD74 y exón 34 de ROS1; exón 4 de SLC34A y exón 34 de ROS1; exón 8 de TPM3 y exón 10 de NTRK1; exón 5 de TFG y exón 10 de NTRK1; exón 18 de Fg FR3 y exón 2 de BAIAP2L1; exón 18 de FGFR3 y exón 11 de TACC3; exón 8 de PAX8 y exón 1 de PPARG; y exón 5 de ETV6 y exón 13 de NTRK3, respectivamente; o
(b) cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de un gen seleccionado entre el grupo que consiste en tirosina quinasa receptora de linfoma anaplásico (ALK), proteína 1 similar a proteína 2 asociada al inhibidor 1 de la angiogénesis específico del cerebro (BAIAP2L1), CD74, proteína similar a 4 asociada a microtúbulos de equinodermo (EML4), variante 6 de ETS (ETV6), receptor 3 del factor de crecimiento de fibroblastos (FGFR3), cadena pesada de kinesina 1 (KIF5B), coactivador 4 de receptor nuclear (NCOA4), nucleofosmina (NPM1), receptor neurotrófico de tirosina quinasa 1 (NTRK1), receptor neurotrófico de tirosina quinasa 3 (NTRK3), gen de caja emparejada 8 (Pax8), receptor gamma activado por proliferador de peroxisomas (PPARG), protooncogén RET (RET), protooncogén 1 de ROS (ROS1), proteína de transporte de fosfato dependiente de sodio SLC34A, proteína 3 que contiene superenrollamiento ácida transformante (TACC3), gen fusionado con TRK (TFG), y tropomiosina 3 (TPM3);
opcionalmente en donde cada subsecuencia de un gen es una subsecuencia de un exón único del gen;
opcionalmente en donde cada exón único se selecciona entre el grupo que consiste en exón 20 de ALK, exón
2 de BAIAP2L1, exón 6 de CD74, exón 13 de EML4, exón 5 de ETV6, exón 18 de FGFR3, exón 24 de KIF5B, exón 8 de NCOA4, exón 5 de NPM1, exón 10 de NTRK1, exón 13 de NTRK3, exón 8 de PAX8, exón 1 de PPARG, exón 11 de RET, exón 12 de RET, exón 34 de ROS1, exón 4 de SLC34A, exón 11 de TACC3, exón 5 de TFG, y exón 8 de TPM3;
opcionalmente en donde el primer exón y el segundo exón de cada secuencia de nucleótidos se seleccionan entre el grupo que consiste en exón 13 de EML4 y exón 20 de ALK; exón 5 de NPM1 y exón 20 de ALK; exón 24 de KIF5B y exón 11 de Ret; exón 8 de NCOA4 y exón 12 de RET; exón 6 de Cd74 y exón 34 de ROS1; exón 4 de SLC34A y exón 34 de ROS1; exón 8 de TpM3 y exón 10 de NTRK1; exón 5 de TFG y exón 10 de NTRK1; exón 18 de FGFR3 y exón 2 de BAIAP2L1; exón 18 de FGFR3 y exón 11 de TACC3; exón 8 de PAX8 y exón 1 de PPARG; y exón 5 de ETV6 y exón 13 de NTRK3, respectivamente; o
(c) cada primer gen y cada segundo gen, respectivamente, se seleccionan entre el grupo que consiste en ACBD6 y RRP15; ACSL3 y ETV1; ACTB y GLI1; AGPAT5 y MCPH1; AGTRAP y BRAF; AKAP9 y BRAF; ARFIP1 y FHDC1; ARID1A y MAST2; ASPSCR1 y TFE3; ATG4C y FBXO38; ATIC y ALK; BBS9 y PKD1L1; BCR y ABL1; BCR y JAK2; BRD3 y NUTM1; BRD4 y NUTM1; C2orf44 y ALK; CANT1 y ETV4; CARS y ALK; CCDC6 y RET; CD74 y NRG1; CD74 y ROS1; CDH11 y USP6; CDKN2D y WDFY2; CEP89 y BRAF; CHCHD7 y PLAG1; CIC y DUX4L1; CIC y FOXO4; CLCN6 y BRAF; CLIP1 y ROS1; CLTC y ALK; CLTC y TFE3; CNBP y USP6; COL1A1 y PDGFB; COL1A1 y USP6; COL1A2 y PLAG1; CRTC1 y MAML2; CRTC3 y MAML2; CTAGE5 y SIP1; CTNNB1 y PLAG1; DCTN1 y ALK; DDX5 y ETV4; DNAJB1 y PRKACA; EIF3E y RSPO2; EIF3K y CYP39A1; EML4 y ALK; EPC1 y PHF1; ERC1 y RET; ERC1 y ROS1; ERO1L y FERMT2; ESRP1 y RAF1; ETV6 e ITPR2; ETV6 y JAK2; ETV6 y NTRK3; EWSR1 y ATF1; EWSR1 y CREB1; EWSR1 y DDIT3; EWSR1 y ERG; EWSR1 y ETV1; EWSR1 y ETV4; EWSR1 y FEV; EWSR1 y FLI1; EWSR1 y NFATC1; EWSR1 y NFATC2; EWSR1 y NR4A3; EWSR1 y PATZ1; EWSR1 y PBX1; EWSR1 y POU5F1; EWSR1 y SMARCA5; EWSR1 y SP3; EWSR1 y WT1; EWSR1 y YY1; EWSR1 y ZNF384; EWSR1 y ZNF444; EZR y ROS1; FAM131B y BRAF; FBXL18 y RNF216; FCHSD1 y BRAF; FGFR1 y ZNF703; FGFR1 y PLAG1; FGFR1 y TACC1; FGFR3 y BAIAP2L1; FGFR3 y TACC3; FN1 y ALK; FUS y ATF1; FUS y CREB3L1; FUS y CREB3L2; FUS y DDIT3; FUS y ERG; FUS y FEV; GATM y BRAF; GMDS y PDE8B; GNAI1 y BRAF; GOLGA5 y RET; GOPC y ROS1; GPBP1L1 y MAST2; HACL1 y RAF1; HAS2 y PLAG1; HERPUD1 y BRAF; HEY1 y NCOA2; HIP1 y ALK; HLA-A y ROS1; HMGA2 y ALDH2; HMGA2 y CCNB1IP1; HMGA2 y COX6C; HMGA2 y EBF1; HMGA2 y FHIT; HMGA2 y LHFP; HMGA2 y LPP; HMGA2 y NFIB; HMGA2 y RAD51B; HMGA2 y WIF1; HN1 y USH1G; HNRNPA2B1 y ETV1; HOOK3 y RET; IL6R y ATP8B2; INTS4 y GAB2; IRF2BP2 y CDX1; JAZF1 y PHF1; JAZF1 y SUZ12; KIAA1549 y BRAF; KIAA1598 y ROS1; KIF5B y ALK; KIF5B y RET; KLC1 y ALK; KLK2 y ETV1; KLK2 y ETV4; KMT2A y ABI1; KMT2A y ABI2; KMT2A y ACTN4; KMT2A y AFF1; KMT2A y AFF3; KMT2A y AFF4; KMT2A y ARHGAP26; KMT2A y ARHGEF12; KMT2A y BTBD18; KMT2A y CASC5; KMT2A y CASP8AP2; KMT2A y CBL; KMT2A y CREBBP; KMT2A y CT45A2; KMT2A y DAB2IP; KMT2A y EEFSEC; KMT2A y ELL; KMT2A y EP300; KMT2A y EPS15; KMT2A y FOXO3; KMT2A y FOXO4; KMT2A y FRYL; KMT2A y GAS7; KMT2A y GMPS; KMT2A y GPHN; KMT2A y KIAA0284; KMT2A y KIAA1524; KMT2A y LASP1; KMT2A y LPP; KMT2A y MAPRE1; KMT2A y MLLT1; KMT2A y MLLT10; KMT2A y MLLT11; KMT2A y MLLT3; KMT2A y MLLT4; KMT2A y MLLT6; KMT2A y MYOIF; KMT2A y NCKIPSD; KMT2A y NRIP3; KMT2A y PDS5A; KMT2A y PICALM; KMT2A y PRRC1; KMT2A y SARNP; KMT2A y SEPT2; KMT2A y SEPT5; KMT2A y SEPT6; KMT2A y SEPT9; KMT2A y SH3GL1; KMT2A y SORBS2; KMT2A y TET1; KMT2A y TOP3A; KMT2A y ZFYVE19; KTN1 y RET; LIFR y PLAG1; LMNA y NTRK1; LRIG3 y ROS1; LSM14A y BRAF; MARK4 y ERCC2; MBOAT2 y PRKCE; MBTD1 y CXorf67; MEAF6 y PHF1; MKRN1 y BRAF; MSN y ALK; MYB y NFIB; MYO5A y ROS1; NAB2 y STAT6; NACC2 y NTRK2; NCOA4 y RET; NDRG1 y ERG; NF1 y ACCN1; NFIA y EHF; NFIX y MAST1; NONO y TFE3; NOTCH1 y GABBR2; NPM1 y ALK; NTN1 y ACLY; NUP107 y LGR5; OMD y USP6; PAX3 y FOXO1; PAX3 y NCOA1; PAX3 y NCOA2; PAX5 y JAK2; PAX7 y FOXO1; PAX8 y PPARG; PCM1 y JAK2; PCM1 y RET; PLA2R1 y RBMS1; PLXND1 y TMCC1; PPFIBP1 y ALK; PPFIBP1 y ROS1; PRCC y TFE3; PRKAR1A y RET; PTPRK y RSPO3; PWWP2A y ROS1; QKI y NTRK2; RAF1 y DAZL; RANBP2 y ALK; RBM14 y PACS1; RGS22 y SYCP1; RNF130 y BRAF; SDC4 y ROS1; SEC16A_NM_014866.1 y NOTCH1; SEC31A y ALK; SEC31A y JAK2; SEPT8 y AFF4; SFPQ y TFE3; SLC22A1 y CUTA; SLC26A6 y PRKAR2A; SLC34A2 y ROS1; SLC45A3 y BRAF; SLC45A3 y ELK4; SLC45A3 y ERG; SLC45A3 y ETV1; SLC45A3 y ETV5; SND1 y BRAF; SQSTM1 y ALK; SRGAP3 y RAF1; SS18 y SSX1; SS18 y SSX2; SS18 y SSX4; SS18L1 y SSX1; SSBP2 y JAK2; SSH2 y SUZ12; STIL y TALI; STRN y ALK; SUSD1 y ROD1; TADA2A y MAST1; TAF15 y NR4A3; TCEA1 y PLAG1; TCF12 y NR4A3; TCF3 y PBX1; TECTA y TBCEL; TFG y ALK; TFG y NR4A3; TFG y NTRK1; THRAP3 y USP6; TMPRSS2 y ERG; TMPRSS2 y ETV1; TMPRSS2 y ETV4; TMPRSS2 y ETV5; TP53 y NTRK1; TPM3 y ALK; TPM3 y NTRK1; TPM3 y ROS1; TPM3 y ROS1; TPM4 y ALK; TRIM24 y RET; TRIM27 y RET; TRIM33 y RET; UBE2L3 y KRAS; VCL y ALK; VTI1A y TCF7L2; YWHAE y FAM22A; YWHAE y NUTM2B; ZC3H7B y BCOR; ZCCHC8 y ROS1; ZNF700 y MAST1; y ZSCAN30 y BRAF.
4. El ácido nucleico de una cualquiera de las reivindicaciones 1, 2 o 3 partes (a) y (b), en donde:
cada secuencia de nucleótidos de la pluralidad comprende una subsecuencia de extensión de una secuencia de nucleótidos seleccionada entre el grupo que consiste en SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, y SEQ ID NO: 10; y la subsecuencia de extensión comprende la primera subsecuencia y la segunda subsecuencia.
5. El ácido nucleico de una cualquiera de las reivindicaciones 1-4, en donde:
(a) la pluralidad de secuencias de nucleótidos consiste en 2, 3, 2, 3, 4, 5, 6, 7, 8, 9, 10,
18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 0, 41, 42, 43, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 0, 71, 72, 73, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 00, 101, 102, 1 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122,
128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144,
150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166,
194, 195, 196, 197, 198, 199, o 200 secuencias de nucleótidos diferentes; y/o
(b) la pluralidad de secuencias de nucleótidos consiste en 2 a 12 secuencias de nucleótidos; y/o
(c) la pluralidad de secuencias de nucleótidos consiste en 6 secuencias de nucleótidos; y/o
(d) cada primera subsecuencia y cada segunda subsecuencia tienen al menos de 120 a 500 nucleótidos de longitud.
6. El ácido nucleico de una cualquiera de las reivindicaciones 1-5, en donde:
(a) una primera subsecuencia o una segunda subsecuencia de una secuencia de nucleótidos de la pluralidad comprende dos o más exones;
cada exón de los dos o más exones es un exón del mismo gen; y
los exones de los dos o más exones están ordenados en el ácido nucleico de acuerdo con el orden de los exones en un ARNm de origen natural,
opcionalmente
en donde:
una primera subsecuencia comprende dos o más exones, y el primer exón de la primera subsecuencia tiene menos de 200 nucleótidos de longitud; o
una segunda subsecuencia comprende dos o más exones, y el segundo exón de la segunda subsecuencia tiene menos de 200 nucleótidos de longitud; y/o
(b) el ácido nucleico es como se presenta en la parte (a) y la suma de las longitudes de los dos o más exones es de al menos 50 nucleótidos de longitud o de 120 a 500 nucleótidos de longitud; y/o
(c) el ácido nucleico comprende además una secuencia de nucleótidos que comprende un intrón, en donde:
la secuencia de nucleótidos que comprende un intrón comprende una primera subsecuencia y una segunda subsecuencia;
la primera subsecuencia comprende una subsecuencia 3' de un intrón o exón de un primer gen;
la segunda subsecuencia comprende una subsecuencia 5' de un intrón o exón de un segundo gen;
la primera subsecuencia y la segunda subsecuencia son secuencias adyacentes en el ácido nucleico;
la primera subsecuencia está en 5' con respecto a la segunda subsecuencia; y
el primer gen y el segundo gen son el mismo gen o genes diferentes;
opcionalmente en donde:
la primera subsecuencia comprende una subsecuencia 3' de un intrón de un primer gen; o
la segunda subsecuencia comprende una subsecuencia 5' de un intrón de un segundo gen; y/o
(d) el ácido nucleico es como se presenta en la parte (c) y el primer gen y el segundo gen de la secuencia de nucleótidos que comprende un intrón son genes diferentes o son el mismo gen; y/o
(e) el ácido nucleico comprende además una cola de poli-A.
7. El ácido nucleico de la reivindicación 6, en donde el ácido nucleico comprende además al menos un nucleósido metilado, opcionalmente en donde el al menos un nucleósido metilado comprende 7-metil guanosina, opcionalmente en donde el ácido nucleico comprende una protección 5' [m7G(5')ppp(5')G].
8. El ácido nucleico de la reivindicación 6, en donde:
(a) el ácido nucleico comprende además un promotor, opcionalmente en donde el promotor es un promotor SP6;
y/o
(b) el ácido nucleico comprende además un promotor en donde el promotor es de una especie diferente a las secuencias de nucleótidos de la pluralidad, opcionalmente en donde el promotor es un promotor SP6; y/o
(c) el ácido nucleico es un plásmido.
9. Un método para preparar el ácido nucleico de una cualquiera de las reivindicaciones 1-7, que comprende incubar una mezcla de reacción que comprende un molde de ADN, ARN polimerasa, y ribonucleótido trifosfatos a una
temperatura a la que la ARN polimerasa muestra actividad de polimerasa, formando de ese modo el ácido nucleico.
10. Una célula que comprende el ácido nucleico de una cualquiera de las reivindicaciones 1-8.
11. La célula de la reivindicación 10, en donde:
(a) la célula es una célula humana; y/o
(b) la célula es un fibroblasto o un linfocito, opcionalmente un linfocito B inmortalizado; y/o
(c) la célula es GM12878, GM24149, GM24143, GM24385, GM24631, GM24694, o GM24695, opcionalmente GM24385; y/o
(d) la célula comprende de 1 a 1.000 copias o de 5 a 500 copias del ácido nucleico; o
(e) la célula es E. coli.
12. Una composición, que comprende una primera pluralidad de células y una segunda pluralidad de células, en donde:
la primera pluralidad de células consiste en células de acuerdo con la reivindicación 11 parte (d), células que comprenden de 5 a 500 copias del ácido nucleico;
la segunda pluralidad de células consiste en células que no comprenden el ácido nucleico;
la primera pluralidad de células y la segunda pluralidad de células son células humanas;
la primera pluralidad de células y la segunda pluralidad de células están mezcladas en la composición; y la proporción del número de células de la primera pluralidad con respecto al número de células de la segunda pluralidad es de aproximadamente 1:1 a aproximadamente 1:10.000 en la composición.
13. Un método para preparar un material de referencia biológico, que comprende transfectar una pluralidad de células con el ácido nucleico de una cualquiera de las reivindicaciones 1-8,
que comprende además opcionalmente:
(a) fijar las células de la pluralidad, opcionalmente en donde fijar las células comprende fijar las células con formalina; y/o
(b) embeber las células en parafina; y/o
(c) diluir la pluralidad de células con células no transfectadas, opcionalmente en donde diluir la pluralidad de células con células no transfectadas comprende diluir a una proporción de células transfectadas con respecto a células no transfectadas de aproximadamente 1:1 a aproximadamente 1:10.000.
14. Un material de referencia biológico, que comprende:
(a) una pluralidad de células de una cualquiera de las reivindicaciones 10 u 11 partes (a)-(d) y parafina, en donde la pluralidad de células están fijadas y embebidas en la parafina, que comprende además opcionalmente células no transfectadas en donde las células no transfectadas no comprenden el ácido nucleico o la pluralidad de fragmentos de ácido nucleico, opcionalmente en donde la proporción de células que comprenden el ácido nucleico o la pluralidad de fragmentos de ácido nucleico con respecto a células no transfectadas es de aproximadamente 1:1 a aproximadamente 1:10.000, de aproximadamente 1:5 a aproximadamente 1:5.000 o de aproximadamente 1:10 a aproximadamente 1:1.000; o
(b) una pluralidad de células de una cualquiera de las reivindicaciones 10 u 11 partes (a)-(d); y un líquido, opcionalmente en donde el líquido es plasma sanguíneo.
15. Una composición que comprende el ácido nucleico de una cualquiera de las reivindicaciones 1-8, y un tampón acuoso, opcionalmente en donde el tampón comprende tris(hidroximetil)aminometano y ácido etilendiaminotetraacético, o una sal de uno cualquiera de los mencionados anteriormente.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562261514P | 2015-12-01 | 2015-12-01 | |
US201662323659P | 2016-04-16 | 2016-04-16 | |
PCT/US2016/048661 WO2017095486A1 (en) | 2015-12-01 | 2016-08-25 | Multiplex cellular reference materials |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2893000T3 true ES2893000T3 (es) | 2022-02-07 |
Family
ID=58797728
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES16871194T Active ES2893000T3 (es) | 2015-12-01 | 2016-08-25 | Materiales de referencia celulares multiplex |
ES16871195T Active ES2972471T3 (es) | 2015-12-01 | 2016-08-25 | Materiales de referencia celulares multiplex |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES16871195T Active ES2972471T3 (es) | 2015-12-01 | 2016-08-25 | Materiales de referencia celulares multiplex |
Country Status (9)
Country | Link |
---|---|
US (2) | US20190352720A1 (es) |
EP (3) | EP3384054B1 (es) |
AU (2) | AU2016362875B2 (es) |
CA (2) | CA3006464A1 (es) |
DK (2) | DK3384054T5 (es) |
ES (2) | ES2893000T3 (es) |
FI (1) | FI3384054T3 (es) |
IL (2) | IL259448B2 (es) |
WO (2) | WO2017095486A1 (es) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MY201941A (en) * | 2017-08-21 | 2024-03-25 | Taiho Pharmaceutical Co Ltd | Fusion protein of dctn1 protein with ret protein |
AU2019374898A1 (en) * | 2018-11-08 | 2021-06-24 | University Of Miami | Method of determining responsiveness to cell therapy in dilated cardiomyopathy |
TW202122590A (zh) * | 2019-08-28 | 2021-06-16 | 行動基因生技股份有限公司 | 檢測ntrk基因融合的套組及方法 |
IL293051A (en) | 2019-11-18 | 2022-07-01 | Janssen Biotech Inc | calr and jak2 mutant-based vaccines and their uses |
CN112080566B (zh) * | 2020-08-25 | 2021-08-17 | 上海交通大学医学院附属瑞金医院 | 基于高通量测序法的甲状腺癌检测产品及用途 |
CN115141886B (zh) * | 2022-06-28 | 2023-06-06 | 厦门艾德生物医药科技股份有限公司 | 一种基于高通量测序的髓系白血病基因突变检测的探针引物组及其应用 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2408980B (en) * | 2003-12-09 | 2006-06-07 | Nat Biolog Standards Board | Genetic reference materials |
WO2007056825A1 (en) * | 2005-11-21 | 2007-05-24 | Simons Haplomics Limited | Method and probes for identifying a nucleotide sequence |
US20100286143A1 (en) * | 2009-04-24 | 2010-11-11 | Dora Dias-Santagata | Methods and materials for genetic analysis of tumors |
EP2633311A4 (en) * | 2010-10-26 | 2014-05-07 | Univ Stanford | NON-INVASIVE F TAL GENE SCREENING BY SEQUENCING ANALYSIS |
CA2890346A1 (en) * | 2012-11-05 | 2014-05-08 | Foundation Medicine, Inc. | Novel fusion molecules and uses thereof |
EP3421613B1 (en) * | 2013-03-15 | 2020-08-19 | The Board of Trustees of the Leland Stanford Junior University | Identification and use of circulating nucleic acid tumor markers |
CN103468813B (zh) | 2013-09-17 | 2015-06-03 | 广州达健生物科技有限公司 | Eml4-alk融合基因荧光定量pcr检测试剂盒 |
EP3066194B1 (en) * | 2013-11-05 | 2019-08-07 | Life Technologies Corporation | Method for preparing ffpe quality control material with bulking agent |
WO2015073080A1 (en) * | 2013-11-12 | 2015-05-21 | Life Technologies Corporation | Reagents and methods for sequencing |
EP4219744A3 (en) * | 2014-01-27 | 2023-08-30 | The General Hospital Corporation | Methods of preparing nucleic acids for sequencing |
GB201402249D0 (en) * | 2014-02-10 | 2014-03-26 | Vela Operations Pte Ltd | NGS systems control and methods involving the same |
-
2016
- 2016-08-25 ES ES16871194T patent/ES2893000T3/es active Active
- 2016-08-25 EP EP16871195.0A patent/EP3384054B1/en active Active
- 2016-08-25 US US15/779,682 patent/US20190352720A1/en active Pending
- 2016-08-25 CA CA3006464A patent/CA3006464A1/en active Pending
- 2016-08-25 AU AU2016362875A patent/AU2016362875B2/en active Active
- 2016-08-25 EP EP16871194.3A patent/EP3384053B1/en active Active
- 2016-08-25 CA CA3007056A patent/CA3007056A1/en active Pending
- 2016-08-25 FI FIEP16871195.0T patent/FI3384054T3/fi active
- 2016-08-25 US US15/779,681 patent/US20190177794A1/en active Pending
- 2016-08-25 AU AU2016362876A patent/AU2016362876B2/en active Active
- 2016-08-25 ES ES16871195T patent/ES2972471T3/es active Active
- 2016-08-25 WO PCT/US2016/048661 patent/WO2017095486A1/en active Application Filing
- 2016-08-25 DK DK16871195.0T patent/DK3384054T5/da active
- 2016-08-25 EP EP21179226.2A patent/EP3929305B1/en active Active
- 2016-08-25 IL IL259448A patent/IL259448B2/en unknown
- 2016-08-25 DK DK21179226.2T patent/DK3929305T5/da active
- 2016-08-25 WO PCT/US2016/048668 patent/WO2017095487A1/en active Application Filing
-
2018
- 2018-05-17 IL IL259449A patent/IL259449B/en unknown
Also Published As
Publication number | Publication date |
---|---|
FI3384054T3 (fi) | 2024-02-19 |
WO2017095487A1 (en) | 2017-06-08 |
CA3006464A1 (en) | 2017-06-08 |
DK3929305T3 (en) | 2024-01-02 |
EP3384054A4 (en) | 2019-07-24 |
DK3384054T3 (en) | 2024-01-08 |
DK3929305T5 (en) | 2024-08-05 |
IL259449B (en) | 2021-12-01 |
EP3929305B1 (en) | 2023-11-08 |
AU2016362875A1 (en) | 2018-06-21 |
AU2016362875B2 (en) | 2022-12-08 |
US20190352720A1 (en) | 2019-11-21 |
EP3384054B1 (en) | 2023-11-29 |
DK3384054T5 (en) | 2024-08-05 |
IL259448B1 (en) | 2023-10-01 |
EP3929305A1 (en) | 2021-12-29 |
IL259448A (en) | 2018-07-31 |
IL259448B2 (en) | 2024-02-01 |
EP3384053A1 (en) | 2018-10-10 |
EP3384053A4 (en) | 2019-07-24 |
IL259449A (en) | 2018-07-31 |
EP3384054A1 (en) | 2018-10-10 |
US20190177794A1 (en) | 2019-06-13 |
AU2016362876B2 (en) | 2023-02-09 |
WO2017095486A1 (en) | 2017-06-08 |
EP3384053B1 (en) | 2021-08-11 |
ES2972471T3 (es) | 2024-06-12 |
AU2016362876A1 (en) | 2018-06-28 |
CA3007056A1 (en) | 2017-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2893000T3 (es) | Materiales de referencia celulares multiplex | |
Jiang et al. | TEFM regulates both transcription elongation and RNA processing in mitochondria | |
US20240140978A1 (en) | Therapeutic oligonucleotides | |
RU2662932C2 (ru) | Композиции и способы с участием нуклеиновых кислот, нацеленных на нуклеиновые кислоты | |
CA3025486A1 (en) | Oligonucleotide probes and uses thereof | |
Zhang et al. | Translation repression via modulation of the cytoplasmic poly (A)-binding protein in the inflammatory response | |
AU2018244320A1 (en) | Oligonucleotide probes and uses thereof | |
Liu et al. | circFL-seq reveals full-length circular RNAs with rolling circular reverse transcription and nanopore sequencing | |
Malone et al. | Selective modulation of a pan-essential protein as a therapeutic strategy in cancer | |
Sammons et al. | ZNF9 activation of IRES-mediated translation of the human ODC mRNA is decreased in myotonic dystrophy type 2 | |
US20150045237A1 (en) | Method for identification of the sequence of poly(a)+rna that physically interacts with protein | |
Rao et al. | KMT 1 family methyltransferases regulate heterochromatin–nuclear periphery tethering via histone and non‐histone protein methylation | |
Ueberschär et al. | BEN-solo factors partition active chromatin to ensure proper gene activation in Drosophila | |
Falk et al. | The EIF4E1-4EIP cap-binding complex of Trypanosoma brucei interacts with the terminal uridylyl transferase TUT3 | |
ES2971123T3 (es) | Cribado de alta productividad basado en células para aptámeros | |
US20230277618A1 (en) | Therapeutic targeting of phosphate dysregulation in cancer via the xpr1:kidins220 protein complex | |
Baticados | Functional consequences of transmembrane protein 30A (TMEM30A) inactivating mutations in diffuse large B-cell lymphoma | |
Marr | Probing Genome-Wide Native Chromatin Structure via Histone Surface Accessibilities | |
Yuan | G-quadruplexes in Gene Regulation and Telomere Maintenance | |
Duggimpudi | Elucidating the physiological function of the RNA binding protein EWS and its role in post-transcriptional gene regulation | |
WO2023173012A2 (en) | Compositions for activating and silencing gene expression | |
WO2021194531A1 (en) | Dna repair site detection for personal genomics, epigenomics, and gene therapy | |
Class et al. | Patent application title: METHOD FOR IDENTIFICATION OF THE SEQUENCE OF POLY (A)+ RNA THAT PHYSICALLY INTERACTS WITH PROTEIN Inventors: Markus Landthaler (Berlin, DE) Mathias Munschauer (Berlin, DE) Alexander Baltz (Berlin, DE) | |
Gao et al. | C-BERST: Defining subnuclear proteomic landscapes at genomic elements with dCas9-APEX2 [preprint] | |
Gupta | The human CCHC-type Zinc Finger Nucleic Acid Binding Protein (CNBP) binds to the G-rich elements in target mRNA coding sequences and promotes translation |