ES2612903T3 - Moléculas de ácido nucleico y colecciones de las mismas, su aplicación e identificación - Google Patents
Moléculas de ácido nucleico y colecciones de las mismas, su aplicación e identificación Download PDFInfo
- Publication number
- ES2612903T3 ES2612903T3 ES11181833.2T ES11181833T ES2612903T3 ES 2612903 T3 ES2612903 T3 ES 2612903T3 ES 11181833 T ES11181833 T ES 11181833T ES 2612903 T3 ES2612903 T3 ES 2612903T3
- Authority
- ES
- Spain
- Prior art keywords
- mrna
- nucleic acid
- sequence
- cell
- mrnas
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 184
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 177
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 177
- 108020004999 messenger RNA Proteins 0.000 claims abstract description 145
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 116
- 239000002773 nucleotide Substances 0.000 claims abstract description 104
- 108020004414 DNA Proteins 0.000 claims abstract description 22
- 125000002652 ribonucleotide group Chemical group 0.000 claims abstract description 6
- 108091028664 Ribonucleotide Proteins 0.000 claims abstract description 5
- 239000002336 ribonucleotide Substances 0.000 claims abstract description 5
- 108091026890 Coding region Proteins 0.000 claims abstract description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 56
- 102000053602 DNA Human genes 0.000 claims description 7
- 239000002679 microRNA Substances 0.000 abstract description 32
- 108091070501 miRNA Proteins 0.000 abstract 2
- 108700011259 MicroRNAs Proteins 0.000 description 403
- 210000004027 cell Anatomy 0.000 description 156
- 239000000523 sample Substances 0.000 description 110
- 230000014509 gene expression Effects 0.000 description 102
- 230000000295 complement effect Effects 0.000 description 97
- 108090000623 proteins and genes Proteins 0.000 description 96
- 238000000034 method Methods 0.000 description 92
- 241000282414 Homo sapiens Species 0.000 description 78
- 108091034117 Oligonucleotide Proteins 0.000 description 76
- 241000699666 Mus <mouse, genus> Species 0.000 description 67
- 108091027967 Small hairpin RNA Proteins 0.000 description 63
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 58
- 210000001519 tissue Anatomy 0.000 description 49
- 239000011159 matrix material Substances 0.000 description 39
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 31
- 241000894007 species Species 0.000 description 30
- 206010028980 Neoplasm Diseases 0.000 description 29
- 238000004458 analytical method Methods 0.000 description 29
- 201000011510 cancer Diseases 0.000 description 23
- 239000002243 precursor Substances 0.000 description 22
- 238000011161 development Methods 0.000 description 21
- 230000018109 developmental process Effects 0.000 description 21
- 238000002493 microarray Methods 0.000 description 21
- 101000907904 Homo sapiens Endoribonuclease Dicer Proteins 0.000 description 20
- 210000002308 embryonic cell Anatomy 0.000 description 20
- 230000006870 function Effects 0.000 description 19
- 102100023387 Endoribonuclease Dicer Human genes 0.000 description 18
- 201000010099 disease Diseases 0.000 description 18
- 241000700159 Rattus Species 0.000 description 17
- 108020004459 Small interfering RNA Proteins 0.000 description 17
- 108091032955 Bacterial small RNA Proteins 0.000 description 16
- 239000000203 mixture Substances 0.000 description 16
- 230000009471 action Effects 0.000 description 15
- 210000004556 brain Anatomy 0.000 description 15
- 102000004169 proteins and genes Human genes 0.000 description 15
- 108091027974 Mature messenger RNA Proteins 0.000 description 14
- 238000009396 hybridization Methods 0.000 description 14
- 238000003752 polymerase chain reaction Methods 0.000 description 14
- 208000035475 disorder Diseases 0.000 description 13
- 230000001594 aberrant effect Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 12
- 210000004881 tumor cell Anatomy 0.000 description 12
- 230000000875 corresponding effect Effects 0.000 description 11
- 238000002474 experimental method Methods 0.000 description 11
- 238000012360 testing method Methods 0.000 description 11
- 241000252212 Danio rerio Species 0.000 description 10
- 241000124008 Mammalia Species 0.000 description 10
- 241000288906 Primates Species 0.000 description 10
- 210000001671 embryonic stem cell Anatomy 0.000 description 10
- 210000001161 mammalian embryo Anatomy 0.000 description 10
- 239000008194 pharmaceutical composition Substances 0.000 description 10
- 230000035755 proliferation Effects 0.000 description 10
- 238000012163 sequencing technique Methods 0.000 description 10
- 230000014616 translation Effects 0.000 description 10
- 238000003556 assay Methods 0.000 description 9
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 230000035772 mutation Effects 0.000 description 9
- 238000013519 translation Methods 0.000 description 9
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000003776 cleavage reaction Methods 0.000 description 8
- 238000001914 filtration Methods 0.000 description 8
- 230000009368 gene silencing by RNA Effects 0.000 description 8
- 210000002216 heart Anatomy 0.000 description 8
- 230000007017 scission Effects 0.000 description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 8
- 241000282553 Macaca Species 0.000 description 7
- 108091030071 RNAI Proteins 0.000 description 7
- 241000283984 Rodentia Species 0.000 description 7
- 239000000872 buffer Substances 0.000 description 7
- 238000012512 characterization method Methods 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000035945 sensitivity Effects 0.000 description 7
- 230000001225 therapeutic effect Effects 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 241000251468 Actinopterygii Species 0.000 description 6
- 241000283690 Bos taurus Species 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- 210000004958 brain cell Anatomy 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 230000004069 differentiation Effects 0.000 description 6
- 210000002257 embryonic structure Anatomy 0.000 description 6
- 230000030279 gene silencing Effects 0.000 description 6
- 210000004072 lung Anatomy 0.000 description 6
- 230000007935 neutral effect Effects 0.000 description 6
- 230000001717 pathogenic effect Effects 0.000 description 6
- 208000003200 Adenoma Diseases 0.000 description 5
- 206010001233 Adenoma benign Diseases 0.000 description 5
- 241000196324 Embryophyta Species 0.000 description 5
- 241000287828 Gallus gallus Species 0.000 description 5
- 101100144701 Mus musculus Drosha gene Proteins 0.000 description 5
- 238000000636 Northern blotting Methods 0.000 description 5
- 108091093037 Peptide nucleic acid Proteins 0.000 description 5
- 241000009328 Perro Species 0.000 description 5
- 108091036066 Three prime untranslated region Proteins 0.000 description 5
- 108020004566 Transfer RNA Proteins 0.000 description 5
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 5
- 208000036142 Viral infection Diseases 0.000 description 5
- 239000002253 acid Substances 0.000 description 5
- 238000010804 cDNA synthesis Methods 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 238000003745 diagnosis Methods 0.000 description 5
- 210000002064 heart cell Anatomy 0.000 description 5
- 230000005764 inhibitory process Effects 0.000 description 5
- 210000005229 liver cell Anatomy 0.000 description 5
- 210000005265 lung cell Anatomy 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 210000004927 skin cell Anatomy 0.000 description 5
- 210000001541 thymus gland Anatomy 0.000 description 5
- 230000009385 viral infection Effects 0.000 description 5
- 239000011534 wash buffer Substances 0.000 description 5
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- BACYUWVYYTXETD-UHFFFAOYSA-N N-Lauroylsarcosine Chemical compound CCCCCCCCCCCC(=O)N(C)CC(O)=O BACYUWVYYTXETD-UHFFFAOYSA-N 0.000 description 4
- 238000000429 assembly Methods 0.000 description 4
- 230000000712 assembly Effects 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 230000009849 deactivation Effects 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 238000002405 diagnostic procedure Methods 0.000 description 4
- 210000003754 fetus Anatomy 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 208000019622 heart disease Diseases 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 230000008774 maternal effect Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000003252 repetitive effect Effects 0.000 description 4
- 108700004121 sarkosyl Proteins 0.000 description 4
- 125000006850 spacer group Chemical group 0.000 description 4
- 238000011895 specific detection Methods 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 108091030146 MiRBase Proteins 0.000 description 3
- 241000244206 Nematoda Species 0.000 description 3
- 102000014736 Notch Human genes 0.000 description 3
- 108010070047 Notch Receptors Proteins 0.000 description 3
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 3
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 3
- 241001441723 Takifugu Species 0.000 description 3
- 239000000654 additive Substances 0.000 description 3
- 230000000996 additive effect Effects 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 230000000692 anti-sense effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 239000012472 biological sample Substances 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 210000005013 brain tissue Anatomy 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 239000003937 drug carrier Substances 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 230000001605 fetal effect Effects 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 239000002502 liposome Substances 0.000 description 3
- 230000036210 malignancy Effects 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 230000003278 mimic effect Effects 0.000 description 3
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 3
- 230000001575 pathological effect Effects 0.000 description 3
- 229920002401 polyacrylamide Polymers 0.000 description 3
- 239000002994 raw material Substances 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 2
- 102100031780 Endonuclease Human genes 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- SEQKRHFRPICQDD-UHFFFAOYSA-N N-tris(hydroxymethyl)methylglycine Chemical compound OCC(CO)(CO)[NH2+]CC([O-])=O SEQKRHFRPICQDD-UHFFFAOYSA-N 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 101710124239 Poly(A) polymerase Proteins 0.000 description 2
- 239000013614 RNA sample Substances 0.000 description 2
- 108010016790 RNA-Induced Silencing Complex Proteins 0.000 description 2
- 102000000574 RNA-Induced Silencing Complex Human genes 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 150000001413 amino acids Chemical group 0.000 description 2
- 230000027455 binding Effects 0.000 description 2
- 125000002091 cationic group Chemical group 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 208000022602 disease susceptibility Diseases 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 210000004602 germ cell Anatomy 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 108091023663 let-7 stem-loop Proteins 0.000 description 2
- 108091063478 let-7-1 stem-loop Proteins 0.000 description 2
- 108091049777 let-7-2 stem-loop Proteins 0.000 description 2
- 108091053735 lin-4 stem-loop Proteins 0.000 description 2
- 108091032363 lin-4-1 stem-loop Proteins 0.000 description 2
- 108091028008 lin-4-2 stem-loop Proteins 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 108091085969 miR-61 stem-loop Proteins 0.000 description 2
- 108091064233 miR-61-1 stem-loop Proteins 0.000 description 2
- 108091043412 miR-61-2 stem-loop Proteins 0.000 description 2
- 108091070523 miR163 stem-loop Proteins 0.000 description 2
- 108091059821 miR173 stem-loop Proteins 0.000 description 2
- 108091083752 miR402 stem-loop Proteins 0.000 description 2
- 108091046880 miR416 stem-loop Proteins 0.000 description 2
- 108091049650 miR417 stem-loop Proteins 0.000 description 2
- 108091050537 miR418 stem-loop Proteins 0.000 description 2
- 108091056527 miR419 stem-loop Proteins 0.000 description 2
- 108091079534 miR420 stem-loop Proteins 0.000 description 2
- 238000010208 microarray analysis Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 238000012175 pyrosequencing Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 239000004055 small Interfering RNA Substances 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- 241000256186 Anopheles <genus> Species 0.000 description 1
- 241000256844 Apis mellifera Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 102100025238 CD302 antigen Human genes 0.000 description 1
- 241000244203 Caenorhabditis elegans Species 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 241000251569 Ciona Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241001559589 Cullen Species 0.000 description 1
- 208000012239 Developmental disease Diseases 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241000289427 Didelphidae Species 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- 241000282575 Gorilla Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 108700005087 Homeobox Genes Proteins 0.000 description 1
- 101100273718 Homo sapiens CD302 gene Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 241000288904 Lemur Species 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 108091007775 MIR1-1 Proteins 0.000 description 1
- 108091064430 Mir-48 Proteins 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101100496109 Mus musculus Clec2i gene Proteins 0.000 description 1
- 108091066297 Mus musculus let-7e stem-loop Proteins 0.000 description 1
- 108091069074 Mus musculus miR-106a stem-loop Proteins 0.000 description 1
- 108091067012 Mus musculus miR-133b stem-loop Proteins 0.000 description 1
- 108091068658 Mus musculus miR-149 stem-loop Proteins 0.000 description 1
- 108091068656 Mus musculus miR-150 stem-loop Proteins 0.000 description 1
- 108091067716 Mus musculus miR-185 stem-loop Proteins 0.000 description 1
- 108091068783 Mus musculus miR-30a stem-loop Proteins 0.000 description 1
- 108091067644 Mus musculus miR-30e stem-loop Proteins 0.000 description 1
- 108091068781 Mus musculus miR-99a stem-loop Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 102000016187 PAZ domains Human genes 0.000 description 1
- 108050004670 PAZ domains Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241000282577 Pan troglodytes Species 0.000 description 1
- 241000282405 Pongo abelii Species 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000288961 Saguinus imperator Species 0.000 description 1
- 241000221016 Schoepfia arenaria Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 238000012167 Small RNA sequencing Methods 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 108700025695 Suppressor Genes Proteins 0.000 description 1
- UZMAPBJVXOGOFT-UHFFFAOYSA-N Syringetin Natural products COC1=C(O)C(OC)=CC(C2=C(C(=O)C3=C(O)C=C(O)C=C3O2)O)=C1 UZMAPBJVXOGOFT-UHFFFAOYSA-N 0.000 description 1
- 241000214655 Tetraodon Species 0.000 description 1
- 239000007997 Tricine buffer Substances 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 1
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 1
- 241000269370 Xenopus <genus> Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 235000019606 astringent taste Nutrition 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 238000012742 biochemical analysis Methods 0.000 description 1
- 238000007622 bioinformatic analysis Methods 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 210000000133 brain stem Anatomy 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- TWFZGCMQGLPBSX-UHFFFAOYSA-N carbendazim Chemical compound C1=CC=C2NC(NC(=O)OC)=NC2=C1 TWFZGCMQGLPBSX-UHFFFAOYSA-N 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 210000001638 cerebellum Anatomy 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 230000007748 combinatorial effect Effects 0.000 description 1
- 238000010205 computational analysis Methods 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 101150012655 dcl1 gene Proteins 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- KCFYHBSOLOXZIF-UHFFFAOYSA-N dihydrochrysin Natural products COC1=C(O)C(OC)=CC(C2OC3=CC(O)=CC(O)=C3C(=O)C2)=C1 KCFYHBSOLOXZIF-UHFFFAOYSA-N 0.000 description 1
- 239000013024 dilution buffer Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 230000001819 effect on gene Effects 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 210000001652 frontal lobe Anatomy 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 210000005003 heart tissue Anatomy 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 102000051308 human DICER1 Human genes 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 229940102223 injectable solution Drugs 0.000 description 1
- 229940102213 injectable suspension Drugs 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000010468 interferon response Effects 0.000 description 1
- 208000028774 intestinal disease Diseases 0.000 description 1
- 210000004347 intestinal mucosa Anatomy 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- RCRODHONKLSMIF-UHFFFAOYSA-N isosuberenol Natural products O1C(=O)C=CC2=C1C=C(OC)C(CC(O)C(C)=C)=C2 RCRODHONKLSMIF-UHFFFAOYSA-N 0.000 description 1
- 230000000366 juvenile effect Effects 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 101150072601 lin-14 gene Proteins 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 201000002037 lung adenoma Diseases 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 238000010841 mRNA extraction Methods 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 108091044592 miR-1-1 stem-loop Proteins 0.000 description 1
- 108091045542 miR-1-2 stem-loop Proteins 0.000 description 1
- 108091023127 miR-196 stem-loop Proteins 0.000 description 1
- 108091063796 miR-206 stem-loop Proteins 0.000 description 1
- 108091039884 miR-241 stem-loop Proteins 0.000 description 1
- 108091073853 miR-241-1 stem-loop Proteins 0.000 description 1
- 108091057178 miR-241-2 stem-loop Proteins 0.000 description 1
- 108091029119 miR-34a stem-loop Proteins 0.000 description 1
- 108091076178 miR-48 stem-loop Proteins 0.000 description 1
- 108091084599 miR-48-1 stem-loop Proteins 0.000 description 1
- 108091074333 miR-48-2 stem-loop Proteins 0.000 description 1
- 108091062546 miR-84 stem-loop Proteins 0.000 description 1
- 238000012775 microarray technology Methods 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 230000003387 muscular Effects 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- GUCVJGMIXFAOAE-UHFFFAOYSA-N niobium atom Chemical compound [Nb] GUCVJGMIXFAOAE-UHFFFAOYSA-N 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 210000000869 occipital lobe Anatomy 0.000 description 1
- 239000002674 ointment Substances 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 231100000255 pathogenic effect Toxicity 0.000 description 1
- VYMDGNCVAMGZFE-UHFFFAOYSA-N phenylbutazonum Chemical compound O=C1C(CCCC)C(=O)N(C=2C=CC=CC=2)N1C1=CC=CC=C1 VYMDGNCVAMGZFE-UHFFFAOYSA-N 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002335 preservative effect Effects 0.000 description 1
- 108091007428 primary miRNA Proteins 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 102000029946 rDNA binding proteins Human genes 0.000 description 1
- 108091014792 rDNA binding proteins Proteins 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000023276 regulation of development, heterochronic Effects 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 102000019694 tRNA binding proteins Human genes 0.000 description 1
- 108091016288 tRNA binding proteins Proteins 0.000 description 1
- 210000003478 temporal lobe Anatomy 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/14—Type of nucleic acid interfering nucleic acids [NA]
- C12N2310/141—MicroRNAs, miRNAs
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/10—Applications; Uses in screening processes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/178—Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Oncology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmacology & Pharmacy (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Plant Pathology (AREA)
- Hospice & Palliative Care (AREA)
- Heart & Thoracic Surgery (AREA)
- Cardiology (AREA)
- Virology (AREA)
- Communicable Diseases (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
Molécula de ácido nucleico aislado donde dicha molécula de ácido nucleico es una molécula de ARNmi, pre-ARNmi o ADN que codifica dicho pre-ARNmi, que tiene una longitud de 18 a 26 nucleótidos en el caso de ARNmi o 60-110 nucleótidos en el caso de pre-ARNmi o su secuencia codificante, donde: (a) la secuencia de dicha molécula de ácido nucleico comprende una secuencia que codifica un ARNmi seleccionado del grupo que consiste en SEC ID n.º: 9024, 9023 y su secuencia de ribonucleótidos correspondiente, (b) la secuencia de dicha molécula de ácido nucleico comprende una secuencia que codifica un pre-ARNmi que consiste en SEC ID n.º: 1862 y su secuencia de ribonucleótidos correspondiente, (c) la secuencia de dicha molécula de ácido nucleico es al menos 80% idéntica a la molécula de ácido nucleico de (a) o al menos 70% idéntica a la molécula de ácido nucleico de (b).
Description
5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCION
Moleculas de acido nucleico y colecciones de las mismas, su aplicacion e identificacion
[0001] La invencion se refiere a moleculas de acido nucleico y colecciones de las mismas. La invencion se refiere ademas al uso de moleculas de acido nucleico en aplicaciones terapeuticas y de diagnostico. La divulgacion ademas se refiere a un metodo para identificar una molecula de ARNmi o una molecula precursora de la misma.
[0002] MicroARN (ARNmi) son ARN no codificantes que regulan la expresion de los genes en el nivel postranscripcional (resenado en Bartel, 2004). Aunque se ha descubierto recientemente, se ha encontrado que desempenan funciones en una amplia variedad de procesos biologicos, incluyendo especificacion de destino celular, muerte celular, proliferacion y almacenamiento de grasa (Brennecke, 2003, Poy et al., 2004, resenado en Ambros, 2004). Aproximadamente 200 ARNmi diferentes se han descrito ya para raton y humano (Griffiths-Jones, 2004). Los requisitos y mecanismos moleculares por los que los ARNmi regulan la expresion genica se han clarificado actualmente (Bartel; 2004), pero las funciones biologicas individuales permanecen desconocidas en gran medida. La expresion temporal y espacial de los ARNmi pueden ser caracteristicas clave que llevan a la especificidad celular.
[0003] Los ARNmi, tales como los ARNsi, se conocen en el contexto de los ARN de interferencia (ARNi). ARNi es el silenciamiento de la expresion genica por la administracion de ARN bicatenario (ARNbc). ARNi endogeno parece ser un tipo primitivo de sistema inmunologico, dirigido a la defensa de genomas contra parasitos moleculares tales como virus y transposones. Durante el proceso de ARNi, el ARNbc se convierte en una forma mas corta: los siRNA. siRNA es la abreviatura de "short interfering RNA" (ARN interferente corto), y versiones sinteticas de estas moleculas de 21 nucleotidos de largo se han usado ampliamente para inducir ARNi en los sistemas celulares de mamiferos ya que eluden la respuesta especifica de interferon de estas celulas para ARNbc. Los ARNmi son otras especies de moleculas de ARN pequenas. ARNmi, sin embargo, son siempre codificados por el genoma mismo, como estructuras en horquilla, mientras que ARNsi pueden ser tanto artificiales como endogenos (Hamilton & Baulcombe 1999; Aravin et al, 2001; Reinhart & Bartel 2002; Ambros et al, 2003). Ambas moleculas se alimentan en gran medida en uno y el mismo proceso que puede bien llevar a la degradacion de ARNm o a la inhibicion de la sintesis de proteinas. Por regla general, los ARNsi provocan la destruccion de los ARNm, mientras que los ARNmi pueden hacer ambos: en las plantas la mayoria de los ARNmi dirigen la escision, mientras que los ARNmi en animales muy a menudo inducen la inhibicion de traduccion; sin embargo, ejemplos de inhibicion de traduccion en plantas y escision en animales se han encontrado (Chen 2004; Yekta et al, 2004).
[0004] Genes de ARNmi son transcritos por ARN-polimerasa II y los transcritos son posteriormente capsulados y poli- adenilados (Cai et al., 2004). Por lo tanto, modelos de expresion de ARNmi en C. elegans se pueden determinar facilmente fusionando la proteina verde fluorescente (GFP) con las secuencias corriente arriba (Johnson et al, 2003; Johnston & Hobert 2003). El transcrito naciente del ARNmi se denomina pri-miRNA (ARNmi primario) y puede contener mas de un ARNmi. El precursor de la horquilla que contiene ARNmi individual (o pre-ARNmi) es extirpado de este pri- miRNA por la enzima Drosha (Lee et al, 2003) en el nucleo, y es ayudado por una proteina de union a ARNbc, pinza (G. Hannon, Cold Spring Harbor, NY, EE.UU.). Drosha es una enzima de ARNasalll especifica de animal, y es esencial para la production de estructuras precursoras de ARNmi que se pueden exportar desde el nucleo. En plantas, este papel parece ser desempenado por uno de los homologos de Dicer (DCL1; Park et al, 2002; Reinhart et al, 2002; Xie et al, 2004).
[0005] El pre-ARNmi se exporta luego al citosol (Yi et al, 2003; Bohnsack et al, 2004; Lund et al, 2004), donde es procesado posteriormente por Dicer (Grishok et al, 2001; Hutvagner et al, 2001; Ketting et al, 2001). Esta enzima basicamente puede coger cualquier ARNbc y convertirlo en ARNsi/mi (Bernstein et al, 2001) y ha habido muchos modelos para los que se ha conseguido. Sin embargo, ahora parece claro que la enzima Dicer humana lo hace enlazando, como un monomero, a un extremo del ARNbc a traves del dominio PAZ (= Piwi-Argonaute-Zwille) (Lingel et al, 2003; Song et al, 2003; Yan et al, 2003), que parece reconocer especificamente los extremos de ARNbc producidos por las enzimas de ARNasalll (Ma et al, 2004). Esto coloca los dos dominios de ARNasalll del monomero Dicer de manera que forman un sitio activo de aproximadamente 21 pares de bases (Zhang et al, 2004). En el caso de los ARNmi, este modo de action normalmente lleva a la produccion de solo un ARNmi de secuencia especifica, ya que solo el extremo emparejado de la horquilla de pre-ARNmi puede ser reconocido. El modo de accion de la produccion de ARNmi a partir de pre-ARNmi es impredecible en cuanto a que los ARNmi especificos no se pueden predecir basandose en la secuencia de acidos nucleicos del pre-ARNmi.
[0006] El complejo que es en ultima instancia responsable del silenciamiento se ha denominado complejo de silenciamiento inducido por ARN (RlSC), que incorpora tanto ARNsi como ARNmi. Solo el ARN monocatenario se incorpora, sin embargo, y cual de las dos cadenas los convierte en RlSC es determinado por la naturaleza asimetrica termodinamicamente del ARNsi: la cadena con el extremo 5' mas holgadamente base apareado es en la mayoria de los casos incorporada (Khvorova et al, 2003; Schwarz et al, 2003). P. Zamore (Worcester, MA, EE.UU.) informo de que esta asimetria es detectada por Dicer en el complejo con la proteina de union a ARNbc R2D2, que lleva literalmente esta cadena al complejo RlSC (Lee et al, 2004; Pham et al, 2004; Tomari et al, 2004). Lo que ocurre despues es determinado por una combination de factores: el origen del ARN pequeno (esto es, si ha sido procesado por Drosha y/o Dicer), proteinas asociadas y la extension del apareamiento de base entre el ARNm diana y el ARNsi/mi.
5
10
15
20
25
30
35
40
45
50
55
60
65
[0007] Una de las consecuencias es la escision del ARNm. La proteina que ejecuta esta escision ("Slicer") permanece evasiva, pero se sabe la quimica que esta enzima deberia usar: un grupo 3' hidroxilo y 5' fosfato caracterizan el producto de escision (Martinez & Tuschl 2004; Schwarz et al, 2004). Tambien, RISC se comporta como una enzima real, asi cataliza muchos ciclos de escision. El otro resultado, inhibicion de la traduccion, no esta completamente dilucidado tampoco. La etapa de traduccion que realmente se inhibe podria ser iniciacion y/o alargamiento. Alternativamente el proceso de traduccion podria no ser inhibido en absoluto. Una manera de silenciamiento traduccional puede implicar la degradation de la cadena naciente.
[0008] Actualmente, se conocen aproximadamente 200 ARNmi de mamifero diferentes. Una estimation publicada del numero total de genes de ARNmi en el genoma humano ha sido que el genoma humano contiene como mucho 255 genes de ARNmi (Lim et al., 2003). La invention sorprendentemente descubrio que hay muchos mas ARNmi diferentes expresados en celulas mamiferas. Al menos ~1000 ARNmi putativos en el genoma humano se conservan en al menos algunos otros vertebrados, y hay tambien un numero sustancial de ARNmi especificos de especies.
[0009] La invencion proporciona secuencias de ARNmi nuevas y precursoras y complementos de las mismas. Las especies de ARN mayores desde las que se escinden los ARNmi tienen varios nombres tales como pre-ARNmi, pri- ARNmi y como se usa en la invencion ARN en horquilla. La invencion proporciona muchos ARNmi diferentes y al menos algunas de las especies de ARN mayores de las que se derivan. El ARNmi y el ARN en horquilla proporcionados por la invencion se enumeran en la figura 1. Esta figura contiene una cantidad sustancial de information sobre el ARNmi, la fuente de donation, la estructura del ARN en horquilla, homologos mamiferos de los mismos, y datos extraidos de resultados experimentales de la figura 2, etc. Los diferentes elementos de la figura 1 se detallan en la figura 1A. Tipos de celulas diferentes fueron analizados para la presencia de los ARNmi respectivos. En casos en los que un ARNmi fue producido por una celula, la estructura y la secuencia de nucleotidos del ARNmi fue determinada. La divulgation asi proporciona ademas un metodo para analizar una muestra que comprende acido nucleico a partir de una celula mediante la determination de la presencia en esta de un ARNmi particular o ARN en horquilla de la figura 1. La correlation de los ARNmi detectados con los pre-ARNmi revelo que la prediction precisa de ARNmi directamente basandose en la secuencia de acidos nucleicos de un pre-ARNmi no es posible. Los resultados encontrados por el metodo RAKE modificado, como se detalla en la figura 2A, por ejemplo en un caso, mostraron un ARNmi resultante de una cadena de un precursor de un ARNmi predicho, en otro caso de dos cadenas de un precursor. Ademas hubo una variabilidad significativa de la position del ARNmi en el precursor predicho, la cantidad y la secuencia de nucleotidos en cualquier extremo de una cadena.
[0010] Se ha observado que los ARNmi y los ARN en horquilla de la invencion son expresados diferencialmente en celulas de varios origenes. Una sonda especifica para un ARNmi individual u ARN en horquilla puede asi ser utilizada para muestras diferenciadas basandose en la expresion del ARNmi respectivo o ARN en horquilla. La divulgacion por lo tanto proporciona un metodo para caracterizar una muestra que comprende acido nucleico derivado a partir de una celula, dicho metodo comprende la determinacion de si dicha muestra comprende al menos una secuencia minima de al menos un ARNmi (ARNmi) de la invencion o un homologo mamifero del mismo y/o si dicha muestra comprende un precursor de dicho ARNmi (ARN en horquilla) de la invencion u homologo mamifero del mismo y caracterizacion de dicha muestra basandose en la presencia, abundancia relativa, o ausencia de dicho ARNmi o ARN en horquilla.
[0011] La Figura 1 representa ARNmi y precursores del mismo (denominados en este caso ARN en horquilla) de la invencion. El ARN en horquilla proporcionado en la figura 1 es tipicamente mas corto que el ARN precursor real encontrado en la celula. Contiene las secuencias que forman la estructura tallo-bucle a partir de la que el ARNmi se extirpa.
[0012] ARNmi fueron detectados en varias fuentes biologicas, dependiendo del ARNmi y la fuente biologica. El analisis de la estructura del ARNmi revelo que ARNmi producido a partir de ARN en horquilla es un grupo heterologo donde los ARNmi individuales comparten una secuencia tipicamente central. El ARNmi individual producido a partir de un pre- ARNmi difieren entre si en el extremo 5', el extremo 3' o ambos extremos. Una secuencia minima de un ARNmi de la invencion es una secuencia que es compartida por todas las variantes de ARNmi identificadas de una mitad del pre- ARNmi o ARN en horquilla. La mitad puede ser la mitad con el extremo 5' del pre-ARNmi o ARN en horquilla o la mitad con el extremo 3' del pre-ARNmi o ARN en horquilla. Una secuencia minima de un ARNmi que contiene un numero impar de nucleotidos es tipicamente una secuencia de al menos 10 nucleotidos que comprende el nucleotido central del ARNm y al menos los 4 nucleotidos junto al nucleotido central bien en el lado 5' o 3' del nucleotido central. Para un ARNmi que contiene un numero par de nucleotidos, una secuencia minima es tipicamente una secuencia de 10 nucleotidos que comprende los dos nucleotidos centrales del ARNmi y al menos los 4 nucleotidos junto a los nucleotidos centrales en el lado 5' o 3' de los dos nucleotidos centrales. En otra forma de realization, una secuencia minima de un ARNmi de la figura 1, comprende al menos la secuencia "semilla" de dicho ARNmi, es decir, los nucleotidos 2-8 de un ARNmi de la figura 1.
[0013] Como los ARNmi diferentes se expresan diferentemente en varios tipos de celulas o tejidos, un metodo de la divulgacion puede utilizarse para caracterizar la fuente de la muestra. Por ejemplo, una sonda especifica para un ARNmi que se expresa en el tejido de corazon pero no en las celulas embrionarias puede utilizarse para clasificar una muestra
5
10
15
20
25
30
35
40
45
50
55
60
65
que bien no contiene ARN del corazon o viceversa, no contiene acido nucleico derivado de celulas embrionarias. Para ARNmi expresado en otros tejidos o celulas similares caracterizaciones son posibles.
[0014] Acido nucleico obtenido a partir de una fuente natural puede ser bien ADN o ARN. En la presente invencion se prefiere que dicho acido nucleico comprenda ARN. El acido nucleico se deriva preferiblemente directamente de una celula. Sin embargo, el acido nucleico puede tambien haber sufrido una o mas etapas de tratamiento tales como, pero no limitado a, modificacion quimica. Un ARNmi o pre-ARNmi de la invencion, o complemento del mismo tambien puede usarse para analizar muestras de ADN, por ejemplo, analizando una secuencia de un (pre-)ARNmi obtenido es posible determinar las especies a las que la celula pertenecia que proporcionaron el acido nucleico para el analisis.
[0015] La caracterizacion de una muestra basandose en la presencia, abundancia relativa, o ausencia de un ARNmi particular y/o ARN en horquilla se puede usar como un indicador para la presencia o ausencia de enfermedad, tal como cancer. Por ejemplo, cuando una muestra de un tejido comprende un modelo de expresion diferente de ARNmi y/o ARN en horquilla cuando se compara con un tejido comparable de un individuo normal, o cuando se compara con un tejido comparable de una parte no sospechosa de dicho tejido del mismo individuo. Una diferencia en presencia de un ARNmi y/o ARN en horquilla proporciona una indicacion en este tipo de analisis. Sin embargo, la exactitud (es decir, valor predictivo) del analisis aumenta tipicamente con un numero creciente de diferentes ARNmi y/o ARN en horquilla que se analizan. Asi un metodo para la caracterizacion de una muestra de la divulgacion preferiblemente comprende determinar si dicha muestra comprende al menos la secuencia minima de 5 ARNmi o ARN en horquilla diferentes de la figura 1 o un homologo de mamifero del mismo. Preferiblemente, al menos la secuencia minima de 10, preferiblemente al menos 20, mas preferiblemente al menos 60 ARNmi y/o ARN en horquilla diferentes de la figura 1 o un homologo mamifero del mismo. Un metodo de la divulgacion puede por supuesto incluir ademas la detection de ARNmi y/o ARN en horquilla de la tecnica. Se prefiere que la presencia o ausencia de al menos una secuencia minima de un ARNmi de la figura 1 se determine en un metodo de la divulgacion. Es tipicamente el ARNmi que ejerce una funcion de reglaje de expresion en una celula. La presencia de pre-ARNmi y/o ARN en horquilla en una muestra es por supuesto indicativo de la presencia de al menos la secuencia minima del ARNmi correspondiente en dicha muestra, aunque esto no siempre tiene que ser cierto. Preferiblemente, un metodo de la divulgacion, comprende ademas determinar si dicha muestra comprende al menos una secuencia minima de al menos cinco ARNmi (ARNmi) de la figura 1, o un homologo de mamifero de la misma donde dichos al menos cinco ARNmi se derivan de al menos cinco ARN en horquilla diferentes y caracterizar dicha muestra basandose en la presencia o ausencia de dicho ARNmi.
[0016] Una muestra puede comprender celulas. Tipicamente, sin embargo, una muestra ha sufrido algun tipo de manipulacion antes de analizar la presencia o ausencia en esta de un ARNmi y/o ARN en horquilla segun la invencion. Tal manipulation, tipicamente, aunque no necesariamente comprende el aislamiento de al menos (parte de) el acido nucleico de las celulas. El acido nucleico en una muestra tambien puede haber sufrido algun tipo de amplification y/o conversion antes del analisis con un metodo de la divulgacion. El ARNmi se puede detectar directamente via sonda complementaria especifica para dicho ARNmi o indirectamente. Formas indirectas incluyen, pero de forma no limitativa, la conversion en ADN o proteina y deteccion especifica posterior del producto de la conversion. La conversion puede tambien implicar varias conversiones. Por ejemplo, el ARN se puede convertir en ADN y posteriormente en ARN que a su vez se puede traducir en proteina. Por supuesto tales conversiones pueden implicar anadir las secuencias de senal apropiadas tales como promotores, sitios de initiation de la traduction y similares. Otros ejemplos no limitativos incluyen amplificacion, con o sin conversion de dicho ARNmi en dicha muestra por ejemplo mediante PCR o NASBA u otro metodo de amplificacion de acido nucleico. Todos estos metodos indirectos tienen en comun que el producto convertido retiene al menos algo de la information de especificidad del ARNmi original y/o ARN en horquilla, por ejemplo en la secuencia de acidos nucleicos o en la secuencia de aminoacidos u otra secuencia. Metodos indirectos pueden ademas comprender que nucleotidos o aminoacidos diferentes a los que se producen en la naturaleza se incorporen en el producto convertido y/o amplificado. Tales productos estan por supuesto tambien dentro del campo de la invencion en tanto que comprenden al menos algo de la informacion de especificidad del ARNmi original y/o ARN en horquilla. Por al menos algo de la informacion de especificidad del ARNmi original y/o ARN en horquilla se refiere a que el producto convertido (o una parte esencial del mismo) es caracteristico para el ARNmi y/o ARN en horquilla del cual la presencia o ausencia debe ser determinada.
[0017] La celula que comprende dicho acido nucleico puede ser cualquier tipo de celula. Como se ha mencionado anteriormente, puede ser una celula embrionaria, una celula fetal u otra celula prenatal, o puede ser una celula de un individuo despues del nacimiento, por ejemplo un joven o un adulto. Tambien puede ser una celula de una parte particular de un cuerpo o tejido de un mamifero. Preferiblemente, dicha celula es una celula aberrante, preferiblemente una celula con un fenotipo de proliferation aberrante tal como una celula de tumor o una celula de cultivo de tejido. Preferiblemente una celula cancerosa, o una celula sospechada de ser una celula cancerosa. En una forma de realizacion preferida dicha celula cancerosa es una celula de glioma. En otra forma de realizacion preferida dicha celula cancerosa es una celula de cancer de pulmon. En otra forma de realizacion preferida dicha celula es una celula de adenoma, preferiblemente una celula de adenoma de pulmon. En otra forma de realization preferida dicha celula es una celula que esta infectada con un patogeno. Preferiblemente dicho patogeno es un virus o una (mico)bacteria. Un metodo de la divulgacion es particularmente adecuado para determinar la fase de dicha celula aberrante. Por ejemplo, celulas tumorigenicas pueden tener grados variables de malignidad. Mientras se progresa a traves de los diferentes grados de malignidad el modelo de expresion de (pre-)ARNmi cambia y puede ser detectado. Tal modelo puede asi estar
5
10
15
20
25
30
35
40
45
50
55
60
65
correlacionado con el grado de malignidad. Un metodo de la divulgacion puede de este modo usarse para determinar una prognosis para el individuo que sufre dicho cancer.
[0018] La celula es preferiblemente una celula de pulmon, una celula de piel, una celula cerebral, una celula hepatica, una celula embrionaria, una celula de corazon, una linea celular embrionaria o un derivado de celula aberrante de las mismas.
[0019] Los cambios en la expresion se detectan mejor cuando una muestra de prueba se compara con una referencia. Asi, en un aspecto la divulgacion proporciona un metodo para determinar si una celula en una muestra es diferente de una celula de referencia, que comprende determinar si la expresion de al menos un ARNmi de la figura 1 o un homologo mamifero del mismo o al menos un ARN en horquilla de la figura 1 o un homologo mamifero del mismo, en dicha celula es diferente cuando se compara con dicha celula de referencia. Preferiblemente se determina si la expresion en al menos 5 ARNmi o ARN en horquilla es diferente en dicha celula de dicha muestra cuando se compara con una celula de referencia. La expresion es diferente cuando hay al menos un factor de dos diferencias en el nivel de expresion. Preferiblemente, la diferencia es una diferencia entre la expresion de ARNmi detectable y no detectable. Preferiblemente dichos al menos 5 ARNmi o pre-ARNmi son de la figura 1. Los niveles de expresion se pueden comparar mediante la comparacion de los niveles de estado estacionario o la comparacion de los indices de sintesis.
[0020] Una celula como se utiliza en este caso es una celula de un mamifero, preferiblemente un raton, una rata, un primate o un humano. Una muestra se caracteriza por ejemplo por la presencia o ausencia de una enfermedad, la pertenencia o no a ciertas especies, o por estar en una fase especifica de desarrollo. En muchos casos sin embargo, una muestra se caracteriza mejor determinando la presencia, abundancia relativa o ausencia en la misma de una coleccion de ARNmi y/o ARN en horquilla de la invencion, como una muestra de un organismo muestra normalmente una variacion natural y/o patologica en parametros diversos.
[0021] Otra razon por la cual una muestra es preferiblemente caracterizada basandose en una coleccion de ARNmi y/o ARN en horquilla, es que un trastorno se manifiesta en maneras variables en individuos diferentes. Estas dos causas de variabilidad se pueden calcular sin embargo proporcionando informacion de deteccion de una coleccion de ARNmi y/o ARN en horquilla. Por ejemplo, unos perfiles de expresion caracteristicos de una enfermedad estan compuestos por una coleccion de ARNmi y/o ARN en horquilla. Comparando un perfil de expresion de dicha coleccion en una muestra con un perfil de expresion de referencia de dicha coleccion que es caracteristica de dicha enfermedad, un individuo del que se toma esta muestra es asi evaluado para presencia o ausencia de dicha enfermedad. El proceso para determinar si una muestra coincide con un perfil de expresion de una enfermedad o una especie depende de multiples factores. Un ARNmi en si tiene mas o menos potencia distintiva dentro de, por ejemplo, un trastorno o una especie. Ademas un ARNmi como parte de una coleccion representa un porcentaje de una coleccion total. Caracterizar una muestra asi preferiblemente comprende, ademas de determinar la ausencia o presencia de un ARNmi, determinar la ausencia o presencia de mas ARNmi. La ausencia o presencia de un ARNmi es por ejemplo un indicador positivo o negativo de una enfermedad o una especie. Una coleccion o un perfil de expresion preferiblemente comprende uno o mas indicadores positivos y/o negativos. Dichos indicadores positivos y/o negativos son por ejemplo expresados como un porcentaje de un numero total de ARNmi o como un numero absoluto de ARNmi. Cuando se expresan indicadores en porcentajes, un peso es opcionalmente atribuido a un indicador. A un indicador con una potencia distintiva mas alta se le da aqui preferiblemente un peso mas alto que a un indicador con una potencia distintiva baja.
[0022] En una forma de realizacion, la divulgacion proporciona un metodo segun la divulgacion, que comprende determinar si dicha muestra comprende al menos una secuencia minima de al menos dos, preferiblemente al menos tres, mas preferiblemente al menos cuatro, de la forma mas preferible al menos cinco ARNmi de la figura 1 o un homologo mamifero del mismo donde dichos ARNmi son preferiblemente derivados de distintos ARNmi precursores (pre-miRNA) y caracterizar dicha muestra basandose en la presencia o ausencia de dicho ARNmi. La presencia en un ARN en horquilla diferente como se representa en la figura 1, o en homologos de mamifero diferentes del mismo es indicativo de la presencia en ARNmi precursor diferente. En una forma de realizacion preferida dicha caracterizacion de dicha muestra es una prueba para una enfermedad. En muchos casos, una prueba que comprende mas ARNmi tiene un valor de diagnostico mas alto, sin embargo, este puede no ser siempre el caso. En otra forma de realizacion preferida de la divulgacion uno o mas ARNmi segun la invencion se determinan en una muestra, en combinacion con uno o mas otros ARNmi. En otra forma de realizacion preferida al menos un ARNmi segun la divulgacion se determina en una muestra en combinacion con uno o mas otros ARNmi, dando como resultado la determinacion de un total de al menos 10, preferiblemente al menos 15, mas preferiblemente al menos 20 o de la forma mas preferible al menos 25 ARNmi. En una forma de realizacion preferida, dicho otros ARNmi determinados en una muestra estan implicados en el mismo tipo de trastorno que dicho ARNmi segun la invencion que es determinado en dicha muestra. Alternativamente, una prueba esta compuesta por ARNmi con valores indicativos de dos o mas enfermedades o dos o mas especies.
[0023] Dicha muestra preferiblemente comprende acido nucleico de una celula diferenciada. Diferenciado, como se utiliza en este caso, es bien diferenciado celularmente o diferenciado evolutivamente. Preferiblemente diferenciado es diferenciado celular. Una celula diferenciada se deriva de cualquier parte de un organismo. Dicha celula se deriva preferiblemente de una parte de un organismo que esta asociado con una enfermedad. Por ejemplo, cuando se caracteriza una muestra para cancer, dicha celula se deriva preferiblemente de un tumor. En otra forma de realizacion preferida dicha muestra comprende acido nucleico de una celula embrionaria. Una celula embrionaria se puede derivar
5
10
15
20
25
30
35
40
45
50
55
60
65
de cualquier organismo pero se deriva preferiblemente de un mamifero. Una muestra que comprende acido nucleico derivado de una celula embrionaria, se toma por ejemplo para diagnostico temprano de una enfermedad en un organismo. Una celula embrionaria es, en una forma de realizacion, una celula madre embrionaria. En otra forma de realizacion preferida dicha muestra comprende acido nucleico de una celula con un fenotipo de proliferacion aberrante. Un fenotipo de proliferacion aberrante indica que un proceso de proliferacion ha sido perturbado de alguna manera. El trastorno bien es provocado por factores internos o por factores externos o por una combinacion de los mismos. Un fenotipo de proliferacion aberrante se encuentra por ejemplo en la hepatitis, una enfermedad intestinal o un cancer. Preferiblemente una celula con un fenotipo de proliferacion aberrante es una celula tumoral y/o celula de linea celular. Una celula tumoral es por ejemplo una celula leucemica, tal como un linfocito B leucemico. Dicha celula de linea celular de tumor se obtiene por ejemplo de una linea celular que se cultiva a partir de una celula derivada de un tumor de un organismo, preferiblemente un mamifero. Alternativamente, dicha celula de linea celular de tumor se obtiene a partir de una linea celular que se cultiva de una celula donde las caracteristicas del tumor han sido inducidas artificialmente, por ejemplo con una sustancia quimica. En una forma de realizacion preferida la divulgacion proporciona un metodo para caracterizar una muestra que comprende acido nucleico derivado de una celula segun la divulgacion, donde dicha celula es una celula de pulmon, una celula de piel, una celula cerebral, una celula hepatica, una celula embrionaria, una celula cardiaca, o una linea celular embrionaria.
[0024] En una forma de realizacion, la divulgacion proporciona un metodo para determinar si una celula de una muestra se modifica cuando se compara con una celula de referencia, que comprende determinar si la expresion de al menos un ARNmi de la figura 1 o un homologo mamifero del mismo y/o un ARN en horquilla de la figura 1 o un homologo mamifero del mismo en dicha celula se altera cuando se compara con dicha celula de referencia. Una celula de referencia como se utiliza en este caso es por ejemplo un homologo sano o patologico de respectivamente una celula patologica o sana. Una celula de referencia es por ejemplo otra celula del mismo tipo celular del mismo organismo del que dicha muestra es tomada pero preferiblemente de otro organismo. El otro organismo es preferiblemente comparable en especie y/o constitucion y/o desarrollo y/o edad. En una forma de realizacion preferida dicha celula es una celula diferenciada. En otra forma de realizacion preferida es una celula embrionaria. En otra forma de realizacion dicha celula es una celula con un fenotipo de proliferacion aberrante. Preferiblemente dicha celula con un fenotipo de proliferacion aberrante es una celula tumoral y/o celula de linea celular. En una forma de realizacion la divulgacion proporciona un metodo para determinar si una celula de una muestra se modifica cuando se compara con una celula de referencia segun la divulgacion, donde dicha celula es una celula de pulmon, una celula de piel, una celula cerebral, una celulas hepatica, una celula embrionaria, una celula cardiaca o una linea celular embrionaria.
[0025] Un homologo mamifero de un ARN en horquilla tal y como se representa en la figura 1 es una secuencia que comprende al menos 70% de identidad de secuencia con un ARN en horquilla de la figura 1 que se puede plegar en una estructura (horquilla) de tallo-bucle similar al ARN en horquilla correspondiente de la figura 1 (graficamente representados en la figura 3). Un homologo mamifero de un ARNmi como se representa en la figura 1 es una secuencia que muestra 90% de identidad de secuencia con al menos 20, preferiblemente consecutivos, nucleotidos del ARNmi correspondiente de la figura 1 (graficamente representados en la figura 3). Preferiblemente, dicho homologo mamifero de un ARNmi de la figura 1 esta presente en un homologo mamifero del ARN en horquilla correspondiente. Preferiblemente, dicho homologo de ARNmi esta presente en una parte de dicho homologo de horquilla que puede formar una estructura de tallo.
[0026] La presencia, abundancia relativa o ausencia de un ARNmi de la figura 1 o un homologo mamifero del mismo y/o un ARN en horquilla de la figura 1 o un homologo mamifero del mismo en una muestra, se puede determinar usando un metodo de deteccion. Tipicamente se usa un metodo para la detection especifica de acido nucleico. Actualmente hay muchos metodos para la deteccion especifica de acidos nucleicos. Tipicamente, aunque no necesariamente, estos usan una sonda que especificamente reconoce al menos parte del acido nucleico que debe evaluarse. Tal sonda es frecuentemente acido nucleico, pero puede tambien ser un derivado analogo. Por ejemplo, varios analogos de nucleotidos estan disponibles actualmente que imitan al menos algunas de las caracteristicas de apareamiento de bases de los nucleotidos "estandar" A, C, G, T y U. Alternativamente, analogos de nucleotidos tales como la inosina se pueden incorporar a tales sondas. Otros tipos para analogos incluyen LNA, PNA, morfolino y similar. Otros metodos para la deteccion especifica de acido nucleico incluyen pero de forma no limitativa metodos de amplification de acido nucleico especificos tales como reaction en cadena de polimerasa (PCR) y NASBA. Tales metodos de amplificacion tipicamente usan uno o mas cebadores especificos. Un cebador o sonda preferiblemente comprende al menos 12 nucleotidos que tienen al menos 90% de identidad de secuencia con una secuencia como se representa en la figura 1, o su complemento.
[0027] La presente invention proporciona una molecula de acido nucleico aislado que comprende:
a) una secuencia de nucleotidos como se muestra en la figura 1, y/o
b) una secuencia de nucleotidos que es un complemento de a), y/o
c) una secuencia de nucleotidos que tiene una identidad de al menos 80% con una secuencia de a) o b) y/o
d) una secuencia de nucleotidos que hibridiza bajo condiciones de astringencia a una secuencia de a), b) o c).
[0028] Un complemento de una secuencia de acidos nucleicos como se utiliza en este caso es una secuencia donde la mayoria, pero no necesariamente todas las bases son sustituidas por su base complementaria: adenina (A) por timidina
5
10
15
20
25
30
35
40
45
50
55
60
65
(T) o uracilo (U), citosina (C) por guanina (G), y viceversa. La identidad de secuencia en porcentaje es preferiblemente determinada por la division del numero de nucleotidos identicos entre una secuencia dada y una comparativa por la longitud de la secuencia comparativa. En una forma de realizacion preferida la invencion proporciona una molecula de acido nucleico segun la invencion, donde la identidad de secuencia c) con una secuencia de a) o b) es al menos 90%. En una forma de realizacion mas preferida dicha identidad de secuencia c) con una secuencia de a) o b) es al menos 95%. Preferiblemente, dicha identidad de secuencia con un ARNmi de la figura 1 o su complemento es 90% en una extension de preferiblemente 20 nucleotidos de dicho ARNmi. Los nucleotidos A, C, G y U como se usan en la invencion, son bien ribonucleotidos, desoxirribonucleotidos y/o otros analogos de nucleotidos, tales como analogos de nucleotidos sinteticos. Un analogo de nucleotidos como se usa en la invencion es, por ejemplo, un acido nucleico de peptido (PNA), un acido nucleico bloqueado (LNA), o alternativamente un ribonucleotido o desoxirribonucleotido modificado a lo largo de la estructura o con azucar. Ademas los nucleotidos son sustituidos opcionalmente por los nucleotidos correspondientes que son capaces de formar enlaces de H analogos de una secuencia de acidos nucleicos complementaria. Un ejemplo de tal sustitucion es la sustitucion de U por T. Condiciones rigurosas bajo las que una secuencia de nucleotidos hibridiza a una secuencia segun la invencion son condiciones altamente controladas. Las condiciones de hibridacion en laboratorio rigurosas son conocidas por un experto en la tecnica.
[0029] En una forma de realizacion preferida la invencion proporciona una molecula de acido nucleico segun la invencion, que es una molecula de ARNmi o un derivado analogo. Otra forma de realizacion preferida de la invencion proporciona una molecula de ARN en horquilla y una molecula de ADN que codifica una molecula de ARNmi o en horquilla. En otra forma de realizacion, la invencion proporciona un homologo de ARNmi de la figura 1 o un homologo mamifero de un ARNmi de la figura 1. Un homologo como se utiliza en este caso es una secuencia, preferiblemente un gen o un producto de este gen que se ha desarrollado a partir de un ancestro comun en dos o mas especies.
[0030] Un acido nucleico aislado segun la invencion tiene preferiblemente una longitud de 18 a 100 nucleotidos, mas preferiblemente de 18 a 80 nucleotidos. El ARNmi maduro normalmente tiene una longitud de 18 a 26 nucleotidos, principalmente aproximadamente 22 nucleotidos. En una forma de realizacion preferida, la invencion asi proporciona una molecula de acido nucleico segun la invencion que tiene una longitud de 18 a 26 nucleotidos, preferiblemente de 19-24 nucleotidos, de la forma mas preferible 20, 21, 22 o 23 nucleotidos. Los ARNmi son tambien proporcionados por la invencion como moleculas precursoras. La invencion proporciona ademas una molecula de acido nucleico segun la invencion que es un pre-ARNmi, un ARN en horquilla como se representa en la figura 1 o una molecula de ADN que codifica el mismo. Las moleculas precursoras o de horquilla normalmente tienen una longitud de 50-90 nucleotidos. La invencion proporciona una molecula de acido nucleico segun la invencion, que tiene una longitud de 50-90 nucleotidos de un ARN en horquilla de la figura 1. En una forma de realizacion preferida, la invencion proporciona asi una molecula de acido nucleico segun la invencion, que es una molecula de pre-ARNmi o de ADN que codifica el mismo, que tiene una longitud de 60-110 nucleotidos. La invencion ademas proporciona una molecula de acido nucleico segun la invencion que tiene una longitud de mas de 110 nucleotidos, como un ARNmi precursor se produce por ejemplo tratando un transcrito primario. En una forma de realizacion preferida la invencion proporciona una molecula de acido nucleico segun la invencion, donde dicho pre-ARNmi es un pre-ARNmi de la figura 1 o un homologo mamifero u ortologo del mismo.
[0031] Como se ha mencionado anteriormente, el ARNmi monocatenario se incorpora en un RISC. Una molecula precursora de ARNmi es frecuentemente parcialmente bicatenaria. Normalmente una molecula precursora de ARNmi es al menos parcialmente autocomplementaria y forma partes bicatenarias tal y como estructuras de tallo-bucle. La invencion en una forma de realizacion proporciona una molecula de acido nucleico segun la invencion, que es monocatenaria. En otra forma de realizacion, la invencion proporciona una molecula de acido nucleico segun la invencion, que es al menos parcialmente bicatenaria. En una forma de realizacion de la invencion, una molecula de acido nucleico segun la invencion es seleccionada de moleculas analogas de acido nucleico, ARN, ADN o una combinacion de las mismas. En otra forma de realizacion de la invencion la molecula de acido nucleico anteriormente mencionada es una molecula que contiene al menos un analogo de nucleotido modificado. En otra forma de realizacion, la invencion proporciona el uso de dicha molecula de acido nucleico segun la invencion en una aplicacion terapeutica y/o de diagnostico.
[0032] Una molecula de acido nucleico segun la invencion es en una forma de realizacion parte de una coleccion de moleculas de acido nucleico. Tal coleccion se usa preferiblemente, pero no exclusivamente, en una prueba. Una coleccion de moleculas de acido nucleico se usa por ejemplo en una prueba como se ha descrito anteriormente, por ejemplo para determinar la ausencia o la presencia de una enfermedad en un individuo evaluando una muestra tomada de este individuo. Una coleccion de moleculas de acido nucleico normalmente tiene un valor predictivo mas alto en cualquier preparacion experimental cuando el numero de moleculas de acido nucleico proporcionado aqui es mayor. Asi, en una forma de realizacion, la invencion proporciona una coleccion de moleculas de acido nucleico, que comprende al menos 5, preferiblemente al menos 10, mas preferiblemente al menos 20 moleculas de acido nucleico que comprenden una secuencia de nucleotidos como se muestra en la figura 1. Una coleccion de moleculas de acido nucleico segun la invencion, se usa en una forma de realizacion para el diagnostico de enfermedades tales como cancer, cardiopatia, infecciones viricas o susceptibilidad de enfermedad. Ademas se proporciona una coleccion de moleculas de acido nucleico, que comprende al menos 5, preferiblemente al menos 10, mas preferiblemente al menos 20 moleculas de acido nucleico que son complementarias para ARNmi mostrados en la figura 1, o que tienen secuencias de nucleotidos que hibridan bajo condiciones rigurosas en ARNmi mostrados en la figura 1. Una coleccion
5
10
15
20
25
30
35
40
45
50
55
60
65
de moleculas de acido nucleico se usan preferiblemente en el diagnostico de cancer, cardiopatia, infecciones viricas y otras enfermedades.
[0033] Una molecula de acido nucleico segun la invention se puede obtener por cualquier metodo. Ejemplos no limitativos son los metodos de smtesis quimica o metodos recombinantes. Una molecula de acido nucleico segun la invencion es en una forma de realization modificada. Dicha modification es por ejemplo una sustitucion de nucleotido. Dicha modificacion se realiza por ejemplo para modificar una especificidad de objetivo para un objetivo en una celula, por ejemplo una especificidad para un oncogen. Dicha molecula de acido nucleico modificada preferiblemente tiene una identidad de al menos 80% con el ARNmi original, mas preferiblemente de al menos 85%, lo mas preferido de al menos 90%. En otra forma de realizacion una molecula de acido nucleico segun la invencion se modifica para formar una molecula de ARNsi. Por ejemplo, una molecula de ARNmi se procesa en una forma simetrica y se genera posteriormente como un ARNsi bicatenario. En una forma de realizacion preferida la invencion proporciona una molecula de acido nucleico segun la invencion, que se selecciona de moleculas de ARN, ADN o de analogo de acido nucleico que preferiblemente comprende ademas al menos un analogo de nucleotido. En una forma de realizacion una molecula de acido nucleico de la invencion esta presente en un vector de expresion recombinante. Un vector de expresion recombinante segun la invencion por ejemplo comprende un acido nucleico recombinante operativamente enlazado a una secuencia de control de expresion. Dicho vector es cualquier vector capaz de establecer expresion de acido nucleico en un organismo, preferiblemente un mamifero. Dicho vector es preferiblemente un vector virico o un plasmido. En una forma de realizacion preferida la introduction de dicho vector en un organismo establece la transcripcion de dicho acido nucleico. En una forma de realizacion preferida, despues de dicha transcripcion, el transcrito se procesa para dar como resultado una molecula de pre-ARNmi y/o una molecula en horquilla y posteriormente una molecula de ARNmi.
[0034] Acidos nucleicos segun la invencion estan en una forma de realizacion proporcionada como una sonda. Muchos tipos diferentes de sondas se conocen actualmente en la tecnica. Las sondas son frecuentemente acidos nucleicos, sin embargo, alternativas que tienen la misma especificidad de enlace en especie, no necesariamente en cantidad estan disponibles para el experto en la tecnica, tales alternativas incluyen pero de forma no limitativa analogos de nucleotidos. En una forma de realizacion la invencion proporciona un conjunto de sondas que comprenden al menos una molecula de acido nucleico segun la invencion. En una forma de realizacion preferida la invencion proporciona un conjunto de sondas segun la invencion, donde dicha molecula de acido nucleico es una molecula de ARNmi de la figura 1 o una parte funcional, derivado y/o analogo de la misma. En otra forma de realizacion preferida la invencion proporciona un conjunto de sondas segun la invencion, donde dicha molecula de acido nucleico es un complemento de una molecula de ARNmi o una parte funcional, derivado y/o analogo de la misma. En otra forma de realizacion preferida la invencion proporciona un conjunto de sondas que comprende una coleccion de moleculas de acido nucleico segun la invencion. Una coleccion en esta forma de realizacion es preferiblemente una coleccion de moleculas de acido nucleico, que comprende al menos 5, preferiblemente al menos 10, mas preferiblemente al menos 20 moleculas de acido nucleico que comprende una secuencia de nucleotidos como se muestra en la figura 1 o un homologo mamifero de la misma, o es una coleccion de moleculas de acido nucleico, que comprende al menos 5, preferiblemente al menos 10, mas preferiblemente al menos 20 moleculas de acido nucleico con una secuencia de nucleotidos que es un complemento de una secuencia de nucleotidos como se muestra en la figura 1, o con una secuencia de nucleotidos que hibridiza bajo condiciones rigurosas a una secuencia de nucleotidos como se muestra en la figura 1, o es una combination de las mismas.
[0035] Ademas se proporciona una matriz que comprende uno o mas acidos nucleicos de la invencion. Una matriz se utiliza para analizar una o mas muestras al mismo tiempo. Preferiblemente dicha matriz comprende al menos dos sondas, donde al menos una sonda comprende una molecula de acido nucleico segun la invencion. En una forma de realizacion preferida, dicha matriz comprende un conjunto de sondas que comprende una coleccion de moleculas de acido nucleico segun la invencion, o una combinacion de colecciones de moleculas de acido nucleico segun la invencion. En una forma de realizacion una matriz de la invencion es una micromatriz. Dicha micromatriz preferiblemente comprende oligonucleotidos. Un conjunto de sondas o una matriz o micromatriz segun la invencion se usa en una forma de realizacion preferida en una prueba diagnostica.
[0036] Una prueba diagnostica como se usa en la invencion, es una prueba donde una molecula de acido nucleico segun la invencion se utiliza para someter una muestra de un organismo a un procedimiento de diagnostico. Dicho organismo es preferiblemente un mamifero, mas preferiblemente un ser humano. Una muestra como se usa en la invencion es preferiblemente una muestra biologica. Una muestra biologica es por ejemplo un fluido corporal. Una muestra biologica preferida es una muestra de tejido. Una muestra de tejido se usa, por ejemplo, para determinar una fase de diferenciacion o desarrollo de una celula. Alternativamente un tipo de celula o tipo de tejido se clasifica como correspondiente con un trastorno. Dicho trastorno se caracteriza, por ejemplo, por un nivel de expresion tipico de una molecula de ARNmi o un modelo de expresion tipico de moleculas de ARNmi. La invencion proporciona una molecula de acido nucleico segun la invencion para aplicaciones de diagnostico al igual que para usos terapeuticos. Un diagnostico de aplicacion terapeutica segun la invencion se refiere a un trastorno, por ejemplo una infection virica o cancer. Recientemente los ARNmi se han descrito por ser un factor causal importante en el cancer (Lu et al., 2005; He et al., 2005; O'Donnell et al., 2005; Alvarez-Garcia and Miska, 2005) o un indicador potente para la prognosis y la progresion del cancer (Calin et al., 2005). Un cancer es por ejemplo leucemia.
5
10
15
20
25
30
35
40
45
50
55
60
65
[0037] En una forma de realization la invention proporciona una composition farmaceutica, que comprende como un agente activo al menos una molecula de acido nucleico segun la invencion, y opcionalmente un portador farmaceuticamente aceptable. Una composicion farmaceutica segun la invencion opcionalmente comprende ademas otro aditivo. Tal otro aditivo puede por ejemplo ser un conservante o un colorante. Alternativamente un aditivo es un compuesto activo conocido farmaceuticamente. Un portador es cualquier portador farmaceutico adecuado. Un portador preferido es un compuesto que es capaz de aumentar la eficacia de una molecula de acido nucleico para entrar en una celula objetivo. Ejemplos de tales compuestos son liposomas, liposomas cationicos particularmente. Una composicion es por ejemplo un comprimido, una pomada o una crema. Preferiblemente una composicion es una solution inyectable o una suspension inyectable. En una forma de realizacion la invencion proporciona una composicion farmaceutica segun la invencion para aplicaciones de diagnostico. En otra forma de realizacion la invencion proporciona una composicion farmaceutica segun la invencion para usos terapeuticos. En una forma de realizacion preferida la invencion proporciona una composicion farmaceutica segun la invencion, como un modulador para un trastorno de desarrollo o patogenico. En una forma de realizacion preferida dicho trastorno de desarrollo o patogenico es cancer. Una molecula de ARNmi por ejemplo funciona como un gen supresor o como un regulador de la traduction de un gen.
[0038] Una molecula de acido nucleico segun la invencion se administra por cualquier metodo conocido adecuado. El modo de administration de una composicion farmaceutica por supuesto depende de su forma. En una forma de realizacion preferida una solucion se inyecta en un tejido. Una molecula de acido nucleico segun la invencion se introduce en una celula objetivo por cualquier metodo conocido in vivo o in vitro. Dicha introduction se establece por ejemplo por una tecnica de transferencia genica conocida por el experto en la tecnica, tal como metodos de electroporation, micro inyeccion, DEAE-dextrano, fosfato calcico, liposomas cationicos o viricos.
[0039] Una molecula de acido nucleico segun la invencion se usa en una forma de realizacion como un marcador de un gen. Un marcador identifica un gen, por ejemplo un gen implicado en el cancer u otro trastorno de desarrollo. Un marcador es, por ejemplo, un ARNmi que se expresa tipicamente de forma diferencial en un trastorno o es un conjunto de dos o mas ARNmi que muestran un modelo de expresion tipico en un trastorno. Una molecula de acido nucleico es alternativamente por ejemplo marcada con una etiqueta fluorescente o radiactiva. Una molecula de acido nucleico segun la invencion es, en otra forma de realizacion, un objetivo para una aplicacion de diagnostico o terapeutica. Por ejemplo, una molecula de ARNmi segun la invencion se inhibe o activa y el efecto de la inhibition o la activation se determina midiendo la diferenciacion de un tipo de celula. En otra forma de realizacion, un acido nucleico segun la invencion no es un objetivo en si mismo, pero se usa alternativamente para dirigir un objetivo en una celula. Un objetivo en una celula es preferiblemente un gen. Preferiblemente dicho gen es al menos parcialmente complementario de dicha molecula de acido nucleico. Por ejemplo, un ARNmi segun la invencion se utiliza para encontrar un gen en una celula que tiene una secuencia que es al menos parcialmente complementaria de la secuencia de dicho ARNmi. En una forma de realizacion preferida la invencion proporciona una composicion farmaceutica como un marcador o modulador de expresion de un gen. En otra forma de realizacion preferida la invencion proporciona una composicion farmaceutica segun la invencion, donde dicho gen es al menos parcialmente complementario de dicha molecula de acido nucleico. Un modulador de expresion de un gen es por ejemplo un ARNmi. Un ARNmi que funciona como un supresor de tumor es por ejemplo proporcionado y expresado en y/o entregado a una celula tumoral suprimiendo asi el desarrollo de un tumor. En una forma de realizacion preferida, la invencion proporciona un uso de una molecula de acido nucleico segun la invencion, para regular negativamente la expresion de un gen. Regular negativamente la expresion de un gen es por ejemplo importante en el cancer. En una forma de realizacion alternativa, un ARNmi se introduce y/o expresa en una celula de un tejido que no expresa dicho ARNmi. Como resultado, dicha celula de dicho tejido por ejemplo muestra un tipo de diferenciacion diferente. Tal procedimiento se usa por ejemplo como un procedimiento de reprogramacion de tejido.
[0040] Actualmente, hay esencialmente dos metodos para identification de genes de ARNmi nuevos: donation de ARN fraccionados por tamano (18-25 nt) y la prediction computacional basada en caracteristicas estructurales diferentes de ARNmi seguido de verification experimental. Los ARN fraccionados por tamano es un procedimiento laborioso y ha dado como resultado cantidades restringidas de ARNmi identificados. Metodos establecidos para la validation de genes de ARNmi predichos dependen de la construction de bibliotecas de ADNc fraccionado por tamano. Esto es un procedimiento tecnicamente dificil que no escala bien. Ademas requiere probar muchos tejidos y puntos de tiempo de desarrollo. Por lo tanto, los metodos establecidos de validacion experimental de ARNmi predichos no escalan para el analisis de miles de regiones candidatas. La invencion sorprendentemente encontro un metodo de alto rendimiento para evaluar las regiones de ARNmi candidatas. La invencion proporciona un ensayo RAKE modificado para estudios de expresion de alto rendimiento de regiones de ARNmi candidatas. El ensayo proporcionado permite el mapeo exacto de extremos 3' de ARNmi maduros, proporcionando asi information tanto de estructura como de perfiles de expresion de genes de ARNmi nuevos. Diferentes tecnologias de micromatriz, incluyendo ensayo RAKE, han sido aplicadas para el perfil de expresion de ARNmi conocidos. Sin embargo, las micromatrices no se usaron previamente para detection de ARNmi predichos computacionalmente nuevos. El metodo unico de la combination de un metodo computacional con un ensayo RAKE modificado, proporcionado por la invencion, ha llevado al descubrimiento de numerosos ARNmi nuevos. Ademas el metodo proporcionado ofrece una oportunidad para descubrir otros ARNmi.
[0041] La comparacion de secuencias entre especies es un metodo potente para identificar elementos genomicos funcionales, pero su sensibilidad disminuye con el aumento de la distancia filogenetica, especialmente para secuencias cortas. Ademas, los elementos especificos del taxon pueden pasarse por alto. Para superar las limitaciones de los metodos de obtencion de la impronta filogenetica tradicionales, la invencion aplico el metodo de sombreado filogenetico
5
10
15
20
25
30
35
40
45
50
55
60
65
(Boffelli et al., 2003), que permite alineamientos de secuencias sin ambiguedad y determinacion de conservacion precisa a nivel de resolucion de nucleotidos unico. Este metodo se basa en el alineamiento de especies cercanamente relacionadas filogeneticamente; ya que estas muestran solo pocas diferencias de secuencia, muchos genomas diferentes (pero relacionados) necesitan ser alineados para identificar posiciones (conservadas) invariantes. En la invention, regiones de 700 pb rodeando 122 ARNmi en 10 especies de primates diferentes fueron secuenciadas, incluyendo orangutan, gorila, 2 especies de chimpances y 2 de macaco, tamarino, mono arana, mono lanoso y lemur. Ademas de la region que abarca el pre-ARNmi, ninguna region conservada adicional comun para ARNmi diferentes se pudo encontrar, lo que sugiere que, a diferencia de C. elegans (Ohler et al., 2004), no se pueden reconocer inmediatamente elementos que actuan en cis comunes en ARNmi de mamiferos. En la invencion se descubrio sorprendentemente que existe una caida prominente de las regiones conservacion inmediatamente flanqueantes de pre- ARNmi. Este modelo de conservacion caracteristico puede tambien ser reconocido en los alineamientos en pares entre especies mas divergidas como el humano y el raton y se uso para identificar genes de ARNmi nuevos mediante la selection de alineamientos de secuencia de genoma completo de raton-humano y rata-humano para este perfil de conservacion tipico. La filtration restrictiva adicional para la capacidad de regiones candidatas para plegar en una horquilla estable favorable termodinamicamente, segun se calculo mediante el programa Randfold (Bonnet et al., 2004), dio como resultado la identification de 976 ARNmi candidatos, que contenian 83% de todos los ARNmi humanos conocidos (158 de 189, basado en el registro de ARNmi v.3.1).
[0042] La seleccion de homologos en genomas de vertebrados adicionales (pez cebra, pollo, zarigueya, vaca y perro) revelo que 678 candidatos se conservan en al menos otra especie ademas de los roedores. Una parte sustancial de las predicciones consiste en ARNmi unicos para los mamiferos. Tanto la distribution genomica como la extension de datos de apoyo para la expresion son comparables para el subconjunto especifico de mamifero y el conjunto de candidatos que tambien se conservan en al menos una especie no mamifera. Aunque el grado de cobertura del genoma varia para las especies usadas en las comparaciones, estos datos sugieren que hay un numero significativo de ARNmi especificos de linaje e indica que existen ARNmi que evolucionan tanto rapida como lentamente (siendo 7 un ejemplo tipico de un evolucionador lento).
[0043] Catorce candidatos nuevos comparten homologia con ARNmi conocidos y 60 adicionales comparten homologia con al menos otro candidato, creando nuevas subfamilias. Ademas del comportamiento de agrupamiento establecido de los ARNmi (Bartel 2004, Rodriguez et al., 2004), la proportion entre el numero de genes de ARNmi en regiones inter- e intragenicas es similar tanto para ARNmi conocidos como nuevos. Aunque una proporcion justa de candidatos se predice en la cadena opuesta a los transcritos anotados, la presencia desproporcionada de genes de ARNmi en los intrones es intrigante y pueden reflejar mecanismos de expresion por co-transcripcion con el gen huesped y procesamiento de intrones empalmados. 171 de los ARNmi nuevos predichos residen en regiones genomicas que se anotan como exones. En metodos experimentales, tales candidatos son frecuentemente descartados como artefactos de donation potenciales, pero estas regiones se pueden procesar en ARNmi maduros. El trabajo de Cullen y sus colaboradores (Cai et al., 2004) demostro que un transcrito que alberga simultaneamente un ARNmi y un ORF se usa eficazmente para la production de tanto ARNmi como proteina. Aproximadamente 25% (44) de los candidatos exonicos reside en partes no codificantes y aunque 127 candidatos se solapan con secuencias codificantes de proteina anotadas, 75 son predichos en la cadena opuesta.
[0044] El soporte para la expresion de ARNmi candidatos se proporciona mediante varias fuentes. Tres candidatos estan presentes en la base de datos FANTOM2 de secuencias expresadas y 11 candidatos residen en las agrupaciones genicas que contienen uno o mas ARNmi conocidos. Estos ARNmi pueden ser coexpresados a partir del mismo transcrito primario (Bartel, 2004, Rodriguez et al., 2004). Se esta llevando a cabo un analisis sistematico del transcriptoma humano utilizando micromatrices de oligonucleotidos de alta densidad (Kapranov et al., 2002) y en la invencion se ha observado que las regiones genomicas que codifican 64 ARNmi conocidos y 214 nuevos han sido cubiertas. De este conjunto, 13 ARNmi conocidos (20%) y 72 nuevos (34%) se expresan en la linea celular SK-N-AS, para la que los datos estan disponibles publicamente. Aunque se uso poli (A)+ ARN para estos experimentos y las propiedades de los transcritos que contienen ARNmi siguen teniendo que ser dilucidadas en gran medida, se detectaron tanto ARNmi intergenicos como intronicos. Varias lineas de investigation sostienen el hallazgo de que al menos algunos ARNmi son procesados a partir de ARN poli-adenilado (Cai et al., 2004, Lee et al., 2004).
[0045] Para proporcionar soporte experimental para los ARNmi predichos, en la invencion se llevaron a cabo experimentos de transferencia de Northern para 69 candidatos, confirmando la expresion de 16 ARNmi maduros (23%). Aunque estos indices de verification son inferiores a los indices publicados previamente usando metodos de clonacion y basados en PCR (38 de los 93; Lim et al., 2003), pueden ser una sub-representation como resultado de una tendencia en el conjunto de ARNmi ya conocidos para ARNmi expresados altamente y asi mas facilmente detectables, la sensibilidad del metodo de detection, y las limitaciones espacio-temporales de las muestras de ARN usadas. Por lo tanto, desarrollamos otra estrategia mas sensible potencialmente para validation de ARNmi candidato basada en el ensayo RAKE (extension de Klenow basada en matriz cebada con ARN, Nelson et al., 2004).
[0046] Este ensayo se basa en la capacidad de una molecula de ARN para funcionar como un cebador para la extension de polimerasa de Klenow cuando se empareja completamente con una molecula de ADN monocatenaria. Como el extremo 3' exacto del ARNmi deberia ser conocido para la extension exitosa y las predicciones computacionales no son optimas para predecir el inicio y el fin correcto del ARNmi maduro, disenamos solapamiento de
5
10
15
20
25
30
35
40
45
50
55
60
65
sondas complementarias de ambos precursores de ARNmi conocido y predicho. Tal ensayo RAKE de solapamiento es menos propenso a falsos positivos que los ensayos de hibridacion estandar, dado que depende de la presencia de un extremo 3' del ARNmi que coincida totalmente y por lo tanto distingue entre miembros de familia del ARNmi que difieren en sus secuencias 3'. Las sondas de solapamiento flanqueantes funcionan como controles negativos. Aunque se han propuesto algunas reglas para determinar que cadena del tallo se carga preferentemente como ARNmi maduro en el complejo RISC (Khvorova et al., 2003; Schwarz et al., 2003), tales predicciones computacionales pueden hacerse solo cuando los extremos precisos del duplex de ARNmi procesado son conocidos. Ademas, debido a la naturaleza de la secuencia en horquilla a menudo es dificil predecir que cadena del ADN genomico codifica un precursor. Para adoptar un enfoque totalmente imparcial, disenamos solapamientos de 11 sondas que cubren cada brazo de la estructura tallo- bucle, tanto para la secuencia genomica sentido como la antisentido, dando como resultado conjuntos de 44 sondas por gen de ARNmi candidato. Debido al apareamiento G-U permitido en el plegado de ARN y a la composicion de nucleotidos diferentes de la cadena de ADN complementaria, los transcritos antisentido no se pliegan necesariamente en las estructuras de tallo-bucle estables y para este tipo de candidatos solo 22 sondas se incluyeron. La posicion central en el solapamiento se determino mediante la prediccion de los sitios de procesamiento mas probables Dicer/Drosha de la informacion de la horquilla de estructura secundaria. Disenamos una micromatriz de validacion personalizada con 44.000 caracteristicas, cubriendo 271 ARNmi de raton conocidos y 676 de los ARNmi predichos que son conservados entre raton y humano, y llenamos la matriz con 199 candidatos adicionales basados en estrictos criterios de Randfold (Bonnet et al., 2004) y conservacion de genoma de raton y rata. Estas matrices fueron evaluadas con 4 fuentes diferentes de ARN pequenos: celulas de embriones de raton en los dias embrionarios 8,5 y 16,5, de cerebro de raton adulto y celulas madre embrionarias (ES) (figura 2). Los ARNmi maduros fueron anotados semi- manualmente despues del preprocesamiento de los datos de resultados de la micromatriz cruda usando secuencias personalizadas. Un conjunto redundante de 221 de ARNmi conocidos (82%), 429 de los ARNmi conservados candidatos (63%), y 126 del conjunto extra (63%) se encontraron positivos (figura 2). Como los loci genomicos diferentes pueden producir un ARNmi maduro identico a partir de una horquilla diferente (por ejemplo miR-1-1 y miR-1-2), el numero total de ARNmi maduros no redundantes es inferior. De manera interesante, para mas de la mitad de los ARNmi conocidos, el extremo 3' mas prominente observado en el ensayo RAKE difirio de la forma anotada, incluyendo 8 ARNmi maduros residiendo en el otro brazo de la horquilla, lo que sugiere que originalmente la secuencia de estrella fue anotada. Ademas, para varios ARNmi candidatos y conocidos, sondas posteriores multiples (2 o 3) resultaron en una senal positiva, indicando que el procesamiento del extremo 3' de los ARNmi no es un proceso completamente preciso en el nivel de nucleotido unico. Estas conclusiones concuerdan con la variacion observada en los extremos de los ARNmi clonados (Aravin y Tuschl, 2005).
[0047] El segundo enfoque que perseguimos para confirmar experimentalmente los ARNmi nuevos es la secuenciacion profunda de bibliotecas de ARN pequeno fraccionado por tamano de tejidos de humano y de raton aislados. Aunque se sugirio previamente que tales esfuerzos habian alcanzado una saturation cercana (Lim et al., 2003), solo se ha secuenciado un numero limitado de clones de biblioteca a partir de un conjunto seleccionado de tejidos de vertebrados (Lagos-Quintana et al., 2001, Lim et al., 2003, Bentwich et al., 2005). Ademas, nuestras predicciones computacionales y confirmaciones basadas en micromatriz(RAKE) sugirieron muchos ARNmi nuevos por descubrir. Por lo tanto, generamos siete bibliotecas no concatomerizadas de alta graduation de ARN pequeno fraccionado por tamano a partir de cerebro de raton y varios tejidos fetales humanos (cerebro, piel, corazon, pulmon y tejidos mezclados) y secuenciamos 83.040 clones. Despues de recorte de vector y de calidad, se recuperaron 51.044 insertos mas largos de 17 bases que representan 8.768 y 7.306 secuencias no redundantes de raton y de humano, respectivamente. Establecimos una tuberia computacional para la anotacion automatizada de las secuencias clonadas, teniendo en cuenta la posicion cromosomica unica, la ubicacion en elementos repetitivos o genes de ARNr, ARNt, ARNsno, datos de conservacion de 9 genomas de vertebrados (humano, raton, rata, perro, vaca, pollo, zarigueya, pez cebra y fugu) y la informacion de estructura secundaria usando randfold (Bonnet et al., 2004). Este analisis se aplico a los fragmentos clonados de raton y de humano, al igual que a todos los ARNmi de humano y de raton conocidos y los candidatos positivos identificados utilizando el ensayo RAKE. 214 de los 238 ARNmi de raton (90%) y 306 de los 319 de humano (96%), segun esta depositado en la miRBase (Griffiths-Jones, 2004), pasaron la filtration y la anotacion automatizada, mostrando que el indice de falso negativo es bajo para los ARNmi conocidos. Para los ARN pequenos secuenciados, 21.537 clones de raton (69%) y 13.120 de humano (66%) pasaron esta filtracion. Las secuencias de ARNmi abundantes conocidas dominan este conjunto, pero de manera interesante aproximadamente 2% de las lecturas representan 115 genes de ARNmi de raton nuevos y 111 de humano nuevos (figura 1).
[0048] Tomados juntos, identificamos 535 genes ARNmi de raton nuevos (RAKE y donation) y 111 de humano nuevos (donation solo). Aunque solo 17 ARNmi fueron clonados tanto de muestras de humano como de raton, la mayoria de los ARNmi de raton nuevos tiene un homologo de humano claro (por encima del 90% de identidad para el ARNmi maduro y 70% para el pre-ARNmi), llegando hasta 401 y 542 de genes de ARNmi recien descubiertos en los genomas de humano y de raton, respectivamente.
[0049] Como la mayoria de los ARNmi nuevos fueron clonados solo una vez y nuestros esfuerzos de clonacion identificaron solo aproximadamente 2/3 de todos los ARNmi conocidos, razonamos que los esfuerzos de clonacion no estaban agotados. Por lo tanto, generamos otras 32 bibliotecas de ARN pequeno fraccionado por tamano de muestras de cerebro de humano, chimpance y macaco. Estas bibliotecas no fueron clonadas en bacterias, sino amplificadas clonalmente en una emulsion de PCR, seguido de pirosecuenciacion masivamente paralela (Margulies et al., 2005). Un total de mas de 1,6 millones de lecturas de secuenciacion fueron evaluadas utilizando la tuberia de analisis de
5
10
15
20
25
30
35
40
45
50
55
60
65
bioinformatica mencionada anteriormente. Como habia mas genomas de vertebrados en el momento de este analisis, usamos un metodo alternativo para la identificacion de genes de ARNmi homologos en otras especies para este conjunto de ARNmi. Los experimentos de humano, chimpance y macaco dieron como resultado la identificacion de 878, 227 y 1973 ARNmi nuevos respectivamente (figura 1). El analisis de homologia dio como resultado un conjunto de 2384 microARN de humano nuevos. 65 microARN se descubrio que eran especificos de humano, mientras que 17 y 519 estaban restringidos al genoma de chimpance y de macaco, respectivamente.
[0050] En una forma de realizacion, la divulgacion proporciona un metodo de identificacion de un ARNmi de humano o un ARNmi de raton. En otra forma de realizacion un metodo segun la divulgacion comprende un paso adicional. Dicho paso comprende determinar un ortologo o un homologo de un gen. Un ortologo o un homologo se determina por comparacion de secuencias. Un homologo u ortologo de humano se determina por ejemplo de una secuencia de raton o viceversa, un ortologo de raton se determina de una secuencia de humano. Un homologo de un ARNmi de la figura 1 es preferiblemente un homologo de mamifero. Los homologos de mamifero de un ARNmi de la figura 1 comprenden al menos 90% de identidad de secuencia en una extension de al menos 20 nucleotidos consecutivos de un ARNmi de la figura 1, y estan preferiblemente situados en un ARN mayor que comprende 70% de identidad de secuencia con el ARN en horquilla correspondiente de dicho ARNmi, donde dicho ARN mayor es preferiblemente capaz de formar una estructura de tallo-bucle como predicho por un modelo informatico apropiado, y donde dicho homologo esta preferiblemente situado en una region de tallo predicha en dicho ARN mayor.
[0051] Los ARNmi son productos de cadena unica derivados de precursores de tallo-bucle mas largos; pueden emparejarse a base con ARN mensajeros, y asi prevenir su expresion. Los genomas de animales contienen cientos de genes de ARNmi y miles de genes a los que estos se dirigen. Los ARNmi frecuentemente tienen importante expresion especifica de organo y pueden asi usarse para discriminar entre tipos de celulas diferentes.
[0052] Historicamente se descubrio que los ARNmi son reguladores anormales en gusanos extranos: mutantes defectuosos en el momento de la division celular en las larvas del nematodo C. elegans se descubrio que eran defectuosos en un gen lin-4, que codificaba un ARN pequeno se demostro que se enlaza a y silencia la traduccion del ARNm de lin-14 (Lee et al., 1993). La relevancia general de este descubrimiento de hito se volvio mas clara cuando un segundo ARN pequeno, let-7, resulto ser fuertemente conservado desde gusanos a moscas y humano (Reinhart et al., 2000), y cuando posteriormente ARNmi adicionales fueron descubiertos. La situacion actual es que el genoma humano contiene probablemente al menos 500 genes de ARNmi (Bartel 2004, Berezikov et al., 2005), que pueden regular miles de genes diana(Lim et al., 2005, Lewis et al., 2005). Solo la secuencia semilla de 7 bases (posicion 2-8 desde el extremo 5') parece necesaria para la accion de ARNmi en celulas animales; ^por que entonces se conserva tan fuertemente el ARNmi entero? Seguramente otras posiciones aportan efectos pequenos pero sin embargo significativos a la accion de ARNmi, pero explicaciones adicionales pueden ser que las otras secuencias del ARNmi son necesarias para el procesamiento de los precursores, por lo tanto antes de que el ARNmi sea maduro, y no se puede descartar que los ARNmi sirvan para otras funciones desconocidas en la celula para las que estas otras secuencias son necesarias.
[0053] Independiente del descubrimiento de los ARNmi, el silenciamiento genico por ARNsi fue descubierto: interferencia de ARN (Fire et al., 1997). La similitud no se reconocio inmediatamente, pero los agentes centrales en el ARNi fueron moleculas de ARN del mismo tamano que los ARNmi, y ya que la ARNasa que hace ARNsi a partir de ARN bicatenarios mas largos se habia descubierto (Bernstein et al., 2001), no escapo a la atencion de nadie, como dice la frase desde el papel de la doble helice de 1953, que Dicer tambien podria ser responsable de la fabricacion de ARNmi (lo que se confirmo de hecho mediante una serie de papeles paralelos que mostraron que los mutantes de Dicer son defectuosos en la sintesis de ARNmi). Desde entonces, un cuerpo impresionante de analisis genetico y bioquimico ha llevado a la conclusion de que los complejos que silencian un ARNm y son guiados por un ARN pequeno (RISC, para complejo de silenciamiento inducido por ARN) puede diferir de organismo a organismo, de tejido a tejido, y puede incluso haber vias paralelas dentro de una celula, pero en esencia los ARNmi y los ARNsi actuan via un complejo bastante similar, que siempre contiene al menos un miembro de la familia de las proteinas argonautas.
[0054] El mecanismo preciso por el que los ARNmi silencian ARNm no esta claro, con diferentes temas que necesitan resolverse. El descubrimiento original del primer ARNmi lin-4 indico que el ARNm objetivo se dejo intacto y sin cambios en los niveles de estado estable (Lee et al., 1993); se creyo que el ARNmi silenciaba pero no degradaba su objetivo. Desde entonces, se ha descubierto que el silenciamiento de ARNmi esta en realidad acompanado por una caida de los niveles de los ARNm objetivo; la caida suele ser modesta, un factor de 2-3 es comun, lo que parece insuficiente para explicar completamente la caida en los niveles de proteina, lo que sugiere que los ARNm intactos tambien son silenciados (Bagga et al., 2005). La discrepancia con los datos anteriores se puede explicar debido a que el estudio original midio los niveles de ARN mediante proteccion de ARNasa en lugar de por membranas de Northern, una tecnica que no es tan sensible a la degradacion parcial de ARN. Un segundo punto que necesita ser clarificado es si el efecto de la supresion de la traduccion de los ARNmi esta en iniciacion o alargamiento de la traduccion, con un reciente estudio que muestra que la introduccion de un IRES (sitio de entrada de ribosoma interno) anula la represion de ARNmi, lo que sugiere que la accion esta en iniciacion (Pillai et al., 2005).
[0055] ^Que es la funcion de los ARNmi? La falta virtual de mutantes de ARNmi descubierta en cazas de mutantes sentido en sistemas geneticos tales como Drosophila o C. elegans se puede atribuir parcialmente al pequeno tamano de los ARNmi como objetivos de mutagenesis; ademas, los ARNmi parecen bastante tolerantes de un cambio de base
5
10
15
20
25
30
35
40
45
50
55
60
65
unica siempre y cuando no afecte a la "secuencia semilla" de 7 nucleotidos. Ademas, los investigadores que tratan de mapear una mutacion para una region de codificacion de proteina pueden haber elegido ignorar las mutaciones en las secuencias de ARNmi no codificante. Sin embargo, probablemente la explicacion mas importante por la que los ARNmi se han perdido en las pantallas de mutantes es que su inactivacion a menudo no tiene fenotipo. En un reciente estudio, los ARNmi del genoma de nematodos se desactivaron, y el resultado fue que los mutantes unicos no tenian un fenotipo mientras que los mutantes multiples si tenian (Abbott et al., 2005). Tambien vemos esto con la destruccion de los ARNmi de embriones de pez cebra usando morfolinos. La conclusion es que hay mucha redundancia; posiblemente los niveles muy altos de ARNmi en una celula (frecuentemente mas de 50.000 copias) se consiguen mejor mediante un conjunto de genes que codifican ARNmi relacionado, y la perdida de uno de ellos lleva a una reduction modesta de los niveles que no da como resultado inmediatamente un fenotipo visible fuerte. Como sucede frecuentemente en biologia, esto plantea la pregunta de por que tantos genes de ARNmi han sido fuertemente conservados si parece que hay tan poca presion selectiva, y como suele ocurrir frecuentemente la respuesta tiene que estar en los efectos sutiles que no son reconocidos en condiciones de laboratorio.
[0056] Como la secuencia semilla parece determinar la especificidad de objetivo del ARNmi, la presente invention ademas proporciona una secuencia de acidos nucleicos que comprende al menos los nucleotidos 2-8 de un ARNmi como se representa en la figura 1, o la secuencia semilla de un homologo mamifero de un ARNmi como se representa en la figura 1. En una forma de realization preferida, dicha secuencia de acidos nucleicos que comprende al menos los nucleotidos 2-8 de un ARNmi de la figura 1 comprende entre aproximadamente 18 y 26 nucleotidos. Preferiblemente, entre aproximadamente 20-24 nucleotidos, mas preferiblemente aproximadamente 22 nucleotidos.
[0057] Como se describe, desactivar mutantes de ARNmi unicos da pocos indicios acerca de la funcion de los ARNmi. Una indication de funcion viene del estudio del modelo de expresion de ARNmi: nuestro laboratorio mostro recientemente que muchos ARNmi tienen expresion especifica de organo importante, o incluso expresion restringida para capas de tejido unico dentro de un organo. Esto indica que no desempenan un papel de gestion interna general en el metabolismo celular, pero muy probablemente desempenan un papel en un aspecto de la diferencia entre celulas diferenciadas (Wienholds et al., 2005). Un ejemplo de tales modelos de expresion es miR-206 en el musculo y miR-34A en el cerebelo. Un segundo indicio viene del experimento de desactivacion de ARNmi mas crudo posible: la desactivacion de todos los ARNmi (mas los ARNsi), por interruption del gen Dicer, que codifica la nucleasa que fabrica los ARNmi. (Wienholds et al., 2003). Como es de esperar, esta mutacion es letal. En el raton, la funcion Dicer es incluso necesaria para la formation de celulas madre. En el pez cebra, sin embargo, no lo es. Asi, se pueden cruzar dos peces heterozigoticos de Dicer, y analizar la progenie homocigotica: se desarrolla normalmente hasta aproximadamente una semana de edad, momento en el que el crecimiento se detiene y los animales finalmente mueren. Los embriones de pez tienen formados la mayor parte de sus organos a las 24-48 horas, y despues de una semana nadan, comen y se comportan como verdaderas pequenas bestias, todo esto sin Dicer. El analisis de los niveles de ARNmi muestra parte de la explicacion: rescate materno. En los primeros dias de desarrollo, incluso los embriones mutantes de Dicer forman nuevos ARNmi zigoticos, y esto debe ser hecho mediante la funcion de Dicer materno (ARNm y/o proteina de Dicer en el ovocito). Sin embargo, cabe destacar que, con la exception de algunos ARNmi, en las primeras 24-48 horas de desarrollo solo se ven bajos niveles, tambien en el tipo salvaje (Wienholds et al., 2005). Asi, el patron temporal de expresion de ARNmi es que aparecen mucho despues de que la mayoria de las celulas se hayan diferenciado y los tejidos se hayan formado. El lento aumento de los niveles debe ser el resultado de la acumulacion en el tiempo: muchos genes de ARNmi estan incrustados en intrones de genes codificantes de proteina, y son transcritos inicialmente junto con su ARNm "huesped", y por lo tanto presumiblemente equimolares a los ARNm; mientras que los niveles de ARNm permanecen modestos, los niveles de ARNmi se acumulan con el tiempo, debido a que los ARNmi son mucho menos devueltos que sus ARNm huespedes. Un experimento elegante (Giraldez et al., 2005) planteo ademas el hecho de que los ARNmi no desempenan un gran papel en el desarrollo temprano: la expresion materna de Dicer se pueden retirar trasplantando celulas germinales de embriones de mutantes de Dicer en los embriones de tipo salvaje de la misma edad: cuando los peces crecen son fertiles, pero su linea germinal es mutante de Dicer geneticamente. En esta situacion, los peces no tienen Dicer materna, y de hecho los animales se detienen antes en el desarrollo, pero aun forman diferentes tejidos. La conclusion de estos experimentos es que los ARNmi son necesarios para el desarrollo completo, tienen unos modelos de expresion sugestivo de funciones de desarrollo, pero no son necesarios para la diferenciacion de tejido inicial. Los estudios anteriormente mencionados pueden se pueden refinar mas con el descubrimiento de los ARNm de la figura 1, dado que objetivos nuevos para la expresion de los ARNmi en el desarrollo se han facilitado.
[0058] Algunos estudios recientes describen como los ARNmi pueden ajustar la expresion genica en el desarrollo. Un estudio describe el papel de mir-61 en la determination de la suerte de una celula en el desarrollo vulvar del nematodo mediante un bucle de retroaction: la suerte celular se determina por expresion mutuamente exclusiva de un gen u otro, y una proteina activa la expresion de un ARNmi, lo que disminuye la expresion de la segunda proteina (Yoo and Greenwald, 2005). Otro estudio reciente describe como miR-196 actua aguas arriba de los genes Hox (Hornstein et al., 2005). Los genes de la cascada de serialization Notch se regulan mediante un conjunto de ARNmi (Lai et al., 2005). Todos estos casos se pueden denominar action de ARNmi programada: la action de ARNmi es una parte integral de un evento de desarrollo. La consecuencia logica es que la accion esta bajo presion evolutiva positiva, y de hecho el estudio de la ruta Notch podria explotar la conservation evolutiva de los sitios objetivo entre especies de insectos para reconocerlos en las UTR 3' de los genes.
5
10
15
20
25
30
35
40
45
50
55
60
65
[0059] Un requisito previo para tales conmutadores de desarrollo es que en algun momento en el tiempo el ARNmi y su ARNm objetivo se expresan en el mismo tejido, de modo que el ARNmi puede ejercer su accion y silenciar la expresion de su objetivo. Intuitivamente esto es lo que se puede esperar que sea la norma: si un ARNm es un "objetivo genuino" de un ARNmi, los dos tienen que ser coexpresados. En otras palabras: un enfoque ingenuo para descubrir pares de ARNmi/objetivo biologicamente relevantes seria el siguiente: seleccionar la secuencia de la secuencia "semilla" de 7 pares de bases de cada ARNmi contra la UTR 3' de todos los genes conocidos; tomar los conjuntos de pares de ARNmi/ARNm que resultan, luego filtrar el conjunto entero solo aceptando los pares en los que ARNmi y ARNm objetivo se expresan en el mismo tejido. Esto pareceria logico, puesto que ^como podrian los dos interactuar si no se expresan en las mismas celulas? Curiosamente dos estudios recientes muestran que la situation es mas compleja que eso. Un estudio se hizo en Drosophila (Stark et al., 2005), el otro en mamiferos (Farh et al., 2005), y en esencia la conclusion es en gran medida la misma. El primer resultado sorprendente es este. Si se toma ARNmi conocidos por ser expresadas en un tipo determinado de tejido (digamos musculo), y se miran los niveles de expresion de los genes cuyas UTR 3' contienen un sitio objetivo (potencial) de tal ARNmi (definido de forma operacional como una correspondencia perfecta para la secuencia semilla de 7 bases), entonces los genes con un sitio objetivo se expresan en niveles mas altos en los tejidos que no expresan el ARNmi que en los tejidos que lo hacen. Por lo tanto los socios reales (ARNmi mas objetivos) no son necesariamente coexpresados. ^Es este efecto causa o consecuencia? Ambos estudios comparan los niveles de ARNmi con los niveles del transcrito de ARNm, y ya que los ARNmi pueden reducir los niveles de transcrito (vease arriba) la relation de causa/consecuencia no esta totalmente clara en cualquier caso. Asi, decir que los ARNm y los ARNmi evitan la coexpresion pueden ser una exageracion, ya que la reduction de un ARNm tambien puede ser la consecuencia de la accion del ARNmi, no una consecuencia de evitar en el nivel transcripcional. Bartel y sus companeros plantearon esto de forma elegante: miraron los genes de raton que no tienen un objetivo de ARNmi, mientras que el ortologo de humano si tiene. Estos genes de raton siguen evitando sin embargo significativamente la expresion en los tejidos que expresan el ARNmi. Esto sugiere que la evitacion es realmente a nivel transcripcional, y no es ausencia como resultado de la accion de ARNmi (debido a que la version de raton del gen no ve ninguna accion de ARNmi en ese tejido).
[0060] Despues hay un segundo efecto. Ambos documentos encuentran evidencia de "anti-objetivos": hay una evitacion selectiva de sitios objetivo en genes que se expresan a altos niveles en tejidos donde los ARNmi son expresados. Dado que la expresion genica es reducida por los ARNmi, la adquisicion de nuevos sitios objetivo de ARNmi para ARNmi expresados en ese tejido (probablemente no es un evento infrecuente en la evolution, ya que la secuencia semilla crucial solo tiene 7 nucleotidos de longitud) es una mala noticia y se seleccionaran en contra si se produce una desactivacion no deseada de ese gen.
[0061] Entonces, ^como se relacionan los ejemplos de la accion de los ARNmi programados, que sirven como conmutadores de desarrollo, con la nocion de evitar la coexpresion? Si el ARNmi se relaciona con su objetivo como una aspiradora con el polvo, ^como pueden los dos verse como socios bien ajustados en un conmutador de desarrollo sutil? La respuesta esta provista por una bonita distincion hecha en el estudio de Bartel y colegas (Farh et al., 2005): los objetivos de los ARNmi se dividen en dos clases: conservados y no conservados. Aqui se define de forma operacional como aquellos objetivos que se conservan o que no se conservan en las UTR 3' de humano contra genes de raton ortologos. La mayoria no se conserva, la minoria si. Ahora, aqui esta el descubrimiento: los objetivos conservados estan en genes que no evitan la coexpresion con sus ARNmi, los no conservados la evitan.
[0062] La clase de objetivos conservados tiene su explication en el papel esencial que desempenan los ARNmi en conmutadores de desarrollo, tales como los mencionados anteriormente en las vias vulvar y de Notch, y pueden denominarse en esos casos como silenciamiento de ARNmi programado. Un segundo tipo de objetivos conservados son aquellos en los que la expresion genica es necesaria en una fase de desarrollo, pero despues de determinar la suerte celular, los ARNmi analizan las celulas para eliminar las trazas restantes de expresion de estos ARNm que no estan destinados a ser expresados en ese tejido. El sistema de ARNmi es una aspiradora que elimina hasta la ultima mancha de transcritos no deseados. Alternativamente el sistema puede servir para regular pero deliberadamente no desactivar sus objetivos. Junto con el inicio tardio y la perseverancia de la expresion de muchos ARNmi y la diferenciacion de tejidos en embriones de pez desprovistos de todos los ARNmi, esto indica que la funcion primaria de muchos ARNmi no puede ser cambiar la suerte celular, sino mas bien amortiguar la expresion de genes no deseados, para recordar a una celula la suerte que ha elegido previamente: recuerda que eres una celula muscular, jno tienes coraje para expresar otros genes!
[0063] La mayoria no conservada tiene una explicacion completamente diferente: aparentemente las UTR 3' de genes estan llenas de secuencias a las que los ARNmi se pueden enlazar; esto no es sorprendente si la unica caracteristica esencial real es la homologia con la secuencia semilla de 7 nucleotidos: con una UTR 3' de mil o dos mil pares de bases, y con cientos de diferentes ARNmi, a menudo habra coincidencias. En la evolucion, tales nuevas secuencias de reconocimiento de "ARNmi" aparecen todo el tiempo, y no pasa nada malo con ellas de por si. El problema aparece solo si el objetivo es en un gen que necesita ser expresado a un nivel significativo precisamente en el tejido en el que el ARNmi correspondiente esta presente a altos niveles, listo para silenciar cualquier ARNmi que coincida con su secuencia semilla. Para estos genes, la coincidencia con este ARNmi pueden ser un fastidio, con propiedad negativa como resultado, y por lo tanto estas coincidencias son contra seleccionadas. Las secuencias objetivo de ARNmi de nueva aparicion (sin funcion, y asi bajo ninguna presion evolutiva para permanecer conservadas) no se seleccionaran contra, y tendran esencialmente efectos de propiedad neutra si el ARNmi que podria enlazar con ellas no es expresado
5
10
15
20
25
30
35
40
45
50
55
60
65
en el mismo tejido. Estas secuencias objetivo no tienen relevancia fisiologica, y por lo tanto son por lo tanto son ignoradas por evolucion, ni seleccionada para ni contra, en tanto que no se expresan en los tejidos que expresan los ARNmi. Estas secuencias de 7 pares de bases son al organismo como los sitios de restriccion EcoRI en el ADN (GAATTC): de ninguna importancia o interes (en tanto en cuanto no hay EcoRI alrededor en la celula).
[0064] Las combinaciones entre ARNmi y su objetivo puede asi ser clasificada en al menos tres grupos: positivamente seleccionados, neutros y negativamente seleccionados.
1. Las interacciones seleccionadas positivamente o programadas pueden ser conmutadores de suerte celular genuinos, tal como el conmutador de la 2a suerte celular vulvar por miR-61 en gusanos, donde en una fase crucial en el tiempo una celula tiene que escoger. Un segundo tipo de objetivos programados son aquellos donde despues de determinar la suerte celular todas las trazas de ARNm que fueron necesarias en una fase de desarrollo previa tienen que eliminarse, o los niveles de genes tienen que permanecer amortiguados significativamente. Se puede esperar que estas interacciones se conserven, ya que contribuyen positivamente al establecimiento estable o el mantenimiento de la suerte celular.
2. La segunda clase de combinaciones es neutra. Hay dos posibilidades. La primera un es baladi: los ARNmi y los objetivos no se expresan en el mismo tejido. Si un gen se expresa unicamente en el epitelio intestinal, la presencia de un objetivo para un ARNmi muscular es irrelevante. Una segunda clase de pares es real, lo que significa que el ARNmi y su objetivo interactuan en la vida real, pero el efecto es neutro evolucionariamente. Un gen se puede amortiguar un poco, o no, y el organismo no importa. Notese que estas interacciones son neutras en un sentido evolutivo, sin efecto selectivo, pero no en un sentido bioquimico, dado que los ARNmi infrarregulan (y la desactivacion experimental del ARNmi daria por lo tanto como resultado un efecto ascendente en la expresion del gen objetivo). La clase de interacciones de ARNmi-objetivo neutras pero activas pueden resultar ser muy grandes. Mientras que la primera clase (interacciones programadas) sera conservada entre especies, la segunda clase no lo sera.
3. La tercera clase de interacciones ARNmi-objetivo son aquellas donde el ARNmi se expresa en el mismo tejido que el ARNm, cerrando los genes que tienen que ser expresados. Los datos de evitacion sugieren que hay presion selectiva contra tal coexpresion, y se han denominado como anti-objetivos. Hay inevitablemente un nivel de estado estable de sitios objetivo de reciente aparicion de en los genes anti-objetivo, pero estos se filtraran eventualmente por presion selectiva.
[0065] Dadas estas distinciones, hay diferentes formas de que la mutacion de interacciones de ARNmi-objetivo pueda causar la enfermedad. Un ARNmi puede mutar y perder la funcionar; hay en muchos casos algun nivel de redundancia, pero esto es a un nivel bruto (visible en el laboratorio), mientras que la perdida de incluso un gen de ARNmi puede tener efectos patogenos negativos sutiles. Tambien un sitio objetivo de ARNmi programado puede mutar, liberando el gen del ARNmi-control. Finalmente un gen puede adquirir una secuencia objetivo de ARNmi nueva y no deseada: hay numerosas secuencias que estan a tan solo una mutacion de convertirse en un objetivo para uno de los ARNmi expresados en el mismo tejido. Algunas de estas mutaciones daran lugar a reduccion no deseada de actividad genica, y pueden causar la enfermedad. De modo que las tres posibles causas de enfermedad son: 1. mutacion de un gen de ARNmi, 2. mutacion de un sitio objetivo de ARNmi programado, 3. mutacion que crea un sitio objetivo nuevo en un gen de anti-objetivo.
[0066] En una nota mas positiva: dados los efectos combinatorios complejos de regulacion de genes por a menudo mas de un ARNmi, cada uno de los cuales tiene un efecto sutil en la expresion genica, los polimorfismos en objetivos de ARNmi pueden ser el sustrato ideal para el tipo de variaciones pequenas en el desarrollo que la seleccion natural puede actuar en la evolucion. Los cambios en la codificacion de la proteina a menudo pueden bien interrumpir totalmente la funcion de la proteina, lo que contribuye raramente positivamente a la propiedad, pueden dejar la proteina inalterada, o reducir la actividad de la proteina codificada. Por otro lado, los cambios en los objetivos de ARNmi pueden esculpir modelos de expresion con grande finura. Las muchas diferencias graduales que suman para crear un embrion de raton a partir de un cigoto de raton y un pez a partir de un cigoto de pez son ciertamente en sus mayoria diferencias en la sincronizacion y los niveles de expresion de factores que realizan acciones bioquimicas identicas esencialmente, en lugar de diferencias en la accion de la proteina. Por lo tanto, el ajuste fino de la expresion genica por ganancia o perdida de secuencias objetivo de ARNmi se puede esperar que sea un mecanismo principal en la evolucion y procesos de la enfermedad. Donde en la presente invention la expresion de un ARNmi de la figura 1 se mide en un metodo de la divulgation, o una coleccion de ARNmi de la figura 1 se proporciona o un complemento de la misma o una secuencia que hibridiza bajo condiciones rigurosas de la misma, o su complemento, o una (micro-)matriz que comprende un ARNmi de la figura 1 se proporciona, o de un complemento de la misma o una secuencia que hibridiza bajo condiciones rigurosas de la misma, o su complemento, se prefiere que la expresion, coleccion o matriz mida o comprenda al menos 5 ARNmi de la figura 1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. Mas preferiblemente, la expresion, coleccion o matriz mide o comprende al menos 10 ARNmi de la figura 1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. Mas preferiblemente, la expresion, coleccion o matriz mide o comprende al menos 20 ARNmi de la figura 1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. Mas preferiblemente, la expresion, coleccion o matriz mide o comprende al menos 40 ARNmi de la figura
5
10
15
20
25
30
35
40
45
50
55
60
65
1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. Mas preferiblemente, la expresion, coleccion o matriz mide o comprende al menos 60 ARNmi de la figura 1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. Mas preferiblemente, la expresion, coleccion o matriz mide o comprende al menos 100 ARNmi de la figura 1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. Mas preferiblemente, la expresion, coleccion o matriz mide o comprende al menos 200 ARNmi de la figura 1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. Mas preferiblemente, la expresion, coleccion o matriz mide o comprende al menos 400 ARNmi de la figura 1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. Mas preferiblemente, la expresion, coleccion o matriz mide o comprende al menos 600 ARNmi de la figura 1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento.
[0067] Donde en la presente invencion la expresion de un ARN en horquilla de la figura 1 se mide en un metodo de la divulgacion, o una coleccion de ARN en horquilla de la figura 1 es proporcionado o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento, o una (micro-)matriz que comprende un ARN en horquilla de la figura 1 es proporcionado, o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento, se prefiere que la expresion, coleccion o matriz mida o comprenda al menos 5 ARN en horquilla de la figura 1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. Mas preferiblemente, la expresion, coleccion o matriz mide o comprende al menos 10 ARN en horquilla de la figura 1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. Mas preferiblemente, la expresion, coleccion o matriz mide o comprende al menos 20 ARN en horquilla de la figura 1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. Mas preferiblemente, la expresion, coleccion o matriz mide o comprende al menos 40 ARN en horquilla de la figura 1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. Mas preferiblemente, la expresion, coleccion o matriz mide o comprende al menos 60 ARN en horquilla de la figura 1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. Mas preferiblemente, la expresion, coleccion o matriz mide o comprende al menos 100 ARN en horquilla de la figura 1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. Mas preferiblemente, la expresion, coleccion o matriz mide o comprende al menos 200 ARN en horquilla de la figura 1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. Mas preferiblemente, la expresion, coleccion o matriz mide o comprende al menos 400 ARN en horquilla de la figura 1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. Mas preferiblemente, la expresion, coleccion o matriz mide o comprende al menos 600 ARN en horquilla de la figura 1 o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. La expresion es preferiblemente medida determinando si una celula comprende dicho ARNmi o ARN en horquilla. Tambien se usa para caracterizar una celula o una muestra.
[0068] En una forma de realizacion preferida, la expresion o la presencia de un ARNmi o ARN en horquilla humano se mide o caracteriza en una celula o muestra utilizando un metodo de la divulgacion. Asi, en una forma de realizacion preferida dicha coleccion y o (micro-)matriz comprende al menos uno, preferiblemente al menos 5, mas preferiblemente al menos 10, mas preferiblemente al menos 20, mas preferiblemente al menos 40, mas preferiblemente al menos 60, mas preferiblemente al menos 100, mas preferiblemente al menos 200, mas preferiblemente al menos 200, mas preferiblemente al menos 400, mas preferiblemente al menos 600 ARNmi humano y/o ARN en horquilla humano de la figura 1, o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento.
[0069] En una forma de realizacion preferida, la expresion o la presencia de un ARNmi o ARN en horquilla de primate se mide o caracteriza en una celula o muestra utilizando un metodo de la divulgacion. Asi en una forma de realizacion preferida, dicha coleccion y o (micro-)matriz comprende al menos uno, preferiblemente al menos 5, mas preferiblemente al menos 10, mas preferiblemente al menos 20, mas preferiblemente al menos 40, mas preferiblemente al menos 60, mas preferiblemente al menos 100, mas preferiblemente al menos 200, mas preferiblemente al menos 200, mas preferiblemente al menos 400, mas preferiblemente al menos 600 ARNmi de primate y/o ARN en horquilla de primate de la figura 1, o un complemento del mismo o una secuencia que hibridiza bajo condiciones rigurosas del mismo, o su complemento. En una forma de realizacion preferida dicho primate es un humano. En otra forma de realizacion preferida dicho primate es un chimpance o un macaco.
[0070] Donde en la presente invencion, se proporciona una molecula de acido nucleico que comprende una secuencia de nucleotidos como se muestra en la figura 1, y/o una secuencia de nucleotidos que es su complemento, y/o una secuencia de nucleotidos que tiene una identidad de al menos 80% con dicha secuencia de nucleotidos o complemento de la misma, y/o una secuencia de nucleotidos que hibridiza bajo condiciones rigurosas para tal secuencia de nucleotidos se prefiere al menos 5 moleculas de acido nucleico diferentes que comprenden una secuencia de nucleotidos como se muestra en la figura 1, y/o una secuencia de nucleotidos que es su complemento, y/o una secuencia de nucleotidos que tiene una identidad de al menos 80% con dicha secuencia de nucleotidos o complemento de la misma, y/o una secuencia de nucleotidos que hibridiza bajo condiciones rigurosas para tal secuencia de nucleotidos, se proporcionan. Preferiblemente al menos 10, mas preferiblemente al menos 20, mas preferiblemente al menos 40, mas preferiblemente al menos 60, mas preferiblemente al menos 100, mas preferiblemente al menos 200 y
5
10
15
20
25
30
35
40
45
50
55
60
65
mas preferiblemente al menos 600 moleculas de acido nucleico diferentes que comprenden una secuencia de nucleotidos como se muestra en la figura 1, y/o una secuencia de nucleotidos que es su complemento, y/o una secuencia de nucleotidos que tiene una identidad de al menos 80% con dicha secuencia de nucleotidos o complemento de la misma, y/o una secuencia de nucleotidos que hibridiza bajo condiciones rigurosas para tal secuencia de nucleotidos, se proporcionan. En un aspecto preferido de esta forma de realization, dicha secuencia de la figura 1 es una secuencia de ARNmi, preferiblemente una secuencia de ARNmi humano. En otro aspecto preferido de esta forma de realizacion, dicha secuencia de la figura 1 es una secuencia de ARN en horquilla, preferiblemente una secuencia de horquilla de primate, mas preferiblemente una secuencia humana. En otra forma de realizacion preferida dicha secuencia de ARN en horquilla es una secuencia de chimpance o secuencia de macaco.
[0071] La invention ademas proporciona una coleccion de oligonucleotidos o analogos de oligonucleotidos seleccionada a partir del grupo que consiste en un conjunto A, conjunto B y conjunto C, donde;
el conjunto A es un conjunto de oligonucleotidos o analogos de oligonucleotidos que comprenden secuencias complementarias de todas las secuencias identificadas en la figura 9,
el conjunto B es un conjunto de oligonucleotidos o analogos de oligonucleotidos que comprende secuencias
complementarias de todas las secuencias del conjunto A y
el conjunto C es el conjunto de oligonucleotidos identificado en la figura 9.
Estas colecciones son especialmente adecuadas para determinar el estado de diferenciacion de una celula. Una muestra que comprende ARN de dicha celula se puede escanear para la presencia de los microARN identificados en la figura 9. Estos microARN son diferencialmente expresados en celulas primitivas versus diferenciadas. Las celulas que han sufrido una o mas modificaciones en el camino a la tumorigenesis, o las celulas tumorales en si mismas son frecuentemente desdiferenciadas cuando se comparan con el tipo de celula que las origino. Los conjuntos A, B o C son por lo tanto muy adecuados para determinar si una muestra de celulas comprende celulas desdiferenciadas, preferiblemente celulas tumorales. El ARNmi al que se hace referencia es frecuentemente bajo expresado en el tejido desdiferenciado. En una forma de realizacion preferida la invencion proporciona una coleccion de oligonucleotidos o analogos de oligonucleotidos seleccionada del grupo que consiste en el conjunto A, conjunto B y conjunto C, donde;
el conjunto A es un conjunto de oligonucleotidos o analogos de oligonucleotidos que comprenden secuencias complementarias de al menos la secuencia minima y/o la secuencia semilla de todas las secuencias de ARNmi identificadas en la figura 9,
el conjunto B es un conjunto de oligonucleotidos o analogos de oligonucleotidos que comprende secuencias complementarias de al menos la secuencia minima y/o la secuencia semilla de todas las secuencias de ARNmi del conjunto A y
el conjunto C es el conjunto de oligonucleotidos que comprende al menos la secuencia minima y/o secuencia semilla de los ARNmi identificados en la figura 9.
El conjunto A es un conjunto de oligonucleotidos o analogos de oligonucleotidos que comprenden secuencias complementarias de todas las secuencias identificadas en la figura 9. El conjunto A por lo tanto preferiblemente comprende el mismo numero de oligonucleotidos o de analogos de oligonucleotidos que se especifica en la figura 9. De forma similar, el conjunto B es un conjunto de oligonucleotidos o analogos de oligonucleotidos que comprende secuencias complementarias de al menos la secuencia minima y/o la secuencia semilla de todas las secuencias de ARNmi del conjunto A. Asi el conjunto B por lo tanto preferiblemente comprende el mismo numero de oligonucleotidos o analogos de oligonucleotidos que se especifica en la figura 9. Un analogo oligonucleotidos es un analogo de acidos nucleicos que tiene una secuencia que corresponde a la secuencia de un oligonucleotido. Un conjunto de oligonucleotidos de la invencion preferiblemente comprende oligonucleotidos o sus analogos de acidos nucleicos, que tienen o que se corresponden con una longitud de secuencia de un acido nucleico de la invencion, preferiblemente un ARNmi de la invencion. Asi un oligonucleotido se define aqui como una molecula de acido nucleico segun la invencion que tiene una longitud de 18 a 26 nucleotidos, preferiblemente de 19-24 nucleotidos, de la forma mas preferible 20, 21, 22 o 23 nucleotidos. Actualmente muchos tipos diferentes de modificaciones de acidos nucleicos y estructuras alternativas se han generado que imitan la secuencia de un acido nucleico pero no se denominan en si mismas algunas veces como acido nucleico. Ejemplos no limitativos de tales analogos de acidos nucleicos son los analogos que contienen uno o mas analogos de nucleotidos que imitan las caracteristicas de apareamiento de bases de los nucleotidos que reemplazan. Las moleculas de acido nucleico que incluyen tales analogos de nucleotidos se considera que son un analogo de acido nucleico de una molecula de acido nucleico de la invencion si contienen las mismas caracteristicas de hibridacion o caracteristicas de apareamiento de bases en especie, no necesariamente en cantidad, que dicha molecula de acido nucleico de la invencion. Otros ejemplos no limitativos de analogos de molecula de acido nucleico son acido nucleico bloqueado (ANB), acido nucleico de peptido (PNA) o morfolino. Otros ejemplos no limitativos mas de analogos de molecula de acido nucleico de la invencion son las modificaciones de la estructura del azucar que alteran la estabilidad de la molecula, tales modificaciones tipicamente no alteran la especie de las caracteristicas de apareamiento de bases. Un ejemplo no limitativo de tal modification es la modification 2-O-metil frecuentemente usada para oligonucleotidos.
[0072] En una forma de realizacion preferida la invencion proporciona una coleccion de oligonucleotidos o sus analogos de acido nucleico seleccionados del grupo que consiste en el conjunto A, conjunto B y conjunto C, donde;
5
10
15
20
25
30
35
40
45
50
55
60
65
el conjunto A es un conjunto de oligonucleotidos o sus analogos de acido nucleico que comprenden secuencias complementarias de todas las secuencias identificadas en la figura 9,
el conjunto B es un conjunto de oligonucleotidos o sus analogos de acido nucleico que comprende secuencias
complementarias de todas las secuencias del conjunto A y
el conjunto C es el conjunto de oligonucleotidos identificado en la figura 9.
[0073] La invention ademas proporciona una coleccion de oligonucleotidos o sus analogos de acido nucleico seleccionados del grupo que consiste en los conjuntos D-R, donde;
el conjunto D es el conjunto de oligonucleotidos identificado en la figura 4, el conjunto E es el conjunto de oligonucleotidos identificado en la figura 5, el conjunto F es el conjunto de oligonucleotidos identificado en la figura 6, el conjunto G es el conjunto de oligonucleotidos identificado en la figura 7, el conjunto H es el conjunto de oligonucleotidos identificado en la figura 8,
el conjunto I es un conjunto de oligonucleotidos o sus analogos de acido nucleico que comprende secuencias complementarias de todas las secuencias identificadas en la figura 4,
el conjunto J es un conjunto de oligonucleotidos o sus analogos de acido nucleico que comprende secuencias complementarias de todas las secuencias identificadas en la figura 5,
el conjunto K es un conjunto de oligonucleotidos o sus analogos de acido nucleico que comprende secuencias complementarias de todas las secuencias identificadas en la figura 6,
el conjunto L es un conjunto de oligonucleotidos o sus analogos de acido nucleico que comprende secuencias complementarias de todas las secuencias identificadas en la figura 7,
el conjunto M es un conjunto de oligonucleotidos o sus analogos de acido nucleico que comprende secuencias complementarias de todas las secuencias identificadas en la figura 8, y
los conjuntos de oligonucleotidos N, O, P, Q y R o sus analogos de acido nucleico, que comprenden secuencias complementarias de todas las secuencias de los conjuntos I, J, K, L y M, respectivamente. El conjunto N asi corresponde al conjunto I, el conjunto O al conjunto J, el conjunto P al conjunto K, el conjunto Q al conjunto L y el conjunto R al conjunto M.
[0074] La invencion ademas proporciona una coleccion de oligonucleotidos o sus analogos de acido nucleico seleccionados del grupo que consiste en los conjuntos D-R, donde;
el conjunto D es el conjunto de oligonucleotidos que comprende al menos la secuencia minima y/o la secuencia semilla de los microARN identificados en la figura 4,
el conjunto E es el conjunto de oligonucleotidos que comprende al menos la secuencia minima y/o la secuencia semilla de los microARN identificados en la figura 5,
el conjunto F es el conjunto de oligonucleotidos que comprende al menos la secuencia minima y/o la secuencia semilla de los microARN identificados en la figura 6,
el conjunto G es el conjunto de oligonucleotidos que comprende al menos la secuencia minima y/o la secuencia semilla de los microARN identificados en la figura 7,
el conjunto H es el conjunto de oligonucleotidos que comprende al menos la secuencia minima y/o la secuencia semilla de los microARN identificados en la figura 8,
el conjunto I es el conjunto de oligonucleotidos que comprende al menos la secuencia minima y/o la secuencia semilla de los microARN identificados en la figura 4,
el conjunto J es el conjunto de oligonucleotidos que comprende al menos la secuencia minima y/o la secuencia semilla de los microARN identificados en la figura 5,
el conjunto K es el conjunto de oligonucleotidos que comprende al menos la secuencia minima y/o la secuencia semilla de los microARN identificados en la figura 6,
el conjunto L es el conjunto de oligonucleotidos que comprende al menos la secuencia minima y/o la secuencia semilla de los microARN identificados en la figura 7,
el conjunto M es el conjunto de oligonucleotidos que comprende al menos la secuencia minima y/o la secuencia semilla de los microARN identificados en la figura 8, y
los conjuntos de oligonucleotidos N, O, P, Q y R o sus analogos de acido nucleico, que comprenden secuencias complementarias de todas las secuencias de los conjuntos I, J, K, L y M, respectivamente. El conjunto N asi corresponde al conjunto I, el conjunto O al conjunto J, el conjunto P al conjunto K, el conjunto Q al conjunto L y el conjunto R al conjunto M.
Aspectos preferidos y formas de realization de la invencion
[0075]
Aspecto 1.
5
10
15
20
25
30
35
40
45
50
55
60
65
(1) El aspecto 1 se refiere a una coleccion de oligonucleotidos o sus analogos de acido nucleico seleccionados del grupo que consiste en el conjunto A, conjunto B y conjunto C, donde;
el conjunto A es un conjunto de oligonucleotidos o sus analogos de acido nucleico que comprenden secuencias complementarias de todas las secuencias identificadas en la figura 9,
el conjunto B s un conjunto de oligonucleotidos o sus analogos de acido nucleico que comprenden secuencias complementarias de todas las secuencias del conjunto A y el conjunto C es el conjunto de oligonucleotidos identificado en la figura 9.
Aspecto 2.
(2) El aspecto 2 se refiere a una coleccion de oligonucleotidos o sus analogos de acido nucleico seleccionados del grupo que consiste en los conjuntos D-R, donde;
el conjunto D es el conjunto de oligonucleotidos identificado en la figura 4, el conjunto E es el conjunto de oligonucleotidos identificado en la figura 5, el conjunto F es el conjunto de oligonucleotidos identificado en la figura 6, el conjunto G es el conjunto de oligonucleotidos identificado en la figura 7, el conjunto H es el conjunto de oligonucleotidos identificado en la figura 8, el conjunto I es un conjunto de oligonucleotidos o sus analogos de acido secuencias complementarias de todas las secuencias identificadas en la figura el conjunto J es un conjunto de oligonucleotidos o sus analogos de acido secuencias complementarias de todas las secuencias identificadas en la figura el conjunto K es un conjunto de oligonucleotidos o sus analogos de acido secuencias complementarias de todas las secuencias identificadas en la figura el conjunto L es un conjunto de oligonucleotidos o sus analogos de acido secuencias complementarias de todas las secuencias identificadas en la figura el conjunto M es un conjunto de oligonucleotidos o sus analogos de acido secuencias complementarias de todas las secuencias identificadas en la figura
los conjuntos de oligonucleotidos N, O, P, Q y R o sus analogos de acido nucleico, que comprenden secuencias complementarias de todas las secuencias de los conjuntos I, J, K, L y M, respectivamente.
Aspecto 3.
(3) El aspecto 3 se refiere a un metodo para caracterizar una muestra que comprende acido nucleico derivado de una celula, dicho metodo comprende la determination de si dicha muestra comprende al menos una secuencia minima de al menos un microARN (ARNmi) de la figura 1, o un homologo mamifero de la misma y/o si dicha muestra comprende un ARN en horquilla de la figura 1 o un homologo mamifero de la misma, y la caracterizacion de dicha muestra basandose en la presencia o ausencia de dicho ARNmi o ARN en horquilla.
(4) En una forma de realization preferida del metodo (3), dicho metodo comprende la determinacion de si dicha muestra comprende al menos una secuencia minima de al menos cinco ARNmi de la figura 1 u su homologo mamifero.
(5) En una forma de realizacion preferida del metodo (4) es un metodo donde dichos al menos cinco ARNmi se derivan de un ARNmi precursor diferente (pre-miRNA) y la caracterizacion de dicha muestra basandose en la presencia o ausencia de dicho ARNmi.
(6) Una forma de realizacion preferida del metodo (3), (4) o (5) es un metodo donde dicha muestra comprende acido nucleico de una celula diferenciada.
(7) Una forma de realizacion preferida del metodo (3), (4), (5) o (6) es un metodo donde dicha muestra comprende acido nucleico de una celula embrionaria, o celula madre.
(8) Una forma de realizacion preferida del metodo (3), (4), (5), (6) o (7) es un metodo donde dicha muestra comprende acido nucleico de una celula con un fenotipo de proliferation aberrante.
(9) Una forma de realizacion preferida del metodo (8) es un metodo donde dicha celula es una celula tumoral y/o celula de linea celular.
(10) Una forma de realizacion preferida del metodo (3), (4), (5), (6), (7), (8) o (9) es un metodo donde dicha celula es una celula de pulmon, una celula de piel, una celula cerebral, una celula hepatica, una celula embrionaria, una celula de corazon, o una linea celular embrionaria.
Aspecto 4.
nucleico que comprenden las
4,
nucleico que comprenden las
5,
nucleico que comprenden las
6,
nucleico que comprenden las
7,
nucleico que comprenden las
8, y
5
10
15
20
25
30
35
40
45
50
55
60
65
(11) El aspecto 4 se refiere a un metodo para la determinacion de si una celula de una muestra es diferente de una celula de referencia, que comprende la determinacion de si la expresion de ARNmi de al menos un ARNmi (ARNmi) de la figura 1 o un homologo mamifero del mismo, y/o un ARN en horquilla de la figura 1 o un homologo mamifero del mismo, en dicha celula es diferente cuando se compara con su expresion en dicha celula de referencia.
(12) Una forma de realizacion preferida del metodo (11) es un metodo donde dicha celula es una celula diferenciada.
(13) Una forma de realizacion preferida del metodo (10) o (11) es un metodo donde dicha celula es una celula embrionaria o celula madre.
(14) Una forma de realizacion preferida del metodo (11), (12) o (13) es un metodo donde dicha celula es una celula con un fenotipo de proliferacion aberrante.
(15) Una forma de realizacion preferida del metodo (14) es un metodo donde dicha celula es una celula tumoral y/o celula de linea celular.
(16) Una forma de realizacion preferida del metodo (13), (14) o (15) es un metodo donde dicha celula es una celula de pulmon, una celula de piel, una celula cerebral, una celula hepatica, una celula embrionaria, una celula de corazon, o una linea celular embrionaria.
Aspecto 5.
(17) El aspecto 5 proporciona una molecula de acido nucleico aislado que comprende:
a) una secuencia de nucleotidos como se muestra en la figura 1, y/o
b) una secuencia de nucleotidos que es un complemento de a), y/o
c) una secuencia de nucleotidos que tiene una identidad de al menos 80% con una secuencia ARNmi de la figura 1 o 70% con un ARN en horquilla de la figura 1 y/o
d) una secuencia de nucleotidos que hibridiza bajo condiciones rigurosas a una secuencia de a), b) o c).
(18) En una forma de realizacion preferida, la molecula de acido nucleico (17) es una molecula de acido nucleico donde la identidad de secuencia c) con una secuencia de la figura 1 es de al menos 90%.
(19) En una forma de realizacion preferida, la molecula de acido nucleico (17) o (18) es una molecula de ARNmi o un derivado analogo.
(20) En una forma de realizacion preferida, la molecula de acido nucleico (19) tiene una longitud de 18 a 26 nucleotidos.
(21) En una forma de realizacion preferida, la molecula de acido nucleico (17), (18), (19) o (20) es un pre-ARNmi o una molecula de ADN que codifica la misma.
(22) En una forma de realizacion preferida, la molecula de acido nucleico (21) tiene una longitud de 60-110 nucleotidos.
(23) En una forma de realizacion preferida, la molecula de acido nucleico (17), (18), (19), (20), (21) o (22) es monocatenaria.
(24) En una forma de realizacion preferida, la molecula de acido nucleico (17), (18), (19), (20), (21) o (22) es al menos parcialmente bicatenaria.
(25) En una forma de realizacion preferida, la molecula de acido nucleico (17), (18), (19), (20), (21), (22), (23) o (24) se selecciona de moleculas de ARN, ADN, analogas de acido nucleico o una combination de las mismas.
(26) En una forma de realizacion preferida, la molecula de acido nucleico (25) es una molecula que contiene al menos un analogo de nucleotido modificado.
Aspecto 6.
(27) El aspecto 6 se refiere a un uso de molecula de acido nucleico (17), (18), (19), (20), (21), (22), (23), (24), (25) o (26) en una solicitud terapeutica y/o de diagnostico.
Aspecto 7.
5
10
15
20
25
30
35
40
45
50
55
60
65
(28) El aspecto 7 proporciona una coleccion de moleculas de acido nucleico, que comprenden al menos 5, preferiblemente al menos 10, mas preferiblemente al menos 20 moleculas de acido nucleico que comprenden una secuencia de nucleotidos como se muestra en la figura 1.
Aspecto 8.
(29) El aspecto 8 proporciona una coleccion de moleculas de acido nucleico, que comprende al menos 5, preferiblemente al menos 10, mas preferiblemente al menos 20 moleculas de acido nucleico con una secuencia de nucleotidos que es un complemento de una secuencia de nucleotidos como se muestra en la figura 1, o con una secuencia de nucleotidos que hibridiza bajo condiciones rigurosas a una secuencia de nucleotidos como se muestra en la figura 1.
Aspecto 9.
(30) El aspecto 9 se refiere a un uso de coleccion de moleculas de acido nucleico (28) para el diagnostico del cancer, la cardiopatia, infecciones viricas, susceptibilidad de enfermedad.
(31) Una forma de realizacion preferida es el uso (30) para el diagnostico del cancer, la cardiopatia, infecciones viricas.
Aspecto 10.
(32) El aspecto 10 proporciona un vector de expresion recombinante, que comprende la molecula de acido nucleico (17), (18), (19), (20), (21), (22), (23), (24), (25) o (26).
Aspecto 11.
(33) El aspecto 11 proporciona un conjunto de sondas que comprenden la coleccion de moleculas de acido nucleico (28) o (29) o una combinacion de las mismas.
Aspecto 12.
(34) El aspecto 12 proporciona una matriz que comprende el conjunto de sondas (33).
(35) En una forma de realizacion preferida, la matriz (34) es una micromatriz.
Aspecto 13.
(36) El aspecto 13 se refiere a un uso de conjunto de sondas (33) y/o matriz (34) o (35) en una prueba diagnostica. Aspecto 14.
(37) El aspecto 14 proporciona una composition farmaceutica, que comprende como un agente activo al menos una molecula de acido nucleico del grupo que comprende la molecula de acido nucleico (17)-(26) y opcionalmente un portador farmaceuticamente aceptable.
Aspecto 15
(38) El aspecto 15 se refiere a un uso de composicion farmaceutica (37) o acido nucleico (17), (18), (19), (20), (21), (22), (23), (24), (25) o (26), como un modulador para un trastorno de desarrollo o patogenico.
(39) En una forma de realizacion preferida, el uso (38) es un uso donde dicho trastorno es cancer.
Aspecto 16
(40) El aspecto 16 se refiere a un uso de acido nucleico (17), (18), (19), (20), (21), (22), (23), (24), (25) o (26) para regular negativamente la expresion de un gen.
Aspecto 17
(41) El aspecto 17 se refiere a un uso de acido nucleico (17), (18), (19), (20), (21), (22), (23), (24), (25) o (26) para la remodelacion de la cromatina en una celula.
Aspecto 18
(42) El aspecto 18 se refiere a un uso de acido nucleico (17), (18), (19), (20), (21), (22), (23), (24), (25) o (26) para modular la transcripcion en una celula.
5
10
15
20
25
30
35
40
45
50
55
60
65
Aspecto 19
(43) El aspecto 19 se refiere a un uso de acido nucleico (17), (18), (19), (20), (21), (22), (23), (24), (25) o (26) para la reduccion de la cantidad de proteina producida por un gen en una celula.
Breve descripcion de los dibujos
[0076]
Figura 1: Compilacion de ARNmi y ARN en horquilla y expresion de los mismos. La Figura 1a contiene una explicacion del formato.
Figura 2: resultados de micromatriz RAKE modificada. Los resultados de la hibridacion para un solo tejido positivo (embrion de raton de 8,5 dpc, embrion de 16,5 dpc, celulas madre de cerebro o embrionarias (ES)) de todas sondas en un solapamiento se muestran para cada ARNmi nuevo. Las secuencias en horquilla son mostradas donde los numeros indican el extremo mas '3 de la sonda respectiva en la micromatriz RAKE. Las imagenes pequenas muestran los resultados crudos para las sondas respectivas. Anotacion (cand*** sonda %%) se refiere a la sonda positiva y coincide con la anotacion de evidencia experimental para los ARNmi maduros de la figura 1.
Figura 3. La representation esquematica de ARNmi maduro y el ARN en horquilla correspondiente. El ARNmi se representa como una caja clara y el resto de la horquilla como una (caja/linea) oscura. El esquema no esta a escala.
Figura 4. Lista de numeros de identification de secuencia del listado de secuencias para la secuencia madura de humano mas abundante o mas larga como se determina mediante donation.
Figura 5. Lista de numeros de identificacion de secuencia del listado de secuencias para la secuencia madura de raton mas abundante o mas larga como se determina mediante clonacion.
Figura 6. Lista de numeros de identificacion de secuencia del listado de secuencias de las secuencias maduras de humano de la figura 2 para las que los ortologos de raton tienen evidencia para expresion diferencial en los experimentos RAKE (celulas de embrion de raton 8,5 dpc, de embrion de raton 16,5 dpc, de cerebro de raton, de raton ES). Solo las secuencias maduras que fueron clonadas en humano estan incluidas aqui.
Figura 7. Lista de numeros de identificacion de secuencia de la secuencia que lista las secuencias maduras de raton de la figura 3 que tienen evidencia para expresion diferencial en los experimentos de RAKE (celulas de embrion de raton 8,5 dpc, de embrion de raton 16,5 dpc, de cerebro de raton, de raton ES). Secuencias de sonda que no fueron necesariamente clonadas en el raton estan incluidas.
Figura 8. Lista de numeros de identificacion de secuencia de la secuencias que lista secuencias de microARN maduro de humano que se expresan diferencialmente (mas de 2 veces en aumento o disminucion) en grioblastoma versus tejido cerebral normal o adenoma versus tejido de pulmon normal o en ambos (de las figuras 11 y 12).
Figura 9. Lista de numeros de identificacion de secuencia del listado de secuencias de secuencias de microARN maduro de humano que se expresan diferencialmente (mas de 2 veces en aumento o disminucion) en grioblastoma versus tejido cerebral normal o adenoma versus tejido de pulmon normal (de las figuras 11 y 12).
Figura 10. Imagen en dos colores de parte de los resultados de expresion de la micromatriz cruda para tejido de pulmon normal (rojo) comparado con el material de tumor de adenoma (verde). Los microARN que son sobrerregulados o infrarregulados por el material tumoral aparecen como verde y rojo, respectivamente. Los microARN que no cambian la expresion son amarillos y los microARN no expresados aparecen en negro.
Figura 11. Los microARN expresados de forma diferencial entre glioblastoma y tejido cerebral de control normal.
Figura 12. Los microARN expresados de forma diferencial entre adenoma y tejido de pulmon de control normal.
Ejemplos
Material y metodos
Secuenciacion y analisis de regiones de ARNmi en primates.
[0077] Conjuntos de cebadores anidados para amplification por PCR de regiones de ~700 pb para 144 genes de ARNmi conocidos fueron disenados utilizando la interfaz personalizada para el software primer3
5
10
15
20
25
30
35
40
45
50
55
60
65
(
http://cebadores.niob.knaw:NL). La seleccion de cebadores se baso solamente en secuencias humanas. Los ADNs genomicos de 10 especies de primate (Panel de ADN de repositorio de celulas de envejecimiento PRP00001 del NIA) se compraron de Coriell Cell Repositories (Camden, NJ). Todas las reacciones de la PCR fueron efectuadas en un volumen total de 10 pl con 0,5 unidades de Taq polimerasa (Invitrogen, Carlsbad CA) segun las condiciones del fabricante y las condiciones de ciclo universales (60 segundos 94°C, seguido de 30 ciclos de 94°C durante 20 segundos, 58°C durante 20 segundos y 72°C durante 60 segundos). Los productos de PCR fueron secuenciados desde ambos extremos utilizando un secuenciador capilar ABI3700 (Applied Biosystems, Foster City, CA). Las secuencias fueron recortadas y ensambladas usando el software phred/phrap (Ewing et al., 1998, Gordon et al., 1998) y alineadas usando POA (Lee et al., 2002).
http://cebadores.niob.knaw:NL). La seleccion de cebadores se baso solamente en secuencias humanas. Los ADNs genomicos de 10 especies de primate (Panel de ADN de repositorio de celulas de envejecimiento PRP00001 del NIA) se compraron de Coriell Cell Repositories (Camden, NJ). Todas las reacciones de la PCR fueron efectuadas en un volumen total de 10 pl con 0,5 unidades de Taq polimerasa (Invitrogen, Carlsbad CA) segun las condiciones del fabricante y las condiciones de ciclo universales (60 segundos 94°C, seguido de 30 ciclos de 94°C durante 20 segundos, 58°C durante 20 segundos y 72°C durante 60 segundos). Los productos de PCR fueron secuenciados desde ambos extremos utilizando un secuenciador capilar ABI3700 (Applied Biosystems, Foster City, CA). Las secuencias fueron recortadas y ensambladas usando el software phred/phrap (Ewing et al., 1998, Gordon et al., 1998) y alineadas usando POA (Lee et al., 2002).
Prediccion computacional de genes de ARNmi
[0078] Todos los analisis fueron realizados utilizando software desarrollado en casa (Perl), cuando no se indica lo contrario. Los alineamientos de genoma entero (WGA) para humano (ensamblaje de julio 2003), raton (ensamblaje de octubre 2003) y rata (ensamblaje de junio 2003) fueron descargados del sitio de UCSC Genome Bioinformatics (
http://genoma.uscsc.edu). Primero se seleccionaron los WGAs para bloques que se ajustaban el perfil de conservation tipo ARNmi, es decir, que tenian una region de tallo-bucle conservada de ~100 nt y flancos no conservados de ~50 nt. Tecnicamente, para cada position, primero se calculo el porcentaje de conservacion sobre una ventana deslizante de 15 nt y se asigno un valor de 0 a 9 y 'o', donde 'o' representa 100% de identidad, 9 entre 90 y 100%, etcetera. A continuation, la cadena de conservacion resultante se busco mediante la siguiente expresion regular para definir el perfil de conservacion: /([0-8]{50,60})([o98] {53,260})([0-8]{50,60})/. En la etapa siguiente utilizamos el software RNAfold (Hofacker, 2003) para evaluar el potencial de regiones conservadas para formar estructuras de replegado. Se aceptaron las estructuras secundarias que coinciden con la siguiente expresion regular:
http://genoma.uscsc.edu). Primero se seleccionaron los WGAs para bloques que se ajustaban el perfil de conservation tipo ARNmi, es decir, que tenian una region de tallo-bucle conservada de ~100 nt y flancos no conservados de ~50 nt. Tecnicamente, para cada position, primero se calculo el porcentaje de conservacion sobre una ventana deslizante de 15 nt y se asigno un valor de 0 a 9 y 'o', donde 'o' representa 100% de identidad, 9 entre 90 y 100%, etcetera. A continuation, la cadena de conservacion resultante se busco mediante la siguiente expresion regular para definir el perfil de conservacion: /([0-8]{50,60})([o98] {53,260})([0-8]{50,60})/. En la etapa siguiente utilizamos el software RNAfold (Hofacker, 2003) para evaluar el potencial de regiones conservadas para formar estructuras de replegado. Se aceptaron las estructuras secundarias que coinciden con la siguiente expresion regular:
/((\((?:\.*\(){24,})(\.{2,17}|\.*\({.1,8}\.*\){1,8}\.*\({1,8}\.*\){1,8}\.*)(\)(?:\.*\)){50,}))/ x (datos detallados estan disponibles de los autores bajo petition). Este paso dio como resultado 12.958 regiones candidatas de alineamientos de humano/raton y 12.530 regiones candidatas de alineamientos de humano/rata, que incluyen 167 y 154 ARNmi de humano conocidos, respectivamente. Los WGAs de humano/raton y humano/rata originales contenian 187 y 172 ARNmi de humano anotados (registro de ARNmi v.3.1), respectivamente. Por lo tanto, la sensibilidad combinada de los pasos de perfil de conservacion y seleccion de estructura de repliegue es casi del 90%. No calculamos directamente la aportacion del primer paso, perfil de conservacion, para la filtration de regiones de ARNmi candidatas. Se informo previamente, sin embargo, que aproximadamente 800.000 tallo-bucles podrian ser identificados en las regiones no codificantes de humano/raton conservadas (Lim et al., 2003). Por lo tanto, se puede estimar que el perfil de conservacion es un filtro muy eficaz que elimina mas del 98% de todas estructuras de repliegue potenciales mientras que retiene el 90% de los ARNmi reales. En casos donde las regiones candidatas de superposition fueron predichas en cadenas de ADN diferentes, el candidato con energia de plegado libre mas baja fue seleccionado. Este metodo "ingenuo" identifico correctamente la orientation de 144 ARNmi conocidos de los 165 evaluados (87%).
[0079] Como el tercer paso de filtracion utilizamos una propiedad recientemente descubierta de ARNmi para tener energias libres de plegado mas bajas que las secuencias aleatorias con el mismo contenido de nucleotido (Bonnet et al., 2004). La aplicacion del programa Randfold (filtracion para regiones con p <=0,005) ademas redujo el numero de candidatos 18-veces, a 716 para los conjunto de datos de humano/raton y 639 para los de humano/rata. La sensibilidad de este paso de filtracion, cuando se usa p <= 0,005 corte para valor randfold, es de aproximadamente 85% (143 de 167 ARNmi conocidos retenidos en los conjuntos de datos de humano/raton, y 134 de 154 en los de humano/rata). El valor de corte de 0,005 es muy riguroso pero proporciona una proportion de sensibilidad/especificidad optima para la filtracion.
[0080] A continuacion, se intersectaron predicciones de humano/raton y de humano/rata utilizando coordenadas genomicas humanas y orientacion. Parecio que solo 379 regiones candidatas que incluian 119 ARNmi conocidos, fueron predichas en ambos conjuntos de datos, y una fraction sustancial de las predicciones se establecio especifica, es decir 337 candidatos que incluyen 24 ARNmi conocidos, se encontraron en los WGA de humano/raton pero no en los de humano/rata, mientras que 260 candidatos (incluyendo 15 ARNmi conocidos) fueron encontrados en los conjuntos de datos de humano/rata pero no en los de humano/raton. El analisis detallado de las predicciones no superpuestas revelo que aproximadamente dos tercios de ellas en realidad se podrian mapear para las regiones genomicas correspondientes en las segundas especies de roedor (predicciones de raton para el genoma de rata y viceversa) pero no cumplieron bien el perfil de conservacion o el criterio de randfold (para secuencias de roedor) o sencillamente no estaban presentes en el WGA inicial y por lo tanto no fueron elegidos por nuestra tuberia computacional en un conjunto de datos particular. Este analisis ilustra el valor de los datos de combination de dos especies de roedor en lugar de concentrarse en un conjunto de datos, por ejemplo, de humano/raton.
[0081] En total, identificamos 976 regiones de ARNmi candidatas que cumplen los siguientes criterios: (1) tienen perfiles de conservacion tipo ARNmi caracteristicos en alineamientos de humano/raton o humano/rata; (2) forman estructuras de repliegue de forma, y (3) tienen el valor randfold p <= 0,005 para secuencias tanto de humano como de roedor. Estas 976 regiones candidatas incluyeron 158 ARNmi conocidos (basado en datos del registro de ARNmi v.3.1). Los alineamientos humanos/murinos de genoma entero iniciales, despues combinados, cubrieron 189 ARNmi conocidos.
5
10
15
20
25
30
35
40
45
50
55
60
65
Por lo tanto, la sensibilidad de nuestro analisis, basada en este conjunto de datos, es de 83% (158/189). Al mismo tiempo, la especificidad de las predicciones idealmente deberia ser inferida de verificaciones experimentales de todas las predicciones. Es posible, sin embargo, usar la conservacion de regiones candidatas en genomas adicionales como una medida indirecta de robustez de las predicciones. Usamos genomas de pez cebra, pollo, zarigueya, vaca y perro para buscar ortologos de nuestros candidatos predichos. Dado que los genomas de zarigueya y de vaca no estaban ensamblados en el momento del analisis, se utilizo el software Genotrace (Berezikov et al., 2002) para hacer ensamblajes parciales de regiones de interes a partir de datos de rastreo. La region de un genoma fue considerada como ortologa de la region candidata si tenia (1) al menos 16 coincidencias identicas con la secuencia candidata en un hit de al menos 18 pb de largo, (2) se plego en una horquilla y (3) paso el criterio de randfold de energia libre. Parece que 678 de los 976 candidatos (~70%) se conservan en al menos una especie mas ademas de los roedores.
[0082] Para producir genes de microARN candidatos adicionales, el genoma de raton fue escaneado para horquillas potenciales con una ventana deslizante de 100 nt, y los valores de randfold fueron calculados para horquillas resultantes (redistribution de mononucleotidos, 1000 iteraciones). A partir de un conjunto grande de horquillas que tienen valores de randfold bajos pero que no son conservados necesariamente en otras especies, un subconjunto de 199 fue seleccionado de forma aleatoria.
Caracterizacion de regiones de ARNmi candidatas
[0083] Para poner los candidatos de ARNmi predichos en el contexto genomico, utilizamos la anotacion Ensembl (version 24) del genoma humano. Buscamos nuestros candidatos contra el subconjunto de ARNnc de la base de datos FANTOM (Okazaki et al., 2002) y descubrimos que 3 regiones (cand428, cand523 y cand420) se solapan con o residen junto a los ARN no codificantes. Los datos para matrices de solapamiento Affymetrix de alta resolution (Kapranov et al., 2002) fueron descargados desde el sitio web del UCSC Genome (
http://hgdownload.cse.ucsc.edu/goldenPath/10april2003/database/affyTranscription.txt.gz and affyTransfrags.txt.gz), reasignado al ensamblaje de genoma humano de julio de 2003 e intersectado con predicciones de region candidata. Regiones candidatas que solaparon o residian dentro de los 50 pb de una region Transfrag anotada estaban asociadas a un fragmento de Transfrag dado.
http://hgdownload.cse.ucsc.edu/goldenPath/10april2003/database/affyTranscription.txt.gz and affyTransfrags.txt.gz), reasignado al ensamblaje de genoma humano de julio de 2003 e intersectado con predicciones de region candidata. Regiones candidatas que solaparon o residian dentro de los 50 pb de una region Transfrag anotada estaban asociadas a un fragmento de Transfrag dado.
Analisis de transferencia de Northern de regiones ARNmi predichas
[0084] Se realizo el analisis de transferencia de Northern de 69 candidatos representando subgrupos diferentes de candidatos, tales como conservados ampliamente (pez cebra) o escasamente (roedores solo), reagrupados o en familias, localizados en intrones, exones o intergenicos. Nuestro analisis se limito a la prueba de la expresion de ARNmi en 3 etapas embrionarias de raton (8,5, 12,5 y 16,5 dpc), celulas de raton ES celulas y cerebro de raton. Dado que no se puede predecir la position exacta del ARNmi maduro en un tallo, se usaron sondas de 35 nt de largo que cubrian la mayor parte del brazo de la horquilla. El brazo que contenia una secuencia de ARNmi maduro fue predicho basandose en el nivel de conservacion. Para algunas regiones candidatas ambos brazos de la horquilla fueron evaluadas. Para los candidatos conservados en el pez cebra, tambien realizamos analisis de transferencia de Northern sobre ARN de embriones de pez cebra (7, 14, 21 y 28 dias) y un mutante de Dicer (Wienholds et al., 2003). El ARN fue aislado utilizando el equipo de aislamiento de ARNmi mirVana (Ambion, Austin, TX), separado en geles de poliacrilamida desnaturalizante al 12% junto con marcador de ARN Decadea (Ambion, Austin, TX), transferido por electrotransferencia a membranas de nylon positivamente cargadas (Roche, Basel). Las transferencias fueron hibridizadas durante toda la noche a 37°C con sondas de oligonucleotidos de ADN marcadas radioactivamente (32P) en tampon de Church y Gilbert modificado, se lavaron tres veces con 2 x SSC, 0,1% SDS a 37°C, y se visualizaron utilizando fosfoimagen (Typhoon, Amersham, UK). En algunos casos (cand181 y cand707), las bandas maduras fueron detectadas solo despues de exposition durante una semana a una transferencia, indicando los limites de sensibilidad del analisis de transferencia de Northern.
Diseno y analisis de micromatriz RAKE
[0085] La micromatriz para la verification de microARN candidatos utilizando el ensayo de RAKE fue disenada como
una micromatriz personalizada de 44K (Agilent Technologies, Palo Alto CA, USA). Sondas de 60 meros que estan unidas a la superficie de vidrio con sus extremos 3' fueron disenadas para incluir una secuencia de sonda completamente coincidente de 25 nucleotidos complementaria del microARN predicho con espaciadores universales en cada lado (extremo 5', espaciador 5': CGATCTTT, secuencia de 21 nt complementaria de la region candidata de microARN (solapamiento), espaciador 3': TAGGGTCCGATAAGGGTCAGTGCTCGCTCTA, extremo 3' fijado a la superficie de vidrio). Las tres Ts del espaciador 5' funcionan como un modelo para la extension de microARN mediada por Klenow usando biotina-dATP. Un solapamiento de 11 nucleotidos fue disenado para cubrir el sitio de escision Dicer/Drosha mas probable determinado en 22 nt aguas arriba y aguas abajo desde el bucle terminal extendido para contener al menos 11 nucleotidos no emparejados. Para todos los casos, las sondas fueron disenadas para ambos brazos de la secuencia de horquilla y para 648 candidatos un conjunto adicional de 2 x 11 sondas fue disenado dado que el transcrito originado de la secuencia genomica antisentido tambien puede eficazmente plegarse en una estructura en horquilla estable. Todas las 22/44 sondas para microARN candidato estaban localizadas en agrupaciones en la matriz para excluir efectos regionales de fondo. 10 controles de hibridacion diferentes complementarios de microARN de planta (miR-402, UUCGAGGCCUAUUAAACCUCUG; miR-418, UAAUGU GAU GAU GAAC U GACCU; miR-167,
5
10
15
20
25
30
35
40
45
50
55
60
65
UGAAGCUGCCAGCAUGATCUGG; miR-416, GGUUCGUACGUACACUGUUCAU; miR-173,
UUCGCUUGCAGAGAGAAAUCAC; miR-417, GAAGGUAGUGAAUUUGUUCGAC; miR-163,
GAAGAGGACUUGGAACUUCGAU; miR-419, UUAUGAAUGCUGAGGAUGUUGU; miR-405,
GAGUUGGGUCUAACCCAUAACU; miR-420, UAAACUAAUCACGGAAAUGCAC) estaban representados 10 veces distribuidos de forma aleatoria en la matriz. Las micromatrices fueron escaneadas en un modelo de escaner de Agilent G2565B a 10 pm de resolucion y la identificacion de momento y la determinacion de la intensidad se hizo utilizando el software Agilent Feature Extraction (Image Analysis version A.7.5.1) con ajustes estandar. Para permitir la inspeccion manual y la anotacion de secuencias de microARN maduras, las imagenes crudas y los datos de intensidad de momento fueron procesadas utilizando scripts personalizados y se visualizaron junto con informacion de secuencia de solapamiento. Las interfaces basadas en la Web se disenaron para anotacion de experimentos unicos y para resumir todos los experimentos. Despues de la inspeccion manual, todas las secuencias de microARN maduras nuevas que fueron positivas fueron alimentadas en la tuberia de analisis bioinformatico configurada para la evaluacion de los ARN pequenos clonados, para filtrar la senal que se origina de elementos repetitivos y ARN estructurales y para encontrar ARNmi homologos en otras especies.
Ensayo RAKE modificado
[0086] El ensayo RAKE original (Nelson et al., 2004) fue modificado para su uso con micromatrices impresas personalizadas de alta densidad en la plataforma Agilent. Principalmente, a diferencia de la mayoria de las micromatrices manchadas personalizadas, las sondas impresas personalizadas se fijan con su extremo 3' a la superficie del vidrio. Esto elimina la necesidad de que la exonucleasa que fue incluida en el protocolo original reduzca la senal de fondo de los repliegues de los extremos 3 libres de las sondas que dan como resultado estructuras de DNA bicatenarias que pueden funcionar como un modelo para la extension de Klenow, dando como resultado senal de fondo especifica. Ademas, las condiciones de hibridacion, lavado y de incubacion fueron adaptadas. Todos los tampones de hibridacion y de lavado se hicieron frescos a partir de soluciones madre sometidas a autoclave utilizando agua tratada con DEPC, esterilizada por filtro y precalentada. Las diapositivas y los cubreobjetos de la micromatriz fueron prelavados dos veces durante 2 minutos a 37°C con tampon de lavado precalentado (2 x SSPE, 0,025% N-lauroilsarcosina), seguido de 5 minutos de incubacion con tampon de pre-hibridacion (5 x SSPE, 40% formamida, 0,025% N-lauroilsarcosina). Despues, la camara de hibridacion Agilent fue completamente rellenada con la mezcla de hibridacion, sin dejar burbujas de aire, dado que la burbuja de aire usual para la mezcla no se mueve alrededor a temperatura baja y con la mezcla de hibridacion usada. La mezcla de hibridacion (750 pl total por diapositiva) consiste en 500 pl 1,5 x tampon de hibridacion (7,5 x SSPE, 60% formamida, 0,0375% N-lauroilsarcosina), 10 pl de ARN en espiga (caldo de microARN de planta de control: miR-402, 1 x 10'6 M; miR-418, 3,3 x 10'7 M; miR-167, 1x10'7 M; miR-416, 3,3 x 10'8 M; miR-173, 1 x 10'8 M; miR- 417, 3,3 x 10'9 M; miR-163, 1 x 10'9 M; miR-419, 3,3 x 10'10 M; miR-405, 1 x 10'10 M; miR-420, 3,3 x 10'11 M), y 20 pg de muestra de ARN pequeno (embrion de raton de 8,5 dpc y 16,5 dpc, celulas madre embrionarias de raton (ES) y cerebro total), aislado utilizando el equipo de aislamiento de microARN MirVana (Ambion, Austin Texas, EE.UU.) y suplementado con agua tratada con DEPC hasta 240 pl. La mezcla de hibridacion fue calentada a 75°C durante 5 minutos y enfriada en hielo antes de aplicar a la matriz. La matriz fue incubada durante toda la noche a 37°C, seguido de 4 lavados de 2 minutos en el tampon de lavado y 1 lavado durante 2 minutos en 1 x tampon de Klenow (10 mM Tris pH 7,9, 50 mM NaCl, 10 mM MgCh, 1 mM DTT, 0,025% N-lauroilsarcosina). Para la extension de Klenow, una mezcla enzimatica (750 pl total por diapositiva) conteniendo 375 pl 12 x tampon de Klenow, 365 pl agua tratada con DEPC, 2,5 pl Klenow Exo- (50,000 u/pl, NEB, Ipswich MA, EE.UU.), y 7,5 pl biotina-14-dATP (4 pM materia prima, Perkin Elmer, Wellesley MA, EE.UU.) se aplico a la matriz en una camara de incubacion limpia y se incubo durante 1 hora a 37°C. Despues, la matriz se lavo cuatro veces durante 2 minutos con tampon de lavado y una vez durante 2 minutos con 1 x tampon de Klenow. Despues, la mezcla de conjugation de tinte (volumen total 750 pl) consistente en 375 pl 2 x tampon de Klenow, 368 pl agua tratada con DEPC y 20pl fluor-647 Alexa conjugado con estreptavidina (2 mg/ml materia prima, Invitrogen, Carlsbad CA, EE.UU.) se aplico en una camara de incubacion nueva durante 30 minutos a 37°C, seguido de cuatro lavados de 2 minutos a 37°C con tampon de lavado y 5 sumergidos breves en agua DEPC para eliminar las sales. La diapositivas fueron secadas por centrifugation en un tubo de 50 ml por centrifugation durante 5 minutos a 1000 r.p.m. (180 x g).
[0087] Construccion de la biblioteca de ARN pequeno por clonacion bacteriana y secuenciacion dideoxi de insertos. Siete bibliotecas de ARN pequeno de graduation alta fueron hechas. En resumen, la fraction de ARN pequeno de cerebro de raton adulto (12 semanas) y varios tejidos fetales humanos (17 semanas de desarrollo: cerebro; corazon; piel; pulmon; mezcla 1: tejidos fetales multiples; mezcla 2: higado, estomago, intestino) fue aislada utilizando el equipo de aislamiento de microARN mirVana (Ambion), seguido de un enriquecimiento adicional por escision de la fraccion de 15 a 30 nt de una gel de poliacrilamida. Para sintesis de ADNc, las moleculas ARN de esta fraccion fueron primero sometidos a poliadenilacion usando poli(A)polimerasa de levadura seguido de ligamiento de un oligo enlazador de ARN al fosfato 5' de los ARNmi. La sintesis de ADNc de la primera cadena fue luego realizada utilizando un cebador enlazador de oligo(dT) y transcriptasa inversa M-MLV-RNasa H-. El ADNc resultante fue luego amplificado por PCR durante 15 a 22 ciclos (dependiendo de la calidad y la cantidad de la materia prima), seguido de tratamiento con nucleasa de restriction, purification en gel de la fraccion de 95-110 pb, y donation en los sitios EcoRI y BamHI del vector de plasmido pBSII SK+. Los ligamientos fueron sometidos a electroporation en celulas electrocompetentes TransforMaxTMEC100TM resistente al fago T1 (epicentro), dando como resultado titulos entre 1,2 y 3,3 x 106 clones recombinantes por biblioteca. Un total de 83.328 de colonias fueron automaticamente escogidas en placas de 384 pocillos (Genetix QPix2, New Milton Hampshire, UK) conteniendo 75 pl LB-AMP y dejando crecer durante toda la noche
5
10
15
20
25
30
35
40
45
50
55
60
65
a 37°C con agitacion continua. Todos las etapas de pipeteo siguientes fueron realizadas utilizando robots de manipulacion de liquido (Tecan (Mannedorf, Switzerland) Genesis RSP200 con TeMo96 integrado y velocidad 11 (Menlo Park CA, USA) Vprep con BenchCell 4x). 5 pl de cultivo fue transferido a una placa de PCR de 384 pocillos(Greiner, Mannheim, Alemania) conteniendo 20 pl de agua, y las celulas fueron lisadas por calentamiento durante 15 minutos a 95°C en una maquina de PCR. 1 pl de suspension lisada fue transferida a una placa de 384 pocillos fresca conteniendo 4 pl de mezcla de PCR (concentraciones finales: 0,2 pM M13forward, TGTAAAACGACGGCCAGT; 0,2 pM M13reverse, AGGAAACAGCTATGACCAT, 400 pM de cada dNTP, 25 mM tricina, 7,0% (p/v) de glicerol, 1,6% DMSO (p/v), 2 mM MgCl2, 85 mM de acetato amonico pH 8,7 y 0,2 U Taq polimerasa en un volumen total de 10 pl) y el inserto fue amplificado por 35 ciclos de 20" 94°C, 10" 58°C, 30" 72°C. Despues de la adicion de 30 pl agua, 1 pl de producto de PCR fue directamente usado para secuenciacion dideoxi por transferencia a una placa de PCR nueva de 384 pocillos conteniendo 4 pl de mezcla de secuenciacion (0,027 jul BigDye mezcla terminadora v3.1 (Applied Biosystems, Foster City, CA, EE.UU.), 1,96 pl 2,5 x tampon de dilucion (Applied Biosystems), 0,01 pl oligonucleotidos de secuenciacion (100 pM material T7, GTAATACGACTCACTATAGgGc), y 2 pl agua). El termociclado se realizo durante 35 ciclos de 10" 94°C, 10" 50°C, 20" 60°C y los productos finales fueron purificados por precipitation de etanol en placas de 384 pocillos segun la recomendacion del fabricante (Applied Biosystems) y se analizo en los secuenciadores ABI3730XL con un protocolo modificado para generar lecturas de secuanciacion de aproximadamente 100 nt.
Construccion de biblioteca para secuenciacion masivamente paralela
[0088] Las bibliotecas de ARN pequeno de graduation alta fueron hechas por Vertis Biotechnology AG (Freising- Weihenstephan, Alemania) a partir de cerebro fetal de macho humano y cerebro juvenil de macho chimpance (7 anos). Para el tejido fetal humano, se obtuvo el permiso individual utilizando los procedimientos de consentimiento informado estandar y aprobacion previa del comite de etica del centro medico de la universidad de Utrecht. El material de chimpance se obtuvo a partir de un recurso crioconservado (BPRC). En resumen, la fraction de ARN pequeno de secciones de cerebro de chimpance adulto (lobulo temporal, frontal, y occipital y tronco cerebral) y de cerebro fetal humano (composition mezclada) fue aislada utilizando el equipo de aislamiento de microARN mirVana (Ambion), seguido de un enriquecimiento adicional por escision de la fraccion de 15 a 30 nt de un gel de poliacrilamida. Para sintesis de ADNc las moleculas ARN en esta fraccion fueron primer sometidas a poliadenilacion usando poli(A)polimerasa seguido de ligamiento de adaptador de ARN sintetico al fosfato 5' de los ARNmi. La sintesis de ADNc de primera cadena fue luego realizada utilizando un cebador de oligo(dT)-enlazador y transcriptasa inversa M-MLV- RNasa H-. El ADNc fue amplificado por PCR con cebadores especificos de adaptador y usado en secuenciacion de monomolecula. La secuenciacion paralela masivamente fue realizada por 454 Life Sciences (Branford, EE.UU.) utilizando el sistema Genome Sequencer 20.
Analisis computacional de lecturas de secuenciacion de ARN pequenos clonados
[0089] La llamada a base y el recorte de calidad de los cromatogramas de secuencia se hizo mediante el software Phred (Ewing et al., 1998). Despues de enmascarar las secuencias de vector y de adaptador, y de eliminar la redundancia, los insertos de 18 bases de longitud y mas largos fueron mapeados para genomas (ensamblaje ncbi35 para humano y ensamblaje ncbim34 para raton) usando el software megablast (
ftp://ftp.ncbi.nlm.nih.gov/blast/). No todos los insertos coincidian perfectamente con un genoma, y el analisis detallado de las secuencias no coincidentes indico que muchas de ellas representan microARN conocidos con diferentes nucleotidos adicionales anadidos a uno de sus extremos. Estas secuencias no genomicas pueden ser artefactos del procedimiento de donation o un resultado de modification sin plantilla de microARN maduros (Aravin et al., 2005). Tales secuencias fueron corregidas segun el mejor hit de Blast para un genoma. Despues, para cada locus genomico coincidente con un inserto, anotaciones de repetition fueron recuperadas de la base de datos Ensembl (
http://www.ensembl.org) y regiones repetitivas fueron descartadas de posterior analisis, con la exception de los siguientes repetidores: MIR, MER, L2, MARNA, MON, Arthur y trf, ya que repiten solapamiento de anotaciones con algunos microARN conocidos. Regiones genomicas que contienen insertos con flancos de 100 nt fueron recuperadas de Ensembl y una diapositiva de 100 nt fue usada para calcular estructuras secundarias de ARN por RNAfold (Hofacker, 2003). Solo regiones que se plegaron en horquillas y contenian un inserto en un de los brazos de la horquilla, se usaron en posterior analisis. Dado que insertos no redundantes produjeron hits independientes en esta fase, las horquillas con las coordenadas genomicas de superposition fueron fusionadas en una region, trazando ubicaciones de insertos coincidentes. En los casos en los que diferentes insertos se superponen, la region completa cubierta por insertos de superposicion fue usada en calculos aguas abajo como una secuencia madura. Despues, el gen y las anotaciones de repeticion para regiones genomicas de horquilla se recuperaron de Ensembl, y las regiones repetitivas (con las excepciones anteriormente mencionadas) al igual que ARN ribosomicos, ARNt y ARNs no fueron descartados. Para encontrar horquillas homologas en otros genomas, regiones maduras fueron sometidas a Blast contra genomas de humano, raton, rata, perro, vaca, zarigueya, pollo, pez cebra y fugu. Los hits con longitud de al menos 20 nt e identidad de al menos 70% fueron extraidos de los genomas junto con secuencias flanqueantes de longitud similar a la observada en horquillas originales a las que una determinada secuencia de consulta madura pertenecia. Secuencias extraidas fueron verificadas para estructuras en horquilla usando RNAfold, y las horquillas positivas fueron alineadas con la horquilla original usando Clustalw (Thompson et al., 1994). Solo homologos con al menos 70% de identidad general y 90% de identidad dentro de la secuencia madura fueron considerados. En algunos casos en los que diferentes horquillas homologas en una especie fueron identificadas, la mejor horquilla de marcado de ClustalW fue retenida. Despues, homologos de distintos organismos fueron alineados con la horquilla original por
ftp://ftp.ncbi.nlm.nih.gov/blast/). No todos los insertos coincidian perfectamente con un genoma, y el analisis detallado de las secuencias no coincidentes indico que muchas de ellas representan microARN conocidos con diferentes nucleotidos adicionales anadidos a uno de sus extremos. Estas secuencias no genomicas pueden ser artefactos del procedimiento de donation o un resultado de modification sin plantilla de microARN maduros (Aravin et al., 2005). Tales secuencias fueron corregidas segun el mejor hit de Blast para un genoma. Despues, para cada locus genomico coincidente con un inserto, anotaciones de repetition fueron recuperadas de la base de datos Ensembl (
http://www.ensembl.org) y regiones repetitivas fueron descartadas de posterior analisis, con la exception de los siguientes repetidores: MIR, MER, L2, MARNA, MON, Arthur y trf, ya que repiten solapamiento de anotaciones con algunos microARN conocidos. Regiones genomicas que contienen insertos con flancos de 100 nt fueron recuperadas de Ensembl y una diapositiva de 100 nt fue usada para calcular estructuras secundarias de ARN por RNAfold (Hofacker, 2003). Solo regiones que se plegaron en horquillas y contenian un inserto en un de los brazos de la horquilla, se usaron en posterior analisis. Dado que insertos no redundantes produjeron hits independientes en esta fase, las horquillas con las coordenadas genomicas de superposition fueron fusionadas en una region, trazando ubicaciones de insertos coincidentes. En los casos en los que diferentes insertos se superponen, la region completa cubierta por insertos de superposicion fue usada en calculos aguas abajo como una secuencia madura. Despues, el gen y las anotaciones de repeticion para regiones genomicas de horquilla se recuperaron de Ensembl, y las regiones repetitivas (con las excepciones anteriormente mencionadas) al igual que ARN ribosomicos, ARNt y ARNs no fueron descartados. Para encontrar horquillas homologas en otros genomas, regiones maduras fueron sometidas a Blast contra genomas de humano, raton, rata, perro, vaca, zarigueya, pollo, pez cebra y fugu. Los hits con longitud de al menos 20 nt e identidad de al menos 70% fueron extraidos de los genomas junto con secuencias flanqueantes de longitud similar a la observada en horquillas originales a las que una determinada secuencia de consulta madura pertenecia. Secuencias extraidas fueron verificadas para estructuras en horquilla usando RNAfold, y las horquillas positivas fueron alineadas con la horquilla original usando Clustalw (Thompson et al., 1994). Solo homologos con al menos 70% de identidad general y 90% de identidad dentro de la secuencia madura fueron considerados. En algunos casos en los que diferentes horquillas homologas en una especie fueron identificadas, la mejor horquilla de marcado de ClustalW fue retenida. Despues, homologos de distintos organismos fueron alineados con la horquilla original por
5
10
15
20
25
30
35
40
45
50
55
Clustalw para producir un alineamiento multiple final de la region de horquilla. La ubicacion cromosomica de las secuencias homologas se uso para recuperar anotaciones de gen y de repeticion de las bases de datos de especies respectivas Ensembl. Las horquillas que contenian anotaciones de repeticion/ARN en una de las especies, al igual que las horquillas que contenian regiones maduras mas largas de 25 nt o con contenido GC superior a 85% fueron descartadas. Para las horquillas restantes, los valores randfold fueron calculados para cada secuencia en un alineamiento utilizando redistribution de mononucleotidos y 1000 iteraciones. El corte de 0,01 fue usado para randfold y solo las regiones que contenian una horquilla por debajo de este corte para al menos una especie en un alineamiento, se consideraron como genes de microARN. Finalmente, horquillas positivas fueron divididas en microARN conocidos y nuevos segun las anotaciones. Para facilitar estas anotaciones y tambien para trazar el rendimiento de la tuberia, secuencias maduras de microARN conocidos de miRBase (Griffiths-Jones; 2004) se incluyeron en el analisis.
[0090] Las secuencias obtenidas por pirosecuenciacion masivamente paralela se analizaron con la misma tuberia compuational, pero homologos en otros genomas fueron identificados de forma ligeramente diferente, aunque se usaron parametros similares. Horquillas homologas en otros genomas fueron identificadas comparando las regiones de ARNmi maduro usando BLAST contra el genoma de humano, chimpance, macaco, raton, rata, perro, vaca, zarigueya, pollo, pez cebra, fugu, tetraodon, xenopus, anopheles, drosophila, abeja y ciona. Cuando disponibles, las regiones alineadas BLASTZ NET se recuperaron tambien del Ensembl. Todos los hits coincidentes con al menos 7 nucleotidos continuos empezando desde el 1°, 2 o 3° nucleotido de la secuencia madura fueron extraidos y plegados utilizando el programa RNAshapes (Steffen et al., 2005; diapositivas de 80,100 y 120 nt). Solo las regiones que 1) se plegaron en horquillas con la forma abstracta ' [], 2) tuvieron una probabilidad del plegado mayor de 0,8, y 3) contenian una secuencia homologa en uno de los brazos de la horquilla, fueron usadas en posterior analisis. Despues, la similitud entre todas las horquillas homologas potenciales y la horquilla original fue calculada utilizando el software RNAforester (
http://bibiserv.techfak.uni-bielefeld:de/rnaforester). Si una region alineada BLASTZ NET se plego en una horquilla y tuvo una puntuacion RNAforetsre por encima de 0,3, se asigno como una horquilla ortologa en una especie particular; de otro modo, la horquilla de puntuacion maxima por encima de una puntuacion de 0,3 se definio como un ortologo. Despues, homologos de distintos organistas fueron alineados con la horquilla original por Clustalw (Thompson et al., 1994) para producir un alineamiento multiple final de la region de horquilla. Ubicaciones cromosomicas de secuencias de homologas se usaron para recuperar anotaciones de gen y de repeticion de las especies respectivas en la base de datos Ensembl. Horquillas que contenian anotaciones de repeticion/ARN en una de las especies, al igual que horquillas que contenian regiones maduras mas largas de 25 nt o con contenido GC superior a 85% fueron descartadas. Para las horquillas restantes, se calcularon los valores randfold para cada secuencia en un alineamiento utilizando redistribucion de mononucleotidos y 1000 iteraciones (Bonnet et al., 2004). El corte de 0,005 se uso para randfold y solo las regiones que contenian una horquilla por debajo de este corte para al menos una especie en un alineamiento se consideraron como genes de microARN. Finalmente, las horquillas positivas se dividieron en microARN conocidos y nuevos segun las anotaciones. Para facilitar estas anotaciones y tambien para trazar el rendimiento de la tuberia, las secuencias maduras de microARN conocidos de miRBase v.8.0 (Griffiths-Jones et al., 2006) se incluyeron en el analisis.
http://bibiserv.techfak.uni-bielefeld:de/rnaforester). Si una region alineada BLASTZ NET se plego en una horquilla y tuvo una puntuacion RNAforetsre por encima de 0,3, se asigno como una horquilla ortologa en una especie particular; de otro modo, la horquilla de puntuacion maxima por encima de una puntuacion de 0,3 se definio como un ortologo. Despues, homologos de distintos organistas fueron alineados con la horquilla original por Clustalw (Thompson et al., 1994) para producir un alineamiento multiple final de la region de horquilla. Ubicaciones cromosomicas de secuencias de homologas se usaron para recuperar anotaciones de gen y de repeticion de las especies respectivas en la base de datos Ensembl. Horquillas que contenian anotaciones de repeticion/ARN en una de las especies, al igual que horquillas que contenian regiones maduras mas largas de 25 nt o con contenido GC superior a 85% fueron descartadas. Para las horquillas restantes, se calcularon los valores randfold para cada secuencia en un alineamiento utilizando redistribucion de mononucleotidos y 1000 iteraciones (Bonnet et al., 2004). El corte de 0,005 se uso para randfold y solo las regiones que contenian una horquilla por debajo de este corte para al menos una especie en un alineamiento se consideraron como genes de microARN. Finalmente, las horquillas positivas se dividieron en microARN conocidos y nuevos segun las anotaciones. Para facilitar estas anotaciones y tambien para trazar el rendimiento de la tuberia, las secuencias maduras de microARN conocidos de miRBase v.8.0 (Griffiths-Jones et al., 2006) se incluyeron en el analisis.
Expresion de ARNmi en las muestras de tejido
[0091] Micromatrices personalizadas (Amersham CodeLink) se hicieron por manchado de oligonucleotidos 3'-amino enlazados (60-meros, como se ha descrito anteriormente para las micromatrices Agilent personalizadas) para detection de todos los microARN maduros conocidos y nuevos. En este punto, ya no se necesita ningun solapamiento, dando como resultado una diapositiva con aproximadamente 15.000 puntos que representan el repertorio de ARNmi completo de humano, de raton y de rata en 8-veces. Estas diapositivas fueron hibridizadas con ARN pequeno de corazon de raton y timo de raton (aislado utilizando el equipo de aislamiento de ARN pequeno Ambion MirVana) como se ha descrito anteriormente para las micromatrices Agilent personalizadas. En la tabla a continuation, intensidades normalizadas (valores arbitrarios, promedio de 8 puntos, normalizadas asumiendo una cantidad de total constante de moleculas de microARN por muestra) para timo y corazon se muestran para aquellos ARNmi que se expresan mas de dos veces diferencialmente. Debe observarse que los valores bajos pueden indicar senal de fondo y ausencia de este ARNmi particular en una muestra. Claramente, ocho de 24 ARNmi que se expresan diferencialmente entre el timo y el corazon y por lo tanto proporcionan una firma caracteristica de los tejidos respectivos, son ARNmi nuevos como se describen en la figura 1.
Tabla: expresion de ARNmi como detectada por analisis de micromatriz
- intensidad de senal pliegue
- rango
- ARNmi timo corazon diferencia
- 1
- mmu-mir-133b 0,2767 5,3531 19,3
- 2
- Mmd_532 nuevo 3,5050 0,2970 -11,8
- 3
- mmu-mir-125b 1,3814 11,9810 8,7
5
10
15
20
25
- Tabla: expresion de ARNmi como detectada por analisis de micromatriz
- intensidad de senal pliegue
- rango
- ARNmi timo corazon diferencia
- 4
- mmu-mir-99a 0,8470 6,1479 7,3
- 5
- Mmd_524 nuevo 0,0117 0,0527 4,5
- 6
- Mmd_124 nuevo 0,0094 0,0412 4,4
- 7
- mmu-mir-126 4,2831 16,3321 3,8
- 8
- mmu-mir-145 1,1160 4,1833 3,7
- 9
- mmu-mir-30a 2,1039 7,3289 3,5
- 10
- mmu-mir-150 4,5540 1,4430 -3,2
- 11
- mmu-mir-106a 0,6968 0,2245 -3,1
- 12
- mmu-mir-30e 2,6240 7,6983 2,9
- 13
- Mmd_297 nuevo 0,2878 0,8431 2,9
- 14
- mmu-mir-145 0,5578 1,5293 2,7
- 15
- mmu-mir-21 4,1493 1,5676 -2,6
- 16
- Mmd_254 nuevo 0,0178 0,0461 2,6
- 17
- Mmd_120 nuevo 0,3228 0,1308 -2,5
- 18
- mmu-mir-26a 2,4855 5,9199 2,4
- 19
- mmu-let-7e 1,1802 2,7889 2,4
- 20
- Mmd_45 nuevo 0,3750 0,1599 -2,3
- 21
- Mmd_93 nuevo 0,0239 0,0558 2,3
- 22
- mmu-mir-185 0,6790 1,5214 2,2
- 23
- mmu-mir-149 0,1115 0,2333 2,1
- 24
- mmu-mir-18 1,9616 0,9721 -2,0
Referencias
[0092]
Abbott, A.L., Alvarez-Saavedra, E., Miska, E.A., Lau, N.C., Bartel, D.P., Horvitz, H.R., Ambros, V. (2005). The let-7 microRNA family members mir-48, mir-84 and mir-241 function together to regulate developmental timing in Caenorhabditis elegans. Dev. Cell 9, 403-414.
Alvarez-Garcia, I. & Miska, E. A. MicroRNA functions in animal development and human disease. Development 132, 4653-62 (2005).
Ambros, V. (2004). The functions of animal microRNAs. Nature 431, 350-355.
Ambros, V., Lee, R.C., Lavanway, A., Williams, P.T. and Jewell, D. (2003). MicroRNAs and Other Tiny Endogenous RNAs in C. elegans. Curr Biol 13: 807-18.
Aravin, A. & Tuschl, T. Identification and characterization of small RNAs involved in RNA silencing. FEBS Lett 579, 5830-40 (2005).
Aravin, A.A., Naumova, N.M., Tulin, A.V., Vagin, V.V., Rozovsky, Y.M. and Gvozdev, V.A. (2001). Double-stranded RNA-mediated silencing of genomic tandem repeats and transposable elements in the D. melanogaster germline. Curr Biol 11: 1017-27.
Bagga, S., Bracht, J., Hunter, S., Massirer, K., Holtz, J., Eachus, R., Pasquinelli, A.E. (2005). Regulation by let-7 and lin-4 miRNAs results in target mRNA degradation. Cell 122, 553-563.
5
10
15
20
25
30
35
40
45
50
55
60
65
Bartel, D.P. (2004). MicroRNAs: genomics, biogenesis, mechanism, and function. Cell 116, 281-297.
Bentwich I, Avniel A, Karov Y, Aharonov R, Gilad S, Barad O, Barzilai A, Einat P, Einav U, Meiri E, Sharon E, Spector Y, Bentwich Z. (2005) Identification of hundreds of conserved and nonconserved human microRNAs. Nature Genet. 37, 766-770.
Berezikov, E., Plasterk, R.H. and Cuppen, E. (2002). GENOTRACE: cDNA-based local GENOme assembly from TRACE archives. Bioinformatics 18, 1396-1397.
Berezikov, E., Guryev, V., van de Belt, J., Wienholds, E., Plasterk, R.H., Cuppen, E. (2005). Phylogenetic shadowing and computational identification of human microRNA genes. Cell 120, 21-24.
Bernstein, E., Caudy, A.A., Hammond, S.M. and Hannon, G.J. (2001). Role for a bidentate ribonuclease in the initiation step of RnA interference. Nature 409: 363-6.
Boffelli, D., McAuliffe, J., Ovcharenko, D., Lewis, K.D., Ovcharenko, I., Pachter, L. and Rubin, E.M. (2003). Phylogenetic shadowing of primate sequences to find functional regions of the human genome. Science 299, 13911394.
Bohnsack, M.T., Czaplinski, K. and Gorlich, D. (2004). Exportin 5 is a RanGTP-dependent dsRNA-binding protein that mediates nuclear export of pre-miRNAs. Rna 10: 185-91.
Bonnet, E., Wuyts, J., Rouze, P. and Van De, P.e.Y. (2004). Evidence that microRNA precursors, unlike other noncoding RNAs, have lower folding free energies than random sequences. Bioinformatics 20, 2911-2917.
Brennecke, J., Hipfner, D.R., Stark, A., Russell, R.B. and Cohen, S.M. (2003). bantam encodes a developmentally regulated microRNA that controls cell proliferation and regulates the proapoptotic gene hid in Drosophila. Cell 113: 25-36.
Cai, X., Hagedorn, C.H. and Cullen, B.R. (2004). Human microRNAs are processed from capped, polyadenylated transcripts that can also function as mRNAs. RNA 10, 1957-1966.
Calin, G. A. et al. A MicroRNA signature associated with prognosis and progression in chronic lymphocytic leukemia. N Engl J Med 353, 1793-801 (2005).
Chen, X. (2004). A microRNA as a translational repressor of APETALA2 in Arabidopsis flower development. Science 303: 2022-5.
Ewing, B., Hillier, L., Wendl, M. C. & Green, P. Base-calling of automated sequencer traces using phred. I. Accuracy assessment. Genome Res 8, 175-85 (1998).
Farh, K.K., Grimson, A., Jan, C., Lewis, B.P., Johnston, W.K., Lim, L.P., Burge, C.B., Bartel, D.P. (2005). The widespread impact of mammalian microRNAs on mRNA repression and evolution. Science 310, 1817-1821.
Fire, A., Xu, S., Montgomery, M.K., Kostas, S.A., Driver, S.E. and Mello, C.C. (1998). Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans. Nature 391: 806-11.
Giraldez, A.J., Cinalli, R.M., Glasner, M.E., Enright, A.J., Thomson, J.M., Baskerville, S., Hammond, S.M., Bartel, D.P., Schier, A.F. (2005). MicroRNA regulate brain morphogenesis in zebrafish. Science 308, 833-838.
Gordon, D., Abajian, C. and Green, P. (1998). Consed: a graphical tool for sequence finishing. Genome Res 8, 195-202.
Griffiths-Jones, S. (2004). The microRNA Registry. Nucleic Acids Res 32 Database issue, D109-11.
Griffiths-Jones, S., Grocock, R.J., van Dongen, S., Bateman, A. & Enright, A.J. miRBase: microRNA sequences, targets and gene nomenclature. 2006. Nucleic Acids Res 34, D140-4.
Grishok, A., Pasquinelli, A.E., Conte, D., Li, N., Parrish, S., Ha, I., Baillie, D.L., Fire, A., Ruvkun, G. and Mello, C.C. (2001). Genes and mechanisms related to RNA interference regulate expression of the small temporal RNAs that control C. elegans developmental timing. Cell 106: 23-34.
Hamilton, A.J. and Baulcombe, D.C. (1999). A species of small antisense RNA in posttranscriptional gene silencing in plants. Science 286: 950-2.
5
10
15
20
25
30
35
40
45
50
55
60
65
Hammond, S. M. MicroRNAs as oncogenes. Curr Opin Genet Dev (2005).
He L, Thomson JM, Hemann MT, Hernando-Monge E, Mu D, Goodson S, Powers S, Cordon-Cardo C, Lowe SW, Hannon GJ, Hammond SM. (2005) A microRNA polycistron as a potential human oncogene. Nature 435, 828-33.
Hofacker, I. L. Vienna RNA secondary structure server. Nucleic Acids Res 31, 3429-31 (2003).
Hornstein, E., Mansfield, J.H., Yekta, S., Kuang-Hsien Hu, J., Harfe, B.D., McManus, M.T., Baskerville, S., Bartel, D.P., Tabin, C.J. (2005). The microRNA miR-196 acts upstream of Hoxb8 and Shh in limb development. Nature 438, 671-674.
Hutvagner, G., Mclachlan, J., Pasquinelli, A.E., Balint, E., Tuschl, T. and Zamore, P.D. (2001). A cellular function for the RNA-interference enzyme Dicer in the maturation of the let-7 small temporal RNA. Science 293: 834-8.
Johnson, S.M., Lin, S.Y. and Slack, F.J. (2003). The time of appearance of the C. elegans let-7 microRNA is transcriptionally controlled utilizing a temporal regulatory element in its promoter. Dev Biol 259: 364-79.
Johnston, R.J. and Hobert, O. (2003). A microRNA controlling left/right neuronal asymmetry in Caenorhabditis elegans. Nature 426: 845-9.
Kaprarlov, P., Cawley, S.E., Drenkow, J., Bekiranov, S., Strausberg, R.L., Fodor, S.P. and Gingeras, T.R. (2002). Large-scale transcriptional activity in chromosomes 21 and 22. Science 296, 916-919.
Ketting, R.F., Fischer, S.E., Bernstein, E., Sijen, T., Hannon, G.J. and Plasterk, R.H. (2001). Dicer functions in RNA interference and in synthesis of small RNA involved in developmental timing in C. elegans. Genes Dev. 15: 2654-9.
Khvorova, A., Reynolds, A. and Jayasena, S.D. (2003). Functional siRNAs and miRNAs exhibit strand bias. Cell 115: 209-16.
Lagos-Quintana, M., Rauhut, R., Lendeckel, W. & Tuschl, T. Identification of novel genes coding for small expressed RNAs. Science 294, 853-8 (2001).
Lai, Etc., Tam, B., Rubin, G.M. (2005). Pervasive regulation of Drosophila Notch target genes by GY-box-, Brd-Box- , and K-box-class microRNAs. Genes Dev. 19, 1067-1080.
Lee, R.C., Feinbaum, R.L., Ambros, V. (1993). The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell 75, 843-854.
Lee, C., Grasso, C. and Sharlow, M.F. (2002). Multiple sequence alignment using partial order graphs. Bioinformatics 18, 452-464.
Lee, Y., Ahn, C., Han, J., Choi, H., Kim, J., Yim, J., Lee, J., Provost, P., Radmark, O., Kim, S. and Kim, V.N. (2003). The nuclear RNase III Drosha initiates microRNA processing. Nature 425: 415-9.
Lee, Y., Kim, M., Han, J., Yeom, K.H., Lee, S., Baek, S.H. and Kim, V.N. (2004). MicroRNA genes are transcribed by RNA polymerase II. EMBO J 23, 4051-4060.
Lee, Y.S., Nakahara, K., Pham, J.W., Kim, K., He, Z., Sontheimer, E.J. and Carthew, R.W. (2004). Distinct roles for Drosophila Dicer-1 and Dicer-2 in the siRNA/miRNA silencing pathways. Cell 117: 69-81.
Lewis, B.P., Burge, C.B., Bartel, D.P. (2005). Conserved seed pairing, often flanked by adenosines, indicates that thousands of human genes are microRNA targets. Cell 120, 15-20.
Lim, L.P., Glasner, M.E., Yekta, S., Burge, C.B. and Bartel, D.P. (2003). Vertebrate microRNA genes. Science 299, 1540.
Lim, L.P., Lau, N.C., Garrett-Engele, P., Grimson, A., Schelter, J.M., Castle, J., Bartel, D.P., Linsley, P.S., Johnson, J.M. (2005). Microarray analysis shows that some microRNAs downregulate large numbers of target mRNAs. Nature 433, 769-773.
Lingel, A., Simon, B., Izaurralde, E. and Sattler, M. (2003). Structure and nucleic-acid binding of the Drosophila Argonaute 2 PAZ domain. Nature 426: 465-9.
Lu, J. et al. MicroRNA expression profiles classify human cancers. Nature 435, 834-8 (2005).
5
10
15
20
25
30
35
40
45
50
55
60
65
Lund, E., Guttinger, S., Calado, A., Dahlberg, J.E. and Kutay, U. (2004). Nuclear export of microRNA precursors. Science 303: 95-8.
Ma, J., Ye, K. and Patel, D. (2004). Structural basis for overhang-specific small interfering RNA recognition by the PAZ domain. Nature in press.
Margulies, M. Eghold, M. et al. Genome sequencing in microfabricated high-density picolitre reactors. Nature. 2005 Sep 15; 437(7057):326-7.
Martinez, J. and Tuschl, T. (2004). RISC is a 5' phosphomonoester-producing RNA endonuclease. Genes Dev.
Nelson, P. T. et al. Microarray-based, high-throughput gene expression profiling of microRNAs. Nat Methods 1, 155-61 (2004).
O'Donnell KA, Wentzel EA, Zeller KI, Dang CV, Mendell JT. (2005) c-Myc-regulated microRNAs modulate E2F1 expression. Nature 435:839-43
Ohler, U., Yekta, S., Lim, L.P., Bartel, D.P. and Burge, C.B. (2004). Patterns of flanking sequence conservation and a characteristic upstream motif for microRNA gene identification. RNA 10, 1309-1322.
Okazaki, Y., Furuno, M., Kasukawa, T., Adachi, J., Bono, H., Kondo, S., Nikaido, I., Osato, N., Saito, R., Suzuki, H., Yamanaka, I., Kiyosawa, H., Yagi, K., Tomaru, Y., Hasegawa, Y., Nogami, A., Schonbach, C., Gojobori, T., Baldarelli, R. and Hill, D.P. (2002). Analysis of the mouse transcriptome based on functional annotation of 60,770 full-length cDNAs. Nature 420, 563-573.
Park, W., Li, J., Song, R., Messing, J. and Chen, X. (2002). CARPEL FACTORY, a Dicer homolog, and HEN1, a novel protein, act in microRNA metabolism in Arabidopsis thaliana. Curr Biol 12: 1484-95.
Pham, J.W., Pellino, J.L., Lee, Y.S., Carthew, R.W. and Sontheimer, E.J. (2004). A Dicer-2-dependent 80s complex cleaves targeted mRNAs during RNAi in Drosophila. Cell 117: 83-94.
Pillai, R.S., Bhattacharyya, S.N., Artus, C.G., Zoller, T., Cougot, N., Basyuk, E., Bertrand, E., Filipowicz, W. (2005). Inhibition of translational initiation by let-7 microRNA in human cells. Science 309, 1573-1576.
Poy, M.N., Eliasson, L., Krutzfeldt, J., Kuwajima, S., Ma, X., Macdonald, P.E., Pfeffer, S., Tuschl, T., Rajewsky, N., Rorsman, P. and Stoffel, M. (2004). A pancreatic islet-specific microRNA regulates insulin secretion. Nature 432, 226-230.
Reinhart, B.J. and Bartel, D.P. (2002). Small RNAs correspond to centromere heterochromatic repeats. Science 297: 1831.
Reinhart, B.J., Slack, F.J., Basson, M., Pasquinelli, A.E., Bettinger, J.C., Rougvie, A.E., Horvitz, H.R., Ruvkun, G. (2000). The 21-nucleotide let-7 RNA regulates developmental timing in Caenorhabditis elegans. Nature 403, 901906.
Reinhart, B.J., Weinstein, E.G., Rhoades, M.W., Bartel, B. and Bartel, D.P. (2002). MicroRNAs in plants. Genes Dev 16: 1616-26.
Rodriguez, A., Griffiths-Jones, S., Ashurst, J.L. and Bradley, A. (2004). Identification of Mammalian microRNA Host Genes and Transcription Units. Genome Res 14,1902-1910.
Schwarz, D.S., Hutvagner, G., Du, T., Xu, Z., Aronin, N. and Zamore, P.D. (2003). Asymmetry in the assembly of the RNAi enzyme complex. Cell 115: 199-208.
Schwarz, D.S., Tomari, Y. and Zamore, P.D. (2004). The RNA-Induced Silencing Complex Is a Mg(2+)-Dependent Endonuclease. Curr Biol 14: 787-91.
Song, J.J:, Liu, J., Tolia, N.H., Schneiderman, J., Smith, S.K., Martienssen, R.A., Hannon, G.J. and Joshua-Tor, L. (2003). The crystal structure of the Argonaute2 PAZ domain reveals an RNA binding motif in RNAi effector complexes. Nat Struct Biol 10: 1026-1032.
Stark, A., Brennecke, J., Bushati, N., Russell, R.B., Cohen, S.M. (2005). Animal microRNAs confer robustness to gene expression and have a significant impact on 3'-UTR evolution. Cell 123, 1133-1146.
Steffen, P., Voss, B., Rehmsmeier, M., Reeder, J., Giegerich, R. 2006. RNAshapes: an integrated RNA analysis package based on abstract shapes. Bioinformatics 22:500-3.
31
5
10
15
20
25
30
Thompson, J. D., Higgins, D. G. & Gibson, T. J. CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res 22, 4673-80(1994).
Tomari, Y., Du, T., Haley, B., Schwarz, D.S., Bennett, R., Cook, H.A., Koppetsch, B.S., Theurkauf, W.E. and Zamore, P.D. (2004). RISC assembly defects in the Drosophila RNAi mutant armitage. Cell 116: 831-41.
Wienholds, E., Kloosterman, W.P., Miska, E., Alvarez-.Saavedra, E., Berezikov, E., de Bruijn, E., Horvitz, H.R., Kauppinen, S., Plasterk, R.H. (2005). MicroRNA expression in zebrafish embryonic development. Science 309, 310-311.
Wienholds, E., Koudijs, M.J., van Eeden, F.J., Cuppen, E., Plasterk, R.H. (2003). The microRNA-producing enzyme Dicer 1 is essential for zebrafish development. Nat. Genet. 35, 217-218.
Xie, Z., Johansen, L.K., Gustafson, A.M., Kasschau, K.D., Lellis, A.D., Zilberman, D., Jacobsen, S.E. and Carrington, J.C. (2004). Genetic and Functional Diversification of Small RNA Pathways in Plants. PLoS Biol 2: E104.
Yan, K.S., Yan, S., Farooq, A., Han, A., Zeng, L. and Zhou, M.M. (2003). Structure and conserved RNA binding of the PAZ domain. Nature 426: 468-74.
Yekta, S., Shih, I.H. and Bartel, D.P. (2004). MicroRNA-directed cleavage of HOXB8 mRNA. Science 304: 594-6.
Yi, R., Qin, Y., Macara, I.G. and Cullen, B.R. (2003). Exportin-5 mediates the nuclear export of pre-microRNAs and short hairpin RNAs. Genes Dev 17: 3011-6.
Yoo, A.S., Greenwald, I. (2005). Lin-12/Notch activation leads to microRNA-mediated down-regulation of Vav in C. elegans. Science 310, 1330-1333.
Zhang, H., Kolb, F.A., Jaskiewisz, L., Westhof, E. and Filipowicz, W. (2004). Single processing center models for human Dicer and bacterial RNase III. Cell in press.
Claims (7)
- 51015202530REIVINDICACIONES1. Molecula de acido nucleico aislado donde dicha molecula de acido nucleico es una molecula de ARNmi, pre-ARNmi o ADN que codifica dicho pre-ARNmi, que tiene una longitud de 18 a 26 nucleotidos en el caso de ARNmi o 60-110 nucleotidos en el caso de pre-ARNmi o su secuencia codificante, donde:(a) la secuencia de dicha molecula de acido nucleico comprende una secuencia que codifica un ARNmi seleccionado del grupo que consiste en SEC ID n.°: 9024, 9023 y su secuencia de ribonucleotidos correspondiente,(b) la secuencia de dicha molecula de acido nucleico comprende una secuencia que codifica un pre-ARNmi que consiste en SEC ID n.°: 1862 y su secuencia de ribonucleotidos correspondiente,(c) la secuencia de dicha molecula de acido nucleico es al menos 80% identica a la molecula de acido nucleico de (a) o al menos 70% identica a la molecula de acido nucleico de (b).
- 2. Molecula de acido nucleico segun la reivindicacion 1 que comprende al menos la secuencia minima y/o la secuencia semilla de las secuencias de ARNmi identificadas en la reivindicacion 1(a).
- 3. Molecula de acido nucleico segun la reivindicacion 1 y/o 2 que es monocatenaria.
- 4. Molecula de acido nucleico segun la reivindicacion 1 y/o 2 que es al menos parcialmente bicatenaria.
- 5. Molecula de acido nucleico segun la reivindicacion 1 y/o 2 que es ARN, ADN, un analogo de acido nucleico o una combinacion de los mismos.
- 6. Molecula de acido nucleico segun cualquiera de las reivindicaciones 1-5 que comprende al menos un analogo de nucleotido modificado.
- 7. Molecula de acido nucleico segun cualquiera de las reivindicaciones 1-6 para su uso en una aplicacion de diagnostico.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
WOPCT/NL2006/000010 | 2006-01-10 | ||
PCT/NL2006/000010 WO2007081196A1 (en) | 2006-01-10 | 2006-01-10 | New nucleic acid molecules and collections thereof, their application and identification |
NL2006000491 | 2006-09-29 | ||
WOPCT/NL2006/000491 | 2006-09-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2612903T3 true ES2612903T3 (es) | 2017-05-19 |
Family
ID=38256737
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES11181833.2T Active ES2612903T3 (es) | 2006-01-10 | 2007-01-10 | Moléculas de ácido nucleico y colecciones de las mismas, su aplicación e identificación |
Country Status (7)
Country | Link |
---|---|
US (2) | US8362230B2 (es) |
EP (2) | EP1984497A2 (es) |
JP (1) | JP2009523013A (es) |
AU (1) | AU2007205326B2 (es) |
CA (1) | CA2636607C (es) |
ES (1) | ES2612903T3 (es) |
WO (1) | WO2007081204A2 (es) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8592384B2 (en) | 2005-04-04 | 2013-11-26 | The Board Of Regents Of The University Of Texas System | Micro-RNA's that regulate muscle cells |
EP2631293A3 (en) * | 2005-04-29 | 2013-11-20 | The Rockefeller University | Human microRNAs and methods for inhibiting same |
JP2009523013A (ja) | 2006-01-10 | 2009-06-18 | コニンクリユケ ネーデルランドセ アカデミ ファン ウェテンスハッペン | 新規な核酸分子及びそのコレクション、並びにそれらの用途及び同定方法 |
WO2007081196A1 (en) * | 2006-01-10 | 2007-07-19 | Koninklijke Nederlandse Akademie Van Wetenschappen | New nucleic acid molecules and collections thereof, their application and identification |
AU2007334502B2 (en) * | 2006-12-14 | 2011-12-15 | Novartis Ag | Compositions and methods to treat muscular & cardiovascular disorders |
US20090099034A1 (en) * | 2007-06-07 | 2009-04-16 | Wisconsin Alumni Research Foundation | Reagents and Methods for miRNA Expression Analysis and Identification of Cancer Biomarkers |
US20100063742A1 (en) * | 2008-09-10 | 2010-03-11 | Hart Christopher E | Multi-scale short read assembly |
US20120302626A1 (en) * | 2009-12-04 | 2012-11-29 | Sandeep Dave | Microrna and use thereof in identification of b cell malignancies |
WO2011108930A1 (en) | 2010-03-04 | 2011-09-09 | Interna Technologies Bv | A MiRNA MOLECULE DEFINED BY ITS SOURCE AND ITS DIAGNOSTIC AND THERAPEUTIC USES IN DISEASES OR CONDITIONS ASSOCIATED WITH EMT |
EP3369817A1 (en) | 2010-07-06 | 2018-09-05 | InteRNA Technologies B.V. | Mirna and its diagnostic and therapeutic uses in diseases or conditions associated with melanoma , or in diseases or conditions with activated braf pathway |
EP2474617A1 (en) | 2011-01-11 | 2012-07-11 | InteRNA Technologies BV | Mir for treating neo-angiogenesis |
US9057068B1 (en) * | 2012-04-01 | 2015-06-16 | The Ohio State University | Methods and compositions using miR-3151 in the diagnosis and treatment of cancer |
CN102899405A (zh) * | 2012-09-19 | 2013-01-30 | 杨祚璋 | 检测肺癌肿瘤细胞rna变化的试剂盒 |
WO2015190586A1 (ja) * | 2014-06-13 | 2015-12-17 | 東レ株式会社 | 大腸がんの検出キット又はデバイス及び検出方法 |
CA2951388A1 (en) * | 2014-06-18 | 2015-12-23 | Toray Industries, Inc. | Lung cancer detection kit or device, and detection method |
EP3277844A4 (en) * | 2015-04-01 | 2018-11-07 | Institute Of Environmental Science And Research Limited | Methods and materials for detecting rna sequences |
US20180201937A1 (en) | 2015-08-04 | 2018-07-19 | The University Of Chicago | Inhibitors of cacna1a/alpha1a subunit internal ribosomal entry site (ires) and methods of treating spinocerebellar ataxia type 6 |
AU2018358016A1 (en) | 2017-11-03 | 2020-05-07 | Interna Technologies B.V. | MiRNA molecule, equivalent, antagomir, or source thereof for treating and/or diagnosing a condition and/or a disease associated with neuronal deficiency or for neuronal (re)generation |
CA3242118A1 (en) | 2021-12-22 | 2023-06-29 | Alfica Sehgal | Modulation of gene transcription using antisense oligonucleotides targeting regulatory rnas |
JPWO2024005158A1 (es) * | 2022-06-30 | 2024-01-04 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5989885A (en) * | 1997-01-10 | 1999-11-23 | Myriad Genetics, Inc. | Specific mutations of map kinase 4 (MKK4) in human tumor cell lines identify it as a tumor suppressor in various types of cancer |
WO2003029459A2 (en) * | 2001-09-28 | 2003-04-10 | MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. | Micro-rna molecules |
WO2005111211A2 (en) * | 2004-05-14 | 2005-11-24 | Rosetta Genomics Ltd. | Micronas and uses thereof |
EP2631293A3 (en) * | 2005-04-29 | 2013-11-20 | The Rockefeller University | Human microRNAs and methods for inhibiting same |
US20070161031A1 (en) * | 2005-12-16 | 2007-07-12 | The Board Of Trustees Of The Leland Stanford Junior University | Functional arrays for high throughput characterization of gene expression regulatory elements |
JP2009523013A (ja) | 2006-01-10 | 2009-06-18 | コニンクリユケ ネーデルランドセ アカデミ ファン ウェテンスハッペン | 新規な核酸分子及びそのコレクション、並びにそれらの用途及び同定方法 |
WO2007081196A1 (en) | 2006-01-10 | 2007-07-19 | Koninklijke Nederlandse Akademie Van Wetenschappen | New nucleic acid molecules and collections thereof, their application and identification |
US20130190379A1 (en) * | 2007-07-06 | 2013-07-25 | Edwin Pieter Johan Cuppen | Small rna molecules, precursors thereof, means and methods for detecting them, and uses thereof in typing samples |
-
2007
- 2007-01-10 JP JP2008549442A patent/JP2009523013A/ja active Pending
- 2007-01-10 EP EP07709131A patent/EP1984497A2/en not_active Withdrawn
- 2007-01-10 US US12/087,649 patent/US8362230B2/en not_active Expired - Fee Related
- 2007-01-10 CA CA2636607A patent/CA2636607C/en not_active Expired - Fee Related
- 2007-01-10 EP EP11181833.2A patent/EP2402463B1/en not_active Not-in-force
- 2007-01-10 ES ES11181833.2T patent/ES2612903T3/es active Active
- 2007-01-10 WO PCT/NL2007/000012 patent/WO2007081204A2/en active Application Filing
- 2007-01-10 AU AU2007205326A patent/AU2007205326B2/en not_active Ceased
-
2012
- 2012-12-20 US US13/722,643 patent/US8895720B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP2402463A2 (en) | 2012-01-04 |
AU2007205326B2 (en) | 2013-08-22 |
CA2636607A1 (en) | 2007-07-19 |
EP2402463A3 (en) | 2012-11-28 |
JP2009523013A (ja) | 2009-06-18 |
AU2007205326A1 (en) | 2007-07-19 |
US20130178387A1 (en) | 2013-07-11 |
EP2402463B1 (en) | 2016-11-09 |
US8895720B2 (en) | 2014-11-25 |
WO2007081204A3 (en) | 2008-03-27 |
EP1984497A2 (en) | 2008-10-29 |
US20100035760A1 (en) | 2010-02-11 |
CA2636607C (en) | 2021-05-25 |
WO2007081204A2 (en) | 2007-07-19 |
US8362230B2 (en) | 2013-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2612903T3 (es) | Moléculas de ácido nucleico y colecciones de las mismas, su aplicación e identificación | |
Tomasello et al. | The MicroRNA family gets wider: the IsomiRs classification and role | |
Mahmoudi et al. | MiR-137: an important player in neural development and neoplastic transformation | |
US20150152416A1 (en) | Nucleic acid molecules and collections thereof, their application and modification | |
JP5697297B2 (ja) | マイクロnasおよびその使用 | |
Harfe | MicroRNAs in vertebrate development | |
Mirnezami et al. | MicroRNAs: key players in carcinogenesis and novel therapeutic targets | |
Wu et al. | MicroRNA and cancer: Current status and prospective | |
Esquela-Kerscher et al. | Oncomirs—microRNAs with a role in cancer | |
CA2673793C (en) | Micrornas for diagnosis and treatment of cancer | |
Ahmed | Role of miRNA in carcinogenesis and biomarker selection: a methodological view | |
Zhu et al. | Identification of common carp (Cyprinus carpio) microRNAs and microRNA-related SNPs | |
Pizzimenti et al. | MicroRNA expression changes during human leukemic HL-60 cell differentiation induced by 4-hydroxynonenal, a product of lipid peroxidation | |
Sedani et al. | An emerging role for microRNAs in NF1 tumorigenesis | |
Võsa | MicroRNAs in disease and health: aberrant regulation in lung cancer and association with genomic variation | |
US20210238593A1 (en) | Micrornas as therapeutic targets for ischemic stroke | |
He et al. | MicroRNA and esophageal carcinoma | |
Abba et al. | MicroRNAs as regulatory molecules in cancer: a focus on models defining miRNA functions | |
Wang et al. | Recent patents on the identification and clinical application of microRNAs and target genes | |
Behera et al. | N. Rajesh, Manoj Kumar Gupta, Ravindra Donde, S. Sabarinathan, Gayatri Gouda, Goutam Kumar Dash, Menaka Ponnana | |
Baba et al. | MicroRNAs as Early Detection Biomarker in Cancer | |
Thomson et al. | Micro‐RNAs as Oncogenes and Tumour Suppressors | |
Agrawal et al. | Micro RNA and non-coding DNA and repeats | |
Flanagan et al. | MicroRNA and NF1 Tumorigenesis | |
McLoughlin | Microrna regulation of central nervous system development and their species-specific role in evolution |