CN116042611A - 编辑rna的方法和组合物 - Google Patents
编辑rna的方法和组合物 Download PDFInfo
- Publication number
- CN116042611A CN116042611A CN202210740517.9A CN202210740517A CN116042611A CN 116042611 A CN116042611 A CN 116042611A CN 202210740517 A CN202210740517 A CN 202210740517A CN 116042611 A CN116042611 A CN 116042611A
- Authority
- CN
- China
- Prior art keywords
- rna
- target
- editing
- adar
- target rna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 284
- 239000000203 mixture Substances 0.000 title claims abstract description 22
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 claims abstract description 256
- 239000002126 C01EB10 - Adenosine Substances 0.000 claims abstract description 127
- 229960005305 adenosine Drugs 0.000 claims abstract description 127
- 230000007115 recruitment Effects 0.000 claims abstract description 33
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 776
- 210000004027 cell Anatomy 0.000 claims description 446
- 108020004414 DNA Proteins 0.000 claims description 232
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 171
- 108090000623 proteins and genes Proteins 0.000 claims description 135
- 230000035772 mutation Effects 0.000 claims description 118
- 125000003729 nucleotide group Chemical group 0.000 claims description 114
- 239000002773 nucleotide Substances 0.000 claims description 108
- 201000010099 disease Diseases 0.000 claims description 103
- 102000004169 proteins and genes Human genes 0.000 claims description 102
- 102000040650 (ribonucleotides)n+m Human genes 0.000 claims description 90
- 239000003184 complementary RNA Substances 0.000 claims description 76
- 108020004394 Complementary RNA Proteins 0.000 claims description 74
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 claims description 70
- 208000035475 disorder Diseases 0.000 claims description 68
- 102100029791 Double-stranded RNA-specific adenosine deaminase Human genes 0.000 claims description 67
- 108020004999 messenger RNA Proteins 0.000 claims description 54
- 239000013612 plasmid Substances 0.000 claims description 51
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 claims description 46
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 claims description 41
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 claims description 41
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 claims description 41
- 102100035028 Alpha-L-iduronidase Human genes 0.000 claims description 40
- 238000006481 deamination reaction Methods 0.000 claims description 35
- 230000009615 deamination Effects 0.000 claims description 34
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 33
- 239000004135 Bone phosphate Substances 0.000 claims description 32
- 102100038191 Double-stranded RNA-specific editase 1 Human genes 0.000 claims description 32
- 101000742223 Homo sapiens Double-stranded RNA-specific editase 1 Proteins 0.000 claims description 31
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 claims description 30
- 230000000295 complement effect Effects 0.000 claims description 30
- 101001019502 Homo sapiens Alpha-L-iduronidase Proteins 0.000 claims description 28
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 claims description 25
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 claims description 25
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 claims description 24
- 102000055025 Adenosine deaminases Human genes 0.000 claims description 24
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 claims description 23
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 claims description 23
- 229940029575 guanosine Drugs 0.000 claims description 23
- 102100024692 Double-stranded RNA-specific editase B2 Human genes 0.000 claims description 21
- 101000686486 Homo sapiens Double-stranded RNA-specific editase B2 Proteins 0.000 claims description 21
- 230000001594 aberrant effect Effects 0.000 claims description 21
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 21
- 108020004485 Nonsense Codon Proteins 0.000 claims description 20
- 239000013603 viral vector Substances 0.000 claims description 20
- 210000004962 mammalian cell Anatomy 0.000 claims description 19
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 claims description 15
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 claims description 15
- 229940045145 uridine Drugs 0.000 claims description 15
- 206010056886 Mucopolysaccharidosis I Diseases 0.000 claims description 14
- 208000026350 Inborn Genetic disease Diseases 0.000 claims description 13
- 208000016361 genetic disease Diseases 0.000 claims description 13
- 102000014150 Interferons Human genes 0.000 claims description 10
- 108010050904 Interferons Proteins 0.000 claims description 10
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 10
- 229940079322 interferon Drugs 0.000 claims description 10
- 208000011580 syndromic disease Diseases 0.000 claims description 10
- 206010069754 Acquired gene mutation Diseases 0.000 claims description 8
- 102100025422 Bone morphogenetic protein receptor type-2 Human genes 0.000 claims description 8
- 102100026234 Cytokine receptor common subunit gamma Human genes 0.000 claims description 8
- 101000934635 Homo sapiens Bone morphogenetic protein receptor type-2 Proteins 0.000 claims description 8
- 101001055227 Homo sapiens Cytokine receptor common subunit gamma Proteins 0.000 claims description 8
- 101000982032 Homo sapiens Myosin-binding protein C, cardiac-type Proteins 0.000 claims description 8
- 208000024556 Mendelian disease Diseases 0.000 claims description 8
- 102100026771 Myosin-binding protein C, cardiac-type Human genes 0.000 claims description 8
- 206010028980 Neoplasm Diseases 0.000 claims description 8
- 229910052770 Uranium Inorganic materials 0.000 claims description 8
- 108091032955 Bacterial small RNA Proteins 0.000 claims description 7
- 102100031611 Collagen alpha-1(III) chain Human genes 0.000 claims description 7
- 101000993285 Homo sapiens Collagen alpha-1(III) chain Proteins 0.000 claims description 7
- 208000028781 Mucopolysaccharidosis type 1 Diseases 0.000 claims description 7
- 108091046869 Telomeric non-coding RNA Proteins 0.000 claims description 7
- 108020004566 Transfer RNA Proteins 0.000 claims description 7
- 201000011510 cancer Diseases 0.000 claims description 7
- 239000003112 inhibitor Substances 0.000 claims description 7
- 108020004418 ribosomal RNA Proteins 0.000 claims description 7
- 208000031309 Hypertrophic Familial Cardiomyopathy Diseases 0.000 claims description 5
- 201000006692 familial hypertrophic cardiomyopathy Diseases 0.000 claims description 5
- 206010053138 Congenital aplastic anaemia Diseases 0.000 claims description 4
- 201000004939 Fanconi anemia Diseases 0.000 claims description 4
- 210000001766 X chromosome Anatomy 0.000 claims description 4
- 230000028993 immune response Effects 0.000 claims description 4
- 208000030683 polygenic disease Diseases 0.000 claims description 4
- 208000002491 severe combined immunodeficiency Diseases 0.000 claims description 4
- 208000002197 Ehlers-Danlos syndrome Diseases 0.000 claims 1
- 201000008645 Joubert syndrome Diseases 0.000 claims 1
- 230000026279 RNA modification Effects 0.000 abstract description 107
- 238000010357 RNA editing Methods 0.000 abstract description 106
- 235000018102 proteins Nutrition 0.000 description 94
- 230000014509 gene expression Effects 0.000 description 76
- 230000000694 effects Effects 0.000 description 63
- 230000008685 targeting Effects 0.000 description 53
- 101000611202 Homo sapiens Peptidyl-prolyl cis-trans isomerase B Proteins 0.000 description 50
- 102100040283 Peptidyl-prolyl cis-trans isomerase B Human genes 0.000 description 50
- 150000007523 nucleic acids Chemical class 0.000 description 38
- 238000004458 analytical method Methods 0.000 description 33
- 230000000875 corresponding effect Effects 0.000 description 33
- 239000013598 vector Substances 0.000 description 31
- 102000039446 nucleic acids Human genes 0.000 description 30
- 108020004707 nucleic acids Proteins 0.000 description 30
- 230000004048 modification Effects 0.000 description 28
- 238000012986 modification Methods 0.000 description 28
- 238000004519 manufacturing process Methods 0.000 description 22
- 150000003838 adenosines Chemical class 0.000 description 21
- 108010027673 Fanconi Anemia Complementation Group C protein Proteins 0.000 description 19
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 19
- 238000012163 sequencing technique Methods 0.000 description 19
- 102000018825 Fanconi Anemia Complementation Group C protein Human genes 0.000 description 18
- 102100030708 GTPase KRas Human genes 0.000 description 18
- 238000012350 deep sequencing Methods 0.000 description 18
- 238000013461 design Methods 0.000 description 18
- 238000004520 electroporation Methods 0.000 description 18
- 238000001890 transfection Methods 0.000 description 18
- 239000002299 complementary DNA Substances 0.000 description 17
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 17
- 210000002950 fibroblast Anatomy 0.000 description 16
- 239000000047 product Substances 0.000 description 16
- 229930024421 Adenine Natural products 0.000 description 15
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 15
- 229930010555 Inosine Natural products 0.000 description 15
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 15
- 229960000643 adenine Drugs 0.000 description 15
- 229960003786 inosine Drugs 0.000 description 15
- 230000001717 pathogenic effect Effects 0.000 description 15
- 238000012360 testing method Methods 0.000 description 15
- 230000001225 therapeutic effect Effects 0.000 description 15
- 108020005004 Guide RNA Proteins 0.000 description 14
- 241000699666 Mus <mouse, genus> Species 0.000 description 14
- 238000007481 next generation sequencing Methods 0.000 description 14
- 108010003381 Iduronidase Proteins 0.000 description 13
- 241000699670 Mus sp. Species 0.000 description 13
- 102100022596 Tyrosine-protein kinase ABL1 Human genes 0.000 description 13
- 101710098624 Tyrosine-protein kinase ABL1 Proteins 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 210000005260 human cell Anatomy 0.000 description 13
- 230000001404 mediated effect Effects 0.000 description 13
- 230000001105 regulatory effect Effects 0.000 description 13
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 12
- 101001024630 Drosophila melanogaster RNA cytidine acetyltransferase Proteins 0.000 description 12
- 101000652705 Drosophila melanogaster Transcription initiation factor TFIID subunit 4 Proteins 0.000 description 12
- 101000721661 Homo sapiens Cellular tumor antigen p53 Proteins 0.000 description 12
- 101000873927 Homo sapiens Squamous cell carcinoma antigen recognized by T-cells 3 Proteins 0.000 description 12
- 108091034117 Oligonucleotide Proteins 0.000 description 12
- 101000996915 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Nucleoporin NSP1 Proteins 0.000 description 12
- 102100035748 Squamous cell carcinoma antigen recognized by T-cells 3 Human genes 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 12
- 230000009977 dual effect Effects 0.000 description 12
- 238000002474 experimental method Methods 0.000 description 12
- 238000001262 western blot Methods 0.000 description 12
- 230000003197 catalytic effect Effects 0.000 description 11
- 238000009396 hybridization Methods 0.000 description 11
- 108090000765 processed proteins & peptides Proteins 0.000 description 11
- 229920002430 Fibre-reinforced plastic Polymers 0.000 description 10
- 239000002131 composite material Substances 0.000 description 10
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 10
- 239000011151 fibre-reinforced plastic Substances 0.000 description 10
- 238000010362 genome editing Methods 0.000 description 10
- 230000002018 overexpression Effects 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- 206010059866 Drug resistance Diseases 0.000 description 9
- 238000012413 Fluorescence activated cell sorting analysis Methods 0.000 description 9
- 208000015178 Hurler syndrome Diseases 0.000 description 9
- 238000003559 RNA-seq method Methods 0.000 description 9
- 239000002609 medium Substances 0.000 description 9
- 229920001184 polypeptide Polymers 0.000 description 9
- 102000004196 processed proteins & peptides Human genes 0.000 description 9
- 230000002103 transcriptional effect Effects 0.000 description 9
- 239000012096 transfection reagent Substances 0.000 description 9
- 108020005067 RNA Splice Sites Proteins 0.000 description 8
- 230000027455 binding Effects 0.000 description 8
- 239000000872 buffer Substances 0.000 description 8
- 210000004986 primary T-cell Anatomy 0.000 description 8
- 238000011002 quantification Methods 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 238000011160 research Methods 0.000 description 8
- 238000007480 sanger sequencing Methods 0.000 description 8
- 239000000758 substrate Substances 0.000 description 8
- 238000002560 therapeutic procedure Methods 0.000 description 8
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 8
- 230000003612 virological effect Effects 0.000 description 8
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- 102100028089 RING finger protein 112 Human genes 0.000 description 7
- 108091030071 RNAI Proteins 0.000 description 7
- 102000004243 Tubulin Human genes 0.000 description 7
- 108090000704 Tubulin Proteins 0.000 description 7
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 7
- 238000003556 assay Methods 0.000 description 7
- 208000036815 beta tubulin Diseases 0.000 description 7
- 210000000424 bronchial epithelial cell Anatomy 0.000 description 7
- 238000012937 correction Methods 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 7
- 239000012091 fetal bovine serum Substances 0.000 description 7
- 230000009368 gene silencing by RNA Effects 0.000 description 7
- 238000001727 in vivo Methods 0.000 description 7
- 230000009437 off-target effect Effects 0.000 description 7
- 238000003753 real-time PCR Methods 0.000 description 7
- 238000011084 recovery Methods 0.000 description 7
- 238000003757 reverse transcription PCR Methods 0.000 description 7
- 108010085238 Actins Proteins 0.000 description 6
- 108091033409 CRISPR Proteins 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 6
- 101000833492 Homo sapiens Jouberin Proteins 0.000 description 6
- 102000004889 Interleukin-6 Human genes 0.000 description 6
- 108090001005 Interleukin-6 Proteins 0.000 description 6
- 102100024407 Jouberin Human genes 0.000 description 6
- 241000713666 Lentivirus Species 0.000 description 6
- 239000005089 Luciferase Substances 0.000 description 6
- 238000000692 Student's t-test Methods 0.000 description 6
- 108020005038 Terminator Codon Proteins 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- 239000000074 antisense oligonucleotide Substances 0.000 description 6
- 238000012230 antisense oligonucleotides Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 108020001507 fusion proteins Proteins 0.000 description 6
- 102000037865 fusion proteins Human genes 0.000 description 6
- 229940100601 interleukin-6 Drugs 0.000 description 6
- 210000004072 lung Anatomy 0.000 description 6
- 239000008194 pharmaceutical composition Substances 0.000 description 6
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 5
- 241000196324 Embryophyta Species 0.000 description 5
- 108010029485 Protein Isoforms Proteins 0.000 description 5
- 102000001708 Protein Isoforms Human genes 0.000 description 5
- -1 about 50% Chemical class 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 5
- 238000007385 chemical modification Methods 0.000 description 5
- 229940104302 cytosine Drugs 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 230000005014 ectopic expression Effects 0.000 description 5
- 229910052739 hydrogen Inorganic materials 0.000 description 5
- 239000001257 hydrogen Substances 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 108091070501 miRNA Proteins 0.000 description 5
- 239000002679 microRNA Substances 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 229940115272 polyinosinic:polycytidylic acid Drugs 0.000 description 5
- 125000006850 spacer group Chemical group 0.000 description 5
- 208000024891 symptom Diseases 0.000 description 5
- 102100022900 Actin, cytoplasmic 1 Human genes 0.000 description 4
- 238000010453 CRISPR/Cas method Methods 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 238000002123 RNA extraction Methods 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 150000001413 amino acids Chemical class 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 238000012761 co-transfection Methods 0.000 description 4
- 239000012636 effector Substances 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 230000005847 immunogenicity Effects 0.000 description 4
- 238000002347 injection Methods 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- 230000015788 innate immune response Effects 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 238000004020 luminiscence type Methods 0.000 description 4
- 102000040430 polynucleotide Human genes 0.000 description 4
- 108091033319 polynucleotide Proteins 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 239000013641 positive control Substances 0.000 description 4
- 101150105899 ppiB gene Proteins 0.000 description 4
- 210000001236 prokaryotic cell Anatomy 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 230000003007 single stranded DNA break Effects 0.000 description 4
- 229960005322 streptomycin Drugs 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 238000010361 transduction Methods 0.000 description 4
- 230000026683 transduction Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 3
- 238000010354 CRISPR gene editing Methods 0.000 description 3
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 3
- 101150022680 IDUA gene Proteins 0.000 description 3
- 101150105104 Kras gene Proteins 0.000 description 3
- 108091027974 Mature messenger RNA Proteins 0.000 description 3
- 102100025725 Mothers against decapentaplegic homolog 4 Human genes 0.000 description 3
- 101710143112 Mothers against decapentaplegic homolog 4 Proteins 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 3
- 108020004459 Small interfering RNA Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 108091028113 Trans-activating crRNA Proteins 0.000 description 3
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 3
- 101150063416 add gene Proteins 0.000 description 3
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 3
- 229940024606 amino acid Drugs 0.000 description 3
- 235000001014 amino acid Nutrition 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 229910002091 carbon monoxide Inorganic materials 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 210000003169 central nervous system Anatomy 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000009274 differential gene expression Effects 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 239000002502 liposome Substances 0.000 description 3
- 210000004185 liver Anatomy 0.000 description 3
- 230000017156 mRNA modification Effects 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 239000002777 nucleoside Substances 0.000 description 3
- 238000004806 packaging method and process Methods 0.000 description 3
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 3
- 239000000546 pharmaceutical excipient Substances 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 229950010131 puromycin Drugs 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 239000004055 small Interfering RNA Substances 0.000 description 3
- 239000003381 stabilizer Substances 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- HSHNITRMYYLLCV-UHFFFAOYSA-N 4-methylumbelliferone Chemical compound C1=C(O)C=CC2=C1OC(=O)C=C2C HSHNITRMYYLLCV-UHFFFAOYSA-N 0.000 description 2
- 108091023043 Alu Element Proteins 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- 206010010356 Congenital anomaly Diseases 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 230000007018 DNA scission Effects 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 102000002227 Interferon Type I Human genes 0.000 description 2
- 108010014726 Interferon Type I Proteins 0.000 description 2
- 241000254158 Lampyridae Species 0.000 description 2
- 108060001084 Luciferase Proteins 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 101100468236 Mus musculus Adarb1 gene Proteins 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 239000002033 PVDF binder Substances 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Natural products OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 241000242739 Renilla Species 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- 239000013504 Triton X-100 Substances 0.000 description 2
- 229920004890 Triton X-100 Polymers 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 241000269370 Xenopus <genus> Species 0.000 description 2
- 239000008228 bacteriostatic water for injection Substances 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000012888 bovine serum Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 108020001778 catalytic domains Proteins 0.000 description 2
- YCIMNLLNPGFGHC-UHFFFAOYSA-N catechol Chemical compound OC1=CC=CC=C1O YCIMNLLNPGFGHC-UHFFFAOYSA-N 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 210000001638 cerebellum Anatomy 0.000 description 2
- 230000004186 co-expression Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 230000008519 endogenous mechanism Effects 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000003205 genotyping method Methods 0.000 description 2
- 210000003494 hepatocyte Anatomy 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- RLSSMJSEOOYNOY-UHFFFAOYSA-N m-cresol Chemical compound CC1=CC=CC(O)=C1 RLSSMJSEOOYNOY-UHFFFAOYSA-N 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 230000000051 modifying effect Effects 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 108700007502 mouse ADAR1 Proteins 0.000 description 2
- 108700007949 mouse ADAR2 Proteins 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 230000006780 non-homologous end joining Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- AQIXEPGDORPWBJ-UHFFFAOYSA-N pentan-3-ol Chemical compound CCC(O)CC AQIXEPGDORPWBJ-UHFFFAOYSA-N 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 2
- 230000004853 protein function Effects 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- GHMLBKRAJCXXBS-UHFFFAOYSA-N resorcinol Chemical compound OC1=CC=CC(O)=C1 GHMLBKRAJCXXBS-UHFFFAOYSA-N 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 230000000087 stabilizing effect Effects 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000009966 trimming Methods 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 210000003462 vein Anatomy 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 229920002799 BoPET Polymers 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 102100027098 CMP-N-acetylneuraminate-beta-galactosamide-alpha-2,3-sialyltransferase 1 Human genes 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 102100025473 Carcinoembryonic antigen-related cell adhesion molecule 6 Human genes 0.000 description 1
- 206010007269 Carcinogenicity Diseases 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 206010010099 Combined immunodeficiency Diseases 0.000 description 1
- 102100026846 Cytidine deaminase Human genes 0.000 description 1
- 108010031325 Cytidine deaminase Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 230000022963 DNA damage response, signal transduction by p53 class mediator Effects 0.000 description 1
- 238000010442 DNA editing Methods 0.000 description 1
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- 208000035240 Disease Resistance Diseases 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 102100032020 EH domain-containing protein 2 Human genes 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 108091007413 Extracellular RNA Proteins 0.000 description 1
- 208000004248 Familial Primary Pulmonary Hypertension Diseases 0.000 description 1
- 101150065330 Fancc gene Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 238000000729 Fisher's exact test Methods 0.000 description 1
- 101150112014 Gapdh gene Proteins 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 229920002683 Glycosaminoglycan Polymers 0.000 description 1
- 101000836774 Homo sapiens CMP-N-acetylneuraminate-beta-galactosamide-alpha-2,3-sialyltransferase 1 Proteins 0.000 description 1
- 101000921226 Homo sapiens EH domain-containing protein 2 Proteins 0.000 description 1
- 101000926535 Homo sapiens Interferon-induced, double-stranded RNA-activated protein kinase Proteins 0.000 description 1
- 101000708835 Homo sapiens SET and MYND domain-containing protein 4 Proteins 0.000 description 1
- 101000708766 Homo sapiens Structural maintenance of chromosomes protein 3 Proteins 0.000 description 1
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 description 1
- 101000891092 Homo sapiens TAR DNA-binding protein 43 Proteins 0.000 description 1
- 101000662708 Homo sapiens Trafficking protein particle complex subunit 12 Proteins 0.000 description 1
- 101000855037 Homo sapiens WD repeat-containing protein 73 Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 208000020875 Idiopathic pulmonary arterial hypertension Diseases 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical class C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102000003996 Interferon-beta Human genes 0.000 description 1
- 108090000467 Interferon-beta Proteins 0.000 description 1
- 102100034170 Interferon-induced, double-stranded RNA-activated protein kinase Human genes 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 208000034578 Multiple myelomas Diseases 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 101100066898 Mus musculus Flna gene Proteins 0.000 description 1
- 239000005041 Mylar™ Substances 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 1
- 239000012124 Opti-MEM Substances 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 101000921214 Oryza sativa subsp. japonica Protein EARLY HEADING DATE 2 Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 206010064911 Pulmonary arterial hypertension Diseases 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 108010052090 Renilla Luciferases Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 102100032725 SET and MYND domain-containing protein 4 Human genes 0.000 description 1
- 101150019443 SMAD4 gene Proteins 0.000 description 1
- 201000002883 Scheie syndrome Diseases 0.000 description 1
- 241000221016 Schoepfia arenaria Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108091007415 Small Cajal body-specific RNA Proteins 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 1
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 1
- 239000004280 Sodium formate Substances 0.000 description 1
- 102100032723 Structural maintenance of chromosomes protein 3 Human genes 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 description 1
- 102100040347 TAR DNA-binding protein 43 Human genes 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical group OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 102100037451 Trafficking protein particle complex subunit 12 Human genes 0.000 description 1
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 241000586263 Tuoba Species 0.000 description 1
- 108010064978 Type II Site-Specific Deoxyribonucleases Proteins 0.000 description 1
- 102100020717 WD repeat-containing protein 73 Human genes 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 229960001040 ammonium chloride Drugs 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 229960005070 ascorbic acid Drugs 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 230000008970 bacterial immunity Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 229960000686 benzalkonium chloride Drugs 0.000 description 1
- UREZNYTWGJKWBI-UHFFFAOYSA-M benzethonium chloride Chemical compound [Cl-].C1=CC(C(C)(C)CC(C)(C)C)=CC=C1OCCOCC[N+](C)(C)CC1=CC=CC=C1 UREZNYTWGJKWBI-UHFFFAOYSA-M 0.000 description 1
- 229960001950 benzethonium chloride Drugs 0.000 description 1
- CADWTSSKOVRVJC-UHFFFAOYSA-N benzyl(dimethyl)azanium;chloride Chemical compound [Cl-].C[NH+](C)CC1=CC=CC=C1 CADWTSSKOVRVJC-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 229910002056 binary alloy Inorganic materials 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 210000004958 brain cell Anatomy 0.000 description 1
- LRHPLDYGYMQRHN-UHFFFAOYSA-N butyl alcohol Substances CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 1
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 230000007670 carcinogenicity Effects 0.000 description 1
- 231100000260 carcinogenicity Toxicity 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 230000030570 cellular localization Effects 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- HPXRVTGHNJAIIH-UHFFFAOYSA-N cyclohexanol Chemical compound OC1CCCCC1 HPXRVTGHNJAIIH-UHFFFAOYSA-N 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000019425 dextrin Nutrition 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 238000003113 dilution method Methods 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000003028 enzyme activity measurement method Methods 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000009459 flexible packaging Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 229940093915 gynecological organic acid Drugs 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 102000043770 human ADAR Human genes 0.000 description 1
- 229920001477 hydrophilic polymer Polymers 0.000 description 1
- 230000005934 immune activation Effects 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 230000003308 immunostimulating effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 229960001388 interferon-beta Drugs 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000003670 luciferase enzyme activity assay Methods 0.000 description 1
- 239000012931 lyophilized formulation Substances 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 230000002132 lysosomal effect Effects 0.000 description 1
- 238000007885 magnetic separation Methods 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Chemical class 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 235000010270 methyl p-hydroxybenzoate Nutrition 0.000 description 1
- 239000004292 methyl p-hydroxybenzoate Substances 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 239000002736 nonionic surfactant Substances 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 229960003742 phenol Drugs 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 108091007428 primary miRNA Proteins 0.000 description 1
- 201000008312 primary pulmonary hypertension Diseases 0.000 description 1
- 230000007112 pro inflammatory response Effects 0.000 description 1
- 230000000770 proinflammatory effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 235000010232 propyl p-hydroxybenzoate Nutrition 0.000 description 1
- 239000004405 propyl p-hydroxybenzoate Substances 0.000 description 1
- QELSKZZBTMNZEB-UHFFFAOYSA-N propylparaben Chemical compound CCCOC(=O)C1=CC=C(O)C=C1 QELSKZZBTMNZEB-UHFFFAOYSA-N 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 102220004234 rs121965019 Human genes 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012764 semi-quantitative analysis Methods 0.000 description 1
- 239000002924 silencing RNA Substances 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- HLBBKKJFGFRGMU-UHFFFAOYSA-M sodium formate Chemical compound [Na+].[O-]C=O HLBBKKJFGFRGMU-UHFFFAOYSA-M 0.000 description 1
- 235000019254 sodium formate Nutrition 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000010473 stable expression Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- SFVFIFLLYFPGHH-UHFFFAOYSA-M stearalkonium chloride Chemical compound [Cl-].CCCCCCCCCCCCCCCCCC[N+](C)(C)CC1=CC=CC=C1 SFVFIFLLYFPGHH-UHFFFAOYSA-M 0.000 description 1
- 238000011146 sterile filtration Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000010472 type I IFN response Effects 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 229910052727 yttrium Inorganic materials 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/7105—Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/712—Nucleic acids or oligonucleotides having modified sugars, i.e. other than ribose or 2'-deoxyribose
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/7125—Nucleic acids or oligonucleotides having modified internucleoside linkage, i.e. other than 3'-5' phosphodiesters
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
- A61P7/06—Antianaemics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
- A61P9/04—Inotropic agents, i.e. stimulants of cardiac contraction; Drugs for heart failure
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0634—Cells from the blood or the immune system
- C12N5/0636—T lymphocytes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
- C12N2320/34—Allele or polymorphism specific uses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2330/00—Production
- C12N2330/50—Biochemical production, i.e. in a transformed host cell
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/15011—Lentivirus, not HIV, e.g. FIV, SIV
- C12N2740/15041—Use of virus, viral particle or viral elements as a vector
- C12N2740/15043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/106—Plasmid DNA for vertebrates
- C12N2800/107—Plasmid DNA for vertebrates for mammalian
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Crystallography & Structural Chemistry (AREA)
- Epidemiology (AREA)
- Immunology (AREA)
- Mycology (AREA)
- Virology (AREA)
- Cardiology (AREA)
- Hematology (AREA)
- Neurosurgery (AREA)
- Cell Biology (AREA)
- Hospice & Palliative Care (AREA)
- Heart & Thoracic Surgery (AREA)
- Neurology (AREA)
- Diabetes (AREA)
Abstract
本发明提供一种通过在宿主细胞中引入脱氨酶募集RNA来编辑RNA的方法,用于使靶标RNA中的腺苷脱氨基,和在所述RNA编辑方法中使用的脱氨酶募集RNA,以及包含它的组合物。
Description
本申请是申请号为201980067380.1、发明名称为“编辑RNA的方法和组合物”的中国专利申请的分案申请。
对相关申请的交叉引用
本申请要求于2018年10月12日提交的国际申请号PCT/CN2018/110105的国际申请,和于2019年4月15日提交的国际申请号CN2019/082713的国际申请的优先权,其内容在此通过提及以其整体并入。
以ASCII文本文件提交序列表
以下以ASCII文本文件提交的内容在此通过提及以其整体并入:序列表的计算机可读形式(CRF)(文件名:FC00158PCT-New-equence listing-YZG-zhc.TXT,记录日期:2019年10月11日,大小:104KB)。
技术领域
本发明涉及利用工程化RNA来编辑RNA的方法和组合物,工程化RNA 能够募集腺苷脱氨酶用以使靶标RNA中的一个或多个腺苷脱氨基。
背景技术
基因组编辑是生物医学研究和疾病疗法开发的有力工具。到目前为止,最流行的基因编辑技术是成簇规律间隔的短回文重复序列(Clustered Regularly InterspacedShort Palindromic Repeats,CRISPR)-Cas系统,它是从细菌和古细菌的适应性免疫系统开发出来的。CRISPR-Cas可以精确打靶和切割基因组DNA,从而产生双链DNA断裂(DSB)。DSB可以通过非同源末端连接(NHEJ)途径修复,导致插入或缺失(Indel),后者在大多数情况下使基因失活。替选地,同源定向修复(HDR)途径可以使用同源模板dsDNA或ssDNA修复所述DSB,从而实现精确的基因组编辑。
最近,利用脱氨酶蛋白(诸如作用于RNA的腺苷脱氨酶,ADAR),开发了用于RNA编辑的新工具。在哺乳动物细胞中,有三种类型的ADAR蛋白, Adar1(两个同种型,p110和p150),Adar2和Adar3(无催化活性)。ADAR蛋白的催化底物是双链RNA,它可以从腺苷(A)核苷碱基中去除-NH2基团,将A 变为肌苷(I),后者被识别为鸟苷(G)并且在随后的细胞转录和翻译过程中与胞苷(C)配对。研究人员将λN肽与人类Adar1或Adar2脱氨酶结构域相融合来构建λN-ADARDD系统,该系统可由BoxB茎环和反义RNA组成的融合RNA 来引导,结合特定的RNA靶标。该方法可以在靶标A碱基处将靶标A编辑为 I(引入A-C错配),从而导致从A至G的RNA碱基编辑。用于RNA编辑的其他方法包括将反义RNA融合至R/G基序(ADAR-募集RNA支架)以通过在哺乳动物细胞中过表达Adar1或Adar2蛋白来编辑靶标RNA,以及利用dCas13-ADAR 精确打靶和编辑RNA。
本文提及的所有出版物、专利、专利申请和公开的专利申请的公开内容均通过提及以其整体由此并入本文。
发明概述
核酸编辑在生物学研究和治疗学的发展中具有巨大的潜力。目前用于 DNA或RNA编辑的工具依赖于将外源蛋白引入活的生物体,由于可能的异常效应子活性,传递限制和免疫原性,它们可能面临潜在的风险或技术障碍。在一些方面,本申请提供了使用短RNA来利用内源性ADAR(作用于RNA的腺苷脱氨酶)蛋白用于靶向RNA编辑的可编程方法。在一些方面,本申请提供了一种工程改造的RNA,其与靶转录物部分互补以募集天然ADAR1或 ADAR2以在靶标RNA中的特定位点将腺苷变为肌苷。本文所述的方法统称为“LEAPER”(利用内源性ADAR进行RNA的可编程编辑),而募集ADAR的 RNA可互换地称为“dRNA”或“arRNA”。
在一个方面,本申请提供了一种用于编辑宿主细胞中的靶标RNA的方法,包含将脱氨酶募集RNA(dRNA)或编码脱氨酶募集RNA的构建体引入宿主细胞,其中,所述dRNA包含与靶标RNA杂交的互补RNA序列,并且其中,所述dRNA能够募集作用于RNA的腺苷脱氨酶(ADAR)以使靶标RNA中的靶标腺苷(A)脱氨基。在某些实施方案中,所述宿主细胞是真核细胞。在一些实施方案中,所述宿主细胞是哺乳动物细胞。在一些实施方案中,所述宿主细胞是人类细胞。在一些实施方案中,所述宿主细胞是小鼠细胞。在一些实施方案中,所述宿主细胞是原核细胞。
在某些实施方案中,ADAR天然地或内源地存在于宿主细胞中,例如,天然地或内源地存在于真核细胞中。在一些实施方案中,ADAR由宿主细胞内源表达。在某些实施方案中,ADAR对宿主细胞而言是外源的。在一些实施方案中,ADAR由核酸(例如DNA或RNA)编码。在一些实施方案中,该方法包括将ADAR或编码ADAR的构建体引入宿主细胞。在一些实施方案中,该方法不包含将任何蛋白质引入宿主细胞中。在某些实施方案中,所述 ADAR是ADAR1和/或ADAR2。在一些实施方案中,ADAR是选自由 hADAR1,hADAR2,小鼠ADAR1和小鼠ADAR2构成的组的一种或多种 ADAR。
在某些实施方案中,Cas不识别所述dRNA。在一些实施方案中,所述 dRNA不包含CRISPR/Cas系统中使用的crRNA,tracrRNA或gRNA。在一些实施方案中,该方法不包含将Cas或Cas融合蛋白引入宿主细胞中。
在某些实施方案中,所述靶标RNA中的靶标A的脱氨基作用导致所述靶标RNA中的错义突变、过早的终止密码子、异常剪接或可变剪接。在一些实施方案中,靶标RNA编码蛋白质,而所述靶标RNA中靶标A的脱氨基作用导致所述蛋白质的点突变、截短、延伸和/或错误折叠。在一些实施方案中,所述靶标RNA中靶标A的脱氨基作用导致靶标RNA中的错义突变、过早的终止密码子、异常剪接或可变剪接的回复。在一些实施方案中,其中所述靶标RNA 编码截短的、延长的、突变的或错误折叠的蛋白质,靶标RNA中的靶标A的脱氨基作用通过靶标RNA中的错义突变、过早的终止密码子、异常剪接或可变剪接的回复产生有功能的、全长的、正确折叠的和/或野生型蛋白质。在一些实施方案中,靶标RNA是调节RNA,并且靶标A的脱氨基作用导致由靶标 RNA调节的下游分子的表达的变化。在某些实施方案中,该方法用于利用内源性腺苷脱氨酶在靶标RNA上的编辑产生由靶标RNA编码的蛋白质的点突变和/或错误折叠、和/或在靶标RNA中产生过早的终止密码子、异常剪接位点、和/或的可变剪接位点。
在某些实施方案中,提供了用于编辑宿主细胞中的多种靶标RNA的方法,其中所述方法包含将多种dRNA或编码所述多种dRNA的构建体引入宿主细胞中,其中所述多种脱氨酶募集RNA中的每一种包含与多种靶标RNA中的相应靶标RNA杂交的互补RNA序列,并且其中每种dRNA能够募集作用于RNA的腺苷脱氨酶(ADAR)以使相应靶标RNA中的靶标腺苷(A)脱氨基。
在一些实施方案中,提供了经编辑的RNA或宿主细胞,其具有通过如上所述的RNA编辑方法中的任一种生产的经编辑的RNA。
在一个方面,本申请提供了治疗或预防个体疾病或病症的方法,包含根据如上所述的RNA编辑方法的任何一种编辑与个体细胞中的疾病或病症相关的靶标RNA。在一些实施方案中,该方法包含离体编辑细胞中的靶标RNA。在一些实施方案中,该方法包含将经编辑的细胞施用于个体。在一些实施方案中,该方法包含向个体施用有效量的dRNA或者编码该dRNA的构建体。在一些实施方案中,该方法还包含向细胞中引入ADAR或编码ADAR的构建体(例如,病毒载体)。在一些实施方案中,该方法还包含向个体施用ADAR或编码该ADAR的构建体(例如,病毒载体)。在一些实施方案中,疾病或病症是遗传性的基因疾病。在一些实施方案中,所述疾病或病症与一种或多种获得性基因突变(例如,药物抗性)相关。
本申请的一个方面提供了一种dRNA,其通过募集作用于RNA的腺苷脱氨酶(ADAR)来使靶标RNA中的靶标腺苷脱氨基,所述腺苷脱氨酶包含与靶标RNA杂交的互补RNA序列。在一些实施方案中,dRNA包含SEQ ID NO: 25-44、142-205、341-342中任一项的核酸序列。
在根据本文所述的方法或dRNA的任何一项的一些实施方案中,所述 dRNA包含下述RNA序列,其包含直接与在靶标RNA中待编辑的靶标腺苷相对的胞苷(C)、腺苷(A)或尿苷(U)。在某些实施方案中,所述RNA序列还包含一个或多个鸟苷,每个鸟苷直接与靶标RNA中的非靶标腺苷相对。在某些实施方案中,靶标RNA序列中靶标A的5'最近邻位是选自U,C,A和G的核苷酸,优先度U>C≈A>G,而且靶标RNA序列中靶标A的3'最近邻位是选自G, C,A和U的核苷酸,优先度G>C>A≈U。在某些实施方案中,在靶标RNA中靶标A处于选自:由UAG,UAC,UAA,UAU,CAG,CAC,CAA,CAU, AAG,AAC,AAA,AAU,GAG,GAC,GAA和GAU构成的组的三碱基基序中。在某些实施方案中,其中所述三碱基基序是UAG,所述dRNA包含与所述三碱基基序中的U正对的A,与靶标A正对的C,和与三碱基基序中的G 正对的C,G或U。在某些实施方案中,其中所述三碱基基序是靶标RNA中的 UAG,所述dRNA包含与靶标RNA的UAG相对的ACC,ACG或ACU。
在根据本文所述的方法或dRNA的任何一项的一些实施方案中,所述脱氨酶募集RNA包含超过40、45、50、55、60、65、70、75或80个的核苷酸。在某些实施方案中,脱氨酶募集RNA长度为40-260、45-250、50-240、60-230、 65-220、70-210、70-200、70-190、70-180、70-170,70-160、70-150、70-140、 70-130、70-120、70-110、70-100、70-90、70-80、75-200、80-190、85-180、 90-170、95-160、100-150或105-140个核苷酸。在某些实施方案中,靶标RNA是选自:由前信使RNA,信使RNA,核糖体RNA,转移RNA,长非编码RNA 和小RNA(例如miRNA)构成的组的RNA。
在根据本文所述的方法或dRNA的任何一项的一些实施方案中,所述 dRNA是单链RNA。在一些实施方案中,所述互补RNA序列是单链的,并且其中所述dRNA还包含一个或多个双链区。在一些实施方案中,所述dRNA 包含一种或多种修饰,例如2'-O-甲基修饰和/或硫代磷酸酯修饰。
在一些实施方案中,提供了编码上述任何一种dRNA的构建体(例如,病毒载体或质粒)。在一些实施方案中,所述构建体包含与编码dRNA的序列可操作地连接的启动子。在一些实施方案中,所述构建体是DNA构建体。在一些实施方案中,所述构建体是病毒载体,诸如AAV,诸如AAV8。
在一些实施方案中,提供了文库,其包含根据上述任何一种dRNA的多个dRNA或根据上述任何一种构建体的多个构建体。
还提供了组合物,宿主细胞,试剂盒和制品,其包含本文所述的任何一种dRNA,本文所述的任何一种构建体,或本文所述的任何一种文库。
附图说明
图1A-1H显示使用利用了内源Adar1蛋白的单个dRNA的RNA编辑。图1A 和1B显示使用内源Adar1蛋白编辑RNA的示意图。图1C显示使用利用了内源 Adar1蛋白质的dRNA编辑报道分子mRNA。图1D显示图1B中的结果的统计分析。图1E显示Adar1敲除和Adar1(p110),Adar1(p150)和Adar2的回复结果。图1F显示图1D中的结果的统计分析。图1G显示Adar1(p110),Adar1(p150)或Adar2过表达对293T-WT细胞中dRNA介导的RNA编辑的影响。图1H显示深度测序(即二代测序,NGS)结果证实了在打靶位点处从A至G的编辑。
图2A-2H显示dRNA的优化。图2A显示与打靶腺苷相对的四种碱基(A, U,C和G)识别的示意图。图2B显示与打靶腺苷相对的碱基识别对dRNA的 RNA编辑效率的影响。图2C显示带有与UAG打靶位点的一个,两个或三个碱基错配的dRNA的示意图。图2D显示与UAG打靶位点的一个,两个或三个碱基错配对于用dRNA编辑的报道RNA的影响。dRNA优选打靶腺苷上的A-C 错配。图2E显示带有变化的长度的dRNA的示意图。图2F显示基于双荧光报道分子-2,dRNA长度对于RNA编辑效率的影响。图2G显示不同A-C错配位置的示意图。图2H显示A-C错配位置对于RNA编辑效率的影响。
图3A-3B显示通过本申请的示例性RNA编辑方法的内源RNA编辑的编辑灵活性。图3A显示在所有16种不同的3-碱基基序上内源RNA编辑效率的百分比定量。图3B显示对16种不同3碱基基序的内源RNA编辑的5'侧和3'侧碱基优先度的热图。
图4A-4H显示在293T细胞中用dRNA编辑内源基因的mRNA。图4A显示 KRAS mRNA靶标和带有变化的长度的dRNA的示意图。图4B显示在293T细胞中用dRNA编辑内源KRAS基因的mRNA。空白载体,dRNA-91nt质粒被分别转染到293T-WT细胞中。在60个小时后,分离RNA用于RT-PCR,然后扩增cDNA并在Illumina NextSeq上测序。图4C显示PPIB mRNA靶标(位点1,位点2和位点3)和相应的dRNA设计的示意图。图4D,4E和4F显示在293T细胞中用dRNA编辑内源PPIB基因的mRNA。图4G显示β-肌动蛋白mRNA靶标和 dRNA(71-nt和131-nt)的示意图。图4H显示在293T细胞中用dRNA编辑内源β- 肌动蛋白基因的mRNA。
图5A-5G显示脱靶分析。图5A显示序列窗口的示意图,其中为PPIB mRNA靶标(PPIB位点1)分析了从A至I的编辑。黑色箭头标明了目标腺苷。图 5B显示通过151-nt dRNA打靶PPIB mRNA靶标(PPIB位点1)进行从A至I的 RNA编辑的深度测序定量。图5C显示序列窗口的示意图,其中为了KRAS mRNA靶标分析了从A至I的编辑。黑色箭头表示靶向的腺苷。图5D显示打靶 KRAS mRNA靶标的91-nt和111-nt dRNA编辑A至I的RNA的深度测序定量。图5E显示含有不同的A-G错配组合的设计的的四种91-nt或111-nt的dRNA的示意图。基于在图5D中的统计结果以及关于不同氨基酸的基因代码的现有知识,设计了A-G错配。图5F显示dRNA以及在图5E中不同种类的dRNA变体对靶向的A56编辑的结果。图5G显示通过111-nt dRNA和打靶KRAS mRNA靶标的4种111-nt dRNA变体对从A至I的RNA编辑的深度测序定量。
图6A-6H显示使用利用了内源Adar1蛋白的单个dRNA的RNA编辑。图6A 显示dLbuCas13-ADARDD融合蛋白的RNA编辑的示意图。无催化活性的dLbuCas13与ADAR1或ADAR2的RNA脱氨酶结构域相融合。图6B显示双荧光报道mRNA靶标和指导RNA的设计的示意图。图6C显示图6A和图6B中的结果的统计分析。图6D显示293T-WT细胞中Adar1和Adar2的mRNA水平。图 6E显示凭借基因组PCR在293T-ADAR1-KO细胞系中对ADAR1基因进行基因分型的结果。图6F显示在293T-WT和293T-ADAR1-KO细胞系中Adar1(p110) 和Adar1(p150)的表达水平(通过蛋白质印迹法)。图6G显示Adar1(p110), Adar1(p150)或Adar2过表达对在293T-WT细胞中由dRNA介导的RNA编辑的影响(通过FACS)。图6H显示Sanger测序结果显示在靶标腺苷位点处的从A至 G的编辑。
图7A-7C显示对dRNA的优化。图7A显示带有变化的长度的dRNA的示意图以及基于双荧光报道分子-1凭借带有变化的长度的dRNA对靶向的mRNA 进行编辑的结果。图7B显示基于双荧光报道分子-1,不同的A-C错配位置和 A-C错配位置对RNA编辑效率的影响的示意图。图7C显示基于双荧光报道分子-3,不同的A-C错配位置和A-C错配位置对RNA编辑效率的影响的示意图。
图8A-8B显示在293T细胞中用dRNA编辑内源基因的mRNA。图8A显示在293T细胞中用dRNA编辑内源β-肌动蛋白基因(位点2)的mRNA。图8B显示在293T细胞中用dRNA编辑内源GAPDH基因的mRNA。
图9显示在不同细胞系中凭借dRNA进行RNA编辑。图9显示报道分子质粒和dRNA质粒被共转染到不同细胞系中,结果显示dRNA在多种细胞系中可以很好地起作用,这表明了dRNA应用的普遍性。
图10A-10D显示对有效的示例性RNA编辑平台的探索。图10A, dLbuCas13a-ADAR1DD(E1008Q)融合蛋白和相应的crRNA的示意图。使用3× GGGGS接头将催化的无活性LbuCas13a融合到ADAR1的脱氨酶结构域(超活性E1008Q变体)上。crRNA(crRNACas13a)由Lbu-crRNA支架和间隔子组成,该间隔子与靶向RNA互补,具有所示的A-C错配。图10B,双荧光报道系统和具有所示的多个长度的间隔子的Lbu-crRNA的示意图。图10C,EGFP阳性 (EGFP+)细胞的定量。将稳定表达报道分子-1(Reporter-1)的HEK293T细胞用所示长度的crRNACas13a转染,并伴或不伴dLbuCas13a-ADAR1DD(E1008Q)的共表达,然后进行FACS分析。数据表示为平均值±s.e.m.(n=3)。图10D,用对照(Ctrl crRNA70)或靶向间隔子(crRNA70)进行的实验的代表性FACS结果。
图11A-11G显示利用内源性ADAR1蛋白进行靶向RNA编辑的示例性方法。图11A,报道分子-1和70-nt arRNA的示意图。图11B,在稳定表达报道分子-1的野生型(HEK293T,上图)或ADAR1敲除(HEK293T ADAR1–/–,下图) 细胞中,arRNA诱导的EGFP表达的代表性FACS分析。图11C,蛋白质印迹分析显示野生型和HEK293T ADAR1–/–细胞以及转染有ADAR1亚型(p110和 p150)的HEK293T ADAR1–/–细胞中ADAR1蛋白的表达水平。图11D,蛋白质印迹分析显示野生型和HEK293T ADAR1–/–细胞以及转染有ADAR2的 HEK293T ADAR1–/–细胞中ADAR2蛋白的表达水平。图11E,EGFP阳性(EGFP+) 细胞的定量。将报道分子-1和所示表达ADAR的构建体与对照RNA70或靶向 arRNA70一起共转染到HEK293T ADAR1–/–细胞中,然后进行FACS分析。通过转染效率对EGFP+百分比进行归一化,转染效率由mCherry+确定。数据为平均值±s.e.m.(n=4)。图11F,电泳图显示对照RNA70(上图)或arRNA70(下图) 靶向区域的Sanger测序结果。图11G,通过深度测序对靶位点的A至I转化率进行定量。
图12A-12B显示ADAR1/ADAR2的mRNA表达水平,和arRNA介导的 RNA编辑。图12A,定量PCR显示HEK293T细胞中ADAR1和ADAR2的mRNA 水平。数据表示为平均值±s.e.m.(n=3)。图12B,来自图1E的代表性FACS 结果。
图13显示定量PCR结果,该结果证明了示例性LEAPER方法对HEK293T 细胞中111-nt arRNA或对照RNA靶向报道分子-1转录物的表达水平的影响。数据表示为平均值±s.e.m.(n=3);未配对的双面学生t检验,ns,不显著。
图14A-14D显示在多个细胞系中用示例性LEAPER方法进行的靶向RNA 编辑。图14A,蛋白质印迹结果显示在所示人细胞系中ADAR1,ADAR2和 ADAR3的表达水平。将β-微管蛋白用作上样对照。显示的数据是三个独立实验的代表。ADAR1–/–/ADAR2代表过表达ADAR2的ADAR1-敲除HEK293T细胞。图14B,通过β-微管蛋白表达归一化的相对ADAR蛋白表达水平。图14C,所示人细胞用报道分子-1,以及71-nt对照arRNA(对照RNA71)或71-nt靶向 arRNA(arRNA71)转染,然后进行FACS分析。图14D,如图14C所述分析所示小鼠细胞系。通过转染效率对EGFP+百分比进行归一化,该转染效率由 mCherry+确定。图14B,14c和14d中的误差线均表示平均值±s.e.m.(n=3);未配对的双面学生t检验,*P<0.05;**P<0.01;***P<0.001;****P <0.0001;ns,不显著。
图15A-15C显示报道分子-1(a),-2(b)和-3(c)以及它们相应的arRNA的示意图。
图16A-16G显示示例性LEAPER方法的表征和优化。图16A,上图,具有与靶UAG相对的改变的三联体(5'-CNA,N表示A,U,C或G)的arRNA设计的示意图。下图,EGFP+百分比,其显示与靶标腺苷相对的可变碱基对RNA 编辑效率的影响。图16B,上图,具有A-C错配(5'-N1CN2)中的胞苷侧翼的改变的相邻碱基的arRNA的设计。下图,N1CN2的16种不同组合对RNA编辑效率的影响。图16C,A-C错配中的胞苷的5'和3'最邻近位点的优先度的概述。图16D,上图,具有可变长度的arRNA的设计。下图,基于报道分子-1和报道分子-2,arRNA长度对RNA编辑效率的影响。图16E,上图,具有可变A-C 错配位置的arRNA的设计。下图,基于报道分子1和报道分子-2,A-C错配位置对的RNA编辑效率的影响。图16F,上图,报道分子-3的三联体基序的设计,在靶标腺苷(5'-N1AN2)周围具有可变最邻近碱基,在111-nt arRNA(arRNA111)上具有相对基序(5'-N2CN1)。下图,深层测序结果显示 5'-N1AN2基序中靶标腺苷的编辑率。图16G,在“报道分子-3”上LEAPER介导的编辑的5'和3'碱基优先度的概述。16A,16B,16D,16E和16F中的误差线均表示平均值±s.e.m.(n=3)。
图17A-17I显示用示例性LEAPER方法对内源转录物的编辑。图17A,四个疾病相关基因(PPIB,KRAS,SMAD4和FANCC)和相应arRNA的靶向内源转录物的示意图。图17B,深度测序结果显示通过引入指定长度的arRNA,对PPIB,KRAS,SMAD4和FANCC转录物的靶向腺苷的编辑率。图17C,深度测序结果显示在内源PPIB,FANCC和IDUA转录物的非UAN位点的编辑率。图17D,两个111-nt arRNA的多重编辑率。所示arRNA可以单独转染或共转染到HEK293T细胞中。从共转染的细胞中测量两个位点的靶向编辑。图 17E,由151-nt arRNA覆盖的PPIB转录物序列的示意图。黑色箭头指示靶标腺苷。所有腺苷标记为红色。图17F,腺苷的编辑率的热图,其被靶向PPIB 基因的所示长度的arRNA覆盖(以蓝色粗体框标记的)。对于111nt arRNA或 arRNA151-PPIB覆盖的区域,由于缺乏有效的PCR引物来扩增该区域,因此通过RNA-seq确定A22,A30,A33和A34的编辑率。否则,通过有针对性的深度测序分析来确定编辑率。图17G,上图,报道分子-3的三联体基序的设计,在靶标腺苷(5'-N1AN2)周围具有可变最邻近碱基,在111-nt arRNA(arRNA111) 中具有相对基序(5'-N2’GN1’)。下图,深层测序结果显示编辑率。图17H,上图,在5'-N1GN2与5'-UAG或5'-AAG基序相对的基序中具有两个连续错配的arRNA的设计。深度测序结果显示在与5'-UAG基序(左下)或5'-AAG基序(右下) 相对的5'-N1GN2基序中具有两个连续错配的arRNA111的编辑率。图17I,由靶向KRAS基因的工程化的arRNA111变体覆盖的腺苷的编辑率的热图。图17B, 17C,17D,17G和17H中的数据表示为平均值±s.e.m.(n=3);未配对的双面学生t检验,*P<0.05;**P<0.01;***P<0.001;****P<0.0001;NS,不显著。(f和i)的数据表示为平均值(n=3)。
图18A-18B显示示例性LEAPER方法对靶向转录物和蛋白质产物的表达水平的影响。图18A,定量PCR显示HEK293T细胞中相应的151-nt arRNA或对照RNA的PPIB,KRAS,SMAD4和FANCC的靶向转录物的表达水平。数据表示为平均值±s.e.m.(n=3);未配对的双面学生t检验,*P<0.05;**P <0.01;***P<0.001;****P<0.0001;ns,不显著。图18B,蛋白质印迹结果显示在HEK293T细胞中,151-nt arRNA对靶向KRAS基因的蛋白质产物的影响。将β-微管蛋白用作上样对照。
图19A-19F显示用示例性LEAPER方法对内源转录物的编辑。图19A,由 151-ntarRNA覆盖的KARS转录物序列的示意图。箭头指示靶向腺苷。所有腺苷标记为红色。图19B,由KARS转录物中所示arRNA覆盖的腺苷的编辑率的热图(以蓝色粗框标记的)。图19C,由151-nt arRNA覆盖的SMAD4转录物的示意图。图19D,由SMAD4转录物中所示arRNA覆盖的腺苷的编辑率的热图。图19E,由151-nt arRNA覆盖的FANCC转录物的示意图。图19F,由FANCC转录物中所示arRNA覆盖的腺苷的编辑率的热图。对于每个arRNA,双链体 RNA的区域以蓝色粗体框突出显示。数据(图19B,19D和19F)表示为平均值 (n=3)。
图20A-20D显示LEAPER的RNA编辑的转录组范围特异性。20A和20B,对照RNA151和arRNA151-PPIB的转录组范围脱靶分析。上靶位点(PPIB)以红色突出显示。在对照RNA和靶向PPIB的RNA组中识别出的潜在脱靶位点标记为蓝色。图20C,脱靶位点和相应的对照RNA151或arRNA151-PPIB之间的预期退火亲和力。使用在线网站工具RNAhybrid预测脱靶位点(编辑位点的上游和下游150nt)和相应的对照RNA151或arRNA151-PPIB形成的双链RNA的最小自由能(ΔG)。图20D,上图,arRNA151-PPIB和指定的潜在脱靶位点之间的高度互补区域的示意图,其可通过藉由NCBI-BLAST搜索同源序列来预测。下图,深度测序显示arRNA151-PPIB的上靶位点和所有预测的脱靶位点的编辑率。数据表示为平均值±s.e.m.(n=3)。
图21A-21B显示潜在脱靶的评估。图21A,arRNA111-FANCC的高度互补区和指定的潜在脱靶序列的示意图,其是通过藉由NCBI-BLAST搜索同源序列来预测的。图21B,深度测序显示arRNA111-FANCC的上靶位点和所有预测的脱靶位点的编辑率。所有数据均表示为平均值±s.e.m.(n=3)。
图22A-22F显示在哺乳动物细胞中应用示例性LEAPER方法的安全性评估。图22A和22B,通过转录组范围的RNA测序对对照RNA151(a) arRNA151-PPIB(b)对天然编辑位点的作用的转录组范围的分析。皮尔逊相关系数分析(Pearson’s correlation coefficientanalysis)用于评估天然编辑位点的差异RNA编辑率。图22C和22D,用转录组水平上的RNA-seq数据对对照 RNA151(c)arRNA151-PPIB(d)的作用进行差异基因表达分析。皮尔逊相关系数分析用于评估差异基因表达。图22E和22F,arRNA转染对先天免疫应答的影响。将所示arRNA或聚(I:C)转染到HEK293T细胞中。然后使用定量PCR分析总RNA,以确定IFN-β(e)和IL-6(f)的表达水平。数据(e和f)表示为平均值±s.e.m.(n=3)。
图23A-23D显示通过LEAPER恢复突变体TP53W53X的转录调节活性。图23A,上图,由含有c.158G>A临床相关无义突变(Trp53Ter)的111-nt arRNA 覆盖的TP53转录物序列的示意图。黑色箭头指示靶标腺苷。所有腺苷标记为红色。下图,设计了两个针对TP53W53X转录物的优化arRNA,其中 arRNA111-AG1在A46th处具有A-G错配,而arRNA111-AG4分别在A16th,A46th,A91th和A94th处具有A-G错配,以最大程度地减少“易编辑”基序的潜在脱靶。图23B,深度测序结果显示通过arRNA111,arRNA111-AG1和arRNA111-AG4对 TP53W53X转录物进行靶向编辑。图23C,蛋白质印迹显示从HEK293T TP53–/–细胞中的TP53W53X转录物中恢复全长p53蛋白的产物。图23D,使用p53-萤火虫-荧光素酶报道系统检测恢复的p53蛋白的转录调节活性,该系统通过共转染的海藻-荧光素酶载体进行了归一化。数据(b,c和d)表示为平均值±s.e.m.(n =3);未配对的双面学生t检验,*P<0.05;**P<0.01;***P<0.001;****P <0.0001;ns,不显著。
图24显示通过示例性的LEAPER方法对突变体TP53W53X转录物的编辑。上图,是111nt arRNA覆盖的TP53转录序列的示意图。箭头指示靶标腺苷。所有腺苷标记为红色。下图,是TP53转录物中所示arRNA覆盖的腺苷编辑率的热图。
图25显示从ClinVar数据和相应的111-nt arRNA中选择的含有G至A突变的疾病相关cDNA的示意图。
图26显示通过示例性的LEAPER方法对病原性突变的校正。通过相应的 111ntarRNA从ClinVar数据对疾病相关的G>A突变进行A至I校正,靶向所示的来自六个致病基因的临床相关突变(图25以及以下arRNA和对照RNA和疾病相关的cDNA的序列的表)。数据表示为平均值±s.e.m.(n=3);未配对的双面学生t检验,*P<0.05;**P<0.01;***P<0.001;****P<0.0001;ns,不显著。
图27A-27C显示通过示例性LEAPER方法在多个人原代细胞中的RNA编辑。图27A,由LEAPER介导的RNA编辑诱导的EGFP阳性(EGFP+)细胞的定量。用报道分子-1,以及151-nt对照RNA(对照RNA151)或151-nt靶向 arRNA(arRNA151)转染人原代肺成纤维细胞和人原代支气管上皮细胞,然后进行FACS分析。图27B和27C,深度测序结果显示人原代肺成纤维细胞,人原代支气管上皮细胞(b)和人原代T细胞(c)中PPIB转录物的编辑率。a,b和未治疗组(c)中的数据表示为平均值±s.e.m.(n=3);对照RNA151和arRNA151(c) 的数据表示为平均值±s.e.m.(n=2)。
图28A-28D显示arRNA的慢病毒转导和合成arRNA寡核苷酸的电穿孔的靶向编辑。图28A,EGFP+细胞的定量。将稳定表达报道分子-1的HEK293T 细胞用表达Ctrl-RNA或靶向arRNA的151-nt的慢病毒感染。感染后2天和8天进行FACS分析。EGFP+细胞的比率通过慢病毒转导效率(BFP+比率)归一化。图28B,深度测序结果显示慢病毒将151-nt arRNA转导入HEK293T细胞后, PPIB转录物的编辑率。图28C,PPIB序列和相应的111-nt靶向arRNA的示意图。*(红色)表示具有2'-O-甲基和硫代磷酸酯键修饰的核苷酸。图28D,深度测序结果显示当将111nt合成arRNA寡核苷酸电穿孔到人原代T细胞中时, PPIB转录物的编辑率。
图29A-29E显示通过示例性LEAPER方法在源自Hurler综合征患者的原代成纤维细胞中α-L-艾杜糖醛酸酶活性的恢复。图29A,上图,源自患者的成纤维细胞GM06214中致病突变的遗传信息;中间图,IDUA基因的外显子9(Trp402Ter)中含有纯合TGG>TAG突变的GM06214细胞(黑色)的IDUA成熟 mRNA序列的示意图,相应的111-nt靶向arRNA111-IDUA-V1(蓝色);下图, GM06214细胞的IDUA前mRNA序列(黑色)和相应的111-nt靶向 arRNA111-IDUA-V2的示意图(蓝色)。*(红色)表示具有2'-O-甲基和硫代磷酸酯键修饰的核苷酸。图29B,在不同时间点,用4-甲基伞形酮α-L-艾杜糖醛酸酶底物测量α-L-艾杜糖醛酸酶的催化活性。数据表示为平均值±s.e.m.(n=2)。图29C,深度测序结果显示在电穿孔后48小时,在GM06214细胞中,IDUA 转录物的靶向编辑率。图29D,上图,由111-nt arRNA覆盖的IDUA转录序列的示意图。箭头指示靶标腺苷。所有腺苷标记为红色。下图,由IDUA转录物中所示arRNA覆盖的腺苷编辑率的热图(以蓝色粗体框显示)。e,定量PCR 显示在arRNA或聚(I:C)电穿孔后,I型干扰素、干扰素刺激基因和促炎基因的表达。数据表示为平均值(n=3)。
图30A-30C显示双荧光报道分子(报道分子-1,-2和-3),mCherry和EGFP 的三种形式。图30A,报道分子-1的结构,图30B,报道分子-2的结构,图30C,报道分子-3的结构。
图31显示AAV8-IDUA-adRNA151-KD2和AAV8-Random151-KD2的质粒信息。
图32A-B显示注射有AAV8-IDUA-adRNA151-KD2和 AAV8-Random151-KD2的MPSI小鼠的α-L-艾杜糖醛酸酶相对酶活性。 GM01323细胞作为对照。
图33A-B显示注射有AAV8-IDUA-adRNA151-KD2和AAV8-Random151-KD2的MPSI小鼠的RNA编辑效率。
发明详述
本申请提供RNA编辑方法(本文称为“LEAPER”方法)和经特殊设计的 RNA,本文称为脱氨酶募集RNA(“dRNA”)或ADAR-募集RNA(“arRNA”),以编辑宿主细胞中的靶标RNA。不受任何理论或假设的约束,所述dRNA通过序列特异的方式与其靶标RNA杂交而起作用,形成双链RNA,其募集作用于 RNA的腺苷脱氨酶(Adenosine Deaminase Acting on RNA,ADAR)以使靶标 RNA中的靶标腺苷脱氨基。因此,在一些实施方案中,在无宿主细胞中异位表达或过表达ADAR蛋白的情况下可以实现有效的RNA编辑。本发明还提供了使用所述RNA编辑方法治疗或预防个体疾病或病症的方法和组合物。
本文所述的RNA编辑方法不使用包含ADAR和特异性结合指导核酸的蛋白质(诸如Cas)的融合蛋白。本文描述的脱氨酶募集 RNA(deaminase-recruiting RNA(dRNA))不包含CRISPR/Cas系统中使用的 crRNA,tracrRNA或gRNA。在一些实施方案中,dRNA不包含ADAR招募结构域或化学修饰。在一些实施方案中,dRNA可以从质粒或病毒载体表达,或合成为寡核苷酸,其可以实现所需的编辑效率。
本文所述的LEAPER方法对靶标转录物和罕见的全局脱靶具有可控的脱靶率。发明人已经使用LEAPER方法通过修复特定的癌症相关点突变来恢复 p53功能。本文所述的LEAPER方法还可以应用于包括多种人类原代细胞的广泛的细胞类型,并且可以用于在源自Hurler综合征患者的原代成纤维细胞中恢复α-L-艾杜糖醛酸酶催化活性,而无需引起先天免疫应答。在一些实施方案中,LEAPER方法涉及单分子(即,dRNA)系统。本文所述的LEAPER方法可实现精确而有效的RNA编辑,从而为基础研究和治疗提供了变革性的潜力。
定义
将参照特定实施方案并参考某些附图来描述本发明,但是本发明不受限于此,而是仅由权利要求进行限定。权利要求中的任何参考标记不应被解释为为范围的限制。当在本说明书和权利要求中使用术语“包括”时,不排除其他因素或者步骤。对于提及单数名词时使用不定冠词或定冠词的情况,例如“一个”或“一种”,“该”,它包括了该名词的复数形式,除非另有特别说明。对于本文中对核苷酸的数值范围的描述,明确考虑了其间的每个中间数值。例如,对于40-260个核苷酸的范围,除了40个核苷酸和260个核苷酸的数量之外,还考虑了40到260个核苷酸之间的任何整数个核苷酸。
提供以下术语或定义,仅用于帮助理解本发明。除非本文中具体定义,否则本文使用的所有术语对本发明所属领域技术人员具有相同的含义。从业者特别针对Sambrook等人,Molecular Cloning:A Laboratory Manual,2nd ed, Cold Spring Harbor Press,Plainsview,New York(1989);和Ausubel等人,Current Protocols in MolecularBiology(Supplement 47),John Wiley&Sons,New York(1999),关于本领域的定义和术语。本文提供的定义不应被解释为具有比本领域普通技术人员所理解的范围更窄的范围。
术语“脱氨酶募集RNA”,“dRNA”,“ADAR-募集RNA”和“arRNA”在本文中可互换使用,指能募集ADAR在RNA中使靶标腺苷脱氨的工程化的 RNA。
术语“多核苷酸”,“核苷酸序列”和“核酸”可互换使用。它们是指任何长度的聚合形式的核苷酸,脱氧核糖核苷酸或核糖核苷酸,或者其类似物。
本文所用的术语“腺嘌呤”,“鸟嘌呤”,“胞嘧啶”,“胸腺嘧啶”,“尿嘧啶”和“次黄嘌呤”是指核碱基本身。术语“腺苷”,“鸟苷”,“胞苷”,“胸苷”,“尿苷”和“肌苷”是指与核糖或脱氧核糖的糖部分连接的核碱基。术语“核苷”是指与核糖或脱氧核糖连接的核碱基。术语“核苷酸”是指各自的核碱基-核糖基 -磷酸酯或核碱基-脱氧核糖基-磷酸酯。有时术语腺苷和腺嘌呤(缩写“A”),鸟苷和鸟嘌呤(缩写“G”),胞嘧啶和胞苷(缩写“C”),尿嘧啶和尿苷(缩写“U”),胸腺嘧啶和胸苷(缩写“T”),肌苷和次黄嘌呤(缩写“I”),可互换使用,指相应的核碱基,核苷或核苷酸。有时,术语核碱基,核苷和核苷酸可互换使用,除非上下文明确要求不同。
在本申请的上下文中,“靶标RNA”是指将脱氨酶募集RNA序列设计为与其具有完全互补性或基本互补性的RNA序列,并且靶标序列与dRNA之间杂交形成含有靶标腺苷的双链RNA(dsRNA)区域,其募集作用于RNA的腺苷脱氨酶(ADAR),该酶使靶标腺苷脱氨基。在一些实施方案中,ADAR天然地存在于宿主细胞中,例如真核细胞(优选哺乳动物细胞,更优选人类细胞)。在一些实施方案中,将所述ADAR引入宿主细胞中。
如本文所用,“互补性”是指核酸通过传统的Watson-Crick碱基配对与另一种核酸形成氢键的能力。百分比互补性表示核酸分子中可与第二核酸形成氢键(即,Watson-Crick碱基配对)的残基的百分比(例如,10个中的约5、6、7、 8、9、10个分别为约50%,60%,70%,80%,90%和100%互补)。“完全互补”是指核酸序列的所有连续残基与第二核酸序列中相同数量的连续残基形成氢键。如本文所用,“基本上互补”是指在约40、50、60、70、80、100、150、200、250或更多个核苷酸的区域内,至少约70%,75%,80%,85%, 90%,95%,97%,98%,99%或100%中的任何一个的互补程度,或指在严格条件下杂交的两条核酸。
如本文所用,杂交的“严格条件”是指与靶标序列具有互补性的核酸主要与靶标序列杂交并且基本上不与非靶标序列杂交的条件。严格条件通常是序列依赖性的,并且取决于许多因素而变化。通常,序列越长,序列与其靶标序列发生特异性杂交的温度越高。Tijssen(1993),Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I,Second Chapter“Principles ofprinciples of hybridization and the strategy of nucleic acid probe assay”,Elsevier,N,Y中详细描述了严格条件的非限制性实例。
“杂交”是指其中一种或多种多核苷酸反应形成复合物的反应,所述复合物通过核苷酸残基的碱基之间的氢键稳定。所述氢键可以通过Watson Crick 碱基配对,Hoogstein结合或以任何其他序列特异性的方式发生。能够与给定序列杂交的序列称为给定序列的“互补序列”。
如本文所用,术语“细胞”,“细胞系”和“细胞培养物”可互换使用,并且所有这些名称包括后代。应理解,由于故意或无意的突变,所有后代的DNA 内容可能不完全相同。本发明包括了具有与原始细胞相同的功能或生物活性的变体后代。
RNA编辑方法
在一些实施方案中,本发明提供了用于编辑宿主细胞(例如,真核细胞) 中的靶标RNA的方法,包含将脱氨酶募集RNA(dRNA)或编码dRNA的构建体引入宿主细胞,其中所述dRNA包含与靶标RNA杂交的互补RNA序列,并且其中dRNA能够募集作用于RNA的腺苷脱氨酶(ADAR)以使靶标RNA中的靶标腺苷(A)脱氨基。
在一些实施方案中,本发明提供了用于编辑宿主细胞(例如,真核细胞) 中的靶标RNA的方法,包含将dRNA或编码dRNA的构建体引入宿主细胞,其中所述dRNA包含与靶标RNA杂交的互补RNA序列,并且其中所述dRNA 募集宿主细胞的内源表达的ADAR,以使靶标RNA中的靶标A脱氨基。在一些实施方案中,该方法不包含将任何蛋白质或编码蛋白质的构建体(例如, Cas,ADAR或ADAR和Cas的融合蛋白)引入宿主细胞。
在一些实施方案中,提供了用于编辑宿主细胞(例如,真核细胞)中的靶标RNA的方法,包含引入:(a)dRNA或编码dRNA的构建体,和(b)ADAR或编码ADAR的构建体到宿主细胞中,其中所述dRNA包含与靶标RNA杂交的互补RNA序列,并且其中所述dRNA募集ADAR,以使靶标RNA中的靶标A 脱氨基。在一些实施方案中,所述ADAR是宿主细胞的内源编码的ADAR,其中所述ADAR引入包含在宿主细胞中过表达ADAR。在一些实施方案中,所述ADAR对宿主细胞是外源的。在一些实施方案中,所述编码ADAR的构建体是载体,例如质粒,或病毒载体(例如,慢病毒载体)。
在一些实施方案中,提供了用于编辑宿主细胞(例如,真核细胞)中的多种(例如,至少约2、3、4、5、10、20、50、100或更多种)靶标RNA的方法,其包含引入多个dRNA或编码多个dRNA的构建体至宿主细胞,其中每个 dRNA包含与所述多个靶标RNA中的相应靶标RNA杂交的互补RNA序列,并且其中每个dRNA能够募集ADAR,以使相应靶标RNA的靶标A脱氨基。
在一些实施方案中,提供了用于编辑宿主细胞(例如,真核细胞)中的多个(例如,至少约2、3、4、5、10、20、50、100或更多个)靶标RNA的方法,其包含引入多个dRNA或编码多个dRNA的构建体至宿主细胞,其中每个 dRNA包含与所述多个靶标RNA的相应靶标RNA杂交的互补RNA序列,并且其中每个dRNA募集内源表达的ADAR,以使相应靶标RNA中的靶标A脱氨基。
在一些实施方案中,提供了用于编辑宿主细胞(例如,真核细胞)中的多种(例如,至少约2、3、4、5、10、20、50、100、1000或更多种)靶标RNA 的方法,包括引入(a)多个dRNA或者编码多个dRNA的构建体,和(b)ADAR 或者编码ADAR的构建体到宿主细胞中,其中每个dRNA包含互补RNA序列,其与所述多个靶标RNA中的相应靶标RNA杂交,并且其中每个dRNA募集 ADAR,以使相应靶标RNA中的靶标A脱氨基。
在一个方面,本申请提供了通过引入多种脱氨酶募集RNA,一种或多种编码脱氨酶募集RNA的构建体或本文所述的文库至宿主细胞,来编辑宿主细胞中的多种RNA的方法。
在某些实施方案中,用于编辑靶标RNA的方法包含引入多种脱氨酶募集 RNA或包含多种脱氨酶募集RNA的一种或多种构建体至宿主细胞中,以募集作用于RNA的腺苷脱氨酶(ADAR)以进行脱氨基反应(针对一个或多个靶标 RNA中的一个或多个靶标腺苷),其中每种脱氨酶募集RNA包含与相应靶标 RNA互补的RNA序列。
在一个方面,本申请提供了用于在宿主细胞(例如,真核细胞)中产生靶标RNA和/或由靶标RNA编码的蛋白质的一种或多种修饰的方法,包含引入dRNA或编码该dRNA的构建体到宿主细胞中,其中dRNA包含与靶标RNA杂交的互补RNA序列,并且其中所述一个或多个修饰选自下组:由靶标RNA 编码的蛋白质的点突变,由靶标RNA编码的蛋白质的错误折叠,靶标RNA 中的过早的终止密码子,靶标RNA中的异常剪接位点和靶标RNA中的可变剪接位点。
在一些实施方案中,本申请提供了用于在宿主细胞(例如,真核细胞)中恢复靶标RNA或由靶标RNA编码的蛋白质的表达或活性的方法,包括将 dRNA或编码该RNA的构建体引入宿主细胞,其中dRNA包含与靶标RNA杂交的互补RNA序列,其中靶标RNA具有G到A突变,导致在靶标RNA中过早的终止密码子,异常剪接位点或可变剪接位点,或蛋白质的错误折叠,其中 dRNA募集ADAR以编辑A突变,由此恢复靶标RNA或靶标RNA编码的蛋白质的表达或活性。
在某些实施方案中,用于在宿主细胞(例如,真核细胞)中产生多个靶标 RNA和/或由靶标RNA编码的蛋白质中的一种或多种修饰的方法包含引入多种脱氨酶募集RNA或编码多个脱氨酶募集RNA的构建体至宿主细胞中,其中每个dRNA包含与所述多个靶标RNA中的相应靶标RNA杂交的互补RNA序列,并且其中每个dRNA能够募集ADAR以使相应的靶标RNA的靶标A脱氨基。在一个方面,本申请提供了根据本文所述的dRNA的任何一种的脱氨酶募集RNA的用途,用于编辑宿主细胞中的靶标RNA。在某些实施方案中,脱氨酶募集RNA包含与待编辑的靶标RNA杂交的互补RNA序列。
在一个方面,本申请提供了根据本文所述的dRNA的任何一种的脱氨酶募集RNA的用途,用于在靶标RNA和/或由靶标RNA编码的蛋白质上产生一种或多种修饰,其中所述一种或多种修饰选自下组:由靶标RNA编码的蛋白质的点突变,由靶标RNA编码的蛋白质的错误折叠,靶标RNA中的过早的终止密码子,靶标RNA中的异常剪接位点,以及靶标RNA中的可变剪接位点。在某些实施方案中,所述脱氨酶募集RNA包含与待编辑的靶标RNA杂交的互补RNA序列。
本发明还涉及利用内源性腺苷脱氨酶编辑真核细胞中的靶标RNA的方法,包含将如本文所述的dRNA或编码dRNA的构建体引入真核细胞中以募集天然内源性腺苷脱氨酶(ADAR),其作用于RNA以对靶标RNA序列中的靶标腺苷进行脱氨基反应。
在根据本文描述的任何一种方法或用途的某些实施方案中,dRNA包含多于约40、45、50、55、60、65、70、75、80、90、100、110、120、130、 140、150、160、170、180、190、200、210、220、230、240或250个核苷酸中的任何一种。在某些实施方案中,dRNA为约40-260、45-250、50-240、 60-230、65-220、70-220、70-210、70-200、70-190、70-180、70-170、70-160、 70-150、70-140、70-130、70-120、70-110、70-100、70-90、70-80、75-200、 80-190、85-180、90-170、95-160、100-200、100-150、100-175、110-200、 110-175、110-150或105-140个核苷酸中的任何一种。在一些实施方案中, dRNA为约71个核苷酸长。在一些实施方案中,dRNA为约111个核苷酸长。
在根据本文描述的任何一种方法或用途的某些实施方案中,dRNA不包含ADAR-募集结构域。“ADAR-募集结构域”可以是与ADAR高亲和力结合的核苷酸序列或结构,或与在工程化的ADAR构建体中与ADAR融合的结合配偶体结合的核苷酸序列。示例性ADAR募集域包括,但不限于,GluR-2, GluR-B(R/G),GluR-B(Q/R),GluR-6(R/G),5HT2C和FlnA(Q/R)域;参见,例如Wahlstedt,Helene和Marie,"Site-selective versus promiscuous A-to-Iediting."Wiley Interdisciplinary Reviews:RNA 2.6(2011):761-771,其通过引用以其整体并入本文。在一些实施方案中,dRNA不包含双链部分。在一些实施方案中,dRNA不包含发夹,诸如MS2茎环。在一些实施方案中,dRNA 是单链的。在一些实施方案中,ADAR不包含DSB结合结构域。在一些实施方案中,dRNA由互补RNA序列组成(或基本上由其组成)。
在根据本文描述的任何一种方法或用途的某些实施方案中,dRNA不包含化学修饰。在一些实施方案中,dRNA不包含化学修饰的核苷酸,诸如2’-O- 甲基核苷酸或具有硫代磷酸酯键的核苷酸。在一些实施方案中,dRNA仅在前三个残基和后三个残基处包含2'-O-甲基和硫代磷酸酯键修饰。在一些实施方案中,dRNA不是反义寡核苷酸(ASO)。
在根据本文所述的方法或用途的任何一种的某些实施方案中,所述宿主细胞是原核细胞。在一些实施方案中,所述宿主细胞是真核细胞。在一些实施方案中,所述宿主细胞是哺乳动物细胞。在一些实施方案中,所述宿主细胞是人类细胞。在一些实施方案中,所述宿主细胞是小鼠细胞。在一些实施方案中,所述宿主细胞是植物细胞或真菌细胞。
在根据本文描述的任何一种方法或用途的一些实施方案中,宿主细胞是细胞系,诸如HEK293T,HT29,A549,HepG2,RD,SF268,SW13和HeLa 细胞。在一些实施方案中,宿主细胞是原代细胞,诸如成纤维细胞,上皮细胞或免疫细胞。在一些实施方案中,宿主细胞是T细胞。在一些实施方案中,宿主细胞是有丝分裂后细胞。在一些实施方案中,宿主细胞是中枢神经系统 (CNS)的细胞,诸如脑细胞,例如小脑细胞。
在一些实施方案中,提供了在原代宿主细胞(例如,T细胞或CNS细胞) 中编辑靶标RNA的方法,其包括将dRNA或编码该dRNA的构建体引入宿主细胞,其中dRNA包含与靶标RNA杂交的互补RNA序列,并且其中dRNA募集宿主细胞的内源表达的ADAR以使靶标RNA中的靶标A脱氨基。
在根据本文所述的方法或用途的任何一种的某些实施方案中,所述 ADAR对宿主细胞是内源的。在一些实施方案中,作用于RNA的腺苷脱氨酶 (ADAR)天然地或内源地存在于宿主细胞中,例如,天然地或内源地存在于真核细胞中。在一些实施方案中,所述ADAR由宿主细胞内源表达。在某些实施方案中,将所述ADAR外源引入宿主细胞中。在一些实施方案中,所述 ADAR是ADAR1和/或ADAR2。在某些实施方案中,所述ADAR是选自下组的一种或多种ADAR:hADAR1,hADAR2,小鼠ADAR1和ADAR2。在一些实施方案中,ADAR是ADAR1,诸如ADAR1的p110同种型(“ADAR1p110”)和/ 或ADAR1的p150同种型(“ADAR1p150”)。在一些实施方案中,ADAR是 ADAR2。在一些实施方案中,ADAR是宿主细胞表达的ADAR2,例如小脑细胞表达的ADAR2。
在一些实施方案中,ADAR是宿主细胞外源的ADAR。在一些实施方案中,ADAR是天然存在的ADAR的过度活跃的突变体。在一些实施方案中, ADAR是包含E1008Q突变的ADAR1。在一些实施方案中,ADAR不是包含结合结构域的融合蛋白。在一些实施方案中,ADAR不包含工程化的双链核酸结合结构域。在一些实施方案中,ADAR不包含与融合至dRNA中的互补 RNA序列的MS2发夹结合的MCP结构域。在一些实施方案中,ADAR不包括 DSB结合结构域。
在根据本文描述的任何一种方法或用途的一些实施方案中,宿主细胞具有高表达水平的ADAR1(诸如ADAR1p110和/或ADAR1p150),例如相对于β-微管蛋白的蛋白质表达水平的至少约10%,20%,50%,100%,2x,3x,5x 或更高中的任何一项。在一些实施方案中,宿主细胞具有高表达水平的 ADAR2,例如相对于β-微管蛋白的蛋白质表达水平的至少约10%,20%, 50%,100%,2x,3x,5x或更高中的任何一项。在一些实施方案中,宿主细胞具有低表达水平的ADAR3,例如相对于β-微管蛋白的蛋白质表达水平不超过约5x,3x,2x,100%,50%,20%或更少中的任何一项。
在根据本文所述的方法或用途的任何一种的某些实施方案中,所述互补 RNA序列包含与靶标RNA中的靶标A正对的胞苷、腺苷或尿苷。在一些实施方案中,互补RNA序列包含与靶标RNA中的靶标A正对的胞苷错配。在一些实施方案中,胞苷错配位于距互补RNA序列的5'端至少5个核苷酸,例如至少 10、15、20、25、30或更多个核苷酸。在一些实施方案中,胞苷错配位于距互补RNA序列的3'端至少20个核苷酸,例如至少25、30、35或更多个核苷酸。在一些实施方案中,胞苷错配不位于距互补RNA序列的3'端20(例如15、10、 5或更少)个核苷酸内。在一些实施方案中,胞苷错配位于距互补RNA序列的 3'端至少20个核苷酸(例如,至少25、30、35或更多个核苷酸)和5'端至少5个核苷酸(例如,至少10、15、20,25、30或更多个核苷酸)。在一些实施方案中,胞苷错配位于互补RNA序列的中心。在一些实施方案中,胞苷错配位于 dRNA中互补序列中心的20个核苷酸(例如15、10、9、8、7、6、5、4、3、2 或1个核苷酸)内。
在根据本文描述的任何一种方法或用途的某些实施方案中,互补RNA序列还包含一个或多个鸟苷,诸如1、2、3、4、5、6或多个G,分别与靶标RNA 中的非靶标腺苷正对。在一些实施方案中,互补RNA序列包含与靶标RNA 中的非靶腺苷相对的两个或更多个连续错配核苷酸(例如2、3、4、5或更多个错配核苷酸)。在一些实施方案中,靶标RNA包含不超过约20个非靶标A,诸如不超过约15、10、9、8、7、6、5、4、3、2或1个非靶标A中的任何一项。与非靶标A相对的G和连续错配核苷酸可降低ADAR的脱靶编辑作用。
在根据本文描述的任何一种方法或用途的某些实施方案中,靶标A的5' 侧最近邻位是选自U,C,A和G的核苷酸,优先度U>C≈A>G且靶标A的3'侧最近邻位是选自G,C,A和U的核苷酸,优先度G>C>A≈U。在某些实施方案中,靶标RNA中的靶标A是选自下组的三碱基基序:UAG,UAC,UAA, UAU,CAG,CAC,CAA,CAU,AAG,AAC,AAA,AAU,GAG,GAC, GAA和GAU。在某些实施方案中,所述三碱基基序是UAG,并且所述dRNA 包含与所述三碱基基序中的U正对的A,与所述靶标A正对的C,和与三碱基基序中的G正对的C,G或U。在某些实施方案中,所述三碱基基序是靶标RNA 中的UAG,并且所述dRNA包含与靶标RNA的UAG相对的ACC,ACG或 ACU。在某些实施方案中,三碱基基序是靶标RNA中的UAG,并且dRNA包含与靶标RNA的UAG相对的ACC。
在根据本文所述的方法或用途的任何一种的某些实施方案中,所述靶标 RNA是选自下组的任何一种:前信使RNA,信使RNA,核糖体RNA,转移 RNA,长非编码RNA和小RNA(例如,miRNA)。在一些实施方案中,靶标 RNA是前信使RNA。在一些实施方案中,靶标RNA是信使RNA。
在根据本文描述的任何一种方法或用途的某些实施方案中,该方法进一步包括将ADAR3的抑制剂引入宿主细胞。在一些实施方案中,ADAR3的抑制剂是针对ADAR3的RNAi,诸如针对ADAR3的shRNA或针对ADAR3的 siRNA。在一些实施方案中,该方法进一步包括将干扰素的刺激物引入宿主细胞。在一些实施方案中,ADAR可由干扰素诱导,例如,ADAR是ADARp150。在一些实施方案中,干扰素的刺激物是IFN。在一些实施方案中,ADAR3 的抑制剂和/或干扰素的刺激物由编码dRNA的相同构建体(例如,载体)编码。
在根据本文描述的任何一种方法或用途的某些实施方案中,靶标RNA的编辑效率为至少约5%,诸如至少约6%,7%,8%,9%,10%,15%,20%, 25%,30%,35%,40%,45%,50%,55%,60%,65%或更高中的任何一项。在一些实施方案中,在体内(例如,在动物中)编辑靶标RNA的效率为至少约5%(例如,至少约7%)。在一些实施方案中,在体外或离体在细胞中编辑靶标RNA的效率为至少约10%(例如,至少约15%)。在一些实施方案中,编辑的效率通过Sanger测序来确定。在一些实施方案中,编辑的效率由下一代测序确定。
在根据本文描述的任何一种方法或用途的某些实施方案中,该方法具有低的脱靶编辑率。在一些实施方案中,该方法对靶标RNA中的非靶标A具有低于约1%(例如,不超过约0.5%,0.1%,0.05%,0.01%,0.001%或更低中的任何一项)的编辑效率。在一些实施方案中,该方法不编辑靶标RNA中的非靶标A。在一些实施方案中,该方法对非靶标RNA中的A具有低于约0.1% (例如,不超过约0.05%,0.01%,0.005%,0.001%,0.0001%或更低中的任何一项)的编辑效率。
在根据本文描述的任何一种方法或用途的某些实施方案中,该方法不诱导免疫应答,诸如先天免疫应答。在一些实施方案中,该方法不诱导宿主细胞中干扰素和/或白介素的表达。在一些实施方案中,该方法在宿主细胞中不诱导IFN-β和/或IL-6表达。
本发明还提供了经编辑的RNA或宿主细胞,所述宿主细胞具有通过本文所述的方法的任何一种所产生的经编辑的RNA。在一些实施方案中,经编辑的RNA包含肌苷。在一些实施方案中,所述宿主细胞包含具有错义突变,过早的终止密码子,可变剪接位点或异常剪接位点的RNA。在一些实施方案中,所述宿主细胞包含突变的,截短的或错误折叠的蛋白质。
如本文所述的“宿主细胞”是指可用作宿主细胞的任何细胞类型,前提是其可如本文所述的被修饰。例如,所述宿主细胞可以是具有作用于RNA的内源性表达的腺苷脱氨酶(ADAR)的宿主细胞,或者可以是通过本领域已知的方法引入作用于RNA的腺苷脱氨酶(ADAR)的宿主细胞。例如,所述宿主细胞可以是原核细胞,真核细胞或植物细胞。在一些实施方案中,所述宿主细胞源自预先建立的细胞系,例如哺乳动物细胞系,包括人类细胞系或非人类细胞系。在一些实施方案中,所述宿主细胞源自个体,例如人类个体。
本文使用的“引入(introducing)”或“引入(introduction)”是指将一种或多种多核苷酸(例如dRNA)或一种或多种构建体(包括本文所述的载体,它的一种或多种转录物)递送至所述宿主细胞。本发明用作能够打靶地编辑RNA 的基础平台,例如,前信使RNA,信使RNA,核糖体RNA,转移RNA,长非编码RNA和小RNA(例如miRNA)。本申请的方法可以采用许多递送系统,包括但不限于:病毒,脂质体,电穿孔,显微注射和接合作用,以实现如本文所述的dRNA或构建体向宿主细胞中的引入。常规的基于病毒和非病毒的基因转移方法可用于将核酸引入哺乳动物细胞或靶标组织。此类方法可用于将编码本申请的dRNA的核酸施用于培养的细胞或宿主生物体中。非病毒载体递送系统包括DNA质粒,RNA(例如本文所述的构建体的转录物),裸核酸和与递送载体复合的核酸,例如脂质体。所述病毒载体递送系统包括DNA和RNA病毒,其具有游离或整合的基因组以递送至所述宿主细胞。
非病毒递送核酸的方法包括脂质转染,核转染,显微注射,生物射弹,病毒体,脂质体,免疫脂质体,聚合阳离子或脂质:核酸接合物,电穿孔,纳米颗粒,外泌体,微泡或基因枪,裸DNA和人工病毒粒子。
使用基于RNA或DNA病毒的系统来递送核酸在使病毒打靶特定细胞和使病毒的有效负载运输到细胞核方面具有高效率。
在根据本文描述的任何一种方法或用途的某些实施方案中,该方法包括将编码dRNA的病毒载体(诸如,慢病毒载体)引入宿主细胞。在一些实施方案中,病毒载体是AAV,例如AAV8。在一些实施方案中,该方法包括将编码 dRNA的质粒引入宿主细胞。在一些实施方案中,该方法包括将dRNA(例如,合成dRNA)引入(例如,通过电穿孔)到宿主细胞中。在一些实施方案中,该方法包括将dRNA转染到宿主细胞中。
在脱氨基之后,根据靶标RNA中的靶标腺苷的位置,可以使用不同方法确定靶标RNA和/或靶标RNA编码的蛋白质的修饰。例如,为了确定在靶标 RNA中是否已将“A”编辑为“I”,可以使用本领域已知的RNA测序方法来检测 RNA序列的修饰。当靶标腺苷位于mRNA的编码区中时,RNA编辑可以引起 mRNA编码的氨基酸序列的改变。例如,可以将点突变引入mRNA,或者 mRNA中的先天的或获得性的点突变被回复以产生野生型基因产物,因为“A”转化为了“I”。通过本领域已知的方法进行氨基酸测序可用于发现编码蛋白质中氨基酸残基的任何变化。终止密码子的修饰可以通过评估功能性的、伸长的、截短的、全长的和/或野生型的蛋白质的存在来确定。例如,当靶标腺苷位于UGA,UAG或UAA终止密码子中时,靶标A(UGA或UAG)或多个 A(UAA)的修饰可创造出通读突变和/或延长的蛋白质,或者,由靶标RNA编码的截短蛋白质可以被回复以产生有功能的、全长的和/或野生型的蛋白质。靶标RNA的编辑还可以在靶标RNA中产生异常剪接位点和/或可变的剪接位点,从而导致延长的,截短的或错误折叠的蛋白质,或者靶标RNA中经编码的异常剪接或可变剪接位点经回复以产生有功能的、正确折叠的、全长的和 /或野生型的蛋白质。在一些实施方案中,本申请考虑编辑先天的和获得性的基因变化,例如,错义突变,过早的终止密码子,异常剪接或由靶标RNA编码的可变剪接位点。使用已知方法评估由靶标RNA编码的蛋白质的功能,可以发现RNA编辑是否实现了期望的效果。因为腺苷(A)对肌苷(I)的脱氨基可以纠正编码蛋白质的突变RNA中的靶标位置处的突变A,所以对脱氨基为肌苷的鉴定可以提供功能蛋白质是否存在的评估,或者突变的腺苷引起的、与疾病或药物抗性相关的RNA是否已回复或部分回复的评估。类似地,因为腺苷(A)对肌苷(I)的脱氨基作用可能在所得蛋白质中引入点突变,所以对脱氨基为肌苷的鉴定可以找出疾病原因或疾病相关因素的功能性指征。
当靶标腺苷的存在引起异常剪接时,读出值可以是异常剪接的发生和频率的评估。另一方面,当期望的目标腺苷的脱氨基作用被引入剪接位点时,可以使用类似的方法来检查是否发生所需的剪接类型。使用本领域技术人员熟知的方法在靶标腺苷脱氨基之后鉴别出肌苷存在的示例性合适方法是 RT-PCR和测序。
靶标腺苷的脱氨作用包括例如点突变,过早的终止密码子,异常剪接位点,可变剪接位点和所得蛋白质的错误折叠。这些效应可以诱导与疾病相关的RNA和/或蛋白质的结构和功能变化,无论它们是先天遗传的还是由获得性基因突变引起的,或者可以诱导与耐药性发生相关的RNA和/或蛋白质的结构和功能变化。因此,通过改变与疾病相关的RNA和/或蛋白质的结构和/ 或功能,可以将dRNA,编码dRNA的构建体和本申请的RNA编辑方法用于预防或治疗遗传性疾病或病症,或与获得性基因突变相关的疾病或病症。
在一些实施方案中,靶标RNA是调节RNA。在一些实施方案中,待编辑的靶标RNA是核糖体RNA,转移RNA,长非编码RNA或小RNA(例如, miRNA,pri-miRNA,pre-miRNA,piRNA,siRNA,snoRNA,snRNA,exRNA 或scaRNA)。靶标腺苷的脱氨基作用包括例如核糖体RNA,转移RNA,长非编码RNA或小RNA(例如,miRNA),包括了三维结构和/或功能损失或功能获得的变化。在一些实施方案中,靶标RNA中靶标A的脱氨基作用改变了靶标RNA的一种或多种下游分子(例如,蛋白质,RNA和/或代谢物)的表达水平。所述下游分子的表达水平的变化可以是表达水平的增加或减少。
本申请的一些实施方案涉及宿主细胞中靶标RNA的多重编辑,其可用于筛选靶标基因的不同变体或宿主细胞中的不同基因。在一些实施方案中,其中所述方法包含将多个dRNA引入所述宿主细胞,所述多个dRNA中的至少两个dRNA具有不同的序列和/或具有不同的靶标RNA。在一些实施方案中,每种dRNA具有不同的序列和/或不同的靶标RNA。在一些实施方案中,该方法在宿主细胞中的单个靶标RNA中产生多个(例如,至少2、3、5、10、50、100、1000或更多个)修饰。在一些实施方案中,该方法产生宿主细胞中多种(例如,至少2、3、5、10、50、100、1000或更多种)靶标RNA的修饰。在一些实施方案中,该方法包含:编辑多个宿主细胞群中的多个靶标RNA。在一些实施方案中,每个宿主细胞群接收不同的dRNA或具有与其他宿主细胞群不同的靶标RNA的dRNA。
脱氨酶募集RNA,构建体和文库
在一个方面,本申请提供了可用于本文所述方法的任何一种的脱氨酶募集RNA。本节中描述的任何一种dRNA可用于本文所述的RNA编辑和治疗方法中。设定本文描述的dRNA的任何特征和参数可以彼此组合,就好像每个组合被单独描述一样。本文描述的dRNA不包含CRISPR/Cas系统中使用的 tracrRNA,crRNA或gRNA。
在一些实施方案中,提供了一种脱氨酶募集RNA(dRNA),其通过募集 ADAR对靶标RNA中的靶标腺苷进行脱氨基作用,所述ADAR包含与靶标 RNA杂交的互补RNA序列。
在一个方面,本发明提供了包含本文所述的任何一种脱氨酶募集RNA的构建体。在某些实施方案中,所述构建体是病毒载体(诸如慢病毒载体)或质粒。在一些实施方案中,病毒载体是AAV,诸如AAV8。在一些实施方案中,所述构建体编码单个dRNA。在一些实施方案中,所述构建体编码多个(例如,约1、2、3、4、5、10、20或更多个中的任一项)dRNA。
在一个方面,本申请提供了包含多种脱氨酶募集RNA或本文所述的多种构建体的文库。
在一个方面,本申请提供了包含所述脱氨酶募集RNA或本文所述构建体的组合物或宿主细胞。在某些实施方案中,所述宿主细胞是原核细胞或真核细胞。优选地,所述宿主细胞是哺乳动物细胞。最优选地,所述宿主细胞是人类细胞。
在根据本文所述的dRNA,构建体,文库或组合物中的任一种的某些实施方案中,所述互补RNA序列包含直接与靶标腺苷相对的胞苷,腺苷或尿苷 (其在靶标RNA中待编辑)。在某些实施方案中,所述互补RNA序列还包含一种或多种鸟苷,其各自与靶标RNA中的非靶标腺苷正对。在某些实施方案中,靶标A的5'侧最近邻位是选自U,C,A和G的核苷酸,优先度U>C≈A>G且靶标A的3'侧最近邻位是选自G,C,A和U的核苷酸,优先度G>C>A≈U。在一些实施方案中,靶标A的5'侧最近邻位是U。在一些实施例中,靶标A的5'侧最近邻位是C或A。在一些实施例中,靶标A的3'侧最近邻位是G。在一些实施方案中,靶标A的3'侧最近邻位是C。
在根据本文所述的dRNA,构建体,文库或组合物中的任一种的某些实施方案中,靶标RNA中的靶标A是选自下组的三碱基基序:UAG,UAC, UAA,UAU,CAG,CAC,CAA,CAU,AAG,AAC,AAA,AAU,GAG, GAC,GAA和GAU。在某些实施方案中,所述三碱基基序是UAG,并且dRNA包含与三碱基基序中的U正对的A,与靶标A正对的C,和与三碱基基序中的 G正对的C,G或U。在某些实施方案中,所述三碱基基序是靶标RNA中的 UAG,并且所述dRNA包含与靶标RNA的UAG相对的ACC,ACG或ACU。
在一些实施方案中,dRNA包含与靶标RNA中的靶标A正对的胞苷错配。在一些实施方案中,胞苷错配靠近互补RNA序列的中心,诸如在距互补RNA 序列的中心20、15、10、5、4、3、2或1个核苷酸内。在一些实施方案中,胞苷错配距互补RNA序列的5'末端至少5个核苷酸。在一些实施方案中,胞苷错配距互补RNA序列的3'末端至少20个核苷酸。
在根据本文所述的dRNA,构建体,文库或组合物中的任一种的某些实施方案中,所述dRNA包含多于大约40、45、50、55、60、65、70、75、80、 90,100、110、120、130、140、150、160、170、180、190、200、210、220、 230、240或250个核苷酸中的任一项。在某些实施方案中,所述dRNA的长度为40-260、45-250、50-240、60-230、65-220、70-210、70-200、70-190、70-180、70-170,70-160、70-150、70-140、70-130、70-120、70-110、70-100、70-90、 70-80、75-200、80-190、85-180、90-170、95-160、100-150或105-140个核苷酸中的任一项。
在一些实施方案中,dRNA包含SEQ ID NO:25-44、142-205、341-342 中任一项的核酸序列。
本申请的dRNA包含与靶标RNA杂交的互补RNA序列。所述互补RNA序列与靶标RNA完全互补或基本上互补,以允许互补RNA序列与靶标RNA杂交。在一些实施方案中,所述互补RNA序列具有100%的与靶标RNA的序列互补性。在一些实施方案中,所述互补RNA序列具有至少大约70%,80%, 85%,90%,95%,96%,97%,98%或99%或更高的任一项的互补性(在至少约为靶标RNA中20、40、60、80、100、150、200或更多个核苷酸中的任何一项的连续伸长(stretch)内)。在一些实施方案中,通过互补RNA序列和靶标RNA之间的杂交形成的dsRNA具有一个或多个(例如,1、2、3、4、5、 6、7、8、9、10或更多个)非Watson-Crick碱基对(即错配)。
ADAR,例如,人类ADAR酶编辑具有不同特异性的双链RNA(dsRNA) 结构,这取决于许多因素。一个重要因素是构成dsRNA序列的两条链的互补程度。所述dRNA和靶标RNA之间的完美互补性通常导致ADAR的催化结构域以非判别性方式使腺苷脱氨基。可以通过在dsRNA区域中引入错配来修饰 ADAR的特异性和效率。例如,优选推荐A-C错配以增加待编辑的腺苷脱氨的特异性和效率。相反,在除了靶标A的其他A(腺苷)位置(即“非靶标A”), G-A错配可以减少脱靶编辑。所述dRNA与其靶标RNA之间的dsRNA形成不一定需要完美的互补性,前提是dRNA和靶标RNA之间的杂交和dsRNA的生成具有实质的互补性。在一些实施方案中,其dRNA序列或单链RNA区域具有至少约70%,80%,85%,90%,95%,96%,97%,98%或99%序列中的任何一项的与靶标RNA的互补性(当理想比对时)。可以使用用于对准序列的任何合适的算法来确定理想比对,其非限制性的示例包括Smith-Waterman 算法,Needleman-Wimsch算法,基于Burrows-Wheeler变换的算法(例如 Burrows WheelerAligner)。
与靶标腺苷相邻的核苷酸也影响脱氨基的特异性和效率。例如,在靶标 RNA序列中待编辑的靶标腺苷的5'侧最近邻位具有优先度U>C≈A>G并且在靶标RNA序列中待编辑的靶标腺苷的3'侧最近邻位具有在腺苷脱氨基的特异性和效率方面的优先度:G>C>A≈U。在一些实施方案中,当在靶标RNA中靶标腺苷可以是选自下组的三碱基基序:UAG,UAC,UAA,UAU,CAG, CAC,CAA,CAU,AAG,AAC,AAA,AAU,GAG,GAC,GAA和GAU 时,所述腺苷脱氨基的特异性和效率高于其他的三碱基基因中的腺苷。在一些实施方案中,待编辑的靶标腺苷处于三碱基基序UAG,UAC,UAA,UAU, CAG,CAC,AAG,AAC或AAA中时,所述腺苷脱氨基的效率高于其他基序中的腺苷。对于相同的三碱基基序,dRNA的不同设计也可导致不同的脱氨基效率。以三碱基基序UAG为例,在一些实施方案中,当dRNA包含与待编辑的靶标腺苷正对的胞苷(C)时,所述腺苷(A)直接与尿苷相对,而胞苷(C),鸟苷(G)或尿苷(U)与鸟苷正对,靶标腺苷脱氨基的效率高于使用其他dRNA 序列的脱氨基的效率。在一些实施方案中,当dRNA包含与靶标RNA的UAG 相对的ACC,ACG或ACU时,所述靶标RNA的UAG中A的编辑效率可达到约 25%-30%。
除了靶标腺苷外,靶标RNA中可能存在一种或多种不希望编辑的腺苷。对于这些腺苷,优选尽可能降低它们的编辑效率。本发明发现,鸟苷与靶标 RNA中的腺苷正对处,脱氨基效率显着降低。因此,为了减少脱靶脱氨基作用,可以将dRNA设计成包含一种或多种鸟苷,其直接与靶标RNA中除待编辑的靶标腺苷之外的一种或多种腺苷相对。
编辑靶标RNA序列的所需特异性水平和效率可取决于不同的应用。按照本专利申请中的说明,本领域技术人员将能够根据其需要设计具有与靶标 RNA序列互补或基本上互补的序列的dRNA,并且通过一些试验和错误,获得他们期望的结果。如本文所用,术语“错配”是指双链RNA(dsRNA)中相对的核苷酸,其根据Watson-Crick碱基配对规则不形成完美的碱基对。错配碱基对包括:例如G-A,C-A,U-C,A-A,G-G,C-C,U-U碱基对。以A-C匹配为例,其中靶标A在靶标RNA中被编辑,dRNA被设计为包含与待编辑的A 相对的C,在通过靶标RNA和dRNA之间的杂交形成的dsRNA中产生A-C错配。
在一些实施方案中,通过dRNA和靶标RNA之间的杂交形成的dsRNA不包含错配。在一些实施方案中,通过dRNA和靶标RNA之间的杂交形成的 dsRNA包含一个或多个,例如1、2、3、4、5、6、7或更多个错配中的任何一个(例如,不同类型错配中相同类型的错配)。在一些实施方案中,通过dRNA 和靶标RNA之间的杂交形成的dsRNA包含一种或多种错配,例如,选自G-A, C-A,U-C,A-A,G-G,C-C和U-U中的1、2、3、4、5、6、7种错配。
通过dRNA和靶标RNA之间的杂交形成的dsRNA中的错配核苷酸可以形成凸起,其可以提高靶标RNA的编辑效率。可能存在一个(仅在靶标腺苷处形成)或更多个由错配形成的凸起。额外的诱发凸起的错配可以在靶标腺苷的上游和/或下游。所述凸起可以是单错配凸起(由一个错配的碱基对引起)或多错配的凸起(由多于一个连续的错配碱基对引起,优选两个或三个连续的错配碱基对)。
dRNA中的互补RNA序列是单链的。所述dRNA可以是完全单链的或具有一个或多个(例如,1、2、3或更多个)双链区和/或一个或多个茎环区。在一些实施方案中,互补RNA序列是至少约40、45、50、55、60、65、70、75、 80、90、100、110、120、130、140、150、160、170、180、190、200或更多个核苷酸中的任何一项。在某些实施方案中,互补RNA序列的长度为 40-260、45-250、50-240、60-230、65-220、70-220、70-210、70-200、70-190、70-180、70-170、70-160、70-150、70-140、70-130、70-120、70-110、70-100、 70-90、70-80、75-200、80-190、85-180、90-170、95-160、100-200、100-150、 100-175、110-200、110-175、110-150或105-140个核苷酸中的任一项。在一些实施方案中,互补RNA序列为约71个核苷酸长。在一些实施方案中,互补 RNA序列为约111个核苷酸长。
在一些实施方案中,除互补RNA序列外,dRNA还可包含用于稳定dRNA 的区域,例如,一个或多个双链区和/或茎环区。在一些实施方案中,dRNA 的双链区或茎环区可包含不超过约200、150、100、50、40、30、20、10个或更少个碱基对中的任一项。在一些实施方案中,dRNA不包含茎环或双链区。在一些实施方案中,dRNA包含ADAR募集结构域。在一些实施方案中, dRNA不包含ADAR募集结构域。
所述dRNA可包含一个或多个修饰。在一些实施方案中,dRNA具有一个或多个经修饰的核苷酸,包括核碱基修饰和/或骨架修饰。对RNA的示例性修饰包括但不限于:硫代磷酸酯骨架修饰,核糖中的2'-取代(例如2'-O-甲基和2'-氟取代),LNA和L-RNA。在一些实施方案中,所述dRNA不具有对核碱基或骨架的修饰。
本申请还考虑包含本文所述dRNA的构建体。如本文所用的术语“构建体”是指包含编码核苷酸序列的DNA或RNA分子,所述编码核苷酸序列可以转录成RNA或表达成蛋白质。在一些实施方案中,所述构建体含有一个或多个调控元件,其可操作地连接于编码RNA或蛋白质的核苷酸序列。当所述构建体被引入宿主细胞时,在合适的条件下,所述构建体中的编码核苷酸的序列可以被转录或表达。
在一些实施方案中,所述构建体包含与编码核苷酸序列可操作地连接或空间连接的启动子,使得所述启动子控制编码核苷酸序列的转录或表达。所述启动子可位于其控制下的编码核苷酸序列的5'侧(上游)。所述启动子和编码序列之间的距离可以与该启动子与其起源于启动子的基因中它控制的基因之间的距离大致相同。如本领域所知,可以适应该距离的变化而不丧失启动子功能。在一些实施方案中,所述构建体包含5'UTR和/或3'UTR,其调节编码核苷酸序列的转录或表达。
在一些实施方案中,所述构建体是编码本申请中公开的任何一种dRNA 的载体。术语“载体”是指能够转运与其连接的另一种核酸的核酸分子。所述载体包括但不限于单链,双链或部分双链的核酸分子;包含一个或多个游离末端的,没有游离末端的(例如环状)核酸分子;包含DNA,RNA或两者的核酸分子;以及本领域已知的其他多核苷酸种类。一种类型的载体是“质粒”,它是指环状的双链DNA环,其中可以插入额外的DNA区段,例如通过标准分子克隆技术。某些载体能够在引入它们的宿主细胞中自主复制(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到宿主细胞的基因组中,由此与宿主基因组一起复制。此外,某些载体能够指导它们可操作地连接的编码核苷酸序列的转录或表达。此类载体在本文中称为“表达载体”。
所述重组表达载体可以包含适合于在宿主细胞中转录或表达核酸的形式的本发明的核酸。在一些实施方案中,所述重组表达载体包括一种或多种调节元件,其可以基于待用于转录或表达的宿主细胞进行选择,其与待转录或表达的核酸序列可操作地连接。在所述重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以允许核苷酸序列表达的方式与调节元件连接(例如在体外的或在宿主细胞中的转录/翻译系统中,当载体被引入所述宿主细胞时)。
在一些实施方案中,提供了构建体(例如,载体,例如病毒载体),其包含编码dRNA的核苷酸序列。在一些实施方案中,提供了构建体(例如,载体,诸如病毒载体),其包含编码所述ADAR的核苷酸序列。在一些实施方案中,提供了构建体,其包含编码所述dRNA的第一核苷酸序列和编码所述ADAR 的第二核苷酸序列。在一些实施方案中,第一核苷酸序列和第二核苷酸序列与相同的启动子可操作地连接。在一些实施方案中,第一核苷酸序列和第二核苷酸序列与不同的启动子可操作地连接。在一些实施方案中,所述启动子是可诱导的。在一些实施方案中,所述构建体不编码ADAR。在一些实施方案中,载体还包含编码ADAR3的抑制剂(例如,ADAR3 shRNA或siRNA)和/ 或干扰素的刺激物(例如,IFN-α)的核酸序列。在一些实施方案中,构建体是 AAV,诸如AAV8。
治疗方法
本文所述的RNA编辑方法和组合物可用于治疗或预防个体的疾病或病症,包括但不限于:遗传性的基因疾病以及耐药性。
在一些实施方案中,提供了一种离体编辑个体(例如人类个体)细胞中的靶标RNA的方法,包括使用本文所述的任何一种RNA编辑方法编辑靶标 RNA。
在一些实施方案中,提供了一种离体编辑个体(例如人类个体)细胞中的靶标RNA的方法,包括将dRNA或编码该dRNA的构建体引入个体的细胞中,其中所述dRNA包含与靶标RNA杂交的互补RNA序列,并且其中所述dRNA 能够募集ADAR以使靶标RNA中的靶标A脱氨基。在一些实施方案中,所述靶标RNA与个体的疾病或病症相关。在一些实施方案中,所述疾病或病症是遗传性的基因疾病或与一种或多种获得性基因突变(例如,抗药性)相关的疾病或病症。在一些实施方案中,该方法还包含从个体获得细胞。
在一些实施方案中,提供了一种在患有疾病或病症的个体的细胞中恢复靶标RNA或由靶标RNA编码的蛋白质的表达或活性的方法,包括使用本文所述的RNA编辑方法的任何一种方法编辑靶标RNA,其中靶标RNA具有与疾病或病症相关的G至A突变。在一些实施方案中,该方法离体在来自个体的分离的细胞上进行。在一些实施方案中,该方法在体内进行。
在一些实施方案中,提供了治疗或预防个体(例如,人类个体)中的疾病或病症的方法,包含使用本文描述的RNA编辑方法的任何一种编辑个体细胞中与疾病或病症相关的靶标RNA。
在一些实施方案中,提供了治疗或预防个体(例如,人类个体)中的疾病或病症的方法,包括将dRNA或编码该dRNA的构建体引入从个体离体的分离细胞中,其中所述dRNA包含与和疾病或病症相关的靶标RNA杂交的互补 RNA序列,并且其中所述dRNA能够募集ADAR以使靶标RNA中的靶标A脱氨基。在一些实施方案中,所述ADAR是分离细胞中的内源表达的ADAR。在一些实施方案中,该方法包含将ADAR或编码该ADAR的构建体引入分离的细胞。在一些实施方案中,该方法还包含培养具有经编辑的RNA的细胞。在一些实施方案中,该方法还包含向个体施用具有经编辑的RNA的细胞。在一些实施方案中,所述疾病或病症是遗传性的基因疾病或与一种或多种获得性基因突变(例如抗药性)相关的疾病或病症。
在一些实施方案中,提供了治疗或预防个体(例如,人类个体)中的疾病或病症的方法,包含将dRNA或编码该dRNA的构建体引入从个体离体的分离细胞中,其中所述dRNA包含与和疾病或病症相关的靶标RNA杂交的互补RNA序列,并且其中所述dRNA能够募集宿主细胞的内源表达的ADAR以使所述靶标RNA中的靶标A脱氨基。在一些实施方案中,该方法还包含培养具有经编辑的RNA的细胞。在一些实施方案中,该方法还包含向个体施用具有经编辑的RNA的细胞。在一些实施方案中,所述疾病或病症是遗传性的基因疾病或与一种或多种获得性基因突变(例如抗药性)相关的疾病或病症。
在一些实施方案中,提供了治疗或预防个体(例如,人类个体)中的疾病或病症的方法,包含向个体施用有效量的dRNA或编码该dRNA的构建体,其中所述dRNA包含与和疾病或病症相关的靶标RNA杂交的互补RNA序列,并且其中所述dRNA能够募集ADAR以使靶标RNA中的靶标A脱氨基。在一些实施方案中,所述ADAR是个体细胞中的内源表达的ADAR。在一些实施方案中,该方法包含向个体施用ADAR或编码该ADAR的构建体。在一些实施方案中,所述疾病或病症是遗传性的基因疾病或与一种或多种获得性基因突变 (例如抗药性)相关的疾病或病症。
适用于使用本申请的方法治疗的疾病和病症包括与突变相关的疾病,诸如G至A突变,例如导致RNA转录物中的错义突变,过早的终止密码子,异常剪接或可变剪接的G至A突变。可以通过本申请的方法恢复的与疾病相关的突变的例子包括但不限于与癌症相关的TP53W53X(例如,158G>A),I型粘多糖贮积病(MPS I)与IDUAW402X(例如,外显子9中的TGG>TAG突变),与埃勒斯 -当洛斯综合征相关的COL3A1W1278X(例如3833G>A突变),与原发性肺动脉高压相关的BMPR2W298X(例如893G>A),与朱伯特综合征相关的AHI1W725X(例如 2174G>A),与范科尼贫血相关的FANCCW506X(例如1517G>A),与原发性家族性肥厚性心肌病相关的MYBPC3W1098X(例如3293G>A),和与X染色体连锁性严重联合免疫缺陷症相关的IL2RGW237X(例如710G>A)。在一些实施方案中,疾病或病症是癌症。在一些实施方案中,该疾病或病症是单基因疾病。在一些实施方案中,该疾病或病症是多基因疾病。
在一些实施方案中,提供了治疗与个体中具有突变(例如,G>A突变)的靶标RNA相关的癌症的方法,其包括将dRNA或编码dRNA的构建体引入从个体离体的分离细胞中,其中dRNA包含与靶标RNA杂交的互补RNA序列,并且其中dRNA能够募集ADAR以使靶标RNA中的靶标A脱氨基,由此拯救靶标RNA中的突变。在一些实施方案中,ADAR是分离的细胞中内源表达的 ADAR。在一些实施方案中,该方法包括将ADAR或编码ADAR的构建体引入分离的细胞。在一些实施方案中,靶标RNA是TP53W53X(例如158G>A)。在一些实施方案中,dRNA包含SEQ IDNO:195、196或197的核酸序列。
在一些实施方案中,提供了一种用个体中具有突变(例如,G>A突变)的靶标RNA治疗或预防癌症的方法,其包括向个体施用有效量的dRNA或编码该dRNA的构建体。其中dRNA包含与与疾病或病症相关的靶标RNA杂交的互补RNA序列,并且其中dRNA能够募集ADAR使靶标RNA中的靶标A脱氨基,从而拯救靶标RNA的突变。在一些实施方案中,ADAR是个体细胞中内源表达的ADAR。在一些实施方案中,该方法包括向个体施用ADAR或编码 ADAR的构建体。在一些实施方案中,靶标RNA是TP53W53X(例如158G>A)。在一些实施方案中,dRNA包含SEQ IDNO:195、196或197的核酸序列。
在一些实施方案中,提供了一种治疗与个体中具有突变(例如,G>A突变)的靶标RNA相关的MPS I(例如,Hurler综合征或Scheie综合征)的方法,包括dRNA或将编码dRNA的构建体引入从个体离体的分离细胞中,其中dRNA 包含与靶标RNA杂交的互补RNA序列,并且其中dRNA能够募集ADAR以使靶标RNA中的靶标A脱氨基,由此而拯救靶标RNA中的突变。在一些实施方案中,ADAR是分离的细胞中内源表达的ADAR。在一些实施方案中,该方法包括将ADAR或编码ADAR的构建体引入分离的细胞。在一些实施方案中,靶标RNA是IDUAW402X(例如,外显子9中的TGG>TAG突变)。在一些实施方案中,dRNA包含SEQ ID NO:204或205的核酸序列。
在一些实施方案中,提供了用个体中具有突变(例如,G>A突变)的靶标 RNA治疗或预防MPS I(例如,Hurler综合征或Scheie综合征)的方法,包括向个体施用有效量的dRNA或编码dRNA的构建体,其中dRNA包含与与疾病或病症相关的靶标RNA杂交的互补RNA序列,并且其中dRNA能够募集ADAR 以使靶标RNA中的靶标A脱氨基,由此拯救了靶标RNA中的突变。在一些实施方案中,ADAR是个体细胞中内源表达的ADAR。在一些实施方案中,该方法包括向个体施用ADAR或编码ADAR的构建体。在一些实施方案中,靶标RNA是IDUAW402X(例如,外显子9中的TGG>TAG突变)。在一些实施方案中,dRNA包含SEQ ID NO:204或205的核酸序列。
在一些实施方案中,提供了一种治疗或预防个体中与具有突变(例如, G>A突变)的靶标RNA相关的埃勒斯-当洛斯综合征的方法,其包括dRNA或编码dRNA的构建体引入从个体离体的分离细胞中,其中dRNA包含与靶标RNA杂交的互补RNA序列,并且其中dRNA能够募集ADAR以使靶标RNA中的靶标A脱氨,由此拯救靶标RNA中的突变。在一些实施方案中,ADAR是分离的细胞中内源表达的ADAR。在一些实施方案中,该方法包括将ADAR 或编码ADAR的构建体引入分离的细胞。在一些实施方案中,靶标RNA是 COL3A1W1278X(例如3833G>A突变)。在一些实施方案中,dRNA包含SEQ ID NO:198的核酸序列。
在一些实施方案中,提供了用个体中具有突变(例如,G>A突变)的靶标 RNA治疗或预防埃勒斯-当洛斯综合征的方法,其包括向个体施用有效量的 dRNA或编码dRNA的构建体,其中dRNA包含与与疾病或病症相关的靶标 RNA杂交的互补RNA序列,并且其中dRNA能够募集ADAR以使靶标RNA中的靶标A脱氨基,由此拯救靶标RNA中的突变。在一些实施方案中,ADAR 是个体细胞中内源表达的ADAR。在一些实施方案中,该方法包括向个体施用ADAR或编码ADAR的构建体。在一些实施方案中,靶标RNA是 COL3A1W1278X(例如3833G>A突变)。在一些实施方案中,dRNA包含SEQ ID NO:198的核酸序列。
在一些实施方案中,提供了一种治疗与个体中具有突变(例如,G>A突变)的靶标RNA相关的原发性肺动脉高压的方法,其包括将dRNA或编码 dRNA的构建体引入从离个体体的分离细胞,其中dRNA包含与靶标RNA杂交的互补RNA序列,并且其中dRNA能够募集ADAR以使靶标RNA中的靶标 A脱氨基,从而拯救靶标RNA中的突变。在一些实施方案中,ADAR是分离的细胞中内源表达的ADAR。在一些实施方案中,该方法包括将ADAR或编码ADAR的构建体引入分离的细胞。在一些实施方案中,靶标RNA是 BMPR2W298X(例如,893G>A)。在一些实施方案中,dRNA包含SEQ ID NO: 199的核酸序列。
在一些实施方案中,提供了用个体中具有突变(例如,G>A突变)的靶标 RNA治疗或预防原发性肺动脉高压的方法,其包括向个体施用有效量的 dRNA或编码dRNA的构建体,其中dRNA包含与与疾病或病症相关的靶标 RNA杂交的互补RNA序列,并且其中dRNA能够募集ADAR以使靶标RNA中的靶标A脱氨基,由此拯救靶标RNA的突变。在一些实施方案中,ADAR是个体细胞中内源表达的ADAR。在一些实施方案中,该方法包括向个体施用 ADAR或编码ADAR的构建体。在一些实施方案中,靶标RNA是BMPR2W298X (例如,893G>A)。在一些实施方案中,dRNA包含SEQ ID NO:199的核酸序列。
在一些实施方案中,提供了治疗与个体中具有突变(例如,G>A突变)的靶标RNA有关的朱伯特综合征的方法,其包括将dRNA或编码dRNA的构建体引入从个体离体的分离细胞,其中dRNA包含与靶标RNA杂交的互补RNA 序列,并且其中dRNA能够募集ADAR以使靶标RNA中的靶标A脱氨基,由此拯救靶标RNA中的突变。在一些实施方案中,ADAR是分离的细胞中内源表达的ADAR。在一些实施方案中,该方法包括将ADAR或编码ADAR的构建体引入分离的细胞。在一些实施方案中,靶标RNA是AHI1W725X(例如 2174G>A)。在一些实施方案中,dRNA包含SEQ ID NO:200的核酸序列。
在一些实施方案中,提供了用个体中具有突变(例如,G>A突变)的靶标 RNA治疗或预防朱伯特综合征的方法,其包括向个体施用有效量的dRNA或编码dRNA的构建体,其中dRNA包含与与疾病或病症相关的靶标RNA杂交的互补RNA序列,并且其中dRNA能够募集ADAR以使靶标RNA中的靶标A 脱氨,由此拯救靶标RNA中的突变。在一些实施方案中,ADAR是个体细胞中内源表达的ADAR。在一些实施方案中,该方法包括向个体施用ADAR或编码ADAR的构建体。在一些实施方案中,靶标RNA是AHI1W725X(例如 2174G>A)。在一些实施方案中,dRNA包含SEQ ID NO:200的核酸序列。
在一些实施方案中,提供了治疗与个体中具有突变(例如,G>A突变)的靶标RNA相关的范科尼贫血的方法,其包括将dRNA或编码dRNA的构建体引入从个体离体的分离细胞中,其中dRNA包含与靶标RNA杂交的互补RNA 序列,并且其中dRNA能够募集ADAR以使靶标RNA中的靶标A脱氨基,由此拯救靶标RNA中的突变。在一些实施方案中,ADAR是分离的细胞中内源表达的ADAR。在一些实施方案中,该方法包括将ADAR或编码ADAR的构建体引入分离的细胞。在一些实施方案中,靶标RNA是FANCCW506X(例如1517G >A)。在一些实施方案中,dRNA包含SEQ ID NO:201的核酸序列。
在一些实施方案中,提供了用个体中具有突变(例如,G>A突变)的靶标 RNA治疗或预防范科尼贫血的方法,其包括向个体施用有效量的dRNA或编码dRNA的构建体,其中dRNA包含与与疾病或病症相关的靶标RNA杂交的互补RNA序列,并且其中dRNA能够募集ADAR以使靶标RNA中的靶标A脱氨基,由此拯救靶标RNA中的突变。在一些实施方案中,ADAR是个体细胞中内源表达的ADAR。在一些实施方案中,该方法包括向个体施用ADAR或编码ADAR的构建体。在一些实施方案中,靶标RNA是FANCCW506X(例如 1517G>A)。在一些实施方案中,dRNA包含SEQ ID NO:201的核酸序列。
在一些实施方案中,提供了一种治疗与个体中具有突变(例如,G>A突变)的靶标RNA相关的原发性家族性肥厚性心肌病的方法,其包括将dRNA或编码dRNA的构建体引入从个体离体的分离细胞,其中dRNA包含与靶标 RNA杂交的互补RNA序列,并且其中dRNA能够募集ADAR以使靶标RNA中的靶标A脱氨基,由此拯救靶标RNA中的突变。在一些实施方案中,ADAR 是分离的细胞中内源表达的ADAR。在一些实施方案中,该方法包括将ADAR 或编码ADAR的构建体引入分离的细胞。在一些实施方案中,靶标RNA是 MYBPC3W1098X(例如3293G>A)。在一些实施方案中,dRNA包含SEQ ID NO: 202的核酸序列。
在一些实施方案中,提供了用个体中具有突变(例如,G>A突变)的靶标 RNA治疗或预防原发性家族性肥厚性心肌病的方法,其包括向个体施用有效量的dRNA或编码dRNA的构建体,其中dRNA包含与与疾病或病症相关的靶标RNA杂交的互补RNA序列,并且其中dRNA能够募集ADAR以使靶标RNA 中的靶标A脱氨基,由此拯救靶标RNA中的突变。在一些实施方案中,ADAR 是个体细胞中内源表达的ADAR。在一些实施方案中,该方法包括向个体施用ADAR或编码ADAR的构建体。在一些实施方案中,靶标RNA是 MYBPC3W1098X(例如3293G>A)。在一些实施方案中,dRNA包含SEQ ID NO: 202的核酸序列。
在一些实施方案中,提供了一种治疗与个体中具有突变(例如,G>A突变)的靶标RNA有关的X染色体连锁性严重联合免疫缺陷的方法,其包括 dRNA或编码dRNA的构建体引入从个体离体的分离细胞,其中dRNA包含与靶标RNA杂交的互补RNA序列,并且其中dRNA能够募集ADAR以使靶标 RNA中的靶标A脱氨,由此拯救靶标RNA中的突变。在一些实施方案中,ADAR是分离的细胞中内源表达的ADAR。在一些实施方案中,该方法包括将ADAR或编码ADAR的构建体引入分离的细胞。在一些实施方案中,靶标 RNA是IL2RGW237X(例如710G>A)。在一些实施方案中,dRNA包含SEQ ID NO:203的核酸序列。
在一些实施方案中,提供了一种用个体中具有突变(例如,G>A突变)的靶标RNA治疗或预防的X染色体连锁性严重联合免疫缺陷的方法,包括向个体施用有效量的dRNA或编码dRNA的构建体,其中dRNA包含与与疾病或病症相关的靶标RNA杂交的互补RNA序列,并且其中dRNA能够募集ADAR以使靶标RNA中的靶标A脱氨基,由此拯救靶标RNA中的突变。在一些实施方案中,ADAR是个体细胞中内源表达的ADAR。在一些实施方案中,该方法包括向个体施用ADAR或编码ADAR的构建体。在一些实施方案中,靶标RNA 是IL2RGW237X(例如710G>A)。在一些实施方案中,dRNA包含SEQ ID NO: 203的核酸序列。
如本文所用,“治疗(treatment)”或“治疗(treating)”是用于获得包括临床结果的有益或期望结果的方法。出于本发明的目的,有益的或期望的临床结果包括但不限于以下一种或多种:减少由疾病引起的另外一种症状,减少疾病的程度,稳定化疾病(例如,预防或延迟疾病的恶化),预防或延迟疾病的传播(例如,转移),预防或延迟疾病的发生或复发,延缓或减缓疾病的进展,改善疾病症态,提供缓解(无论是部分的还是全部的)疾病,减少治疗疾病所需的一种或多种其他药物的剂量,延迟疾病的进展,提高生活质量和 /或延长生存期。“治疗”还包括减少疾病或病症的病理后果。本发明的方法考虑了这些治疗方面中的任何一个或多个。
术语“个体”,“受试者”和“患者”在本文中可互换使用以描述哺乳动物,包括人类。所述个体包括但不限于:人类,牛,马,猫,犬,啮齿类动物或灵长类动物。在一些实施方案中,所述个体是人。在一些实施方案中,所述个体患有疾病或病症,例如耐药性。在一些实施方案中,所述个体需要治疗。
如本领域所理解的,“有效量”是指足以产生所需治疗结果的组合物(例如,dRNA或编码该dRNA的构建体)的量(例如,降低疾病或病症的一种或多种症状的严重性或持续时间,稳定疾病或病症的一种或多种症状的严重程度,或消除疾病或病症的一种或多种症状)。对于治疗用途,有益的或期望的结果包括例如减少由疾病引起的一种或多种症状(生物化学的,组织学的和/或行为学的),包括其在疾病发展期间呈现的并发症和中间病理表型,提高那些患有疾病或病症的人的生活质量,减少治疗疾病所需的其他药物的剂量,增强另一种药物的效果,延迟疾病的进展和/或延长患者的存活。
通常,组合物的剂量,时间表和施用途径(例如,dRNA或编码该dRNA 的构建体)可以根据个体的大小和状况,并根据标准药学实践来确定。示例性施用途径包括静脉内,动脉内,腹膜内,肺内,囊内,肌肉内,气管内,皮下,眼内,鞘内或透皮。
本申请的RNA编辑方法不仅可以用于动物细胞,例如哺乳动物细胞,还可以用于修饰植物或真菌的RNA,例如,在具有内源表达的ADAR的植物或真菌中。本文描述的方法可用于产生具有改善性质的基因工程植物和真菌。
组合物,试剂盒和制品
本文还提供了包含任何一种dRNA,构建体,文库或具有如本文所述的经编辑的RNA的宿主细胞的组合物(例如药物组合物)。
在一些实施方案中,提供了药物组合物,其包含本文所述的dRNA或者编码该dRNA的构建体的任一种,以及药学上可接受的载体,赋形剂或稳定剂。示例性的药学上可接受的载体,赋形剂和稳定剂已在例如Remington's Pharmaceutical Sciences第16版,Osol,A.Ed.(1980)中描述。可接受的载体,赋形剂或稳定剂在所用剂量和浓度下对接受者无毒,包括缓冲剂,诸如磷酸盐,柠檬酸盐和其他有机酸;抗氧化剂,包括抗坏血酸和甲硫氨酸;防腐剂 (诸如十八烷基二甲基苄基氯化铵;六甲基氯化铵;苯扎氯铵,苄索氯铵;苯酚,丁基或苄醇;对羟基苯甲酸烷基酯,诸如对羟基苯甲酸甲酯或对羟基苯甲酸丙酯;儿茶酚;间苯二酚;环己醇;3-戊醇;和间甲酚);低分子量(少于约10个残基)的多肽;蛋白质,如血清白蛋白,明胶或免疫球蛋白;亲水性聚合物,诸如聚乙烯吡咯烷酮;氨基酸,诸如甘氨酸,谷氨酰胺,天冬酰胺,组氨酸,精氨酸或赖氨酸;单糖,二糖和其他碳水化合物,包括葡萄糖,甘露糖或糊精;螯合剂诸如EDTA;糖类,诸如蔗糖,甘露醇,海藻糖或山梨糖醇;成盐的反离子诸如钠;金属络合物(例如锌蛋白复合物);和/或非离子表面活性剂,诸如TWEENTM,PLURONICSTM或聚乙二醇(PEG)。在一些实施方案中,提供了冻干制剂。用于体内施用的药物组合物必须是无菌的。这可以通过例如通过无菌过滤膜过滤而容易地实现。进一步提供了可用于本文所述的RNA编辑方法或治疗方法中的任一种的试剂盒或制品,其包含如本文所述的任何一种dRNA,构建体,组合物,文库或者经编辑的宿主细胞。
在一些实施方案中,提供了用于编辑宿主细胞中的靶标RNA的试剂盒,其包含dRNA,其中所述dRNA包含与靶标RNA杂交的互补RNA序列,其中所述dRNA能够募集ADAR以使靶标RNA中的A脱氨基。在一些实施方案中,所述试剂盒还包含ADAR或编码ADAR的构建体。在一些实施方案中,试剂盒进一步包含ADAR3的抑制剂或其构建体。在一些实施方案中,试剂盒进一步包含干扰素的刺激物或其构建体。在一些实施方案中,所述试剂盒还包括用于实施本文所述的任何一种RNA编辑方法的说明书。
本申请的试剂盒处于合适的包装中。合适的包装包括但不限于:小瓶,瓶子,广口瓶,软包装(例如,密封的聚酯薄膜或塑料袋)等。试剂盒可选地提供额外的组分,例如转染或转导试剂,细胞培养基,缓冲液和解释性信息。
因此,本申请还提供了制品。所述制品可包括容器和容器上或与容器相关的标签或包装说明书。合适的容器包括小瓶(例如密封的小瓶),瓶子,罐子,软包装等。在一些实施方案中,所述容器容纳药物组合物,并且可以具有无菌进入口(例如,所述容器可以是静脉内溶液袋或具有可由皮下注射针刺穿的塞子的小瓶)。容纳药物组合物的容器可以是多次使用的小瓶,其允许重组制剂的重复施用(例如2-6次施用)。包装说明书是指通常包括在治疗产品的商业包装中的说明书,其包含关于使用这些产品的适应症,用法,剂量,施用,禁忌症和/或警告的信息。另外,所述制品还可包含第二容器,其包含药学上可接受的缓冲液,例如抑菌性注射用水(BWFI),磷酸盐缓冲盐水,林格氏溶液和右旋糖溶液。它还可以包括从商业和用户角度所需的其他材料,包括其他缓冲剂,稀释剂,过滤器,针头和注射器。
所述试剂盒或制品可包括多个单位剂量的药物组合物和使用说明书,其以足以在药房(例如,医院药房以及配药药房)中储存和使用的量包装。
示例性实施方案
在本文提供的实施方案中是:
1.一种用于在宿主细胞中编辑靶标RNA的方法,包括将脱氨酶募集 RNA(dRNA)或编码所述dRNA的构建体引入宿主细胞,其中所述dRNA包含与所述靶标RNA杂交的互补RNA序列,并且其中所述脱氨酶募集RNA能够募集作用于RNA的腺苷脱氨酶(ADAR)以使所述靶标RNA中的靶标腺苷脱氨基。
2.如实施方案1所述的方法,其中所述RNA序列包含与所述靶标RNA中的所述靶腺苷正对的胞苷,腺苷或尿苷。
3.如实施方案2所述的方法,其中所述RNA序列包含与所述靶标RNA中的所述靶腺苷正对的胞苷错配。
4.如实施方案3所述的方法,其中所述胞苷错配位于所述dRNA中距所述互补序列的3'端至少20个核苷酸,并且距所述互补序列的5'端至少5个核苷酸。
5.如实施方案4所述的方法,其中所述胞苷错配位于所述dRNA中所述互补序列中心(例如,在中心)的10个核苷酸内。
6.如实施方案1-5中任一项所述的方法,其中所述RNA序列进一步包含一个或多个鸟苷,其各自与所述靶标RNA中的非靶腺苷相对。
7.如实施方案1-6中任一项所述的方法,其中所述互补序列包含与所述靶标RNA中的非靶腺苷相对的两个或更多个连续错配核苷酸。
8.如实施方案1-7中任一项所述的方法,其中所述靶标RNA中所述靶标腺苷的5'侧最近邻位是选自U,C,A和G的核苷酸,优先度U>C≈A>G,而所述靶标RNA中所述靶标腺苷的3'侧最近邻位是选自G,C,A和U的核苷酸,优先度G>C>A≈U。
9.如实施方案1至8中任一项所述的方法,其中所述靶标RNA中的所述靶标腺苷位于选自:UAG,UAC,UAA,UAU,CAG,CAC,CAA,CAU, AAG,AAC,AAA,AAU,GAG,GAC,GAA和GAU构成的组的三碱基基序中。
10.如实施方案9所述的方法,其中所述三碱基基序是UAG,并且其中所述脱氨酶募集RNA包含与所述三碱基基序中的尿苷正对的A,与所述靶腺苷正对的胞苷,以及与所述三碱基基序中的鸟苷正对胞苷,鸟苷或尿苷。
11.如实施方案1-10中任一项所述的方法,其中所述脱氨酶募集RNA的长度为约40-260个核苷酸。
12.如实施方案11所述的方法,其中所述脱氨酶募集RNA的长度为约 60-230个核苷酸。
13.如实施方案11或12所述的方法,其中所述dRNA的长度大于约70个核苷酸。
14.如实施方案11-13中任一项所述的方法,其中所述dRNA的长度为约 100至约150(例如,约110-150)个核苷酸。
15.如实施方案1-14中任一项所述的方法,其中所述靶标RNA是选自:由前信使RNA,信使RNA,核糖体RNA,转移RNA,长非编码RNA和小RNA 构成的组的RNA。
16.如实施方案15所述的方法,其中所述靶标RNA是前信使RNA。
17.如实施方案1-16中任一项所述的方法,其中所述ADAR由所述宿主细胞内源表达。
18.如实施方案1-16中任一项所述的方法,其中所述ADAR对于所述宿主细胞是外源的。
19.如实施方案18所述的方法,其进一步包括将所述ADAR引入所述宿主细胞。
20.如实施方案18或19所述的方法,其中所述ADAR包含E1008突变。
21.如实施方案1-20中任一项所述的方法,其中所述脱氨酶募集RNA是单链RNA。
22.如实施方案1-20中任一项所述的方法,其中所述互补RNA序列是单链的,并且其中所述脱氨酶募集RNA还包含一个或多个双链区。
23.如实施方案1-22中任一项所述的方法,其中所述dRNA不包含 ADAR-募集结构域(例如,DSB结合结构域,GluR2结构域或MS2结构域)。
24.如实施方案1-23中任一项所述的方法,其中所述dRNA不包含化学修饰的核苷酸(例如,2’-O-甲基或硫代磷酸酯修饰)。
25.如实施方案24所述的方法,其包括将编码所述dRNA的构建体引入所述宿主细胞,其中所述构建体是病毒载体(例如,慢病毒载体)或质粒。
26.如实施方案1-25中任一项所述的方法,其中所述靶标RNA中靶标腺苷的脱氨基导致靶标RNA中的错义突变,过早的终止密码子,异常剪接或可变剪接,或者所述靶标RNA中的错义突变,过早的终止密码子,异常剪接或可变剪接的回复。
27.如实施方案26所述的方法,其中所述靶标RNA中的靶标腺苷的脱氨基作用导致所述靶标RNA编码的蛋白质的点突变、截短、延伸和/或错误折叠;或者凭借所述靶标RNA中的错义突变、过早的终止密码子、异常剪接或可变剪接的回复导致有功能的、全长的、正确折叠的和/或野生型的蛋白。
28.如实施方案1-27中任一项所述的方法,其中所述宿主细胞是真核细胞。
29.如实施方案28所述的方法,其中所述宿主细胞是哺乳动物细胞。
30.如实施方案29所述的方法,其中所述宿主细胞是人或小鼠细胞。
31.如实施方案29或30所述的方法,其中所述ADAR是ADAR1和/或 ADAR2。
32.如实施方案1-31中任一项所述的方法,其中所述宿主细胞是原代细胞。
33.如实施方案32所述的方法,其中所述宿主细胞是T细胞。
34.如实施方案32所述的方法,其中所述宿主细胞是有丝分裂后细胞。
35.如实施方案1-34中任一项所述的方法,其进一步包括将ADAR3的抑制剂引入所述宿主细胞。
36.如实施方案1-35中任一项所述的方法,其进一步包括将干扰素的刺激物引入所述宿主细胞。
37.如实施方案1-36中任一项所述的方法,包括引入各自靶向不同靶标 RNA的多个dRNA。
38.如实施方案1-37中任一项所述的方法,其中所述编辑靶标RNA的效率为至少约5%(例如,至少约10%,20%或30%)。
39.如实施方案1-38中任一项所述的方法,其中所述dRNA不诱导免疫应答。
40.凭借如实施方案1-39中任一项所述的方法产生的经编辑的RNA或具有经编辑的RNA的宿主细胞。
41.一种用于治疗或预防个体的疾病或病症的方法,其包括根据实施方案1-39中任一项的方法编辑与个体细胞中的疾病或病症相关的靶标RNA。
42.如实施方案41所述的方法,其中所述疾病或病症是遗传性的基因疾病或与一种或多种获得性基因突变相关的疾病或病症。
43.如实施方案41或42所述的方法,其中所述靶标RNA具有G至A突变。
44.如实施方案41-43中任一项所述的方法,其中所述疾病或病症是单基因疾病或病症。
45.如实施方案41-44中任一项所述的方法,其中所述疾病或病症是多基因疾病或病症。
46.如实施方案41-45中任一项所述的方法,其中:
(i)所述靶标RNA是TP53,并且所述疾病或病症是癌症;
(ii)所述靶标RNA是IDUA,并且所述疾病或病症是I型粘多糖贮积病 (MPS I);
(iii)所述靶标RNA是COL3A1,并且所述疾病或病症是埃勒斯-当洛斯综合征;
(iv)所述靶标RNA是BMPR2,并且所述疾病或病症是朱伯特综合征;
(v)所述靶标RNA是FANCC,并且所述疾病或病症是范科尼贫血;
(vi)所述靶标RNA是MYBPC3,并且所述疾病或病症是原发性家族性肥厚性心肌病;或
(vii)所述靶标RNA是IL2RG,并且所述疾病或病症是X染色体连锁性严重联合免疫缺陷。
47.一种通过募集作用于RNA的腺苷脱氨酶(ADAR)使靶标RNA中的靶标腺苷脱氨基作用的脱氨酶募集RNA(dRNA),其包含与所述靶标RNA杂交的互补RNA序列。
48.如实施方案47所述的脱氨酶募集RNA,其中所述RNA序列包含与所述靶标RNA中的所述靶标腺苷正对的胞苷,腺苷或U。
49.如实施方案48所述的dRNA,其中所述RNA序列包含与所述靶标 RNA中的靶标腺苷正对的胞苷错配。
50.如实施方案49所述的dRNA,其中所述胞苷错配位于所述dRNA中距所述互补序列的3'端至少20个核苷酸,和距所述互补序列的5'端至少5个核苷酸。
51.如实施方案50所述的dRNA,其中所述胞苷错配位于所述dRNA中互补序列中心(例如,在中心)的10个核苷酸内。
52.如实施方案47-51中任一项所述的脱氨酶募集RNA,其中所述RNA 序列进一步包含一个或多个鸟苷,其各自与所述靶标RNA中的非靶标腺苷正对。
53.如实施方案47-51中任一项所述的dRNA,其中所述互补序列包含与所述靶标RNA中的非靶标腺苷相对的两个或更多个连续错配核苷酸。
54.如实施方式47-53中任一项所述的脱氨酶募集RNA,其中所述靶标 RNA中的所述靶标腺苷位于选自:由UAG,UAC,UAA,UAU,CAG,CAC, CAA,CAU,AAG,AAC,AAA,AAU,GAG,GAC,GAA和GAU构成的组的三碱基基序中。
55.如实施方案54所述的脱氨酶募集RNA,其中所述三碱基基序是 UAG,并且其中所述dRNA包含与所述三碱基基序中的尿苷正对的腺苷,与所述靶腺苷正对的胞嘧啶,以及与所述三碱基基序中的鸟苷正对的胞苷、鸟苷或尿苷。
56.如实施方案55所述的脱氨酶募集RNA,其中所述三碱基基序是所述靶标RNA中的UAG,并且其中所述脱氨酶募集RNA包括与所述靶标RNA的 UAG相对的ACC,ACG或ACU。
57.如实施方案47-56中任一项所述的脱氨酶募集RNA,其中脱氨酶募集 RNA的长度为约40-260个核苷酸。
58.如实施方案57所述的dRNA,其中所述dRNA的长度为约70个核苷酸。
59.如实施方案57或58所述的dRNA,其中所述dRNA的长度为约100至约150个核苷酸(例如,约110-150个)。
60.如实施方案47-59中任一项所述的dRNA,其中所述dRNA不包含 ADAR募集结构域(例如,DSB结合结构域,GluR2结构域或MS2结构域)。
61.如实施方案47-60中任一项所述的dRNA,其中所述dRNA不包含化学修饰的核苷酸(例如,2'-O-甲基或硫代磷酸酯修饰)。
62.一种编码实施方案47-61中任一项所述的脱氨酶募集RNA的构建体。
63.如实施方案62所述的构建体,其中所述构建体是病毒载体(例如,慢病毒载体)或质粒。
64.一种文库,其包含实施方案47-61中任一项所述的多个脱氨酶募集 RNA或实施方案62或63所述的构建体。
65.一种组合物,其包含实施方案47-61中任一项所述的脱氨酶募集 RNA,实施方案62或63所述的构建体,或实施方案64所述的文库。
66.一种宿主细胞,其包含实施方案47-61中任一项所述的脱氨酶募集 RNA或实施方案62或63所述的构建体。
67.如实施方案66所述的宿主细胞,其中所述宿主细胞是真核细胞。
68.如实施方案66或67所述的宿主细胞,其中所述宿主细胞是原代细胞。
69.一种用于在宿主细胞中编辑靶标RNA的试剂盒,其包含脱氨酶募集 RNA,其中所述脱氨酶募集RNA包含与所述靶标RNA杂交的互补RNA序列,其中所述脱氨酶募集RNA能够募集ADAR以使所述靶标RNA中的靶标腺苷脱氨基。
实施例
下面的实施例仅是本申请的示例,因此不应以任何方式被认为限制本发明。通过示例而非限制的方式提供以下实施例和详细描述。
材料和方法
质粒构建
通过PCR扩增mCherry和EGFP(EGFP第一密码子ATG缺失)编码DNA来克隆双荧光报道分子,在PCR期间通过引物添加3×GS接头和打靶的DNA序列。然后通过II型限制酶BsmB1(Thermo)和T4 DNA连接酶(NEB)切割和连接 PCR产物,然后将其插入pLenti骨架中(pLenti-CMV-MCS-SV-Bsd,Stanley Cohen Lab,Stanford University)。
从Lbu质粒(Addgene#83485)PCR扩增dLbuCas13 DNA。ADAR1DD和 ADAR2DD从Adar1(p150)cDNA和Adar2 cDNA中扩增,这两种cDNA都来自厦门大学的汉氏实验室。通过重叠PCR将ADAR1DD或ADAR2DD与 dLbuCas13 DNA融合,并将融合的PCR产物插入pLenti骨架中。
为了在哺乳动物细胞中表达dRNA,直接合成dRNA序列(针对短dRNA) 并通过合成重叠的ssDNA进行退火或PCR扩增,并通过Golden-gate克隆将产物克隆到U6表达下的相应载体中。
从Adar1(p150)cDNA中PCR扩增全长Adar1(p110)和Adar1(p150),并从 Adar2cDNA中PCR扩增全长Adar2,然后将其克隆到pLenti骨架中。
对于三种版本的双荧光报道分子(报道分子-1,-2和-3),mCherry和EGFP (EGFP的起始密码子ATG被删除)编码序列进行PCR扩增,使用BsmBI (Thermo Fisher Scientific,ER0452)消化,然后用T4 DNA连接酶(NEB, M0202L)介导的与GGGGS接头的连接。随后将连接产物插入 pLenti-CMV-MCS-PURO主链。
对于表达dLbuCas13-ADAR DD(E1008Q)的构建体,从ADAR1p150构建体 (来自厦门大学韩家淮实验室的赠予)扩增了ADAR1DD基因。通过PCR从 Lbu_C2c2_R472A_H477A_R1048A_H1053A质粒(Addgene#83485)扩增了 dLbuCas13基因。通过重叠PCR生成ADAR1DD(高活性E1008Q变体),然后融合至dLbuCas13。将连接产物插入pLenti-CMV-MCS-BSD主链。
对于表达arRNA的构建体,合成arRNA的序列并将金门(golden-gate) 克隆到pLenti-sgRNA-lib 2.0(Addgene#89638)主链中,并且由hU6启动子驱动arRNA的转录。对于表达ADAR的构建体,从ADAR1p150构建体中扩增出全长ADAR1p110和ADAR1p150,并从ADAR2构建体中扩增出全长ADAR2(厦门大学韩家淮实验室的赠予)。然后将扩增的产物克隆到pLenti-CMV-MCS-BSD主链中。对于表达具有致病性突变的基因的构建体, TP53的全长编码序列(从Vigenebio订购)和其他6种与疾病相关的基因 (COL3A1,BMPR2,AHI1,FANCC,MYBPC3和IL2RG,来自中国医学科学院病原生物学研究所的王建伟实验室的赠予)通过诱变PCR从编码具有引入 G>A突变的相应基因的构建体中扩增出。通过Gibson克隆方法59将扩增产物克隆到pLenti-CMV-MCS-mCherry主链中。
哺乳动物细胞系和细胞培养
哺乳动物细胞系培养达尔伯克改良伊格尔培养基(Dulbecco's Modified EagleMedium,10-013-CV,Corning,Tewksbury,MA,USA),加入10%胎牛血清(兰州百灵生物技术有限公司,兰州,中国),在37℃、5%CO2下补充以1%青霉素-链霉素。所述Adar1-KO细胞系购自EdiGene China,基因分型结果也由EdiGene China提供。
HeLa和B16细胞系来自Z.Jiang的实验室(北京大学)。HEK293T细胞系来自C.Zhang的实验室(北京大学)。RD细胞系来自J Wang的实验室(北京协和医学院和中国医学科学院,病原生物学研究所)。SF268细胞系来自中国医学科学院,基础医学研究所,细胞中心。A549和SW13细胞系来自EdiGene Inc. HepG2,HT29,NIH3T3和MEF细胞系在我们北京大学的实验室中维护。将这些哺乳动物细胞系在含10%胎牛血清(CellMax,SA201.02)的达尔伯克改良伊格尔培养基(Corning,10-013-CV)中培养,并在37℃于5%CO2下补充1%青霉素-链霉素。除非另有说明,否则按照制造商的说明用X-tremeGENE HP DNA转染试剂(Roche,06366546001)转染细胞。
人原发性肺成纤维细胞(#3300)和人原发性支气管上皮细胞(#3210)购自ScienCell Research Laboratories,Inc.,并在成纤维细胞培养基(ScienCell, #2301)和支气管上皮细胞培养基(ScienCell,#3211)中培养。两种培养基均补充有15%的胎牛血清(BI)和1%的青霉素-链霉素。GM06214和GM01323原代细胞是从卡瑞尔医学研究所(CoriellInstitute for Medical Research)订购的,并在含15%胎牛血清(BI)和1%青霉素-链霉素的达尔伯克改良伊格尔培养基 (Corning,10-013-CV)中培养。将所有细胞在37℃在5%CO2下培养。
报道系统的转染,FACS分析和Sanger测序
对于双荧光报道编辑实验,将293T-WT细胞或293T-Adar1-KO细胞接种在6孔板(6×105个细胞/孔)中,24小时后,接种1.5μg报道质粒和1.5μg dRNA 质粒。根据供应商的方案,使用X-tremeGENE HP DNA转染试剂(06366546001; Roche,Mannheim,德国)共转染。48至72小时后,收集细胞并进行FACS分析。为了进一步确认报道分子mRNA编辑,我们使用FACSAria流式细胞仪 (BD Biosciences)分选来自用报道分子和dRNA质粒转染的293T-WT细胞的 EGFP阳性细胞,然后进行总RNA分离(TIANGEN,DP430)。然后通过 RT-PCR(TIANGEN,KR103-04)将RNA逆转录成cDNA,并用相应的引物对(23 个PCR循环)PCR扩增靶标基因座,并纯化PCR产物用于Sanger测序。
对于Adar1(p110),Adar1(p150)或Adar2的回复和过表达实验,将293T-WT 细胞或293T-Adar1-KO细胞接种于12孔板(2.5×105个细胞/孔)中,24小时后,使用X-tremeGENEHP DNA转染试剂(06366546001,Roche,Mannheim,德国)共转染0.5μg的报道质粒,0.5μg的dRNA质粒和0.5μg的Adar1/2质粒(pLenti 骨架作为对照)。48至72小时后,收集细胞并进行FACS分析。
对于内源mRNA实验,将293T-WT细胞接种在6孔板(6×105个细胞/孔)中,当约70%汇合时,使用X-tremeGENE HP DNA转染试剂(06366546001,罗氏,曼海姆,德国)转染3μg的dRNA质粒。72小时后,通过FACS收集细胞和分选的GFP阳性或BFP阳性细胞(根据相应的荧光标记物)用于以下的RNA分离。
人原代T细胞的分离与培养
从健康人供体的白细胞分离产物中分离出原代人T细胞。简而言之,通过Ficoll离心(Dakewei,AS1114546)分离外周血单个核细胞(PBMC),并使用 EasySep人T细胞分离试剂盒(STEMCELL,17951)从PBMC通过磁阴性选择分离T细胞。分离后,将T细胞在X-vivo15培养基,10%FBS和IL2(1000U/ml) 中培养,并用CD3/CD28 DynaBeads(ThermoFisher,11131D)刺激2天。健康捐献者的白细胞分离术产品购自AllCells LLC中国。所有健康的捐助者均提供了知情同意。
Lenti病毒包装物和报道分子细胞系构建
通过X-tremeGENE HP DNA转染试剂将表达质粒与两种病毒包装质粒 pR8.74和pVSVG(Addgene)一起共转染到HEK293T-WT细胞中。72小时后,收集上清液病毒并储存在-80℃。用慢病毒感染HEK293T-WT细胞,72小时后,通过FACS分选mCherry阳性细胞并培养以通过有限稀释方法选择出稳定表达具有低EGFP背景的双荧光报道系统的单克隆细胞系。
对于稳定的报道分子细胞系,将报道分子构建体 (pLenti-CMV-MCS-PURO骨架)与两个病毒包装质粒pR8.74和pVSVG一起共转染到HEK293T细胞中。72小时后,收集上清病毒并保存在-80℃。用慢病毒感染HEK293T细胞,然后通过FACS分选mCherry阳性细胞并培养来选择稳定表达无可检测EGFP背景的双荧光报道系统的单克隆细胞系。HEK293T ADAR1–/–和TP53–/–细胞系是根据以前报道的方法60生成的。将靶向ADAR1的 sgRNA和含有CMV驱动的嘌呤霉素抗性基因的PCR扩增供体DNA共转染到 HEK293T细胞中。然后在转染后7天用嘌呤霉素处理细胞。从嘌呤霉素抗性细胞中分离出单个克隆,然后通过测序和蛋白质印迹进行验证。
内源或外源表达转录物的RNA编辑
为了评估在双荧光报道分子上的RNA编辑,将HEK293T细胞或 HEK293T ADAR1-/-细胞接种在6孔板中(6×105个细胞/孔)。24小时后,将细胞用1.5μg报道分子质粒和1.5μgarRNA质粒共转染。为了检查ADAR1p110, ADAR1p150或ADAR2蛋白表达的影响,通过EGFP阳性比率和深度测序来测定编辑效率。
将HEK293T ADAR1-/-细胞接种在12孔板中(2.5×105个细胞/孔)。24小时后,将细胞与0.5μg报道分子质粒,0.5μg arRNA质粒和0.5μgADAR1/2质粒 (pLenti骨架作为对照)共转染。通过EGFP阳性比率和深度测序测定编辑效率。
为了评估内源mRNA转录物上的RNA编辑,将HEK293T细胞接种在6孔板中(6×105个细胞/孔)。二十四小时后,将细胞用3μg arRNA质粒转染。通过深度测序分析编辑效率。
为了评估多个细胞系中的RNA编辑效率,将8-9×104(RD,SF268,HeLa) 或1.5×105(HEK293T)个细胞接种在12孔板中。对于难以转染的细胞,例如HT29,A549,HepG2,SW13,NIH3T3,MEF和B16,将2-2.5×105个细胞接种在6孔板中。24小时后,将报道分子和arRNA质粒共转染到这些细胞中。通过EGFP阳性比率测定编辑效率。
为了评估EGFP阳性比率,在转染后48至72小时,通过荧光激活细胞分选(FACS)分析分选并收集细胞。mCherry信号用作报道分子/表达arRNA的细胞的荧光选择标记,计算EGFP+/mCherry+细胞的百分比作为编辑效率的读数。
为了NGS定量A至I编辑率,在转染后48至72小时,通过FACS测定法分选和收集细胞,然后进行RNA分离(TIANGEN,DP420)。然后,通过 RT-PCR(TIANGEN,KR103-04)将总RNA反转录为cDNA,并使用下表中列出的相应引物PCR扩增目标基因座。
将PCR产物纯化用于Sanger测序或NGS(Illumina HiSeq X Ten)。
深度测序
对于内源mRNA编辑实验,将293T-WT细胞接种在6孔板上(6×105个细胞 /孔),当约70%汇合时,使用X-tremeGENE HP DNA转染试剂(Roche)以3μg 的dRNA转染HEK293细胞。72小时后,通过FACS分选GFP阳性或BFP阳性细胞(根据相应的荧光标记),然后进行RNA分离。然后通过RT-PCR将分离的 RNA逆转录成cDNA,并用相应的引物对扩增特异性靶标基因座(23个PCR循环),并在Illumina NextSeq上测序。
在多个细胞系中进行测试
除了HEK293T(阳性对照)和HEK293T ADAR1-/-(阴性对照)细胞,选择一种小鼠细胞系(NIH3T3)以及源自不同组织和器官的七种人细胞系(RD, HeLa,SF268,A549,HepG2,HT-29,SW13)进行实验。对于具有较高转染效率的细胞系,将约8-9×104个细胞(RD,HeLa,SF268)或1.5×105个 (HEK293T)接种到12孔板的每个孔上,至于难以转染的那些(A549,HepG2, HT-29,SW13,NIH3T3),把2-2.5×105个细胞接种于6孔板中。并且将所有这些细胞维持在37℃在达尔伯克改良伊格尔培养基(DMEM,Corning)中,该培养基补充有10%胎牛血清(FBS,CellMax)和5%CO2。24小时后,用X-tremeGENE HP DNA转染试剂(Roche)将CG2报道基因和71nt dRNA(35-C-35)质粒共转染到不同类型的细胞中。转染后48小时,用胰蛋白酶处理细胞并通过FACS(BD)分析。因为具有低转染效率的细胞具有相当少的mCherry和BFP阳性细胞,对于那些铺在6孔板上的细胞,我们将用于FACS 分析的总细胞数增加至1×105个。
针对靶标位点的RNA编辑分析
对于深度测序分析,使用arRNA覆盖序列的靶标位点序列(上游和下游 20-nt)产生索引。使用BWA版本0.7.10-r789对读段进行比对和定量。然后通过Samtools对比对BAM进行分选,并使用REDitools 1.0.4版分析RNA编辑位点。参数如下:-U[AG或TC]-t 8-n 0.0-T6-6-e-d-u。通过费舍尔精确检验 (Fisher’s exact test)(p值<0.05)计算出的arRNA靶向区域内所有显着的A>G 转化(p值<0.05)都被arRNA视为编辑。除靶标腺苷外的转化均为脱靶编辑。同时出现在对照组和实验组中的突变被认为是SNP。
转录组范围的RNA测序分析
将具有BFP表达盒的表达对照RNA151或arRNA151-PPIB的质粒转染到 HEK293T细胞中。转染后48小时,通过FACS富集BFP+细胞,并用RNAprep Pure Micro试剂盒(TIANGEN,DP420)纯化RNA。然后使用NEBNext聚 (A)mRNA磁性分离模块(New England Biolabs,E7490)纯化mRNA,并用用于 Illumina的NEBNext Ultra II RNA文库制备试剂盒(NewEngland Biolabs, E7770)处理,然后使用Illumina HiSeq X Ten平台(2×150-bp配对末端;每个样品30G)进行深度测序分析。为了排除转染引起的非特异性作用,我们加入了模拟组,其中仅用转染试剂处理细胞。每个组包含四个副本。
生物信息学分析管道由Vogel等人22引用。使用FastQC进行分析的质量控制,质量修整基于Cutadapt(每个读段的前6-bp被修整,最高20-bp被质量修整)。使用AWK脚本过滤掉引入的arRNA。修剪后,将长度小于90-nt的读段过滤掉。随后,通过STAR软件61将过滤的读段映射到参考基因组 (GRCh38-hg38)。我们使用GATK Haplotypcaller62来调用变体。GATK生成的原始VCF文件已通过GATK VariantFiltration,bcftools和ANNOVAR63进行了过滤和注释。在dbSNP,1000Genome64的变体中,过滤出EVS。然后选择每组四个重复的共享变体作为RNA编辑位点。将模拟组的RNA编辑水平视为背景,通过减去模拟组的变体获得对照RNA151和arRNA151-PPIB的整体靶标。
为了评估LEAPER是否干扰自然的编辑稳态,我们分析了由模拟组和 arRNA151-PPIB组(或对照RNA151组)共享的全局编辑位点。使用Pearson相关系数分析评估了天生A-至-I编辑位点的差异RNA编辑率。计算了模拟组和 arRNA151-PPIB组(或对照RNA151组)之间编辑率的皮尔森相关性,并在图6中进行了注释。
X意指模拟组中每个位点的编辑率;Y意指对照RNA151组(图6A)或 arRNA151-PPIB组(图6B)中每个位点的编辑率;σx是X的标准偏差;σY是Y的标准偏差;μx是X的平均值;μY是Y的平均值;E是期望值。
分析RNA-Seq数据以询问由RNA编辑事件诱导的可能的转录变化。使用 HISAT2和STRINGTIE软件进行了转录组范围的基因表达的分析65。我们使用 Cutadapt和FastQC进行测序数据的质量控制。然后使用HISAT2将测序读段映射到参考基因组(GRCh38-hg38),然后如上所述进行Pearson相关系数分析。
蛋白质印迹
我们分别使用了针对ADAR1(Santa Cruz,sc-271854),ADAR2(Santa Cruz,sc-390995),ADAR3(Santa Cruz,sc-73410),p53(Santa Cruz,sc-99), KRAS(Sigma,SAB1404011);GAPDH(Santa Cruz,sc-47724)和β-微管蛋白 (CWBiotech,CW0098)的小鼠单克隆一抗。HRP偶联的山羊抗小鼠IgG(H+L, 115-035-003)二抗购自JacksonImmunoResearch。分选2×106个细胞进行裂解,并上样等量的每种裂解物进行SDS-PAGE。然后,将样品蛋白质转移到PVDF 膜(Bio-Rad实验室)上,并用针对一种ADAR酶(抗ADAR1,1:500;抗ADAR2, 1:100;抗ADAR3,1:800)的一抗进行免疫印迹),然后进行二抗温育(1: 10,000)和暴露。用剥离缓冲液(CWBiotech,CW0056)剥离ADAR蛋白后,将β-微管蛋白重新探测到同一PVDF膜上。重复实验三遍。使用Image Lab软件进行半定量分析。
细胞因子表达测定
将HEK293T细胞接种在12孔板(2×105个细胞/孔)上。当约70%汇合时,将细胞用1.5μg的arRNA转染。作为阳性对照,转染了1μg的聚(I:C) (Invitrogen,tlrl-picw)。48小时后,收集细胞并进行RNA分离(TIANGEN, DP430)。然后,通过RT-PCR(TIANGEN,KR103-04)将总RNA逆转录成cDNA,并通过定量PCR(TAKARA,RR820A)测量IFN-β和IL-6的表达。引物的序列在上表中列出。
p53的转录调控活性测定
将表达TP53W53X cDNA的质粒和表达arRNA的质粒与p53-萤火虫-荧光素酶顺式报道质粒(YRGene,VXS0446)和海肾-荧光素酶质粒(来自北京大学Z. Jiang实验室的赠予)一起共转染到HEK293T TP53-/-细胞中用于检测p53的转录调控活性。48小时后,收获细胞并根据制造商的方案用Promega Dual-Glo 荧光素酶测定系统(Promega,E4030)测定。简而言之,将150μL Dual-Glo荧光素酶试剂添加到收获的细胞离心沉淀中,并在30分钟后,通过Infinite M200 读取器(TECAN)将100μL Dual-Glo荧光素酶试剂(细胞裂解)添加到96孔白板中,测量萤火虫的发光。30分钟后,依次向每个孔中添加100μL Dual-Glo终止剂和Glo试剂,以测量海肾发光,并计算萤火虫发光与海肾发光的比。
原代细胞中的电穿孔
对于在人原代肺成纤维细胞或人原代支气管上皮细胞中表达arRNA的质粒进行电穿孔,将20μg质粒用NucleofectorTM 2b装置(Lonza)和Basic NucleofectorTM试剂盒(Lonza,VPI-1002)电穿孔,并且电穿孔程序是U-023。对于在人原代T细胞中表达arRNA的质粒电穿孔,将20μg质粒通过NucleofectorTM 2b Device(Lonza)和Human T细胞NucleofectorTM Kit(Lonza, VPA-1002)电穿孔到人原代T中,电穿孔程序是T-024。电穿孔后48小时,通过FACS测定分选和收集细胞,然后进行以下深度测序以用于靶向RNA编辑测定。电穿孔效率根据荧光标记进行归一化。
为了在人原代T细胞或原代GM06214细胞中进行化学合成arRNA或对照 RNA电穿孔,将RNA寡核苷酸于终浓度为2μM的100μL opti-MEM培养基(Gbico,31985070)中。然后用上述电穿孔混合物重悬1×10E6 GM06214细胞或3×10E6 T细胞,并用Agile Pulse InVivo装置(BTX)在450V电穿孔1ms。然后将细胞转移到温暖的培养基中用于以下测定。
α-L-异丁烯酸酶(IDUA)催化活性测定
将收获的细胞离心沉淀重悬并在冰上用在1×PBS缓冲液中的28μL 0.5% TritonX-100溶解30分钟。然后将25μL细胞裂解液加入25μL 190μM 4-甲基伞形酮-α-L-艾杜糖醛酸酶底物(Cayman,2A-19543-500)中,将其溶解在0.4M 含0.2%Triton X-100的甲酸钠缓冲液中,pH 3.5,并在黑暗中在37℃温育90 分钟。加入200μL 0.5M NaOH/甘氨酸缓冲液,pH10.3,淬灭催化反应,然后在4℃下离心2分钟。将上清液转移至96孔板,并使用InfiniteM200读取器 (TECAN)在365nm激发波长和450nm发射波长下测量荧光。
实施例1.测试基于报道分子的本发明的RNA编辑方法
据报道,Cas13家族蛋白(C2c2)可以编辑哺乳动物细胞中的RNA。我们在多种条件下进一步测试了该系统。首先,我们通过在mCherry和EGFP基因之间引入含有终止密码子的3×GS接头打靶序列,构建了基于mCherry和 EGFP荧光的双荧光报道系统。此外,我们删除了EGFP的起始密码子ATG,以减少EGFP翻译的遗漏。
双荧光报道分子-1包含mCherry序列(SEQ ID NO:1),该序列包含3×GS 接头和靶标A(SEQ ID NO:2)的序列,以及eGFP序列(SEQ ID NO:3)。 ATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTC ATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTC GAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGAC CGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGG ACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGC ACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCT TCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACC GTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTG AAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAG AAGACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGA CGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACG GCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAG CCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATC ACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGC CGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAG (mCherry的序列)(SEQ ID NO:1)
GTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGT CGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCG AGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCC TGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGC AGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGC GCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAG GTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGG CATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGT ACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGA ACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGC AGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGA CGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGC CCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACA AGTAA(eGFP的序列)(SEQ ID NO:3)
双荧光报道分子-2包含mCherry序列(SEQ ID NO:1),序列包含3×GS接头(显示为斜体且加粗的字符)和靶标A(显示为加大且加粗的A)(SEQ ID NO: 4),以及eGFP的序列(SEQ ID NO:3)。
双荧光报道分子-3包含mCherry序列(SEQ ID NO:1),包含1×GS接头(显示为斜体且加粗的字符)和靶标A(SEQ ID NO:5)的序列,以及eGFP的序列 (SEQ ID NO:3)。
我们将mCherry-3×GS接头-TAG-EGFP克隆到pLenti骨架中,并将报道质粒装入慢病毒中,感染293T细胞,构建表达双荧光报道基因的稳定细胞系。然后,我们选择具有低EGFP荧光背景的单个克隆作为报道系统。我们将 LbucC2c2 crRNA指导平铺了28到78个核苷酸长的间隔子横跨打靶腺苷,以测试最佳的crRNA设计。我们发现更长的crRNA指导赋予更高的EGFP阳性效率。引人注目的是,当我们转染打靶的crRNA质粒而不共转染任何表达dC2c2-ADARDD的质粒时,EGFP蛋白基本上被表达。例如,带有下述序列的crRNA指导: GGACCACCCCAAAAAUGAAUAUAACCAAAACUGAACAGCUCCUCGC CCUUGCUCACUGGCAGAGCCCUCCAGCAUCGCGAGCAGGCGCUGCC UCCUCCGCC(SEQ ID NO:6)被赋予了超过25%的EGFP阳性效率。这表明终止密码子UAG中的腺嘌呤在很大程度上被编辑。相反,随机crRNA不能使 EGFP阴性细胞呈阳性(图6A,6B和6C)。基于这些结果,我们推断:单个RNA 转录物的过表达就可以利用内源ADAR酶来编辑RNA。
此外,我们删除了RNA指导分子上的支架RNA序列,创造了直线的指导RNA。我们发现:70核苷酸长的、与带有AC错配的打靶标RNA互补的 RNA(AAACCGAGGGAUCAUAGGGGACUGAAUCCACCAUUCUUCUCCC AAUCCCUGCAACUCCUUCUUCCCCUGC(SEQ ID NO:7)可以有效地使 EGFP阴性细胞转化为EGFP阳性细胞,而70-nt的随机 RNA(UGAACAGCUCCUCGCCCUUGCUCACUGGCAGAGCCCUCCAGCA UCGCGAGCAGGCGCUGCCUCCUCCGCC(SEQ ID NO:8)不能(图1A,1B, 1C和1D)。因此,我们将该RNA指定为dRNA(脱氨酶募集RNA)。为了验证细胞内源性ADAR可被募集以通过dRNA进行腺嘌呤脱氨基作用,我们在Adar1 p110和Adar1 p150双敲除293T细胞系中进行了实验(图6E和6F)。因为Adar1 普遍表达,而Adar2主要在脑中高水平表达。因此我们提出:通过dRNA打靶腺嘌呤脱氨基作用主要由Adar1而不是Adar2介导。正如预期的那样,打靶的dRNA不能在293T-Adar1-/-细胞中触发EGFP表达,但是过表达外源Adar1 p110,p150或Adar2可以回复293T-Adar1-/-细胞中的EGFP表达(图1E和1F),这提示:在293T细胞中,dRNA可以募集Adar1或Adar2来介导靶标RNA上的腺嘌呤脱氨基作用。此外,我们发现:Adar1-p110和Adar2具有比Adar1-p150 更高的编辑活性(图1G和图6G),这可能是由于Adar1-p110和Adar1-p150的不同细胞定位。
为了确定EGFP的荧光恢复是由打靶的RNA编辑事件引起的,我们通过 RT-PCR直接测量dRNA介导的报道分子2转录物的编辑,然后进行靶向的 Sanger测序和二代测序。测序结果显示:靶标腺嘌呤(A-C错配位点)中的A至 G碱基转化,并且,编辑率可达到13%(图6H和图1H)。此外,我们还在靶标腺嘌呤附近的序列窗口期间观察到略微的A到G编辑,这很可能是由于双链 RNA区域增加,之后,我们将尝试用几种策略去除非预期的编辑。
实施例2.优化设计dRNA的因素
接下来,我们开始优化dRNA以实现更高的编辑效率。首先,我们的目的是确定在靶标腺嘌呤相对位置哪个碱基更有利于编辑。以前的研究表明,靶标腺苷的相对的碱基会有效地影响编辑。因此,我们在与靶标A相对的中间位置设计了具有错配N(A,U,C和G)的71ntdRNA。基于FACS结果,我们发现,四种不同的dRNA有效编辑如下:C>A>U>G(图2A和2B)。最近,据报道,靶标UAG位置中的小泡可能有利于编辑效率。因此,我们设计了含有两个或三个错配碱基的靶标UAG位点的dRNA来检验我们的假设。使用 Golden Gate克隆方法,在具有BFP标记的dRNA载体上设计和构建了16种不同的71nt dRNA。我们发现,具有CCA和GCA序列的dRNA具有最高的效率,这意味着,小泡对A-I编辑几乎没有贡献,至少在UAG靶标位点的情况下。此外,NCA序列的四个dRNA具有较高百分比的GFP阳性细胞,推论出,互补的U-A碱基对可能对ADAR编辑很重要(图2C和2D)。随后,我们基于报道分子测试不同长度的dRNA的效率。dRNA设计为中间位置的错配C,长度范围为31nt至221nt。我们发现,编辑效率随着dRNA的增加而增加。报道系统的编辑高峰位于171nt dRNA。51nt dRNA可以以良好的效率(18%)激活报道系统(图2E和2F)。最后,我们检查了dRNA错配C的位置是否影响编辑效率。 dRNA保持相同的71nt长度,设计了与转录起始位置不同的错配C。基于FACS 结果,我们发现,相反错配C的位置可能影响编辑效率,并且,位于dRNA 的5'侧或3'侧的错配C具有较低的效率(图2G和2H)。通过Gibson克隆构建出16 种不同的包含靶标序列的报道分子,其含有所有可能的3种碱基基序,然后克隆到pLenti骨架(pLenti-CMV-MCS-SV-Bsd,Stanley Cohen Lab,Stanford University)中。所述靶标序列如下所示。
含有所有可能的3碱基基序的靶标序列:
TAT:
ATGGACGAGCTGTACAAGCTGCAGGGCGGAGGAGGCAGCGCCTGCTC GCGATGCTATAGGGCTCTGCCAGTGAGCAAGGGCGAGGAGCTGTTCAC CGGGGTGGTGCCCATC(SEQ ID NO:9)
TAA:
ATGGACGAGCTGTACAAGCTGCAGGGCGGAGGAGGCAGCGCCTGCTC GCGATGCTAAAGGGCTCTGCCAGTGAGCAAGGGCGAGGAGCTGTTCA CCGGGGTGGTGCCCATC(SEQ ID NO:10)
TAC:
ATGGACGAGCTGTACAAGCTGCAGGGCGGAGGAGGCAGCGCCTGCTC GCGATGCTACAGGGCTCTGCCAGTGAGCAAGGGCGAGGAGCTGTTCA CCGGGGTGGTGCCCATC(SEQ ID NO:11)
TAG:
ATGGACGAGCTGTACAAGCTGCAGGGCGGAGGAGGCAGCGCCTGCTC GCGATGCTAGAGGGCTCTGCCAGTGAGCAAGGGCGAGGAGCTGTTCA CCGGGGTGGTGCCCATC(SEQ ID NO:12)
AAT:
ATGGACGAGCTGTACAAGCTGCAGGGCGGAGGAGGCAGCGCCTGCTC GCGATGCAATAGGGCTCTGCCAGTGAGCAAGGGCGAGGAGCTGTTCA CCGGGGTGGTGCCCATC(SEQ ID NO:13)
AAA:
ATGGACGAGCTGTACAAGCTGCAGGGCGGAGGAGGCAGCGCCTGCTC GCGATGCAAAAGGGCTCTGCCAGTGAGCAAGGGCGAGGAGCTGTTCA CCGGGGTGGTGCCCATC(SEQ ID NO:14)
AAC:
ATGGACGAGCTGTACAAGCTGCAGGGCGGAGGAGGCAGCGCCTGCTC GCGATGCAACAGGGCTCTGCCAGTGAGCAAGGGCGAGGAGCTGTTCA CCGGGGTGGTGCCCATC(SEQ ID NO:15)
AAG:
ATGGACGAGCTGTACAAGCTGCAGGGCGGAGGAGGCAGCGCCTGCTC GCGATGCAAGAGGGCTCTGCCAGTGAGCAAGGGCGAGGAGCTGTTCA CCGGGGTGGTGCCCATC(SEQ ID NO:16)
CAT:
ATGGACGAGCTGTACAAGCTGCAGGGCGGAGGAGGCAGCGCCTGCTC GCGATGCCATAGGGCTCTGCCAGTGAGCAAGGGCGAGGAGCTGTTCA CCGGGGTGGTGCCCATC(SEQ ID NO:17)
CAA:
ATGGACGAGCTGTACAAGCTGCAGGGCGGAGGAGGCAGCGCCTGCTC GCGATGCCAAAGGGCTCTGCCAGTGAGCAAGGGCGAGGAGCTGTTCA CCGGGGTGGTGCCCATC(SEQ ID NO:18)
CAC:
ATGGACGAGCTGTACAAGCTGCAGGGCGGAGGAGGCAGCGCCTGCTC GCGATGCCACAGGGCTCTGCCAGTGAGCAAGGGCGAGGAGCTGTTCA CCGGGGTGGTGCCCATC(SEQ ID NO:19)
CAG:
ATGGACGAGCTGTACAAGCTGCAGGGCGGAGGAGGCAGCGCCTGCTC GCGATGCCAGAGGGCTCTGCCAGTGAGCAAGGGCGAGGAGCTGTTCA CCGGGGTGGTGCCCATC(SEQ ID NO:20)
GAT:
ATGGACGAGCTGTACAAGCTGCAGGGCGGAGGAGGCAGCGCCTGCTC GCGATGCGATAGGGCTCTGCCAGTGAGCAAGGGCGAGGAGCTGTTCA CCGGGGTGGTGCCCATC(SEQ ID NO:21)
GAA:
ATGGACGAGCTGTACAAGCTGCAGGGCGGAGGAGGCAGCGCCTGCTC GCGATGCGAAAGGGCTCTGCCAGTGAGCAAGGGCGAGGAGCTGTTCA CCGGGGTGGTGCCCATC(SEQ ID NO:22)
GAC:
ATGGACGAGCTGTACAAGCTGCAGGGCGGAGGAGGCAGCGCCTGCTC GCGATGCGACAGGGCTCTGCCAGTGAGCAAGGGCGAGGAGCTGTTCA CCGGGGTGGTGCCCATC(SEQ ID NO:23)
GAG:
ATGGACGAGCTGTACAAGCTGCAGGGCGGAGGAGGCAGCGCCTGCTC GCGATGCGAGAGGGCTCTGCCAGTGAGCAAGGGCGAGGAGCTGTTCA CCGGGGTGGTGCCCATC(SEQ ID NO:24)
dRNA保持相同的111bp长度,并且,在中心处朝向靶标A设计了错配C。
在12孔细胞培养群集中,将2×105个细胞HEK293T铺板到每个孔中,并进行每个实验三次重复。24小时后,使用X-tremeGENE HP DNA转染试剂 (Roche)将0.5μg的dRNA质粒和0.5μg的报道分子靶标质粒共转染至细胞。48 小时后,用胰蛋白酶处理细胞并通过FACS(BD)选择出mCherry阳性细胞。收获总共4×105个细胞,并使用RNAprep纯细胞/细菌试剂盒(TIANGEN DP430)提取总RNA。使用Quantscript RT试剂盒(TIANGEN KR103-04)从2μg 的总RNA合成cDNA。并通过PCR扩增111个靶标区域并进行深度测序。
我们发现,所有16种不同的3碱基基序都可以通过本申请的示例性RNA 编辑方法进行编辑,尽管效率可变。总之,结果表明,要编辑的A的5'侧最近邻位具有优先度U>C≈A>G并且要编辑的A的3'侧最近邻位具有优先度G> C>A≈U。数据以图3A中的条形图或者图3B中的热图表示。
实施例3.编辑从内源基因转录的RNA
接下来,我们测试了dRNA是否可以介导从内源基因转录的mRNA。我们设计了打靶四种基因KRAS,PPIB,β-肌动蛋白和GAPDH的dRNA。对于 KRAS mRNA,我们设计了91、111、131、151、171和191个核苷酸长度的 dRNA(图4A),其序列如下所示。
91-nt KRAS-dRNA
UAGCUGUAUCGUCAAGGCACUCUUGCCUACGCCACCAGCUCCAACC ACCACAAGUUUAUAUUCAGUCAUUUUCAGCAGGCCUCUCUCCCGC (SEQ ID NO:25)
111-nt KRAS-dRNA
GAUUCUGAAUUAGCUGUAUCGUCAAGGCACUCUUGCCUACGCCACC AGCUCCAACUACCACAAGUUUAUAUUCAGUCAUUUUCAGCAGGCCU CUCUCCCGCACCUGGGAGC(SEQ ID NO:26)
131-nt KRAS-dRNA
UCCACAAAAUGAUUCUGAAUUAGCUGUAUCGUCAAGGCACUCUUGC CUACGCCACCAGCUCCAACUACCACAAGUUUAUAUUCAGUCAUUUU CAGCAGGCCUCUCUCCCGCACCUGGGAGCCGCUGAGCCU(SEQ ID NO:27)
151-nt KRAS-dRNA
AUCAUAUUCGUCCACAAAAUGAUUCUGAAUUAGCUGUAUCGUCAAG GCACUCUUGCCUACGCCACCAGCUCCAACCACCACAAGUUUAUAUU CAGUCAUUUUCAGCAGGCCUCUCUCCCGCACCUGGGAGCCGCUGAGCCUCUGGCCCCGC(SEQ ID NO:28)
171-nt KRAS-dRNA
CUAUUGUUGGAUCAUAUUCGUCCACAAAAUGAUUCUGAAUUAGCUG UAUCGUCAAGGCACUCUUGCCUACGCCACCAGCUCCAACCACCACA AGUUUAUAUUCAGUCAUUUUCAGCAGGCCUCUCUCCCGCACCUGGG AGCCGCUGAGCCUCUGGCCCCGCCGCCGCCUUC(SEQ ID NO:29)
191-nt KRAS-dRNA
UAGGAAUCCUCUAUUGUUGGAUCAUAUUCGUCCACAAAAUGAUUCU GAAUUAGCUGUAUCGUCAAGGCACUCUUGCCUACGCCACCAGCUCC AACCACCACAAGUUUAUAUUCAGUCAUUUUCAGCAGGCCUCUCUCC CGCACCUGGGAGCCGCUGAGCCUCUGGCCCCGCCGCCGCCUUCAGUG CCUGCG(SEQ ID NO:30)
二代测序结果显示:dRNA可编辑靶标KRAS mRNA,编辑效率高达 11.7%(图4B)。对于内源性PPIB mRNA,靶标的三个位点:位点1,位点2和位点3。我们为每个位点设计了151个核苷酸长度的dRNA(图4C),其序列如下所示。
151-nt PPIB-dRNA(位点1)
GAGGCGCAGCAUCCACAGGCGGAGGCGAAAGCAGCCCGGACAGCUG AGGCCGGAAGAGGGUGGGGCCGCGGUGGCCAGGGAGCCGGCGCCGC CACGCGCGGGUGGGGGGGACUGGGGUUGCUCGCGGGCUCCGGGCGGGCGGCGGGCGCCG(SEQ ID NO:31)
151-nt PPIB-dRNA(位点2)
UCCUGUAGCUAAGGCCACAAAAUUAUCCACUGUUUUUGGAACAGUC UUUCCGAAGAGACCAAAGAUCACCCGGCCCACAUCUUCAUCUCCAA UUCGUAGGUCAAAAUACACCUUGACGGUGACUUUGGGCCCCUUCUUCUUCUCAUCGGCC(SEQ ID NO:32)
151-nt PPIB-dRNA(位点3)
GCCCUGGAUCAUGAAGUCCUUGAUUACACGAUGGAAUUUGCUGUUU UUGUAGCCAAAUCCUUUCUCUCCUGUAGCCAAGGCCACAAAAUUAU CCACUGUUUUUGGAACAGUCUUUCCGAAGAGACCAAAGAUCACCCGGCCUACAUCUUCA(SEQ ID NO:33)
二代测序的结果显示:dRNA可以以高达14%的编辑效率有效地编辑 PPIB mRNA位点1(图4D)。对于PPIB mRNA位点2和位点3,编辑效率为1.5%和0.6%(图4E和4F)。对于内源性β-肌动蛋白mRNA,我们为每个位点选择了两个靶标位点和经设计的dRNA(图4G),其序列如下所示。
72-ntβ-肌动蛋白-dRNA(位点1)
GCGCAAGUUAGGUUUUGUCAAGAAAGGGUGUAACGCAACCAAGUCAUAGUCCGCCUAGAAGCAUUUGCGGUG(SEQ ID NO:34)
131-ntβ-肌动蛋白-dRNA(位点1)
GCCAUGCCAAUCUCAUCUUGUUUUCUGCGCAAGUUAGGUUUUGUCA AGAAAGGGUGUAACGCAACCAAGUCAUAGUCCGCCUAGAAGCAUUU GCGGUGGACGAUGGAGGGGCCGGACUCGUCAUACUCCUG(SEQ ID NO:35)
70-ntβ-肌动蛋白-dRNA(位点2)
GGACUUCCUGUAACAACGCAUCUCAUAUUUGGAAUGACCAUUAAAAAAACAACAAUGUGCAAUCAAAGUC(SEQ ID NO:36)
我们发现,dRNA可以编辑位点1和位点2的β-肌动蛋白mRNA,每个位点的编辑效率高达1.4%(图4H和图8A)。我们还观察到更长的dRNA被赋予更高的编辑效率,dRNA-71nt为0.6%,dRNA-131nt为1.4%(图4H)。对于另一个管家基因GAPDH,我们使用71nt dRNA(CAAGGUGCGGCUCCGGCCCCUCCCCUCUUCAAGGGGUCCACA UGGCAACUGUGAGGAGGGGAGAUUCAGUG(SEQ IDNO:37)),编辑效率为0.3%,可能是由于dRNA的长度短(图8B)。
实施例4.对示例性LEAPER方法的脱靶分析
对于治疗应用,编辑的精确度是关键的。接下来,我们试图表征本申请的示例性RNA编辑系统的特异性。我们选择内源性PPIB位点1和KRAS位点进行分析。对于PPIB位点1,我们可以看到,在dRNA覆盖区域之间,在靶标 A76的侧翼存在几个A碱基,例如A22,A30,A33,A34,A39,A49,A80, A91,A107和A140。这揭示了,那些侧翼的A碱基几乎没有受到编辑,而靶标A76碱基(A-C错配)显示高达14%的编辑效率(图5A和5B)。
对于KRAS位点,我们可以在dRNA覆盖区域中看到,在靶标A56碱基侧翼存在许多腺嘌呤,多达29个侧翼的A碱基。根据KRAS mRNA编辑结果,我们发现虽然靶标A56碱基(A-C错配)显示高达11.7%的编辑效率,但是可以编辑侧翼的腺嘌呤(图5C和5D)。编辑了多种脱靶的腺嘌呤,而诸如A41,A43, A45,A46,A74,A79的腺嘌呤显示出更多的编辑。我们发现那些未经编辑的A碱基的5'侧最近邻位是G或C,而那些有效编辑的腺嘌呤的5'侧最近邻位是T或A。基于这一观察,我们开始设计dRNA以最小化对那些易于编辑的腺嘌呤的脱靶编辑。在我们的研究中,我们发现ADAR优选:A-C与A-A,A-U 错配,并且A-G错配是最不优选的。因此,我们提出,对于5'侧最近邻位为U 或A的脱靶A碱基,A-G错配可能会减少或消除脱靶效应。之前的研究报道了 A-G错配可能会阻碍ADAR的脱氨基编辑。
接下来,基于图5D中的统计结果和现有知识,我们设计了三种91-nt dRNA变体和四种111-nt dRNA变体(具有如下所示的序列),其含有不同的 A-G错配组合,:dRNA-AG1(A41,A46,A74);dRNA-AG2(A41,A43,A45, A46,A74,A79);dRNA-AG3(A31,A32,A33,A41,A43,A45,A46, A47,A74,A79);dRNA-AG4(A7,A31,A32,A33,A40,A41,A43,A45, A46,A47,A74,A79,A95)(图4E)。
KRAS-dRNA-91-AG2
UAGCUGUAUCGUCAAGGCACUCgUGCCgACGCCACCAGCUCCAACcA CCACAAGgggAgAgUCAGUCAgggUCAGCAGGCCUCUCUCCCGC(SEQ ID NO:38)
KRAS-dRNA-91-AG3
UAGCUGUAUCGUCAAGGCACUCUUGCCgACGCCACCAGCUCCAACcA CCACAAGUgUAUAgUCAGUCAUUUUCAGCAGGCCUCUCUCCCGC (SEQ ID NO:39)
KRAS-dRNA-91-AG4
UAGCUGGAUCGUCAAGGCACUCGUGCCGACGCCACCAGCUCCAACC ACCACAAGGGGAGAGGCAGUCAGGGUCAGCAGGCCUCUCUCCCGC (SEQ ID NO:40)
KRAS-dRNA-111-AG1
GAUUCUGAAUUAGCUGUAUCGUCAAGGCACUCUUGCCgACGCCACC AGCUCCAACcACCACAAGUgUAUAgUCAGUCAUUUUCAGCAGGCCUC UCUCCCGCACCUGGGAGC(SEQ ID NO:41)
KRAS-dRNA-111-AG2
GAUUCUGAAUUAGCUGUAUCGUCAAGGCACUCgUGCCgACGCCACCA GCUCCAACcACCACAAGUggAgAgUCAGUCAUUUUCAGCAGGCCUCUC UCCCGCACCUGGGAGC(SEQ ID NO:42)
KRAS-dRNA-111-AG3
GAUUCUGAAUUAGCUGUAUCGUCAAGGCACUCgUGCCgACGCCACCA GCUCCAACcACCACAAGgggAgAgUCAGUCAgggUCAGCAGGCCUCUCU CCCGCACCUGGGAGC(SEQ ID NO:43)
KRAS-dRNA-111-AG4
GCUCCCCGGUGCGGGAGAGAGGCCUGCUGACCCUGACUGCCUCUCC CCUUGUGGUGGUUGGAGCUGGUGGCGUCGGCACGAGUGCCUUGACG AUCCAGCUAAUUCAGAAUC(SEQ ID NO:44)
然后将这些dRNA转染到HEK293T细胞中,并将空白载体和71-nt非打靶 dRNA对照:(TCTCAGTCCAATGTATGGTCCGAGCACAAGCTCTAATCAAAGTCCGCG GGTGTAGACCGGTTGCCATAGGA(SEQID NO:45))用作阴性对照。对于 91-nt dRNA,深度测序结果显示,dRNA-91-AG2的中上靶(on-target)编辑 (A56)降至2.8%,dRNA-91-AG3的降至2.3%,dRNA-91-AG4的降至0.7%,这是与没有A-G错配的dRNA-91的上靶编辑(A56)效率7.9%相比(图4F)。对于 91-nt dRNA,dRNA-111-AG2的中上靶编辑(A56)降低至5.1%,而dRNA -111-AG3的降低至4.9%,这是与没有A-G错配的dRNA-111的上靶编辑(A56) 效率15.1%相比(图4F),其表明较长的dRNA可以承受更多的A-G错配。接下来我们选择111-nt dRNA进行详细的脱靶分析。除A7和A79外,显著消除了侧翼的A碱基编辑(图4G)。对于A7碱基,可以通过该位点的进一步A-G错配设计来防止脱靶效应,这在当前的dRNA设计中是不存在的。对于A79碱基,引入相邻的两个A-G错配A78/A79可能有助于消除脱靶效应。基于这样的结果,应用本申请的RNA编辑系统治疗基因疾病是非常有希望和鼓舞人心的。
实施例5.在多个细胞系中测试示例性LEAPER方法
通过HEK293T细胞中的结果,我们认为,由线性dRNA及其靶标RNA形成的双链RNA可以募集内源ADAR蛋白用于A-I编辑。为了证实这一假设,我们选择了更多的细胞系来测试我们的RNA编辑方法。结果如图9所示。多个细胞系的结果证明了我们RNA编辑方法有普遍性。首先,尽管具有多种编辑效率,但使用dRNA募集内源性ADAR适合于多种人类细胞系(其源自7种不同的组织和器官)。此外,该方法不仅可以在人类细胞中起作用,而且可以在小鼠细胞中起作用,从而提供了在小鼠上进行实验的可能性。
实施例6.利用内源性ADAR进行RNA编辑
为了探索有效的RNA编辑平台,我们将高活性E1008Q突变体 ADAR1(ADAR1DD)40的脱氨酶结构域与催化失活的LbuCas13(dCas13a),一种 RNA引导的靶向RNA的CRISPR效应子41融合(图10A)。为了评估RNA编辑效率,我们构建了一个包含通过包含3x GGGGS编码区和框内UAG终止密码子的序列连接mCherry和EGFP基因的替代报道分子(报道分子-1,图10B)。报道分子转染的细胞仅表达mCherry蛋白,而在报道分子转录物的UAG上进行靶向编辑可以将终止密码子转换为UIG,因此允许下游EGFP表达。这样的报道分子使我们能够通过监测EGFP水平来测量A-至-I编辑效率。然后,我们设计了hU6启动子驱动的crRNA(CRISPR RNA),其包含进行Cas13a识别的5' 支架和可变长度的间隔子序列以用于靶向(crRNACas13a,紧随LbuCas13 crRNA序列)。
LbuCas13 crRNA序列
与靶转录物互补的序列均包含与UAG密码子相对的CCA,从而导致胞苷 (C)与腺苷(A)错配(图10B),因为腺苷脱氨作用优先发生在A-C错配位点13,14。为了测试crRNA的最佳长度,在稳定表达报道分子-1的HEK293T细胞中,将不同长度的非靶向或靶向crRNA与dCas13a-ADAR1DD蛋白共表达。用含有至少40-nt长的匹配序列的crRNA观察到了由EGFP表达出现所指示的明显的RNA编辑作用,crRNA越长,EGFP阳性百分比就越高(图10C)。令人惊讶地,仅长crRNACas13a的表达似乎足以激活EGFP表达,并且 dCas13a-ADAR1DD的共表达反而降低了crRNA活性(图10C,10d)。EGFP表达显然是序列依赖性的,因为70-nt(不包括用于长度计算的5'支架)对照RNA不能激活EGFP的表达(图10C,10D)。
令人惊讶的发现是,某些长期工程化的crRNACas13a能够独立于 dCas13a-ADAR1DD进行RNA编辑,我们决定从crRNA中删除Cas13a募集的支架序列。因为crRNA70具有触发EGFP表达的最高活性(图10C,10D),所以我们选择了相同的70-nt长的指导RNA,而没有Cas13a募集支架进行进一步测试 (图11A和以下在实施例中使用的arRNA和对照RNA序列)。
事实证明,这种线性指导RNA在接近40%携带报道分子-1的总细胞中诱导了EGFP的强表达(图11B,上图)。由于内源性ADAR蛋白可以编辑双链 RNA(dsRNA)底物12,因此我们认为长指导RNA可以与靶标转录物退火形成 dsRNA底物,转而募集内源性ADAR蛋白用于靶向编辑。因此,我们将这样的指导RNA称为arRNA(ADAR募集RNA)。为了验证内源性ADAR蛋白是否确实是上述观察的原因,我们着手研究在ADAR缺陷细胞中arRNA介导的 RNA编辑。由于在HEK293T细胞中几乎检测不到ADAR2 mRNA(图12A),因此我们生成了HEK293T ADAR1-/-细胞,从而使该细胞系在ADAR1和ADAR2 中均缺乏(图11C,D)。实际上,ADAR1的消耗消除了arRNA70诱导的EGFP 信号(图11B,下图)。此外,HEK293T ADAR1-/-细胞中ADAR1p110,ADAR1p150或ADAR2的外源表达(图11C,D)成功地挽救了通过arRNA70诱导EGFP的丢失(图11E,图12B),证明了arRNA诱导的EGFP报道分子其表达完全取决于天然的ADAR1,其活性可以通过其同种型(p110和p150)或ADAR2重建。对 arRNA70靶向区域的Sanger测序分析显示,UAG中预测的腺苷位点有一个A/G 重叠峰,表明明显的A至I(G)转化(图11F)。下一代测序(NGS)进一步证实了A 至I的转化率约为全部报道分子转录物的13%(图11G)。定量PCR分析表明 arRNA70不会减少靶标转录物的表达(图13),排除了arRNA可能的RNAi效应。总体而言,我们的数据表明,arRNA能够通过工程化的A-C错配对靶标转录物产生显着水平的编辑。
实施例7.LEAPER可以在多个细胞系中进行RNA编辑
因为内源性ADAR蛋白的表达是LEAPER介导的RNA编辑的前提,所以我们测试了LEAPER在一组来自不同组织的细胞系中的性能,这些细胞系包括HT29,A549,HepG2,RD,SF268,SW13和HeLa。我们首先使用蛋白质印迹分析检查了所有三种ADAR蛋白的内源表达。ADAR1在所有测试的细胞系中都高度表达,其在蛋白质印迹中的身份已通过阴性对照HEK293T ADAR1–/–系得到证实(图14A,B)。仅在HepG2和HeLa细胞中检测到ADAR3(图14A,B)。在任何细胞中均未检测到ADAR2,其结果并非由于蛋白质印迹失败,因为可以从过表达ADAR2的HEK293T细胞中检测到ADAR2蛋白(图 14A,B)。这些发现与先前报道的ADAR1普遍表达,而ADAR2和ADAR3的表达仅限于某些组织一致11。
然后我们着手在这些细胞系中测试靶向报道分子-1的重新设计的71-nt arRNA(arRNA71)的编辑效率(图15A和上面列出的这项研究中使用的arRNA 和对照RNA的序列)。
LEAPER在该arRNA71的所有测试的细胞中都工作,尽管效率有所不同 (图14C)。这些结果与先前的报道一致,除了HepG2和HeLa细胞外,ADAR1/2 蛋白水平与RNA编辑产量相关42。编辑效率与ADAR1水平的次优相关性可能是由于这两个系中都有大量的ADAR3表达(图14A,B),因为据报道ADAR3 在RNA编辑中起抑制作用。重要的是,LEAPER还用于小鼠起源的三种不同细胞系(NIH3T3,小鼠胚胎成纤维细胞(MEF)和B16)(图14D),为通过动物和疾病模型测试其治疗潜力铺平了道路。总体而言,我们得出的结论是, LEAPER是一种用于广谱细胞类型以及不同生物体的多功能工具。
实施例8.LEAPER的特性和优化
为了更好地表征和优化LEAPER,我们研究了靶标转录物的UAG三联体内与腺苷相对的核苷酸的选择。在HEK293T细胞中,靶向报道分子-1的 arRNA71显示出可变的编辑效率,具有与靶向UAG相对的变化的三联体 (5’-CNA,N表示A/U/C/G之一)(上面列出的在这项研究中使用的arRNA 和对照RNA的序列)。A-C错配导致最高的编辑效率,而A-G错配产生最少但明显的编辑(图16A)。然后,我们研究了arRNA中A-C错配侧翼核苷酸的优先度。我们测试了胞苷(5'-N1CN2)周围的所有16个5'和3'相邻位点组合(上面列出的在这项研究中使用的arRNA和对照RNA的序列),发现3'相邻腺苷是有效编辑所必需的,而腺苷是5'位点上最不利的核苷酸(图16B,C)。因此,我们得出结论,arRNA上的CCA基序赋予了靶向UAG位点的最高编辑效率。值得注意的是,arRNA中的3'相邻鸟苷(5'-N1CG)表现出显著的抑制作用(图16B,C)。
RNA的长度似乎在指导对靶转录物的编辑中与arRNA效率有关(图 10C),与先前的报道一致42。为了完全理解这种效果,我们测试了可变长度的arRNA,它们靶向两种不同的报道分子转录物-报道分子-1和报道分子 -2(图15A,B)。对于任一报道分子靶向,设计和测试了10种不同大小的arRNA,范围从31-nt到211-nt,CCA三联体(用于UAG靶向)正好位于中间(上面列出的这项研究中使用的arRNA和对照RNA的序列)。基于报道分子EGFP活性,对于两个报道分子,arRNA的长度与编辑效率正相关,在111-191-nt处达到峰值 (图16D)。尽管一个arRNA51似乎起作用,但71-nt是arRNA对两个报道分子均起作用的最短长度(图16D)。
接下来,我们研究了arRNA内A-C错配位置对编辑效率的影响。我们将所有要测试的arRNA的长度固定为71-nt,并将靶向UAG的ACC三联体从 arRNA中的5'滑到3'(上面列出的这项研究中使用的arRNA和对照RNA的序列)。事实证明,在两个报道分子中,将A-C错配置于中间区域会导致较高的编辑产率,且错配位点接近3'端的arRNA优于接近5'端的arRNA(图16E)。为方便起见,对所有我们的后续研究,我们都将A-C错配置于arRNA的中心。
我们还测试了LEAPER的靶向灵活性,并试图确定靶标上的UAG是否是进行RNA编辑的唯一基序。对于报道分子-3上的所有16个三联体组合 (5'-N1AN2)(图15C),我们使用了固定长度(111-nt)的相应arRNA,并确保了除了编辑位点(AC错配)外,arRNA和报道分子的完美序列匹配(图16F和上面列出的这项研究中使用的arRNA和对照RNA的序列)。NGS结果表明,所有 N1AN2基序均可编辑。UAN2和GAN2分别是最优选和最不优选的基序(图 16F,G)。总体而言,靶标腺苷的最近邻位优先度为5'U>C≈A>G和3' G>C>A≈U(图16G)。
实施例9.使用LEAPER编辑内源转录物
接下来,我们检查了LEAPER是否可以对内源转录物进行有效的编辑。使用不同长度的arRNA,我们靶向PPIB,KRAS和SMAD4基因转录物中的UAG 基序,以及FANCC基因转录物中的UAC基序(图17A,上面列出的这项研究中使用的arRNA和对照RNA序列)。令人鼓舞的是,所有四种转录物中的靶标腺苷位点均由其相应的所有四种大小的arRNA编辑,尽管根据NGS结果的效率有所不同(图17B)。与我们先前的观察一致,更长的arRNA倾向于产生更高的编辑率。值得注意的是,151-nt的arRNAPPIB编辑了PPIB基因总转录物的(图17B)。没有arRNA在其靶标转录物(图18A)或最终蛋白质水平(例如KRAS,图18B)上显示出RNAi作用。此外,LEAPER能够在非UAN位点上达到理想的编辑率(图17C和上面列出的这项研究中使用的arRNA和对照RNA 的序列),显示LEAPER在编辑内源转录物上的灵活性。为了进一步探索LEAPER的功能,我们测试了LEAPER是否可以同时靶向多个位点。我们通过共表达两个arRNA(上面列出的这项研究中使用的arRNA和对照RNA的序列)观察到TARDBP和FANCC转录物的多重编辑,其效率甚至高于单个 arRNA(图17D)的那些,表明LEAPER非常适合并行编辑多个靶标。
值得注意的是,ADAR1/2倾向于使RNA双链体中的多个腺苷杂乱地脱氨基44,并且A-C错配不是指导A至I转换的唯一基序(图16A)。因此,可以合理地假设,arRNA覆盖范围内靶标转录物上的所有腺苷均受到可变水平的编辑,这是不需要的修饰的主要来源。arRNA越长,这样的脱靶的可能性就越高。因此,我们检查了这些靶标转录物中arRNA覆盖区域内的所有腺苷位点。对于PPIB转录物,在整个测序窗口中,对于可变大小的arRNA,观察到很少的脱靶编辑(图17E,F)。但是,在靶向KRAS,SMAD4和FANCC基因的情况下,检测到多个脱靶编辑(图19A-F)。特别是对于KRAS,在arRNA111的测序窗口中,30个腺苷中有11个进行了大量的A至I转化(图19A,B)。
我们接下来尝试开发策略以最小化这样的不需要的脱靶效应。因为A-G 错配抑制了UAG靶向的编辑(图16A),所以我们假设将鸟苷与非靶向腺苷配对可能会减少不良的编辑。然后,我们测试了报道分子-3中所有可能的三联体组合(5'-N1AN2)中A-G错配对腺苷的影响(图15C和上面列出的这项研究中使用的arRNA和对照RNA序列)。与A-C错配(图16F)相比,除了UAG或AAG 靶向()(图17G),A-G错配确实降低了所有测试靶标上腺苷的编辑。为了进一步降低不想要的位点的编辑率,我们继续测试了两个连续错配的影响。结果表明,与UAG或AAG相对的三联体的3'端核苷酸处的额外错配消除了其相应的腺苷编辑(图17H以及上面列出的这项研究中使用的arRNA和对照RNA的序列)。根据这些发现,我们尝试应用此规则以减少KRAS转录物中的脱靶(图19A)。我们首先设计了一个arRNA(arRNA111-AG6),其在arRNA111覆盖的所有“易编辑”基序上产生了AG错配(图17I,图19A和上述研究中使用的arRNA和对照RNA的序列),包括AAU(第61位),UAU(第63位),UAA(第 65位),AAA(第66位),UAG(第94位)和AAG(第99位)。该arRNA111-AG6消除了大部分脱靶编辑,同时保持了约5%的脱靶编辑率。与图17G中的发现一致,单个A-G错配不能完全最小化AAG基序(第99位)的编辑(图17I和图19A)。然后,我们在arRNA111-AG6上添加了更多错配,包括双重错配(与靶标基序5'-AAG相对的5'-CGG),以及三个另外的A-G错配以减轻第27、98和115位腺苷的编辑(arRNA111-AG9)(上面列出的这项研究中使用的arRNA和对照RNA 的序列)。因此,我们实现了大大提高的编辑特异性,而又没有在靶标位点 (A76)上额外损失编辑率(图17I)。总之,结合其他规则的工程化的LEAPER 可以对内源转录物进行有效和更精确的RNA编辑。
实施例10.LEAPER的RNA编辑特异性
除了在arRNA覆盖的dsRNA区域内可能的脱靶效应外,我们还担心通过 arRNA的部分碱基配对对其他转录物的潜在脱靶效应。然后,我们进行了转录组范围的RNA测序分析,以评估LEAPER的全局脱靶效应。在进行RNA序列分析之前,先用对照RNA151或PPIB特异性arRNA(arRNA151-PPIB)表达质粒转染细胞。我们在对照RNA151组中确定了六个潜在脱靶(图20A),在 arRNA151-PPIB的五个潜在脱靶(图20B),基于NGS分析的PPIB脱靶率为~37%(图20B)。进一步的分析表明,除来自EIF2AK2转录物的两个位点外,所有位点均位于SINE(Alu)或LINE区域(图20A,B),均易于受到ADAR介导的编辑45,表明这些脱靶可能不是从靶标转录物和arRNA或对照RNA的配对中得出的。值得注意的是,两组均出现了脱靶转录物,WDR73和SMYD4,表明它们不太可能是依赖序列的RNA编辑。实际上,最小自由能分析表明,所有这些可能的脱靶转录物均不能与对照RNA151或arRNA151-PPIB形成稳定的双链体(图20C)。为了进一步测试arRNA是否产生依赖序列的脱靶,我们通过使用NCBI BLAST比较arRNA151-PPIB和arRNA111-FANCC的序列相似性来选择潜在的脱靶位点。arRNA151-PPIB的TRAPPC12转录物以及 arRNA111-FANCC的ST3GAL1,OSTM1-AS1和EHD2转录物中的三个位点是最佳候选者(图20D和图21A)。NGS分析表明,在这些预测的脱靶位点中均未检测到编辑(图20D和图21B)。这些结果表明,LEAPER允许在靶标位点进行有效编辑,同时保持转录组范围的特异性,而没有检测到依赖序列的脱靶编辑。
实施例11.LEAPER在哺乳动物细胞中的安全性评估
因为arRNA依赖于内源性ADAR蛋白来编辑靶标转录物,所以我们想知道外源性arRNA的添加是否通过占用过多的ADAR1或ADAR2蛋白来影响天然RNA编辑事件。因此,我们从转录组范围的RNA测序结果中分析了模拟组和arRNA151-PPIB组共享的A-to-I RNA编辑位点,并分析了模拟组和对照 RNA151组之间的比较。与模拟组相比,对照RNA151组和arRNA151-PPIB组均未显示出显著差异(图22A,B),这表明LEAPER对内源ADAR1催化天然A-to-I 编辑事件的正常功能影响很小。
同时,我们使用RNA-seq数据进行了差异基因表达分析,以验证arRNA 是否影响全局基因表达。我们发现,与模拟组相比,对照RNA151和 arRNA151-PPIB均不影响全局基因表达(图22C,D)。与我们先前的观察结果一致(图18A),arRNA对PPIB的表达未显示任何RNAi作用(图22C,D)。
考虑到arRNA与靶转录物形成RNA双链体并且RNA双链体可引起先天免疫应答,我们研究了arRNA的引入是否具有这样的作用。为了测试这一点,我们选择了靶向已证明有效的四个基因转录物的arRNA。我们没有观察到干扰素-β(IFN-β)(图22E)或白介素6(IL-6)(图22F)的任何mRNA诱导,这是先天性免疫激活的两个标志。作为阳性对照,双链RNA的合成类似物-聚(I:C) 诱导了强烈的IFN-β和IL-6表达(图22E,F)。LEAPER似乎不会在靶细胞中诱导免疫原性,一种对安全治疗很重要的特征。
实施例12.通过LEAPER恢复p53的转录调节活性
现在我们已经建立了无需引入外源蛋白质就可以进行RNA编辑的新方法,我们试图证明其治疗作用。我们首先针对了肿瘤抑制基因TP53,该基因在维持细胞稳态中起着至关重要的作用,但在>50%的人类癌症中经常发生突变46。TP53中的c.158G>A突变是临床相关的无意义突变(Trp53Ter),导致无功能的截短蛋白46。我们设计了一个arRNA111和两个替代性arRNA (arRNA111-AG1和arRNA111-AG4)(上面列出的本研究中使用的arRNA和对照 RNA的序列),它们均靶向TP53W53X转录物(图23A),后两个被设计为最小化潜在脱靶。我们产生了HEK293T TP53–/–细胞系,以消除天然p53蛋白的作用。靶向TP53W53X的所有三种形式的arRNA都在突变的腺苷位点上转化了 TP53W53X转录物的~25-35%(图23B),可变减少arRNA111-AG1和arRNA111-AG4 的不想要的编辑(图24)。蛋白质印迹表明,基于HEK293TTP53–/–细胞中的 TP53W53X转录物,arRNA111,arRNA111-AG1和arRNA111-AG4均可挽救全长p53蛋白的产生,而对照RNA111则不能(图23C)。
为了验证修复的p53蛋白是否功能完全,我们用p53-荧光素酶顺式报道系统测试了p53的转录调节活性47,48。所有三个版本的arRNA均可恢复p53活性,而优化版本的arRNA111-AG1表现最佳(图23D)。总之,我们证明了LEAPER 能够修复与癌症相关的TP53的提前终止密码子(pre-mature stop codon)并恢复其功能。
实施例13.LEAPER对致病性突变的校正
接下来,我们调查了LEAPER是否可用于校正更多的致病突变。针对六个致病基因的临床相关突变:埃勒斯-当洛斯综合征的COL3A1,原发性肺动脉高压的BMPR2,朱伯特综合征的AHI1,范科尼贫血的FANCC,原发性家族性肥厚性心肌病的MYBPC3和X染色体连锁严重联合免疫缺陷病的IL2RG,我们为每个携带相应致病性G>A突变的基因设计了111-nt arRNA(图25和上面列出的这项研究中使用的arRNA和对照RNA的序列,以及这项研究中使用的以下与疾病相关的cDNA)。
这项研究中使用的与疾病相关的cDNA
通过在HEK293T细胞中共表达arRNA/cDNA对,我们在所有测试中鉴定了显著量的具有A>G校正的靶转录物(图24)。由于G>A突变占人类已知致病点突变的近一半10,49,因此LEAPER进行的A>G转化可为治疗提供巨大的机会。
实施例14.LEAPER在多个人类原代细胞中进行RNA编辑
为了进一步探索LEAPER的临床实用性,我们着手在多个人类原代细胞中测试该方法。首先,我们在人原代肺成纤维细胞和人原代支气管上皮细胞中用151-nt arRNA(上面列出的这项研究中使用的arRNA和对照RNA的序列) 测试了LEAPER,以编辑报道分子-1(图15A)。在两个人原代细胞中,LEAPER 均可获得35-45%的EGFP阳性细胞(图27A)。然后,我们测试了LEAPER在这两个原代细胞和人类原代T细胞中编辑内源性基因PPIB的结果,发现arRNA151-PPIB在人类原发性肺成纤维细胞,原发性支气管上皮细胞(图27B) 和原代T细胞(图27C)中的编辑率可分别达到>40%,>80%和>30%。LEAPER 在人原代细胞中的高编辑效率因其在治疗中的潜在应用而特别令人鼓舞。
实施例15.通过慢病毒表达和arRNA的化学合成的有效编辑
然后我们研究了是否可以通过临床上更相关的方法来递送LEAPER。我们首先通过基于慢病毒的表达测试了arRNA的作用。感染后2天(dpi),靶向报道分子-1的arRNA151在HEK293T细胞中的40%以上带有报道分子-1的总细胞中诱导了强EGFP表达。在8dpi时,EGFP比率保持在的可比水平(图 28A和上面列出的这项研究中使用的arRNA和对照RNA序列),表明LEAPER 可以适合需要连续施用的疗法。对于天然基因编辑,我们通过慢病毒转导在 HEK293T细胞中递送了靶向PPIB的arRNA151,并在6dpi时观察到超过6%的靶标编辑(图28B)。
我们接下来测试了用于LEAPER的合成的arRNA寡核苷酸和电穿孔递送方法。化学合成具有111-nt的靶向PPIB转录物的arRNA和对照RNA,并在 arRNA的前三个和后三个残基处进行2'-O-甲基和硫代磷酸酯键修饰(图28C)。通过电穿孔引入T细胞后,arRNA111-PPIB寡核苷酸在PPIB转录物上实现了~20%的编辑(图28D),这表明LEAPER有望开发出寡核苷酸药物。
实施例16.通过LEAPER恢复源自Hurler综合征患者的原代成纤维细胞中的α-L-艾杜糖醛酸酶活性
最后,我们检查了LEAPER在治疗单基因疾病-Hurler综合征方面的潜力,该疾病是由于α-L-艾杜糖醛酸酶(IDUA),一种负责粘多糖的降解的溶酶体代谢酶的缺乏而导致的I型粘多糖贮积病最严重的亚型(MPS I)50。我们选择了从Hurler综合征患者最初分离的原代成纤维细胞GM06214。GM06214细胞在 IDUA基因的外显子9中含有纯合的TGG>TAG突变,从而导致蛋白质中的 Trp402Ter突变。我们通过具有化学修饰的合成RNA寡核苷酸设计了两个版本的arRNA,分别是靶向IDUA的成熟mRNA和pre-mRNA的arRNA111-IDUA-V1和arRNA111-IDUA-V2(图29A以及在上面列出的这项研究中使用arRNA和对照RNA的序列)。通过电穿孔将arRNA111-IDUA-V1或 arRNA111-IDUA-V2引入GM06214细胞后,我们通过NGS分析测量了靶标RNA编辑率,并在不同的时间点用4-MU-α-L-艾杜糖醛酸酶底物测量了α-L- 艾杜糖醛酸酶的催化活性。在电穿孔后,arRNA111-IDUA-V1和 arRNA111-IDUA-V2均可随着时间的推移逐渐恢复IDUA缺失的GM06214细胞中IDUA的催化活性,而arRNA111-IDUA-V2的性能要比arRNA111-IDUA-V1 好得多,而在三个对照组中无α-L-艾杜糖醛酸酶活性可以检测到(图29B)。
为了进一步评价LEAPER在GM06214中恢复的IDUA活性减轻Hurler综合征的程度,我们检查了GM01323细胞中的IDUA活性,GM01323细胞是来自患有Scheie综合征的患者的另一种原代成纤维细胞,该综合征是一种比 Hurler轻得多的MPS I亚型,由于IDUA基因杂合基因型导致残留IDUA活性而引起的。我们发现电穿孔后48小时,在具有arRNA111-IDUA-V2的GM06214 细胞中IDUA的催化活性高于GM01323细胞(图29B)。与这些结果一致,NGS 分析表明arRNA111-IDUA-V2将近30%的A转换为I,比arRNA111-IDUA-V1的转化率高得多(图29C)。进一步的分析表明,在IDUA转录物的arRNA覆盖区域内检测到最少的不需要的编辑(图29D)。重要的是,LEAPER不会在原代细胞中触发免疫反应,如我们证明的,与RNA双链体聚(I:C)用作阳性对照不同,arRNA111-IDUA-V1和arRNA111-IDUA-V2均未诱导一组涉及I型干扰素和促炎反应的基因的表达(图29E)。这些结果表明LEAPER在靶向某些单基因疾病方面的治疗潜力。
实施例17.通过LEAPER恢复Hurler综合征小鼠中的α-L-艾杜糖醛酸酶活性
由于LEAPER提供了在小鼠上进行实验的可能性,因此我们检查了 LEAPER在体内治疗单基因疾病-Hurler综合征的潜力。选择腺相关病毒(AAV) 作为递送系统。将两个序列(Seq ID NO.341和Seq ID NO.342)插入质粒 AAV-U6-CMV-GFP载体中,并通过PackGeneBiotech将质粒包装到AAV8病毒中(见图31)。病毒滴度如下:
选择六只MPSI(idua W392X小鼠,B6.129S-Iduatm1.1Kmke/J)雄性小鼠(4-10 周龄),分成两组,第一组的三只小鼠各自通过尾静脉注射包装有质粒 AAV8-IDUA-adRNA151-KD2的AAV8病毒的1E12 GC,第二组的另外三只小鼠各自通过尾静脉注射包装有质粒AAV8-Random151-KD2的AAV8病毒的 1E12 GC以及一个对照。注射后28天,通过颈脱位法处死小鼠并取肝脏。我们测量了两组小鼠中具有4-MU-α-L-艾杜糖醛酸酶底物的小鼠肝细胞中α-L-艾杜糖醛酸酶的酶活性。将肝脏分为小块,将研磨后的一部分(立即)用于酶活性测量。第一组的平均相对酶活性高于第二组的平均相对酶活性(参见图 32A)。第一组的每只小鼠的相对酶活性高于第二组的相对酶活性(参见图 32B,GM01323作为对照,并且与野生型细胞相比,其具有0.3%的α-L-艾杜糖醛酸酶酶活性)。从酶活性的结果可以看出,第一组小鼠的α-L-艾杜糖苷酶活性得以恢复。为了确认TGG>TAG突变已恢复并且LEAPER提供有效的 RNA编辑,然后我们通过使用研磨的肝的其他部分对两组中的每只小鼠进行了下一代测序分析,来测量小鼠肝细胞中的靶向RNA编辑率。另一部分添加了Trizol用于NGS。第一组的平均RNA编辑效率高于第二组的平均RNA编辑效率(参见图33A)。第一组的每只小鼠的RNA编辑效率几乎高于第二组的 RNA编辑效率(参见图33B)。从RNA编辑效率的结果可以看出,LEAPER方法可提供高达7%的有效RNA编辑。
ADAR1(p110)cDNA
5’-ATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTA AAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTAT AGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATA CGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAAT ATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAA AGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCC GCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCAC CCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGT CAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCAT CAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCC ATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAG AGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGC CCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGC CCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGC AAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGG CTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTC AGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCA TGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAA AGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCG GCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGG GGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTG GCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCT CCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGC TTGGGAACAGGGAATCGCTGTGTAAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGC AGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGA AGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTAT ATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGA ATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGC ACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCAT GTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGC CCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGT GACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAG TCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGC TATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAA AAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGT GAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCT ATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTA GATTACAAGGATGACGACGATAAG(标记标签)TAG-3’(SEQ IDNO:332)
ADAR1(p150)cDNA
5’ATGAATCCGCGGCAGGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGC TCAGATACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGC AGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGG TTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGCAAGTGGACATCAGGGGTGTCCCCAGGGGCGTGCATCT CGGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGAGTCTGCCACAGAGAGGTGTTG ATTGCCTTTCCTCACATTTCCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAG AGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAA TCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAA CTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGC AGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAAC TCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATG GCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAAT ATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACA AGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAAC AGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACC CACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTA GAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAG CAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCA GCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTAC AAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAAC CTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATG GCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGAC AATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAA GAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGT CACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGC CCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGA AAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTC TGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGA AGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGC TTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTT GGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTC TCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGC CAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCA GCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCT TGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTG GGAACAGGGAATCGCTGTGTAAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAG AAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAG GATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATAT CAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAAT CCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCAC AATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGT CCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCC ATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGA CAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTC AGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTA TGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAA AGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGA GGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTAT GGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTA GATTACAAGGATGACGACGATAAG(标记标签)TAG-3’(SEQ ID NO:333)
ADAR2 cDNA
5’-ATGGATATAGAAGATGAAGAAAACATGAGTTCCAGCAGCACTGATGTGAAGGAAAACCGCAATCTGGACAA CGTGTCCCCCAAGGATGGCAGCACACCTGGGCCTGGCGAGGGCTCTCAGCTCTCCAATGGGGGTGGTGGTGGCC CCGGCAGAAAGCGGCCCCTGGAGGAGGGCAGCAATGGCCACTCCAAGTACCGCCTGAAGAAAAGGAGGAAAA CACCAGGGCCCGTCCTCCCCAAGAACGCCCTGATGCAGCTGAATGAGATCAAGCCTGGTTTGCAGTACACACTCCTGTCCCAGACTGGGCCCGTGCACGCGCCTTTGTTTGTCATGTCTGTGGAGGTGAATGGCCAGGTTTTTGAGGGCTCTGGTCCCACAAAGAAAAAGGCAAAACTCCATGCTGCTGAGAAGGCCTTGAGGTCTTTCGTTCAGTTTCCTAATGCCTCTGAGGCCCACCTGGCCATGGGGAGGACCCTGTCTGTCAACACGGACTTCACATCTGACCAGGCCGACTT CCCTGACACGCTCTTCAATGGTTTTGAAACTCCTGACAAGGCGGAGCCTCCCTTTTACGTGGGCTCCAATGGGGA TGACTCCTTCAGTTCCAGCGGGGACCTCAGCTTGTCTGCTTCCCCGGTGCCTGCCAGCCTAGCCCAGCCTCCTCTCCCTGCCTTACCACCATTCCCACCCCCGAGTGGGAAGAATCCCGTGATGATCTTGAACGAACTGCGCCCAGGACT CAAGTATGACTTCCTCTCCGAGAGCGGGGAGAGCCATGCCAAGAGCTTCGTCATGTCTGTGGTCGTGGATGGTC AGTTCTTTGAAGGCTCGGGGAGAAACAAGAAGCTTGCCAAGGCCCGGGCTGCGCAGTCTGCCCTGGCCGCCATT TTTAACTTGCACTTGGATCAGACGCCATCTCGCCAGCCTATTCCCAGTGAGGGTCTTCAGCTGCATTTACCGCAG GTTTTAGCTGACGCTGTCTCACGCCTGGTCCTGGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCAC GCTCGCAGAAAAGTGCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATAAGTG TTTCTACAGGAACAAAATGTATTAATGGTGAATACATGAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCA GAAATAATATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACAAAGATGAT CAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATGTCCAGTTTCATCTGTA CATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGCCAATCCTGGAAGAACCAGCAGATA GACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGTCTGGTGAGGGGACGATTCCAGTGCG CTCCAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACA AGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCCCTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGA GCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAG GACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCAGTGGCATCAGCAATGCAGAAGCACGGCAGCCAGG GAAGGCCCCCAACTTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGA AGGATGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAG GTTCCCTCCCACTTACTACGCTCCAAGATTACCAAACCCAACGTGTACCATGAGTCCAAGCTGGCGGCAAAGGA GTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGCCC GATTACAAGGATGACGACGATAAG(标记标签)TAG-3’(SEQ IDNO:334)
疾病相关基因的编码序列(CDS)
COL3A1
5’-atgatgagctttgtgcaaaaggggagctggctacttctcgctctgcttcatcccactattattttggcacaacaggaagctgttgaaggaggatgttcccatcttggtcagtcctatgcgg atagagatgtctggaagccagaaccatgccaaatatgtgtctgtgactcaggatccgttctctgcgatgacataatatgtgacgatcaagaattagactgccccaacccagaaattccatttg gagaatgttgtgcagtttgcccacagcctccaactgctcctactcgccctcctaatggtcaaggacctcaaggccccaagggagatccaggccctcctggtattcctgggagaaatggtg accctggtattccaggacaaccagggtcccctggttctcctggcccccctggaatctgtgaatcatgccctactggtcctcagaactattctccccagtatgattcatatgatgtcaagtctgg agtagcagtaggaggactcgcaggctatcctggaccagctggccccccaggccctcccggtccccctggtacatctggtcatcctggttcccctggatctccaggataccaaggacccc ctggtgaacctgggcaagctggtccttcaggccctccaggacctcctggtgctataggtccatctggtcctgctggaaaagatggagaatcaggtagacccggacgacctggagagcg aggattgcctggacctccaggtatcaaaggtccagctgggatacctggattccctggtatgaaaggacacagaggcttcgatggacgaaatggagaaaagggtgaaacaggtgctcct ggattaaagggtgaaaatggtcttccaggcgaaaatggagctcctggacccatgggtccaagaggggctcctggtgagcgaggacggccaggacttcctggggctgcaggtgctcgg ggtaatgacggtgctcgaggcagtgatggtcaaccaggccctcctggtcctcctggaactgccggattccctggatcccctggtgctaagggtgaagttggacctgcagggtctcctggt tcaaatggtgcccctggacaaagaggagaacctggacctcagggacacgctggtgctcaaggtcctcctggccctcctgggattaatggtagtcctggtggtaaaggcgaaatgggtcc cgctggcattcctggagctcctggactgatgggagcccggggtcctccaggaccagccggtgctaatggtgctcctggactgcgaggtggtgcaggtgagcctggtaagaatggtgcc aaaggagagcccggaccacgtggtgaacgcggtgaggctggtattccaggtgttccaggagctaaaggcgaagatggcaaggatggatcacctggagaacctggtgcaaatgggct tccaggagctgcaggagaaaggggtgcccctgggttccgaggacctgctggaccaaatggcatcccaggagaaaagggtcctgctggagagcgtggtgctccaggccctgcaggg cccagaggagctgctggagaacctggcagagatggcgtccctggaggtccaggaatgaggggcatgcccggaagtccaggaggaccaggaagtgatgggaaaccagggcctccc ggaagtcaaggagaaagtggtcgaccaggtcctcctgggccatctggtccccgaggtcagcctggtgtcatgggcttccccggtcctaaaggaaatgatggtgctcctggtaagaatgg agaacgaggtggccctggaggacctggccctcagggtcctcctggaaagaatggtgaaactggacctcagggacccccagggcctactgggcctggtggtgacaaaggagacaca ggaccccctggtccacaaggattacaaggcttgcctggtacaggtggtcctccaggagaaaatggaaaacctggggaaccaggtccaaagggtgatgccggtgcacctggagctcca ggaggcaagggtgatgctggtgcccctggtgaacgtggacctcctggattggcaggggccccaggacttagaggtggagctggtccccctggtcccgaaggaggaaagggtgctgc tggtcctcctgggccacctggtgctgctggtactcctggtctgcaaggaatgcctggagaaagaggaggtcttggaagtcctggtccaaagggtgacaagggtgaaccaggcggtcca ggtgctgatggtgtcccagggaaagatggcccaaggggtcctactggtcctattggtcctcctggcccagctggccagcctggagataagggtgaaggtggtgcccccggacttccag gtatagctggacctcgtggtagccctggtgagagaggtgaaactggccctccaggacctgctggtttccctggtgctcctggacagaatggtgaacctggtggtaaaggagaaagagg ggctccgggtgagaaaggtgaaggaggccctcctggagttgcaggaccccctggaggttctggacctgctggtcctcctggtccccaaggtgtcaaaggtgaacgtggcagtcctggt ggacctggtgctgctggcttccctggtgctcgtggtcttcctggtcctcctggtagtaatggtaacccaggacccccaggtcccagcggttctccaggcaaggatgggcccccaggtcct gcgggtaacactggtgctcctggcagccctggagtgtctggaccaaaaggtgatgctggccaaccaggagagaagggatcgcctggtgcccagggcccaccaggagctccaggcc cacttgggattgctgggatcactggagcacggggtcttgcaggaccaccaggcatgccaggtcctaggggaagccctggccctcagggtgtcaagggtgaaagtgggaaaccagga gctaacggtctcagtggagaacgtggtccccctggaccccagggtcttcctggtctggctggtacagctggtgaacctggaagagatggaaaccctggatcagatggtcttccaggccg agatggatctcctggtggcaagggtgatcgtggtgaaaatggctctcctggtgcccctggcgctcctggtcatccaggcccacctggtcctgtcggtccagctggaaagagtggtgaca gaggagaaagtggccctgctggccctgctggtgctcccggtcctgctggttcccgaggtgctcctggtcctcaaggcccacgtggtgacaaaggtgaaacaggtgaacgtggagctgc tggcatcaaaggacatcgaggattccctggtaatccaggtgccccaggttctccaggccctgctggtcagcagggtgcaatcggcagtccaggacctgcaggccccagaggacctgtt ggacccagtggacctcctggcaaagatggaaccagtggacatccaggtcccattggaccaccagggcctcgaggtaacagaggtgaaagaggatctgagggctccccaggccaccc agggcaaccaggccctcctggacctcctggtgcccctggtccttgctgtggtggtgttggagccgctgccattgctgggattggaggtgaaaaagctggcggttttgccccgtattatgga gatgaaccaatggatttcaaaatcaacaccgatgagattatgacttcactcaagtctgttaatggacaaatagaaagcctcattagtcctgatggttctcgtaaaaaccccgctagaaactgc agagacctgaaattctgccatcctgaactcaagagtggagaatactgggttgaccctaaccaaggatgcaaattggatgctatcaaggtattctgtaatatggaaactggggaaacatgca taagtgccaatcctttgaatgttccacggaaacactggtggacagattctagtgctgagaagaaacacgtttggtttggagagtccatggatggtggttttcagtttagctacggcaatcctga acttcctgaagatgtccttgatgtgcagctggcattccttcgacttctctccagccgagcttcccagaacatcacatatcactgcaaaaatagcattgcatacatggatcaggccagtggaaa tgtaaagaaggccctgaagctgatggggtcaaatgaaggtgaattcaaggctgaaggaaatagcaaattcacctacacagttctggaggatggttgcacgaaacacactggggaatgga gcaaaacagtctttgaatatcgaacacgcaaggctgtgagactacctattgtagatattgcaccctatgacattggtggtcctgatcaagaatttggtgtggacgttggccctgtttgctttttat aa-3’(SEQ ID NO:335)
BMPR2
5’-atgacttcctcgctgcagcggccctggcgggtgccctggctaccatggaccatcctgctggtcagcgctgcggctgcttcgcagaatcaagaacggctatgtgcgtttaaagatccg tatcagcaagaccttgggataggtgagagtagaatctctcatgaaaatgggacaatattatgctcgaaaggtagcacctgctatggcctttgggagaaatcaaaaggggacataaatcttgt aaaacaaggatgttggtctcacattggagatccccaagagtgtcactatgaagaatgtgtagtaactaccactcctccctcaattcagaatggaacataccgtttctgctgttgtagcacagat ttatgtaatgtcaactttactgagaattttccacctcctgacacaacaccactcagtccacctcattcatttaaccgagatgagacaataatcattgctttggcatcagtctctgtattagctgttttg atagttgccttatgctttggatacagaatgttgacaggagaccgtaaacaaggtcttcacagtatgaacatgatggaggcagcagcatccgaaccctctcttgatctagataatctgaaactg ttggagctgattggccgaggtcgatatggagcagtatataaaggctccttggatgagcgtccagttgctgtaaaagtgttttcctttgcaaaccgtcagaattttatcaacgaaaagaacattt acagagtgcctttgatggaacatgacaacattgcccgctttatagttggagatgagagagtcactgcagatggacgcatggaatatttgcttgtgatggagtactatcccaatggatctttatg caagtatttaagtctccacacaagtgactgggtaagctcttgccgtcttgctcattctgttactagaggactggcttatcttcacacagaattaccacgaggagatcattataaacctgcaattt cccatcgagatttaaacagcagaaatgtcctagtgaaaaatgatggaacctgtgttattagtgactttggactgtccatgaggctgactggaaatagactggtgcgcccaggggaggaag ataatgcagccataagcgaggttggcactatcagatatatggcaccagaagtgctagaaggagctgtgaacttgagggactgtgaatcagctttgaaacaagtagacatgtatgctcttgg actaatctattgggagatatttatgagatgtacagacctcttcccaggggaatccgtaccagagtaccagatggcttttcagacagaggttggaaaccatcccacttttgaggatatgcaggt tctcgtgtctagggaaaaacagagacccaagttcccagaagcctggaaagaaaatagcctggcagtgaggtcactcaaggagacaatcgaagactgttgggaccaggatgcagaggc tcggcttactgcacagtgtgctgaggaaaggatggctgaacttatgatgatttgggaaagaaacaaatctgtgagcccaacagtcaatccaatgtctactgctatgcagaatgaacgcaac ctgtcacataataggcgtgtgccaaaaattggtccttatccagattattcttcctcctcatacattgaagactctatccatcatactgacagcatcgtgaagaatatttcctctgagcattctatgtc cagcacacctttgactataggggaaaaaaaccgaaattcaattaactatgaacgacagcaagcacaagctcgaatccccagccctgaaacaagtgtcaccagcctctccaccaacacaa caaccacaaacaccacaggactcacgccaagtactggcatgactactatatctgagatgccatacccagatgaaacaaatctgcataccacaaatgttgcacagtcaattgggccaaccc ctgtctgcttacagctgacagaagaagacttggaaaccaacaagctagacccaaaagaagttgataagaacctcaaggaaagctctgatgagaatctcatggagcactctcttaaacagtt cagtggcccagacccactgagcagtactagttctagcttgctttacccactcataaaacttgcagtagaagcaactggacagcaggacttcacacagactgcaaatggccaagcatgtttg attcctgatgttctgcctactcagatctatcctctccccaagcagcagaaccttcccaagagacctactagtttgcctttgaacaccaaaaattcaacaaaagagccccggctaaaatttggc agcaagcacaaatcaaacttgaaacaagtcgaaactggagttgccaagatgaatacaatcaatgcagcagaacctcatgtggtgacagtcaccatgaatggtgtggcaggtagaaacca cagtgttaactcccatgctgccacaacccaatatgccaatgggacagtactatctggccaaacaaccaacatagtgacacatagggcccaagaaatgttgcagaatcagtttattggtgag gacacccggctgaatattaattccagtcctgatgagcatgagcctttactgagacgagagcaacaagctggccatgatgaaggtgttctggatcgtcttgtggacaggagggaacggcca ctagaaggtggccgaactaattccaataacaacaacagcaatccatgttcagaacaagatgttcttgcacagggtgttccaagcacagcagcagatcctgggccatcaaagcccagaag agcacagaggcctaattctctggatctttcagccacaaatgtcctggatggcagcagtatacagataggtgagtcaacacaagatggcaaatcaggatcaggtgaaaagatcaagaaac gtgtgaaaactccctattctcttaagcggtggcgcccctccacctgggtcatctccactgaatcgctggactgtgaagtcaacaataatggcagtaacagggcagttcattccaaatccagc actgctgtttaccttgcagaaggaggcactgctacaaccatggtgtctaaagatataggaatgaactgtctgtga-3’(SEQ ID NO:336)
AHI1
5’-atgcctacagctgagagtgaagcaaaagtaaaaaccaaagttcgctttgaagaattgcttaagacccacagtgatctaatgcgtgaaaagaaaaaactgaagaaaaaacttgtcaggt ctgaagaaaacatctcacctgacactattagaagcaatcttcactatatgaaagaaactacaagtgatgatcccgacactattagaagcaatcttccccatattaaagaaactacaagtgatg atgtaagtgctgctaacactaacaacctgaagaagagcacgagagtcactaaaaacaaattgaggaacacacagttagcaactgaaaatcctaatggtgatgctagtgtagaggaagac aaacaaggaaagccaaataaaaaggtgataaagacggtgccccagttgactacacaagacctgaaaccggaaactcctgagaataaggttgattctacacaccagaaaacacatacaa agccacagccaggcgttgatcatcagaaaagtgagaaggcaaatgagggaagagaagagactgatttagaagaggatgaagaattgatgcaagcatatcagtgccatgtaactgaaga aatggcaaaggagattaagaggaaaataagaaagaaactgaaagaacagttgacttactttccctcagatactttattccatgatgacaaactaagcagtgaaaaaaggaaaaagaaaaa ggaagttccagtcttctctaaagctgaaacaagtacattgaccatctctggtgacacagttgaaggtgaacaaaagaaagaatcttcagttagatcagtttcttcagattctcatcaagatgat gaaataagctcaatggaacaaagcacagaagacagcatgcaagatgatacaaaacctaaaccaaaaaaaacaaaaaagaagactaaagcagttgcagataataatgaagatgttgatg gtgatggtgttcatgaaataacaagccgagatagcccggtttatcccaaatgtttgcttgatgatgaccttgtcttgggagtttacattcaccgaactgatagacttaagtcagattttatgatttc tcacccaatggtaaaaattcatgtggttgatgagcatactggtcaatatgtcaagaaagatgatagtggacggcctgtttcatcttactatgaaaaagagaatgtggattatattcttcctattat gacccagccatatgattttaaacagttaaaatcaagacttccagagtgggaagaacaaattgtatttaatgaaaattttccctatttgcttcgaggctctgatgagagtcctaaagtcatcctgtt ctttgagattcttgatttcttaagcgtggatgaaattaagaataattctgaggttcaaaaccaagaatgtggctttcggaaaattgcctgggcatttcttaagcttctgggagccaatggaaatgc aaacatcaactcaaaacttcgcttgcagctatattacccacctactaagcctcgatccccattaagtgttgttgaggcatttgaatggtggtcaaaatgtccaagaaatcattacccatcaacac tgtacgtaactgtaagaggactgaaagttccagactgtataaagccatcttaccgctctatgatggctcttcaggaggaaaaaggtaaaccagtgcattgtgaacgtcaccatgagtcaagc tcagtagacacagaacctggattagaagagtcaaaggaagtaataaagtggaaacgactccctgggcaggcttgccgtatcccaaacaaacacctcttctcactaaatgcaggagaacg aggatgtttttgtcttgatttctcccacaatggaagaatattagcagcagcttgtgccagccgggatggatatccaattattttatatgaaattccttctggacgtttcatgagagaattgtgtggc cacctcaatatcatttatgatctttcctggtcaaaagatgatcactacatccttacttcatcatctgatggcactgccaggatatggaaaaatgaaataaacaatacaaatactttcagagttttac ctcatccttcttttgtttacacggctaaattccatccagctgtaagagagctagtagttacaggatgctatgattccatgatacggatatggaaagttgagatgagagaagattctgccatattg gtccgacagtttgacgttcacaaaagttttatcaactcactttgttttgatactgaaggtcatcatatgtattcaggagattgtacaggggtgattgttgtttggaatacctatgtcaagattaatga tttggaacattcagtgcaccactggactataaataaggaaattaaagaaactgagtttaagggaattccaataagttatttggagattcatcccaatggaaaacgtttgttaatccataccaaag acagtactttgagaattatggatctccggatattagtagcaaggaagtttgtaggagcagcaaattatcgggagaagattcatagtactttgactccatgtgggacttttctgtttgctggaagt gaggatggtatagtgtatgtttggaacccagaaacaggagaacaagtagccatgtattctgacttgccattcaagtcacccattcgagacatttcttatcatccatttgaaaatatggttgcatt ctgtgcatttgggcaaaatgagccaattcttctgtatatttacgatttccatgttgcccagcaggaggctgaaatgttcaaacgctacaatggaacatttccattacctggaatacaccaaagtc aagatgccctatgtacctgtccaaaactaccccatcaaggctcttttcagattgatgaatttgtccacactgaaagttcttcaacgaagatgcagctagtaaaacagaggcttgaaactgtcac agaggtgatacgttcctgtgctgcaaaagtcaacaaaaatctctcatttacttcaccaccagcagtttcctcacaacagtctaagttaaagcagtcaaacatgctgaccgctcaagagattcta catcagtttggtttcactcagaccgggattatcagcatagaaagaaagccttgtaaccatcaggtagatacagcaccaacggtagtggctctttatgactacacagcgaatcgatcagatga actaaccatccatcgcggagacattatccgagtgtttttcaaagataatgaagactggtggtatggcagcataggaaagggacaggaaggttattttccagctaatcatgtggctagtgaaa cactgtatcaagaactgcctcctgagataaaggagcgatcccctcctttaagccctgaggaaaaaactaaaatagaaaaatctccagctcctcaaaagcaatcaatcaataagaacaagtc ccaggacttcagactaggctcagaatctatgacacattctgaaatgagaaaagaacagagccatgaggaccaaggacacataatggatacacggatgaggaagaacaagcaagcagg cagaaaagtcactctaatagagta-3’(SEQ ID NO:337)
FANCC
5’-atggctcaagattcagtagatctttcttgtgattatcagttttggatgcagaagctttctgtatgggatcaggcttccactttggaaacccagcaagacacctgtcttcacgtggctcagttc caggagttcctaaggaagatgtatgaagccttgaaagagatggattctaatacagtcattgaaagattccccacaattggtcaactgttggcaaaagcttgttggaatccttttattttagcatat gatgaaagccaaaaaattctaatatggtgcttatgttgtctaattaacaaagaaccacagaattctggacaatcaaaacttaactcctggatacagggtgtattatctcatatactttcagcactc agatttgataaagaagttgctcttttcactcaaggtcttgggtatgcacctatagattactatcctggtttgcttaaaaatatggttttatcattagcgtctgaactcagagagaatcatcttaatgg atttaacactcaaaggcgaatggctcccgagcgagtggcgtccctgtcacgagtttgtgtcccacttattaccctgacagatgttgaccccctggtggaggctctcctcatctgtcatggacg tgaacctcaggaaatcctccagccagagttctttgaggctgtaaacgaggccattttgctgaagaagatttctctccccatgtcagctgtagtctgcctctggcttcggcaccttcccagcctt gaaaaagcaatgctgcatctttttgaaaagctaatctccagtgagagaaattgtctgagaaggatcgaatgctttataaaagattcatcgctgcctcaagcagcctgccaccctgccatattc cgggttgttgatgagatgttcaggtgtgcactcctggaaaccgatggggccctggaaatcatagccactattcaggtgtttacgcagtgctttgtagaagctctggagaaagcaagcaagc agctgcggtttgcactcaagacctactttccttacacttctccatctcttgccatggtgctgctgcaagaccctcaagatatccctcggggacactggctccagacactgaagcatatttctga actgctcagagaagcagttgaagaccagactcatgggtcctgcggaggtccctttgagagctggttcctgttcattcacttcggaggatgggctgagatggtggcagagcaattactgatg tcggcagccgaaccccccacggccctgctgtggctcttggccttctactacggcccccgtgatgggaggcagcagagagcacagactatggtccaggtgaaggccgtgctgggccac ctcctggcaatgtccagaagcagcagcctctcagcccaggacctgcagacggtagcaggacagggcacagacacagacctcagagctcctgcacaacagctgatcaggcaccttctc ctcaacttcctgctctgggctcctggaggccacacgatcgcctgggatgtcatcaccctgatggctcacactgctgagataactcacgagatcattggctttcttgaccagaccttgtacag atggaatcgtcttggcattgaaagccctagatcagaaaaactggcccgagagctccttaaagagctgcgaactcaagtctag-3’(SEQ ID NO:338)
MYBPC3
5’-atgcctgagccggggaagaagccagtctcagcttttagcaagaagccacggtcagtggaagtggccgcaggcagccctgccgtgttcgaggccgagacagagcgggcaggag tgaaggtgcgctggcagcgcggaggcagtgacatcagcgccagcaacaagtacggcctggccacagagggcacacggcatacgctgacagtgcgggaagtgggccctgccgacc agggatcttacgcagtcattgctggctcctccaaggtcaagttcgacctcaaggtcatagaggcagagaaggcagagcccatgctggcccctgcccctgcccctgctgaggccactgg agcccctggagaagccccggccccagccgctgagctgggagaaagtgccccaagtcccaaagggtcaagctcagcagctctcaatggtcctacccctggagcccccgatgacccca ttggcctcttcgtgatgcggccacaggatggcgaggtgaccgtgggtggcagcatcaccttctcagcccgcgtggccggcgccagcctcctgaagccgcctgtggtcaagtggttcaa gggcaaatgggtggacctgagcagcaaggtgggccagcacctgcagctgcacgacagctacgaccgcgccagcaaggtctatctgttcgagctgcacatcaccgatgcccagcctg ccttcactggcagctaccgctgtgaggtgtccaccaaggacaaatttgactgctccaacttcaatctcactgtccacgaggccatgggcaccggagacctggacctcctatcagccttccg ccgcacgagcctggctggaggtggtcggcggatcagtgatagccatgaggacactgggattctggacttcagctcactgctgaaaaagagagacagtttccggaccccgagggactc gaagctggaggcaccagcagaggaggacgtgtgggagatcctacggcaggcacccccatctgagtacgagcgcatcgccttccagtacggcgtcactgacctgcgcggcatgctaa agaggctcaagggcatgaggcgcgatgagaagaagagcacagcctttcagaagaagctggagccggcctaccaggtgagcaaaggccacaagatccggctgaccgtggaactgg ctgaccatgacgctgaggtcaaatggctcaagaatggccaggagatccagatgagcggcagcaagtacatctttgagtccatcggtgccaagcgtaccctgaccatcagccagtgctca ttggcggacgacgcagcctaccagtgcgtggtgggtggcgagaagtgtagcacggagctctttgtgaaagagccccctgtgctcatcacgcgccccttggaggaccagctggtgatgg tggggcagcgggtggagtttgagtgtgaagtatcggaggagggggcgcaagtcaaatggctgaaggacggggtggagctgacccgggaggagaccttcaaataccggttcaagaa ggacgggcagagacaccacctgatcatcaacgaggccatgctggaggacgcggggcactatgcactgtgcactagcgggggccaggcgctggctgagctcattgtgcaggaaaag aagctggaggtgtaccagagcatcgcagacctgatggtgggcgcaaaggaccaggcggtgttcaaatgtgaggtctcagatgagaatgttcggggtgtgtggctgaagaatgggaag gagctggtgcccgacagccgcataaaggtgtcccacatcgggcgggtccacaaactgaccattgacgacgtcacacctgccgacgaggctgactacagctttgtgcccgagggcttcg cctgcaacctgtcagccaagctccacttcatggaggtcaagattgacttcgtacccaggcaggaacctcccaagatccacctggactgcccaggccgcataccagacaccattgtggttg tagctggaaataagctacgtctggacgtccctatctctggggaccctgctcccactgtgatctggcagaaggctatcacgcaggggaataaggccccagccaggccagccccagatgc cccagaggacacaggtgacagcgatgagtgggtgtttgacaagaagctgctgtgtgagaccgagggccgggtccgcgtggagaccaccaaggaccgcagcatcttcacggtcgag ggggcagagaaggaagatgagggcgtctacacggtcacagtgaagaaccctgtgggcgaggaccaggtcaacctcacagtcaaggtcatcgacgtgccagacgcacctgcggccc ccaagatcagcaacgtgggagaggactcctgcacagtacagtgggagccgcctgcctacgatggcgggcagcccatcctgggctacatcctggagcgcaagaagaagaagagcta ccggtggatgcggctgaacttcgacctgattcaggagctgagtcatgaagcgcggcgcatgatcgagggcgtggtgtacgagatgcgcgtctacgcggtcaacgccatcggcatgtcc aggcccagccctgcctcccagcccttcatgcctatcggtccccccagcgaacccacccacctggcagtagaggacgtctctgacaccacggtctccctcaagtggcggcccccagag cgcgtgggagcaggaggcctggatggctacagcgtggagtactgcccagagggctgctcagagtgggtggctgccctgcaggggctgacagagcacacatcgatactggtgaagg acctgcccacgggggcccggctgcttttccgagtgcgggcacacaatatggcagggcctggagcccctgttaccaccacggagccggtgacagtgcaggagatcctgcaacggcca cggcttcagctgcccaggcacctgcgccagaccattcagaagaaggtcggggagcctgtgaaccttctcatccctttccagggcaagccccggcctcaggtgacctggaccaaagag gggcagcccctggcaggcgaggaggtgagcatccgcaacagccccacagacaccatcctgttcatccgggccgctcgccgcgtgcattcaggcacttaccaggtgacggtgcgcatt gagaacatggaggacaaggccacgctggtgctgcaggttgttgacaagccaagtcctccccaggatctccgggtgactgacgcctggggtcttaatgtggctctggagtggaagccac cccaggatgtcggcaacacggagctctgggggtacacagtgcagaaagccgacaagaagaccatggagtggttcaccgtcttggagcattaccgccgcacccactgcgtggtgccagagctcatcattggcaatggctactacttccgcgtcttcagccagaatatggttggctttagtgacagagcggccaccaccaaggagcccgtctttatccccagaccaggcatcacctatg agccacccaactataaggccctggacttctccgaggccccaagcttcacccagcccctggtgaaccgctcggtcatcgcgggctacactgctatgctctgctgtgctgtccggggtagcc ccaagcccaagatttcctggttcaagaatggcctggacctgggagaagacgcccgcttccgcatgttcagcaagcagggagtgttgactctggagattagaaagccctgcccctttgacg ggggcatctatgtctgcagggccaccaacttacagggcgaggcacggtgtgagtgccgcctggaggtgcgagtgcctcagtga-3’(SEQ IDNO:339)
IL2RG
5’-atgttgaagccatcattaccattcacatccctcttattcctgcagctgcccctgctgggagtggggctgaacacgacaattctgacgcccaatgggaatgaagacaccacagctgattt cttcctgaccactatgcccactgactccctcagtgtttccactctgcccctcccagaggttcagtgttttgtgttcaatgtcgagtacatgaattgcacttggaacagcagctctgagccccag cctaccaacctcactctgcattattggtacaagaactcggataatgataaagtccagaagtgcagccactatctattctctgaagaaatcacttctggctgtcagttgcaaaaaaaggagatccacctctaccaaacatttgttgttcagctccaggacccacgggaacccaggagacaggccacacagatgctaaaactgcagaatctggtgatcccctgggctccagagaacctaacactt cacaaactgagtgaatcccagctagaactgaactggaacaacagattcttgaaccactgtttggagcacttggtgcagtaccggactgactgggaccacagctggactgaacaatcagtg gattatagacataagttctccttgcctagtgtggatgggcagaaacgctacacgtttcgtgttcggagccgctttaacccactctgtggaagtgctcagcattggagtgaatggagccaccc aatccactgggggagcaatacttcaaaagagaatcctttcctgtttgcattggaagccgtggttatctctgttggctccatgggattgattatcagccttctctgtgtgtatttctggctggaacg gacgatgccccgaattcccaccctgaagaacctagaggatcttgttactgaataccacgggaacttttcggcctggagtggtgtgtctaagggactggctgagagtctgcagccagacta cagtgaacgactctgcctcgtcagtgagattcccccaaaaggaggggcccttggggaggggcctggggcctccccatgcaaccagcatagcccctactgggcccccccatgttacac cctaaagcctgaaacctga-3’(SEQ IDNO:340)
讨论
基因组编辑技术正在彻底改变生物医学研究。高活性核酸酶,诸如锌指核酸酶(ZFN)1,转录激活因子样效应子核酸酶(TALEN)2-4和CRISPR的Cas蛋白(聚簇规则间隔短回文重复序列)系统5-7已成功工程化成可操纵无数生物中的基因组。最近,已经利用脱氨基酶精确地改变了基因密码而不破坏双链 DNA。通过将胞苷或腺苷脱氨酶与CRISPR-Cas9系统联合,研究人员创建了可编程的碱基编辑器,使基因组DNA中的C·G转化为T·A或A·T转化为 G·C8-10,为纠正致病突变提供新的机会。
除了DNA之外,RNA是用于基因校正的引人注目的靶标,因为RNA修饰可以改变蛋白质功能而不会对基因组产生任何永久性变化。目前已利用 ADAR腺苷脱氨酶对RNA实现精确的碱基编辑。在哺乳动物中已鉴定出三种 ADAR蛋白,即ADAR1(亚型p110和p150),ADAR2和ADAR3(催化失活)11,12,其底物是双链RNA,其中与胞嘧啶(C)错配的腺苷(A)优先被脱氨基为肌苷 (I)。肌苷被认为在翻译过程中可模拟鸟苷(G)13,14。为了实现靶向RNA编辑,将ADAR蛋白或其催化结构域与λN肽15-17,SNAP-tag18-22或Cas蛋白 (dCas13b)23融合,并设计了一个指导RNA来募集嵌合的ADAR蛋白至特定位点。或者,也有报道称过表达的ADAR1或ADAR2蛋白与带有R/G基序的指导RNA一起可以实现靶向RNA的编辑24-27。
在哺乳动物系统中所有这些已报道的核酸编辑方法都依赖于两种成分的异位表达:一种酶和一种指导RNA。尽管这些二进制系统在大多数研究中都能有效地工作,但是某些固有的障碍限制了它们的广泛应用,尤其是在治疗中。因为基因治疗最有效的体内递送是通过病毒载体28,并且高度理想的腺相关病毒(AAV)载体受到负荷大小()的限制,因此使同时容纳蛋白质和指导RNA成为挑战29,30。最近有报道称,由于RNA的过度过度编辑31, ADAR1的过度表达赋予多发性骨髓瘤致癌性,并产生大量的全局脱靶编辑32。此外,异位表达蛋白质或其非人类来源的结构域具有引发免疫原性的潜在风险30,33。此外,预先存在的适应性免疫和p53介导的DNA损伤反应可能会损害治疗性蛋白质(诸如Cas934-38)的功效。尽管已经尝试利用内源性机制进行 RNA编辑,但是仅通过将预组装的靶标转录物:RNA双链体注射入非洲爪蟾 (Xenopus)胚胎中进行尝试。非常需要不依赖蛋白质异位表达的强健的核酸编辑替代技术。在这里,我们开发了一种利用内源性ADAR进行RNA编辑的新方法。我们表明,表达经过精心设计的指导RNA可以对内源RNA进行高效且精确的编辑,并纠正致病突变。该一元核酸编辑平台可以为治疗和研究开辟新的途径。
特别地,我们表明具有足够长度的线性arRNA的表达能够引导内源 ADAR蛋白在靶标转录物上将腺苷编辑成肌苷。该系统称为LEAPER,它利用内源性ADAR蛋白来实现可编程的核酸编辑,因此比现有方法具有优势。
LEAPER的罕见品质是其简单性,因为它仅依赖于小分子RNA来引导内源蛋白质进行RNA编辑。这使人想起RNAi,其中小的dsRNA可以调用靶向 RNA降解的天然机制51。由于体积小,arRNA可以很容易地通过多种病毒和非病毒载体递送。与RNAi不同,LEAPER催化精确的A至I转换,而不会产生目标转录物的切割或降解(图18A)。尽管arRNA的长度要求比RNAi长,但它既不诱导细胞水平的免疫刺激作用(图22E,f和图29E),也不影响内源性 ADAR蛋白的功能(图22A,B),使其为RNA靶向的安全策略。引人注目的是,据报道,ADAR蛋白或其催化结构域的异位表达会引起大量全局脱靶编辑32,并可能引发癌症31。
最近,几个研究小组报道,由于效应蛋白的表达,胞嘧啶碱基编辑器可在小鼠胚胎,水稻或人类细胞系中产生大量脱靶的单核苷酸变体,这说明了 LEAPER在潜在治疗应用中的优势52-54。令人欣慰的是,LEAPER能够进行有效的编辑,同时又引起罕见的全局脱靶编辑(图20和图21)。此外,LEAPER 可以最大程度地减少潜在的免疫原性或克服其他需要引入外源蛋白质的方法通常存在的递送障碍。
对于LEAPER,我们建议使用最小大小高于70-nt的arRNA以实现所需的活性。在天然环境中,ADAR蛋白非特异性编辑具有300-nt以上双链体的Alu 重复序列55。值得注意的是,Alu重复序列形成稳定的分子内双链体,而 LEAPER导致arRNA与mRNA或pre-mRNA之间的分子间双链体,这应该是不稳定的,更难以形成。因此,我们假设长于70nt的RNA双链体在化学计量上对于募集或船坞ADAR蛋白进行有效编辑很重要。实际上,更长的arRNA导致异位表达的报道分子和内源转录物的更高编辑产量(图16D和图17B)。但是,由于ADAR蛋白混杂地使RNA双链体中的腺苷碱基脱氨基,因此更长的 arRNA可能在靶向窗口内引起更多的脱靶。
虽然LEAPER可以有效地靶向天然转录物,但是它们的编辑效率和脱靶率却有所不同。对于PPIB转录物靶向,我们可以将50%的靶向腺苷转化为肌苷,而在覆盖窗口内没有明显的脱靶(图17B,F)。对于其他转录物,脱靶变得更加严重。我们设法减少了脱靶,诸如引入A-G错配或连续错配以抑制不希望的编辑。但是,太多的错配会降低上靶效率。考虑到效率和潜在的脱靶,我们建议使用长度在100到150-nt之间的arRNA对内源转录物进行编辑。如果有选择,最好选择腺苷较少的区域,以最大程度地减少不想要的编辑的机会。令人鼓舞的是,我们没有在arRNA靶向的转录双链体之外检测到任何脱靶(图20)。
我们已经优化了arRNA的设计以实现提高的编辑效率,并证明了可以利用LEAPER来操纵基因功能或纠正致病突变。我们还表明,LEAPER不仅限于在UAG上运行,它还可以与任何腺苷一起使用,而不管其侧翼核苷酸如何 (图16F,G和图17C)。这样的灵活性对于由某些单点突变引起的遗传疾病的潜在治疗校正是有利的。有趣的是,在编辑IDUA转录物时,靶向pre-mRNA 的arRNA比靶向成熟RNA更有效,这表明核是ADAR蛋白的主要作用位点,并且LEAPER可通过修饰pre-mRNA中的剪接位点来操纵剪接。更重要的是, LEAPER证明了同时靶向多个基因转录物的高效性(图17D)。LEAPER的这种多路复用能力可能会在将来用于治疗某些多基因疾病。
在RNA水平上进行遗传校正是有益的。首先,在目标转录物上进行编辑不会永久改变基因组或全套转录组(transcriptome repertoire),从而使RNA 编辑方法比基因组编辑方法更安全地用于治疗。此外,暂时编辑非常适合于临时控制治疗特定状态偶尔改变导致的疾病。其次,LEAPER和其他RNA编辑方法不会在基因组上引入DSB,从而避免了产生不希望的大DNA片段缺失的风险37。采用切口酶Cas9的DNA碱基编辑方法仍可在基因组中产生插入缺失8。此外,独立于天然DNA修复机制,LEAPER也应在有丝分裂后的细胞中起作用,诸如ADAR2高表达的小脑细胞11。
我们已经证明,LEAPER可以应用于广泛的细胞类型,诸如人类细胞系 (图14C),小鼠细胞系(图14D)和包括原代T细胞的人类原代细胞(图27和图 28D)。通过慢病毒递送或合成的寡核苷酸进行的有效编辑为治疗发展提供了更大的潜力(图28)。此外,LEAPER可以在多种应用中产生表型或生理变化,包括恢复p53的转录调控活性(图7),纠正致病突变(图26)以及恢复源自Hurler 综合征患者原代成纤维细胞的α-L-艾杜糖醛酸酶活性(图29)。因此可以设想,LEAPER在疾病治疗方面具有巨大潜力。
Stafforst及其同事报道了一种新的,看似相似的RNA编辑方法,称为 RESTORE,其通过使用合成的反义寡核苷酸募集内源性ADAR而起作用56。 RESTORE和LEAPER之间的根本区别在于用于募集内源性ADAR的指导 RNA的独特性质。RESTORE的指导RNA限于化学合成反义寡核苷酸(ASO),具体取决于复杂的化学修饰,而LEAPER的arRNA可以多种方式生成,可以通过病毒或非病毒载体进行化学合成和表达(图28和图29)。重要的是,ASO 经过大量化学修饰,因此只能在疾病治疗中短暂起作用。相比之下,arRNA 可以通过表达产生,一种对于不断编辑而言尤其重要的特征。
关于LEAPER的效率和特异性,仍有改进的余地。由于LEAPER依赖于内源性ADAR,因此靶细胞中ADAR蛋白的表达水平是成功编辑的决定因素之一。根据先前的报道57和我们的观察(图14A,B),ADAR1p110在组织中普遍表达,确保了LEAPER的广泛适用性。ADAR1p150是干扰素诱导的同种型58,并已证明在LEAPER中具有功能(图11E,图12B)。因此,在某些情况下,干扰素刺激性RNA与arRNA的共转染可能会进一步提高编辑效率。或者,由于 ADAR3发挥抑制作用,因此抑制ADAR3可能会增强表达ADAR3的细胞的编辑效率。此外,arRNA的其他修饰可能会提高其编辑效率。例如,与某些ADAR 募集支架融合的arRNA可能会增加局部ADAR蛋白浓度,从而提高编辑产量。到目前为止,我们只能利用内源性ADAR1/2蛋白进行A至I碱基的转化。探索是否可以类似地利用更多的天然机制来修饰遗传元件,特别是实现有效的核酸编辑,是令人兴奋的。
总体上,我们提供了原理证明,可以共同选择细胞中的内源性机制来编辑RNA转录物。我们证明了LEAPER是一个简单,高效和安全的系统,为基于基因编辑的疗法和研究开辟了一条新途径。
参考文献
1Porteus,M.H.&Carroll,D.Gene targeting using zinc finger nucleases.Nat Biotechnol 23,967-973(2005).
2Boch,J.et al.Breaking the code of DNA binding specificity of TAL-type III effectors.Science 326,1509-1512(2009).
3Moscou,M.J.&Bogdanove,A.J.A simple cipher governs DNA recognition byTAL effectors.Science 326,1501(2009).
4Miller,J.C.et al.A TALE nuclease architecture for efficient genomeediting.Nat Biotechnol 29,143-148(2011).
5Jinek,M.et al.A programmable dual-RNA-guided DNA endonuclease inadaptive bacterial immunity.Science 337,816-821(2012).
6Cong,L.et al.Multiplex genome engineering using CRISPR/Cas systems.Science 339,819-823(2013).
7Mali,P.et al.RNA-guided human genome engineering via Cas9.Science339,823-826(2013).
8Komor,A.C.,Kim,Y.B.,Packer,M.S.,Zuris,J.A.&Liu,D.R. Programmableediting of a target base in genomic DNA without double-stranded DNAcleavage.Nature 533,420-424(2016).
9Ma,Y.et al.Targeted AID-mediated mutagenesis(TAM)enables efficientgenomic diversification in mammalian cells.Nat Methods 13,1029-1035 (2016).
10 Gaudelli,N.M.et al.Programmable base editing of A*T to G*C ingenomic DNA without DNA cleavage.Nature 551,464-471(2017).
11 Tan,M.H.et al.Dynamic landscape and regulation of RNA editing inmammals.Nature 550,249-254(2017).
12 Nishikura,K.Functions and regulation of RNA editing by ADARdeaminases.Annu Rev Biochem 79,321-349(2010).
13 Bass,B.L.&Weintraub,H.An unwinding activity that covalentlymodifies its double-stranded RNA substrate.Cell 55,1089-1098(1988).
14 Wong,S.K.,Sato,S.&Lazinski,D.W.Substrate recognition by ADAR1 andADAR2.RNA 7,846-858(2001).
15 Montiel-Gonzalez,M.F.,Vallecillo-Viejo,I.,Yudowski,G.A.&Rosenthal,J.J.Correction of mutations within the cystic fibrosistransmembrane conductance regulator by site-directed RNA editing.Proc NatlAcad Sci U S A 110,18285-18290(2013).
16 Sinnamon,J.R.et al.Site-directed RNA repair of endogenous Mecp2RNA in neurons.Proc Natl Acad Sci U S A 114,E9395-E9402(2017).
17 Montiel-Gonzalez,M.F.,Vallecillo-Viejo,I.C.&Rosenthal,J.J.Anefficient system for selectively altering genetic information within mRNAs.Nucleic Acids Res 44,e157(2016).
18 Hanswillemenke,A.,Kuzdere,T.,Vogel,P.,Jekely,G.&Stafforst,T. Site-Directed RNA Editing in Vivo Can Be Triggered by the Light-Driven Assembly ofan Artificial Riboprotein.J Am Chem Soc 137,15875-15881 (2015).
19 Schneider,M.F.,Wettengel,J.,Hoffmann,P.C.&Stafforst,T.OptimalguideRNAs for re-directing deaminase activity of hADAR1 and hADAR2 intrans.Nucleic Acids Res 42,e87(2014).
20 Vogel,P.,Hanswillemenke,A.&Stafforst,T.Switching ProteinLocalization by Site-Directed RNA Editing under Control of Light.ACSsynthetic biology 6,1642-1649(2017).
21 Vogel,P.,Schneider,M.F.,Wettengel,J.&Stafforst,T.Improving site-directed RNA editing in vitro and in cell culture by chemical modification ofthe guideRNA.Angewandte Chemie 53,6267-6271 (2014).
22 Vogel,P.et al.Efficient and precise editing of endogenoustranscripts with SNAP-tagged ADARs.Nat Methods 15,535-538(2018).
23 Cox,D.B.T.et al.RNA editing with CRISPR-Cas13.Science 358, 1019-1027(2017).
24 Fukuda,M.et al.Construction of a guide-RNA for site-directed RNAmutagenesis utilising intracellular A-to-I RNA editing.Scientific reports 7,41478(2017).
25 Wettengel,J.,Reautschnig,P.,Geisler,S.,Kahle,P.J.&Stafforst,T.Harnessing human ADAR2 for RNA repair-Recoding a PINK1 mutation rescuesmitophagy.Nucleic Acids Res 45,2797-2808(2017).
26 Heep,M.,Mach,P.,Reautschnig,P.,Wettengel,J.&Stafforst,T. ApplyingHuman ADAR1p110 and ADAR1p150 for Site-Directed RNA Editing-G/C SubstitutionStabilizes GuideRNAs against Editing.Genes (Basel)8(2017).
27 Katrekar,D.et al.In vivo RNA editing of point mutations via RNA-guided adenosine deaminases.Nat Methods 16,239-242(2019).
28 Yin,H.,Kauffman,K.J.&Anderson,D.G.Delivery technologies for genomeediting.Nat Rev Drug Discov 16,387-399(2017).
29 Platt,R.J.et al.CRISPR-Cas9 knockin mice for genome editing andcancer modeling.Cell 159,440-455(2014).
30 Chew,W.L.et al.A multifunctional AAV-CRISPR-Cas9 and its hostresponse.Nat Methods 13,868-874(2016).
31 Teoh,P.J.et al.Aberrant hyperediting of the myeloma transcriptomeby ADAR1 confers oncogenicity and is a marker of poor prognosis.Blood 132,1304-1317(2018).
32 Vallecillo-Viejo,I.C.,Liscovitch-Brauer,N.,Montiel-Gonzalez,M.F.,Eisenberg,E.&Rosenthal,J.J.C.Abundant off-target edits from site-directed RNAediting can be reduced by nuclear localization of the editing enzyme.RNAbiology 15,104-114(2018).
33 Mays,L.E.&Wilson,J.M.The complex and evolving story of T cellactivation to AAV vector-encoded transgene products.Mol Ther 19,16-27 (2011).
34 Wagner,D.L.et al.High prevalence of Streptococcus pyogenes Cas9-reactive T cells within the adult human population.Nat Med 25, 242-248(2019).
35 Simhadri,V.L.et al.Prevalence of Pre-existing Antibodies toCRISPR-Associated Nuclease Cas9 in the USA Population.Mol Ther Methods ClinDev 10,105-112(2018).
36 Charlesworth,C.T.et al.Identification of preexisting adaptiveimmunity to Cas9 proteins in humans.Nat Med 25,249-254(2019).
37 Haapaniemi,E.,Botla,S.,Persson,J.,Schmierer,B.&Taipale,J. CRISPR-Cas9 genome editing induces a p53-mediated DNA damage response.Nat Med 24,927-930(2018).
38 Ihry,R.J.et al.p53 inhibits CRISPR-Cas9 engineering in humanpluripotent stem cells.Nat Med 24,939-946(2018).
39 Woolf,T.M.,Chase,J.M.&Stinchcomb,D.T.Toward the therapeuticediting of mutated RNA sequences.Proc Natl Acad Sci U S A 92, 8298-8302(1995).
40 Zheng,Y.,Lorenzo,C.&Beal,P.A.DNA editing in DNA/RNA hybrids byadenosine deaminases that act on RNA.Nucleic Acids Res 45, 3369-3377(2017).
41 Abudayyeh,O.O.et al.C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector.Science 353,aaf5573 (2016).
42 Daniel,C.,Widmark,A.,Rigardt,D.&Ohman,M.Editing inducer elementsincreases A-to-I editing efficiency in the mammalian transcriptome.GenomeBiol 18,195(2017).
43 Chen,C.X.et al.A third member of the RNA-specific adenosinedeaminase gene family,ADAR3,contains both single-and double-stranded RNAbinding domains.RNA 6,755-767(2000).
44 Savva,Y.A.,Rieder,L.E.&Reenan,R.A.The ADAR protein family. GenomeBiol 13,252(2012).
45 Nishikura,K.A-to-I editing of coding and non-coding RNAs by ADARs.Nat Rev Mol Cell Biol 17,83-96(2016).
46 Floquet,C.,Deforges,J.,Rousset,J.P.&Bidou,L.Rescue of non-sensemutated p53 tumor suppressor gene by aminoglycosides.Nucleic Acids Res 39,3350-3362(2011).
47 Kern,S.E.et al.Identification of p53 as a sequence-specific DNA-binding protein.Science 252,1708-1711(1991).
48 Doubrovin,M.et al.Imaging transcriptional regulation of p53-dependent genes with positron emission tomography in vivo.Proc Natl Acad SciUS A 98,9300-9305(2001).
49 Landrum,M.J.et al.ClinVar:public archive of interpretations ofclinically relevant variants.Nucleic Acids Res 44,D862-868(2016).
50 Ou,L.et al.ZFN-Mediated In Vivo Genome Editing Corrects MurineHurler Syndrome.Mol Ther 27,178-187(2019).
51 Fire,A.et al.Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans.Nature 391,806-811(1998).
52 Zuo,E.et al.Cytosine base editor generates substantial off-targetsingle-nucleotide variants in mouse embryos.Science(2019).
53 Jin,S.et al.Cytosine,but not adenine,base editors induce genome-wide off-target mutations in rice.Science(2019).
54 Kim,D.,Kim,D.E.,Lee,G.,Cho,S.I.&Kim,J.S.Genome-wide targetspecificity of CRISPR RNA-guided adenine base editors.Nat Biotechnol 37,430-435(2019).
55 Levanon,E.Y.et al.Systematic identification of abundant A-to-Iediting sites in the human transcriptome.Nat Biotechnol 22,1001-1005(2004).
56 Merkle,T.et al.Precise RNA editing by recruiting endogenous ADARswith antisense oligonucleotides.Nat Biotechnol 37,133-138(2019).
57 Wagner,R.W.et al.Double-stranded RNA unwinding and modifyingactivity is detected ubiquitously in primary tissues and cell lines.Mol CellBiol 10,5586-5590(1990).
58 Patterson,J.B.&Samuel,C.E.Expression and regulation by interferonof a double-stranded-RNA-specific adenosine deaminase from human cells:evidence for two forms of the deaminase.Mol Cell Biol 15,5376-5388 (1995).
59 Gibson,D.G.et al.Enzymatic assembly of DNA molecules up to severalhundred kilobases.Nat Methods 6,343-345(2009).
60 Zhou,Y.,Zhang,H.&Wei,W.Simultaneous generation of multi-geneknockouts in human cells.FEBS Lett 590,4343-4353(2016).
61 Dobin,A.et al.STAR:ultrafast universal RNA-seq aligner.Bioinformatics 29,15-21(2013).
62 Van der Auwera,G.A.et al.From FastQ data to high confidencevariant calls:the Genome Analysis Toolkit best practices pipeline.Curr ProtocBioinformatics 43,11 10 11-33(2013).
63 Wang,K.,Li,M.&Hakonarson,H.ANNOVAR:functional annotation ofgenetic variants from high-throughput sequencing data.Nucleic Acids Res 38,e164(2010).
64 Genomes Project,C.et al.An integrated map of genetic variationfrom 1,092 human genomes.Nature 491,56-65(2012).
65 Pertea,M.,Kim,D.,Pertea,G.M.,Leek,J.T.&Salzberg,S.L. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie andBallgown.Nat Protoc 11,1650-1667(2016).
序列表
<110> 北京大学
博雅辑因(北京)生物科技有限公司
<120> 编辑RNA的方法和组合物
<130> PE01429D3
<150> PCT/CN2018/110105
<150> PCT/CN2019/082713
<151> 2018-10-12
<151> 2019-04-15
<160> 343
<170> SIPOSequenceListing 1.0
<210> 1
<211> 708
<212> DNA
<213> 人工序列()
<400> 1
atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat gcgcttcaag 60
gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga gggcgagggc 120
cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg ccccctgccc 180
ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta cgtgaagcac 240
cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa gtgggagcgc 300
gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc cctgcaggac 360
ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga cggccccgta 420
atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc cgaggacggc 480
gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca ctacgacgct 540
gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc ctacaacgtc 600
aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga acagtacgaa 660
cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaag 708
<210> 2
<211> 99
<212> DNA
<213> 人工序列()
<400> 2
ctgcagggcg gaggaggcag cggcggagga ggcagcggcg gaggaggcag cagaaggtat 60
acacgccgga agaatctgta gagatccccg gtcgccacc 99
<210> 3
<211> 717
<212> DNA
<213> 人工序列()
<400> 3
gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc 60
gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc 120
aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc 180
gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag 240
cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc 300
aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg 360
aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag 420
ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc 480
atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac 540
cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 600
ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg 660
ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaa 717
<210> 4
<211> 81
<212> DNA
<213> 人工序列()
<400> 4
ctgcagggcg gaggaggcag cggcggagga ggcagcggcg gaggaggcag cgcctgctcg 60
cgatgctaga gggctctgcc a 81
<210> 5
<211> 50
<212> DNA
<213> 人工序列()
<400> 5
ctgcagggcg gaggaggcag cgcctgctcg cgatgctaga gggctctgcc 50
<210> 6
<211> 101
<212> RNA
<213> 人工序列()
<400> 6
ggaccacccc aaaaaugaau auaaccaaaa cugaacagcu ccucgcccuu gcucacuggc 60
agagcccucc agcaucgcga gcaggcgcug ccuccuccgc c 101
<210> 7
<211> 70
<212> RNA
<213> 人工序列()
<400> 7
aaaccgaggg aucauagggg acugaaucca ccauucuucu cccaaucccu gcaacuccuu 60
cuuccccugc 70
<210> 8
<211> 70
<212> RNA
<213> 人工序列()
<400> 8
ugaacagcuc cucgcccuug cucacuggca gagcccucca gcaucgcgag caggcgcugc 60
cuccuccgcc 70
<210> 9
<211> 111
<212> DNA
<213> 人工序列()
<400> 9
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgctatagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 10
<211> 111
<212> DNA
<213> 人工序列()
<400> 10
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgctaaagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 11
<211> 111
<212> DNA
<213> 人工序列()
<400> 11
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgctacagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 12
<211> 111
<212> DNA
<213> 人工序列()
<400> 12
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgctagagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 13
<211> 111
<212> DNA
<213> 人工序列()
<400> 13
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcaatagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 14
<211> 111
<212> DNA
<213> 人工序列()
<400> 14
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcaaaagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 15
<211> 111
<212> DNA
<213> 人工序列()
<400> 15
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcaacagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 16
<211> 111
<212> DNA
<213> 人工序列()
<400> 16
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcaagagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 17
<211> 111
<212> DNA
<213> 人工序列()
<400> 17
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgccatagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 18
<211> 111
<212> DNA
<213> 人工序列()
<400> 18
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgccaaagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 19
<211> 111
<212> DNA
<213> 人工序列()
<400> 19
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgccacagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 20
<211> 111
<212> DNA
<213> 人工序列()
<400> 20
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgccagagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 21
<211> 111
<212> DNA
<213> 人工序列()
<400> 21
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcgatagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 22
<211> 111
<212> DNA
<213> 人工序列()
<400> 22
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcgaaagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 23
<211> 111
<212> DNA
<213> 人工序列()
<400> 23
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcgacagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 24
<211> 111
<212> DNA
<213> 人工序列()
<400> 24
atggacgagc tgtacaagct gcagggcgga ggaggcagcg cctgctcgcg atgcgagagg 60
gctctgccag tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat c 111
<210> 25
<211> 91
<212> RNA
<213> 人工序列()
<400> 25
uagcuguauc gucaaggcac ucuugccuac gccaccagcu ccaaccacca caaguuuaua 60
uucagucauu uucagcaggc cucucucccg c 91
<210> 26
<211> 111
<212> RNA
<213> 人工序列()
<400> 26
gauucugaau uagcuguauc gucaaggcac ucuugccuac gccaccagcu ccaacuacca 60
caaguuuaua uucagucauu uucagcaggc cucucucccg caccugggag c 111
<210> 27
<211> 131
<212> RNA
<213> 人工序列()
<400> 27
uccacaaaau gauucugaau uagcuguauc gucaaggcac ucuugccuac gccaccagcu 60
ccaacuacca caaguuuaua uucagucauu uucagcaggc cucucucccg caccugggag 120
ccgcugagcc u 131
<210> 28
<211> 151
<212> RNA
<213> 人工序列()
<400> 28
aucauauucg uccacaaaau gauucugaau uagcuguauc gucaaggcac ucuugccuac 60
gccaccagcu ccaaccacca caaguuuaua uucagucauu uucagcaggc cucucucccg 120
caccugggag ccgcugagcc ucuggccccg c 151
<210> 29
<211> 171
<212> RNA
<213> 人工序列()
<400> 29
cuauuguugg aucauauucg uccacaaaau gauucugaau uagcuguauc gucaaggcac 60
ucuugccuac gccaccagcu ccaaccacca caaguuuaua uucagucauu uucagcaggc 120
cucucucccg caccugggag ccgcugagcc ucuggccccg ccgccgccuu c 171
<210> 30
<211> 191
<212> RNA
<213> 人工序列()
<400> 30
uaggaauccu cuauuguugg aucauauucg uccacaaaau gauucugaau uagcuguauc 60
gucaaggcac ucuugccuac gccaccagcu ccaaccacca caaguuuaua uucagucauu 120
uucagcaggc cucucucccg caccugggag ccgcugagcc ucuggccccg ccgccgccuu 180
cagugccugc g 191
<210> 31
<211> 151
<212> RNA
<213> 人工序列()
<400> 31
gaggcgcagc auccacaggc ggaggcgaaa gcagcccgga cagcugaggc cggaagaggg 60
uggggccgcg guggccaggg agccggcgcc gccacgcgcg gguggggggg acugggguug 120
cucgcgggcu ccgggcgggc ggcgggcgcc g 151
<210> 32
<211> 151
<212> RNA
<213> 人工序列()
<400> 32
uccuguagcu aaggccacaa aauuauccac uguuuuugga acagucuuuc cgaagagacc 60
aaagaucacc cggcccacau cuucaucucc aauucguagg ucaaaauaca ccuugacggu 120
gacuuugggc cccuucuucu ucucaucggc c 151
<210> 33
<211> 151
<212> RNA
<213> 人工序列()
<400> 33
gcccuggauc augaaguccu ugauuacacg auggaauuug cuguuuuugu agccaaaucc 60
uuucucuccu guagccaagg ccacaaaauu auccacuguu uuuggaacag ucuuuccgaa 120
gagaccaaag aucacccggc cuacaucuuc a 151
<210> 34
<211> 72
<212> RNA
<213> 人工序列()
<400> 34
gcgcaaguua gguuuuguca agaaagggug uaacgcaacc aagucauagu ccgccuagaa 60
gcauuugcgg ug 72
<210> 35
<211> 131
<212> RNA
<213> 人工序列()
<400> 35
gccaugccaa ucucaucuug uuuucugcgc aaguuagguu uugucaagaa aggguguaac 60
gcaaccaagu cauaguccgc cuagaagcau uugcggugga cgauggaggg gccggacucg 120
ucauacuccu g 131
<210> 36
<211> 70
<212> RNA
<213> 人工序列()
<400> 36
ggacuuccug uaacaacgca ucucauauuu ggaaugacca uuaaaaaaac aacaaugugc 60
aaucaaaguc 70
<210> 37
<211> 71
<212> RNA
<213> 人工序列()
<400> 37
caaggugcgg cuccggcccc uccccucuuc aaggggucca cauggcaacu gugaggaggg 60
gagauucagu g 71
<210> 38
<211> 91
<212> RNA
<213> 人工序列()
<400> 38
uagcuguauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca caaggggaga 60
gucagucagg gucagcaggc cucucucccg c 91
<210> 39
<211> 91
<212> RNA
<213> 人工序列()
<400> 39
uagcuguauc gucaaggcac ucuugccgac gccaccagcu ccaaccacca caaguguaua 60
gucagucauu uucagcaggc cucucucccg c 91
<210> 40
<211> 91
<212> RNA
<213> 人工序列()
<400> 40
uagcuggauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca caaggggaga 60
ggcagucagg gucagcaggc cucucucccg c 91
<210> 41
<211> 111
<212> RNA
<213> 人工序列()
<400> 41
gauucugaau uagcuguauc gucaaggcac ucuugccgac gccaccagcu ccaaccacca 60
caaguguaua gucagucauu uucagcaggc cucucucccg caccugggag c 111
<210> 42
<211> 111
<212> RNA
<213> 人工序列()
<400> 42
gauucugaau uagcuguauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca 60
caaguggaga gucagucauu uucagcaggc cucucucccg caccugggag c 111
<210> 43
<211> 111
<212> RNA
<213> 人工序列()
<400> 43
gauucugaau uagcuguauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca 60
caaggggaga gucagucagg gucagcaggc cucucucccg caccugggag c 111
<210> 44
<211> 111
<212> RNA
<213> 人工序列()
<400> 44
gcuccccggu gcgggagaga ggccugcuga cccugacugc cucuccccuu guggugguug 60
gagcuggugg cgucggcacg agugccuuga cgauccagcu aauucagaau c 111
<210> 45
<211> 71
<212> DNA
<213> 人工序列()
<400> 45
tctcagtcca atgtatggtc cgagcacaag ctctaatcaa agtccgcggg tgtagaccgg 60
ttgccatagg a 71
<210> 46
<211> 31
<212> RNA
<213> 人工序列()
<400> 46
ggaccacccc aaaaaugaag gggacuaaaa c 31
<210> 47
<211> 70
<212> RNA
<213> 人工序列()
<400> 47
aaaccgaggg aucauagggg acugaaucca ccauucuucu cccaaucccu gcaacuccuu 60
cuuccccugc 70
<210> 48
<211> 14
<212> RNA
<213> 人工序列()
<400> 48
gcagagccuc cagc 14
<210> 49
<211> 21
<212> RNA
<213> 人工序列()
<400> 49
cucacuggca gagccuccag c 21
<210> 50
<211> 27
<212> RNA
<213> 人工序列()
<400> 50
cccuugcuca cuggcagagc cuccagc 27
<210> 51
<211> 33
<212> RNA
<213> 人工序列()
<400> 51
cucucgcccu ugcucacugg cagagccucc agc 33
<210> 52
<211> 38
<212> RNA
<213> 人工序列()
<400> 52
cucucgcccu ugcucacugg cagagccucc agcaucgc 38
<210> 53
<211> 45
<212> RNA
<213> 人工序列()
<400> 53
ugaacagcuc ucgcccuugc ucacuggcag agccuccagc aucgc 45
<210> 54
<211> 70
<212> RNA
<213> 人工序列()
<400> 54
ugaacagcuc cucgcccuug cucacuggca gagcccucca gcaucgcgag caggcgcugc 60
cuccuccgcc 70
<210> 55
<211> 70
<212> RNA
<213> 人工序列()
<400> 55
aaaccgaggg aucauagggg acugaaucca ccauucuucu cccaaucccu gcaacuccuu 60
cuuccccugc 70
<210> 56
<211> 70
<212> RNA
<213> 人工序列()
<400> 56
ugaacagcuc cucgcccuug cucacuggca gagcccucca gcaucgcgag caggcgcugc 60
cuccuccgcc 70
<210> 57
<211> 71
<212> RNA
<213> 人工序列()
<400> 57
ucucagucca auguaugguc cgagcacaag cucuaaucaa aguccgcggg uguagaccgg 60
uugccauagg a 71
<210> 58
<211> 71
<212> RNA
<213> 人工序列()
<400> 58
acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 59
<211> 71
<212> RNA
<213> 人工序列()
<400> 59
acagcuccuc gcccuugcuc acuggcagag cccucaagca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 60
<211> 71
<212> RNA
<213> 人工序列()
<400> 60
acagcuccuc gcccuugcuc acuggcagag cccucuagca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 61
<211> 71
<212> RNA
<213> 人工序列()
<400> 61
acagcuccuc gcccuugcuc acuggcagag cccucgagca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 62
<211> 71
<212> RNA
<213> 人工序列()
<400> 62
acagcuccuc gcccuugcuc acuggcagag cccugcagca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 63
<211> 71
<212> RNA
<213> 人工序列()
<400> 63
acagcuccuc gcccuugcuc acuggcagag cccuucagca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 64
<211> 71
<212> RNA
<213> 人工序列()
<400> 64
acagcuccuc gcccuugcuc acuggcagag cccuacagca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 65
<211> 71
<212> RNA
<213> 人工序列()
<400> 65
acagcuccuc gcccuugcuc acuggcagag cccuccugca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 66
<211> 71
<212> RNA
<213> 人工序列()
<400> 66
acagcuccuc gcccuugcuc acuggcagag cccugcugca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 67
<211> 71
<212> RNA
<213> 人工序列()
<400> 67
acagcuccuc gcccuugcuc acuggcagag cccuucugca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 68
<211> 71
<212> RNA
<213> 人工序列()
<400> 68
acagcuccuc gcccuugcuc acuggcagag cccuacugca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 69
<211> 71
<212> RNA
<213> 人工序列()
<400> 69
acagcuccuc gcccuugcuc acuggcagag cccucccgca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 70
<211> 71
<212> RNA
<213> 人工序列()
<400> 70
acagcuccuc gcccuugcuc acuggcagag cccugccgca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 71
<211> 71
<212> RNA
<213> 人工序列()
<400> 71
acagcuccuc gcccuugcuc acuggcagag cccuuccgca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 72
<211> 71
<212> RNA
<213> 人工序列()
<400> 72
acagcuccuc gcccuugcuc acuggcagag cccuaccgca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 73
<211> 71
<212> RNA
<213> 人工序列()
<400> 73
acagcuccuc gcccuugcuc acuggcagag cccuccggca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 74
<211> 71
<212> RNA
<213> 人工序列()
<400> 74
acagcuccuc gcccuugcuc acuggcagag cccugcugca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 75
<211> 71
<212> RNA
<213> 人工序列()
<400> 75
acagcuccuc gcccuugcuc acuggcagag cccuucggca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 76
<211> 71
<212> RNA
<213> 人工序列()
<400> 76
acagcuccuc gcccuugcuc acuggcagag cccuacggca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 77
<211> 31
<212> RNA
<213> 人工序列()
<400> 77
acuggcagag cccuccagca ucgcgagcag g 31
<210> 78
<211> 51
<212> RNA
<213> 人工序列()
<400> 78
gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc c 51
<210> 79
<211> 71
<212> RNA
<213> 人工序列()
<400> 79
acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc 60
cuccgccgcu g 71
<210> 80
<211> 91
<212> RNA
<213> 人工序列()
<400> 80
accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag 60
gcgcugccuc cuccgccgcu gccuccuccg c 91
<210> 81
<211> 131
<212> RNA
<213> 人工序列()
<400> 81
gcucgaccag gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag 60
cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu gccuccuccg ccgcugccuc 120
cuccgcccug c 131
<210> 82
<211> 151
<212> RNA
<213> 人工序列()
<400> 82
ucgccgucca gcucgaccag gaugggcacc accccgguga acagcuccuc gcccuugcuc 60
acuggcagag cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu gccuccuccg 120
ccgcugccuc cuccgcccug cagcuuguac a 151
<210> 83
<211> 171
<212> RNA
<213> 人工序列()
<400> 83
gccguuuacg ucgccgucca gcucgaccag gaugggcacc accccgguga acagcuccuc 60
gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu 120
gccuccuccg ccgcugccuc cuccgcccug cagcuuguac agcucgucca u 171
<210> 84
<211> 191
<212> RNA
<213> 人工序列()
<400> 84
ugaacuugug gccguuuacg ucgccgucca gcucgaccag gaugggcacc accccgguga 60
acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc 120
cuccgccgcu gccuccuccg ccgcugccuc cuccgcccug cagcuuguac agcucgucca 180
ugccgccggu g 191
<210> 85
<211> 211
<212> RNA
<213> 人工序列()
<400> 85
ccggacacgc ugaacuugug gccguuuacg ucgccgucca gcucgaccag gaugggcacc 60
accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag 120
gcgcugccuc cuccgccgcu gccuccuccg ccgcugccuc cuccgcccug cagcuuguac 180
agcucgucca ugccgccggu ggaguggcgg c 211
<210> 86
<211> 31
<212> RNA
<213> 人工序列()
<400> 86
gcgaccgggg aucuccacag auucuuccgg c 31
<210> 87
<211> 51
<212> RNA
<213> 人工序列()
<400> 87
gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc u 51
<210> 88
<211> 71
<212> RNA
<213> 人工序列()
<400> 88
ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc 60
uucugcugcc u 71
<210> 89
<211> 91
<212> RNA
<213> 人工序列()
<400> 89
gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg 60
cguguauacc uucugcugcc uccuccgccg c 91
<210> 90
<211> 111
<212> RNA
<213> 人工序列()
<400> 90
caccaccccg gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag 60
auucuuccgg cguguauacc uucugcugcc uccuccgccg cugccuccuc c 111
<210> 91
<211> 131
<212> RNA
<213> 人工序列()
<400> 91
ccaggauggg caccaccccg gugaacagcu ccucgcccuu gcucacggug gcgaccgggg 60
aucuccacag auucuuccgg cguguauacc uucugcugcc uccuccgccg cugccuccuc 120
cgccgcugcc u 131
<210> 92
<211> 151
<212> RNA
<213> 人工序列()
<400> 92
uccagcucga ccaggauggg caccaccccg gugaacagcu ccucgcccuu gcucacggug 60
gcgaccgggg aucuccacag auucuuccgg cguguauacc uucugcugcc uccuccgccg 120
cugccuccuc cgccgcugcc uccuccgccc u 151
<210> 93
<211> 171
<212> RNA
<213> 人工序列()
<400> 93
cggcgacgua uccagcucga ccaggauggg caccaccccg gugaacagcu ccucgcccuu 60
gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc uucugcugcc 120
uccuccgccg cugccuccuc cgccgcugcc uccuccgccc ugcagcuugu a 171
<210> 94
<211> 191
<212> RNA
<213> 人工序列()
<400> 94
uguggccguu uacgucgccg uccagcucga ccaggauggg caccaccccg gugaacagcu 60
ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc 120
uucugcugcc uccuccgccg cugccuccuc cgccgcugcc uccuccgccc ugcagcuugu 180
acagcucguc c 191
<210> 95
<211> 211
<212> RNA
<213> 人工序列()
<400> 95
acgcugaacu uguggccguu uacgucgccg uccagcucga ccaggauggg caccaccccg 60
gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg 120
cguguauacc uucugcugcc uccuccgccg cugccuccuc cgccgcugcc uccuccgccc 180
ugcagcuugu acagcucguc caugccgccg g 211
<210> 96
<211> 71
<212> RNA
<213> 人工序列()
<400> 96
cagcaucgcg agcaggcgcu gccuccuccg ccgcugccuc cuccgccgcu gccuccuccg 60
cccugcagcu u 71
<210> 97
<211> 71
<212> RNA
<213> 人工序列()
<400> 97
cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu gccuccuccg ccgcugccuc 60
cuccgcccug c 71
<210> 98
<211> 71
<212> RNA
<213> 人工序列()
<400> 98
cagagcccuc cagcaucgcg agcaggcgcu gccuccuccg ccgcugccuc cuccgccgcu 60
gccuccuccg c 71
<210> 99
<211> 72
<212> RNA
<213> 人工序列()
<400> 99
acuggcagag cccucccagc aucgcgagca ggcgcugccu ccuccgccgc ugccuccucc 60
gccgcugccu cc 72
<210> 100
<211> 71
<212> RNA
<213> 人工序列()
<400> 100
ugcucacugg cagagcccuc cagcaucgcg agcaggcgcu gccuccuccg ccgcugccuc 60
cuccgccgcu g 71
<210> 101
<211> 71
<212> RNA
<213> 人工序列()
<400> 101
gcccuugcuc acuggcagag cccuccagca ucgcgagcag gcgcugccuc cuccgccgcu 60
gccuccuccg c 71
<210> 102
<211> 71
<212> RNA
<213> 人工序列()
<400> 102
uccucgcccu ugcucacugg cagagcccuc cagcaucgcg agcaggcgcu gccuccuccg 60
ccgcugccuc c 71
<210> 103
<211> 71
<212> RNA
<213> 人工序列()
<400> 103
ggugaacagc uccucgcccu ugcucacugg cagagcccuc cagcaucgcg agcaggcgcu 60
gccuccuccg c 71
<210> 104
<211> 71
<212> RNA
<213> 人工序列()
<400> 104
accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca ucgcgagcag 60
gcgcugccuc c 71
<210> 105
<211> 71
<212> RNA
<213> 人工序列()
<400> 105
gcaccacccc ggugaacagc uccucgcccu ugcucacugg cagagcccuc cagcaucgcg 60
agcaggcgcu g 71
<210> 106
<211> 71
<212> RNA
<213> 人工序列()
<400> 106
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca 60
ucgcgagcag g 71
<210> 107
<211> 71
<212> RNA
<213> 人工序列()
<400> 107
accaggaugg gcaccacccc ggugaacagc uccucgcccu ugcucacugg cagagcccuc 60
cagcaucgcg a 71
<210> 108
<211> 71
<212> RNA
<213> 人工序列()
<400> 108
gcucgaccag gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag 60
cccuccagca u 71
<210> 109
<211> 71
<212> RNA
<213> 人工序列()
<400> 109
guccagcucg accaggaugg gcaccacccc ggugaacagc uccucgcccu ugcucacugg 60
cagagcccuc c 71
<210> 110
<211> 71
<212> RNA
<213> 人工序列()
<400> 110
cacagauucu uccggcgugu auaccuucug cugccuccuc cgccgcugcc uccuccgccg 60
cugccuccuc c 71
<210> 111
<211> 71
<212> RNA
<213> 人工序列()
<400> 111
aucuccacag auucuuccgg cguguauacc uucugcugcc uccuccgccg cugccuccuc 60
cgccgcugcc u 71
<210> 112
<211> 71
<212> RNA
<213> 人工序列()
<400> 112
cggggaucuc cacagauucu uccggcgugu auaccuucug cugccuccuc cgccgcugcc 60
uccuccgccg c 71
<210> 113
<211> 71
<212> RNA
<213> 人工序列()
<400> 113
gcgaccgggg aucuccacag auucuuccgg cguguauacc uucugcugcc uccuccgccg 60
cugccuccuc c 71
<210> 114
<211> 71
<212> RNA
<213> 人工序列()
<400> 114
cgguggcgac cggggaucuc cacagauucu uccggcgugu auaccuucug cugccuccuc 60
cgccgcugcc u 71
<210> 115
<211> 71
<212> RNA
<213> 人工序列()
<400> 115
gcucacggug gcgaccgggg aucuccacag auucuuccgg cguguauacc uucugcugcc 60
uccuccgccg c 71
<210> 116
<211> 71
<212> RNA
<213> 人工序列()
<400> 116
cccuugcuca cgguggcgac cggggaucuc cacagauucu uccggcgugu auaccuucug 60
cugccuccuc c 71
<210> 117
<211> 71
<212> RNA
<213> 人工序列()
<400> 117
cagcuccucg cccuugcuca cgguggcgac cggggaucuc cacagauucu uccggcgugu 60
auaccuucug c 71
<210> 118
<211> 71
<212> RNA
<213> 人工序列()
<400> 118
gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag auucuuccgg 60
cguguauacc u 71
<210> 119
<211> 71
<212> RNA
<213> 人工序列()
<400> 119
ccccggugaa cagcuccucg cccuugcuca cgguggcgac cggggaucuc cacagauucu 60
uccggcgugu a 71
<210> 120
<211> 71
<212> RNA
<213> 人工序列()
<400> 120
caccaccccg gugaacagcu ccucgcccuu gcucacggug gcgaccgggg aucuccacag 60
auucuuccgg c 71
<210> 121
<211> 71
<212> RNA
<213> 人工序列()
<400> 121
augggcacca ccccggugaa cagcuccucg cccuugcuca cgguggcgac cggggaucuc 60
cacagauucu u 71
<210> 122
<211> 71
<212> RNA
<213> 人工序列()
<400> 122
ccaggauggg caccaccccg gugaacagcu ccucgcccuu gcucacggug gcgaccgggg 60
aucuccacag a 71
<210> 123
<211> 71
<212> RNA
<213> 人工序列()
<400> 123
cucgaccagg augggcacca ccccggugaa cagcuccucg cccuugcuca cgguggcgac 60
cggggaucuc c 71
<210> 124
<211> 111
<212> RNA
<213> 人工序列()
<400> 124
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 125
<211> 111
<212> RNA
<213> 人工序列()
<400> 125
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugcagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 126
<211> 111
<212> RNA
<213> 人工序列()
<400> 126
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuucagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 127
<211> 111
<212> RNA
<213> 人工序列()
<400> 127
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuacagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 128
<211> 111
<212> RNA
<213> 人工序列()
<400> 128
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 129
<211> 111
<212> RNA
<213> 人工序列()
<400> 129
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugcggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 130
<211> 111
<212> RNA
<213> 人工序列()
<400> 130
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuucggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 131
<211> 111
<212> RNA
<213> 人工序列()
<400> 131
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuacggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 132
<211> 111
<212> RNA
<213> 人工序列()
<400> 132
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuccugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 133
<211> 111
<212> RNA
<213> 人工序列()
<400> 133
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugcugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 134
<211> 111
<212> RNA
<213> 人工序列()
<400> 134
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuacugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 135
<211> 111
<212> RNA
<213> 人工序列()
<400> 135
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuucugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 136
<211> 111
<212> RNA
<213> 人工序列()
<400> 136
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucccgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 137
<211> 111
<212> RNA
<213> 人工序列()
<400> 137
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccugccgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 138
<211> 111
<212> RNA
<213> 人工序列()
<400> 138
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuuccgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 139
<211> 111
<212> RNA
<213> 人工序列()
<400> 139
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuaccgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 140
<211> 111
<212> RNA
<213> 人工序列()
<400> 140
uaccgcuaca gccacgcuga uuucagcuau accugcccgg uauaaaggga cguucacacc 60
gcgauguucu cugcugggga auugcgcgau auucaggauu aaaagaagug c 111
<210> 141
<211> 151
<212> RNA
<213> 人工序列()
<400> 141
acuacaguug cuccgauauu uaggcuacgu caauaggcac uaacuuauug gcgcugguga 60
acggacuucc ucucgaguac cagaagauga cuacaaaacu ccuuuccauu gcgaguaucg 120
gagucuggcu caguuuggcc agggaggcac u 151
<210> 142
<211> 51
<212> RNA
<213> 人工序列()
<400> 142
cggaagaggg uggggccgcg guggccaggg agccggcgcc gccacgcgcg g 51
<210> 143
<211> 71
<212> RNA
<213> 人工序列()
<400> 143
cagcugaggc cggaagaggg uggggccgcg guggccaggg agccggcgcc gccacgcgcg 60
gguggggggg a 71
<210> 144
<211> 111
<212> RNA
<213> 人工序列()
<400> 144
ggaggcgaaa gcagcccgga cagcugaggc cggaagaggg uggggccgcg guggccaggg 60
agccggcgcc gccacgcgcg gguggggggg acugggguug cucgcgggcu c 111
<210> 145
<211> 151
<212> RNA
<213> 人工序列()
<400> 145
gaggcgcagc auccacaggc ggaggcgaaa gcagcccgga cagcugaggc cggaagaggg 60
uggggccgcg guggccaggg agccggcgcc gccacgcgcg gguggggggg acugggguug 120
cucgcgggcu ccgggcgggc ggcgggcgcc g 151
<210> 146
<211> 51
<212> RNA
<213> 人工序列()
<400> 146
ucuugccuac gccaccagcu ccaaccacca caaguuuaua uucagucauu u 51
<210> 147
<211> 111
<212> RNA
<213> 人工序列()
<400> 147
gauucugaau uagcuguauc gucaaggcac ucuugccuac gccaccagcu ccaaccacca 60
caaguuuaua uucagucauu uucagcaggc cucucucccg caccugggag c 111
<210> 148
<211> 151
<212> RNA
<213> 人工序列()
<400> 148
aucauauucg uccacaaaau gauucugaau uagcuguauc gucaaggcac ucuugccuac 60
gccaccagcu ccaaccacca caaguuuaua uucagucauu uucagcaggc cucucucccg 120
caccugggag ccgcugagcc ucuggccccg c 151
<210> 149
<211> 51
<212> RNA
<213> 人工序列()
<400> 149
ucggcauggu augaaguacu ucguccagga gcuggagggc ccgguguaag u 51
<210> 150
<211> 71
<212> RNA
<213> 人工序列()
<400> 150
gggucugcaa ucggcauggu augaaguacu ucguccagga gcuggagggc ccgguguaag 60
ugaauuucaa u 71
<210> 151
<211> 111
<212> RNA
<213> 人工序列()
<400> 151
gaccucaguc uaaagguugu gggucugcaa ucggcauggu augaaguacu ucguccagga 60
gcuggagggc ccgguguaag ugaauuucaa uccagcaagg uguuucuuug a 111
<210> 152
<211> 151
<212> RNA
<213> 人工序列()
<400> 152
uaagggcccc aacgguaaaa gaccucaguc uaaagguugu gggucugcaa ucggcauggu 60
augaaguacu ucguccagga gcuggagggc ccgguguaag ugaauuucaa uccagcaagg 120
uguuucuuug augcucuguc uuggguaauc c 151
<210> 153
<211> 51
<212> RNA
<213> 人工序列()
<400> 153
ugggggguuc ggcugccgac aucagcaauu gcucugccac caucucagcc c 51
<210> 154
<211> 71
<212> RNA
<213> 人工序列()
<400> 154
agcagggccg ugggggguuc ggcugccgac aucagcaauu gcucugccac caucucagcc 60
cauccuccga a 71
<210> 155
<211> 111
<212> RNA
<213> 人工序列()
<400> 155
aguagaaggc caagagccac agcagggccg ugggggguuc ggcugccgac aucagcaauu 60
gcucugccac caucucagcc cauccuccga agugaaugaa caggaaccag c 111
<210> 156
<211> 151
<212> RNA
<213> 人工序列()
<400> 156
ccucccauca cgggggccgu aguagaaggc caagagccac agcagggccg ugggggguuc 60
ggcugccgac aucagcaauu gcucugccac caucucagcc cauccuccga agugaaugaa 120
caggaaccag cucucaaagg gaccuccgca g 151
<210> 157
<211> 151
<212> DNA
<213> 人工序列()
<400> 157
gccaaacacc acatgcttgc catctagcca ggctgtcttg actgtcgtga tgaagaactg 60
ggagccgttg gtgtccttgc ctgcgttggc catgctcacc cagccaggcc cgtagtgctt 120
cagtttgaag ttctcatcgg ggaagcgctc a 151
<210> 158
<211> 151
<212> DNA
<213> 人工序列()
<400> 158
gggagtgggt ccgctccacc agatgccagc accggggcca gtgcagctca gagccctgtg 60
gcggactaca gggcccgcac agacggtcac tcaaagaaag atgtccctgt gccctactcc 120
ttggcgatgg caaagggctt ctccacctcg a 151
<210> 159
<211> 151
<212> DNA
<213> 人工序列()
<400> 159
tgcattttgt aaaatagata ctagcagatt gtcccaagat gtgtacagct cattctcaca 60
gcccagcgag ggcacctact ccacaaatgc gtggccacag gtcatcacct gtcctgtggc 120
cctggcgagc ctgatccctc acgccgggca c 151
<210> 160
<211> 151
<212> DNA
<213> 人工序列()
<400> 160
gctcattctc acagcccagc gagggcactt actccacaaa tgcgtggcca caggtcatca 60
cctgtcctgt ggccccggcg agcctgatcc ctcacgccgg gcacccacac ggcctgcgtg 120
ccttctagac ttgagttcgc agctctttaa g 151
<210> 161
<211> 151
<212> DNA
<213> 人工序列()
<400> 161
tcggccgggc cctgggggcg gtgggcgctg gccaggacgc ccaccgtgtg gttgctgtcc 60
aggacggtcc cggcccgcga cacttcggcc cagagctgct cctcatccag cagcgccagc 120
agccccatgg ccgtgagcac cggcttgcgc a 151
<210> 162
<211> 111
<212> RNA
<213> 人工序列()
<400> 162
ugaccagucu uaagaucuuu cuugaccugc accauaagaa cuucuccaaa gguaccaaaa 60
uacucuuuca gguccuguuc gguuguuuuc caugggagac ccaacacuau u 111
<210> 163
<211> 111
<212> RNA
<213> 人工序列()
<400> 163
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 164
<211> 111
<212> RNA
<213> 人工序列()
<400> 164
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 165
<211> 111
<212> RNA
<213> 人工序列()
<400> 165
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 166
<211> 111
<212> RNA
<213> 人工序列()
<400> 166
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 167
<211> 111
<212> RNA
<213> 人工序列()
<400> 167
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 168
<211> 111
<212> RNA
<213> 人工序列()
<400> 168
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 169
<211> 111
<212> RNA
<213> 人工序列()
<400> 169
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 170
<211> 111
<212> RNA
<213> 人工序列()
<400> 170
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 171
<211> 111
<212> RNA
<213> 人工序列()
<400> 171
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 172
<211> 111
<212> RNA
<213> 人工序列()
<400> 172
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 173
<211> 111
<212> RNA
<213> 人工序列()
<400> 173
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 174
<211> 111
<212> RNA
<213> 人工序列()
<400> 174
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 175
<211> 111
<212> RNA
<213> 人工序列()
<400> 175
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgcgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 176
<211> 111
<212> RNA
<213> 人工序列()
<400> 176
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggcgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 177
<211> 111
<212> RNA
<213> 人工序列()
<400> 177
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugcgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 178
<211> 111
<212> RNA
<213> 人工序列()
<400> 178
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagcgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 179
<211> 111
<212> RNA
<213> 人工序列()
<400> 179
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 180
<211> 111
<212> RNA
<213> 人工序列()
<400> 180
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 181
<211> 111
<212> RNA
<213> 人工序列()
<400> 181
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 182
<211> 111
<212> RNA
<213> 人工序列()
<400> 182
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 183
<211> 111
<212> RNA
<213> 人工序列()
<400> 183
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 184
<211> 111
<212> RNA
<213> 人工序列()
<400> 184
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 185
<211> 111
<212> RNA
<213> 人工序列()
<400> 185
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgcgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 186
<211> 111
<212> RNA
<213> 人工序列()
<400> 186
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 187
<211> 111
<212> RNA
<213> 人工序列()
<400> 187
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuggugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 188
<211> 111
<212> RNA
<213> 人工序列()
<400> 188
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuugugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 189
<211> 111
<212> RNA
<213> 人工序列()
<400> 189
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccuagugca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 190
<211> 111
<212> RNA
<213> 人工序列()
<400> 190
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgagca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 191
<211> 111
<212> RNA
<213> 人工序列()
<400> 191
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgcgca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 192
<211> 111
<212> RNA
<213> 人工序列()
<400> 192
gaugggcacc accccgguga acagcuccuc gcccuugcuc acuggcagag cccucgggca 60
ucgcgagcag gcgcugccuc cuccgcccug cagcuuguac agcucgucca u 111
<210> 193
<211> 111
<212> RNA
<213> 人工序列()
<400> 193
gauucugaau uagcuguauc gucaaggcac ucgugccgac gccaccagcu ccaaccacca 60
caaguggaga gucagucauu uucagcaggc cucucucccg caccugggag c 111
<210> 194
<211> 111
<212> RNA
<213> 人工序列()
<400> 194
gauucugaau uagcuggauc gucaaggcac ucgggccgac gccaccagcu ccaaccacca 60
caaguggaga gucagucauu uucagcaggc cucucucccg caccggggag c 111
<210> 195
<211> 111
<212> RNA
<213> 人工序列()
<400> 195
gggagcagcc ucuggcauuc ugggagcuuc aucuggaccu gggucuucag ugaaccauug 60
uucaauaucg uccggggaca gcaucaaauc auccauugcu ugggacggca a 111
<210> 196
<211> 111
<212> RNA
<213> 人工序列()
<400> 196
gggagcagcc ucuggcauuc ugggagcuuc aucuggaccu gggucuucag ugaaccauug 60
uucaagaucg uccggggaca gcaucaaauc auccauugcu ugggacggca a 111
<210> 197
<211> 111
<212> RNA
<213> 人工序列()
<400> 197
gggagcagcc ucuggcaguc ggggagcuuc aucuggaccu gggucuucag ugaaccauug 60
uucaagaucg uccggggaca gcaucaaauc auccagugcu ugggacggca a 111
<210> 198
<211> 111
<212> RNA
<213> 人工序列()
<400> 198
cauauuacag aauaccuuga uagcauccaa uuugcauccu ugguuagggu caacccagua 60
uucuccacuc uugaguucag gauggcagaa uuucaggucu cugcaguuuc u 111
<210> 199
<211> 111
<212> RNA
<213> 人工序列()
<400> 199
gugaagauaa gccaguccuc uaguaacaga augagcaaga cggcaagagc uuacccaguc 60
acuugugugg agacuuaaau acuugcauaa agauccauug ggauaguacu c 111
<210> 200
<211> 111
<212> RNA
<213> 人工序列()
<400> 200
gugaacguca aacugucgga ccaauauggc agaaucuucu cucaucucaa cuuuccauau 60
ccguaucaug gaaucauagc auccuguaac uacuagcucu cuuacagcug g 111
<210> 201
<211> 111
<212> RNA
<213> 人工序列()
<400> 201
gccaaugauc ucgugaguua ucucagcagu gugagccauc agggugauga caucccaggc 60
gaucgugugg ccuccaggag cccagagcag gaaguugagg agaaggugcc u 111
<210> 202
<211> 111
<212> RNA
<213> 人工序列()
<400> 202
caagacggug aaccacucca uggucuucuu gucggcuuuc ugcacugugu acccccagag 60
cuccguguug ccgacauccu gggguggcuu ccacuccaga gccacauuaa g 111
<210> 203
<211> 111
<212> RNA
<213> 人工序列()
<400> 203
aggauucucu uuugaaguau ugcuccccca guggauuggg uggcuccauu cacuccaaug 60
cugagcacuu ccacagagug gguuaaagcg gcuccgaaca cgaaacgugu a 111
<210> 204
<211> 111
<212> RNA
<213> 人工序列()
<400> 204
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca uccagcagcg ccagcagccc cauggccgug agcaccggcu u 111
<210> 205
<211> 111
<212> RNA
<213> 人工序列()
<400> 205
gacgcccacc gugugguugc uguccaggac ggucccggcc ugcgacacuu cggcccagag 60
cugcuccuca ucugcggggc gggggggggc cgucgccgcg uggggucguu g 111
<210> 206
<211> 31
<212> DNA
<213> 人工序列()
<400> 206
tataactagt atggtgagca agggcgagga g 31
<210> 207
<211> 41
<212> DNA
<213> 人工序列()
<400> 207
tatacgtctc atctacagat tcttccggcg tgtatacctt c 41
<210> 208
<211> 53
<212> DNA
<213> 人工序列()
<400> 208
tatacgtctc atagagatcc ccggtcgcca ccgtgagcaa gggcgaggag ctg 53
<210> 209
<211> 36
<212> DNA
<213> 人工序列()
<400> 209
tataggcgcg ccttacttgt acagctcgtc catgcc 36
<210> 210
<211> 94
<212> DNA
<213> 人工序列()
<400> 210
tatacgtctc aaggcgctgc ctcctccgcc gctgcctcct ccgccgctgc ctcctccgcc 60
ctgcagcttg tacagctcgt ccatgccgcc ggtg 94
<210> 211
<211> 62
<212> DNA
<213> 人工序列()
<400> 211
tatacgtctc agcctgctcg cgatgctaga gggctctgcc agtgagcaag ggcgaggagc 60
tg 62
<210> 212
<211> 70
<212> DNA
<213> 人工序列()
<400> 212
tataactagt atggtggatt acaaggatga cgacgataag atgaaagtga cgaaggtagg 60
aggcatttcg 70
<210> 213
<211> 60
<212> DNA
<213> 人工序列()
<400> 213
atatggcgcg ccgttttcag actttttctc ttccattttg tattcaaaca taatcttcac 60
<210> 214
<211> 69
<212> DNA
<213> 人工序列()
<400> 214
tataggcgcg ccaggcggag gaggcagcgg cggaggaggc agcctcctcc tctcaaggtc 60
cccagaagc 69
<210> 215
<211> 64
<212> DNA
<213> 人工序列()
<400> 215
tatacctgca ggctacacct tgcgtttttt cttgggtact gggcagagat aaaagttctt 60
ttcc 64
<210> 216
<211> 24
<212> DNA
<213> 人工序列()
<400> 216
cactccaccg gcggcatgga cgag 24
<210> 217
<211> 28
<212> DNA
<213> 人工序列()
<400> 217
cacgctgaac ttgtggccgt ttacgtcg 28
<210> 218
<211> 40
<212> DNA
<213> 人工序列()
<400> 218
tataactagt atgaatccgc ggcaggggta ttccctcagc 40
<210> 219
<211> 73
<212> DNA
<213> 人工序列()
<400> 219
tataggcgcg ccctacttat cgtcgtcatc cttgtaatct actgggcaga gataaaagtt 60
cttttcctcc tgg 73
<210> 220
<211> 42
<212> DNA
<213> 人工序列()
<400> 220
tataactagt atggatatag aagatgaaga aaacatgagt tc 42
<210> 221
<211> 67
<212> DNA
<213> 人工序列()
<400> 221
tataggcgcg ccctacttat cgtcgtcatc cttgtaatcg ggcgtgagtg agaactggtc 60
ctgctcg 67
<210> 222
<211> 37
<212> DNA
<213> 人工序列()
<400> 222
tataactagt atggccgaga tcaaggagaa aatctgc 37
<210> 223
<211> 73
<212> DNA
<213> 人工序列()
<400> 223
tataggcgcg ccctacttat cgtcgtcatc cttgtaatct actgggcaga gataaaagtt 60
cttttcctcc tgg 73
<210> 224
<211> 19
<212> DNA
<213> 人工序列()
<400> 224
cgccatttcg gactgggag 19
<210> 225
<211> 25
<212> DNA
<213> 人工序列()
<400> 225
agagacaggt ttctccatca attac 25
<210> 226
<211> 16
<212> DNA
<213> 人工序列()
<400> 226
gagcccgcga gcaacc 16
<210> 227
<211> 20
<212> DNA
<213> 人工序列()
<400> 227
gcagcaggaa gaagacggac 20
<210> 228
<211> 23
<212> DNA
<213> 人工序列()
<400> 228
agaagcagtt gaagaccaga ctc 23
<210> 229
<211> 20
<212> DNA
<213> 人工序列()
<400> 229
ggccttcacc tggaccatag 20
<210> 230
<211> 22
<212> DNA
<213> 人工序列()
<400> 230
agagaagcag ttgaagacca ga 22
<210> 231
<211> 20
<212> DNA
<213> 人工序列()
<400> 231
cggccttcac ctggaccata 20
<210> 232
<211> 23
<212> DNA
<213> 人工序列()
<400> 232
cagagaagca gttgaagacc aga 23
<210> 233
<211> 20
<212> DNA
<213> 人工序列()
<400> 233
cggccttcac ctggaccata 20
<210> 234
<211> 20
<212> DNA
<213> 人工序列()
<400> 234
tttgtgaaag gctggggacc 20
<210> 235
<211> 25
<212> DNA
<213> 人工序列()
<400> 235
acaggattgt attttgtagt ccacc 25
<210> 236
<211> 23
<212> DNA
<213> 人工序列()
<400> 236
aggatgagtt ttgtgaaagg ctg 23
<210> 237
<211> 24
<212> DNA
<213> 人工序列()
<400> 237
attttgtagt ccaccatcct gata 24
<210> 238
<211> 22
<212> DNA
<213> 人工序列()
<400> 238
gatgagtttt gtgaaaggct gg 22
<210> 239
<211> 25
<212> DNA
<213> 人工序列()
<400> 239
attttgtagt ccaccatcct gataa 25
<210> 240
<211> 20
<212> DNA
<213> 人工序列()
<400> 240
cgaagagaac gagaccgcat 20
<210> 241
<211> 19
<212> DNA
<213> 人工序列()
<400> 241
gaagatggtg cacaccggg 19
<210> 242
<211> 22
<212> DNA
<213> 人工序列()
<400> 242
gacagatgct tcatcagcag tg 22
<210> 243
<211> 21
<212> DNA
<213> 人工序列()
<400> 243
cgaacaaagc caaacccctt t 21
<210> 244
<211> 25
<212> DNA
<213> 人工序列()
<400> 244
tctgttaatg gacaaataga aagcc 25
<210> 245
<211> 23
<212> DNA
<213> 人工序列()
<400> 245
ggaacattca aaggattggc act 23
<210> 246
<211> 20
<212> DNA
<213> 人工序列()
<400> 246
agtcactgca gatggacgca 20
<210> 247
<211> 22
<212> DNA
<213> 人工序列()
<400> 247
atctcgatgg gaaattgcag gt 22
<210> 248
<211> 25
<212> DNA
<213> 人工序列()
<400> 248
tcagagtttt acctcatcct tcttt 25
<210> 249
<211> 25
<212> DNA
<213> 人工序列()
<400> 249
cctgaataca tatgatgacc ttcag 25
<210> 250
<211> 20
<212> DNA
<213> 人工序列()
<400> 250
agggcacaga cacagacctc 20
<210> 251
<211> 21
<212> DNA
<213> 人工序列()
<400> 251
agggctttca atgccaagac g 21
<210> 252
<211> 19
<212> DNA
<213> 人工序列()
<400> 252
tgacaagcca agtcctccc 19
<210> 253
<211> 21
<212> DNA
<213> 人工序列()
<400> 253
attgccaatg atgagctctg g 21
<210> 254
<211> 25
<212> DNA
<213> 人工序列()
<400> 254
ttatagacat aagttctcct tgcct 25
<210> 255
<211> 20
<212> DNA
<213> 人工序列()
<400> 255
tcaatcccat ggagccaaca 20
<210> 256
<211> 50
<212> DNA
<213> 人工序列()
<400> 256
tacacgacgc tcttccgatc ttaagtagag gccgccactc caccggcggc 50
<210> 257
<211> 51
<212> DNA
<213> 人工序列()
<400> 257
tacacgacgc tcttccgatc tatcatgctt agccgccact ccaccggcgg c 51
<210> 258
<211> 52
<212> DNA
<213> 人工序列()
<400> 258
tacacgacgc tcttccgatc tgatgcacat ctgccgccac tccaccggcg gc 52
<210> 259
<211> 53
<212> DNA
<213> 人工序列()
<400> 259
tacacgacgc tcttccgatc tcgattgctc gacgccgcca ctccaccggc ggc 53
<210> 260
<211> 54
<212> DNA
<213> 人工序列()
<400> 260
tacacgacgc tcttccgatc ttcgatagca attcgccgcc actccaccgg cggc 54
<210> 261
<211> 55
<212> DNA
<213> 人工序列()
<400> 261
tacacgacgc tcttccgatc tatcgatagt tgcttgccgc cactccaccg gcggc 55
<210> 262
<211> 56
<212> DNA
<213> 人工序列()
<400> 262
tacacgacgc tcttccgatc tgatcgatcc agttaggccg ccactccacc ggcggc 56
<210> 263
<211> 57
<212> DNA
<213> 人工序列()
<400> 263
tacacgacgc tcttccgatc tcgatcgatt tgagcctgcc gccactccac cggcggc 57
<210> 264
<211> 58
<212> DNA
<213> 人工序列()
<400> 264
tacacgacgc tcttccgatc tacgatcgat acacgatcgc cgccactcca ccggcggc 58
<210> 265
<211> 59
<212> DNA
<213> 人工序列()
<400> 265
tacacgacgc tcttccgatc ttacgatcga tggtccagag ccgccactcc accggcggc 59
<210> 266
<211> 50
<212> DNA
<213> 人工序列()
<400> 266
agacgtgtgc tcttccgatc ttaagtagag tcgccgtcca gctcgaccag 50
<210> 267
<211> 51
<212> DNA
<213> 人工序列()
<400> 267
agacgtgtgc tcttccgatc tatcatgctt atcgccgtcc agctcgacca g 51
<210> 268
<211> 52
<212> DNA
<213> 人工序列()
<400> 268
agacgtgtgc tcttccgatc tgatgcacat cttcgccgtc cagctcgacc ag 52
<210> 269
<211> 53
<212> DNA
<213> 人工序列()
<400> 269
agacgtgtgc tcttccgatc tcgattgctc gactcgccgt ccagctcgac cag 53
<210> 270
<211> 54
<212> DNA
<213> 人工序列()
<400> 270
agacgtgtgc tcttccgatc ttcgatagca attctcgccg tccagctcga ccag 54
<210> 271
<211> 55
<212> DNA
<213> 人工序列()
<400> 271
agacgtgtgc tcttccgatc tatcgatagt tgctttcgcc gtccagctcg accag 55
<210> 272
<211> 56
<212> DNA
<213> 人工序列()
<400> 272
agacgtgtgc tcttccgatc tgatcgatcc agttagtcgc cgtccagctc gaccag 56
<210> 273
<211> 57
<212> DNA
<213> 人工序列()
<400> 273
agacgtgtgc tcttccgatc tcgatcgatt tgagccttcg ccgtccagct cgaccag 57
<210> 274
<211> 58
<212> DNA
<213> 人工序列()
<400> 274
agacgtgtgc tcttccgatc tacgatcgat acacgatctc gccgtccagc tcgaccag 58
<210> 275
<211> 59
<212> DNA
<213> 人工序列()
<400> 275
agacgtgtgc tcttccgatc ttacgatcga tggtccagat cgccgtccag ctcgaccag 59
<210> 276
<211> 18
<212> DNA
<213> 人工序列()
<400> 276
ggggaactcg ggcaacct 18
<210> 277
<211> 19
<212> DNA
<213> 人工序列()
<400> 277
gaatcggatc tgccccgtg 19
<210> 278
<211> 19
<212> DNA
<213> 人工序列()
<400> 278
catcgaggcc aagctggaa 19
<210> 279
<211> 20
<212> DNA
<213> 人工序列()
<400> 279
gtagtgagga gggagacccc 20
<210> 280
<211> 20
<212> DNA
<213> 人工序列()
<400> 280
aagcctcctt ccttccccaa 20
<210> 281
<211> 21
<212> DNA
<213> 人工序列()
<400> 281
atcgatacac tccctagccc a 21
<210> 282
<211> 22
<212> DNA
<213> 人工序列()
<400> 282
acaaattcgg tacatcctcg ac 22
<210> 283
<211> 21
<212> DNA
<213> 人工序列()
<400> 283
ttcagccatc tttggaaggt t 21
<210> 284
<211> 20
<212> DNA
<213> 人工序列()
<400> 284
acgccgcatt gaccatctat 20
<210> 285
<211> 20
<212> DNA
<213> 人工序列()
<400> 285
tagccaggag gttctcaaca 20
<210> 286
<211> 21
<212> DNA
<213> 人工序列()
<400> 286
ggcatggact gtggtcatga g 21
<210> 287
<211> 20
<212> DNA
<213> 人工序列()
<400> 287
tgcaccacca actgcttagc 20
<210> 288
<211> 22
<212> DNA
<213> 人工序列()
<400> 288
ccccgtaatg cagaagaaga cc 22
<210> 289
<211> 21
<212> DNA
<213> 人工序列()
<400> 289
gtccttcagc ttcagcctct g 21
<210> 290
<211> 20
<212> DNA
<213> 人工序列()
<400> 290
aacgcaacat gaaggtgctc 20
<210> 291
<211> 20
<212> DNA
<213> 人工序列()
<400> 291
accttgacgg tgactttggg 20
<210> 292
<211> 20
<212> DNA
<213> 人工序列()
<400> 292
cagtgcaatg agggaccagt 20
<210> 293
<211> 24
<212> DNA
<213> 人工序列()
<400> 293
aggaccatag gtacatcttc agag 24
<210> 294
<211> 22
<212> DNA
<213> 人工序列()
<400> 294
cgaacgagtt gtatcacctg ga 22
<210> 295
<211> 20
<212> DNA
<213> 人工序列()
<400> 295
cgatggctgt ccctcaaagt 20
<210> 296
<211> 23
<212> DNA
<213> 人工序列()
<400> 296
agttgctctt ttcactcaag gtc 23
<210> 297
<211> 21
<212> DNA
<213> 人工序列()
<400> 297
ttctctctga gttcagacgc t 21
<210> 298
<211> 52
<212> DNA
<213> 人工序列()
<400> 298
tacacgacgc tcttccgatc ttaagtagag tggcacagga ggaaagagca tc 52
<210> 299
<211> 49
<212> DNA
<213> 人工序列()
<400> 299
agacgtgtgc tcttccgatc ttaagtagag gcaccacctc catgccctc 49
<210> 300
<211> 49
<212> DNA
<213> 人工序列()
<400> 300
tacacgacgc tcttccgatc ttaagtagag catcgcagac tgcggcaag 49
<210> 301
<211> 52
<212> DNA
<213> 人工序列()
<400> 301
agacgtgtgc tcttccgatc ttaagtagag agtccatggg cctgtggaat gt 52
<210> 302
<211> 19
<212> DNA
<213> 人工序列()
<400> 302
gaaaaactgg cccgagagc 19
<210> 303
<211> 20
<212> DNA
<213> 人工序列()
<400> 303
ctgagtctgg gctgagggac 20
<210> 304
<211> 20
<212> DNA
<213> 人工序列()
<400> 304
cgcttccagg tcaacaacac 20
<210> 305
<211> 19
<212> DNA
<213> 人工序列()
<400> 305
ctcgcgtaga tcagcaccg 19
<210> 306
<211> 21
<212> DNA
<213> 人工序列()
<400> 306
cccctctgag tcaggaaaca t 21
<210> 307
<211> 19
<212> DNA
<213> 人工序列()
<400> 307
gaagatgaca ggggccagg 19
<210> 308
<211> 19
<212> DNA
<213> 人工序列()
<400> 308
tagcactggc tggaatgag 19
<210> 309
<211> 21
<212> DNA
<213> 人工序列()
<400> 309
gtttcggagg taacctgtaa g 21
<210> 310
<211> 20
<212> DNA
<213> 人工序列()
<400> 310
tacagcaacc atgagtacaa 20
<210> 311
<211> 19
<212> DNA
<213> 人工序列()
<400> 311
tcaggtgttt cacataggc 19
<210> 312
<211> 19
<212> DNA
<213> 人工序列()
<400> 312
ctgcaaccat gagtgagaa 19
<210> 313
<211> 21
<212> DNA
<213> 人工序列()
<400> 313
cctttgaggt gctttagata g 21
<210> 314
<211> 19
<212> DNA
<213> 人工序列()
<400> 314
gccctgagaa aggagacat 19
<210> 315
<211> 24
<212> DNA
<213> 人工序列()
<400> 315
ctgttctgga ggtactctag gtat 24
<210> 316
<211> 18
<212> DNA
<213> 人工序列()
<400> 316
tttgaagagg gctgagaa 18
<210> 317
<211> 19
<212> DNA
<213> 人工序列()
<400> 317
tgttctggat atttcatgg 19
<210> 318
<211> 20
<212> DNA
<213> 人工序列()
<400> 318
catctgcctc cccatattcc 20
<210> 319
<211> 22
<212> DNA
<213> 人工序列()
<400> 319
tccatcctag ctcatctcca aa 22
<210> 320
<211> 18
<212> DNA
<213> 人工序列()
<400> 320
tgctccagaa ggccagac 18
<210> 321
<211> 25
<212> DNA
<213> 人工序列()
<400> 321
ttcataaata ctactaaggc acagg 25
<210> 322
<211> 21
<212> DNA
<213> 人工序列()
<400> 322
acagatgaag tgctccttcc a 21
<210> 323
<211> 21
<212> DNA
<213> 人工序列()
<400> 323
gtcggagatt cgtagctgga t 21
<210> 324
<211> 21
<212> DNA
<213> 人工序列()
<400> 324
cattgtggcc aaggagatct g 21
<210> 325
<211> 21
<212> DNA
<213> 人工序列()
<400> 325
cttcggagtt tgggtttgct t 21
<210> 326
<211> 20
<212> DNA
<213> 人工序列()
<400> 326
catcacttgc tgctgacacg 20
<210> 327
<211> 18
<212> DNA
<213> 人工序列()
<400> 327
tgtggaatct gccgggag 18
<210> 328
<211> 18
<212> DNA
<213> 人工序列()
<400> 328
ctgactctaa gtggcatt 18
<210> 329
<211> 18
<212> DNA
<213> 人工序列()
<400> 329
tgatggcctt cgattctg 18
<210> 330
<211> 23
<212> DNA
<213> 人工序列()
<400> 330
cggagtcaac ggatttggtc gta 23
<210> 331
<211> 24
<212> DNA
<213> 人工序列()
<400> 331
agccttctcc atggtggtga agac 24
<210> 332
<211> 2820
<212> DNA
<213> 人工序列()
<400> 332
atggccgaga tcaaggagaa aatctgcgac tatctcttca atgtgtctga ctcctctgcc 60
ctgaatttgg ctaaaaatat tggccttacc aaggcccgag atataaatgc tgtgctaatt 120
gacatggaaa ggcaggggga tgtctataga caagggacaa cccctcccat atggcatttg 180
acagacaaga agcgagagag gatgcaaatc aagagaaata cgaacagtgt tcctgaaacc 240
gctccagctg caatccctga gaccaaaaga aacgcagagt tcctcacctg taatataccc 300
acatcaaatg cctcaaataa catggtaacc acagaaaaag tggagaatgg gcaggaacct 360
gtcataaagt tagaaaacag gcaagaggcc agaccagaac cagcaagact gaaaccacct 420
gttcattaca atggcccctc aaaagcaggg tatgttgact ttgaaaatgg ccagtgggcc 480
acagatgaca tcccagatga cttgaatagt atccgcgcag caccaggtga gtttcgagcc 540
atcatggaga tgccctcctt ctacagtcat ggcttgccac ggtgttcacc ctacaagaaa 600
ctgacagagt gccagctgaa gaaccccatc agcgggctgt tagaatatgc ccagttcgct 660
agtcaaacct gtgagttcaa catgatagag cagagtggac caccccatga acctcgattt 720
aaattccagg ttgtcatcaa tggccgagag tttcccccag ctgaagctgg aagcaagaaa 780
gtggccaagc aggatgcagc tatgaaagcc atgacaattc tgctagagga agccaaagcc 840
aaggacagtg gaaaatcaga agaatcatcc cactattcca cagagaaaga atcagagaag 900
actgcagagt cccagacccc caccccttca gccacatcct tcttttctgg gaagagcccc 960
gtcaccacac tgcttgagtg tatgcacaaa ttggggaact cctgcgaatt ccgtctcctg 1020
tccaaagaag gccctgccca tgaacccaag ttccaatact gtgttgcagt gggagcccaa 1080
actttcccca gtgtgagtgc tcccagcaag aaagtggcaa agcagatggc cgcagaggaa 1140
gccatgaagg ccctgcatgg ggaggcgacc aactccatgg cttctgataa ccagcctgaa 1200
ggtatgatct cagagtcact tgataacttg gaatccatga tgcccaacaa ggtcaggaag 1260
attggcgagc tcgtgagata cctgaacacc aaccctgtgg gtggcctttt ggagtacgcc 1320
cgctcccatg gctttgctgc tgaattcaag ttggtcgacc agtccggacc tcctcacgag 1380
cccaagttcg tttaccaagc aaaagttggg ggtcgctggt tcccagccgt ctgcgcacac 1440
agcaagaagc aaggcaagca ggaagcagca gatgcggctc tccgtgtctt gattggggag 1500
aacgagaagg cagaacgcat gggtttcaca gaggtaaccc cagtgacagg ggccagtctc 1560
agaagaacta tgctcctcct ctcaaggtcc ccagaagcac agccaaagac actccctctc 1620
actggcagca ccttccatga ccagatagcc atgctgagcc accggtgctt caacactctg 1680
actaacagct tccagccctc cttgctcggc cgcaagattc tggccgccat cattatgaaa 1740
aaagactctg aggacatggg tgtcgtcgtc agcttgggaa cagggaatcg ctgtgtaaaa 1800
ggagattctc tcagcctaaa aggagaaact gtcaatgact gccatgcaga aataatctcc 1860
cggagaggct tcatcaggtt tctctacagt gagttaatga aatacaactc ccagactgcg 1920
aaggatagta tatttgaacc tgctaaggga ggagaaaagc tccaaataaa aaagactgtg 1980
tcattccatc tgtatatcag cactgctccg tgtggagatg gcgccctctt tgacaagtcc 2040
tgcagcgacc gtgctatgga aagcacagaa tcccgccact accctgtctt cgagaatccc 2100
aaacaaggaa agctccgcac caaggtggag aacggagaag gcacaatccc tgtggaatcc 2160
agtgacattg tgcctacgtg ggatggcatt cggctcgggg agagactccg taccatgtcc 2220
tgtagtgaca aaatcctacg ctggaacgtg ctgggcctgc aaggggcact gttgacccac 2280
ttcctgcagc ccatttatct caaatctgtc acattgggtt accttttcag ccaagggcat 2340
ctgacccgtg ctatttgctg tcgtgtgaca agagatggga gtgcatttga ggatggacta 2400
cgacatccct ttattgtcaa ccaccccaag gttggcagag tcagcatata tgattccaaa 2460
aggcaatccg ggaagactaa ggagacaagc gtcaactggt gtctggctga tggctatgac 2520
ctggagatcc tggacggtac cagaggcact gtggatgggc cacggaatga attgtcccgg 2580
gtctccaaaa agaacatttt tcttctattt aagaagctct gctccttccg ttaccgcagg 2640
gatctactga gactctccta tggtgaggcc aagaaagctg cccgtgacta cgagacggcc 2700
aagaactact tcaaaaaagg cctgaaggat atgggctatg ggaactggat tagcaaaccc 2760
caggaggaaa agaactttta tctctgccca gtagattaca aggatgacga cgataagtag 2820
<210> 333
<211> 3705
<212> DNA
<213> 人工序列()
<400> 333
atgaatccgc ggcaggggta ttccctcagc ggatactaca cccatccatt tcaaggctat 60
gagcacagac agctcagata ccagcagcct gggccaggat cttcccccag tagtttcctg 120
cttaagcaaa tagaatttct caaggggcag ctcccagaag caccggtgat tggaaagcag 180
acaccgtcac tgccaccttc cctcccagga ctccggccaa ggtttccagt actacttgcc 240
tccagtacca gaggcaggca agtggacatc aggggtgtcc ccaggggcgt gcatctcgga 300
agtcaggggc tccagagagg gttccagcat ccttcaccac gtggcaggag tctgccacag 360
agaggtgttg attgcctttc ctcacatttc caggaactga gtatctacca agatcaggaa 420
caaaggatct taaagttcct ggaagagctt ggggaaggga aggccaccac agcacatgat 480
ctgtctggga aacttgggac tccgaagaaa gaaatcaatc gagttttata ctccctggca 540
aagaagggca agctacagaa agaggcagga acaccccctt tgtggaaaat cgcggtctcc 600
actcaggctt ggaaccagca cagcggagtg gtaagaccag acggtcatag ccaaggagcc 660
ccaaactcag acccgagttt ggaaccggaa gacagaaact ccacatctgt ctcagaagat 720
cttcttgagc cttttattgc agtctcagct caggcttgga accagcacag cggagtggta 780
agaccagaca gtcatagcca aggatcccca aactcagacc caggtttgga acctgaagac 840
agcaactcca catctgcctt ggaagatcct cttgagtttt tagacatggc cgagatcaag 900
gagaaaatct gcgactatct cttcaatgtg tctgactcct ctgccctgaa tttggctaaa 960
aatattggcc ttaccaaggc ccgagatata aatgctgtgc taattgacat ggaaaggcag 1020
ggggatgtct atagacaagg gacaacccct cccatatggc atttgacaga caagaagcga 1080
gagaggatgc aaatcaagag aaatacgaac agtgttcctg aaaccgctcc agctgcaatc 1140
cctgagacca aaagaaacgc agagttcctc acctgtaata tacccacatc aaatgcctca 1200
aataacatgg taaccacaga aaaagtggag aatgggcagg aacctgtcat aaagttagaa 1260
aacaggcaag aggccagacc agaaccagca agactgaaac cacctgttca ttacaatggc 1320
ccctcaaaag cagggtatgt tgactttgaa aatggccagt gggccacaga tgacatccca 1380
gatgacttga atagtatccg cgcagcacca ggtgagtttc gagccatcat ggagatgccc 1440
tccttctaca gtcatggctt gccacggtgt tcaccctaca agaaactgac agagtgccag 1500
ctgaagaacc ccatcagcgg gctgttagaa tatgcccagt tcgctagtca aacctgtgag 1560
ttcaacatga tagagcagag tggaccaccc catgaacctc gatttaaatt ccaggttgtc 1620
atcaatggcc gagagtttcc cccagctgaa gctggaagca agaaagtggc caagcaggat 1680
gcagctatga aagccatgac aattctgcta gaggaagcca aagccaagga cagtggaaaa 1740
tcagaagaat catcccacta ttccacagag aaagaatcag agaagactgc agagtcccag 1800
acccccaccc cttcagccac atccttcttt tctgggaaga gccccgtcac cacactgctt 1860
gagtgtatgc acaaattggg gaactcctgc gaattccgtc tcctgtccaa agaaggccct 1920
gcccatgaac ccaagttcca atactgtgtt gcagtgggag cccaaacttt ccccagtgtg 1980
agtgctccca gcaagaaagt ggcaaagcag atggccgcag aggaagccat gaaggccctg 2040
catggggagg cgaccaactc catggcttct gataaccagc ctgaaggtat gatctcagag 2100
tcacttgata acttggaatc catgatgccc aacaaggtca ggaagattgg cgagctcgtg 2160
agatacctga acaccaaccc tgtgggtggc cttttggagt acgcccgctc ccatggcttt 2220
gctgctgaat tcaagttggt cgaccagtcc ggacctcctc acgagcccaa gttcgtttac 2280
caagcaaaag ttgggggtcg ctggttccca gccgtctgcg cacacagcaa gaagcaaggc 2340
aagcaggaag cagcagatgc ggctctccgt gtcttgattg gggagaacga gaaggcagaa 2400
cgcatgggtt tcacagaggt aaccccagtg acaggggcca gtctcagaag aactatgctc 2460
ctcctctcaa ggtccccaga agcacagcca aagacactcc ctctcactgg cagcaccttc 2520
catgaccaga tagccatgct gagccaccgg tgcttcaaca ctctgactaa cagcttccag 2580
ccctccttgc tcggccgcaa gattctggcc gccatcatta tgaaaaaaga ctctgaggac 2640
atgggtgtcg tcgtcagctt gggaacaggg aatcgctgtg taaaaggaga ttctctcagc 2700
ctaaaaggag aaactgtcaa tgactgccat gcagaaataa tctcccggag aggcttcatc 2760
aggtttctct acagtgagtt aatgaaatac aactcccaga ctgcgaagga tagtatattt 2820
gaacctgcta agggaggaga aaagctccaa ataaaaaaga ctgtgtcatt ccatctgtat 2880
atcagcactg ctccgtgtgg agatggcgcc ctctttgaca agtcctgcag cgaccgtgct 2940
atggaaagca cagaatcccg ccactaccct gtcttcgaga atcccaaaca aggaaagctc 3000
cgcaccaagg tggagaacgg agaaggcaca atccctgtgg aatccagtga cattgtgcct 3060
acgtgggatg gcattcggct cggggagaga ctccgtacca tgtcctgtag tgacaaaatc 3120
ctacgctgga acgtgctggg cctgcaaggg gcactgttga cccacttcct gcagcccatt 3180
tatctcaaat ctgtcacatt gggttacctt ttcagccaag ggcatctgac ccgtgctatt 3240
tgctgtcgtg tgacaagaga tgggagtgca tttgaggatg gactacgaca tccctttatt 3300
gtcaaccacc ccaaggttgg cagagtcagc atatatgatt ccaaaaggca atccgggaag 3360
actaaggaga caagcgtcaa ctggtgtctg gctgatggct atgacctgga gatcctggac 3420
ggtaccagag gcactgtgga tgggccacgg aatgaattgt cccgggtctc caaaaagaac 3480
atttttcttc tatttaagaa gctctgctcc ttccgttacc gcagggatct actgagactc 3540
tcctatggtg aggccaagaa agctgcccgt gactacgaga cggccaagaa ctacttcaaa 3600
aaaggcctga aggatatggg ctatgggaac tggattagca aaccccagga ggaaaagaac 3660
ttttatctct gcccagtaga ttacaaggat gacgacgata agtag 3705
<210> 334
<211> 2130
<212> DNA
<213> 人工序列()
<400> 334
atggatatag aagatgaaga aaacatgagt tccagcagca ctgatgtgaa ggaaaaccgc 60
aatctggaca acgtgtcccc caaggatggc agcacacctg ggcctggcga gggctctcag 120
ctctccaatg ggggtggtgg tggccccggc agaaagcggc ccctggagga gggcagcaat 180
ggccactcca agtaccgcct gaagaaaagg aggaaaacac cagggcccgt cctccccaag 240
aacgccctga tgcagctgaa tgagatcaag cctggtttgc agtacacact cctgtcccag 300
actgggcccg tgcacgcgcc tttgtttgtc atgtctgtgg aggtgaatgg ccaggttttt 360
gagggctctg gtcccacaaa gaaaaaggca aaactccatg ctgctgagaa ggccttgagg 420
tctttcgttc agtttcctaa tgcctctgag gcccacctgg ccatggggag gaccctgtct 480
gtcaacacgg acttcacatc tgaccaggcc gacttccctg acacgctctt caatggtttt 540
gaaactcctg acaaggcgga gcctcccttt tacgtgggct ccaatgggga tgactccttc 600
agttccagcg gggacctcag cttgtctgct tccccggtgc ctgccagcct agcccagcct 660
cctctccctg ccttaccacc attcccaccc ccgagtggga agaatcccgt gatgatcttg 720
aacgaactgc gcccaggact caagtatgac ttcctctccg agagcgggga gagccatgcc 780
aagagcttcg tcatgtctgt ggtcgtggat ggtcagttct ttgaaggctc ggggagaaac 840
aagaagcttg ccaaggcccg ggctgcgcag tctgccctgg ccgccatttt taacttgcac 900
ttggatcaga cgccatctcg ccagcctatt cccagtgagg gtcttcagct gcatttaccg 960
caggttttag ctgacgctgt ctcacgcctg gtcctgggta agtttggtga cctgaccgac 1020
aacttctcct cccctcacgc tcgcagaaaa gtgctggctg gagtcgtcat gacaacaggc 1080
acagatgtta aagatgccaa ggtgataagt gtttctacag gaacaaaatg tattaatggt 1140
gaatacatga gtgatcgtgg ccttgcatta aatgactgcc atgcagaaat aatatctcgg 1200
agatccttgc tcagatttct ttatacacaa cttgagcttt acttaaataa caaagatgat 1260
caaaaaagat ccatctttca gaaatcagag cgaggggggt ttaggctgaa ggagaatgtc 1320
cagtttcatc tgtacatcag cacctctccc tgtggagatg ccagaatctt ctcaccacat 1380
gagccaatcc tggaagaacc agcagataga cacccaaatc gtaaagcaag aggacagcta 1440
cggaccaaaa tagagtctgg tgaggggacg attccagtgc gctccaatgc gagcatccaa 1500
acgtgggacg gggtgctgca aggggagcgg ctgctcacca tgtcctgcag tgacaagatt 1560
gcacgctgga acgtggtggg catccaggga tccctgctca gcattttcgt ggagcccatt 1620
tacttctcga gcatcatcct gggcagcctt taccacgggg accacctttc cagggccatg 1680
taccagcgga tctccaacat agaggacctg ccacctctct acaccctcaa caagcctttg 1740
ctcagtggca tcagcaatgc agaagcacgg cagccaggga aggcccccaa cttcagtgtc 1800
aactggacgg taggcgactc cgctattgag gtcatcaacg ccacgactgg gaaggatgag 1860
ctgggccgcg cgtcccgcct gtgtaagcac gcgttgtact gtcgctggat gcgtgtgcac 1920
ggcaaggttc cctcccactt actacgctcc aagattacca aacccaacgt gtaccatgag 1980
tccaagctgg cggcaaagga gtaccaggcc gccaaggcgc gtctgttcac agccttcatc 2040
aaggcggggc tgggggcctg ggtggagaag cccaccgagc aggaccagtt ctcactcacg 2100
cccgattaca aggatgacga cgataagtag 2130
<210> 335
<211> 4401
<212> DNA
<213> 人工序列()
<400> 335
atgatgagct ttgtgcaaaa ggggagctgg ctacttctcg ctctgcttca tcccactatt 60
attttggcac aacaggaagc tgttgaagga ggatgttccc atcttggtca gtcctatgcg 120
gatagagatg tctggaagcc agaaccatgc caaatatgtg tctgtgactc aggatccgtt 180
ctctgcgatg acataatatg tgacgatcaa gaattagact gccccaaccc agaaattcca 240
tttggagaat gttgtgcagt ttgcccacag cctccaactg ctcctactcg ccctcctaat 300
ggtcaaggac ctcaaggccc caagggagat ccaggccctc ctggtattcc tgggagaaat 360
ggtgaccctg gtattccagg acaaccaggg tcccctggtt ctcctggccc ccctggaatc 420
tgtgaatcat gccctactgg tcctcagaac tattctcccc agtatgattc atatgatgtc 480
aagtctggag tagcagtagg aggactcgca ggctatcctg gaccagctgg ccccccaggc 540
cctcccggtc cccctggtac atctggtcat cctggttccc ctggatctcc aggataccaa 600
ggaccccctg gtgaacctgg gcaagctggt ccttcaggcc ctccaggacc tcctggtgct 660
ataggtccat ctggtcctgc tggaaaagat ggagaatcag gtagacccgg acgacctgga 720
gagcgaggat tgcctggacc tccaggtatc aaaggtccag ctgggatacc tggattccct 780
ggtatgaaag gacacagagg cttcgatgga cgaaatggag aaaagggtga aacaggtgct 840
cctggattaa agggtgaaaa tggtcttcca ggcgaaaatg gagctcctgg acccatgggt 900
ccaagagggg ctcctggtga gcgaggacgg ccaggacttc ctggggctgc aggtgctcgg 960
ggtaatgacg gtgctcgagg cagtgatggt caaccaggcc ctcctggtcc tcctggaact 1020
gccggattcc ctggatcccc tggtgctaag ggtgaagttg gacctgcagg gtctcctggt 1080
tcaaatggtg cccctggaca aagaggagaa cctggacctc agggacacgc tggtgctcaa 1140
ggtcctcctg gccctcctgg gattaatggt agtcctggtg gtaaaggcga aatgggtccc 1200
gctggcattc ctggagctcc tggactgatg ggagcccggg gtcctccagg accagccggt 1260
gctaatggtg ctcctggact gcgaggtggt gcaggtgagc ctggtaagaa tggtgccaaa 1320
ggagagcccg gaccacgtgg tgaacgcggt gaggctggta ttccaggtgt tccaggagct 1380
aaaggcgaag atggcaagga tggatcacct ggagaacctg gtgcaaatgg gcttccagga 1440
gctgcaggag aaaggggtgc ccctgggttc cgaggacctg ctggaccaaa tggcatccca 1500
ggagaaaagg gtcctgctgg agagcgtggt gctccaggcc ctgcagggcc cagaggagct 1560
gctggagaac ctggcagaga tggcgtccct ggaggtccag gaatgagggg catgcccgga 1620
agtccaggag gaccaggaag tgatgggaaa ccagggcctc ccggaagtca aggagaaagt 1680
ggtcgaccag gtcctcctgg gccatctggt ccccgaggtc agcctggtgt catgggcttc 1740
cccggtccta aaggaaatga tggtgctcct ggtaagaatg gagaacgagg tggccctgga 1800
ggacctggcc ctcagggtcc tcctggaaag aatggtgaaa ctggacctca gggaccccca 1860
gggcctactg ggcctggtgg tgacaaagga gacacaggac cccctggtcc acaaggatta 1920
caaggcttgc ctggtacagg tggtcctcca ggagaaaatg gaaaacctgg ggaaccaggt 1980
ccaaagggtg atgccggtgc acctggagct ccaggaggca agggtgatgc tggtgcccct 2040
ggtgaacgtg gacctcctgg attggcaggg gccccaggac ttagaggtgg agctggtccc 2100
cctggtcccg aaggaggaaa gggtgctgct ggtcctcctg ggccacctgg tgctgctggt 2160
actcctggtc tgcaaggaat gcctggagaa agaggaggtc ttggaagtcc tggtccaaag 2220
ggtgacaagg gtgaaccagg cggtccaggt gctgatggtg tcccagggaa agatggccca 2280
aggggtccta ctggtcctat tggtcctcct ggcccagctg gccagcctgg agataagggt 2340
gaaggtggtg cccccggact tccaggtata gctggacctc gtggtagccc tggtgagaga 2400
ggtgaaactg gccctccagg acctgctggt ttccctggtg ctcctggaca gaatggtgaa 2460
cctggtggta aaggagaaag aggggctccg ggtgagaaag gtgaaggagg ccctcctgga 2520
gttgcaggac cccctggagg ttctggacct gctggtcctc ctggtcccca aggtgtcaaa 2580
ggtgaacgtg gcagtcctgg tggacctggt gctgctggct tccctggtgc tcgtggtctt 2640
cctggtcctc ctggtagtaa tggtaaccca ggacccccag gtcccagcgg ttctccaggc 2700
aaggatgggc ccccaggtcc tgcgggtaac actggtgctc ctggcagccc tggagtgtct 2760
ggaccaaaag gtgatgctgg ccaaccagga gagaagggat cgcctggtgc ccagggccca 2820
ccaggagctc caggcccact tgggattgct gggatcactg gagcacgggg tcttgcagga 2880
ccaccaggca tgccaggtcc taggggaagc cctggccctc agggtgtcaa gggtgaaagt 2940
gggaaaccag gagctaacgg tctcagtgga gaacgtggtc cccctggacc ccagggtctt 3000
cctggtctgg ctggtacagc tggtgaacct ggaagagatg gaaaccctgg atcagatggt 3060
cttccaggcc gagatggatc tcctggtggc aagggtgatc gtggtgaaaa tggctctcct 3120
ggtgcccctg gcgctcctgg tcatccaggc ccacctggtc ctgtcggtcc agctggaaag 3180
agtggtgaca gaggagaaag tggccctgct ggccctgctg gtgctcccgg tcctgctggt 3240
tcccgaggtg ctcctggtcc tcaaggccca cgtggtgaca aaggtgaaac aggtgaacgt 3300
ggagctgctg gcatcaaagg acatcgagga ttccctggta atccaggtgc cccaggttct 3360
ccaggccctg ctggtcagca gggtgcaatc ggcagtccag gacctgcagg ccccagagga 3420
cctgttggac ccagtggacc tcctggcaaa gatggaacca gtggacatcc aggtcccatt 3480
ggaccaccag ggcctcgagg taacagaggt gaaagaggat ctgagggctc cccaggccac 3540
ccagggcaac caggccctcc tggacctcct ggtgcccctg gtccttgctg tggtggtgtt 3600
ggagccgctg ccattgctgg gattggaggt gaaaaagctg gcggttttgc cccgtattat 3660
ggagatgaac caatggattt caaaatcaac accgatgaga ttatgacttc actcaagtct 3720
gttaatggac aaatagaaag cctcattagt cctgatggtt ctcgtaaaaa ccccgctaga 3780
aactgcagag acctgaaatt ctgccatcct gaactcaaga gtggagaata ctgggttgac 3840
cctaaccaag gatgcaaatt ggatgctatc aaggtattct gtaatatgga aactggggaa 3900
acatgcataa gtgccaatcc tttgaatgtt ccacggaaac actggtggac agattctagt 3960
gctgagaaga aacacgtttg gtttggagag tccatggatg gtggttttca gtttagctac 4020
ggcaatcctg aacttcctga agatgtcctt gatgtgcagc tggcattcct tcgacttctc 4080
tccagccgag cttcccagaa catcacatat cactgcaaaa atagcattgc atacatggat 4140
caggccagtg gaaatgtaaa gaaggccctg aagctgatgg ggtcaaatga aggtgaattc 4200
aaggctgaag gaaatagcaa attcacctac acagttctgg aggatggttg cacgaaacac 4260
actggggaat ggagcaaaac agtctttgaa tatcgaacac gcaaggctgt gagactacct 4320
attgtagata ttgcacccta tgacattggt ggtcctgatc aagaatttgg tgtggacgtt 4380
ggccctgttt gctttttata a 4401
<210> 336
<211> 3117
<212> DNA
<213> 人工序列()
<400> 336
atgacttcct cgctgcagcg gccctggcgg gtgccctggc taccatggac catcctgctg 60
gtcagcgctg cggctgcttc gcagaatcaa gaacggctat gtgcgtttaa agatccgtat 120
cagcaagacc ttgggatagg tgagagtaga atctctcatg aaaatgggac aatattatgc 180
tcgaaaggta gcacctgcta tggcctttgg gagaaatcaa aaggggacat aaatcttgta 240
aaacaaggat gttggtctca cattggagat ccccaagagt gtcactatga agaatgtgta 300
gtaactacca ctcctccctc aattcagaat ggaacatacc gtttctgctg ttgtagcaca 360
gatttatgta atgtcaactt tactgagaat tttccacctc ctgacacaac accactcagt 420
ccacctcatt catttaaccg agatgagaca ataatcattg ctttggcatc agtctctgta 480
ttagctgttt tgatagttgc cttatgcttt ggatacagaa tgttgacagg agaccgtaaa 540
caaggtcttc acagtatgaa catgatggag gcagcagcat ccgaaccctc tcttgatcta 600
gataatctga aactgttgga gctgattggc cgaggtcgat atggagcagt atataaaggc 660
tccttggatg agcgtccagt tgctgtaaaa gtgttttcct ttgcaaaccg tcagaatttt 720
atcaacgaaa agaacattta cagagtgcct ttgatggaac atgacaacat tgcccgcttt 780
atagttggag atgagagagt cactgcagat ggacgcatgg aatatttgct tgtgatggag 840
tactatccca atggatcttt atgcaagtat ttaagtctcc acacaagtga ctgggtaagc 900
tcttgccgtc ttgctcattc tgttactaga ggactggctt atcttcacac agaattacca 960
cgaggagatc attataaacc tgcaatttcc catcgagatt taaacagcag aaatgtccta 1020
gtgaaaaatg atggaacctg tgttattagt gactttggac tgtccatgag gctgactgga 1080
aatagactgg tgcgcccagg ggaggaagat aatgcagcca taagcgaggt tggcactatc 1140
agatatatgg caccagaagt gctagaagga gctgtgaact tgagggactg tgaatcagct 1200
ttgaaacaag tagacatgta tgctcttgga ctaatctatt gggagatatt tatgagatgt 1260
acagacctct tcccagggga atccgtacca gagtaccaga tggcttttca gacagaggtt 1320
ggaaaccatc ccacttttga ggatatgcag gttctcgtgt ctagggaaaa acagagaccc 1380
aagttcccag aagcctggaa agaaaatagc ctggcagtga ggtcactcaa ggagacaatc 1440
gaagactgtt gggaccagga tgcagaggct cggcttactg cacagtgtgc tgaggaaagg 1500
atggctgaac ttatgatgat ttgggaaaga aacaaatctg tgagcccaac agtcaatcca 1560
atgtctactg ctatgcagaa tgaacgcaac ctgtcacata ataggcgtgt gccaaaaatt 1620
ggtccttatc cagattattc ttcctcctca tacattgaag actctatcca tcatactgac 1680
agcatcgtga agaatatttc ctctgagcat tctatgtcca gcacaccttt gactataggg 1740
gaaaaaaacc gaaattcaat taactatgaa cgacagcaag cacaagctcg aatccccagc 1800
cctgaaacaa gtgtcaccag cctctccacc aacacaacaa ccacaaacac cacaggactc 1860
acgccaagta ctggcatgac tactatatct gagatgccat acccagatga aacaaatctg 1920
cataccacaa atgttgcaca gtcaattggg ccaacccctg tctgcttaca gctgacagaa 1980
gaagacttgg aaaccaacaa gctagaccca aaagaagttg ataagaacct caaggaaagc 2040
tctgatgaga atctcatgga gcactctctt aaacagttca gtggcccaga cccactgagc 2100
agtactagtt ctagcttgct ttacccactc ataaaacttg cagtagaagc aactggacag 2160
caggacttca cacagactgc aaatggccaa gcatgtttga ttcctgatgt tctgcctact 2220
cagatctatc ctctccccaa gcagcagaac cttcccaaga gacctactag tttgcctttg 2280
aacaccaaaa attcaacaaa agagccccgg ctaaaatttg gcagcaagca caaatcaaac 2340
ttgaaacaag tcgaaactgg agttgccaag atgaatacaa tcaatgcagc agaacctcat 2400
gtggtgacag tcaccatgaa tggtgtggca ggtagaaacc acagtgttaa ctcccatgct 2460
gccacaaccc aatatgccaa tgggacagta ctatctggcc aaacaaccaa catagtgaca 2520
catagggccc aagaaatgtt gcagaatcag tttattggtg aggacacccg gctgaatatt 2580
aattccagtc ctgatgagca tgagccttta ctgagacgag agcaacaagc tggccatgat 2640
gaaggtgttc tggatcgtct tgtggacagg agggaacggc cactagaagg tggccgaact 2700
aattccaata acaacaacag caatccatgt tcagaacaag atgttcttgc acagggtgtt 2760
ccaagcacag cagcagatcc tgggccatca aagcccagaa gagcacagag gcctaattct 2820
ctggatcttt cagccacaaa tgtcctggat ggcagcagta tacagatagg tgagtcaaca 2880
caagatggca aatcaggatc aggtgaaaag atcaagaaac gtgtgaaaac tccctattct 2940
cttaagcggt ggcgcccctc cacctgggtc atctccactg aatcgctgga ctgtgaagtc 3000
aacaataatg gcagtaacag ggcagttcat tccaaatcca gcactgctgt ttaccttgca 3060
gaaggaggca ctgctacaac catggtgtct aaagatatag gaatgaactg tctgtga 3117
<210> 337
<211> 3590
<212> DNA
<213> 人工序列()
<400> 337
atgcctacag ctgagagtga agcaaaagta aaaaccaaag ttcgctttga agaattgctt 60
aagacccaca gtgatctaat gcgtgaaaag aaaaaactga agaaaaaact tgtcaggtct 120
gaagaaaaca tctcacctga cactattaga agcaatcttc actatatgaa agaaactaca 180
agtgatgatc ccgacactat tagaagcaat cttccccata ttaaagaaac tacaagtgat 240
gatgtaagtg ctgctaacac taacaacctg aagaagagca cgagagtcac taaaaacaaa 300
ttgaggaaca cacagttagc aactgaaaat cctaatggtg atgctagtgt agaggaagac 360
aaacaaggaa agccaaataa aaaggtgata aagacggtgc cccagttgac tacacaagac 420
ctgaaaccgg aaactcctga gaataaggtt gattctacac accagaaaac acatacaaag 480
ccacagccag gcgttgatca tcagaaaagt gagaaggcaa atgagggaag agaagagact 540
gatttagaag aggatgaaga attgatgcaa gcatatcagt gccatgtaac tgaagaaatg 600
gcaaaggaga ttaagaggaa aataagaaag aaactgaaag aacagttgac ttactttccc 660
tcagatactt tattccatga tgacaaacta agcagtgaaa aaaggaaaaa gaaaaaggaa 720
gttccagtct tctctaaagc tgaaacaagt acattgacca tctctggtga cacagttgaa 780
ggtgaacaaa agaaagaatc ttcagttaga tcagtttctt cagattctca tcaagatgat 840
gaaataagct caatggaaca aagcacagaa gacagcatgc aagatgatac aaaacctaaa 900
ccaaaaaaaa caaaaaagaa gactaaagca gttgcagata ataatgaaga tgttgatggt 960
gatggtgttc atgaaataac aagccgagat agcccggttt atcccaaatg tttgcttgat 1020
gatgaccttg tcttgggagt ttacattcac cgaactgata gacttaagtc agattttatg 1080
atttctcacc caatggtaaa aattcatgtg gttgatgagc atactggtca atatgtcaag 1140
aaagatgata gtggacggcc tgtttcatct tactatgaaa aagagaatgt ggattatatt 1200
cttcctatta tgacccagcc atatgatttt aaacagttaa aatcaagact tccagagtgg 1260
gaagaacaaa ttgtatttaa tgaaaatttt ccctatttgc ttcgaggctc tgatgagagt 1320
cctaaagtca tcctgttctt tgagattctt gatttcttaa gcgtggatga aattaagaat 1380
aattctgagg ttcaaaacca agaatgtggc tttcggaaaa ttgcctgggc atttcttaag 1440
cttctgggag ccaatggaaa tgcaaacatc aactcaaaac ttcgcttgca gctatattac 1500
ccacctacta agcctcgatc cccattaagt gttgttgagg catttgaatg gtggtcaaaa 1560
tgtccaagaa atcattaccc atcaacactg tacgtaactg taagaggact gaaagttcca 1620
gactgtataa agccatctta ccgctctatg atggctcttc aggaggaaaa aggtaaacca 1680
gtgcattgtg aacgtcacca tgagtcaagc tcagtagaca cagaacctgg attagaagag 1740
tcaaaggaag taataaagtg gaaacgactc cctgggcagg cttgccgtat cccaaacaaa 1800
cacctcttct cactaaatgc aggagaacga ggatgttttt gtcttgattt ctcccacaat 1860
ggaagaatat tagcagcagc ttgtgccagc cgggatggat atccaattat tttatatgaa 1920
attccttctg gacgtttcat gagagaattg tgtggccacc tcaatatcat ttatgatctt 1980
tcctggtcaa aagatgatca ctacatcctt acttcatcat ctgatggcac tgccaggata 2040
tggaaaaatg aaataaacaa tacaaatact ttcagagttt tacctcatcc ttcttttgtt 2100
tacacggcta aattccatcc agctgtaaga gagctagtag ttacaggatg ctatgattcc 2160
atgatacgga tatggaaagt tgagatgaga gaagattctg ccatattggt ccgacagttt 2220
gacgttcaca aaagttttat caactcactt tgttttgata ctgaaggtca tcatatgtat 2280
tcaggagatt gtacaggggt gattgttgtt tggaatacct atgtcaagat taatgatttg 2340
gaacattcag tgcaccactg gactataaat aaggaaatta aagaaactga gtttaaggga 2400
attccaataa gttatttgga gattcatccc aatggaaaac gtttgttaat ccataccaaa 2460
gacagtactt tgagaattat ggatctccgg atattagtag caaggaagtt tgtaggagca 2520
gcaaattatc gggagaagat tcatagtact ttgactccat gtgggacttt tctgtttgct 2580
ggaagtgagg atggtatagt gtatgtttgg aacccagaaa caggagaaca agtagccatg 2640
tattctgact tgccattcaa gtcacccatt cgagacattt cttatcatcc atttgaaaat 2700
atggttgcat tctgtgcatt tgggcaaaat gagccaattc ttctgtatat ttacgatttc 2760
catgttgccc agcaggaggc tgaaatgttc aaacgctaca atggaacatt tccattacct 2820
ggaatacacc aaagtcaaga tgccctatgt acctgtccaa aactacccca tcaaggctct 2880
tttcagattg atgaatttgt ccacactgaa agttcttcaa cgaagatgca gctagtaaaa 2940
cagaggcttg aaactgtcac agaggtgata cgttcctgtg ctgcaaaagt caacaaaaat 3000
ctctcattta cttcaccacc agcagtttcc tcacaacagt ctaagttaaa gcagtcaaac 3060
atgctgaccg ctcaagagat tctacatcag tttggtttca ctcagaccgg gattatcagc 3120
atagaaagaa agccttgtaa ccatcaggta gatacagcac caacggtagt ggctctttat 3180
gactacacag cgaatcgatc agatgaacta accatccatc gcggagacat tatccgagtg 3240
tttttcaaag ataatgaaga ctggtggtat ggcagcatag gaaagggaca ggaaggttat 3300
tttccagcta atcatgtggc tagtgaaaca ctgtatcaag aactgcctcc tgagataaag 3360
gagcgatccc ctcctttaag ccctgaggaa aaaactaaaa tagaaaaatc tccagctcct 3420
caaaagcaat caatcaataa gaacaagtcc caggacttca gactaggctc agaatctatg 3480
acacattctg aaatgagaaa agaacagagc catgaggacc aaggacacat aatggataca 3540
cggatgagga agaacaagca agcaggcaga aaagtcactc taatagagta 3590
<210> 338
<211> 1677
<212> DNA
<213> 人工序列()
<400> 338
atggctcaag attcagtaga tctttcttgt gattatcagt tttggatgca gaagctttct 60
gtatgggatc aggcttccac tttggaaacc cagcaagaca cctgtcttca cgtggctcag 120
ttccaggagt tcctaaggaa gatgtatgaa gccttgaaag agatggattc taatacagtc 180
attgaaagat tccccacaat tggtcaactg ttggcaaaag cttgttggaa tccttttatt 240
ttagcatatg atgaaagcca aaaaattcta atatggtgct tatgttgtct aattaacaaa 300
gaaccacaga attctggaca atcaaaactt aactcctgga tacagggtgt attatctcat 360
atactttcag cactcagatt tgataaagaa gttgctcttt tcactcaagg tcttgggtat 420
gcacctatag attactatcc tggtttgctt aaaaatatgg ttttatcatt agcgtctgaa 480
ctcagagaga atcatcttaa tggatttaac actcaaaggc gaatggctcc cgagcgagtg 540
gcgtccctgt cacgagtttg tgtcccactt attaccctga cagatgttga ccccctggtg 600
gaggctctcc tcatctgtca tggacgtgaa cctcaggaaa tcctccagcc agagttcttt 660
gaggctgtaa acgaggccat tttgctgaag aagatttctc tccccatgtc agctgtagtc 720
tgcctctggc ttcggcacct tcccagcctt gaaaaagcaa tgctgcatct ttttgaaaag 780
ctaatctcca gtgagagaaa ttgtctgaga aggatcgaat gctttataaa agattcatcg 840
ctgcctcaag cagcctgcca ccctgccata ttccgggttg ttgatgagat gttcaggtgt 900
gcactcctgg aaaccgatgg ggccctggaa atcatagcca ctattcaggt gtttacgcag 960
tgctttgtag aagctctgga gaaagcaagc aagcagctgc ggtttgcact caagacctac 1020
tttccttaca cttctccatc tcttgccatg gtgctgctgc aagaccctca agatatccct 1080
cggggacact ggctccagac actgaagcat atttctgaac tgctcagaga agcagttgaa 1140
gaccagactc atgggtcctg cggaggtccc tttgagagct ggttcctgtt cattcacttc 1200
ggaggatggg ctgagatggt ggcagagcaa ttactgatgt cggcagccga accccccacg 1260
gccctgctgt ggctcttggc cttctactac ggcccccgtg atgggaggca gcagagagca 1320
cagactatgg tccaggtgaa ggccgtgctg ggccacctcc tggcaatgtc cagaagcagc 1380
agcctctcag cccaggacct gcagacggta gcaggacagg gcacagacac agacctcaga 1440
gctcctgcac aacagctgat caggcacctt ctcctcaact tcctgctctg ggctcctgga 1500
ggccacacga tcgcctggga tgtcatcacc ctgatggctc acactgctga gataactcac 1560
gagatcattg gctttcttga ccagaccttg tacagatgga atcgtcttgg cattgaaagc 1620
cctagatcag aaaaactggc ccgagagctc cttaaagagc tgcgaactca agtctag 1677
<210> 339
<211> 3825
<212> DNA
<213> 人工序列()
<400> 339
atgcctgagc cggggaagaa gccagtctca gcttttagca agaagccacg gtcagtggaa 60
gtggccgcag gcagccctgc cgtgttcgag gccgagacag agcgggcagg agtgaaggtg 120
cgctggcagc gcggaggcag tgacatcagc gccagcaaca agtacggcct ggccacagag 180
ggcacacggc atacgctgac agtgcgggaa gtgggccctg ccgaccaggg atcttacgca 240
gtcattgctg gctcctccaa ggtcaagttc gacctcaagg tcatagaggc agagaaggca 300
gagcccatgc tggcccctgc ccctgcccct gctgaggcca ctggagcccc tggagaagcc 360
ccggccccag ccgctgagct gggagaaagt gccccaagtc ccaaagggtc aagctcagca 420
gctctcaatg gtcctacccc tggagccccc gatgacccca ttggcctctt cgtgatgcgg 480
ccacaggatg gcgaggtgac cgtgggtggc agcatcacct tctcagcccg cgtggccggc 540
gccagcctcc tgaagccgcc tgtggtcaag tggttcaagg gcaaatgggt ggacctgagc 600
agcaaggtgg gccagcacct gcagctgcac gacagctacg accgcgccag caaggtctat 660
ctgttcgagc tgcacatcac cgatgcccag cctgccttca ctggcagcta ccgctgtgag 720
gtgtccacca aggacaaatt tgactgctcc aacttcaatc tcactgtcca cgaggccatg 780
ggcaccggag acctggacct cctatcagcc ttccgccgca cgagcctggc tggaggtggt 840
cggcggatca gtgatagcca tgaggacact gggattctgg acttcagctc actgctgaaa 900
aagagagaca gtttccggac cccgagggac tcgaagctgg aggcaccagc agaggaggac 960
gtgtgggaga tcctacggca ggcaccccca tctgagtacg agcgcatcgc cttccagtac 1020
ggcgtcactg acctgcgcgg catgctaaag aggctcaagg gcatgaggcg cgatgagaag 1080
aagagcacag cctttcagaa gaagctggag ccggcctacc aggtgagcaa aggccacaag 1140
atccggctga ccgtggaact ggctgaccat gacgctgagg tcaaatggct caagaatggc 1200
caggagatcc agatgagcgg cagcaagtac atctttgagt ccatcggtgc caagcgtacc 1260
ctgaccatca gccagtgctc attggcggac gacgcagcct accagtgcgt ggtgggtggc 1320
gagaagtgta gcacggagct ctttgtgaaa gagccccctg tgctcatcac gcgccccttg 1380
gaggaccagc tggtgatggt ggggcagcgg gtggagtttg agtgtgaagt atcggaggag 1440
ggggcgcaag tcaaatggct gaaggacggg gtggagctga cccgggagga gaccttcaaa 1500
taccggttca agaaggacgg gcagagacac cacctgatca tcaacgaggc catgctggag 1560
gacgcggggc actatgcact gtgcactagc gggggccagg cgctggctga gctcattgtg 1620
caggaaaaga agctggaggt gtaccagagc atcgcagacc tgatggtggg cgcaaaggac 1680
caggcggtgt tcaaatgtga ggtctcagat gagaatgttc ggggtgtgtg gctgaagaat 1740
gggaaggagc tggtgcccga cagccgcata aaggtgtccc acatcgggcg ggtccacaaa 1800
ctgaccattg acgacgtcac acctgccgac gaggctgact acagctttgt gcccgagggc 1860
ttcgcctgca acctgtcagc caagctccac ttcatggagg tcaagattga cttcgtaccc 1920
aggcaggaac ctcccaagat ccacctggac tgcccaggcc gcataccaga caccattgtg 1980
gttgtagctg gaaataagct acgtctggac gtccctatct ctggggaccc tgctcccact 2040
gtgatctggc agaaggctat cacgcagggg aataaggccc cagccaggcc agccccagat 2100
gccccagagg acacaggtga cagcgatgag tgggtgtttg acaagaagct gctgtgtgag 2160
accgagggcc gggtccgcgt ggagaccacc aaggaccgca gcatcttcac ggtcgagggg 2220
gcagagaagg aagatgaggg cgtctacacg gtcacagtga agaaccctgt gggcgaggac 2280
caggtcaacc tcacagtcaa ggtcatcgac gtgccagacg cacctgcggc ccccaagatc 2340
agcaacgtgg gagaggactc ctgcacagta cagtgggagc cgcctgccta cgatggcggg 2400
cagcccatcc tgggctacat cctggagcgc aagaagaaga agagctaccg gtggatgcgg 2460
ctgaacttcg acctgattca ggagctgagt catgaagcgc ggcgcatgat cgagggcgtg 2520
gtgtacgaga tgcgcgtcta cgcggtcaac gccatcggca tgtccaggcc cagccctgcc 2580
tcccagccct tcatgcctat cggtcccccc agcgaaccca cccacctggc agtagaggac 2640
gtctctgaca ccacggtctc cctcaagtgg cggcccccag agcgcgtggg agcaggaggc 2700
ctggatggct acagcgtgga gtactgccca gagggctgct cagagtgggt ggctgccctg 2760
caggggctga cagagcacac atcgatactg gtgaaggacc tgcccacggg ggcccggctg 2820
cttttccgag tgcgggcaca caatatggca gggcctggag cccctgttac caccacggag 2880
ccggtgacag tgcaggagat cctgcaacgg ccacggcttc agctgcccag gcacctgcgc 2940
cagaccattc agaagaaggt cggggagcct gtgaaccttc tcatcccttt ccagggcaag 3000
ccccggcctc aggtgacctg gaccaaagag gggcagcccc tggcaggcga ggaggtgagc 3060
atccgcaaca gccccacaga caccatcctg ttcatccggg ccgctcgccg cgtgcattca 3120
ggcacttacc aggtgacggt gcgcattgag aacatggagg acaaggccac gctggtgctg 3180
caggttgttg acaagccaag tcctccccag gatctccggg tgactgacgc ctggggtctt 3240
aatgtggctc tggagtggaa gccaccccag gatgtcggca acacggagct ctgggggtac 3300
acagtgcaga aagccgacaa gaagaccatg gagtggttca ccgtcttgga gcattaccgc 3360
cgcacccact gcgtggtgcc agagctcatc attggcaatg gctactactt ccgcgtcttc 3420
agccagaata tggttggctt tagtgacaga gcggccacca ccaaggagcc cgtctttatc 3480
cccagaccag gcatcaccta tgagccaccc aactataagg ccctggactt ctccgaggcc 3540
ccaagcttca cccagcccct ggtgaaccgc tcggtcatcg cgggctacac tgctatgctc 3600
tgctgtgctg tccggggtag ccccaagccc aagatttcct ggttcaagaa tggcctggac 3660
ctgggagaag acgcccgctt ccgcatgttc agcaagcagg gagtgttgac tctggagatt 3720
agaaagccct gcccctttga cgggggcatc tatgtctgca gggccaccaa cttacagggc 3780
gaggcacggt gtgagtgccg cctggaggtg cgagtgcctc agtga 3825
<210> 340
<211> 1110
<212> DNA
<213> 人工序列()
<400> 340
atgttgaagc catcattacc attcacatcc ctcttattcc tgcagctgcc cctgctggga 60
gtggggctga acacgacaat tctgacgccc aatgggaatg aagacaccac agctgatttc 120
ttcctgacca ctatgcccac tgactccctc agtgtttcca ctctgcccct cccagaggtt 180
cagtgttttg tgttcaatgt cgagtacatg aattgcactt ggaacagcag ctctgagccc 240
cagcctacca acctcactct gcattattgg tacaagaact cggataatga taaagtccag 300
aagtgcagcc actatctatt ctctgaagaa atcacttctg gctgtcagtt gcaaaaaaag 360
gagatccacc tctaccaaac atttgttgtt cagctccagg acccacggga acccaggaga 420
caggccacac agatgctaaa actgcagaat ctggtgatcc cctgggctcc agagaaccta 480
acacttcaca aactgagtga atcccagcta gaactgaact ggaacaacag attcttgaac 540
cactgtttgg agcacttggt gcagtaccgg actgactggg accacagctg gactgaacaa 600
tcagtggatt atagacataa gttctccttg cctagtgtgg atgggcagaa acgctacacg 660
tttcgtgttc ggagccgctt taacccactc tgtggaagtg ctcagcattg gagtgaatgg 720
agccacccaa tccactgggg gagcaatact tcaaaagaga atcctttcct gtttgcattg 780
gaagccgtgg ttatctctgt tggctccatg ggattgatta tcagccttct ctgtgtgtat 840
ttctggctgg aacggacgat gccccgaatt cccaccctga agaacctaga ggatcttgtt 900
actgaatacc acgggaactt ttcggcctgg agtggtgtgt ctaagggact ggctgagagt 960
ctgcagccag actacagtga acgactctgc ctcgtcagtg agattccccc aaaaggaggg 1020
gcccttgggg aggggcctgg ggcctcccca tgcaaccagc atagccccta ctgggccccc 1080
ccatgttaca ccctaaagcc tgaaacctga 1110
<210> 341
<211> 151
<212> DNA
<213> 人工序列()
<400> 341
gggtgatggg tgctggccag gacacccact gtatgattgc tgtccaacac agccccagcc 60
tttgagacct ctgcccagag ttgttctcca tccaacaggg ccatgagccc catgactgtg 120
agtactggct ttcgcagcaa ctgcacatgg g 151
<210> 342
<211> 151
<212> DNA
<213> 人工序列()
<400> 342
actacagttg ctccgatatt taggctacgt caataggcac taacttattg gcgctggtga 60
acggacttcc tctcgagtac cagaagatga ctacaaaact cctttccatt gcgagtatcg 120
gagtctggct cagtttggcc agggaggcac t 151
<210> 343
<211> 71
<212> RNA
<213> 人工序列()
<400> 343
gucaaggcac ucuugccuac gccaccagcu ccaaccacca caaguuuaua uucagucauu 60
uucagcaggc c 71
Claims (47)
1.一种编辑宿主细胞中靶标RNA的方法,包含将脱氨酶募集RNA(dRNA)或编码所述dRNA的构建体引入所述宿主细胞,其中所述dRNA包含与所述靶标RNA杂交的互补RNA序列,并且其中所述dRNA能够募集作用于RNA的腺苷脱氨酶(ADAR)以使所述靶标RNA中的靶标腺苷脱氨基。
2.如权利要求1所述的方法,其中所述dRNA的长度大于70个核苷酸。
3.如权利要求2所述的方法,其中所述dRNA的长度为约100至约150个核苷酸。
4.如权利要求1-3中任一项所述的方法,其中所述ADAR由所述宿主细胞内源表达。
5.如权利要求1-4中任一项所述的方法,其中所述宿主细胞是原代细胞。
6.如权利要求5所述的方法,其中所述宿主细胞是T细胞。
7.如权利要求1-6中任一项所述的方法,其中所述dRNA不包含ADAR募集结构域。
8.如权利要求1-7中任一项所述的方法,其中所述dRNA不包含化学修饰的核苷酸。
9.如权利要求8所述的方法,其包括将编码所述dRNA的构建体引入所述宿主细胞,其中所述构建体是病毒载体或质粒。
10.如权利要求1-9中任一项所述的方法,其中所述RNA序列包含与所述靶标RNA中的所述靶腺苷正对的胞苷、腺苷或尿苷。
11.如权利要求10所述的方法,其中所述RNA序列包含与所述靶标RNA中的所述靶腺苷正对的胞苷错配。
12.如权利要求11所述的方法,其中所述胞苷错配位于所述dRNA中距所述互补序列的3'端至少20个核苷酸,并且距所述互补序列的5'端至少5个核苷酸。
13.如权利要求12所述的方法,其中所述胞苷错配位于所述dRNA中所述互补序列中心的10个核苷酸内。
14.如权利要求1至13中任一项所述的方法,其中所述互补序列还包含一个或多个鸟苷,其各自与所述靶标RNA中的非靶腺苷相对。
15.如权利要求1至14中任一项所述的方法,其中所述互补序列包含与所述靶标RNA中的非靶腺苷相对的两个或更多个连续错配核苷酸。
16.如权利要求1-15中任一项所述的方法,其中所述靶标RNA中所述靶标腺苷的5'侧最近邻位是选自U,C,A和G的核苷酸,优先度U>C≈A>G,而所述靶标RNA中所述靶标腺苷的3'侧最近邻位是选自G,C,A和U的核苷酸,优先度G>C>A≈U。
17.如权利要求1-16中任一项所述的方法,其中所述靶标RNA中的所述靶标腺苷位于选自由UAG,UAC,UAA,UAU,CAG,CAC,CAA,CAU,AAG,AAC,AAA,AAU,GAG,GAC,GAA和GAU构成的组的三碱基基序中。
18.如权利要求17所述的方法,其中所述三碱基基序是UAG,并且其中所述dRNA包含与所述三碱基基序中的尿苷正对的A,与所述靶标腺苷正对的胞苷,以及与所述三碱基基序中的鸟苷正对的胞苷、鸟苷或尿苷。
19.如权利要求1-18中任一项所述的方法,其中所述靶标RNA是选自由前信使RNA,信使RNA,核糖体RNA,转移RNA,长非编码RNA和小RNA构成的组的RNA。
20.如权利要求19所述的方法,其中所述靶标RNA是前信使RNA。
21.如权利要求1至20中任一项所述的方法,其进一步包括将ADAR3的抑制剂引入所述宿主细胞。
22.如权利要求1-21中任一项所述的方法,其进一步包括将干扰素的刺激物引入所述宿主细胞。
23.如权利要求1-22中任一项所述的方法,其包括引入分别靶向不同靶标RNA的多个dRNA。
24.如权利要求1至23中任一项所述的方法,其中编辑所述靶标RNA的效率为至少5%。
25.如权利要求1至24中任一项所述的方法,其中所述dRNA不诱导免疫应答。
26.如权利要求1至25中任一项所述的方法,其进一步包括将外源ADAR引入所述宿主细胞。
27.如权利要求26所述的方法,其中所述ADAR是包含E1008突变的ADAR1。
28.如权利要求1-27中任一项所述的方法,其中靶标RNA中的靶标腺苷的脱氨基作用导致所述靶标RNA中的错义突变,过早的终止密码子,异常剪接或可变剪接,或者所述靶标RNA中的错义突变,过早的终止密码子,异常剪接或可变剪接的回复。
29.如权利要求28所述的方法,其中所述靶标RNA中的靶标腺苷的脱氨基作用导致由所述靶标RNA编码的蛋白质的点突变、截短、延伸和/或错误折叠;或者凭借所述靶标RNA中的错义突变、过早的终止密码子、异常剪接或可变剪接的回复导致有功能的、全长的、正确折叠的和/或野生型的蛋白。
30.如权利要求1-29中任一项所述的方法,其中所述宿主细胞是真核细胞。
31.如权利要求30所述的方法,其中所述宿主细胞是哺乳动物细胞。
32.如权利要求31所述的方法,其中所述宿主细胞是人类或小鼠细胞。
33.如权利要求31或32所述的方法,其中,所述ADAR是ADAR1和/或ADAR2。
34.一种凭借如权利要求1-31中任一项所述的方法产生的经编辑的RNA或者具有它的宿主细胞。
35.一种治疗或预防个体的疾病或病症的方法,包含根据权利要求1-33中任一项的方法编辑与个体细胞中的疾病或病症相关的靶标RNA。
36.如权利要求35所述的方法,其中所述疾病或病症是遗传性的基因疾病或与一种或多种获得性基因突变相关的疾病或病症。
37.如权利要求35或36所述的方法,其中所述靶标RNA具有G至A突变。
38.如权利要求35-37中任一项所述的方法,其中所述疾病或病症是单基因疾病或病症。
39.如权利要求35-37中任一项的方法,其中所述疾病或病症是多基因疾病或病症。
40.如权利要求35至37中任一项所述的方法,其中:
(i)所述靶标RNA是TP53,并且所述疾病或病症是癌症;
(ii)所述靶标RNA是IDUA,并且所述疾病或病症是I型粘多糖贮积病(MPS I);
(iii)所述靶标RNA是COL3A1,并且所述疾病或病症是埃勒斯-当洛斯综合征(Ehlers-Danlos syndrome);
(iv)所述靶标RNA是BMPR2,并且所述疾病或病症是朱伯特综合征(Joubertsyndrome);
(v)所述靶标RNA是FANCC,并且所述疾病或病症是范科尼贫血(Fanconi anemia);
(vi)所述靶标RNA是MYBPC3,并且所述疾病或病症是原发性家族性肥厚性心肌病;或
(vii)所述靶标RNA是IL2RG,并且所述疾病或病症是X染色体连锁性严重联合免疫缺陷。
41.一种通过募集作用于RNA的腺苷脱氨酶(ADAR)使靶标RNA中的靶标腺苷脱氨基作用的脱氨酶募集RNA(dRNA),其包含与所述靶标RNA杂交的互补RNA序列。
42.一种dRNA,其包含SEQ ID NO:25-44、142-205、341-342中任一项的核酸序列。
43.一种构建体,其编码权利要求41或42所述的dRNA。
44.一种文库,其包含权利要求41或42所述的多个dRNA或权利要求43所述的构建体。
45.一种组合物,其包含权利要求41或42所述的dRNA,权利要求43所述的构建体,或权利要求44所述的文库。
46.一种宿主细胞,其包含权利要求41或42的dRNA,或权利要求43的构建体。
47.一种用于编辑宿主细胞中的靶标RNA的试剂盒,其包含脱氨酶募集RNA,其中所述脱氨酶募集RNA包含与所述靶标RNA杂交的互补RNA序列,其中所述脱氨酶募集RNA能够募集ADAR以使所述靶标RNA中的靶标腺苷脱氨基。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNPCT/CN2018/110105 | 2018-10-12 | ||
CN2018110105 | 2018-10-12 | ||
CNPCT/CN2019/082713 | 2019-04-15 | ||
CN2019082713 | 2019-04-15 | ||
PCT/CN2019/110782 WO2020074001A1 (en) | 2018-10-12 | 2019-10-12 | Methods and Compositions for Editing RNAs |
CN201980067380.1A CN113631708B (zh) | 2018-10-12 | 2019-10-12 | 编辑rna的方法和组合物 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980067380.1A Division CN113631708B (zh) | 2018-10-12 | 2019-10-12 | 编辑rna的方法和组合物 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116042611A true CN116042611A (zh) | 2023-05-02 |
Family
ID=70163607
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210740517.9A Pending CN116042611A (zh) | 2018-10-12 | 2019-10-12 | 编辑rna的方法和组合物 |
CN201980067380.1A Active CN113631708B (zh) | 2018-10-12 | 2019-10-12 | 编辑rna的方法和组合物 |
CN202210724157.3A Pending CN116218836A (zh) | 2018-10-12 | 2019-10-12 | 编辑rna的方法和组合物 |
CN202210717093.4A Active CN115651927B (zh) | 2018-10-12 | 2019-10-12 | 编辑rna的方法和组合物 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980067380.1A Active CN113631708B (zh) | 2018-10-12 | 2019-10-12 | 编辑rna的方法和组合物 |
CN202210724157.3A Pending CN116218836A (zh) | 2018-10-12 | 2019-10-12 | 编辑rna的方法和组合物 |
CN202210717093.4A Active CN115651927B (zh) | 2018-10-12 | 2019-10-12 | 编辑rna的方法和组合物 |
Country Status (21)
Country | Link |
---|---|
US (2) | US20210355494A1 (zh) |
EP (2) | EP4306116A3 (zh) |
JP (2) | JP7252328B2 (zh) |
KR (1) | KR102666695B1 (zh) |
CN (4) | CN116042611A (zh) |
AU (2) | AU2019357450B2 (zh) |
BR (1) | BR112021006844A8 (zh) |
CA (1) | CA3115864A1 (zh) |
CL (1) | CL2021000880A1 (zh) |
CO (1) | CO2021005956A2 (zh) |
CR (1) | CR20210243A (zh) |
DK (1) | DK3864152T5 (zh) |
EC (1) | ECSP21033637A (zh) |
ES (1) | ES2962434T3 (zh) |
IL (1) | IL282191A (zh) |
MX (1) | MX2021004187A (zh) |
PE (1) | PE20211402A1 (zh) |
PH (1) | PH12021550805A1 (zh) |
SG (1) | SG11202103666PA (zh) |
TW (1) | TW202028466A (zh) |
WO (1) | WO2020074001A1 (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3589751A4 (en) | 2017-03-03 | 2021-11-17 | The Regents of The University of California | RNA TARGETING OF MUTATIONS VIA SUPPRESSOR RNA AND DEAMINASES |
KR20210129646A (ko) | 2019-01-22 | 2021-10-28 | 코로 바이오, 인크. | Rna-편집 올리고뉴클레오타이드 및 그의 용도 |
PE20212214A1 (es) | 2019-04-15 | 2021-11-19 | Edigene Inc | Metodos y composiciones para editar acidos ribonucleicos (arn) |
AU2020313143B2 (en) | 2019-07-12 | 2024-04-04 | Peking University | Targeted RNA editing by leveraging endogenous adar using engineered RNAs |
EP4069842A1 (en) | 2019-12-02 | 2022-10-12 | Shape Therapeutics Inc. | Therapeutic editing |
WO2021136404A1 (zh) | 2019-12-30 | 2021-07-08 | 博雅辑因(北京)生物科技有限公司 | 一种治疗Usher综合征的方法和其组合物 |
US20230060518A1 (en) | 2019-12-30 | 2023-03-02 | Edigene Therapeutics (Beijing) Inc. | Leaper technology based method for treating mps ih and composition |
US20230242916A1 (en) * | 2020-04-15 | 2023-08-03 | Edigene Therapeutics (Beijing) Inc. | Method and drug for treating hurler syndrome |
AU2021279027A1 (en) * | 2020-05-28 | 2022-12-08 | Korro Bio, Inc. | Methods and compositions for the ADAR-mediated editing of SERPINA1 |
CN113897359A (zh) * | 2020-07-06 | 2022-01-07 | 博雅辑因(北京)生物科技有限公司 | 一种改善的rna编辑方法 |
TW202214853A (zh) | 2020-07-06 | 2022-04-16 | 大陸商博雅輯因(北京)生物科技有限公司 | 一種改善的rna編輯方法 |
IL278401A (en) | 2020-10-29 | 2022-05-01 | Yeda Res & Dev | Polynucleotides for editing RNA and a method for using them |
WO2022147573A1 (en) * | 2021-01-04 | 2022-07-07 | The Regents Of The University Of California | Programmable rna editing in vivo via recruitment of endogenous adars |
CN117015605A (zh) * | 2021-01-12 | 2023-11-07 | 北京大学 | 使用工程化rna通过利用内源性adar进行靶向rna编辑 |
CA3222560A1 (en) * | 2021-06-15 | 2022-12-22 | Massachusetts Institute Of Technology | Deaminase-based rna sensors |
US20240279656A1 (en) * | 2021-06-29 | 2024-08-22 | Shape Therapeutics Inc. | Engineered Guide RNAs and Polynucleotides |
JP2024531966A (ja) * | 2021-08-18 | 2024-09-03 | 北京大学 | 操作されたadar動員rna及びその使用方法 |
TW202321440A (zh) | 2021-10-07 | 2023-06-01 | 美商肝特斯公司 | 追蹤接受者中之供體細胞之方法 |
IL312403A (en) * | 2021-10-29 | 2024-06-01 | Cold Spring Harbor Laboratory | Compositions and systems for editing RNA programmable cells and methods for their preparation and use |
WO2023143539A1 (en) * | 2022-01-28 | 2023-08-03 | Edigene Therapeutics (Beijing) Inc. | Engineered adar-recruiting rnas and methods of use thereof |
WO2023185231A1 (en) * | 2022-04-02 | 2023-10-05 | Edigene Therapeutics (Beijing) Inc. | Engineered adar-recruiting rnas and methods of use for usher syndrome |
WO2024086650A1 (en) * | 2022-10-18 | 2024-04-25 | Locanabio, Inc. | Compositions and methods comprising programmable snrnas for rna editing |
CN118620958A (zh) * | 2023-03-08 | 2024-09-10 | 广州医科大学 | 一种抗原表位的制备方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101297830B1 (ko) * | 2010-09-10 | 2013-08-19 | 한국생명공학연구원 | 신규한 rna 결합 단백질 및 이를 이용한 무표지 마이크로 rna 검출방법 |
WO2016094845A2 (en) | 2014-12-12 | 2016-06-16 | Woolf Tod M | Compositions and methods for editing nucleic acids in cells utilizing oligonucleotides |
DK3234134T3 (da) * | 2014-12-17 | 2020-07-27 | Proqr Therapeutics Ii Bv | Målrettet rna-redigering |
US11390865B2 (en) | 2015-07-14 | 2022-07-19 | Fukuoka University | Method for introducing site-directed RNA mutation, target editing guide RNA used in the method and target RNA-target editing guide RNA complex |
DE102015012522B3 (de) * | 2015-09-26 | 2016-06-02 | Eberhard Karls Universität Tübingen | Verfahren und Substanzen zur gerichteten RNA-Editierung |
WO2017220751A1 (en) * | 2016-06-22 | 2017-12-28 | Proqr Therapeutics Ii B.V. | Single-stranded rna-editing oligonucleotides |
NZ751483A (en) * | 2016-09-01 | 2022-07-01 | Proqr Therapeutics Ii Bv | Chemically modified single-stranded rna-editing oligonucleotides |
US11274300B2 (en) | 2017-01-19 | 2022-03-15 | Proqr Therapeutics Ii B.V. | Oligonucleotide complexes for use in RNA editing |
EP3589751A4 (en) * | 2017-03-03 | 2021-11-17 | The Regents of The University of California | RNA TARGETING OF MUTATIONS VIA SUPPRESSOR RNA AND DEAMINASES |
EP4361261A3 (en) | 2017-03-15 | 2024-07-10 | The Broad Institute Inc. | Novel cas13b orthologues crispr enzymes and systems |
-
2019
- 2019-10-12 BR BR112021006844A patent/BR112021006844A8/pt unknown
- 2019-10-12 CN CN202210740517.9A patent/CN116042611A/zh active Pending
- 2019-10-12 CR CR20210243A patent/CR20210243A/es unknown
- 2019-10-12 EP EP23184286.5A patent/EP4306116A3/en active Pending
- 2019-10-12 WO PCT/CN2019/110782 patent/WO2020074001A1/en unknown
- 2019-10-12 DK DK19870299.5T patent/DK3864152T5/da active
- 2019-10-12 KR KR1020217014349A patent/KR102666695B1/ko active IP Right Grant
- 2019-10-12 SG SG11202103666PA patent/SG11202103666PA/en unknown
- 2019-10-12 CA CA3115864A patent/CA3115864A1/en active Pending
- 2019-10-12 CN CN201980067380.1A patent/CN113631708B/zh active Active
- 2019-10-12 CN CN202210724157.3A patent/CN116218836A/zh active Pending
- 2019-10-12 MX MX2021004187A patent/MX2021004187A/es unknown
- 2019-10-12 EP EP19870299.5A patent/EP3864152B1/en active Active
- 2019-10-12 AU AU2019357450A patent/AU2019357450B2/en active Active
- 2019-10-12 ES ES19870299T patent/ES2962434T3/es active Active
- 2019-10-12 PE PE2021000498A patent/PE20211402A1/es unknown
- 2019-10-12 CN CN202210717093.4A patent/CN115651927B/zh active Active
- 2019-10-12 JP JP2021520227A patent/JP7252328B2/ja active Active
- 2019-10-12 US US17/284,232 patent/US20210355494A1/en active Pending
- 2019-10-14 TW TW108136892A patent/TW202028466A/zh unknown
-
2021
- 2021-04-08 IL IL282191A patent/IL282191A/en unknown
- 2021-04-09 US US17/226,961 patent/US20210310026A1/en active Pending
- 2021-04-09 CL CL2021000880A patent/CL2021000880A1/es unknown
- 2021-04-12 PH PH12021550805A patent/PH12021550805A1/en unknown
- 2021-05-06 CO CONC2021/0005956A patent/CO2021005956A2/es unknown
- 2021-05-12 EC ECSENADI202133637A patent/ECSP21033637A/es unknown
-
2023
- 2023-03-22 JP JP2023045897A patent/JP2023078373A/ja active Pending
- 2023-04-11 AU AU2023202184A patent/AU2023202184A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115651927B (zh) | 编辑rna的方法和组合物 | |
AU2020259548B2 (en) | Methods and compositions for editing RNAs | |
EP3589751A1 (en) | RNA TARGETING OF MUTATIONS VIA SUPPRESSOR tRNAs AND DEAMINASES | |
TW202028461A (zh) | 核酸構築體及使用方法 | |
KR20180131577A (ko) | 신규의 최소 utr 서열 | |
US20240200104A1 (en) | Ltr transposon compositions and methods | |
US20220162648A1 (en) | Compositions and methods for improved gene editing | |
Qu et al. | Leveraging endogenous ADAR for programmable editing on RNA | |
CN114990093A (zh) | 氨基酸序列小的蛋白序列mini rfx-cas13d | |
JP2024518413A (ja) | 修飾ヌクレアーゼ | |
JP2024502348A (ja) | Tracr不含 V型Casシステム用のガイドRNAデザインおよび複合体 | |
JP2022513750A (ja) | ホーミングエンドヌクレアーゼバリアント | |
CN115992123A (zh) | 一种基于食蟹猴改造后的apobec3a的胞嘧啶碱基编辑器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |