KR20230142776A - Rna 아데노 관련 바이러스(raav) 벡터 및 그 용도 - Google Patents
Rna 아데노 관련 바이러스(raav) 벡터 및 그 용도 Download PDFInfo
- Publication number
- KR20230142776A KR20230142776A KR1020237030365A KR20237030365A KR20230142776A KR 20230142776 A KR20230142776 A KR 20230142776A KR 1020237030365 A KR1020237030365 A KR 1020237030365A KR 20237030365 A KR20237030365 A KR 20237030365A KR 20230142776 A KR20230142776 A KR 20230142776A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- rna
- transcribed
- aav
- virus
- Prior art date
Links
- 241000702421 Dependoparvovirus Species 0.000 title claims description 52
- 239000013598 vector Substances 0.000 title description 82
- 239000002245 particle Substances 0.000 claims abstract description 513
- 241000700605 Viruses Species 0.000 claims abstract description 391
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 330
- 230000003612 virological effect Effects 0.000 claims abstract description 316
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 311
- 108020004414 DNA Proteins 0.000 claims abstract description 277
- 238000004806 packaging method and process Methods 0.000 claims abstract description 222
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 217
- 108020004511 Recombinant DNA Proteins 0.000 claims abstract description 140
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract description 33
- 239000002773 nucleotide Substances 0.000 claims description 210
- 125000003729 nucleotide group Chemical group 0.000 claims description 210
- 235000018102 proteins Nutrition 0.000 claims description 210
- 102000040430 polynucleotide Human genes 0.000 claims description 204
- 108091033319 polynucleotide Proteins 0.000 claims description 204
- 239000002157 polynucleotide Substances 0.000 claims description 204
- 210000004027 cell Anatomy 0.000 claims description 154
- 230000035772 mutation Effects 0.000 claims description 84
- 238000000034 method Methods 0.000 claims description 72
- 102000004190 Enzymes Human genes 0.000 claims description 64
- 108090000790 Enzymes Proteins 0.000 claims description 64
- 230000014509 gene expression Effects 0.000 claims description 62
- 239000013612 plasmid Substances 0.000 claims description 62
- 108020004999 messenger RNA Proteins 0.000 claims description 58
- 108091026890 Coding region Proteins 0.000 claims description 57
- 210000000234 capsid Anatomy 0.000 claims description 57
- 230000027455 binding Effects 0.000 claims description 55
- 230000003682 DNA packaging effect Effects 0.000 claims description 53
- 108020005004 Guide RNA Proteins 0.000 claims description 53
- 239000012636 effector Substances 0.000 claims description 53
- 101100524321 Adeno-associated virus 2 (isolate Srivastava/1982) Rep68 gene Proteins 0.000 claims description 51
- 101100524324 Adeno-associated virus 2 (isolate Srivastava/1982) Rep78 gene Proteins 0.000 claims description 48
- 239000004055 small Interfering RNA Substances 0.000 claims description 48
- 101710125418 Major capsid protein Proteins 0.000 claims description 40
- 230000037430 deletion Effects 0.000 claims description 38
- 238000012217 deletion Methods 0.000 claims description 38
- 239000002679 microRNA Substances 0.000 claims description 38
- 230000035897 transcription Effects 0.000 claims description 38
- 238000013518 transcription Methods 0.000 claims description 38
- 108091093126 WHP Posttrascriptional Response Element Proteins 0.000 claims description 36
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 34
- 238000003776 cleavage reaction Methods 0.000 claims description 34
- 108091070501 miRNA Proteins 0.000 claims description 34
- 230000007017 scission Effects 0.000 claims description 34
- 238000006467 substitution reaction Methods 0.000 claims description 31
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 29
- 230000001105 regulatory effect Effects 0.000 claims description 29
- 101710132601 Capsid protein Proteins 0.000 claims description 28
- 108020004418 ribosomal RNA Proteins 0.000 claims description 28
- 108091027967 Small hairpin RNA Proteins 0.000 claims description 26
- 238000010453 CRISPR/Cas method Methods 0.000 claims description 25
- 239000003623 enhancer Substances 0.000 claims description 25
- 108091079001 CRISPR RNA Proteins 0.000 claims description 24
- 230000037431 insertion Effects 0.000 claims description 24
- 238000003780 insertion Methods 0.000 claims description 24
- 239000002243 precursor Substances 0.000 claims description 24
- 108091027963 non-coding RNA Proteins 0.000 claims description 22
- 102000042567 non-coding RNA Human genes 0.000 claims description 22
- 230000002829 reductive effect Effects 0.000 claims description 21
- 210000001519 tissue Anatomy 0.000 claims description 21
- 108020004459 Small interfering RNA Proteins 0.000 claims description 20
- 101150066583 rep gene Proteins 0.000 claims description 20
- 108091033409 CRISPR Proteins 0.000 claims description 19
- 102100024364 Disintegrin and metalloproteinase domain-containing protein 8 Human genes 0.000 claims description 19
- 101100524317 Adeno-associated virus 2 (isolate Srivastava/1982) Rep40 gene Proteins 0.000 claims description 18
- 101100524319 Adeno-associated virus 2 (isolate Srivastava/1982) Rep52 gene Proteins 0.000 claims description 18
- 101150044789 Cap gene Proteins 0.000 claims description 18
- 108020004566 Transfer RNA Proteins 0.000 claims description 18
- 201000010099 disease Diseases 0.000 claims description 18
- 238000004519 manufacturing process Methods 0.000 claims description 18
- 241001515965 unidentified phage Species 0.000 claims description 18
- 241001634120 Adeno-associated virus - 5 Species 0.000 claims description 17
- 230000001124 posttranscriptional effect Effects 0.000 claims description 16
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 15
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 15
- 241000649045 Adeno-associated virus 10 Species 0.000 claims description 15
- 102000040650 (ribonucleotides)n+m Human genes 0.000 claims description 14
- 108020005345 3' Untranslated Regions Proteins 0.000 claims description 14
- 241001655883 Adeno-associated virus - 1 Species 0.000 claims description 14
- 241000972680 Adeno-associated virus - 6 Species 0.000 claims description 14
- 108010033040 Histones Proteins 0.000 claims description 14
- 241001465754 Metazoa Species 0.000 claims description 14
- 238000010362 genome editing Methods 0.000 claims description 14
- 241000580270 Adeno-associated virus - 4 Species 0.000 claims description 13
- 241001164823 Adeno-associated virus - 7 Species 0.000 claims description 13
- 241000425548 Adeno-associated virus 3A Species 0.000 claims description 13
- 241000958487 Adeno-associated virus 3B Species 0.000 claims description 13
- 108010057856 Adenovirus E2 Proteins Proteins 0.000 claims description 13
- 108010056962 Adenovirus E4 Proteins Proteins 0.000 claims description 13
- 235000004252 protein component Nutrition 0.000 claims description 13
- 241000450599 DNA viruses Species 0.000 claims description 12
- 108091034117 Oligonucleotide Proteins 0.000 claims description 12
- 108091007412 Piwi-interacting RNA Proteins 0.000 claims description 12
- 230000000692 anti-sense effect Effects 0.000 claims description 12
- 230000008488 polyadenylation Effects 0.000 claims description 12
- 108020003589 5' Untranslated Regions Proteins 0.000 claims description 11
- 241000649046 Adeno-associated virus 11 Species 0.000 claims description 11
- 101710094648 Coat protein Proteins 0.000 claims description 11
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 claims description 11
- 101710141454 Nucleoprotein Proteins 0.000 claims description 11
- 101710083689 Probable capsid protein Proteins 0.000 claims description 11
- 108091007428 primary miRNA Proteins 0.000 claims description 11
- 241000649047 Adeno-associated virus 12 Species 0.000 claims description 10
- 241000300529 Adeno-associated virus 13 Species 0.000 claims description 10
- 108091007413 Extracellular RNA Proteins 0.000 claims description 10
- 108091007417 HOX transcript antisense RNA Proteins 0.000 claims description 10
- 108091007415 Small Cajal body-specific RNA Proteins 0.000 claims description 10
- 108020004688 Small Nuclear RNA Proteins 0.000 claims description 10
- 102000039471 Small Nuclear RNA Human genes 0.000 claims description 10
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 10
- 108091007416 X-inactive specific transcript Proteins 0.000 claims description 10
- 108091035715 XIST (gene) Proteins 0.000 claims description 10
- 208000035475 disorder Diseases 0.000 claims description 10
- 230000005030 transcription termination Effects 0.000 claims description 10
- 241000238631 Hexapoda Species 0.000 claims description 9
- 108020003224 Small Nucleolar RNA Proteins 0.000 claims description 9
- 102000042773 Small Nucleolar RNA Human genes 0.000 claims description 9
- 108091027544 Subgenomic mRNA Proteins 0.000 claims description 9
- 241001492404 Woodchuck hepatitis virus Species 0.000 claims description 9
- 230000001225 therapeutic effect Effects 0.000 claims description 9
- 108091028664 Ribonucleotide Proteins 0.000 claims description 8
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 claims description 8
- 230000001939 inductive effect Effects 0.000 claims description 8
- 239000002336 ribonucleotide Substances 0.000 claims description 8
- 230000002103 transcriptional effect Effects 0.000 claims description 8
- 108020005544 Antisense RNA Proteins 0.000 claims description 7
- 108091092236 Chimeric RNA Proteins 0.000 claims description 7
- 101710172711 Structural protein Proteins 0.000 claims description 7
- 239000003184 complementary RNA Substances 0.000 claims description 7
- 230000003993 interaction Effects 0.000 claims description 7
- 125000002652 ribonucleotide group Chemical group 0.000 claims description 7
- 238000007792 addition Methods 0.000 claims description 6
- 230000000890 antigenic effect Effects 0.000 claims description 6
- 229940079593 drug Drugs 0.000 claims description 6
- 239000003814 drug Substances 0.000 claims description 6
- 238000013469 resistive pulse sensing Methods 0.000 claims description 6
- 230000009885 systemic effect Effects 0.000 claims description 6
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 claims description 5
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 4
- 108091006047 fluorescent proteins Proteins 0.000 claims description 4
- 102000034287 fluorescent proteins Human genes 0.000 claims description 4
- 210000004962 mammalian cell Anatomy 0.000 claims description 4
- 244000309459 oncolytic virus Species 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 3
- 238000012258 culturing Methods 0.000 claims description 3
- 230000003213 activating effect Effects 0.000 claims description 2
- 102000036639 antigens Human genes 0.000 claims description 2
- 108091007433 antigens Proteins 0.000 claims description 2
- 108020005198 Long Noncoding RNA Proteins 0.000 claims 1
- 238000010188 recombinant method Methods 0.000 claims 1
- 229920002477 rna polymer Polymers 0.000 description 268
- 102000053602 DNA Human genes 0.000 description 252
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 62
- 230000000875 corresponding effect Effects 0.000 description 47
- 239000013607 AAV vector Substances 0.000 description 37
- 102100040501 Contactin-associated protein 1 Human genes 0.000 description 33
- 101710196304 Contactin-associated protein 1 Proteins 0.000 description 33
- 230000000694 effects Effects 0.000 description 30
- 230000004927 fusion Effects 0.000 description 29
- 108700019146 Transgenes Proteins 0.000 description 24
- 230000006870 function Effects 0.000 description 23
- 108020004682 Single-Stranded DNA Proteins 0.000 description 22
- 108091092195 Intron Proteins 0.000 description 19
- 239000000047 product Substances 0.000 description 19
- 108090000765 processed proteins & peptides Proteins 0.000 description 17
- 125000003275 alpha amino acid group Chemical group 0.000 description 16
- 239000012634 fragment Substances 0.000 description 16
- 150000007523 nucleic acids Chemical group 0.000 description 16
- 102100029791 Double-stranded RNA-specific adenosine deaminase Human genes 0.000 description 14
- 102000004533 Endonucleases Human genes 0.000 description 14
- 108010042407 Endonucleases Proteins 0.000 description 14
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 14
- 108020001507 fusion proteins Proteins 0.000 description 14
- 102000037865 fusion proteins Human genes 0.000 description 14
- 229920001184 polypeptide Polymers 0.000 description 14
- 102000004196 processed proteins & peptides Human genes 0.000 description 14
- 230000010076 replication Effects 0.000 description 14
- 230000004048 modification Effects 0.000 description 13
- 238000012986 modification Methods 0.000 description 13
- 102000039446 nucleic acids Human genes 0.000 description 13
- 108020004707 nucleic acids Proteins 0.000 description 13
- 241000701161 unidentified adenovirus Species 0.000 description 13
- 238000000338 in vitro Methods 0.000 description 12
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 description 11
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 11
- 230000001965 increasing effect Effects 0.000 description 11
- 230000014616 translation Effects 0.000 description 11
- 238000011144 upstream manufacturing Methods 0.000 description 11
- 150000001413 amino acids Chemical class 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 10
- 238000001415 gene therapy Methods 0.000 description 10
- 230000000670 limiting effect Effects 0.000 description 10
- 238000001890 transfection Methods 0.000 description 10
- 238000013519 translation Methods 0.000 description 10
- 210000004899 c-terminal region Anatomy 0.000 description 9
- 230000002950 deficient Effects 0.000 description 9
- 238000001727 in vivo Methods 0.000 description 9
- 208000015181 infectious disease Diseases 0.000 description 9
- 230000000174 oncolytic effect Effects 0.000 description 9
- 102100022433 Single-stranded DNA cytosine deaminase Human genes 0.000 description 8
- 101710143275 Single-stranded DNA cytosine deaminase Proteins 0.000 description 8
- 230000001413 cellular effect Effects 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 8
- 239000013604 expression vector Substances 0.000 description 8
- 238000004448 titration Methods 0.000 description 8
- 239000013603 viral vector Substances 0.000 description 8
- 108020005176 AU Rich Elements Proteins 0.000 description 7
- 108020004705 Codon Proteins 0.000 description 7
- -1 For example Proteins 0.000 description 7
- 101710163270 Nuclease Proteins 0.000 description 7
- 230000003197 catalytic effect Effects 0.000 description 7
- 210000003855 cell nucleus Anatomy 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 229930024421 Adenine Natural products 0.000 description 6
- 102100038191 Double-stranded RNA-specific editase 1 Human genes 0.000 description 6
- 101000742223 Homo sapiens Double-stranded RNA-specific editase 1 Proteins 0.000 description 6
- 241000699670 Mus sp. Species 0.000 description 6
- 108010066154 Nuclear Export Signals Proteins 0.000 description 6
- 108091081548 Palindromic sequence Proteins 0.000 description 6
- 238000001190 Q-PCR Methods 0.000 description 6
- 230000007022 RNA scission Effects 0.000 description 6
- 229960000643 adenine Drugs 0.000 description 6
- 210000002230 centromere Anatomy 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 6
- 230000001537 neural effect Effects 0.000 description 6
- 108010054624 red fluorescent protein Proteins 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 5
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 5
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 5
- 102000055025 Adenosine deaminases Human genes 0.000 description 5
- 102000005381 Cytidine Deaminase Human genes 0.000 description 5
- 108010031325 Cytidine deaminase Proteins 0.000 description 5
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 5
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 5
- 229910019142 PO4 Inorganic materials 0.000 description 5
- 108091023045 Untranslated Region Proteins 0.000 description 5
- 241000700618 Vaccinia virus Species 0.000 description 5
- 108010067390 Viral Proteins Proteins 0.000 description 5
- 230000004913 activation Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 210000001130 astrocyte Anatomy 0.000 description 5
- 230000009615 deamination Effects 0.000 description 5
- 238000006481 deamination reaction Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000010363 gene targeting Methods 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 239000010452 phosphate Substances 0.000 description 5
- 229910052717 sulfur Inorganic materials 0.000 description 5
- 230000026683 transduction Effects 0.000 description 5
- 238000010361 transduction Methods 0.000 description 5
- 108091032955 Bacterial small RNA Proteins 0.000 description 4
- 108700004991 Cas12a Proteins 0.000 description 4
- 102000011591 Cleavage And Polyadenylation Specificity Factor Human genes 0.000 description 4
- 108010076130 Cleavage And Polyadenylation Specificity Factor Proteins 0.000 description 4
- 101710180243 Cytidine deaminase 1 Proteins 0.000 description 4
- 102100040264 DNA dC->dU-editing enzyme APOBEC-3D Human genes 0.000 description 4
- 102000003844 DNA helicases Human genes 0.000 description 4
- 108090000133 DNA helicases Proteins 0.000 description 4
- 102100034235 ELAV-like protein 1 Human genes 0.000 description 4
- 101000964382 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3D Proteins 0.000 description 4
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 4
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 4
- 102000055027 Protein Methyltransferases Human genes 0.000 description 4
- 108700040121 Protein Methyltransferases Proteins 0.000 description 4
- 108091032917 Transfer-messenger RNA Proteins 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 241000711975 Vesicular stomatitis virus Species 0.000 description 4
- 239000000074 antisense oligonucleotide Substances 0.000 description 4
- 229910052796 boron Inorganic materials 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 210000001320 hippocampus Anatomy 0.000 description 4
- 230000004807 localization Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 241000894007 species Species 0.000 description 4
- KISWVXRQTGLFGD-UHFFFAOYSA-N 2-[[2-[[6-amino-2-[[2-[[2-[[5-amino-2-[[2-[[1-[2-[[6-amino-2-[(2,5-diamino-5-oxopentanoyl)amino]hexanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carbonyl]amino]-3-hydroxypropanoyl]amino]-5-oxopentanoyl]amino]-5-(diaminomethylideneamino)p Chemical compound C1CCN(C(=O)C(CCCN=C(N)N)NC(=O)C(CCCCN)NC(=O)C(N)CCC(N)=O)C1C(=O)NC(CO)C(=O)NC(CCC(N)=O)C(=O)NC(CCCN=C(N)N)C(=O)NC(CO)C(=O)NC(CCCCN)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 KISWVXRQTGLFGD-UHFFFAOYSA-N 0.000 description 3
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 description 3
- 102000012758 APOBEC-1 Deaminase Human genes 0.000 description 3
- 241000283707 Capra Species 0.000 description 3
- 241000701022 Cytomegalovirus Species 0.000 description 3
- 101710093299 Double-stranded RNA-specific adenosine deaminase Proteins 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 108091036407 Polyadenylation Proteins 0.000 description 3
- 108091030071 RNAI Proteins 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- 238000012230 antisense oligonucleotides Methods 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 229940104302 cytosine Drugs 0.000 description 3
- 229910052731 fluorine Inorganic materials 0.000 description 3
- 230000009368 gene silencing by RNA Effects 0.000 description 3
- 230000005847 immunogenicity Effects 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 230000002401 inhibitory effect Effects 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 238000002887 multiple sequence alignment Methods 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 201000001119 neuropathy Diseases 0.000 description 3
- 230000007823 neuropathy Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 108091092562 ribozyme Proteins 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 230000010415 tropism Effects 0.000 description 3
- 241001529453 unidentified herpesvirus Species 0.000 description 3
- 210000002845 virion Anatomy 0.000 description 3
- 229910052727 yttrium Inorganic materials 0.000 description 3
- 108010024100 APOBEC Deaminases Proteins 0.000 description 2
- 102000015619 APOBEC Deaminases Human genes 0.000 description 2
- 108010004483 APOBEC-3G Deaminase Proteins 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 2
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 2
- 101000935845 Aliivibrio fischeri Blue fluorescence protein Proteins 0.000 description 2
- 101100123845 Aphanizomenon flos-aquae (strain 2012/KM1/D3) hepT gene Proteins 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 108010087504 Beta-Globulins Proteins 0.000 description 2
- 102100026031 Beta-glucuronidase Human genes 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 102100040399 C->U-editing enzyme APOBEC-2 Human genes 0.000 description 2
- 102000004657 Calcium-Calmodulin-Dependent Protein Kinase Type 2 Human genes 0.000 description 2
- 108010003721 Calcium-Calmodulin-Dependent Protein Kinase Type 2 Proteins 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 108091062157 Cis-regulatory element Proteins 0.000 description 2
- 208000035473 Communicable disease Diseases 0.000 description 2
- 102100040263 DNA dC->dU-editing enzyme APOBEC-3A Human genes 0.000 description 2
- 102100040262 DNA dC->dU-editing enzyme APOBEC-3B Human genes 0.000 description 2
- 102100040261 DNA dC->dU-editing enzyme APOBEC-3C Human genes 0.000 description 2
- 102100040266 DNA dC->dU-editing enzyme APOBEC-3F Human genes 0.000 description 2
- 102100038076 DNA dC->dU-editing enzyme APOBEC-3G Human genes 0.000 description 2
- 102100038050 DNA dC->dU-editing enzyme APOBEC-3H Human genes 0.000 description 2
- 101710082737 DNA dC->dU-editing enzyme APOBEC-3H Proteins 0.000 description 2
- 230000004543 DNA replication Effects 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 101000935842 Escherichia coli O127:H6 (strain E2348/69 / EPEC) Major structural subunit of bundle-forming pilus Proteins 0.000 description 2
- 108010000720 Excitatory Amino Acid Transporter 2 Proteins 0.000 description 2
- 102100031562 Excitatory amino acid transporter 2 Human genes 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- YCKRFDGAMUMZLT-UHFFFAOYSA-N Fluorine atom Chemical compound [F] YCKRFDGAMUMZLT-UHFFFAOYSA-N 0.000 description 2
- 108010001515 Galectin 4 Proteins 0.000 description 2
- 102100039556 Galectin-4 Human genes 0.000 description 2
- 102000053171 Glial Fibrillary Acidic Human genes 0.000 description 2
- 101710193519 Glial fibrillary acidic protein Proteins 0.000 description 2
- 108091093094 Glycol nucleic acid Proteins 0.000 description 2
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 2
- 101001023784 Heteractis crispa GFP-like non-fluorescent chromoprotein Proteins 0.000 description 2
- 101710121996 Hexon protein p72 Proteins 0.000 description 2
- 108090000353 Histone deacetylase Proteins 0.000 description 2
- 102100038720 Histone deacetylase 9 Human genes 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000964322 Homo sapiens C->U-editing enzyme APOBEC-2 Proteins 0.000 description 2
- 101000964378 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3A Proteins 0.000 description 2
- 101000964385 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3B Proteins 0.000 description 2
- 101000964383 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3C Proteins 0.000 description 2
- 101000964377 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3F Proteins 0.000 description 2
- 101000741544 Homo sapiens Properdin Proteins 0.000 description 2
- 101000800426 Homo sapiens Putative C->U-editing enzyme APOBEC-4 Proteins 0.000 description 2
- 101001079872 Homo sapiens RING finger protein 112 Proteins 0.000 description 2
- 108010000521 Human Growth Hormone Proteins 0.000 description 2
- 102000002265 Human Growth Hormone Human genes 0.000 description 2
- 239000000854 Human Growth Hormone Substances 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- 102100024573 Macrophage-capping protein Human genes 0.000 description 2
- 102100036837 Metabotropic glutamate receptor 2 Human genes 0.000 description 2
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 2
- 102100039124 Methyl-CpG-binding protein 2 Human genes 0.000 description 2
- 102000047918 Myelin Basic Human genes 0.000 description 2
- 101710107068 Myelin basic protein Proteins 0.000 description 2
- 241000244206 Nematoda Species 0.000 description 2
- 241000701945 Parvoviridae Species 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 2
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 2
- 108010038512 Platelet-Derived Growth Factor Proteins 0.000 description 2
- 102000010780 Platelet-Derived Growth Factor Human genes 0.000 description 2
- 102100037935 Polyubiquitin-C Human genes 0.000 description 2
- 102000029797 Prion Human genes 0.000 description 2
- 108091000054 Prion Proteins 0.000 description 2
- 102100038931 Proenkephalin-A Human genes 0.000 description 2
- 102100033091 Putative C->U-editing enzyme APOBEC-4 Human genes 0.000 description 2
- 101710086015 RNA ligase Proteins 0.000 description 2
- 230000026279 RNA modification Effects 0.000 description 2
- 230000004570 RNA-binding Effects 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 210000001744 T-lymphocyte Anatomy 0.000 description 2
- 108010056354 Ubiquitin C Proteins 0.000 description 2
- 102000039634 Untranslated RNA Human genes 0.000 description 2
- 108020004417 Untranslated RNA Proteins 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 2
- 125000001931 aliphatic group Chemical group 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 208000029560 autism spectrum disease Diseases 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 102220360166 c.1445C>T Human genes 0.000 description 2
- 102220346620 c.1720A>T Human genes 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 210000003169 central nervous system Anatomy 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- 230000001086 cytosolic effect Effects 0.000 description 2
- 230000007850 degeneration Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 210000001163 endosome Anatomy 0.000 description 2
- 210000002889 endothelial cell Anatomy 0.000 description 2
- 108010021843 fluorescent protein 583 Proteins 0.000 description 2
- 239000011737 fluorine Substances 0.000 description 2
- 238000007306 functionalization reaction Methods 0.000 description 2
- 210000005046 glial fibrillary acidic protein Anatomy 0.000 description 2
- 244000000013 helminth Species 0.000 description 2
- 229960002897 heparin Drugs 0.000 description 2
- 229920000669 heparin Polymers 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 239000012678 infectious agent Substances 0.000 description 2
- 229910052740 iodine Inorganic materials 0.000 description 2
- NBQNWMBBSKPBAY-UHFFFAOYSA-N iodixanol Chemical compound IC=1C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C(I)C=1N(C(=O)C)CC(O)CN(C(C)=O)C1=C(I)C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C1I NBQNWMBBSKPBAY-UHFFFAOYSA-N 0.000 description 2
- 229960004359 iodixanol Drugs 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 108010038421 metabotropic glutamate receptor 2 Proteins 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 238000009126 molecular therapy Methods 0.000 description 2
- 210000004498 neuroglial cell Anatomy 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000005257 nucleotidylation Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 208000033808 peripheral neuropathy Diseases 0.000 description 2
- 229910052700 potassium Inorganic materials 0.000 description 2
- 108010074732 preproenkephalin Proteins 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 230000018883 protein targeting Effects 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 210000003705 ribosome Anatomy 0.000 description 2
- 102220214569 rs1060502907 Human genes 0.000 description 2
- 102220231840 rs1064797305 Human genes 0.000 description 2
- 102200119083 rs118204039 Human genes 0.000 description 2
- 102200062143 rs132630330 Human genes 0.000 description 2
- 102220279424 rs1373614735 Human genes 0.000 description 2
- 102200154191 rs137853843 Human genes 0.000 description 2
- 102220040801 rs140919432 Human genes 0.000 description 2
- 102200038664 rs199472801 Human genes 0.000 description 2
- 102220201261 rs201339004 Human genes 0.000 description 2
- 102220056826 rs368482358 Human genes 0.000 description 2
- 102220014665 rs397517216 Human genes 0.000 description 2
- 102200100757 rs62637007 Human genes 0.000 description 2
- 102220215441 rs756472919 Human genes 0.000 description 2
- 102220101445 rs878853486 Human genes 0.000 description 2
- 102200010124 rs878854402 Human genes 0.000 description 2
- 102220158313 rs886063623 Human genes 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000005100 tissue tropism Effects 0.000 description 2
- 230000037426 transcriptional repression Effects 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 239000012096 transfection reagent Substances 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 241000701447 unidentified baculovirus Species 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 230000029812 viral genome replication Effects 0.000 description 2
- 230000003313 weakening effect Effects 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- 108020005065 3' Flanking Region Proteins 0.000 description 1
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- 108020005029 5' Flanking Region Proteins 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 1
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- XVPZRKIQCKKYNE-UHFFFAOYSA-N Arborine Chemical compound N=1C(=O)C2=CC=CC=C2N(C)C=1CC1=CC=CC=C1 XVPZRKIQCKKYNE-UHFFFAOYSA-N 0.000 description 1
- 102220603295 Arf-GAP with GTPase, ANK repeat and PH domain-containing protein 3_S414N_mutation Human genes 0.000 description 1
- 208000002109 Argyria Diseases 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 102000006734 Beta-Globulins Human genes 0.000 description 1
- 208000020925 Bipolar disease Diseases 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 102100028728 Bone morphogenetic protein 1 Human genes 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 206010008748 Chorea Diseases 0.000 description 1
- 206010008754 Choreoathetosis Diseases 0.000 description 1
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 1
- 102000005221 Cleavage Stimulation Factor Human genes 0.000 description 1
- 108010081236 Cleavage Stimulation Factor Proteins 0.000 description 1
- UDMBCSSLTHHNCD-UHFFFAOYSA-N Coenzym Q(11) Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(O)=O)C(O)C1O UDMBCSSLTHHNCD-UHFFFAOYSA-N 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000016559 DNA Primase Human genes 0.000 description 1
- 108010092681 DNA Primase Proteins 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 206010011968 Decreased immune responsiveness Diseases 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 101500023984 Drosophila melanogaster Synapsin-1 Proteins 0.000 description 1
- 208000012661 Dyskinesia Diseases 0.000 description 1
- 102000016662 ELAV Proteins Human genes 0.000 description 1
- 108010053101 ELAV Proteins Proteins 0.000 description 1
- 102100027723 Endogenous retrovirus group K member 6 Rec protein Human genes 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 108010092674 Enkephalins Proteins 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 241000702189 Escherichia virus Mu Species 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 241000483002 Euproctis similis Species 0.000 description 1
- 208000006168 Ewing Sarcoma Diseases 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 1
- 208000010412 Glaucoma Diseases 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 1
- 108010034145 Helminth Proteins Proteins 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 208000028782 Hereditary disease Diseases 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 101000933465 Homo sapiens Beta-glucuronidase Proteins 0.000 description 1
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 description 1
- 101001111338 Homo sapiens Neurofilament heavy polypeptide Proteins 0.000 description 1
- 101001050288 Homo sapiens Transcription factor Jun Proteins 0.000 description 1
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- 235000000177 Indigofera tinctoria Nutrition 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- URLZCHNOLZSCCA-VABKMULXSA-N Leu-enkephalin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 URLZCHNOLZSCCA-VABKMULXSA-N 0.000 description 1
- 108091007460 Long intergenic noncoding RNA Proteins 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000283923 Marmota monax Species 0.000 description 1
- 101710084218 Master replication protein Proteins 0.000 description 1
- 208000009018 Medullary thyroid cancer Diseases 0.000 description 1
- 101100144701 Mus musculus Drosha gene Proteins 0.000 description 1
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 1
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 1
- 102000004364 Myogenin Human genes 0.000 description 1
- 108010056785 Myogenin Proteins 0.000 description 1
- 208000028389 Nerve injury Diseases 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 206010052399 Neuroendocrine tumour Diseases 0.000 description 1
- 102100024007 Neurofilament heavy polypeptide Human genes 0.000 description 1
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 1
- 102000007999 Nuclear Proteins Human genes 0.000 description 1
- 108010089610 Nuclear Proteins Proteins 0.000 description 1
- 102000043141 Nuclear RNA Human genes 0.000 description 1
- 108020003217 Nuclear RNA Proteins 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 101710112078 Para-Rep C2 Proteins 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 1
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 1
- 108020005120 Plant DNA Proteins 0.000 description 1
- 108010039918 Polylysine Proteins 0.000 description 1
- 102000015623 Polynucleotide Adenylyltransferase Human genes 0.000 description 1
- 108010024055 Polynucleotide adenylyltransferase Proteins 0.000 description 1
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 108010019674 Proto-Oncogene Proteins c-sis Proteins 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 1
- 102000001435 Synapsin Human genes 0.000 description 1
- 108050009621 Synapsin Proteins 0.000 description 1
- 102000017299 Synapsin-1 Human genes 0.000 description 1
- 108050005241 Synapsin-1 Proteins 0.000 description 1
- 101001023030 Toxoplasma gondii Myosin-D Proteins 0.000 description 1
- 102100023132 Transcription factor Jun Human genes 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102100040247 Tumor necrosis factor Human genes 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 108091034131 VA RNA Proteins 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 208000008383 Wilms tumor Diseases 0.000 description 1
- ZVQOOHYFBIDMTQ-UHFFFAOYSA-N [methyl(oxido){1-[6-(trifluoromethyl)pyridin-3-yl]ethyl}-lambda(6)-sulfanylidene]cyanamide Chemical compound N#CN=S(C)(=O)C(C)C1=CC=C(C(F)(F)F)N=C1 ZVQOOHYFBIDMTQ-UHFFFAOYSA-N 0.000 description 1
- 208000037919 acquired disease Diseases 0.000 description 1
- 230000033289 adaptive immune response Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- LNQVTSROQXJCDD-UHFFFAOYSA-N adenosine monophosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)C(OP(O)(O)=O)C1O LNQVTSROQXJCDD-UHFFFAOYSA-N 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- HMFHBZSHGGEWLO-NEEWWZBLSA-N alpha-L-ribose Chemical compound OC[C@@H]1O[C@@H](O)[C@@H](O)[C@H]1O HMFHBZSHGGEWLO-NEEWWZBLSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- HMFHBZSHGGEWLO-TXICZTDVSA-N beta-D-ribose Chemical group OC[C@H]1O[C@@H](O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-TXICZTDVSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 201000009036 biliary tract cancer Diseases 0.000 description 1
- 208000020790 biliary tract neoplasm Diseases 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 201000006491 bone marrow cancer Diseases 0.000 description 1
- 108010006025 bovine growth hormone Proteins 0.000 description 1
- 102220370707 c.1203G>A Human genes 0.000 description 1
- 102200042638 c.1358G>A Human genes 0.000 description 1
- 102220354899 c.1441G>C Human genes 0.000 description 1
- 102220419728 c.1500A>T Human genes 0.000 description 1
- 102220377110 c.1560T>C Human genes 0.000 description 1
- 102220413977 c.1664C>T Human genes 0.000 description 1
- 102220354180 c.1664C>T Human genes 0.000 description 1
- 102220360931 c.3691A>G Human genes 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000025084 cell cycle arrest Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000007248 cellular mechanism Effects 0.000 description 1
- 230000010094 cellular senescence Effects 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 208000012601 choreatic disease Diseases 0.000 description 1
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 206010013663 drug dependence Diseases 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 230000002518 glial effect Effects 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 125000003147 glycosyl group Chemical group 0.000 description 1
- 230000003394 haemopoietic effect Effects 0.000 description 1
- 201000010536 head and neck cancer Diseases 0.000 description 1
- 208000014829 head and neck neoplasm Diseases 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 230000005099 host tropism Effects 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 229940097275 indigo Drugs 0.000 description 1
- COHYTHOBJLSHDF-UHFFFAOYSA-N indigo powder Natural products N1C2=CC=CC=C2C(=O)C1=C1C(=O)C2=CC=CC=C2N1 COHYTHOBJLSHDF-UHFFFAOYSA-N 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 230000010189 intracellular transport Effects 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 150000002605 large molecules Chemical class 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- DTOSIQBPPRVQHS-PDBXOOCHSA-M linolenate Chemical compound CC\C=C/C\C=C/C\C=C/CCCCCCCC([O-])=O DTOSIQBPPRVQHS-PDBXOOCHSA-M 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 208000023356 medullary thyroid gland carcinoma Diseases 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 101150053701 mom gene Proteins 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 210000004165 myocardium Anatomy 0.000 description 1
- 210000000822 natural killer cell Anatomy 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 210000001577 neostriatum Anatomy 0.000 description 1
- 201000008026 nephroblastoma Diseases 0.000 description 1
- 230000008764 nerve damage Effects 0.000 description 1
- 208000016065 neuroendocrine neoplasm Diseases 0.000 description 1
- 201000011519 neuroendocrine tumor Diseases 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 244000309711 non-enveloped viruses Species 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- 210000004492 nuclear pore Anatomy 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 210000001328 optic nerve Anatomy 0.000 description 1
- 208000020911 optic nerve disease Diseases 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012858 packaging process Methods 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- DCWXELXMIBXGTH-QMMMGPOBSA-N phosphonotyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-QMMMGPOBSA-N 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 229920000656 polylysine Polymers 0.000 description 1
- 229920000069 polyphenylene sulfide Polymers 0.000 description 1
- 239000013259 porous coordination polymer Substances 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000009790 rate-determining step (RDS) Methods 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 208000032253 retinal ischemia Diseases 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 102220234408 rs1114167611 Human genes 0.000 description 1
- 102220236111 rs1131691934 Human genes 0.000 description 1
- 102200132001 rs1135402744 Human genes 0.000 description 1
- 102200119884 rs119103214 Human genes 0.000 description 1
- 102200120522 rs121912519 Human genes 0.000 description 1
- 102200017383 rs121918379 Human genes 0.000 description 1
- 102220324924 rs138734772 Human genes 0.000 description 1
- 102220277289 rs1553412768 Human genes 0.000 description 1
- 102220286390 rs1553662601 Human genes 0.000 description 1
- 102220327838 rs1555591722 Human genes 0.000 description 1
- 102200038390 rs199472809 Human genes 0.000 description 1
- 102220094018 rs201798163 Human genes 0.000 description 1
- 102220009044 rs224206 Human genes 0.000 description 1
- 102200126331 rs28937571 Human genes 0.000 description 1
- 102200163429 rs369088781 Human genes 0.000 description 1
- 102220135453 rs369488860 Human genes 0.000 description 1
- 102220240190 rs375064450 Human genes 0.000 description 1
- 102220041311 rs587778722 Human genes 0.000 description 1
- 102220036621 rs587779914 Human genes 0.000 description 1
- 102220013766 rs61731179 Human genes 0.000 description 1
- 102200028480 rs61753980 Human genes 0.000 description 1
- 102220026213 rs63749971 Human genes 0.000 description 1
- 102220085877 rs63750059 Human genes 0.000 description 1
- 102220286378 rs63751393 Human genes 0.000 description 1
- 102220100312 rs755193751 Human genes 0.000 description 1
- 102220062944 rs755395180 Human genes 0.000 description 1
- 102220219522 rs756197350 Human genes 0.000 description 1
- 102220279291 rs764616982 Human genes 0.000 description 1
- 102220086638 rs766438395 Human genes 0.000 description 1
- 102220322048 rs766438395 Human genes 0.000 description 1
- 102220278637 rs770181766 Human genes 0.000 description 1
- 102220264786 rs772460728 Human genes 0.000 description 1
- 102220095438 rs876658180 Human genes 0.000 description 1
- 102220096219 rs876659201 Human genes 0.000 description 1
- 102220122123 rs886043008 Human genes 0.000 description 1
- 201000000980 schizophrenia Diseases 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 210000002460 smooth muscle Anatomy 0.000 description 1
- 210000001057 smooth muscle myoblast Anatomy 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 208000011117 substance-related disease Diseases 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 229910052720 vanadium Inorganic materials 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000010464 virion assembly Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14123—Virus like particles [VLP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/42—Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/48—Vector systems having a special element relevant for transcription regulating transport or export of RNA, e.g. RRE, PRE, WPRE, CTE
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/50—Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Virology (AREA)
- Mycology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
본 발명은 관심 RNA 서열 및 RNA 패키징 신호를 포함한 RNA 서열을 제공한다. RNA 서열을 포함한 재조합 DNA 바이러스의 바이러스 입자를 더 제공하고, 상기 RNA 서열은 DNA 바이러스의 단백질 쉘 내에 패키징되는 관심 RNA 서열 및 RNA 패키징 신호를 포함한다.
Description
관련 출원의 참조
본 국체 특허 출원은 2021년 2월 7일자로 출원된 국체 특허 출원 번호 PCT/CN2021/075874의 우선권을 주장하고, 그 전체 내용은 참조를 통해 본 명세서에 포함된다.
배경기술
아데노 관련 바이러스(AAV)는 인간과 기타 영장류 종들을 감염시키는 소형(직경이 약 20 nm) 복제 결함형 비피막 바이러스이다. 이는 파르보바이러스과(Parvoviridae) 데펜도파르보바이러스속(Dependoparvovirus)에 속한다. 야생형 AAV는 분열세포 및 비분열세포 모두를 감염시킬 수 있고, 그 게놈을 숙주 세포의 게놈에 통합시킬 수 있다. 그 생명 주기는 아데노 바이러스(AdV)와 같은 헬퍼 바이러스의 존재에 의존하고, 이에 따라 명명 및 분류한다.
AAV는 인간 및 비인간 영장류(NHP)를 포함한 여러 척추 동물 종에서 발견되었다. 현재의 공통의 인식은 AAV가 어떠한 인간 질병도 일으키지 않고, 매우 경미한 면역 반응만 일으킬 수 있는 것이다. 이는 직경이 약 20-25 nm인 20면체 단백질 캡시드 및 약 4.7 kb의 단일 가닥 DNA(ssDNA) 게놈(플러스(센스) 가닥일 수도 있고, 마이너스 (안티센스)가닥일 수도 있음)으로 구성될 수 있다.
AAV 캡시드는 VP1, VP2 및 VP3의 세 가지 종류의 서브유닛, 총 60개의 복제를 포함하고, 비율은 1 : 1 : 10(VP1 : VP2 : VP3)이다. 게놈의 양측 말단에 2개의 T형 말단 역반복(ITR)을 포함하고, 주로 바이러스 복제 기점 및 패키징 신호 역할을 한다. rep유전자는 바이러스 복제에 필요한 4가지 단백질을 코딩한다. Rep 단백질은 그 분자량에 따라 Rep78, Rep68, Rep52 및 Rep40으로 명명된다. cap유전자는 상이한 개시 코돈으로부터 코딩 번역된다. 또한, 조립 활성화 단백질(AAP)을 코딩하는 제3 유전자는 상이한 리딩 프레임 중의 cap코딩 서열에서 코딩되고, 비리온 조립을 촉진하는 것으로 나타났다.
현재, 13개의 AAV 혈청형 및 수많은 변이체가 감정되었고, 이들은 상이한 세포 수용체를 인식함으로써, 상이한 조직형 및 세포형의 향성 스펙트럼을 나타낸다. AAV1-13의 생체 내 조직 향성도 여러 동물 모델에서 충분히 연구하였다.
AAV ITR 서열은 각자 145개의 뉴클레오티드를 포함한다. ITR 서열은 각각 자가 개시를 위한 헤어핀을 형성할 수 있고, 이는 제2 DNA가닥이 프리마제에 의존하지 않고 합성이 가능하도록 한다. ITR은 또한 AAV DNA를 숙주 세포 게놈(인간의 19번째 염색체)에 통합하고 상기 숙주 세포 게놈에서 AAV DNA를 구출 및 효율적으로 캡시드화하여 완전 조립된 데옥시리보뉴클레아제 내성 AAV 입자에 필요한 것을 생성하는으로 나타났다.
AAV2 ITR은 복제 기점으로서, 큰 스템 회문 서열(A-A’)에 삽입된 2개의 암 회문 서열(즉 B-B’ 및 C-C’)로 구성된다. ITR은 두 가지 배열(즉 Flip 및 Flop)을 얻을 수 있다. 도 1을 참조한다. Flip 및 Flop 배열은 각각 3’ 말단에 가장 가까운 B-B’ 및 C-C’ 회문 서열을 갖는다. 20개의 뉴클레오티드를 갖는 D 서열 또는 D 영역은 AAV 게놈의 각 말단에서만 한번 나타나기에, 단일 가닥을 유지한다.
ITR은 AAV Rep78 및 Rep68 단백질에 특정 방향으로 결합되는 약 22-bp의 서열 - Rep-결합 요소(RBE)를 더 포함한다. ITR이 회문 서열(헤어핀) 배열일 경우, Rep 단백질은 또한 짧은 회문 서열(RBE’) 중 일 말단 위치의 5-염기 서열에 접촉될 수 있고, 이로써 AAV 복제 및 패키징을 돕도록 Rep DNA 헬리카제 및 사슬 특이적 엔도뉴클레아제의 활성을 활성화하한다(도 1 참조).
RBE는 공유 서열 5’-GNGC-3’을 갖는 테트라 뉴클레오티드 반복(예를 들어, 4개 반복)을 포함한다. Rep78 및 Rep68의 ATP 의존적 DNA 헬리카제 활성은 A-A’ 영역을 리모델링하여, 스템 루프를 생성하고, 상기 스템 루프는 단일 가닥 형식으로 말단 분해 부위(trs 또는 TRS)의 정상에 위치한다. 이러한 배열에서, Rep78 및 Rep68의 가닥 특이적 및 부위 특이적 엔도뉴클레아제 촉매 도메인은 trs 위치에서 절개구에 도입된다. T형 구조 정점 위치의 뉴클레오티드는 별도의 RBE(RBE’)에 대응되고, 상기 RBE는 2개의 최대의 Rep 단백질 및 ITR 사이의 관련을 안정시킨다.
AAV생명 주기에서, AAV DNA가 세포핵에서 코팅되지 않는 경우, 유입 단일 가닥 게놈의 ITR가 헤어핀에 스냅되고, 이는 제2 가닥의 합성에 천연 3’-OH프라이머를 제공한다. 이는 공유 결합성 폐쇄(헤어핀) 말단을 갖는 이중 가닥 분자를 생성할 수 있다. 그 후, 큰 Rep 단백질은 헤어핀 내에서 RBE 및 RBE’를 결합하고, 활성화된 엔도뉴클레아제는 말단 분해 부위(trs)로 불리는 인식 서열 내의 특정 부위에서 하나의 가닥을 절단한다. 이는 새로운 3’-OH 프라이머를 생성하고, ITR을 복구하여 평활말단 이중 가닥 분자를 형성하는 데 사용된다. 절단 기간에 Rep78 또는 Rep68의 분자는 티로신-포스페이트 연결을 통해 5’-말단 인산염에 공유 부착된다. 그 후 ITR을 이중 헤어핀으로 재구성하여 3’-OH 프라이머를 생성하고, 상기 프라이머는 세포 복합체를 사용하여 게놈 길이에 따른 가닥 치환 합성을 가이드한다. 이는 패키징된 단일 가닥을 치환하고, 하나의 단말에서 공유 결합성 폐쇄된 이중 가닥 분자를 개조하여, 절단, 복구 및 가닥 치환 합성의 새로운 사이클을 시작한다. 이러한 사이클을 반복할 때마다 패키징을 위한 새로운 단일 가닥을 형성할 수 있다. 2개의 말단이 동일하기 때문에 이 과정은 2개의 말단에서 동등하게 진행되어 패키징을 위한 플러스 가닥 및 마이너스 가닥을 생성한다.
AAV가 생체 내에서 여러 종 및 조직에 형질도입될 수 있고, 독성 증거가 없으며, 상대적으로 온화한 선천적 면역 반응 및 적응적 면역 반응을 생성하기에, 유전자 요법에 광범위하게 사용되고 있다.
AAV 벡터는 야생형 AAV(wtAAV)에서 발견된 동일한 캡시드 서열 및 구조로 구성된다. 그러나, AAV 벡터는 모든 AAV 단백질 코딩 서열이 결핍되고 그 위치에 전이 유전자 발현 카세트가 설계된 게놈을 캡시드화한다. 바이러스 기점의 유일한 서열은 ITR이고, 상기 ITR이 벡터 생산 과정에서 게놈 복제 및 패키징을 가이드해야 한다. 바이러스 코딩 서열의 완전 제거는 AAV 벡터의 패키징 능력을 최대화하고, 체내 전달 시의 낮은 면역원성 및 세포 독성에 도움이 된다.
AAV 벡터는 4.7 kb 이하의 게놈을 수용하기에 가장 적합하므로, 전이 유전자 서열을 고려할 뿐만 아니라 유전자 발현에 필요한 조절 요소(예를 들어, 프로모터, 인핸서, 인트론 및 폴리아데닐화 신호)도 고려하여 유효 부하를 신중하게 설계해야 한다.
하나의 유행하는 AAV 벡터 생산 방법은 rep 및 cap유전자를 발현시키는 패키징 플라스미드, AAV 캡시드 내에 패키징되는 전이 유전자 플라스미드 및 헬퍼 작용을 하는 다른 AdV유전자(예컨대 각각 복제, 정보 RNA(mRNA) 처리 및 번역에 극히 중요한 E2A, E4 및 VA RNA유전자)를 함유하는 헬퍼 플라스미드로 HEK293T세포에 대해 삼중 형질감염하는 것이며, 상기 HEK293T세포는 구성적 발현 AdV E1a 및 E1b유전자를 함유한다. 다행히, 패키징 플라스미드 또는 헬퍼 바이러스 중의 캡시드 코딩 영역만 교체하면, AAV2 ITR로 구축한 전이 유전자 발현 카세트를 임의의 혈청형 캡시드에 패키징할 수 있다.
AAV 벡터는 상이한 세포 수용체를 인식 및 결합하고, 내재화를 통해 세포에 진입한다. 엔도솜 중 완전한 AAV 벡터 입자는 일련의 pH 의존적 구조 변화를 거치고, 상기 변화는 세포 백본 네트워크를 거쳐 사이토졸을 통해 형질도입 및 운반에 필수적이다. 엔도솜 탈출 후, AAV 벡터는 핵기공 복합물을 통해 세포핵에 진입하고, 상기 세포핵 중 상기 AAV 벡터는 캡시드 탈외피를 거쳐 게놈을 방출한다.
세포핵에서 방출되는 단일 가닥 AAV 벡터 게놈은 즉시 유전자 발현하여 전사의 요구 및 형질도입의 속도 제한 단계인 이중 가닥 형태로 전환되지 않는다.
제2 가닥 합성은 게놈 3’-말단의 ITR 자가 증폭으로부터 시작된다. 그 외, 이중 가닥 게놈은 가닥 어닐링을 통해 구현될 수 있고, 이로써 단독 비리온 중의 플러스 가닥 및 마이너스 가닥 게놈에 패키징되며, 일단 세포핵에 있으면 왓슨-크릭(Watson-Crick) 염기 페어링을 통해 어닐링된다. 그 후 이중 가닥 게놈은 ITR에서의 분자 내 또는 분자간 게놈 재조합을 거쳐 고리화된다. 이러한 고리화 및 연쇄화 과정은 AAV 벡터 게놈을 유리형 DNA로 안정화시켜, 유사 분열 후 세포에서 지속적으로 유전자 발현되도록 한다(도 2).
CRISPR은 유전자 요법에 새로운 동력을 부여하였다. CRISPR은 강력한 게놈 편집 툴이고, 유전병, 후천성 질병 및 전염병 치료에서 이미 잠재력을 보이고 있다. 그러나, CRISPR세포 성분의 전달은 여전히 임상화의 주요한 장애이다. 현재까지 가장 성공적인 CRISPR 체내 유전자 편집은 전달 벡터로서 AAV를 사용한다.
그러나, 기존 AAV 전달은 1) 연장된 Cas9 발현으로 인해 증가된 오프-타겟 효과, 2) Cas9 특이적 면역 반응 자극, 3) CRISPR에 의해 유도된 이중 가닥 절단 중 바이러스 통합의 높은 빈도를 포함한 여러 실제적 어려움에 직면하였다. 최근 연구에서는 사람들에서 광범위하게 전파한 Cas9에 대한 사전 보존 면역력이 Cas9가 지속적으로 발현되면 편집된 세포에 별도의 도전을 가져다 줄 수 있다는 것을 입증하였다.
따라서, Cas9에 의해 매개되는 유전자 편집 툴과 같은 기존의 유전자 편집 툴을 개선해야 한다.
본 발명의 일 양태는 DNA 바이러스의 바이러스 입자에 패키징될 수 있는 리보뉴클레오티드(RNA) 서열을 제공하고, 상기 RNA 서열은 (1) 관심 유전자(GOI)를 코딩하는 RNA 코딩 서열, mRNA와 같은 단백질(예를 들어, 치료성 단백질, 항원 단백질, 또는 유전자 편집 단백질 예컨대 CRISPR/Cas 이펙터 효소(“Cas 단백질”로 약칭), ZFN 단백질, TALEN 단백질)을 코딩하는 RNA, 또는 비코딩 기능적 RNA(예컨대 운반 RNA(tRNA), 리보솜 RNA(rRNA), 작은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 안티센스 RNA, 안티센스 올리고뉴클레오티드, 마이크로 RNA(miRNA) 또는 CRISPR-Cas(예를 들어, Cas9, Cas12, Cas13)시스템의 RNA 성분(단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라)와 같은 가이드 RNA(또는 gRNA), CRISPR RNA(crRNA) 및 tracr RNA) 포함)) 또는 그 전구체와 같은 관심 RNA 서열(RSI); 및 (2) 직접 또는 간접적으로 RPS 상호 작용 분자와 상호 작용(예를 들어 결합)할 수 있고, 상기 RPS 상호 작용 분자가 상기 RNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진하는 RNA 패키징 신호(RPS)를 포함하고, 선택적으로, 상기 RNA 서열을 코딩하거나 이에 대응되는 DNA 서열 또는 상기 DNA 서열의 역-상보적인 서열은 상기 DNA 바이러스의 바이러스 입자에 패키징되는 능력(AAV 패키징을 위한 기능적 AAV ITR과 같은 상기 DNA 서열 또는 그 역-상보적인 서열에 DNA 패키징 신호가 결핍됨)이 감소되거나, 약화되거나 또는 거의 없다.
일부 실시 형태에 있어서, DNA 바이러스의 바이러스 입자는 AAV 바이러스 입자 또는 종양용해 바이러스 입자이다.
일부 실시 형태에 있어서, RPS는 상기 RSI의 5’ 말단에 위치하거나 가깝거나, 상기 RSI의 3’ 말단에 위치하거나 가깝거나 또는 상기 RSI의 내부(예를 들어, mRNA의 인트론 내)에 위치한다.
일부 실시 형태에 있어서, RNA 서열은 서로 같거나 다른 하나 이상의(예를 들어, 1개, 2개, 3개 이상의) RPS를 포함한다.
일부 실시 형태에 있어서, 상기 하나 이상의 RPS 중의 2개 이상(예를 들어, 3개)은 서로 같거나 다른 링커를 통해 서로 인접하거나 또는 직렬 연결된다.
일부 실시 형태에 있어서, RNA 서열은 서로 인접하지 않는(예를 들어, 각자 관심 RNA 서열(RSI)의 하나의 말단에 위치하거나 가까움) 2개 이상의 RPS를 포함한다.
일부 실시 형태에 있어서, RPS는 전사되고 변형된 AAV말단 역반복(ITR)를 포함하고, 여기서 상기 전사되고 변형된 AAV ITR은 (a) 전사된 기능적 Rep 결합 요소(RBE)를 포함하고, 선택적으로 전사된 기능적 RBE’를 더 포함하며, 또한 (b) 전사된 말단 분해 부위(TRS) 또는 전사된 역-상보적인 TRS(rcTRS) 또는 둘 모두가 결핍되고, 선택적으로, 상기 전사되고 변형된 AAV ITR은 전사된 D 영역 서열(D서열 또는 D’서열)을 더 포함하고; 및/또는 선택적으로, 상기 RPS 상호 작용 분자는 Rep78, Rep68, Rep52 및/또는 Rep40이다.
일부 실시 형태에 있어서, 상기 전사되고 변형된 AAV ITR은 상기 RNA의 3’말단 1000개의 뉴클레오티드, 800개의 뉴클레오티드, 500개의 뉴클레오티드, 300개의 뉴클레오티드 또는 200개의 뉴클레오티드 내에 존재하고, 선택적으로, 상기 전사되고 변형된 AAV ITR은 폴리A 서열, 폴리A 신호 서열(예를 들어, AAUAAA) 또는 RNA전사 종결 서열(예를 들어, 히스톤 다운스트림 요소)의 5’에 존재한다.
일부 실시 형태에 있어서, 상기 전사되고 변형된 AAV ITR은 전사된 야생형 Flip 또는 Flop ITR에 기반하여 변형된 것이고, 선택적으로, 상기 야생형 Flip 또는 Flop ITR은 AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAVrh74, AAV8, AAV9, AAV10, AAV11, AAV12 또는 AAV13으로부터 유래된다는(선택적으로, 상기 야생형 Flop ITR은 SEQ ID NO: 1의 뉴클레오티드 서열을 가짐).
일부 실시 형태에 있어서, 상기 전사되고 변형된 AAV ITR은 전사된 TRS 및 전사된 rcTRS 둘 모두가 결핍하다.
일부 실시 형태에 있어서, 상기 전사되고 변형된 AAV ITR은 전사된 D 영역 서열을 포함한다(선택적으로, 상기 변형된 AAV ITR은 SEQ ID NO: 3의 뉴클레오티드 서열을 가짐).
일부 실시 형태에 있어서, 상기 전사되고 변형된 AAV ITR은 상기 전사된 D 영역 서열이 결핍하다(선택적으로, 상기 변형된 AAV ITR은 SEQ ID NO: 2의 뉴클레오티드 서열을 가짐).
일부 실시 형태에 있어서, RNA 서열은 제2 전사되고 변형된 AAV ITR을 더 포함하고, 상기 제2 전사되고 변형된 AAV ITR은 제2 전사된 기능적 RBE 서열을 가지나 제2 전사된 TRS 또는 제2 전사된 rcTRS 또는 둘 모두가 결핍하며, 선택적으로, 상기 제2 전사되고 변형된 AAV ITR은 제2 전사된 D 영역 서열을 더 포함한다.
일부 실시 형태에 있어서, 상기 전사되고 변형된 AAV ITR 및 상기 제2 전사되고 변형된 AAV ITR은 서로 같다(또는 서로 다르다).
일부 실시 형태에 있어서, 상기 전사되고 변형된 AAV ITR 및 상기 제2 전사되고 변형된 AAV ITR은 (만약 존재하면)대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 결실, 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 돌연변이 또는 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 삽입을 포함한다.
일부 실시 형태에 있어서, 상기 제2 전사되고 변형된 AAV ITR은 상기 RNA 서열의 5’말단 1000개의 뉴클레오티드, 800개의 뉴클레오티드, 500개의 뉴클레오티드, 250개의 뉴클레오티드 또는 150개의 뉴클레오티드 내에 존재한다.
일부 실시 형태에 있어서, 상기 RPS는 MS2 서열, PP7 결합 부위 또는 com 결합 부위를 포함하고, 상기 RPS 상호 작용 분자는 결합과 같이 직접 또는 간접적으로 상기 RPS 상호 작용(예를 들어 결합)할 수 있는 RPS 상호 작용 단백질(RPSIP)을 포함하며, 예컨대 MS2 서열의 경우 박테리오파지 유래의 MS2 외피 단백질(MCP), PP7 결합 부위의 경우 PP7 박테리오파지 외피 단백질(PCP) 또는 com 결합 부위의 경우 박테리오파지 COM 단백질(COM)을 포함한다.
일부 실시 형태에 있어서, 상기 RPSIP는 직접 또는 간접적으로 상기 DNA 바이러스의 바이러스 입자의 바이러스 패키징 시스템의 단백질 성분(예를 들어 아데노 관련 바이러스2(AAV2)의 Rep78 및/또는 Rep68 또는 조립 활성화 단백질(AAP))과 관련된다(예를 들어 융합된다).
일부 실시 형태에 있어서, 상기 RNA 서열은 전사된 DNA 패키징 신호, 예를 들어, 전사된 야생형 AAV ITR 서열(예를 들어, 상기 RNA 서열은 전사되고 변형된 AAV ITR 서열을 포함하고, 상기 전사되고 변형된 AAV ITR 서열은 대응되는 전사된 야생형 AAV ITR 서열의 뉴클레오티드의 추가, 결실 및/또는 치환을 가져 상기 DNA 바이러스의 바이러스 입자의 DNA 패키징 능력을 저하)를 포함하거나 바람직하게는 포함하지 않는다.
일부 실시 형태에 있어서, RNA 서열은 (1) 전사된 전사 인핸서; (2) 전사된 인트론 서열 또는 엑손 서열(예를 들어 단백질 발현을 강화하기 위한 전사된 인트론 서열 또는 엑손 서열); (3) 5’ UTR 서열; (4) 3’ UTR 서열; (5) 폴리A 서열 또는 폴리아데닐화(폴리A) 신호 서열 및 선택적으로 상기 폴리A 신호 서열 다운스트림의 GU 풍부 영역; (6) 전사 후 조절 요소 또는 서열, 예를 들어 전사된 우드척 간염 바이러스(WHP) 전사 후 조절 요소(WPRE) 서열; 및/또는 (7) 전사 종결 서열(예를 들어 히스톤 다운스트림 요소)을 더 포함하고, 선택적으로, 상기 RNA 서열은 상기 전사 후 조절 요소 또는 서열의 3’ 및 상기 폴리A 서열 또는 폴리A 신호 서열의 5’에 위치하는 RPS를 포함한다.
일부 실시 형태에 있어서, RNA 서열 5’에서 3’ 방향으로 RSI, 임의의 전사된 WPRE 서열; RPS(예를 들어전사되고 변형된 AAV ITR, MS2 서열, PP7 결합 부위 또는 com 결합 부위); 및 폴리A 서열 또는 폴리A 신호 서열을 포함한다.
일부 실시 형태에 있어서, GOI는 단백질(예를 들어, 형광 단백질, 치료성 단백질, 항원 단백질, 또는 유전자 편집 단백질, 예를 들어 Cas 단백질, ZFN 단백질, TALEN 단백질), 효소(예를 들어 Cre 단백질 또는 CRISPR/Cas 이펙터 효소, 예를 들어, Cas9, Cas12, Cas13 또는 그 변이체), 구조 단백질, mRNA, 비코딩RNA(ncRNA), siRNA, piRNA, 짧은 헤어핀 RNA 또는 shRNA, 마이크로 RNA(miRNA) 또는 그 전구체(전구체 miRNA(pre-miRNA) 및 pri-miRNA(pri-miRNA) 포함), 리보솜 RNA(rRNA), 안티센스 서열 또는 올리고뉴클레오티드(ASO), CRISPR-Cas시스템의 RNA 성분(단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라)와 같은 가이드 RNA(또는 gRNA), CRISPR RNA(crRNA) 및 tracr RNA 포함), CRISPR/Cas 이펙터 효소를 위한 가이드 RNA 또는 gRNA, rRNA, tRNA, snoRNA, snRNA, exRNA, scaRNA, lncRNA, Xist 및 HOTAIR을 포함한다.
일부 실시 형태에 있어서, RNA 서열은 단일 가닥 RNA이고, 이는 길이가 약 8,900개의 뉴클레오티드 미만이고, 길이가 약 8,000개의 뉴클레오티드 미만이며, 길이가 약 7,000개의 뉴클레오티드 미만이고, 길이가 약 6,000개의 뉴클레오티드 미만이며, 길이가 약 5,200개의 뉴클레오티드 미만이고, 길이가 약 4,000개의 뉴클레오티드 미만이며, 길이가 약 3,000개의 뉴클레오티드 미만이고, 길이가 약 2,000개의 뉴클레오티드 미만이며, 길이가 약 4,700-5,200개의 뉴클레오티드이고, 길이가 약 4,700-5,000개의 뉴클레오티드이며, 길이가 약 4,700-4,800개의 뉴클레오티드이거나 또는 길이가 약 4,700개의 뉴클레오티드인 단일 가닥 RNA이다.
본 발명의 다른 양태는 폴리뉴클레오티드를 제공하고, 상기 폴리뉴클레오티드는 본 발명의 RNA 서열을 코딩하는 카세트를 포함하며, 선택적으로, 상기 폴리뉴클레오티드는 DNA 서열(예를 들어, DNA 플라스미드)이며, 상기 DNA 서열은 선택적으로 상기 DNA 플라스미드의 백본에 스터퍼 서열을 포함하고, 및/또는 선택적으로 AAV ITR과 같은 기능적 DNA 패키징 신호를 포함하지 않는다.
일부 실시 형태에 있어서, 폴리뉴클레오티드는 상기 카세트에 의해 코딩되는 RNA 서열에 조작 가능하게 연결되고 전사되도록 구동하는 프로모터를 더 포함한다.
일부 실시 형태에 있어서, 프로모터는 편재 프로모터이다.
일부 실시 형태에 있어서, 프로모터는 조직 특이적 프로모터이다.
일부 실시 형태에 있어서, 프로모터는 전신 발현 프로모터이다.
일부 실시 형태에 있어서, 프로모터는 유도성 프로모터이다.
일부 실시 형태에 있어서, 폴리뉴클레오티드는 프로모터에 의해 구동되는 RNA 서열의 전사를 강화하는 인핸서를 더 포함한다.
본 발명의 다른 양태는 재조합 DNA 바이러스의 바이러스 입자을 제공하고, 상기 재조합 DNA 바이러스의 바이러스 입자는 DNA 바이러스(예컨대 AAV 바이러스 또는 종양용해 바이러스)의 단백질 쉘(예컨대 캡시드)에 패키징되는 RNA 게놈(예컨대, 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열)을 포함한다.
일부 실시 형태에 있어서, DNA 바이러스는 AAV이고, 재조합 DNA 바이러스의 바이러스 입자는 재조합 RNA 아데노 관련 바이러스(rRAAV) 입자이며, 상기 재조합 RNA 아데노 관련 바이러스 입자는 (1) AAV 캡시드; 및 (2) 상기 AAV 캡시드 내에 패키징되는 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열을 포함한다.
일부 실시 형태에 있어서, AAV 캡시드는 혈청형 AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV-DJ, AAV PHP.eB, Anc80L65, Anc80L65AAP, AAVrh74 또는 7m8의 AAV로부터 유래된 캡시드를 포함한다.
본 발명의 다른 양태는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 제공하고, 상기 군체는 복수의 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)를 포함하며, 여기서 상기 군체 내의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 중의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 이상은 이에 패키징된 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열을 갖는다.
본 발명의 다른 양태는 숙주 세포를 제공하고, 상기 숙주 세포는 본 발명의 RNA 서열, 본 발명의 폴리뉴클레오티드, 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열, 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 및/또는 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 포함한다.
일부 실시 형태에 있어서, 숙주 세포는 바이러스 패키징 시스템을 더 포함하고, 상기 바이러스 패키징 시스템은 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열이 DNA 바이러스의 바이러스 입자 중에 패키징되도록 촉진한다.
일부 실시 형태에 있어서, 바이러스 패키징 시스템은 (1) rep 유전자 및 cap 유전자의 전사를 구동하는 하나 또는 복수의 프로모터의 전사 제어 하에 있는 AAV rep 유전자(예를 들어, Rep78, Rep68, Rep52 및/또는 Rep40의 코딩 서열) 및 AAV cap 유전자(예를 들어, VP1, VP2, VP3, AAP 및/또는 MAAP의 코딩 서열) 또는 그 발현 산물; (2) 아데노 바이러스 E2A, E4 및 VA유전자 또는 상기 하나 이상의 단백질과 같이 AAV 패키징에 필요한 하나 이상의 단백질의 하나 또는 복수의 코딩 서열; 및 (3) RPS 상호 작용 분자 또는 그 코딩 서열을 포함하며, 선택적으로, 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징하도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며, 및/또는 (3) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거된다.
일부 실시 형태에 있어서, 숙주 세포는 포유동물 세포 (예컨대 HEK293세포) 또는 곤충세포 (예컨대 Sf9 또는 Sf21세포)이다.
본 발명의 다른 양태는 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 생성하는 방법을 제공하고, 상기 방법은 a) 본 발명의 숙주 세포를 충분한 시간 동안 배양하는 단계; 및 b) 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 수득하는 단계를 포함한다.
일부 실시 형태에 있어서, 상기 방법은 재조합 DNA 바이러스의 바이러스 입자 또는 재조합 DNA 바이러스의 바이러스 입자의 군체를 단리 또는 정제하는 단계를 더 포함한다.
본 발명의 다른 양태는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자의 군체를 생성하는 방법을 제공하고, 상기 방법은 a) 바이러스 패키징 시스템(예를 들어, AAV 패키징 시스템)을 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열에 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 생성하기에 충분한 시간 동안 접촉시키는 단계 및 b) 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 수득하는 단계를 포함하고; 선택적으로, c) 수득한 재조합 DNA 바이러스의 바이러스 입자 또는 재조합 DNA 바이러스의 바이러스 입자의 군체를 단리 또는 정제하는 단계를 포함한다.
일부 실시 형태에 있어서, 바이러스 패키징 시스템(예를 들어, AAV 패키징 시스템)은 (1) 상기 RNA 서열을 패키징하기 위한 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘을 조립하기 위한 하나 이상의 단백질(예를 들어, AAV 캡시드를 조립하기 위한 VP1, VP2 및/또는 VP3) 또는 그 하나 또는 복수의 코딩 서열; (2) 상기 단백질 쉘의 조립 및/또는 상기 RNA 서열이 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘 중에 패키징되도록 촉진하기 위한 하나 이상의 단백질(예를 들어, AAV 패키징을 위한 Rep78, Rep68, Rep52 및/또는 Rep40) 또는 그 하나 또는 복수의 코딩 서열(예를 들어, 아데노 바이러스 E2a, E4 및 VA유전자); 및 (3) RPS 상호 작용 분자 또는 그 코딩 서열을 포함하며, 선택적으로, 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징하도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며, 및/또는 (3) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거된다.
본 발명의 다른 양태는 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열을 DNA 바이러스의 바이러스 입자에 패키징하는 시스템을 제공하고, 상기 시스템은 (1) 상기 RNA 서열을 패키징하기 위한 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘을 조립하기 위한 하나 이상의 단백질(예를 들어, AAV 캡시드를 조립하기 위한 VP1, VP2 및/또는 VP3) 또는 그 하나 또는 복수의 코딩 서열; (2) 상기 단백질 쉘의 조립 및/또는 상기 RNA 서열이 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘 중에 패키징되도록 촉진하기 위한 하나 이상의 단백질(예를 들어, AAV 패키징을 위한 Rep78, Rep68, Rep52 및/또는 Rep40) 또는 그 하나 또는 복수의 코딩 서열(예를 들어, 아데노 바이러스 E2a, E4 및 VA유전자); 및 (3) RPS 상호 작용 분자 또는 그 코딩 서열을 포함하며, 선택적으로, 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징하도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며, 및/또는 (3) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거된다.
본 발명의 다른 양태는 관심 유전자(GOI)를 세포, 식물 또는 동물에 전달하는 방법을 제공하고, 상기 방법은 상기 세포, 식물 또는 동물을 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자), 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체 또는 본 발명의 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체에 접촉시키는 단계를 포함하고, 여기서 상기 GOI는 본 발명의 RNA 서열에 의해 코딩된다.
본 발명의 다른 양태는 관심 RNA 서열(RSI)을 세포, 식물 또는 동물에 전달하는 방법을 제공하고, 상기 방법은 상기 세포, 식물 또는 동물을 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자), 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체 또는 본 발명의 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체에 접촉시키는 단계를 포함한다.
본 발명의 다른 양태는 필요한 대상체에서 질병 또는 장애를 진단, 예방 또는 치료하는 방법을 제공하고, 상기 방법은 상기 대상체에게 치료 유효량 또는 조제량의 본 발명의 또는 본 발명의 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 투여하는 단계를 포함한다.
본 발명의 다른 양태는 필요한 대상체의 질병 또는 장애를 진단, 예방 또는 치료하기 위한 약물의 제조에서 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자), 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체 또는 본 발명의 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체의 용도를 제공한다.
본 명세서에서 설명한 본 발명의 임의의 하나의 실시 형태는 실시예 또는 청구항에서만 설명되거나 이하의 하나의 양태/부분에서만 설명된 그러한 실시 형태를 포함하고, 명백하게 부인하거나 부당하다고 생각하지 않는 하 본 발명의 임의의 기타 하나 또는 복수의 실시 형태와 조합할 수 있는 것을 이해해야 한다.
도 1a는 3’ITR의 Flip 및 Flop 배열 중의 A:A’ 줄기 영역 서열, B:B’ 및 C:C’T 영역 서열 및 짝을 이루지 않는 D 영역 서열을 포함하는 AAV2의 야생형 ITR의 구조 및 서열을 나타낸다. RBE, RBE’ 및 TRS를 더 나타낸다.
도 1b 및 1c는 AAV1-7의 5’(도 1b) 및 3’(도 1c) ITR 서열의 다중 서열 정렬을 나타낸다.
도 2는 AAV 벡터/바이러스 입자 및 대상 RAAV 벡터/바이러스 입자의 생명 주기를 나타낸다.
도 3은 RAAV-ITR 벡터 및 대조 벡터의 전이 유전자 플라스미드의 개략도이고, 프로모터(예컨대 CAG 프로모터 또는 “C”), GOI 코딩 서열(예컨대 리포터 유전자 tdTomato 또는 “T”의 코딩 서열), WPRE 서열(또는 “W”), SV40 폴리A 신호 서열(또는 “S”) 및 야생형 ITR, 돌연변이/최적화된 ITR(dITR 또는 dITR-D)의 상대 위치 및 방향을 나타낸다.
도 4는 삼중 플라스미드 시스템으로 AAV 벡터 및 RAAV-ITR 벡터를 생성하는 개략도를 나타낸다. 3 가지 플라스미드(예를 들어, 전이 유전자 플라스미드, 패키징 플라스미드 및 헬퍼 플라스미드)로 HEK293세포와 같은 적합한 패키징 세포에 공동 형질감염시켜, 재조합 AAV 또는 RAAV 바이러스 벡터를 생성할 수 있다. 녹색 ITR은 야생형 ITR을 나타내고, 황색 ITR은 최적화된 ITR을 나타낸다. pCAG-전이 유전자, pCAG-전이 유전자 -ITR 및 pCAG-ITR-전이 유전자 -ITR은 전이 유전자 플라스미드이고, pAAV-rep/cap은 패키징 플라스미드이며, pHelper은 헬퍼 플라스미드이다.
도 5a 및 5b는 대표적인 바이러스 벡터 적정 방법을 나타낸다. 도 5a는 RAAV 적정의 흐름도이다. 도 5b는 Q-PCR의 프라이머 및 프로브를 나타낸다.
도 6a-6c는 RAAV-ITR 벡터의 적정을 나타낸다. 도 6a는 CITWS 군의 적정을 나타낸다. 도 6b는 CTWIS 군의 적정을 나타낸다. 도 6c는 CITWIS 군의 적정을 나타낸다.
도 7a 및 7b는 RAAV-dITR-D 벡터의 적정 및 감염을 나타낸다. 도 7a는 RAAV-dITR-D 벡터의 적정을 나타낸다. 도 7b는 RAAV-dITR-D 벡터의 체외 감염을 나타낸다. 동일 부피(5 μL)의 정제된 RAAV-dITR-D 벡터는 이미 2 × 105 개의 HEK293T세포를 체외 감염시키는 데 사용되었다. 감염 후 3일 및 5일에 형광 사진을 촬영한다.
도 8a는 RNA를 고효율적으로 RAAV 입자의 여러 플라스미드 작제물에 패키징하는 것을 입증하기 위한 개략도(비율에 따르지 않음)를 나타낸다.
도 8b는 패키징된 DNA 또는 RNA 중의 WPRE 서열을 검출하여, AAV-tdTomato 및 RAAV-tdTomato 작제물의 특이적 DNA 및 RNA 패키징 결과를 나타낸다. 이종 RNA 패키징 신호(RPS) 및 그 동종 RPS 결합 단백질(RBP, 예를 들어MS2의 MCP)이 모두 존재하는 경우, 유효한 RNA 패키징이 발생할 수 있다.
도 9a-9c는 확대된 플라스미드 백본을 사용하는 경우의 감소된 DNA 패키징을 나타낸다. 도 9a는 도 9b 및 9c 중 결과의 여러 플라스미드를 생성하기 위한 개략도(비율에 따르지 않음)이고, 삽입된 스터퍼 영역(L-CTWM3S)으로 인해 긴 백본 서열을 갖는 플라스미드를 포함한다. 도 9b는 CAG 특이적 프라이머로 CAG 프로모터 서열의 존재를 검출하여, AAV-tdTomato 및 RAAV-tdTomato의 특이적 DNA 패키징을 나타낸다. 도 9c는 WPRE 특이적 프라이머로 WPRE 서열의 존재를 검출하여, AAV-tdTomato 및 RAAV-tdTomato의 특이적 DNA 및 RNA 패키징을 나타낸다. 그 결과, 스터퍼 서열을 갖는 확대/연장 플라스미드 백본 서열을 사용하여 원하지 않는 DNA 패키징이 예상 밖으로 약 2배 감소될 수 있는 것으로 나타났다.
도 10a 및 10b는 MS2/MCP패키징 시스템을 사용하여 Cre전이 유전자를 고효율적으로 RAAV에 패키징하는 것을 나타낸다. 도 10a는 CAG 특이적 프라이머로 CAG 프로모터 서열의 존재를 검출하여, AAV-Cre 및 RAAV-Cre의 특이적 DNA 패키징을 나타낸다. 유의할 점은, CAG서열은 RAAV RNA 서열에 존재하지 않고, 검출된 RNA 신호는 백그라운드 신호이다. 도 10b는 WPRE 특이적 프라이머로 WPRE 서열의 존재를 검출하여, AAV-Cre 및 RAAV-Cre의 특이적 DNA 및 RNA 패키징을 나타낸다.
도 11a-11b는 RPS/RBP가 기존 AAV의 RNA 패키징을 개선한 것을 나타낸다. 도 11a는 DNA 패키징 신호(즉, ITR)만 존재하는 경우 AAV 게놈 패키징 결과를 나타낸다. 도 11b는 DNA 패키징 신호(ITR) 및 RNA 패키징 신호(MS2X3) 둘 모두가 존재하는 경우 AAV 게놈의 패키징을 나타낸다.
도 12a-12d는 RAAV 시스템 최적화 및 최적화된 RAAV 성능을 감정하는 결과를 나타낸다. 도 12a는 WPRE 서열 검출을 통해, AAV-Cre 및 RAAV-Cre의 특이적 게놈 패키징을 나타낸다. 도 12b는 Cre 서열 검출을 통해, AAV-Cre 및 RAAV-Cre의 특이적 게놈 패키징을 나타낸다. 도 12c는 AAV 및 RAAV 입자의 조성물의 은염색 분석을 나타낸다. 도 12d는 TEM를 통해 AAV 및 RAAV 입자에 대한 모폴로지 분석을 나타내고, 스케일바는 100 nm이다.
도 13a 및 13b는 AAV 및 RAAV의 DNA 패키징을 감소시킨 결과를 나타낸다. 도 13a는 조작된 Rep가 기존 AAV의 DNA 패키징을 감소시키는 것을 나타낸다. 도 13b는 여러 돌연변이 MCP 융합 단백질(이중 돌연변이 MCP 융합 단백질 DJ-MCPX2 포함)을 사용하여 RAAV 중의 DNA 패키징를 감소시키는 것을 나타낸다.
도 14a-14d는 RAAV 바이러스 입자가 기능적 전이 유전자 코딩 단백질을 발현시키는 것을 나타낸다. 샘플은 도 14a-14c에서 동일한 방식으로 지정한다. 도 14a는 감염 세포에서 Cre mRNA 수준의 시간 과정을 나타낸다. 도 14b는 감염 20시간 후 감염 세포에서 Cre mRNA 수준의 배율 변화를 나타낸다. 도 14c는 감염 세포에서 Cre DNA의 시간 과정을 나타낸다. 도 14d는 감염 5일 후 유세포 분석법을 통해 정량한 감염 세포의 백분율을 나타내고, n = 2 개의 반복이다.
도 15a-15d는 AAV 또는 RAAV 감염된 Ai9-MEF세포의 DNA 및 mRNA 분석 결과를 나타낸다. 도 15a는 Cre mRNA의 Ct값을 나타낸다. 도 15b는 Cre DNA의 Ct값을 나타낸다. 도 15c는 GAPDH mRNA의 Ct값을 나타낸다. 도 15d는 36B4 DNA의 Ct값을 나타낸다.
도 16은 Ai9-MEF세포의 유전자형 감정을 나타낸다.
도 17a-17b는 RAAV 입자의 순간 전이를 나타낸다. 도 17a는 기존 AAV 전달 후 감염 세포에서 Cre 단백질 수명의 단백질 웨스턴 블롯 분석을 나타낸다. 도 17b는 RAAV 전달 후 감염 세포에서 Cre 단백질 수명의 단백질 웨스턴 블롯 분석을 나타낸다.
도 18은 RAAV 시스템에서 테스트한 별도의 기능적 RPS/RBP쌍 - PP7/PCP쌍 및 com/COM쌍을 나타낸다.
도 19는 RAAV 시스템을 AAV-DJ, AAV5, AAV8 및 AAV9를 포함한 각종 AAV 혈청형에 적용하는 것을 나타낸다.
도 20a 및 20b는 별도의 AAP 및 MCP 융합 단백질이 RAAV 수율을 증가시키는 것을 나타낸다. 도 20a는 Cre 서열을 검출하여, RAAV-Cre의 특이적 게놈 패키징을 나타낸다. 도 20b는 RAAV와 AAP N-말단 또는 C-말단 융합물(AM 또는 MA 융합 작제물)의 RNA 패키징 효율의 비교를 나타낸다.
도 21a-21c는 RAAV-Cre을 Ai9- 마우스의 해마에 순간 전이한 결과를 나타낸다. 도 21a는 높은 조제량의 AAV-Cre을 Ai9- 마우스의 해마에 전이하는 것을 나타낸다. 도 21b는 낮은 조제량의 AAV-Cre을 Ai9- 마우스의 해마에 전이하는 것을 나타낸다. 도 21c는 높은 조제량의 RAAV-Cre을 Ai9- 마우스의 해마에 전이하는 것을 나타낸다. 도 21d는 대조 마우스의 결과를 나타낸다. 적색 신호: tdTomato; 녹색 신호: Cre; 남색 신호: DAPI(핵염색).
도 1b 및 1c는 AAV1-7의 5’(도 1b) 및 3’(도 1c) ITR 서열의 다중 서열 정렬을 나타낸다.
도 2는 AAV 벡터/바이러스 입자 및 대상 RAAV 벡터/바이러스 입자의 생명 주기를 나타낸다.
도 3은 RAAV-ITR 벡터 및 대조 벡터의 전이 유전자 플라스미드의 개략도이고, 프로모터(예컨대 CAG 프로모터 또는 “C”), GOI 코딩 서열(예컨대 리포터 유전자 tdTomato 또는 “T”의 코딩 서열), WPRE 서열(또는 “W”), SV40 폴리A 신호 서열(또는 “S”) 및 야생형 ITR, 돌연변이/최적화된 ITR(dITR 또는 dITR-D)의 상대 위치 및 방향을 나타낸다.
도 4는 삼중 플라스미드 시스템으로 AAV 벡터 및 RAAV-ITR 벡터를 생성하는 개략도를 나타낸다. 3 가지 플라스미드(예를 들어, 전이 유전자 플라스미드, 패키징 플라스미드 및 헬퍼 플라스미드)로 HEK293세포와 같은 적합한 패키징 세포에 공동 형질감염시켜, 재조합 AAV 또는 RAAV 바이러스 벡터를 생성할 수 있다. 녹색 ITR은 야생형 ITR을 나타내고, 황색 ITR은 최적화된 ITR을 나타낸다. pCAG-전이 유전자, pCAG-전이 유전자 -ITR 및 pCAG-ITR-전이 유전자 -ITR은 전이 유전자 플라스미드이고, pAAV-rep/cap은 패키징 플라스미드이며, pHelper은 헬퍼 플라스미드이다.
도 5a 및 5b는 대표적인 바이러스 벡터 적정 방법을 나타낸다. 도 5a는 RAAV 적정의 흐름도이다. 도 5b는 Q-PCR의 프라이머 및 프로브를 나타낸다.
도 6a-6c는 RAAV-ITR 벡터의 적정을 나타낸다. 도 6a는 CITWS 군의 적정을 나타낸다. 도 6b는 CTWIS 군의 적정을 나타낸다. 도 6c는 CITWIS 군의 적정을 나타낸다.
도 7a 및 7b는 RAAV-dITR-D 벡터의 적정 및 감염을 나타낸다. 도 7a는 RAAV-dITR-D 벡터의 적정을 나타낸다. 도 7b는 RAAV-dITR-D 벡터의 체외 감염을 나타낸다. 동일 부피(5 μL)의 정제된 RAAV-dITR-D 벡터는 이미 2 × 105 개의 HEK293T세포를 체외 감염시키는 데 사용되었다. 감염 후 3일 및 5일에 형광 사진을 촬영한다.
도 8a는 RNA를 고효율적으로 RAAV 입자의 여러 플라스미드 작제물에 패키징하는 것을 입증하기 위한 개략도(비율에 따르지 않음)를 나타낸다.
도 8b는 패키징된 DNA 또는 RNA 중의 WPRE 서열을 검출하여, AAV-tdTomato 및 RAAV-tdTomato 작제물의 특이적 DNA 및 RNA 패키징 결과를 나타낸다. 이종 RNA 패키징 신호(RPS) 및 그 동종 RPS 결합 단백질(RBP, 예를 들어MS2의 MCP)이 모두 존재하는 경우, 유효한 RNA 패키징이 발생할 수 있다.
도 9a-9c는 확대된 플라스미드 백본을 사용하는 경우의 감소된 DNA 패키징을 나타낸다. 도 9a는 도 9b 및 9c 중 결과의 여러 플라스미드를 생성하기 위한 개략도(비율에 따르지 않음)이고, 삽입된 스터퍼 영역(L-CTWM3S)으로 인해 긴 백본 서열을 갖는 플라스미드를 포함한다. 도 9b는 CAG 특이적 프라이머로 CAG 프로모터 서열의 존재를 검출하여, AAV-tdTomato 및 RAAV-tdTomato의 특이적 DNA 패키징을 나타낸다. 도 9c는 WPRE 특이적 프라이머로 WPRE 서열의 존재를 검출하여, AAV-tdTomato 및 RAAV-tdTomato의 특이적 DNA 및 RNA 패키징을 나타낸다. 그 결과, 스터퍼 서열을 갖는 확대/연장 플라스미드 백본 서열을 사용하여 원하지 않는 DNA 패키징이 예상 밖으로 약 2배 감소될 수 있는 것으로 나타났다.
도 10a 및 10b는 MS2/MCP패키징 시스템을 사용하여 Cre전이 유전자를 고효율적으로 RAAV에 패키징하는 것을 나타낸다. 도 10a는 CAG 특이적 프라이머로 CAG 프로모터 서열의 존재를 검출하여, AAV-Cre 및 RAAV-Cre의 특이적 DNA 패키징을 나타낸다. 유의할 점은, CAG서열은 RAAV RNA 서열에 존재하지 않고, 검출된 RNA 신호는 백그라운드 신호이다. 도 10b는 WPRE 특이적 프라이머로 WPRE 서열의 존재를 검출하여, AAV-Cre 및 RAAV-Cre의 특이적 DNA 및 RNA 패키징을 나타낸다.
도 11a-11b는 RPS/RBP가 기존 AAV의 RNA 패키징을 개선한 것을 나타낸다. 도 11a는 DNA 패키징 신호(즉, ITR)만 존재하는 경우 AAV 게놈 패키징 결과를 나타낸다. 도 11b는 DNA 패키징 신호(ITR) 및 RNA 패키징 신호(MS2X3) 둘 모두가 존재하는 경우 AAV 게놈의 패키징을 나타낸다.
도 12a-12d는 RAAV 시스템 최적화 및 최적화된 RAAV 성능을 감정하는 결과를 나타낸다. 도 12a는 WPRE 서열 검출을 통해, AAV-Cre 및 RAAV-Cre의 특이적 게놈 패키징을 나타낸다. 도 12b는 Cre 서열 검출을 통해, AAV-Cre 및 RAAV-Cre의 특이적 게놈 패키징을 나타낸다. 도 12c는 AAV 및 RAAV 입자의 조성물의 은염색 분석을 나타낸다. 도 12d는 TEM를 통해 AAV 및 RAAV 입자에 대한 모폴로지 분석을 나타내고, 스케일바는 100 nm이다.
도 13a 및 13b는 AAV 및 RAAV의 DNA 패키징을 감소시킨 결과를 나타낸다. 도 13a는 조작된 Rep가 기존 AAV의 DNA 패키징을 감소시키는 것을 나타낸다. 도 13b는 여러 돌연변이 MCP 융합 단백질(이중 돌연변이 MCP 융합 단백질 DJ-MCPX2 포함)을 사용하여 RAAV 중의 DNA 패키징를 감소시키는 것을 나타낸다.
도 14a-14d는 RAAV 바이러스 입자가 기능적 전이 유전자 코딩 단백질을 발현시키는 것을 나타낸다. 샘플은 도 14a-14c에서 동일한 방식으로 지정한다. 도 14a는 감염 세포에서 Cre mRNA 수준의 시간 과정을 나타낸다. 도 14b는 감염 20시간 후 감염 세포에서 Cre mRNA 수준의 배율 변화를 나타낸다. 도 14c는 감염 세포에서 Cre DNA의 시간 과정을 나타낸다. 도 14d는 감염 5일 후 유세포 분석법을 통해 정량한 감염 세포의 백분율을 나타내고, n = 2 개의 반복이다.
도 15a-15d는 AAV 또는 RAAV 감염된 Ai9-MEF세포의 DNA 및 mRNA 분석 결과를 나타낸다. 도 15a는 Cre mRNA의 Ct값을 나타낸다. 도 15b는 Cre DNA의 Ct값을 나타낸다. 도 15c는 GAPDH mRNA의 Ct값을 나타낸다. 도 15d는 36B4 DNA의 Ct값을 나타낸다.
도 16은 Ai9-MEF세포의 유전자형 감정을 나타낸다.
도 17a-17b는 RAAV 입자의 순간 전이를 나타낸다. 도 17a는 기존 AAV 전달 후 감염 세포에서 Cre 단백질 수명의 단백질 웨스턴 블롯 분석을 나타낸다. 도 17b는 RAAV 전달 후 감염 세포에서 Cre 단백질 수명의 단백질 웨스턴 블롯 분석을 나타낸다.
도 18은 RAAV 시스템에서 테스트한 별도의 기능적 RPS/RBP쌍 - PP7/PCP쌍 및 com/COM쌍을 나타낸다.
도 19는 RAAV 시스템을 AAV-DJ, AAV5, AAV8 및 AAV9를 포함한 각종 AAV 혈청형에 적용하는 것을 나타낸다.
도 20a 및 20b는 별도의 AAP 및 MCP 융합 단백질이 RAAV 수율을 증가시키는 것을 나타낸다. 도 20a는 Cre 서열을 검출하여, RAAV-Cre의 특이적 게놈 패키징을 나타낸다. 도 20b는 RAAV와 AAP N-말단 또는 C-말단 융합물(AM 또는 MA 융합 작제물)의 RNA 패키징 효율의 비교를 나타낸다.
도 21a-21c는 RAAV-Cre을 Ai9- 마우스의 해마에 순간 전이한 결과를 나타낸다. 도 21a는 높은 조제량의 AAV-Cre을 Ai9- 마우스의 해마에 전이하는 것을 나타낸다. 도 21b는 낮은 조제량의 AAV-Cre을 Ai9- 마우스의 해마에 전이하는 것을 나타낸다. 도 21c는 높은 조제량의 RAAV-Cre을 Ai9- 마우스의 해마에 전이하는 것을 나타낸다. 도 21d는 대조 마우스의 결과를 나타낸다. 적색 신호: tdTomato; 녹색 신호: Cre; 남색 신호: DAPI(핵염색).
1.
개요
본 명세서에 따른 본 발명은 DNA 바이러스 단백질 쉘을 포함한 재조합 바이러스 입자 및 단일 가닥 RNA(DNA가 아닌)과 같은 RNA를 포함한 “벡터 게놈”을 제공한다. “벡터 게놈”은 전형적인 바이러스 RNA가 아닐 수 있고, 이하에서 설명한 RNA 패키징 신호(RPS)를 제외하고, 이는 매우 적은(만약 있다면) 바이러스 기원의 서열을 가질 수 있기 때문이다. 다시 말해서, DNA 바이러스는 통상적으로 또는 자연적으로 DNA 바이러스 벡터 게놈을 단백질 쉘 내에 캡시드화하고, 본 명세서에 따른 DNA 바이러스의 바이러스 입자의 재조합 버전이 대체적으로 RNA를 캡시드화한다. “RNA” 또는 “리보핵산”은 각 자유 인산, 리보스 및 염기 (A(아데닌), U(우라실), G(구아닌) 또는 C(사이토신))으로 구성된 리보뉴클레오티드를 의미하고, 상기 리보뉴클레오티드 중의 각각은 모두 변형(예를 들어, 염기 변형, 글리코실 변형, 인산 변형, 예를 들어, 산소 변형, 불소 변형, 황 변형, 슈도변형(예를 들어, 슈도우리딘 변형), 메틸화, 캡핑(예를 들어, 5-캡핑))되거나 또는 변형되지 않을 수 있으며, 선택적으로 각각 자유 인산, 디옥시리보스 및 염기(A(아데닌), T(티민), G(구아닌) 또는 C(사이토신))로 구성된 디옥시뉴클레오티드와 직접 또는 간접적으로 융합되고, 상기 디옥시뉴클레오티드 중의 각각은 모두 변형(예를 들어, 염기 변형, 글리코신 변형, 인산 변형, 예를 들어, 산소 변형, 불소 변형, 황 변형, 슈도변형, 메틸화, 캡핑(예를 들어, 5-캡핑))되거나 또는 변형되지 않을 수 있으며, 예를 들어, RNA-DNA 키메라, DNA-RNA-DNA 키메라, RNA-DNA-RNA 키메라이다.
이러한 재조합 DNA 바이러스의 바이러스 입자의 전형적인(비한정적) 예시는 아데노 관련 바이러스(AAV)이고, 상기 아데노 관련 바이러스는 통상적으로/자연적으로 단일 가닥 DNA(ssDNA) 벡터 게놈을 캡시드화한다. 이러한 DNA 바이러스의 다른 하나의 비한정적 예시는 종양 용해성 DNA 바이러스이고, 예컨대 종양 용해성 헤르페스 바이러스(예를 들어, 단순 헤르페스 바이러스 또는 HSV), 종양 용해성 아데노 바이러스, 백시니아 바이러스(VACV), 수포성 구내염 바이러스(VSV) 등이다.
본 발명은 부분적으로 RNA 형태로 전사된 AAV ITR이 이러한 전사된 AAV ITR을 포함하는 전사된 RNA이 고효율적으로 직접 기존 AAV 바이러스 입자에 패키징되도록 촉진할 수 있는 놀라운 발견을 기반으로 한다.
본 명세서에 따른 본 발명은 또한 전사된 AAV ITR(RNA)을 제외하고, 일부 인공 또는 이종 RNA 서열 및 그 동종/대응/천연 RNA 결합 단백질도 야생형 패키징 신호 서열 및 DNA 바이러스 패키징에 유용한 기능을 대체하기 위해 RNA 패키징 신호(RPS)와 RPS 상호 작용 단백질(RPSIP)의 쌍으로 작용할 수 있음으로써, RNA를 DNA 바이러스 단백질 쉘에 패키징하고, 상기 DNA 바이러스 단백질 쉘은 통상적으로/자연적으로 DNA 벡터 게놈을 캡시드화하는 놀라운 발견을 기반으로 한다.
예를 들어, 야생형 AAV에서, DNA 벡터 게놈 5’ 및 3’ 말단 위치의 ITR 서열은 Rep-결합 요소(RBE) 및 RBE’와 같은 Rep 단백질(예컨대 Rep68 및 Rep78)과 상호 작용할 수 있는 서열 요소을 포함한다. Rep 단백질은 ITR을 결합하고 이러한 ITR 서열 요소를 포함하는 AAV ssDNA 벡터 게놈이 AAV 바이러스 입자에 패키징되도록 촉진한다.
발명자는 전사된 ITR 서열 및/또는 인공 또는 이종 RNA 서열, 예컨대 MS2 서열을 RPS로서 관심 RNA 서열(RSI)에 제공함으로써, 얻은 RPS 및 RSI로 구성된 RNA 서열을 MS2에 자연적으로 결합시키는 MCP - 박테리오파지 유래 MS2 외피 단백질(MCP)의 존재 하에 AAV 바이러스 단백질 쉘에 효과적으로 패키징할 수 있는 것을 이미 발견하였다. 인공 RPS/RPSIP쌍, 예를 들어 MS2/MCP는 RNA가 DNA 바이러스 단백질 쉘에 패키징되도록 촉진하는 능력은 DNA 패키징의 천연 ITR패키징 신호의 존재에 의존하지 않지만, 독립적으로 작용할 수 있다. 어떤 의미에서, 이종 MS2-MCP쌍은 RPS 및 RPSIP쌍의 인공 시스템을 구성하고, 상기 시스템은 효과적으로 천연 ITR-Rep DNA 패키징 시스템을 대체할 수 있으며, 전자는 RNA 패키징을 효과적으로 촉진하였다. 이러한 RNA를 함유하는 DNA 바이러스, 예컨대 AAV는 본 명세서에서 R-DNA 바이러스 입자(또는 AAV의 경우, RAAV임) 또는 재조합 R-DNA 바이러스 입자(또는 AAV의 경우 rRAAV로 칭함)로 칭할 수 있다.
본 발명의 R-DNA 바이러스 입자 및 RAAV 바이러스 입자는 적절한 길이(예를 들어, 각종 DNA 바이러스 또는 AAV의 패키징 한도 내)의 임의의 전이 유전자 또는 관심 유전자(GOI)의 RNA 전사체 또는 임의의 가이드 RNA를 DNA 바이러스 단백질 쉘 또는 AAV 바이러스 캡시드의 향성에 상용적인 숙주 세포에 전달하는 데 사용될 수 있다. 본 명세서에서 사용한 바와 같이, 재조합 DNA 바이러스 입자 예컨대 재조합 AAV 벡터, 벡터 게놈 및 재조합 AAV 바이러스 입자 또는 재조합 AAV 입자는 본 명세서에서 각각 rRAAV 벡터(재조합 RNA 아데노 관련 바이러스 벡터), 벡터 게놈 및 재조합 RAAV(rRAAV)바이러스 입자 또는 rRAAV 입자(“rRAAV 벡터” 및 “rRAAV 입자” 본 명세서에서 호환 가용 가능)로 칭한다.
특히, 한편으로, 임의의 정상적 또는 기존 AAV 벡터와 같이, 대상 RAAV 벡터는 DNA를 바이러스 유전재료로 포함하는 임의의 야생형 AAV에서 발견된 서로 같은 캡시드 중의 어느 하나로 구성될 수도 있다. 따라서, 대상 RAAV 벡터는 특이적/광범위한 향성 및 저면역원성과 같은 AAV외피로부터 유래된 모든 통상적인 우세를 갖는다.
그러나, 다른 한편으로, 대상 RAAV 벡터의 게놈은 수명이 짧은 RNA(예를 들어mRNA)로 구성되어, 이러한 RNA 유전 물질에서 임의의 코딩된 유전자 산물의 순간 발현을 초래한다.
적어도 일부 상황에서 이러한 순간 발현이 필요하다. 예를 들어, 본 발명의 RAAV 벡터는 체내 DNA 유전자 편집에 대해 유리하되, RAAV가 코딩하는 DNA유전자 편집기(예컨대 CRISPR/Cas시스템 이펙터 효소Cas9의 mRNA 코딩 서열 및 염기 편집기에 융합된 변이체)에 시간 제한적으로 노출되어 효과적인 유전자 편집을 실현할 수 있기 때문이다. 기존 DNA 기반 AAV 벡터에서 발현되는 동일한 DNA유전자 편집기의 지속적인 발현에 비해, 이러한 순간 발현되는 DNA 편집기는 오프-타겟 유전자 타겟팅을 줄이고 면역원성을 줄임으로써 유전자 요법의 안전성 스펙트럼도 개선한다.
그 외, 기존 DNA 기반 AAV 벡터에 비해, 대상 RAAV 벡터는 더욱 긴 전이 유전자를 포함할 수 있는데, 적어도 DNA 기반 AAV 벡터가 코딩하는 GOI에 필요한 프로모터(및 필요할 수 있는 임의의 비전사 인핸서 서열)가 발현되는 것을 배제하였기 때문이다.
비록 기존 DNA 기반 AAV 벡터에 비해, 대상 rRAAV 벡터는 다른 서열 요소 및 조직을 가지나, rRAAV 바이러스 입자는 기존 DNA 기반 AAV 벡터와 같은 진입 및 세포 내 운반 과정을 가진다. 그러나, 숙주 세포의 세포핵에 진입한 후 이들은 매우 다른 추세를 가진다. 세포핵 진입 후, 대상 RAAV 벡터의 mRNA 게놈을 방출하고, 그 후 세포질에 운반하여, 번역으로 이어진다. mRNA 수명은 통상적으로 몇분 또는 며칠 좌우로 매우 짧고, 최종적으로 복수의 세포 매커니즘을 통해 분해되는 것ㅣ으로 알려져 있다. 그러나, 제한된 mRNA 수명은 여전히 숙주 세포가 단백질 합성을 완료할 수 있도록 하고, 통상적으로 DNA 기반 AAV 벡터 중의 제2 가닥 cDNA 합성에 인해 지연되지 않으며, 코딩된 단백질이 빠르게 작용하도록 허용한다.
복수의 이러한 RPS/RPSIP쌍은 RNA를 DNA 바이러스에 패키징하는 데 사용될 수 있다. 발명자는 PP7 서열 및 PP7 박테리오파지 외피 단백질(PCP), 및 com서열 및 박테리오파지 COM 단백질(COM)을 포함하는 적어도 2개의 이러한 쌍을 입증하였고, 이들은 이종 RPS를 포함한 RNA(즉, 각각 PP7 및 com서열)을 효과적으로 패키징한다. 전시한 3 쌍의 RPS/RPSIP는 적어도 2개의 유형을 포괄한다. 천연 바이러스 패키징 시스템 MS2/MCP 및 PP7/PCP와 달리, com/COM은 천연적인 바이러스 패키징 시스템이 아니라 박테리오파지 Mu mom유전자의 전사 개시에서 역할을 하는 전사조절 인자로 알려져 있다. 복수의 전사되고 변형된 AAV ITR 서열도 본 발명의 RPS로 사용될 수 있다.
본 명세서에 따른 본 발명은 DNA 바이러스 특정 혈청형(예를 들어, 특정 AAV 혈청형)을 한정되지 않는다. 발명자는 각 상황에서 상용되는 RPSIP를 결합 사용하여, 적절한 RPS를 갖는 RNA 서열을 대표적인 AAV 바이러스(AAV5, AAV8, AAV9 및 AAV-DJ 포함)에 고효율적으로 패키징하는 것을 입증하였다.
본 명세서에 따른 본 발명은 또 여러 독립적인 방법을 통해 원하지 않는 DNA가 천연 DNA 바이러스 입자에 패키징되는 효율을 저하시킬 수 있는 발견에 기반한다.
일부 실시 형태에 있어서, 관심 RNA를 전사하는 DNA 벡터의 총 사이즈를 증가함으로써 원하지 않는 DNA의 패키징 효율을 저하시킬 수 있다. 예를 들어, 통상적으로 AAV 생산을 위한 삼중 형질감염 방법에 있어서, 관심 유전자(GOI)는 제1 플라스미드에 포함될 수 있고, 필요한 Rep 및 Cap 단백질은 제2 플라스미드의 rep 및 cap유전자에 의해 코딩되는 반면, 다른 AAV 패키징에 필요한 성분은 제3 플라스미드에서 제공한다. 본 발명의 이러한 실시 형태에 따르면, DNA 바이러스에 패키징될 RNA 서열은 제1 플라스미드로부터 전사될 수 있고, 상기 제1 플라스미드의 전체 크기는 랜덤으로 길이가 적어도 약 1 kb, 2 kb, 3 kb, 4 kb, 5 kb 이상의 스터퍼 서열과 같은 스터퍼 서열(예를 들어 인트론)을 포함시키거나 또는 제1 플라스미드의 전체 크기를 1 kb, 2 kb, 3 kb, 4 kb, 5 kb 이상의 스터퍼 서열, 예를 들어 약 6 kb, 7 kb, 8 kb, 9kb, 10 kb 이상의 스터퍼 서열 등으로 증가하는 것을 통해 인위적으로 증가할 수 있다.
일부 다른 실시 형태에 있어서, DNA 패키징을 촉진하는 전형적인 요소의 기능을 억제하는 것을 통해 원하지 않는 DNA 패키징 효율을 저하시킬 수 있다. DNA 패키징에 사용되는 이러한 전형적인 요소는 DNA 서열(예컨대 trs서열, RBE 또는 RBE’서열 또는 AAV의 전체 ITR 서열을 포함하는 DNA 패키징을 촉진하는 AAV ITR 서열의 요소); 및/또는 DNA 패키징에 참여하는 단백질 요소, 예컨대 DNA 서열과 상호 작용하는 단백질(예컨대 trs-엔도뉴클레아제 활성이 결핍하거나 약화된 활성을 갖는 돌연변이형 Rep68 또는 Rep 78 단백질)을 포함할 수 있다.
따라서, 본 발명의 하나의 양태는 DNA 바이러스의 바이러스 입자(예컨대 자연적으로 DNA를 패키징하는 DNA 바이러스)에 패키징될 수 있는 리보뉴클레오티드(RNA) 서열을 제공하고, 여기서 상기 RNA 서열은 (1) 관심 RNA 서열(RSI); 및 (2) RNA 패키징 신호(RPS)를 포함하며, 상기 RNA 패키징 신호는 직접 또는 간접적으로 RPS 상호 작용 분자(예를 들어, RPS 상호 작용 단백질 또는 RPSIP)와 상호 작용(예를 들어 결합)할 수 있고, 상기 RPS 상호 작용 분자는 상기 RNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진한다.
이러한 RNA 서열은 임의의 RSI(RNA)를 포함할 수 있고, “관심 유전자” 또는 “GOI”(DNA)에 의해 코딩될 수 있다.
본 명세서에 사용된 바와 같이, “관심 유전자” 또는 “GOI”는 단백질 또는 폴리펩티드의 임의의 코딩 서열을 포함하고, 인트론 및 엑손 서열 및/또는 임의의 비번역 RNA 또는 비코딩 RNA(ncRNA, 예컨대 siRNA, piRNA, 짧은 헤어핀 RNA 또는 shRNA, 마이크로 RNA 또는 miRNA 또는 그 전구체(전구체 miRNA 및 pri-miRNA 포함), 안티센스 서열 또는 올리고뉴클레오티드(ASO), CRISPR/Cas의 가이드 RNA 또는 gRNA, rRNA, tRNA, snoRNA, snRNA, exRNA, scaRNA, lncRNA, Xist 및 HOTAIR 등)의 코딩 서열을 포함한다.
유사하게, 대표적인(비한정적인) RSI는 예를 들어, mRNA와 같은 단백질(예를 들어, 치료성 단백질, 항원 단백질, 또는 CRISPR/Cas 이펙터 효소(“Cas 단백질”로 약칭)와 같은 유전자 편집 단백질, ZFN 단백질, TALEN 단백질)을 코딩하는 RNA, 또는 비코딩 기능적 RNA(예컨대 운반 RNA(tRNA), 리보솜 RNA(rRNA), 전이-메신저 RNA(tmRNA), 작은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 안티센스 RNA 또는 올리고뉴클레오티드(ASO), 마이크로 RNA(miRNA), RNA어댑터, 또는 CRISPR-Cas(예를 들어, Cas9, Cas12, Cas13) 시스템의 RNA 성분(예컨대 단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라), CRISPR RNA(crRNA) 및 tracr RNA) 또는 그 전구체, 또는 RISC복합물 또는 RNAi 경로의 RNA 성분(예컨대 shRNA, miRNA 또는 siRNA), 조절 RNA, Piwi 상호 작용 RNA(piRNA), 소핵소체 RNA(snoRNA), 긴 비코딩 RNA(lncRNA)(유전자간 lincRNA, 인트론ncRNA 및 센스/안티센스 lncRNA 포함), long intervening/유전자간 비코딩 RNA(lincRNA), 인핸서 RNA, bacterial small RNA(sRNA), snRNA, exRNA, scaRNA, Xist 및 HOTAIR 및 그 전구체를 포함한다.
본 발명의 RNA 서열 또는 GOI는 하나의 코딩 서열 또는 하나 이상의(예를 들어, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의) 코딩 서열을 포함할 수 있다. 코딩 서열의 길이 또는 모든 코딩 서열의 조합 길이는 특정 또는 선택된 DNA 바이러스의 바이러스 입자(예를 들어, AAV 바이러스 입자)에 패키징될 수 있는 RNA의 최대 길이를 초과하지 않을 수 있고, 특정 DNA 바이러스(예를 들어, AAV) 바이러스 입자와 다른 종 사이에서 다를 수 있다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열을 코딩하거나 본 발명의 RNA 서열에 대응되는 DNA 서열 또는 상기 DNA 서열의 역-상보적인 서열은 감소되거나, 약화되거나 또는 거의 DNA 바이러스의 바이러스 입자에 패키징되지 않는 능력을 갖는다. 예를 들어, DNA 서열은 본 발명의 RNA 서열(예를 들어, 상기 DNA 서열은 본 발명의 RNA 서열의 역-상보적인 서열을 가짐)을 코딩할 수 있다. DNA 서열은 본 발명의 RNA 서열에 대응될 수도 있는데, 상기 DNA 서열은 다른 측면에서 본 발명의 RNA 서열과 서로 같은 뉴클레오티드 서열을 갖고, 상기 DNA 서열을 제외하고 본 발명의 RNA 서열 중의 U가 아닌 T를 가지기 때문이다. 어쨌든, DNA 서열 또는 그 역-상보적인 서열은 AAV 패키징을 위한 AAV ITR 과 같은 DNA 바이러스의 바이러스 입자에 패키징되기 위한 기능적 DNA 패키징 신호가 결핍할 수 있어, 상기 DNA 서열 또는 그 역-상보적인 서열(DNA)이 감소되거나, 약화되거나 또는 거의 DNA 바이러스의 바이러스 입자에 패키징되지 않는 능력을 갖도록 한다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 DNA 작제물로부터 전사되고, 예컨대 상기 RNA 서열을 코딩하는 DNA 플라스미드로부터 전사되며, 여기서 상기 DNA 작제물/플라스미드는 그 백본 서열에 스터퍼 서열(예를 들어, 인트론 서열)을 포함하여 본 발명의 RNA 서열의 패키징을 강화하고 및/또는 원하지 않는 DNA가 DNA 바이러스의 바이러스 입자에 패키징되는 것을 줄인다. 예를 들어, 본 발명의 RNA 서열은 DNA 작제물/플라스미드로부터 전사될 수 있고, 상기 DNA 작제물/플라스미드의 전체 크기는 랜덤으로 길이가 적어도 약 1 kb, 2 kb, 3 kb, 4 kb, 5 kb 이상의 스터퍼 서열과 같은 DNA스터퍼 서열을 포함시키거나, 또는 상기 DNA 작제물/플라스미드의 전체 크기를 1 kb, 2 kb, 3 kb, 4 kb, 5 kb 이상의 스터퍼 서열, 예를 들어, 약 6 kb, 7 kb, 8 kb, 9 kb, 10 kb 이상의 스터퍼 서열 등으로 증가하는 것을 통해 인위적으로 증가할 수 있다. 스터퍼 서열은 본 발명의 RNA 서열 코딩 서열을 포함하는 전사 유닛의 업스트림(예를 들어, 인접 업스트림)에 위치할 수 있다(도 9a를 참조하면, 여기서 > 3 kb의 긴 스터퍼 서열은 본 발명의 예시적 RNA 서열 전사를 구동하는 CAG 프로모터의 업스트림에 접근하여 삽입함). 일부 실시 형태에 있어서, 스터퍼 서열은 프로모터의 업스트림에 직접 삽입되고, 상기 프로모터는 본 발명의 RNA 서열의 코돈 서열에 조작 가능하게 연결된다. 선택적으로, 일부 실시 형태에 있어서, 본 발명의 RNA 서열의 코딩 서열은 DNA 바이러스의 바이러스 입자의 기능적 천연 DNA 패키징 신호가 결핍되고, 예컨대 AAV 바이러스 입자에 패키징되는 기능적 ITR 서열이 결핍된다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 DNA 바이러스의 바이러스 입자에 패키징될 수 있고, 상기 DNA 바이러스의 바이러스 입자는 AAV 바이러스 입자이다. 임의의 AAV 바이러스는 모두 본 발명의 RNA 서열을 패키징하는 데 사용될 수 있고, AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV 11, AAV 12, AAV 13, AAVrh10, AAVrh74, AAVhu32, AAVhu37, AAV-DJ, AAV PHP.eB, Anc80L65, Anc80L65AAP, AAVrh74 또는 7m8을 포함하나 이에 한정되지 않는다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 DNA 바이러스의 바이러스 입자에 패키징될 수 있고, 상기 DNA 바이러스의 바이러스 입자는 종양용해 바이러스 입자이다. 예시적(비한정적) 종양용해 바이러스 입자는 종양 용해성 헤르페스 바이러스(예를 들어, 단순 헤르페스 바이러스 또는 HSV), 종양 용해성 아데노 바이러스, 백시니아 바이러스(VACV), 수포성 구내염 바이러스(VSV) 등을 포함한다.
본 발명의 RNA 서열 중 RPS의 위치는 자유로울 수 있다. 일부 실시 형태에 있어서, RPS는 본 발명의 RNA 서열의 5’ 말단에 위치하거나 가깝가나, 본 발명의 RNA 서열의 3’ 말단에 위치하거나 가깝가나, 또는 본 발명의 RNA 서열의 내부에 위치한다. 일부 실시 형태에 있어서, RPS는 관심 RNA 서열(RSI)의 5’ 말단에 위치하거나 가깝가나, 관심 RNA 서열(RSI)의 3’ 말단에 위치하거나 가깝가나, 또는 관심 RNA 서열의 내부(mRNA의 인트론 내)에 위치한다.
본 발명의 RNA 서열에는 하나 또는 복수의 RPS가 존재할 수 있다. 일부 실시 형태에 있어서, 본 발명의 RNA 서열은 같거나 대체로 같은 하나 이상의(예를 들어, 1개, 2개, 3개 이상의) RPS를 포함한다. 일부 실시 형태에 있어서, 본 발명의 RNA 서열은 하나 이상의(예를 들어, 1개, 2개, 3개 이상의) RPS를 포함하고, 여기서 적어도 2개가 서로 다르다.
본 발명의 RNA 서열에 하나 이상의 RPS가 존재하는 경우, 상기 하나 이상의 RPS 중의 적어도 2개의 직렬 연결되는 것과 같은 서로 인접하는 둘 사이에 임의의 링커 서열을 갖는다. 임의의 2개의 인접한 RPS 서열 사이의 링커는 서로 같거나 서로 다를 수 있다. 링커 서열은 랜덤 RNA 서열일 수 있고, 실질적인 2차 구조를 가지지 않으며, 공지의 기능적 서열 또는 요소를 가지지 않고 및/또는 GC 함량이 50% 보다 작을 수 있다. 링커의 길이는 1-1 kb, 1-500개의 염기, 1-200개의 염기, 1개 내지 약 100개의 염기, 1개 내지 약 60개의 염기, 약 5개 내지 약 55개의 염기, 약 10개 내지 약 30개의 염기 또는 약 15-25개의 염기 사이의 임의의 길이일 수 있다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 서로 인접한 3개의 RPS 서열을 포함하고, 2개의 링커 서열에 의해 나뉘어지며, 각 링커 서열은 독립적으로 약 20개 또는 약 50개의 염기이다. .예를 들어, 3개의 서로 같은 RPS 서열 중의 앞 2개는 20개의 염기의 링커에 의해 나뉘어지고 및/또는 상기 RPS 서열 중의 마지막 2개는 51개의 염기의 링커에 의해 나뉘어질 수 있다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 하나 이상의 RPS(예를 들어, 1개, 2개, 3개, 4개 또는 5개의 RPS)를 포함하고, 여기서 상기 하나 이상의 RPS 중의 적어도 2개는 서로 인접하지 않는다. 예를 들어, RPS 중의 하나는 본 발명의 RNA 서열의 5’ 말단에 위치할 수 있고, 다른 하나의 RPS는 본 발명의 RNA 서열의 3’ 말단에 위치할 수 있으며, 본 발명의 RNA 서열 내의 RSI로서 임의의 3번째 RPS는 mRNA의 인트론 내에 위치할 수 있다. 4번째 및/또는 5번째 RPS는 1번째, 2번째 또는 3번째 RPS 중의 임의의 하나에 가깝거나 인접할 수 있다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 서로 인접하지 않는(예를 들어, 각각 관심 RNA 서열(RSI)의 하나의 말단에 위치하거나 접근하는) 적어도 2개의(예를 들어, 2 개 이상의)RPS 서열을 포함한다.
일부 실시 형태에 있어서, RPS는 전사되고 변형된 AAV말단 역반복(ITR)을 포함하고, 여기서 상기 전사되고 변형된 AAV ITR은 (a) 전사된 기능적 Rep 결합 요소(RBE)를 포함하며, 선택적으로 전사된 기능적 RBE’를 더 포함하고; (b) 전사된 말단 분해 부위(TRS) 또는 전사된 역-상보적인 TRS(rcTRS) 또는 둘 모두가 결핍된다. 일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 전사된 D 영역 서열(D 서열 또는 D’서열)을 더 포함한다. 일부 실시 형태에 있어서, RPS 상호 작용 분자는 Rep78, Rep68, Rep52 및/또는 Rep40이다.
본 명세서에 사용된 바와 같이, “AAV 바이러스 입자”는 아데노 관련 바이러스(AAV)(데펜도파르보바이러스속에 속하고, 또한 파르보바이러스과에 속하는) 임의의 야생형 캡시드를 함유하는 바이러스 입자, 및 변형된 서열 및/또는 조직 또는 숙주 향성을 갖는 조작된 것이거나 변이체를 포함한다.
본 명세서에 사용된 바와 같이, “인트론”은 DNA 또는 RNA의 비코딩 단편을 의미하고, 통상적으로 스플라이싱을 통해 상기 비코딩 단편을 전사된 RNA에서 제거한다. 그러나, 본 발명의 RNA 서열은 인트론 서열, 예컨대 이종 유전자(관심 유전자 또는 GOI의 “이종”에 관련하여, 본 발명의 rRAAV 바이러스 입자를 통해 숙주 세포에 전달되는 전이 유전자로서 발현됨)로부터 유래된 인트론 서열을 포함하여, GOI의 발현을 강화시킬 수 있다. 본 발명의 RNA 서열 중의 이러한 인트론 서열은 스플라이싱을 통해 제거될 수 있고, 제거되지 않을 수도 있다. 그 외, 이러한 인트론 서열은 전사된 인핸서 또는 그 일부를 더 포함할 수 있는데, 일부 인핸서가 코딩DNA의 인트론 내에 위치할 수 있기 때문이다.
본 명세서에 사용된 바와 같이, “엑손”은 DNA 또는 RNA의 코딩 단편을 의미하고, 엑손은 단백질 서열로 번역된다. 그러나, 일부 실시 형태에 있어서, 본 발명의 RNA 서열 내의 엑손 서열은 GOI의 일부 또는 전부를 코딩할 수 있고, 상기 GOI는 본 발명의 rRAAV 바이러스 입자를 통해 숙주 세포에 전달되는 전이 유전자로서 발현된다. 다른 실시 형태에 있어서, 본 발명의 RNA 서열 내의 엑손 서열은 이종 유전자(GOI에 관련하여)에 속할 수 있고, 이러한 엑손의 존재는 GOI의 발현을 강화시킬 수 있다.
본 명세서에 사용된 바와 같이, “코딩 서열”은 산물을 코딩하는 DNA 또는 RNA의 폴리뉴클레오티드 서열을 포함하고, 상기 산물은 (a) 단백질 또는 폴리펩티드 또는 (2) 단백질 또는 폴리펩티드 이외의 산물(예를 들어, ncRNA, 예컨대 siRNA, piRNA, 짧은 헤어핀 RNA 또는 shRNA, 마이크로 RNA 또는 miRNA 또는 그 전구체(전구체 miRNA 및 pri-miRNA 포함), 안티센스 서열 또는 올리고뉴클레오티드(ASO), CRISPR/Cas의 가이드 RNA 또는 gRNA, rRNA, tRNA, snoRNA, snRNA, exRNA, scaRNA, lncRNA, Xist 및 HOTAIR 등)일 수 있다.
RAAV 바이러스 입자의 RNA가 AAV 캡시드 중에서 단리되어 세포에 방출되기만 하면, 관심 유전자의 리보뉴클레오티드 코딩 서열은 세포 내에서 추가 가공될 수 있다. 코딩 서열을 처리하여 하나 이상의 RNA 산물, 예컨대 siRNA, miRNA 및/또는 mRNA을 생성할 수 있고, 상기 산물은 추가로 하나 이상의 단백질산물로 번역되거나 또는 다른 세포 기계, 예컨대 RISC복합물 또는 CRISPR/Cas 이펙터 효소(예컨대 2류, II형, V형 또는 VI형 이펙터 효소)에 포함될 수 있다.
본 명세서에 사용된 바와 같이, 용어 “전사된” 및 그 문법 변체는 리보핵산(RNA) 뉴클레오티드를 포함한 뉴클레오티드 서열을 의미하고, 상기 리보핵산 뉴클레오티드는 DNA 주형(예를 들어, 이중 가닥 DNA 및/또는 단일 가닥 DNA)으로부터 전사된다. 전사된 RNA 분자는 AAV ssDNA의 플러스 가닥 또는 마이너스 가닥에 대응될 수 있고, 여기서 전사된 플러스 가닥 RNA는 DNA 주형의 마이너스 가닥으로부터 전사되며, 전사된 마이너스 가닥 RNA는 DNA 주형의 플러스 가닥으로부터 전사된다. 일부 실시 형태에 있어서, 전사된 RNA 분자는 이중 가닥 DNA 주형의 센스 또는 안티센스 가닥으로부터 전사될 수 있다. 예를 들어, 상황에 따라 결정되고, dsDNA 서열이 한 가닥의 서열(예컨대 SEQ ID NO: 1)로만 표시되는 경우, dsDNA를 주형으로 사용하는 전사된 RNA는 센스 또는 안티센스 가닥과 서로 같은 서열을 가질 수 있다. 다시 말해서, SEQ ID NO: 1로 표시되는 이중 가닥 DNA로부터 전사된 RNA는 SEQ ID NO: 1 또는 그 역-상보적인 서열과 서로 같은 서열을 가질 수 있고, 다만 RNA 중의 U가 DNA 중의 T를 치환하였다.
본 발명의 전사되고 변형된 AAV말단 역반복(ITR) 서열은 RNA 서열(AAV 바이러스 입자 내에서 캡시드화된 기존 AAV 바이러스 게놈 중의 단일 가닥 DNA 서열과 반대)이다. 야생형 AAV ITR DNA 서열로서, 전사되고 변형된 AAV ITR 서열(RNA)도 본 발명의 RNA 서열과 AAV Rep 단백질의 결합을 지지하고, 본 발명의 RNA 서열을 직접 AAV 바이러스 입자에 패키징 하는 것을 지지할 수 있다. 일부 실시 형태에 있어서, 전사되고 변형된 ITR 서열은 전사된 Rep 결합 요소(RBE)(예를 들어, 전사된 기능적 RBE) 및 선택적으로 전사된 RBE’(예를 들어, 전사된 기능적 RBE’)를 포함하여, Rep 결합에 사용된다. 일부 실시 형태에 있어서, 전사되고 변형된 ITR 서열은 RNA 서열을 AAV 바이러스 입자에 패키징하거나 캡시드화하는 것을 지지하거나 촉진한다.
일부 실시 형태에 있어서, 변형된 ITR은 야생형 RBE를 포함한다.
일부 실시 형태에 있어서, 변형된 ITR은 기능적 RBE를 포함하고, 상기 기능적 RBE는 야생형 RBE를 보류하여 AAV 패키징 능력(예컨대 Rep결합)의 적어도 약 60%, 70%, 80%, 90%, 95%, 100% 이상을 지지한다. 일부 실시 형태에 있어서, 야생형 RBE에 비해, 예를 들어 RBE의 하나 또는 복수의 뉴클레오티드의 삽입, 결실, 치환 및/또는 기타 돌연변이로 인해, 기능적 RBE는 약 30%, 25%, 20%, 15%, 10% 또는 5%에 달하는 서열 변이를 포함한다.
일부 실시 형태에 있어서, 이로부터 전사되고 변형된 AAV ITR이 전사되는 변형된 AAV ITR DNA 주형은 ITR로서 결함이 있는데, 이는 대응되는 야생형 AAV ITR의 하나 또는 복수의 기능이 결핍하고, 예컨대 TRS(전사된 말단 분해 부위, 이하 참조)에서 절단할 수 있기 때문이다. 이는 예를 들어 기능적 TRS 결핍으로 인한 것일 수 있다. 일 실시 형태에 있어서, 야생형 TRS를 완전히 결실하여, 변형된 ITR에 TRS가 없도록 한다. 일 실시 형태에 있어서, 결실, 삽입, 치환 및/또는 돌연변이를 통해 하나 또는 복수의 뉴클레오티드가 야생형 TRS로 돌연변이되어, AAV복제 기간에 더 이상 Rep에 의해 인식 및 절단되지 않는다.
일부 실시 형태에 있어서, 변형된 AAV ITR DNA 주형은 본 명세서에 따른 RBE 또는 그 기능적 변이체, 및 선택적으로 RBE’ 또는 그 기능 변이체를 보류한다. 일부 실시 형태에 있어서, RBE 및/또는 RBE’는 AAV Rep78/68 결합 측면에서 기능을 가진다.
본 발명의 전사되고 변형된 AAV말단 역반복(ITR)은 전사된 말단 분해 부위(TRS) 또는 전사된 역-상보적인 TRS(rcTRS) 또는 둘 모두가 더 결핍하다. 일부 실시 형태에 있어서, TRS는 변형된 AAV ITR의 5’ 말단에 위치한다. 일부 실시 형태에 있어서, TRS는 D 영역 서열과 RBE 사이에 위치한다.
일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 전사된 TRS 및 전사된 rcTRS 둘 모두가 결핍하다.
본 명세서에 사용된 바와 같이, “말단 분해 부위” 또는 “TRS”는 AAV복제 기간에 AAV Rep 단백질에 의해 인식되고 절개구가 생성된 단일 가닥 AAV 벡터 게놈(플러스 가닥 또는 마이너스 가닥) 중의 단일 가닥 DNA 서열을 의미한다. 본 명세서에 사용된 바와 같이, “역-상보적인 TRS(rcTRS)”는 단일 가닥 AAV 벡터 게놈(플러스 가닥 또는 마이너스 가닥) 중의 단일 가닥 DNA 서열을 의미하고, 상기 단일 가닥 DNA 서열은 TRS의 역-상보적인 서열이다. rcTRS는 TRS와 페어링되어 A 영역 줄기의 하나의 말단에 이중 가닥 DNA 영역을 형성한다. 도 1a-1c를 참조한다.
AAV2 ITR에서, TRS는 TTGGC의 서열을 포함하고, Rep절단 부위가 2개의 T’ 사이에 위치하며; rcTRS는 GCCAA의 서열을 포함한다. 하나의 TRS가 D 영역과 A 영역 서열의 경계 위치에 위치하고, A 영역 서열의 5’ 최말단(예를 들어, D 영역 서열과 RBE 사이에 위치)에 위치한다. 대표적인 AAV의 5’ 및 3’ ITR 다중 서열 정렬에서의 TRS 및 rcTRS에 관하여, 도 1b 및 1c를 참조한다.
본 명세서에 사용된 바와 같이, “전사된 TRS”는 TRS DNA 주형을 통해 전사되어 생성된 단일 가닥 RNA 서열이다. TTGGC를 포함한 AAV2 TRS에 관하여, 전사된 TRS는 GCCAA를 포함한다.
본 명세서에 사용된 바와 같이, “전사된 rcTRS”는 rcTRS DNA 주형을 통해 전사되어 생성된 단일 가닥 RNA 서열이다. GCCAA를 포함한 AAV2 rcTRS에 관하여, 전사된 rcTRS는 UUGGC를 포함한다.
따라서, 전사되고 변형된 AAV ITR이 GCCAA 서열에서 통상적으로 대응되는 전사된 야생형 AAV2 ITR 중의 위치에 GCCAA 서열이 없고, 예를 들어, GCCAA 서열의 완전 결실 또는 상기 GCCAA 서열 중의 하나 또는 복수의 뉴클레오티드의 삽입, 결실, 치환 및/또는 기타 돌연변이가 없으면, 상기 전사되고 변형된 AAV ITR은 “전사된 AAV2 TRS가 결핍하다”. 이는 TRS(TTGGC)의 완전 결실을 갖는 변형된 AAV ITR의 전사로 인한 것이거나 또는 야생형 TRS 중의 하나 또는 복수의 뉴클레오티드의 삽입, 결실, 치환 및/또는 기타 돌연변이로 인한 것일 수 있다.
따라서, 일부 실시 형태에 있어서, 본 발명의 RNA 서열 또는 전사되고 변형된 AAV ITR은 전사된 기능적 TRS가 결핍하다.
유사하게, 만약전사되고 변형된 AAV ITR이 UUGGC서열에서 통상적으로 대응되는 전사된 야생형 AAV2 ITR 중의 위치에 UUGGC서열이 없고, 예를 들어, GCCAA 서열의 완전 결실에 인한 것이거나 또는 상기 GCCAA 서열 중의 하나 또는 복수의 뉴클레오티드의 삽입, 결실, 치환 및/또는 기타 돌연변이가 없으면, 상기 전사된 그 변형된 AAV ITR은 “전사된 AAV2 rcTRS가 결핍하다”. rcTRS의 완전 결실을 갖는 변형된 AAV ITR의 전사로 인한 것이거나 또는 야생형 rcTRS 중의 하나 또는 복수의 뉴클레오티드의 삽입, 결실, 치환 및/또는 기타 돌연변이로 인한 것일 수 있다.
일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 전사된 D 영역 서열(야생형 AAV ITR 중의 D 또는 D’서열) 또는 돌연변이체 D 영역 서열(예를 들어, 하나 또는 복수의 뉴클레오티드 삽입, 결실, 치환 및/또는 기타 돌연변이를 갖는 서열)을 더 포함하고, 상기 돌연변이체 D 영역 서열은 거의 야생형 D 영역 서열의 기능을 보류하였다. 다른 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 전사된 D 영역 서열을 포함하지 않거나 또는 돌연변이체 D 영역 서열(예를 들어, 하나 또는 복수의 뉴클레오티드 삽입, 결실, 치환 및/또는 기타 돌연변이의 서열)을 포함하지 않으며, 상기 돌연변이체 D 영역 서열은 거의 야생형 D 영역 서열의 기능을 보류하였다.
일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 전사된(기능적) D 영역 서열을 포함한다. 선택적으로, 변형된 AAV ITR DNA 주형은 SEQ ID NO: 3의 뉴클레오티드 서열을 갖는다. 선택적으로, 전사되고 변형된 AAV ITR은 SEQ ID NO: 3의 RNA 등가물을 갖는다(즉, 상기 RNA 등가물은 SEQ ID NO: 3의 DNA 서열과 같은 염기 서열을 가짐). 선택적으로, 전사되고 변형된 AAV ITR은 SEQ ID NO: 3의 역-상보적인 서열의 RNA 등가물을 갖는다(즉, 상기 RNA 등가물은 SEQ ID NO: 3의 역-상보적인 서열의 DNA 서열과 같은 염기 서열을 가짐).
일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 전사된(기능적) D 영역 서열이 결핍하다. 선택적으로, 변형된 AAV ITR DNA 주형은 SEQ ID NO: 2의 뉴클레오티드 서열을 갖는다. 선택적으로, 전사되고 변형된 AAV ITR은 SEQ ID NO: 2의 RNA 등가물을 갖는다(즉, 상기 RNA 등가물은 SEQ ID NO: 2의 DNA 서열과 같은 염기 서열을 가짐). 선택적으로, 전사되고 변형된 AAV ITR은 SEQ ID NO: 2의 역-상보적인 서열의RNA 등가물(즉, 상기 RNA 등가물은 SEQ ID NO: 2의 역-상보적인 서열의 DNA 서열과 같은 염기 서열을 가짐).
본 명세서에 사용된 바와 같이, “D 영역 서열”은 D 서열 또는 그 역-상보적인 서열 D’ 서열을 의미한다. D 영역 서열의 위치는 ITR이 “Flip” 또는 “Flop” 배열을 채택하는 데 의해 결정된다. 도 1A-1C를 참조한다. 예를 들어, 야생형 AAV2 ITR(Srivastava et al., J. Viol. [Virology Journal] 45(2):555-564, 1983의 도 2를 참조하고, 참조로 본 명세서에 포함됨)에서, 플러스 가닥 ssDNA 서열은 5’에서 3’으로 A, B, B’, C, C’, A’, D, . . ., D’, A, C, C, B, B’ 및 A’으로 명명된 회문 서열 단편을 포함하고, 여기서 A:A’, B:B’, C:C’ 및 D:D’는 서로의 역-상보적인 서열이고, 염기 페어링된 줄기 서열을 형성할 수 있다(비록 D 및 D’서열은 ssDNA AAV 벡터 게놈에서 실제로 서로 염기 페어링되지 않을 수 있음). 플러스 가닥의 5’ ITR의 B:B’ 줄기는 C:C’줄기보다 서열의 하나의 말단(5’ 말단)에 더 가깝고, Flip ITR로 칭한다. 플러스 가닥의 3’ ITR의 C:C’ 줄기는 B:B’줄기보다 서열의 하나의 말단(3’ 말단)에 더 가깝고, Flop ITR로 칭한다.
예를 들어 전사된 야생형 D 영역 서열의 하나 또는 복수의 뉴클레오티드에 대해 결실, 삽입, 치환 및/또는 기타 돌연변이를 수행함으로써, 본 발명의 전사되고 변형된 AAV ITR 서열은 기능적의 전사된 D 영역 서열(D 또는 D’서열)이 결핍될 수 있다.
일부 실시 형태에 있어서, 본 발명의 RNA 또는 전사되고 변형된 AAV ITR 서열은 돌연변이되고 전사된 D 영역 서열 및/또는 돌연변이된 전사된 TRS 서열을 포함한다. 일부 실시 형태에 있어서, 본 발명의 RNA 또는 전사되고 변형된 AAV ITR 서열은 전사된 D 영역 서열을 포함하지 않거나 및/또는 전사된 TRS/rcTRS 서열을 포함하지 않는다.
일부 실시 형태에 있어서, 전사된 야생형 Flip ITR 또는 야생형 Flop ITR에 기반하여 전사되고 변형된 AAV ITR를 변형시킨다.
일부 실시 형태에 있어서, 야생형 Flip ITR 또는 야생형 Flop ITR은 AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV 11, AAV 12, AAV 13, AAVrh10, AAVrh74, AAVhu32, AAVhu37, AAV PHP.eB, Anc80L65, Anc80L65AAP, AAVrh74 또는 7m8로부터 유래된다. 선택적으로, 야생형 Flop ITR은 SEQ ID NO: 1의 뉴클레오티드 서열을 갖는다.
일부 실시 형태에 있어서, 전사된 D 영역 서열이 존재하고, 이는 RNA의 3’ 말단 50개의 뉴클레오티드(예를 들어, 40 nt, 30 nt, 25 nt 또는 20 nt) 내에 존재하지 않는다.
일부 실시 형태에 있어서, 전사된 D 영역 서열이 존재하고, 이는 RNA의 3’ 말단 50개의 뉴클레오티드(예를 들어, 40 nt, 30 nt, 25 nt 또는 20 nt) 내에 존재한다.
일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 RNA의 3’말단 1000개의 뉴클레오티드 내에 존재한다. 일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 RNA의 3’ 말단800개의 뉴클레오티드 내에 존재한다. 일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 RNA의 3’ 말단500개의 뉴클레오티드 내에 존재한다. 일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 RNA의 3’ 말단300개의 뉴클레오티드 내에 존재한다. 일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 RNA의 3’ 말단200개의 뉴클레오티드 내에 존재한다.
일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR은 폴리A 서열, 폴리A 신호 서열(예를 들어, AAUAAA) 또는 RNA전사 종결 서열(예를 들어, 히스톤 다운스트림 요소)의 5’에 존재한다.
본 명세서에 사용된 바와 같이, “폴리A 서열” 또는 “폴리A 꼬리”는 아데닌 리보뉴클레오티드 또는 아데노신일인산염의 스트링이다(예를 들어, 여기서 각 염기는 아데닌의 RNA의 스트링이다). 이러한 폴리A 꼬리는 mRNA의 핵배출, 번역 및 안정성에 매우 중요하다. 폴리A 서열의 길이는 본 발명의 상이한 mRNA 또는 RNA 서열에서 변화할 수 있고, 폴리A의 약 250개의 뉴클레오티드, 폴리A의 약 230개의 뉴클레오티드, 폴리A의 약 200개의 뉴클레오티드, 폴리A의 약 180개의 뉴클레오티드, 폴리A의 약 160개의 뉴클레오티드, 폴리A의 약 140개의 뉴클레오티드, 폴리A의 약 120개의 뉴클레오티드, 폴리A의 약 100개의 뉴클레오티드 이하일 수 있다.
본 명세서에 사용된 바와 같이, “폴리A 신호 서열”은 3’ 엑손 가장 다운스트림에 위치한 RNA 서열(예컨대 AAUAAA)을 의미하고, RNA절단 복합물을 통해 인식되며, 상기 복합물은 RNA중합 효소(예컨대 Pol II)를 통해 새로 전사된 RNA의 3’ 말단 서열을 절단함으로써, 폴리아데닐화를 생성할 수 있다. 그 후, 아데노신일인산염 유닛을 ATP에서 RNA의 새로 절단된 3’ 말단에 첨가하여, 폴리아데닐산 중합 효소가 폴리 (A)꼬리를 추가하고 연장시킨다. 초기 RNA절단은 통상적으로 CPSF 효소(절단/폴리아데닐화 특이적 인자)에 의해 촉매되고, 그 결합 부위-폴리A 신호 서열(통상적으로 전사된 RNA 상의 AAUAAA) 다운스트림 약 10-30개의 뉴클레오티드에서 발생한다. RNA절단 부위 5’ 위치에 위치하거나/또는 근접하는 서열은 보통(그러나 반드시는 아님) CA이다. RNA 절단 복합물을 통해 인식된 폴리A 신호 서열은 진핵 세포의 다른 군 사이에서 다르고, 대부분 인간 폴리아데닐화 부위는 AAUAAA 서열을 포함하며, 비록 이러한 서열은 식물 및 진균 mRNA 에서 흔한 것은 아니다. 그 외, CPSF와 더 약하게 결합하는 다른 변이체도 존재한다. RNA절단 및 후속 폴리아데닐화의 모든 이러한 서열 모티브는 모두 폴리A 신호 서열의 범위 내에 있도록 RNA 절단 복합물을 통해 인식된다.
또 본 명세서에 사용된 바와 같이, “폴리A 부위 다운스트림의 전사된 GU 풍부 영역”은 다른 단백질(예컨대 절단 자극 인자 또는 CstF)에 의해 CPSF와 폴리A 신호 서열의 결합 특이성을 강화하는 데 사용될 수 있는 서열(예를 들어, AAUAAA)을 의미한다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 CFI(절단 인자 I)의 인식 서열, 예컨대 포유동물 중의 UGUAA 서열을 더 포함하고, AAUAAA 폴리A 신호 서열이 결실되어도 상기 서열은 CPSF를 모집할 수 있다.
본 명세서에 사용된 바와 같이, “RNA 전사 종결을 위한 서열”은 전사를 종결하는 전사 RNA(예컨대 폴리A 꼬리가 없는 전사 RNA)의 3’ 말단에 존재하거나 가까운 RNA 서열 모티브를 포함한다. 후생동물 복제 의존적 히스톤 mRNA를 제외하고, 거의 모든 진핵 mRNA를 폴리아데닐화하며, 여기서 mRNA 가공은 고도 보수적인 스템 루프 구조와 다운스트림의 약 20개의 뉴클레오티드의 퓨린 풍부 영역을 갖는 부위에서 발생한다. 이들은 소수의(만약 유일한 것이 아니면) 진핵 mRNA이고, 이들은 폴리(A) 꼬리가 결핍되어, 스템 루프 구조로 마무리되며, 이어서 퓨린 풍부 서열이고, 히스톤 다운스트림 요소(HDE) 또는 히스톤 3’ UTR줄기 -고리로 칭한다. HDE는 RNA가 전사 기간/그 후에 절단되는 위치를 가이드함으로써, 히스톤 mRNA의 3′말단을 형성한다. HDE는 히스톤 mRNA의 핵원형질 운반과, 세포질 중 안정성 및 번역효율의 조절에 참여한다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 본 발명의 제2 전사되고 변형된 AAV ITR을 더 포함한다. 일부 실시 형태에 있어서, 제2 전사되고 변형된 AAV ITR은 전사된 기능적 RBE 서열을 가지나, 제2 전사된 TRS 또는 제2 전사된 rcTRS 또는 둘 모두가 결핍하고, 선택적으로, 상기 제2 전사되고 변형된 AAV ITR은 제2 전사된 D 영역 서열을 더 포함하거나 결핍하다. 일부 실시 형태에 있어서, 제2 전사되고 변형된 AAV ITR은 제2 전사된 돌연변이의 D 영역 서열 및/또는 제2 전사된 돌연변이의 TRS 서열을 포함한다.
일부 실시 형태에 있어서, 2개의 전사되고 변형된 AAV ITR을 갖는 본 발명의 RNA 서열에 있어서, 상기 전사되고 변형된 AAV ITR 및 제2 전사되고 변형된 AAV ITR은 서로 같다.
일부 실시 형태에 있어서, 2개의 전사되고 변형된 AAV ITR을 갖는 본 발명의 RNA 서열에 있어서, 상기 전사되고 변형된 AAV ITR 및 2차 전사변형의 AAV ITR은 서로 다르다.
일부 실시 형태에 있어서, 전사되고 변형된 AAV ITR, 제2 전사되고 변형된 AAV ITR(만약 존재하면)은 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 결실, 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 돌연변이 또는 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 삽입을 포함한다.
일부 실시 형태에 있어서, 2개의 전사되고 변형된 AAV ITR을 갖는 본 발명의 RNA 서열에 있어서, 제2 전사되고 변형된 AAV ITR은 RNA 서열의 5’말단 1000개의 뉴클레오티드, 800개의 뉴클레오티드, 500개의 뉴클레오티드, 250개의 뉴클레오티드 또는 150개의 뉴클레오티드 내에 있다.
일부 실시 형태에 있어서, RPS는 MS2 서열, PP7 결합 부위 또는 com 결합 부위를 포함하고, 또한 상기 RPS 상호 작용 분자는 직접 또는 간접적으로 상기 RPS 상호 작용(예를 들어 인식 및 결합)할 수 있는 RPS 상호 작용 단백질(RPSIP)을 포함하며, 예컨대 MS2 서열의 경우 박테리오파지 유래의 MS2 외피 단백질(MCP), PP7 결합 부위의 경우 PP7 박테리오파지 외피 단백질(PCP) 또는 com 결합 부위의 경우 박테리오파지 COM 단백질(COM)을 포함한다. 이러한 RPS/RPSIP쌍의 서열은 명세서의 서열 부분에서 설명된다.
상술한 하나 이상의 RPS 서열 중의 어느 하나는 전사되고 변형된 ITR 서열 중의 어느 하나, 및 MS2 서열, PP7 결합 부위 및/또는 com 결합 부위 중의 어느 하나를 포함하여, 단독적으로 또는 조합적으로, 적절/상용되는 동종 RPSIP 존재 하에서 본 발명의 RNA 서열을 DNA 바이러스의 바이러스 입자에 패키징하도록 촉진할 수 있다.
일부 실시 형태에 있어서, RPSIP는 DNA 바이러스의 바이러스 입자의 바이러스 패키징 시스템의 단백질 성분이거나 또는 그와 직접 또는 간접적으로 관련된다. 예를 들어, 일부 실시 형태에 있어서, RPSIP는 DNA 바이러스의 바이러스 패키징 시스템의 단백질 성분이고, 예컨대 AAV의 Rep78, Rep68, Rep52 및/또는 Rep40이다. 예를 들어, 일부 실시 형태에 있어서, RPSIP는 DNA 바이러스의 바이러스 패키징 시스템의 단백질 성분과 직접적으로 융합될 수 있다. AAV의 바이러스 패키징 시스템의 예시적 단백질 성분은 Rep 단백질(예컨대 아데노 관련 바이러스2(AAV2)의 Rep78 및/또는 Rep68) 중의 어느 하나 및/또는 조립 활성화 단백질(AAP) 중의 어느 하나를 포함한다.
일부 실시 형태에 있어서, 융합은 N 말단 융합이고, 여기서 RPSIP(예컨대 MCP, PCP 또는 COM)는 Rep68/78 단백질 및/또는 AAP의 N 말단에서 융합된다.
일부 실시 형태에 있어서, 융합은 N 말단 융합이고, 여기서 RPSIP(예컨대 MCP, PCP 또는 COM)는 Rep68/78 단백질 및/또는 AAP의 C 말단에서 융합된다.
일부 실시 형태에 있어서, 융합은 직접 융합이고, 그 사이에 링커 서열이 존재하지 않는다.
일부 실시 형태에 있어서, 융합은 하나 또는 복수의 링커 서열에 의하되, 예컨대 Gly 및 Ser이 풍부한 링커 또는 GS링커의 플랙시블 펩티드 링커를 포함할 수 있다. 대표적인 GS링커는 Gly 또는 Ser의 1개, 2개, 3개, 4개, 5개 이상의 반복, 예컨대 GS, GSS, GSSS, GSSSS 및 그 반복(예를 들어, (GSp)n, 여기서 p는 1-5 사이의 정수이고, n은 1-20 사이의 정수임)을 포함한다. 하나의 전형적인 이러한 GS링커는 GS3링커 또는 GS4링커이다. 일부 실시 형태에 있어서, p는 3 또는 4이고, n은 1이다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 전사된 DNA 패키징 신호, 예를 들어, 전사된 야생형 AAV ITR 서열을 포함할 수 있으나 바람직하게는 포함하지 않는다. 예를 들어, 본 발명의 RNA 서열은 전사되고 변형된 AAV ITR 서열을 포함할 수 있고, 상기 전사되고 변형된 AAV ITR 서열은 대응되는 전사된 야생형 AAV ITR 서열의뉴클레오티드의 추가, 결실 및/또는 치환을 가져 상기 DNA 바이러스의 바이러스 입자의 DNA 패키징 능력을 저하시킨다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 (1) 단백질의 코딩 서열(예컨대, 치료성 단백질 또는 CRISPR/Cas 이펙터 효소(Cas9 또는 그 변이체와 같은 Cas이펙터 효소 중의 어느 하나를 포함하고, 선택적으로 염기 편집기와 융합)를 코딩하는 mRNA), 비코딩 RNA(ncRNA), 또는 기능적 RNA(예컨대 tRNA, 리보솜 RNA(rRNA), RNAi 시약 또는 그 전구체, siRNA, shRNA, miRNA 또는 그 전구체(전구체 miRNA 및 pri-miRNA 포함), 안티센스 RNA(ASO), piRNA, CRISPR-Cas시스템의 RNA 성분(예컨대, 가이드 RNA(또는 gRNA), 단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라), CRISPR RNA(crRNA), 또는 tracr RNA), snoRNA, snRNA, exRNA, scaRNA, lncRNA, Xist 및 HOTAIR 등); (2) 전사된 전사 인핸서; (3) 전사된 인트론 서열 또는 엑손 서열(예컨대 단백질 발현을 강화시키기 위한 서열); (4) 5’UTR 서열; (5) 3’ UTR 서열; (6) 폴리A 서열 또는 (전사된)폴리아데닐화(폴리A) 신호 서열 및 선택적으로, 전사된 폴리A부위 및 상기 폴리A부위전사된 다운스트림 GU풍부 영역; (7) 전사 후 조절 요소 또는 서열, 예컨대 전사된 우드척 간염 바이러스(WHP) 전사 후 조절 요소(WPRE) 서열; 및/또는 (8) 전사 종결 서열(예컨대 히스톤 다운스트림 요소) 중의 하나 이상을 더 포함한다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 전사 후 조절 요소 또는 서열의 3’ 및 폴리A 서열 또는 폴리A 신호 서열의 5’에 위치한 RPS를 포함한다.
예를 들어, 일부 실시 형태에 있어서, 본 발명의 RNA 서열은 5’에서 3’방향으로 RSI; 임의의 전사된 WPRE 서열(존재하거나 존재하지 않을 수 있음); RPS(예를 들어전사되고 변형된 AAV ITR, MS2 서열, PP7 결합 부위 또는 com 결합 부위); 및 폴리A 서열 또는 폴리A 신호 서열을 포함한다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열 코딩 또는 GOI는 단백질(예를 들어, 형광 단백질, 치료성 단백질, 항원 단백질, 또는 유전자 편집 단백질, 예컨대 Cas 단백질, ZFN 단백질, TALEN 단백질), 효소(예컨대 Cre 단백질 또는 CRISPR/Cas 이펙터 효소, 예를 들어, Cas9, Cas12, Cas13 또는 그 변이체), 구조 단백질, mRNA, 비코딩RNA(ncRNA), siRNA, piRNA, 짧은 헤어핀 RNA 또는 shRNA, 마이크로 RNA(miRNA) 또는 그 전구체(전구체 miRNA 및 pri-miRNA 포함), 리보솜 RNA(rRNA), 안티센스 서열 또는 올리고뉴클레오티드(ASO), CRISPR-Cas시스템의 RNA 성분(단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라)와 같은 가이드 RNA(또는 gRNA), CRISPR RNA(crRNA) 및 tracr RNA 포함), CRISPR/Cas 이펙터 효소를 위한 가이드 RNA 또는 gRNA, rRNA, tRNA, snoRNA, snRNA, exRNA, scaRNA, lncRNA, Xist 및 HOTAIR을 포함한다.
본 발명의 RNA 서열의 총길이는 AAV 바이러스 입자의 패키징 능력에 의해 결정된다. 대다수 AAV 바이러스 입자의 패키징 능력은 약 4,700-5,200개의 뉴클레오티드이나, 일부 AAV 바이러스 입자, 예컨대 AAV5 입자는 8,900개에 달하는 뉴클레오티드를 패키징할 수 있다.
따라서, 일부 실시 형태에 있어서, AAV 바이러스 입자에 패키징되는 본 발명의 RNA 서열은 길이가 약 8,900개의 뉴클레오티드의 단일 가닥 RNA(ssRNA)보다 작다.
일부 실시 형태에 있어서, RNA 서열은 길이가 약 8,000개의 뉴클레오티드의 ssRNA보다 작다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 7,000개의 뉴클레오티드의 ssRNA보다 작다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 6,000개의 뉴클레오티드의 ssRNA보다 작다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 5,200개의 뉴클레오티드의 ssRNA보다 작다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 4,000개의 뉴클레오티드의 ssRNA보다 작다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 보다 작다약 3,000개의 뉴클레오티드의 ssRNA보다 작다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 2,000개의 뉴클레오티드의 ssRNA보다 작다.
일부 실시 형태에 있어서, RNA 서열은 길이가 약 4,700-5,200개의 뉴클레오티드의 ssRNA이다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 4,700-5,000개의 뉴클레오티드의 ssRNA이다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 4,700-4,800개의 뉴클레오티드의 ssRNA이다. 일부 실시 형태에 있어서, RNA 서열은 길이가 약 4,700개의 뉴클레오티드의 ssRNA이다.
본 발명의 다른 한 양태는 폴리뉴클레오티드를 제공하고, 상기 폴리뉴클레오티드는 본 발명의 RNA 서열의 (전사)카세트를 포함하며, 선택적으로, 상기 폴리뉴클레오티드는 DNA 서열(예를 들어, DNA 플라스미드)이며, 상기 DNA 서열은 선택적으로 상기 DNA 플라스미드의 백본에 스터퍼 서열을 포함하고, 및/또는 선택적으로 AAV ITR과 같은 기능적 DNA 패키징 신호를 포함하지 않는다.
일부 실시 형태에 있어서, 카세트를 포함하는 폴리뉴클레오티드는 본 발명의 RNA 서열을 코딩하는 DNA 벡터이다. 이러한 DNA 벡터 및/또는 그 카세트는 예를 들어 AAV 바이러스 입자에 추가로 패키징되는 데 사용되는 본 발명의 RNA 서열을 전사하고 생성하는 데 사용될 수 있다.
일부 실시 형태에 있어서, 폴리뉴클레오티드는 프로모터를 더 포함하고, 상기 프로모터는 카세트를 통해 코딩되는 본 발명의 RNA 서열에 조작 가능하게 연결되고 전사를 구동하여 본 발명의 RNA 서열을 생성하도록 한다.
일부 실시 형태에 있어서, 프로모터는 편재 프로모터이다.
일부 실시 형태에 있어서, 프로모터는 조직 특이적 프로모터이다.
일부 실시 형태에 있어서, 프로모터는 전신 발현 프로모터이다.
일부 실시 형태에 있어서, 프로모터는 유도성 프로모터이다.
일부 실시 형태에 있어서, 폴리뉴클레오티드는 프로모터에 의해 구동되는 RNA 서열의 전사를 강화하는 인핸서를 더 포함한다.
본 발명의 다른 양태는 재조합 DNA 바이러스의 바이러스 입자을 제공하고, 상기 재조합 DNA 바이러스의 바이러스 입자는 DNA 바이러스(예컨대 AAV 바이러스 또는 종양용해 바이러스)의 단백질 쉘(예컨대 캡시드)에 패키징되는 RNA 게놈(예컨대, 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열)을 포함한다.
일부 실시 형태에 있어서, DNA 바이러스는 AAV이고, 재조합 DNA 바이러스의 바이러스 입자는 재조합 RNA 아데노 관련 바이러스(rRAAV) 입자이며, 상기 재조합 RNA 아데노 관련 바이러스 입자는 (1) AAV 캡시드; 및 (2) 상기 AAV 캡시드 내에 패키징되는 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열을 포함한다.
일부 실시 형태에 있어서, AAV 캡시드는 혈청형AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAVrh74, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV-DJ, AAV PHP.eB, Anc80L65, Anc80L65AAP 또는 7m8의 AAV로부터 유래된 캡시드를 포함한다.
본 발명의 하나의 관련 양태는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 제공하고, 상기 군체는 본 발명의 복수의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)를 포함하며, 여기서 상기 군체 내의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 중의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 이상은 패키징 그 중에 패키징되는 본 발명의 캡시드화 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열을 갖는다.
일부 실시 형태에 있어서, 재조합 바이러스 입자(예를 들어, rRAAV 입자)의 군체는 적어도 1 × 104개의 바이러스 입자, 적어도 2 × 104개의 바이러스 입자, 적어도 5 × 104개의 바이러스 입자, 적어도 1 × 105개의 바이러스 입자, 적어도 2 × 105개의 바이러스 입자, 적어도 5 × 105개의 바이러스 입자, 적어도 1 × 106개의 바이러스 입자, 적어도 2 × 106개의 바이러스 입자, 적어도 5 × 106개의 바이러스 입자, 적어도 1 × 107개의 바이러스 입자, 적어도 2 × 107개의 바이러스 입자, 적어도 5 × 107개의 바이러스 입자, 적어도 1 × 108개의 바이러스 입자, 적어도 2 × 108개의 바이러스 입자, 적어도 5 × 108개의 바이러스 입자, 적어도 1 × 109개의 바이러스 입자, 적어도 2 × 109개의 바이러스 입자, 적어도 5 × 109개의 바이러스 입자, 적어도 1 × 1010개의 바이러스 입자, 적어도 2 × 1010개의 바이러스 입자, 적어도 5 × 1010개의 바이러스 입자, 적어도 1 × 1011개의 바이러스 입자, 적어도 2 × 1011개의 바이러스 입자, 적어도 5 × 1011개의 바이러스 입자, 적어도 1 × 1012개의 바이러스 입자, 적어도 2 × 1012개의 바이러스 입자, 적어도 5 × 1012개의 바이러스 입자, 적어도 1 × 1013개의 바이러스 입자, 적어도 2 × 1013개의 바이러스 입자, 적어도 5 × 1013개의 바이러스 입자, 적어도 1 × 1014개의 바이러스 입자, 적어도 2 × 1014개의 바이러스 입자, 적어도 5 × 1014개의 바이러스 입자, 적어도 1 × 1015개의 바이러스 입자, 적어도 2 × 1015개의 바이러스 입자, 적어도 5 × 1015개의 바이러스 입자, 적어도 1 × 1016개의 바이러스 입자, 적어도 2 × 1016개의 바이러스 입자 또는 적어도 5 × 1016개의 바이러스 입자를 포함한다.
일부 실시 형태에 있어서, 재조합 바이러스 입자의 군체 내의 최대 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10%, 5%, 3%, 2%, 1%, 0.1%, 0.01% 이하는 비RNA(예를 들어 DNA)를 바이러스 입자 내에 캡시드화한다.
본 발명의 다른 양태는 숙주 세포를 제공하고, 상기 숙주 세포는 본 발명의 RNA 서열, 본 발명의 폴리뉴클레오티드, 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열, 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 및/또는 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rAAV 입자)의 군체를 포함한다.
일부 실시 형태에 있어서, 숙주 세포는 바이러스 패키징 시스템을 더 포함하고, 상기 바이러스 패키징 시스템은 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열이 DNA 바이러스의 바이러스 입자 중에 패키징되도록 촉진한다.
일부 실시 형태에 있어서, 바이러스 패키징 시스템은 (1) rep 유전자 및 cap 유전자의 전사를 구동하는 하나 또는 복수의 프로모터의 전사 제어 하에 있는 AAV rep 유전자(예를 들어, Rep78, Rep68, Rep52 및/또는 Rep40의 코딩 서열) 및 AAV cap 유전자(예를 들어, VP1, VP2 및/또는 VP3, AAP 및/또는 MAAP의 코딩 서열) 또는 그 발현 산물; (2) 아데노 바이러스 E2A, E4 및 VA유전자 또는 상기 하나 이상의 단백질과 같이 AAV 패키징에 필요한 하나 이상의 단백질의 하나 또는 복수의 코딩 서열; 및 (3) RPS 상호 작용 분자 또는 그 코딩 서열을 포함한다.
일부 실시 형태에 있어서, 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며; 및/또는 (3) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거된다. 실시 형태에 있어서, 스터퍼 서열(예를 들어 인트론)을 폴리뉴클레오티드(예를 들어 DNA 플라스미드)(의 예를 들어 백본)에 삽입하여 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드의 크기를 확대한다.
일부 실시 형태에 있어서, AAV rep 유전자, AAV cap 유전자 및/또는 AAV 패키징에 필요한 단백질은 DNA가 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진하는 능력을 약화시키거나 또는 감소시키는 돌연변이를 포함한다.
일부 실시 형태에 있어서, DNA 패키징에 필요한 Rep68/Rep 78 단백질은 돌연변이를 포함하고, 상기 돌연변이는 그 trs-엔도뉴클레아제 활성을 파괴하거나 약화시킨다. trs-엔도뉴클레아제 활성은 trs 서열 또는 부위에서 AAV복제(DNA) 중간체를 분해하는 데 필요하고, 이로써 AAV 캡시드 내에 패키징되기 전에, AAV ssDNA의 단일 유닛을 분해할 수 있는 것으로 인식된다.
일부 실시 형태에 있어서, trs-엔도뉴클레아제 돌연변이는 Rep78 및 Rep68 단백질의 공유 서열에 Y156F 돌연변이를 포함한다.
일부 실시 형태에 있어서, Rep78/Rep68 단백질은 KDE-mu 돌연변이(이하의 서열 부분 중의 서열 참조)를 포함한다.
일부 실시 형태에 있어서, Rep78/Rep68 단백질은 EKE-mu 돌연변이(이하의 서열 부분 중의 서열 참조)를 포함한다.
일부 실시 형태에 있어서, Rep78/Rep68 단백질은 Y156F 돌연변이, KDE-mu 돌연변이 및 EKE-mu 돌연변이의 2개 이상으로부터 선택되는 돌연변이를 포함한다.
일부 실시 형태에 있어서, Rep68/Rep78은 혈청형AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV-DJ, AAV PHP.eB, Anc80L65, Anc80L65AAP, AAVrh74 또는 7m8의 AAV 중의 어느 하나를 갖고, Y156F 돌연변이, KDE-mu 돌연변이 및/또는 EKE-mu 돌연변이를 갖는 대응되는 trs-엔도뉴클레아제 돌연변이로부터 유래된다.
일부 실시 형태에 있어서, 숙주 세포는 (1) rep 유전자 및 cap 유전자의 전사를 구동하는 하나 또는 복수의 프로모터의 전사 제어 하에 있는 AAV rep 유전자 및 AAV cap 유전자의 코딩 서열; 및 (2) 아데노 바이러스 E2A, E4 및 VA유전자와 같은 AAV 패키징에 필요한 단백질의 코딩 서열을 더 포함한다.
일부 실시 형태에 있어서, 숙주 세포는 포유동물 세포이고, 예컨대 HEK293세포 또는 그 변이체(예를 들어, HEK293T세포) 또는 곤충세포, 예컨대 Sf9 또는 Sf21세포이다.
본 발명의 다른 양태는 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 생성하는 방법을 제공하고, 상기 방법은 a) 본 발명의 숙주 세포를 충분한 시간 동안 배양하는 단계 및 b)상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 수득하는 단계를 포함한다.
일부 실시 형태에 있어서, 상기 방법은 재조합 DNA 바이러스의 바이러스 입자 또는 재조합 DNA 바이러스의 바이러스 입자의 군체를 단리 또는 정제하는 단계를 더 포함한다.
본 발명의 다른 양태는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자의 군체를 생성하는 방법을 제공하고, 상기 방법은 a) 바이러스 패키징 시스템(예를 들어, AAV 패키징 시스템)을 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열에 접촉시키고, 본 발명의 상기 재조합 DNA 바이러스의 바이러스 입자 또는 본 발명의 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 생성하기에 충족한 시간동안 지속하는 단계 및 b) 본 발명의 상기 재조합 DNA 바이러스의 바이러스 입자 또는 본 발명의 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 수득하는 단계; 및 선택적으로, c)본 발명의 수득한 재조합 DNA 바이러스의 바이러스 입자 또는 본 발명의 재조합 DNA 바이러스의 바이러스 입자의 군체를 단리 또는 정제하는 단계를 포함한다.
일부 실시 형태에 있어서, 바이러스 패키징 시스템(예를 들어, AAV 패키징 시스템)은 (1) 상기 RNA 서열을 패키징하기 위한 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘을 조립하기 위한 하나 이상의 단백질(예를 들어, AAV 캡시드를 조립하기 위한 VP1, VP2 및/또는 VP3) 또는 그 하나 또는 복수의 코딩 서열; (2) 상기 단백질 쉘의 조립 및/또는 상기 RNA 서열이 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘 중에 패키징되도록 촉진하기 위한 하나 이상의 단백질(예를 들어, AAV 패키징을 위한 Rep78, Rep68, Rep52 및/또는 Rep40) 또는 그 하나 또는 복수의 코딩 서열(예를 들어, 아데노 바이러스 E2a, E4 및 VA유전자); 및 (3) RPS 상호 작용 분자 또는 그 코딩 서열을 포함한다. 선택적으로, 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징하도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며, 및/또는 (3) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거된다.
본 발명의 다른 양태는 본 발명의 RNA 서열 또는 본 발명의 폴리뉴클레오티드로부터 전사된 RNA 서열을 DNA 바이러스의 바이러스 입자에 패키징하는 시스템을 제공하고, 상기 시스템은 (1) 상기 RNA 서열을 패키징하기 위한 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘을 조립하기 위한 하나 이상의 단백질(예를 들어, AAV 캡시드를 조립하기 위한 VP1, VP2 및/또는 VP3) 또는 그 하나 또는 복수의 코딩 서열; (2) 상기 단백질 쉘의 조립 및/또는 본 발명의 RNA 서열이 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘 중에 패키징되도록 촉진하기 위한 하나 이상의 단백질(예를 들어, AAV 패키징을 위한 Rep78, Rep68, Rep52 및/또는 Rep40) 또는 그 하나 또는 복수의 코딩 서열(예를 들어, 아데노 바이러스 E2a, E4 및 VA유전자); 및 (3) RPS 상호 작용 분자 또는 그 코딩 서열을 포함한다. 선택적으로, 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징하도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며, 및/또는 (3) 본 발명의 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 본 발명의 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거된다.
본 발명의 다른 양태는 관심 RNA 서열(RSI)을 세포, 식물 또는 동물에 전달하는 방법을 제공하고, 상기 방은 상기 세포, 식물 또는 동물을 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자), 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체 또는 본 발명의 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체에 접촉시키는 단계를 포함하고, 여기서 상기 GOI는 선택적으로 본 발명의 RNA 서열에 의해 코딩된다.
본 발명의 다른 양태는 필요한 대상체에서 질병 또는 장애를 진단, 예방 또는 치료하는 방법을 제공하고, 상기 방법은 상기 대상체에게 치료 유효량 또는 조제량의 본 발명의 또는 본 발명의 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 투여하는 단계를 포함한다.
본 발명의 다른 양태는 필요한 대상체의 질병 또는 장애를 진단, 예방 또는 치료하기 위한 약물의 제조에서 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자), 본 발명의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체 또는 본 발명의 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체의 용도를 제공한다.
본 발명의 다른 양태는 융합 단백질 또는 접합체를 제공하고, 상기 융합 단백질 또는 접합체는 DNA 바이러스의 바이러스 패키징 시스템의 단백질 성분과 융합 또는 접합되는 본 발명의 RPSIP를 포함하며, 여기서 상기 RPSIP는 본 발명의 RNA 서열 상의 RPS와 상호 작용/결합하여, 상기 RNA 서열이 DNA 바이러스에 패키징되도록 촉진한다.
일부 실시 형태에 있어서, RPS는 MS2이고, RPSIP는 MCP이다.
일부 실시 형태에 있어서, RPS는 PP7 결합 부위이고, RPSIP는 PCP이다.
일부 실시 형태에 있어서, RPS는 com이고, RPSIP는 박테리오파지 COM 단백질이다.
일부 실시 형태에 있어서, 융합물 또는 접합체는 하나 이상의 RPSIP를 포함하고, 상기 RPSIP는 각각 독립적으로 본 발명의 RNA 서열 상의 하나 이상의 RPS와 결합한다. 일부 실시 형태에 있어서, 하나 이상의 RPSIP 중의 적어도 2개는 서로 같다. 일부 실시 형태에 있어서, 하나 이상의 RPSIP 중의 적어도 2개는 서로 다르다.
일부 실시 형태에 있어서, 융합물 또는 접합체는 직렬 연결된 2개의 MCP를 포함한다.
일부 실시 형태에 있어서, DNA 바이러스의 바이러스 패키징 시스템의 단백질 성분은 AAV의 Rep 단백질, 예컨대 상기 AAV의 Rep68 또는 Rep78을 포함한다.
일부 실시 형태에 있어서, Rep 단백질은 하나 또는 복수의 돌연변이를 포함하고, 상기 하나 또는 복수의 돌연변이는 trs-엔도뉴클레아제 활성을 파괴하거나 또는 약화시킨다. 일부 실시 형태에 있어서, 돌연변이는 Y156F 돌연변이, KDE-mu 돌연변이 및/또는 EKE-mu 돌연변이를 포함한다.
일부 실시 형태에 있어서, DNA 바이러스의 바이러스 패키징 시스템의 단백질 성분은 조립 활성화 단백질(AAP)을 포함한다.
일부 실시 형태에 있어서, RPSIP를 DNA 바이러스의 바이러스 패키징 시스템의 단백질 성분(예를 들어, Rep 단백질 또는 AAP)과 직접 융합한다.
일부 실시 형태에 있어서, RPSIP를 DNA 바이러스의 바이러스 패키징 시스템의 단백질 성분(예를 들어, Rep 단백질 또는 AAP)과 펩티드 링커를 통해 융합한다.
일부 실시 형태에 있어서, 펩티드 링커는 플랙시블 링커이고, 예컨대 Gly 및 Ser를 포함한 링커이다. 일부 실시 형태에 있어서, Gly 및 Ser를 포함한 링커는 GSn의 1-20개의 반복(예를 들어, 1-5개 또는 1-3개의 반복)을 포함하고, 여기서 n은 1, 2, 3, 4 또는 5이다. 일부 실시 형태에 있어서, GSn링커는 GS2, GS3 또는 GS4이고, 1-4개의(예를 들어, 2개의) 반복을 갖는다. 일부 실시 형태에 있어서, 링커는 GSSGSS이다.
일부 실시 형태에 있어서, 융합 단백질은 MCP 및 Rep를 포함하고, 여기서 상기 Rep는 선택적으로 Y156F 돌연변이, KDE-mu 돌연변이 및/또는 EKE-mu 돌연변이를 포함한다. 일부 실시 형태에 있어서, MCP는 Rep의 N 말단에서 융합된다(MCP-Rep). 일부 실시 형태에 있어서, MCP와 융합되는 Rep는 Y156F 돌연변이, KDE-mu 돌연변이 및/또는 EKE-mu 돌연변이를 포함한다. 일부 실시 형태에 있어서, MCP-Rep 융합물은 GSn링커, 예컨대 GSSGSS를 통해 연결된다. 일부 실시 형태에 있어서, MCP-Rep는 직렬 연결된 2개의 MCP(예를 들어, 2개의 MCP 부분 사이에 임의의 링커가 존재하지 않음)를 포함한다. 일부 실시 형태에 있어서, MCP는 다른 하나의 GSn링커, 예컨대 GSSGSS의 C 말단에 위치한다.
일부 실시 형태에 있어서, 융합 단백질은 PCP 및 Rep를 포함하고, 여기서 상기 Rep은 선택적으로 Y156F 돌연변이, KDE-mu 돌연변이 및/또는 EKE-mu 돌연변이를 포함한다. 일부 실시 형태에 있어서, PCP는 Rep의 N 말단에서 융합된다(PCP-Rep). 일부 실시 형태에 있어서, PCP와 융합되는 Rep는 Y156F 돌연변이, KDE-mu 돌연변이 및/또는 EKE-mu 돌연변이를 포함한다. 일부 실시 형태에 있어서, PCP-Rep 융합물은 GSn링커, 예컨대 GSSGSS를 통해 연결된다. 일부 실시 형태에 있어서, PCP-Rep는 직렬 연결된 2개의 PCP(예를 들어, 2개의 PCP 부분 사이에 임의의 링커가 존재하지 않음)를 포함한다. 일부 실시 형태에 있어서, PCP는 다른 하나의 GSn링커, 예컨대 GSSGSS의 C 말단에 위치한다.
일부 실시 형태에 있어서, 융합 단백질은 COM 및 Rep를 포함하고, 여기서 상기 Rep는 선택적으로 Y156F 돌연변이, KDE-mu 돌연변이 및/또는 EKE-mu 돌연변이를 포함한다. 일부 실시 형태에 있어서, COM은 Rep의 N 말단에서 융합된다(COM-Rep). 일부 실시 형태에 있어서, COM과 융합되는 Rep는 Y156F 돌연변이, KDE-mu 돌연변이 및/또는 EKE-mu 돌연변이를 포함한다. 일부 실시 형태에 있어서, COM-Rep 융합물은 GSn링커, 예컨대 GSSGSS를 통해 연결된다. 일부 실시 형태에 있어서, COM-Rep는 직렬 연결된 2개의 COM(예를 들어, 2개의 COM 부분 사이에 임의의 링커가 존재하지 않음)을 포함한다. 일부 실시 형태에 있어서, COM은 다른 하나의 GSn링커, 예컨대 GSSGSS의 C 말단에 위치한다.
일부 실시 형태에 있어서, 융합 단백질은 MCP 및 AAP를 포함한다. 일부 실시 형태에 있어서, MCP는 AAP의 N 말단에서 융합된다(MCP-AAP 또는 MA). 일부 실시 형태에 있어서, MCP는 AAP의 C 말단에서 융합된다(AAP-MCP 또는 AM). 일부 실시 형태에 있어서, MCP-AAP 또는 AAP-MCP 융합물은 GSn링커, 예컨대 GSSGSS를 통해 연결된다. 일부 실시 형태에 있어서, MCP-AAP 융합물은 다른 하나의 GSn링커, 예컨대 GSSGSS의 C 말단에 위치한다. 일부 실시 형태에 있어서, AAP-MCP 융합물은 다른 하나의 GSn링커, 예컨대 GSSGSS의 N 말단에 위치한다.
본 발명의 다른 양태는 폴리뉴클레오티드를 제공하고, 상기 폴리뉴클레오티드는 본 발명의 RPSIP와 DNA 바이러스의 바이러스 패키징 시스템의 단백질 성분(예를 들어, AAP 또는 Rep 단백질) 사이의 융합물 중의 어느 하나를 코딩한다.
이상 설명한 본 발명의 일반적인 양태에 대해, 이하 부분적으로 본 명세서에 따른 본 발명의 특정 요소의 별도의 세부 사항을 제공하였다. 요소의 모든 가능한 조합 또는 배열을 맹백하게 제시하지 않았으나, 각 특정 요소는 본 발명의 임의의 하나 또는 복수의 별도의 요소와 조합할 수 있을 것으로 예상된다.
2.
AAV 혈청형
본 발명의 리보스폴리뉴클레오티드를 패키징하는 AAV 입자는 임의의 천연 또는 재조합 AAV 혈청형을 포함하거나 임의의 천연 또는 재조합 AAV 혈청형에서 유도될 수 있다.
본 개시에 의하면, AAV 입자는 AAV1, AAV10, AAV106.1/hu.37, AAV11, AAV114.3/hu.40, AAV 12, AAV127.2/hu.41, AAV127.5/hu.42, AAV128.1/hu.43, AAV128.3/hu.44, AAV130.4/hu.48, AAV145.1/hu.53, AAV145.5/hu.54, AAV145.6/hu.55, AAV16.12/hu.l 1, AAV16.3, AAV16.8/hu.10, AAV161.10/hu.60, AAV161.6/hu.61, AAVl-7/rh.48, AAVl-8/rh.49, AAV2, AAV2.5T, AAV2-15/rh.62, AAV223.1, AAV223.2, AAV223.4, AAV 223.5, AAV223.6, AAV223.7, AAV2-3/rh.61, AAV24.1, AAV2-4/rh.50, AAV2-5/rh.51, AAV27.3, AAV29.3/bb.l, AAV29.5/bb.2, AAV2G9, AAV-2-전구체 miRNA-101, AAV3, AAV3.1/hu.6, AAV3.1/hu.9, AAV3-11/rh.53, AAV3-3, AAV33.12/hu. l7, AAV33.4/hu. l5, AAV33.8/hu.l6, AAV3-9/rh.52, AAV3a, AAV3b, AAV4, AAV4-19/rh.55, AAV42.12, AAV42-10, AAV42-11, AAV42-12, AAV42-13, AAV42-15, AAV42-1b, AAV42-2, AAV42-3a, AAV42-3b, AAV42-4, AAV42-5a, AAV42-5b, AAV42-6b, AAV42-8, AAV42-aa, AAV43-1, AAV43-12, AAV43-20, AAV43-21, AAV43-23, AAV43-25, AAV43-5, AAV4-4, AAV44.1, AAV44.2, AAV44.5, AAV46.2/hu.28, AAV46.6/hu.29, AAV4-8/r 11.64, AAV4-8/rh.64, AAV4-9/rh.54, AAV5, AAV52.1/hu.20, AAV52/hu.19, AAV5-22/rh.58, AAV5-3/rh.57, AAV54.1/hu.21, AAV54.2/hu.22, AAV54.4R/hu.27, AAV54.5/hu.23, AAV54.7/hu.24, AAV58.2/hu.25, AAV6, AAV6.1, AAV6.1.2, AAV6.2, AAV7, AAV7.2, AAV7.3/hu.7, AAV8, AAV-8b, AAV-8h, AAV9, AAV9.11, AAV9.13, AAV9.16, AAV9.24, AAV9.45, AAV9.47, AAV9.61, AAV9.68, AAV9.84, AAV9.9, AAV A3.3, AAV A3.4, AAV A3.5, AAV A3.7, AAV-b, AAVC1, AAVC2, AAVC5, AAVCh.5, AAVCh.5R1, AAVcy.2, AAVcy.3, AAVcy.4, AAVcy.5, AAVCy.5Rl, AAVCy.5R2, AAVCy.5R3, AAVCy.5R4, AAVcy.6, AAV-DJ, AAV-DJ8, AAVF3, AAVF5, AAV-h, AAVH-1/hu.l, AAVH2, AAVH-5/hu.3, AAVH6, AAVhE1.1, AAVhER1.14, AAVhErl.16, AAVhErl.18, AAVhER1.23, AAVhErl.35, AAVhErl.36, AAVhErl.5, AAVhErl.7, AAVhErl.8, AAVhEr2.16, AAVhEr2.29, AAVhEr2.30, AAVhEr2.31, AAVhEr2.36, AAVhEr2.4, AAVhEr3.1, AAVhu. l, AAVhu.10, AAVhu.l l, AAVhu. l, AAVhu.12, AAVhu.13, AAVhu.14/9, AAVhu.15, AAVhu.16, AAVhu.17, AAVhu.18, AAVhu.19, AAVhu.2, AAVhu.20, AAVhu.21, AAVhu.22, AAVhu.23.2, AAVhu.24, AAVhu.25, AAVhu.27, AAVhu.28, AAVhu.29, AAVhu.29R, AAVhu.3, AAVhu.31, AAVhu.32, AAVhu.34, AAVhu.35, AAVhu.37, AAVhu.39, AAVhu.4, AAVhu.40, AAVhu.41, AAVhu.42, AAVhu.43, AAVhu.44, AAVhu.44Rl, AAVhu.44R2, AAVhu.44R3, AAVhu.45, AAVhu.46, AAVhu.47, AAVhu.48, AAVhu.48Rl, AAVhu.48R2, AAVhu.48R3, AAVhu.49, AAVhu.5, AAVhu.51, AAVhu.52, AAVhu.53, AAVhu.54, AAVhu.55, AAVhu.56, AAVhu.57, AAVhu.58, AAVhu.6, AAVhu.60, AAVhu.61, AAVhu.63, AAVhu.64, AAVhu.66, AAVhu.67, AAVhu.7, AAVhu.8, AAVhu.9, AAVhu.t 19, AAVLG-10/rh.40, AAVLG-4/rh.38, AAVLG-9/hu.39, AAVLG- 9/hu.39, AAV-LK01, AAV-LK02, AAVLK03, AAV-LK03, AAV-LK04, AAV-LK05, AAV-LK06, AAV-LK07, AAV-LK08, AAV-LK09, AAV-LK10, AAV-LK11, AAV- LK12, AAV-LK13, AAV-LK14, AAV-LK15, AAV-LK17, AAV-LK18, AAV-LK19, AAVN721-8/rh.43, AAV-PAEC, AAV-PAEC11, AAV-PAEC12, AAV-PAEC2, AAV- PAEC4, AAV-PAEC6, AAV-PAEC7, AAV-PAEC8, AAVpi. l, AAVpi.2, AAVpi.3, AAVrh.10, AAVrh.12, AAVrh.13, AAVrh. l3R, AAVrh.14, AAVrh.17, AAVrh.18, AAVrh.19, AAVrh.2, AAVrh.20, AAVrh.21, AAVrh.22, AAVrh.23, AAVrh.24, AAVrh.25, AAVrh.2R, AAVrh.31, AAVrh.32, AAVrh.33, AAVrh.34, AAVrh.35, AAVrh.36, AAVrh.37, AAVrh.37R2, AAVrh.38, AAVrh.39, AAVrh.40, AAVrh.43, AAVrh.44, AAVrh.45, AAVrh.46, AAVrh.47, AAVrh.48, AAVrh.48, AAVrh.48.1, AAVrh.48.1.2, AAVrh.48.2, AAVrh.49, AAVrh.50, AAVrh.51, AAVrh.52, AAVrh.53, AAVrh.54, AAVrh.55, AAVrh.56, AAVrh.57, AAVrh.58, AAVrh.59, AAVrh.60, AAVrh.61, AAVrh.62, AAVrh.64, AAVrh.64Rl, AAVrh.64R2, AAVrh.65, AAVrh.67, AAVrh.68, AAVrh.69, AAVrh.70, AAVrh.72, AAVrh.73, AAVrh.74, AAVrh.8, AAVrh.8R, AAVrh8R, AAVrh8R A586R돌연변이체, AAVrh8R R533A돌연변이체, BAAV, BNP61 AAV, BNP62 AAV, BNP63 AAV, 소 AAV, 염소 AAV, 일본 AAV 10, 트루 타입 AAV(ttAAV), UPENN AAV 10, AAV-LK16, AAAV, AAV 셔플 100-1, AAV 셔플 100-2, AAV 셔플 100-3, AAV 셔플 100-7, AAV 셔플 10-2, AAV 셔플 10-6, AAV 셔플 10-8, AAV SM 100-10, AAV SM 100-3, AAV SM 10-1, AAV SM 10- 2 및/또는 AAV SM 10-8을 포함하나 이에 한정되지 않는 혈청형 및 그 변이체 중의 어느 하나의 혈청형을 이용하거나 또는 이에 기반할 수 있다.
일부 실시 형태에 있어서, AAV 혈청형은 AAV9서열 중의 돌연변이를 포함할 수 있고, 예컨대 Pulicherla et al.이 설명한 서열(Molecular Therapy [분자 요법] 19(6): 1070-1078, 2011), 예컨대 AAV9.9, AAV9.11, AAV9.13, AAV9.16, AAV9.24, AAV9.45, AAV9.47, AAV9.61, AAV9.68, AAV9.84를 포함할 수 있다.
일부 실시 형태에 있어서, AAV 혈청형은 US 6,156,303에서 설명한 서열을 포함할 수 있고, 예컨대 AAV3B(US 6,156,303 중의 SEQ ID NO: 1 및 10), AAV6(US 6,156,303 중의 SEQ ID NO: 2, 7 및 11), AAV2(US 6,156,303 중의 SEQ ID NO: 3 및 8), AAV3A(US 6,156,303 중의 SEQ ID NO: 4 및 9) 또는 그 유도체를 포함할 수 있다.
일부 실시 형태에 있어서, 혈청형은 AAV-DJ 또는 그 변이체일 수 있고, 예컨대 Grimm et al.이 설명한 AAVDJ8(또는 AAV-DJ8)(Journal of Virology [바이러스학 저널] 82(12): 5887- 5911, 2008)일 수 있다. AAV-DJ8의 아미노산 서열은 두개 이상의 돌연변이를 포함하여 헤파린 결합 도메인(HBD)을 제거할 수 있다. 비한정적인 예시로서, US 7,588,772에 SEQ ID NO: 1의 AAV- DJ서열은 2개의 돌연변이: (1) R587Q(아미노산587 위치의 Arg가 글루타민 Gln으로 변경) 및 (2) R590T를 포함할 수 있다고 기재되어 있다. 다른 비한정적인 예시로서, AAV-DJ서열은 3개의 돌연변이: (1) K406R, (2) R587Q 및 (3) R590T를 포함할 수 있다.
일부 실시 형태에 있어서, AAV 혈청형은 WO 2015/121501에서 설명한 서열, 예컨대 트루 타입 AAV(ttAAV)(WO 2015/121501 중의 SEQ ID NO: 2), 소위 UPenn AAV10(WO 2015/121501 중의 SEQ ID NO: 8) 또는 소위 일본 AAV10(WO 2015/121501 중의 SEQ ID NO: 9) 또는 그 변이체를 포함할 수 있다.
AAV 캡시드 혈청형의 선택 또는 사용은 다양한 종으로부터 올 수 있다. 일부 실시 형태에 있어서, AAV는 조류 AAV(aAAV)일 수 있다. aAAV 혈청형은 US 9,238,800에서 설명한 서열, 예컨대 aAAV(US 9,238,800 중의 SEQ ID NO: 1, 2, 4, 6, 8, 10, 12 및 14) 또는 그 변이체를 포함할 수 있다.
일부 실시 형태에 있어서, AAV는 소 AAV(bAAV)일 수 있다. bAAV 혈청형은 US 9,193,769에서 설명한 서열, 예컨대 bAAV(US 9,193,769 중의 SEQ ID NO: 1 및 6) 또는 그 변이체를 포함할 수 있다. bAAV 혈청형은 US 7,427,396에서 설명한 서열, 예컨대 bAAV(US 7,427,396 중의 SEQ ID NO: 5 및 6) 또는 그 변이체를 포함할 수 있다.
일부 실시 형태에 있어서, AAV는 염소 AAV일 수 있다. 염소 AAV 혈청형은 US 7,427,396에서 설명한 서열, 예컨대 염소 AAV(US 7,427,396 중의 SEQ ID NO: 3) 또는 그 변이체를 포함할 수 있다.
일부 실시 형태에 있어서, AAV를 두 가지 이상의 친본 혈청형의 하이브리드 AAV로 조작할 수 있다.
일부 실시 형태에 있어서, AAV는 AAV2G9일 수 있고, AAV2 및 AAV9로부터 유래된 서열을 포함한다. AAV2G9 AAV 혈청형은 US 2016-0017005 A1에서 설명한 서열을 포함할 수 있다. (참조로 본 명세서에 포함됨).
일부 실시 형태에 있어서, AAV는 AAV9캡시드 라이브러리에서 생성한 혈청형일 수 있고, 아미노산 390-627(VP1 넘버링)에서 돌연변이를 가지며, Pulicherla et al.(Molecular Therapy [분자 요법] 19(6): 1070-1078, 2011, 참조로 본 명세서에 통합)에 기재된 바와 같다. 혈청형 및 대응되는 뉴클레오티드 및 아미노산 치환은 AAV9.1(G1594C; D532H), AAV6.2(T1418A 및 T1436X; V473D 및 I479K), AAV9.3(T1238A; F413Y), AAV9.4(T1250C 및 A1617T; F417S), AAV9.5(A1235G, A1314T, A1642G, C1760T; Q412R, T548A, A587V), AAV9.6(T1231A; F411I), AAV9.9(G1203A, G1785T, W595C), AAV9.10(A1500G, T1676C; M559T), AAV9.11(A1425T, A1702C, A1769T; T568P, Q590L), AAV9.13(A1369C, A1720T; N457H, T574S), AAV9.14(T1340A, T1362C, T1560C, G1713A; L447H), AAV9.16(A1775T; Q592L), AAV9.24(T1507C, T1521G; W503R), AAV9.26(A1337G, A1769C; Y446C, Q590P), AAV9.33(A1667C; D556A), AAV9.34(A1534G, C1794T; N512D), AAV9.35(A1289T, T1450A, C1494T, A1515T, C1794A, G1816A; Q430L, Y484N, N98K, V606I), AAV9.40(A1694T, E565V), AAV9.41(A1348T, T1362C; T450S), AAV9.44(A1684C, A1701T, A1737G; N562H, K567N), AAV9.45(A1492T, C1804T; N498Y, L602F), AAV9.46(G1441C, T1525C, T1549G; G481R, W509R, L517V), 9.47(G1241A, G1358A, A1669G, C1745T; S414N, G453D, K557E, T582I), AAV9.48(C1445T, A1736T; P482L, Q579L), AAV9.50(A1638T, C1683T, T1805A; Q546H, L602H), AAV9.53(G1301A, A1405C, C1664T, G1811T; R134Q, S469R, A555V, G604V), AAV9.54(C1531A, T1609A; L511I, L537M), AAV9.55(T1605A; F535L), AAV9.58(C1475T, C1579A; T492I, H527N), AAV.59(T1336C; Y446H), AAV9.61(A1493T; N498I), AAV9.64(C1531A, A1617T; L511I), AAV9.65(C1335T, T1530C, C1568A; A523D), AAV9.68(C1510A; P504T), AAV9.80(G1441A,; G481R), AAV9.83(C1402A, A1500T; P468T, E500D), AAV9.87(T1464C, T1468C; S490P), AAV9.90(A1196T; Y399F), AAV9.91(T1316G, A1583T, C1782G, T1806C; L439R, K528I), AAV9.93(A1273G, A1421G, A1638C, C1712T, G1732A, A1744T, A1832T; S425G, Q474R, Q546H, P571L, G578R, T582S, D611V), AAV9.94(A1675T; M559L) 및 AAV9.95(T1605A; F535L)일 수 있으나 이에 한정되지 않는다.
일부 실시 형태에 있어서, AAV는 적어도 하나의 AAV 캡시드CD8+ T-세포 에피토프를 포함하는 혈청형일 수 있다. 비한정적인 실시예로서, 혈청형은 AAV1, AAV2 또는 AAV 8일 수 있다.
일부 실시 형태에 있어서, AAV는 변이체, 예컨대 Deverman에서 설명한 PHP.A 또는 PHP.B(Nature Biotechnology. [네이처 바이오테크놀리지] 34(2): 204-209, 2016, 참조로 본 명세서에 포함됨)일 수 있다.
일부 실시 형태에 있어서, AAV는 Deverman et al.(Nature Biotechnology [네이처 바이오테크놀리지] 34(2): 204-209, 2016, 참조로 본 명세서에 포함됨)이 설명한 Cre재조합에 기반하여 AAV 타겟팅 진화(CREATE) 생성된 혈청형일 수 있다. 일부 실시 형태에 있어서, 다른 AAV 혈청형에 비해, 이러한 방식으로 생성된 AAV 혈청형은 개선된 CNS 형질도입 및/또는 뉴런 및 성상 세포 향성을 갖는다.
일부 실시 형태에 있어서, AAV 혈청형은 아미노산588-589 사이에 7개의 아미노산 삽입을 갖는 AAV9 유도체일 수 있다. 이러한 7개의 아미노산이 삽입된 비한정적인 예시로서 PHP.A, PHP.B, PHP.B2, PHP.B3, PHP.N, PHP.S, G2A12, G2A15, G2A3, G2B4 및 G2B5를 포함한다.
일부 실시 형태에 있어서, AAV는 SEQ ID NO: 4,734-5,302 및 WO 2018/002719 A1의 표 2로부터 선택된 임의의 혈청형(참조로 본 명세서에 포함됨)일 수 있다. 일부 실시 형태에 있어서, AAV는 예컨대 WO 2018/002719 A1의 SEQ ID NO: 4,734-5,302에 따른 서열, 단편 또는 변이체(참조로 본 명세서에 포함됨)를 통해 코딩될 수 있다.
일부 실시 형태에 있어서, AAV VP1캡시드 서열은 AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV-DJ, AAV PHP.eB, Anc80L65, Anc80L65AAP 또는 7m8 중의 하나이다.
이하 상기 대표적인 VP1 캡시드의 단백질 서열을 제공하였다.
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAA DAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGA KTAPGKKRPVEQSPQEPDSSSGIGKTGQQPAKKRLNFGQTGDSESVPDPQPLGEPPATPAAVGPTTMA SGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSASTGASNDNH YFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTTNDGVTTIANNLTST VQVFSDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGN NFTFSYTFEEVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQNQSGSAQNKDLLFSRGSPAGMSVQPK NWLPGPCYRQQRVSKTKTDNNNSNFTWTGASKYNLNGRESIINPGTAMASHKDDEDKFFPMSGVMIFG KESAGASNTALDNVMITDEEEIKATNPVATERFGTVAVNFQSSSTDPATGDVHAMGALPGMVWQDRDV YLQGPIWAKIPHTDGHFHPSPLMGGFGLKNPPPQILIKNTPVPANPPAEFSATKFASFITQYSTGQVS VEIEWELQKENSKRWNPEVQYTSNYAKSANVDFTVDNNGLYTEPRPIGTRYLTRPL (AAV1; SEQ ID NO: 6)
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEA DAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPV KTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMA TGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHY FGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTV QVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNN FTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRN WLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGK QGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGNRQAATADVNTQGVLPGMVWQDRDVY LQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSV EIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL (AAV2; SEQ ID NO: 7)
MAADGYLPDWLEDNLSEGIREWWALKPGVPQPKANQQHQDNRRGLVLPGYKYLGPGNGLDKGEPVNEA DAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRILEPLGLVEEAA KTAPGKKGAVDQSPQEPDSSSGVGKSGKQPARKRLNFGQTGDSESVPDPQPLGEPPAAPTSLGSNTMA SGGGAPMADNNEGADGVGNSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHY FGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKKLSFKLFNIQVRGVTQNDGTTTIANNLTSTV QVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNN FQFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQGTTSGTTNQSRLLFSQAGPQSMSLQAR NWLPGPCYRQQRLSKTANDNNNSNFPWTAASKYHLNGRDSLVNPGPAMASHKDDEEKFFPMHGNLIFG KEGTTASNAELDNVMITDEEEIRTTNPVATEQYGTVANNLQSSNTAPTTGTVNHQGALPGMVWQDRDV YLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQIMIKNTPVPANPPTTFSPAKFASFITQYSTGQVS VEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL (AAV3A; SEQ ID NO: 8)
MAADGYLPDWLEDNLSEGIREWWALKPGVPQPKANQQHQDNRRGLVLPGYKYLGPGNGLDKGEPVNEA DAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRILEPLGLVEEAA KTAPGKKRPVDQSPQEPDSSSGVGKSGKQPARKRLNFGQTGDSESVPDPQPLGEPPAAPTSLGSNTMA SGGGAPMADNNEGADGVGNSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHY FGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKKLSFKLFNIQVKEVTQNDGTTTIANNLTSTV QVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNN FQFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQGTTSGTTNQSRLLFSQAGPQSMSLQAR NWLPGPCYRQQRLSKTANDNNNSNFPWTAASKYHLNGRDSLVNPGPAMASHKDDEEKFFPMHGNLIFG KEGTTASNAELDNVMITDEEEIRTTNPVATEQYGTVANNLQSSNTAPTTRTVNDQGALPGMVWQDRDV YLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQIMIKNTPVPANPPTTFSPAKFASFITQYSTGQVS VEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL (AAV3B; SEQ ID NO: 9)
MTDGYLPDWLEDNLSEGVREWWALQPGAPKPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAAD AAALEHDKAYDQQLKAGDNPYLKYNHADAEFQQRLQGDTSFGGNLGRAVFQAKKRVLEPLGLVEQAGE TAPGKKRPLIESPQQPDSSTGIGKKGKQPAKKKLVFEDETGAGDGPPEGSTSGAMSDDSEMRAAAGGA AVEGGQGADGVGNASGDWHCDSTWSEGHVTTTSTRTWVLPTYNNHLYKRLGESLQSNTYNGFSTPWGY FDFNRFHCHFSPRDWQRLINNNWGMRPKAMRVKIFNIQVKEVTTSNGETTVANNLTSTVQIFADSSYE LPYVMDAGQEGSLPPFPNDVFMVPQYGYCGLVTGNTSQQQTDRNAFYCLEYFPSQMLRTGNNFEITYS FEKVPFHSMYAHSQSLDRLMNPLIDQYLWGLQSTTTGTTLNAGTATTNFTKLRPTNFSNFKKNWLPGP SIKQQGFSKTANQNYKIPATGSDSLIKYETHSTLDGRWSALTPGPPMATAGPADSKFSNSQLIFAGPK QNGNTATVPGTLIFTSEEELAATNATDTDMWGNLPGGDQSNSNLPTVDRLTALGAVPGMVWQNRDIYY QGPIWAKIPHTDGHFHPSPLIGGFGLKHPPPQIFIKNTPVPANPATTFSSTPVNSFITQYSTGQVSVQ IDWEIQKERSKRWNPEVQFTSNYGQQNSLLWAPDAAGKYTEPRAIGTRYLTHHL (AAV4; SEQ ID NO: 10)
MSFVDHPPDWLEEVGEGLREFLGLEAGPPKPKPNQQHQDQARGLVLPGYNYLGPGNGLDRGEPVNRAD EVAREHDISYNEQLEAGDNPYLKYNHADAEFQEKLADDTSFGGNLGKAVFQAKKRVLEPFGLVEEGAK TAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGGGPLGDN NQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGY FDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQ LPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNF EEVPFHSSFAPSQNLFKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWN LGSGVNRASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLE GNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIP ETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENS KRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL (AAV5; SEQ ID NO: 11)
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAA DAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPFGLVEEGA KTAPGKKRPVEQSPQEPDSSSGIGKTGQQPAKKRLNFGQTGDSESVPDPQPLGEPPATPAAVGPTTMA SGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSASTGASNDNH YFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTTNDGVTTIANNLTST VQVFSDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGN NFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQNQSGSAQNKDLLFSRGSPAGMSVQPK NWLPGPCYRQQRVSKTKTDNNNSNFTWTGASKYNLNGRESIINPGTAMASHKDDKDKFFPMSGVMIFG KESAGASNTALDNVMITDEEEIKATNPVATERFGTVAVNLQSSSTDPATGDVHVMGALPGMVWQDRDV YLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPPAEFSATKFASFITQYSTGQVS VEIEWELQKENSKRWNPEVQYTSNYAKSANVDFTVDNNGLYTEPRPIGTRYLTRPL (AAV6; SEQ ID NO: 12)
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDNGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGAKTAPAKKRPVEPSPQRSPDSSTGIGKKGQQPARKRLNFGQTGDSESVPDPQPLGEPPAAPSSVGSGTVAAGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSETAGSTNDNTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKKLRFKLFNIQVKEVTTNDGVTTIANNLTSTIQVFSDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQSVGRSSFYCLEYFPSQMLRTGNNFEFSYSFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLARTQSNPGGTAGNRELQFYQGGPSTMAEQAKNWLPGPCFRQQRVSKTLDQNNNSNFAWTGATKYHLNGRNSLVNPGVAMATHKDDEDRFFPSSGVLIFGKTGATNKTTLENVLMTNEEEIRPTNPVATEEYGIVSSNLQAANTAAQTQVVNNQGALPGMVWQNRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPANPPEVFTPAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNFEKQTGVDFAVDSQGVYSEPRPIGTRYLTRNL (AAV7; SEQ ID NO: 13)
MAADGYLPDWLEDNLSEGIREWWALKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAA DAAALEHDKAYDQQLQAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGA KTAPGKKRPVEPSPQRSPDSSTGIGKKGQQPARKRLNFGQTGDSESVPDPQPLGEPPAAPSGVGPNTM AAGGGAPMADNNEGADGVGSSSGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISNGTSGGATND NTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLSFKLFNIQVKEVTQNEGTKTIANNLT STIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRT GNNFQFTYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQTTGGTANTQTLGFSQGGPNTMANQ AKNWLPGPCYRQQRVSTTTGQNNNSNFAWTAGTKYHLNGRNSLANPGIAMATHKDDEERFFPSNGILI FGKQNAARDNADYSDVMLTSEEEIKTTNPVATEEYGIVADNLQQQNTAPQIGTVNSQGALPGMVWQNR DVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFNQSKLNSFITQYSTGQ VSVEIEWELQKENSKRWNPEIQYTSNYYKSTSVDFAVNTEGVYSEPRPIGTRYLTRNL (AAV8; SEQ ID NO: 14)
MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAA DAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAA KTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMA SGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDN AYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTS TVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTG NNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGR NYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFG KQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGMVWQDRDV YLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVS VEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL (AAV9; SEQ ID NO: 15)
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAA DAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEAA KTAPGKKRPVEPSPQRSPDSSTGIGKKGQQPAKKRLNFGQTGESESVPDPQPIGEPPAGPSGLGSGTM AAGGGAPMADNNEGADGVGSSSGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISNGTSGGSTND NTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLSFKLFNIQVKEVTQNEGTKTIANNLT STIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRT GNNFEFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQSTGGTQGTQQLLFSQAGPANMSAQ AKNWLPGPCYRQQRVSTTLSQNNNSNFAWTGATKYHLNGRDSLVNPGVAMATHKDDEERFFPSSGVLM FGKQGAGRDNVDYSSVMLTSEEEIKTTNPVATEQYGVVADNLQQANTGPIVGNVNSQGALPGMVWQNR DVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFSQAKLASFITQYSTGQ VSVEIEWELQKENSKRWNPEIQYTSNYYKSTNVDFAVNTEGTYSEPRPIGTRYLTRNL (AAV10; SEQ ID NO: 16)
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAA DAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGA KTAPGKKRPLESPQEPDSSSGIGKKGKQPARKRLNFEEDTGAGDGPPEGSDTSAMSSDIEMRAAPGGN AVDAGQGSDGVGNASGDWHCDSTWSEGKVTTTSTRTWVLPTYNNHLYLRLGTTSSSNTYNGFSTPWGY FDFNRFHCHFSPRDWQRLINNNWGLRPKAMRVKIFNIQVKEVTTSNGETTVANNLTSTVQIFADSSYE LPYVMDAGQEGSLPPFPNDVFMVPQYGYCGIVTGENQNQTDRNAFYCLEYFPSQMLRTGNNFEMAYNF EKVPFHSMYAHSQSLDRLMNPLLDQYLWHLQSTTSGETLNQGNAATTFGKIRSGDFAFYRKNWLPGPC VKQQRFSKTASQNYKIPASGGNALLKYDTHYTLNNRWSNIAPGPPMATAGPSDGDFSNAQLIFPGPSV TGNTTTSANNLLFTSEEEIAATNPRDTDMFGQIADNNQNATTAPITGNVTAMGVLPGMVWQNRDIYYQ GPIWAKIPHADGHFHPSPLIGGFGLKHPPPQIFIKNTPVPANPATTFTAARVDSFITQYSTGQVAVQI EWEIEKERSKRWNPEVQFTSNYGNQSSMLWAPDTTGKYTEPRVIGSRYLTNHL (AAV11; SEQ ID NO: 17)
MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNGRGLVLPGYKYLGPFNGLDKGEPVNEA DAAALEHDKAYDKQLEQGDNPYLKYNHADAEFQQRLATDTSFGGNLGRAVFQAKKRILEPLGLVEEGV KTAPGKKRPLEKTPNRPTNPDSGKAPAKKKQKDGEPADSARRTLDFEDSGAGDGPPEGSSSGEMSHDA EMRAAPGGNAVEAGQGADGVGNASGDWHCDSTWSEGRVTTTSTRTWVLPTYNNHLYLRIGTTANSNTY NGFSTPWGYFDFNRFHCHFSPRDWQRLINNNWGLRPKSMRVKIFNIQVKEVTTSNGETTVANNLTSTV QIFADSTYELPYVMDAGQEGSFPPFPNDVFMVPQYGYCGVVTGKNQNQTDRNAFYCLEYFPSQMLRTG NNFEVSYQFEKVPFHSMYAHSQSLDRMMNPLLDQYLWHLQSTTTGNSLNQGTATTTYGKITTGDFAYY RKNWLPGACIKQQKFSKNANQNYKIPASGGDALLKYDTHTTLNGRWSNMAPGPPMATAGAGDSDFSNS QLIFAGPNPSGNTTTSSNNLLFTSEEEIATTNPRDTDMFGQIADNNQNATTAPHIANLDAMGIVPGMV WQNRDIYYQGPIWAKVPHTDGHFHPSPLMGGFGLKHPPPQIFIKNTPVPANPNTTFSAARINSFLTQY STGQVAVQIDWEIQKEHSKRWNPEVQFTSNYGTQNSMLWAPDNAGNYHELRAIGSRFLTHHL (AAV12; SEQ ID NO: 18)
MTDGYLPDWLEDNLSEGVREWWALQPGAPKPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAAD AAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRILEPLGLVEEAAK TAPGKKRPVEQSPAEPDSSSGIGKSGQQPARKRLNFGQTGDTESVPDPQPLGQPPAAPSGVGSTTMAS GGGAPMADNNEGADGVGNSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISSQSGATNDNHYF GYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQ VFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNF QFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQTASGTQQSRLLFSQAGPTSMSLQAKNWL PGPCYRQQRLSKQANDNNNSNFPWTGATKYHLNGRDSLVNPGPAMASHKDDKEKFFPMHGTLIFGKEG TNANNADLENVMITDEEEIRTTNPVATEQYGTVSNNLQNSNAGPTTGTVNHQGALPGMVWQDRDVYLQ GPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQIMIKNTPVPANPPTNFSAAKFASFITQYSTGQVSVEI EWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL (AAV13; SEQ ID NO: 19)
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEA DAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAA KTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPIGEPPAAPSGVGSLTMA AGGGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDN AYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLSFKLFNIQVKEVTQNEGTKTIANNLTS TIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTG NNFQFTYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQTTGGTTNTQTLGFSQGGPNTMANQA KNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIF GKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGNRQAATADVNTQGVLPGMVWQDRD VYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFNQSKLNSFITQYSTGQV SVEIEWELQKENSKRWNPEIQYTSNYYKSTSVDFAVNTEGVYSEPRPIGTRYLTRNL (AAV-DJ; SEQ ID NO: 20)
MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAA DAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAA KTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMA SGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDN AYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTS TVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTG NNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTINGSGQNQQTLKFSVAGPSNMAVQGR NYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFG KQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSDGTLAVPFKAQAQTGWVQNQGILPGM VWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQ YSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL (AAV PHP.eB; SEQ ID NO: 21)
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAA DAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGA KTAPGKKRPVEQSPQEPDSSSGIGKKGQQPARKRLNFGQTGDSESVPDPQPLGEPPAAPSGVGSNTMA AGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSQSGGSTNDNT YFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKKLNFKLFNIQVKEVTTNDGTTTIANNLTST VQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGN NFQFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQTTSGTAGNRTLQFSQAGPSSMANQAK NWLPGPCYRQQRVSKTTNQNNNSNFAWTGATKYHLNGRDSLVNPGPAMATHKDDEDKFFPMSGVLIFG KQGAGNSNVDLDNVMITNEEEIKTTNPVATEEYGTVATNLQSANTAPATGTVNSQGALPGMVWQDRDV YLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPPTTFSPAKFASFITQYSTGQVS VEIEWELQKENSKRWNPEIQYTSNYNKSTNVDFAVDTNGVYSEPRPIGTRYLTRNL (Anc80L65; SEQ ID NO: 22)
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAA DAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGA KTAPGKKRPVEQSPQEPDSSSGIGKKGQQPARKRLNFGQTGDSESVPDPQPLGEPPAAPSGVGSNTMA AGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSQSGGSTNDNT YFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKKLNFKLFNIQVKEVTTNDGTTTIANNLTST VQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGN NFQFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQTTSGTAGNRTLQFSQAGPSSMANQAK NWLPGPCYRQQRVSKTTNQNNNSNFAWTGATKYHLNGRDSLVNPGPAMATHKDDEDKFFPMSGVLIFG KQGAGNSNVDLDNVMITNEEEIKTTNPVATEEYGTVATNLQSANTAPATGTVNSQGALPGMVWQDRDV YLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPPTTFSPAKFASFITQYSTGQVS VEIEWELQKENSKRWNPEIQYTSNYNKSTNVDFAVDTNGVYSEPRPIGTRYLTRNL (Anc80L65AAP; SEQ ID NO: 23)
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEA DAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPV KTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMA TGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVTTTSTRTWALPTYNNHLYKQISSQSGASNDNHY FGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTV QVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNN FTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRN WLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGK QGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGNLALGETTRPARQAATADVNTQGVLP GMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFI TQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSINVDFTVDTNGVYSEPRPIGTRYLTRNL (7m8; SEQ ID NO: 24)
3.
변형된 AAV ITR
본 명세서의 개시에 의하면, 임의의 전사된 AAV ITR 서열(RNA)은 모두 코딩성의 변형된 AAV ITR DNA 주형에 대해 조작하여 변형되어, 예를 들어 TRS 또는 그 등가물을 제거 또는 비활성화하거나, 및/또는 그 D 영역 서열을 제거할 수 있다. 이러한 변형된 AAV ITR DNA 주형을 전사하여 얻은 전사되고 변형된 AAV ITR은 본 발명의 RNA 서열을 AAV 바이러스 입자에 패키징하도록 촉진하는 능력을 보류한다.
AAV DNA복제 기간에, ITR은 말단 분해 부위(TRS)에서 바이러스에 의해 코딩된 Rep 단백질에 의해 절개구가 생성된다. 이러한 시작 기능은 Rep 결합 요소(RBE), 말단 반복(RBE') 내 내부 헤어핀의 전단을 포함하는 작은 회문 서열 및 TRS의 3개의 DNA 서열 요소를 필요로 한다. TRS에 절개구개 생성되는 기간에, Rep는 특정 방향으로 RBE(DNA)에 연결된다. 이러한 방향은 Rep쌍이 AAV ITR에 정렬되도록 하고, 특정 뉴클레오티드가 RBE’에 접촉되도록 허용하며, TRS의 절개구 생성을 가이드하는 것으로 보인다. TRS 대비 RBE의 극성 또는 위치의 변경은 Rep의 절개구 생성을 크게 억제하였다. RBE’ 내의 치환도 Rep비활성을 저하시키나, 그 정도가 작다. TRS의 절개구 생성 기간에, Rep와 RBE 및 RBE’의 상호 작용은 기능 상에서 서로 다르고, Rep와 RBE의 접촉은 DNA 헬리카제 활성 및 TRS절단에 대해 모두 필수적이기 때문이다. 아울러, Rep와 RBE’의 상호 작용은 주로 ITR 풀림 및 TRS스템 루프 구조의 형성에 필수적이나, TRS 절단에 필요한 것이 아니다.
본 발명의 RNA 서열에 적어도 하나의 본 발명의 전사되고 변형된 ITR 서열(RNA)이 존재한다. 본 발명의 전사되고 변형된 ITR 서열은 본 발명의 RNA 서열의 3’ 말단에 더 가까운 것이 바람직하다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 2개의 전사되고 변형된 ITR 서열을 포함한다.
일부 실시 형태에 있어서, 2개의 전사되고 변형된 ITR 서열은 동일한 AAV 혈청형으로부터 유래될 수 있다.
다른 하나의 실시 형태에 있어서, 2개의 전사되고 변형된 ITR 서열은 다른 혈청형의 2개의 다른 AAV로부터 유래될 수 있다.
일부 실시 형태에 있어서, 하나 또는 복수의 전사되고 변형된 ITR 서열은 삽입, 결실 및/또는 돌연변이를 포함한다.
일부 실시 형태에 있어서, 본 발명의 rRAAV RNA 서열은 하나의 전사된 변형/돌연변된 ITR 서열 및 하나의 전사된 야생형 ITR 서열을 포함한다.
일부 실시 형태에 있어서, 하나 또는 복수의 전사되고 변형된 ITR 서열은 Flip 방향 또는 Flop 방향의 야생형 ITR에 기반한다.
본 분야의 공지의 야생형 ITR 서열에 기반하여, 대상 전사되고 변형된 ITR 서열 또는 그 코딩DNA 서열을 용이하게 제조할 수 있다.
대표적인(비한정적인) 야생형 ITR 서열(DNA)은 적어도 표 1에 열거한 이하 서열을 포함한다. 도 1b 및 1c는 각각 AAV1-AAV7의 5’ ITR 서열의 다중 서열 정렬 및 3’ ITR 서열의 다중 서열 정렬을 나타내고, 공유 서열, TRS, RBE 및 D 영역 서열을 포함한다.
표 1: 대표적인 야생형 AAV말단 역반복(ITR) 서열
본 명세서에 사용된 바와 같이, “RBE 서열” 또는 “RBE”는 A:A’회문 줄기 서열 중의 AAV ITR 서열을 의미하고, 염기 페어링 시, 상기 서열은 줄기(통상적으로 약 21-23 또는 약 22 bp의 이중 가닥 영역)를 형성하고 ITR과 AAV Rep 단백질(Rep78 및 Rep68) 결합을 촉진한다. 도 1a에서 야생형 AAV2 ITR의 Flip 및 Flop 배열 둘 모두에 대표적인 RBE 서열을 나타냈다.
본 분야의 공지의 복수의 AAV 혈청형의 야생형 ITR 서열은 용이하게 얻으며, 모두 다른 AAV ITR과 정렬할 수 있고, 도 1b 및 1c에 도시된 바와 같다. 정렬 결과는 임의의 AAV ITR의 RBE 서열을 감정하는 데 사용될 수 있다.
“전사된 (기능적)RBE”는 RBE DNA 주형에 대응되는 전사된 RNA를 의미하고, 상기 RBE DNA 주형에 대응되는 것은 야생형 RBE 또는 하나 또는 복수의 뉴클레오티드 삽입, 결실, 치환 및/또는 기타 돌연변이의 기능적 변이체를 갖는 것을 의미하며, 기능적 변이체 RBE는 Rep와의 결합의 능력(예를 들어, 적어도 약 60%, 70%, 80%, 90%, 95% 또는 강화된 동일 혈청형Rep와의 결합 보류)을 거의 보류하기만 하면 된다. 일부 실시 형태에 있어서, RBE DNA 주형 또는 전사된 RBE RNA와 야생형 서열의 차이는 10, 9, 8, 7, 6, 5, 4, 3, 2, 1 개의 뉴클레오티드를 초과하지 않는다. 일부 실시 형태에 있어서, 야생형 RBE에 비해, 예를 들어 RBE의 하나 또는 복수의 뉴클레오티드의 삽입, 결실, 치환 및/또는 기타 돌연변이로 인해, 기능적 RBE는 약 30%, 25%, 20%, 15%, 10% 또는 5%에 달하는 서열 변이를 포함한다.
일부 실시 형태에 있어서, 뉴클레오티드 서열 차이는 페어링 염기쌍의 손실(예를 들어, 야생형 RBE 중의 GC쌍은 변이체 RBE 중의 CG, AT/AU 또는 TA/UA로 변경될 수 있으나, 원래의 페어링 염기쌍을 손실하지 않음)을 초래하지 않는다.
일부 실시 형태에 있어서, 전사되고 변형된 ITR 서열(RNA)은 전사된 Rep-결합 요소(전사된 RBE) 또는 그 기능적 변이체를 보류하여, Rep에 의해 매개되는 패키징을 촉진한다. 예를 들어, 야생형 AAV2 ITR의 RBE DNA 서열은 SEQ ID NO: 5이다.
일부 실시 형태에 있어서, 전사되고 변형된 ITR 서열(RNA)은 전사된 Rep-결합 요소의(전사된 RBE의) 서열을 더 보류한다. 예를 들어, 도 1a에서, Flip ITR의 B:B’ 단편에 헤어핀 또는 고리구조를 형성하는 CTTTG DNA 서열은 RBE’서열이다.
일부 실시 형태에 있어서, 전사되고 변형된 ITR 서열은 전사된 TRS 및/또는 전사된 rcTRS 또는 둘 모두가 결핍하다.
일부 실시 형태에 있어서, 이에 대응되는 DNA 서열은 야생형 TRS의 일부 서열 요소가 결핍하기에, 본 발명의 RNA 서열은 전사된 (기능적)TRS 서열이 결핍하여, 야생형 TRS기능이 DNA에서 손실된다(예를 들어, A:A’ 단편과 D 영역 서열 사이의 야생형 TRS 서열이 통상적으로 점유하는 서열 또는 내부 가닥은 AAV복제 기간에 통상적으로 엔도뉴클레아제에 의해 인식 및 절단되고, AAV ITR의 ssDNA 벡터 게놈에 존재하면, 절단되지 않는다).
예를 들어, 일부 실시 형태에 있어서, TRS의 역-상보적인 서열은 결실되거나 또는 돌연변이될 수 있고, 예를 들어 실시예에 사용되는 dITR 및 dITR-D 서열에서 결실되거나 또는 돌연변이될 수 있다.
대체 가능하게 또는 별도로, 통상적으로 A:A’ 단편 및 D 영역 서열 사이의 TRS에 하나 또는 복수의 뉴클레오티드가 결핍하거나 또는 하나 또는 복수의 뉴클레오티드 치환 또는 돌연변이를 가질 수 있다(예를 들어 실시예에 사용된 dITR 서열에서 4 개의 뉴클레오티드가 결핍 또는 치환/돌연변이됨).
일부 실시 형태에 있어서, 야생형 서열 중의 전부 또는 거의 전부의 TRS/rcTRS가 결실되어, 얻은 RNA전사체가 기능적 TRS 서열이 결핍되도록 한다.
일부 실시 형태에 있어서, 예를 들어 야생형 서열에서 삽입, 결실, 치환 및/또는 기타 돌연변이를 가져 야생형 TRS/rcTRS 서열의 일부를 변경/돌연변이하여, 돌연변이된 TRS/rcTRS에서 전사된 기능적 TRS가 결핍된 대응되는 RNA전사체가 생성되도록 한다. 예를 들어, 일부 실시 형태에 있어서, 1개, 2개, 3개, 4개 또는 5개의 연속 또는 비연속 TRS 뉴클레오티드 및/또는 rcTRS뉴클레오티드는 돌연변이된 서열에서 결실 또는 치환될 수 있다.
일부 실시 형태에 있어서, 전사되고 변형된 ITR 서열은 D 영역 서열이 결핍하거나 또는 적어도 기능적 D 영역 서열(D 서열 또는 D’서열은 Flip 또는 Flop 배열에 의해 결정)이 결핍되는 변형된 ITR로부터 전사된다. 예를 들어, 일부 실시 형태에 있어서, 전체 D 영역 서열이 결실되어, 얻은 RNA전사체가 전사된 기능적 D 영역 서열이 결핍되도록 한다. 다른 실시 형태에 있어서, D 영역 서열의 적어도 일부가 돌연변이되어(예를 들어, 결실, 삽입, 치환 및/또는 기타 돌연변이를 가져), 얻은 RNA전사체가 전사된 기능적 D 영역 서열이 결핍되도록 한다. 일부 실시 형태에 있어서, 돌연변이된 D 영역 서열은 야생형 서열의 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개를 초과하지 않는 뉴클레오티드를 가진다.
일부 실시 형태에 있어서, 변형된 ITR 서열(DNA 주형)은 야생형 ITR 서열 5’ 가장 말단의 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 뉴클레오티드가 결핍하다. 예를 들어, 야생형 ITR 서열(SEQ ID NO: 1)에 비해, dITR 서열(SEQ ID NO: 2) 및 dITR-D 서열(SEQ ID NO: 3)은 모두 5’ 가장 말단의 8개의 뉴클레오티드가 결핍하다.
상기 전사된 RNA 코딩 서열(GOI의 DNA 코딩 서열), 전사되고 변형된 AAV ITR(변형의 AAV ITR), 전사된 기능적 RBE(기능적 RBE), 전사된 기능적 D 영역 서열(기능적 D 영역 서열) 및 전사된 기능적 TRS 서열(기능적 TRS 서열) 중의 어느 하나를 코딩하는 대응되는 DNA 서열은 명백하게 본 발명의 범위 내에 있는 것으로 고려된다.
4.
인트론, 엑손, UTR, 인핸서 및 기타 요소
본 발명의 rRAAV 바이러스 입자에 캡시드화될 본 발명의 RNA 서열은 GOI발현을 강화 또는 조절할 수 있는 별도의 임의의 서열 요소(예컨대 발현 제어 요소)를 더 포함할 수 있다.
본 발명의 RNA 서열에 존재하는 발현 제어 요소는 적절한 이종 폴리뉴클레오티드(예를 들어, GOI)가 전사 및/또는 번역되는 것을 촉지하고, 예를 들어 인트론의 스플라이싱 신호, 유전자의 정확한 리딩 프레임을 유지하여 mRNA 및 종결 코돈의 프레임내 번역 등을 포함한다.
전형적으로, 발현 제어 요소(일부는 본 발명의 RNA 서열에 존재하고, 나머지는 본 발명의 RNA 서열을 코딩하는 DNA에 존재)는 하나 또는 복수의 핵산 서열이고, 예컨대 조작 가능하게 연결된 이종 폴리뉴클레오티드(예를 들어, GOI) 발현에 영향을 미치는 프로모터 및 인핸서이다. 이러한 요소는 전형적으로 시스 작용할 수 있으나, 트랜스 작용할 수도 있다. 발현 제어는 전사, 번역, 스플라이싱, 정보 안정성 등 수준에서 수행될 수 있다. 전형적으로, 전사를 조절하는 발현 제어 요소는 전사된 폴리뉴클레오티드의 5'말단(즉, “업스트림”) 근처에 병렬된다. 발현 제어 요소는 전사된 서열의 3' 말단(즉 “다운스트림”) 또는 전사체 내(예를 들어, 인트론 내)에 위치할 수도 있다. 발현 제어 요소는 전사된 관심 유전자 서열에서 멀리 떨어진 거리(예를 들어, 관심 유전자 폴리뉴클레오티드100개 내지 500개, 500개 내지 1000개, 2,000개 내지 5,000개 이상의 뉴클레오티드에서 멀리 떨어짐)에 위치할 수 있다. 그러나, 바이러스 벡터(예컨대 AAV 벡터)의 폴리뉴클레오티드 길이의 제한으로 인해, 이러한 발현 제어 요소는 전형적으로 전사된 관심 유전자 서열에서 1-1,000개, 1-500, 1-250개 또는 1-100개의 뉴클레오티드 떨어진 범위 내에 있다.
본 발명의 RNA 서열 또는 본 발명의 RNA 서열을 코딩하는 DNA 상에 존재할 수 있는 일부 비한정적인 발현 제어 요소는 이하에서 추가로 설명하도록 한다.
인트론
인트론은 전사 후 조절 요소를 가지고, mRNA가 세포핵으로부터 운반되도록 효과적으로 유도할 수 있으며 mRNA안정성을 강화하는 것이 이미 알려져있다.
일부 실시 형태에 있어서, rRAAV는 하나 또는 복수의 인트론 또는 그 단편을 포함할 수 있다. 일부 실시 형태에 있어서, 하나 또는 복수의 인트론은 관심 유전자의 단편이다. 일부 실시 형태에 있어서, 하나 또는 복수의 인트론은 관심 유전자와 이종이다.
보도에 따르면, 인트론은 유전자 발현 수준에 영향을 미친다. 이러한 작용은 유전자 발현의 인트론 매개 강화(IME)로 칭한다(Lu et al., Mol Genet Genomics [분자 유전학 게놈학] 279:563-572, 2008). 일부 실시 형태에 있어서, 하나 또는 복수의 인트론을 갖지 않는 서열로부터 유래된 유전자 발현에 비해, 유전자 발현 수준은 약 1.5배, 약 2배, 약 2.5배, 약 3배, 약 3.5배, 약 4배, 약 4.5배, 약 5배, 약 5.5배, 약 6배, 약 6.5배, 약 7배, 약 7.5배, 약 8배, 약 8.5배, 약 9배, 약 9.5배 또는 약 10배 증가된다.
비한정적인 인트론은 SV40 인트론, β글로불린 인트론 및 짧은 키메릭 인트론(CIB)을 포함한다. 기타 인트론은 Lu et al., Hum Gene Ther. [인류 유전자 치료] 2017;28(1):125-134에서 설명한 ColE2-RNA-OUT, OIPR 및 R6K-RNA-OUT 인트론(참조로 포함됨); 인간 헤모글로빈 서브유닛 β(HBB2)합성 인트론(Snyder et al., Hum Gene Ther [인류 유전자 치료], 8 (1997), 제 1891-1900페이지, 참조로 포함됨)을 포함한다.
일부 실시 형태에 있어서, 하나 또는 복수의 인트론은 25개의 뉴클레오티드 미만이고, 50개의 뉴클레오티드 미만이며, 100개의 뉴클레오티드 미만이고, 150개의 뉴클레오티드 미만이며, 200개의 뉴클레오티드 미만이고, 250개의 뉴클레오티드 미만이며, 300개의 뉴클레오티드 미만이고, 350 개의 뉴클레오티드 미만이며, 400개의 뉴클레오티드 미만이고, 450개의 뉴클레오티드 미만이거나 또는 500개의 뉴클레오티드 미만일 수 있다.
일부 실시 형태에 있어서, 하나 또는 복수의 인트론은 25개의 뉴클레오티드를 초과하고, 50개의 뉴클레오티드를 초과하며, 100개의 뉴클레오티드를 초과하고, 150개의 뉴클레오티드를 초과하며, 200개의 뉴클레오티드를 초과하고, 250개의 뉴클레오티드를 초과하며, 300개의 뉴클레오티드를 초과하고, 350개의 뉴클레오티드를 초과하며, 400개의 뉴클레오티드를 초과하고, 450개의 뉴클레오티드를 초과하거나 또는 500개의 뉴클레오티드 초과할 수 있다.
일부 실시 형태에 있어서, 하나 또는 복수의 인트론은 약 50개 내지 약 100개의 뉴클레오티드, 약 50개 내지 약 200개의 뉴클레오티드, 약 50개 내지 약 300개의 뉴클레오티드, 약 50개 내지 약 400개의 뉴클레오티드, 약 50개 내지 약 500개의 뉴클레오티드, 약 100개 내지 약 200개의 뉴클레오티드, 약 100개 내지 약 300개의 뉴클레오티드, 약 100개 내지 약 400개의 뉴클레오티드, 약 100개 내지 약 500개의 뉴클레오티드, 약 200개 내지 약 300개의 뉴클레오티드, 약 200개 내지 약 400개의 뉴클레오티드, 약 200개 내지 약 500개의 뉴클레오티드, 약 300개 내지 약 400개의 뉴클레오티드, 약 300개 내지 약 500개의 뉴클레오티드 또는 약 400개 내지 약 500개의 뉴클레오티드일 수 있다.
인핸서
본 명세서에 사용된 바와 같이, 용어 “인핸서”는 관심 유전자 근처에 위치한 서열일 수 있다. 인핸서 요소는 전형적으로 본 발명의 RNA 서열을 코딩하는 DNA 중 프로모터 요소의 업스트림에 위치하나, 인트론 서열(예를 들어, 관심 유전자)의 다운스트림 또는 내부에 위치하여, 기능을 유지할 수도 있다. 따라서, 인핸서 또는 그 일부는 본 발명의 전사된 RNA 서열에 존재할 수 있다.
적합한 인핸서의 비한정적인 예시는 CMV 인핸서를 포함한다.
일부 실시 형태에 있어서, 인핸서 요소는 관심 유전자 업스트림 또는 다운스트림의 100개의 염기쌍, 200개의 염기쌍 또는 300개 이상의 염기쌍(예를 들어, 본 발명의 RNA 서열 또는 그 DNA 코딩 서열 중)에 위치할 수 있다. 인핸서 요소는 전형적으로 관심 유전자의 발현을 프로모터 요소를 통해 제공되는 증가된 발현보다 높게 증가시킨다.
비번역 영역(UTR)
본 명세서에 사용된 바와 같이, “비번역 영역”(“UTR”)은 전사 후 미번역 RNA를 의미한다. 예를 들어, 5’ UTR은 관심 유전자 개시 코돈의 업스트림에 위치하고, 3’ UTR은 관심 유전자 종결 코돈의 다운스트림에 위치한다. 일부 실시 형태에 있어서, 5’ 및/또는 3’ UTR은 삽입, 결실 또는 변형을 가져 전사된 관심 유전자의 안정성을 향상시킬 수 있다. 예를 들어, 5′ UTR은 번역 시작 서열을 포함할 수 있고, 예컨대 코작 서열 및 내부 리보솜 진입 부위(IRES)에 한정되지 않는다. 코작 서열은 공유 CCR(A/G)CCAUGG를 가지고, 여기서 R은 개시 코돈(AUG) 업스트림의 3개 염기의 퓨린(아데닌 또는 구아닌)이고, 그 뒤에는 다른 하나의 ‘G’이다.
3′ UTR에 아네노신 및 유리딘이 삽입된 것이 알려져 있다. 이러한 AU가 풍부한 특징은 높은 회전율의 유전자 중에서 특히 보편적이다. 이들의 서열 특징 및 기능 특성에 기반하여, AU 풍부 요소(ARE)는 3류(Chen et al., 1995)로 나뉜다: I류 ARE는 U 풍부 영역 내에 AUUUA 모티브의 몇개의 분산된 복사를 포함한다. C-Myc 및 MyoD는 I류 ARE를 포함한다. II류 ARE는 두 개 이상의 겹치는 UUAUUUA(U/A)(U/A) 노나머를 가진다. 이러한 ARE를 함유하는 분자는 GM-CSF 및 TNF-a를 포함한다. III류 ARES의 정의는 명확하지 않다. 이러한 U 풍부 영역은 AUUUA모티브를 함유하지 않는다. c-Jun 및 미오게닌은 이 유형 중 충분한 연구를 거친 2개의 예시이다. ARE와 결합하는 대다수의 단백질은 메신저의 안정성을 파괴할 수 있다고 이미 알려져 있으나, ELAV 패밀리의 구성원, 특히 HuR은 mRNA의 안정성을 향상시킬 수 있다고 기재되어 있다. HuR은 모든 3개 유형의 ARE와 결합한다. HuR 특이적 결합 부위를 핵산 분자의 3′ UTR에 조작하여, HuR 결합을 이룸으로써, 메신저가 체내에서 안정되도록 한다. 이러한 5’ 및/또는 3’ UTR 서열 중의 임의의 서열은 모두 본 발명의 RNA 서열에 존재할 수 있다.
일부 실시 형태에 있어서, 5’ UTR 및/또는 3’ UTR은 관심 유전자의 이종 서열을 포함할 수 있다. 일부 실시 형태에 있어서, 5’ UTR 및/또는 3’ UTR은 관심 유전자에 대해 천연적이다.
일부 실시 형태에 있어서, 폐, 간, 췌장, 내피 세포, CNS, 뉴런, 성상교세포, 골격근, 심근, 평활근, 혈액, 조혈세포 등의 특정 조직 또는 기관에서 정상적으로 발현되는 mRNA으로부터 유래되는 5’ UTR 및/또는 3’ UTR은 본 발명의 RNA 서열에 사용될 수 있고, 상기 RNA 서열은 이러한 조직 중의 하나 이상을 타겟팅하는 GOI를 포함한다.
폴리아데닐화 서열
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 전사되고 변형된 AAV ITR을 포함하고, 상기 전사되고 변형된 AAV ITR은 폴리A 서열, 폴리A 신호 서열(예를 들어, AAUAAA) 또는 RNA전사 종결 서열(예를 들어, 히스톤 다운스트림 요소)의 5’에 존재한다.
이상에서 “폴리A 서열”, “폴리A 꼬리”, “폴리A 신호 서열” 및 “RNA 전사 종결을 위한 서열”을 정의하였다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 폴리A 꼬리를 포함한다. 이러한 RNA 서열을 본 발명의 rRAAV 바이러스 입자에 패키징하고 표적 세포에 직접 전달할 수 있으며, 본 발명의 RNA 서열에 의해 코딩된 GOI를 직접 번역할 수 있다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 폴리A 신호 서열 및 선택적으로 폴리A 부위 다운스트림의 전사된 GU 풍부 영역을 포함한다. 이러한 RNA 서열을 본 발명의 rRAAV 바이러스 입자에 패키징하고, 표적 세포에 직접 전달할 수 있다. 일단 표적 세포에 진입하면, 폴리A 신호 서열은 세포질 폴리A 첨가 효소에 의해 인식되어 가공되어 폴리A꼬리를 생성할 수 있고, 그 후 본 발명의 RNA 서열에 의해 코딩된 GOI를 번역한다.
대표적인 폴리A 신호 서열 및 주변 서열은 인간 성장 호르몬(hGH)폴리A 서열(Liu et al., Gene Ther [인류 유전자 치료] 20:308-317, 2013 참조, 참조로 포함됨), 소 성장 호르몬 폴리아데닐화 신호(bGHpA)(Goodwin 및 Rottman, J Biol Chem. [생물화학 저널] 1992년 8월 15일; 267(23):16330-4, 참조로 포함됨), SV40 초기 또는 후기 폴리아데닐화 신호 및 Choi et al.(Mol Brain. [분자 브레인] 2014;7:17, 참조로 본 명세서에 포함됨)에 사용된 합성 폴리A 신호를 포함한다.
전사 인핸서
본 명세서에 사용된 바와 같이, “전사 인핸서”는 관심 유전자 전사의 시스 작용을 증가시킬 수 있는 뉴클레오티드 서열을 의미한다. 일부 실시 형태에 있어서, 전사 인핸서는 본 발명의 전사된 RAAV RNA 서열의 인트론 중에 위치하거나 또는 일부가 엑손 영역에 위치할 수 있다.
WPRE
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 코딩 DNA 상의 WPRE 서열에 의해 코딩되고 전사된 WPRE 서열을 포함한다.
우드척 간염 바이러스(WHP) 전사 후 조절 요소(WPRE)는 600 bp 좌우의 DNA 서열이고, 상기 DNA 서열은 전사 시 발현을 강화하는 3차 구조를 생성한다.
WPRE는 바이러스 벡터를 통해 전달되는 유전자의 발현을 증가시키기 위해 분자 생물학에서 자주 사용된다. 이는 γ, α 및 β 성분의 트리플 조절 요소를 갖는다. α 성분 길이는 80 bp: GCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGT(SEQ ID NO: 39)이다. 단독 사용 시, α 성분의 활성은 완전한 트리플 WPRE 서열의 9%에 불과하고, 이는 우드척 B형 간염 바이러스(WHV8) 게놈의 염기쌍 1093-1684와 100% 동일성을 갖는다.
일부 실시 형태에 있어서, 전사된 WPRE 서열 또는 그 일부(예컨대 γ, α 및 β 요소, 바람직하게는 주어진 순서에 따름)는 본 발명 rRAAV 바이러스 입자에 캡시드화된 대상 RNA 서열 상의 GOI의 3’ UTR 영역에 존재하여, 본 발명의 RNA 서열의 안정성 및 단백질 수율을 크게 향상시킨다.
일부 실시 형태에 있어서, WPRE 서열은 최소 γ 요소 및 일부 α-β 요소를 함유한 짧은 WPRE(WPRE2)이다(Kalev-Zylinska, J Neurosci. [신경 과학 저널] 2007, 27: 10456-10467 참조, 참조로 포함됨).
일부 실시 형태에 있어서, WPRE 서열은 최소 γ 및 α 요소를 함유한 짧은 WPRE(WPRE3)이다(Choi et al., Mol Brain [분자 브레인] 7, 17 (2014) 참조, 참조로 포함됨).
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 WPRE 서열 및 인트론이 결핍된 GOI를 포함한다.
프로모터
본 명세서에 사용된 바와 같이, 용어 “프로모터”는 폴리뉴클레오티드 서열의 특이적 전사의 시작에 필요한 세포 합성 기계 또는 도입된 합성 기계에 의해 인식되는 DNA 서열로 정의된다.
따라서, 본 발명의 RNA 서열은 프로모터를 포함하지 않는다. 다른 한편으로, 본 발명의 RNA 서열을 코딩하는 DNA(예컨대 본 발명의 RNA 서열을 코딩하는 발현 카세트 또는 발현 벡터)는 본 발명의 RNA 서열을 전사하기 위한 프로모터를 포함한다.
본 명세서에 사용된 바와 같이, 용어 “프로모터/조절 서열”은 프로모터/조절 서열과 조작 가능하게 연결되는 유전자 산물을 발현시키는 데 필요한 핵산 서열을 의미한다. 일부 경우, 이러한 서열은 코어 프로모터 서열일 수 있다. 다른 경우, 이러한 서열은 인핸서 서열 및 유전자 산물의 발현에 필요한 기타 조절 요소를 더 포함할 수 있다. 프로모터/조절 서열은 예를 들어 조직 또는 세포 유형 특이적 방식으로 유전자 산물(예를 들어, 본 발명의 RNA 서열)을 발현시키는 프로모터/조절 서열일 수 있다.
본 명세서에 사용된 바와 같이, 용어 “조작 가능한 연결” 또는 “조작 가능하게 연결”은 이와 같이 설명되는 성분이 예상 방식으로 작용하도록 물리적 병렬 또는 기능적 병렬되는 것을 의미한다. 이종 폴리뉴클레오티드와 조작 가능하게 연결되는 발현 제어 요소의 예시에서, 이러한 관계는 제어 요소가 이종 폴리뉴클레오티드의 발현을 조절하도록 한다. 더욱 특히, 예를 들어, 2개의 조작 가능하게 연결된 DNA 서열은 2개의 DNA가 이러한 관계로 배열되어(시스 또는 트랜스), DNA 서열 중의 적어도 하나가 다른 하나의 서열에 생리적 작용을 발휘할 수 있도록 하는 것을 의미한다.
일부 실시 형태에 있어서, 프로모터는 전신 발현 프로모터이다.
본 명세서에 사용된 바와 같이, “전신 발현” 프로모터는 유전자 산물을 코딩하거나 지정하는 폴리뉴클레오티드와 조작 가능하게 연결되는 경우, 세포의 대다수 또는 전부의 생리적 조건 하에서 유전자 산물이 세포 내에서 생성되도록 하는 뉴클레오티드 서열이다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열을 코딩하는 DNA에서 전신 발현적으로 그 발현을 구동하기 위한 프로모터는 β-글루쿠로니다제(GUSB) 프로모터, 사이토메갈로바이러스(CMV) 즉시 초기 (Ie) 인핸서 및/또는 프로모터, 닭 β-액틴(CBA) 프로모터 또는 그 유도체, 예컨대 CAG 프로모터, CB프로모터, (인간) 연장인자 1α-서브유닛(EF1α) 프로모터 및 유비퀴틴 C(UBC) 프로모터를 포함할 수 있다.
일부 실시 형태에 있어서, 프로모터는 유도성 프로모터이다.
본 명세서에 사용된 바와 같이, “유도성” 프로모터는 유전자 산물을 코딩 또는 지정하는 폴리뉴클레오티드와 조작 가능하게 연결되는 경우, 거의 프로모터에 대응되는 유도물이 세포에 존재할 때만이 유전자 산물이 세포에서 생성되도록 하는 뉴클레오티드 서열을 의미한다.
일부 실시 형태에 있어서, 프로모터는 조직 특이적 프로모터, 종 특이적 프로모터 또는 세포 주기 특이적 프로모터이다. Parr et al., Nat. Med. [자연의학] 3:1145-9, 1997 참조한다(전부 내용은 참조로 본 명세서에 포함된다).
본 명세서에 사용된 바와 같이, “조직 또는 세포 유형 특이적” 프로모터는 뉴클레오티드 서열이고, 코딩되거나 유전자에 의해 지정되는 폴리뉴클레오티드와 조작 가능하게 연결되는 경우, 바람직하게는 예를 들어 세포/조직은 프로모터가 통상적으로 그 중에서 활성을 갖는 세포 유형 또는 조직 유형이기에, 유전자 산물이 특정 세포 유형 또는 특정 세포에서 생성되도록 한다.
조직 또는 세포 유형 특이적 프로모터는 뉴런 조직 특이적 프로모터; CNS- 또는 PNS- 특이적 프로모터, 예컨대 성상교세포, 회돌기교세포 또는 뉴런 프로모터; 조혈 계통 특이적 프로모터, 예컨대 B세포 프로모터, T세포 프로모터, NK세포 프로모터, 단핵세포 프로모터, 백혈구 프로모터, 대식세포 프로모터; 내피 세포 프로모터; 췌장 프로모터; 간(liver/hepatic)세포 프로모터; 폐 조직 프로모터 등을 포함할 수 있다.
대표적인 조직 특이적 프로모터는 프리온 프로모터, 뉴런 특이적 엔올라제(NSE), 신경세사 경쇄(NFL) 프로모터, 신경세사 중쇄(NFH)프로모터, 혈소판 유래 성장인자(PDGF), 혈소판 유래 성장인자 B가닥(PDGF-β), 시냅신(Syn), 시냅신1(Syn1), 메틸-CpG 결합 단백질 2(MeCP2), Ca2+/칼모듈린 의존형 단백질 키나아제 II(CaMKII), 대사성 글루타메이트 수용체 2(mGluR2), 신경세사 경쇄(NFL) 또는 신경세사 중쇄(NFH), β-글로불린 꼬마유전자 nβ2, 프리프로엔케팔린(PPE), 엔케팔린(Enk) 및 흥분성 아미노산 운반체 2(EAAT2) 프로모터를 포함한다.
성상교세포 특이적 프로모터는 신경교섬유질산성 단백질(GFAP) 및 EAAT 2 프로모터를 포함한다.
회돌기교세포 특이적 프로모터는 미엘린 염기성 단백질(MBP) 프로모터를 포함한다.
일부 실시 형태에 있어서, 프로모터는 관심 유전자와 이종이다. 일부 실시 형태에 있어서, 프로모터는 관심 유전자의 천연 프로모터이다. 일부 실시 형태에 있어서, 이종 프로모터는 삽입, 결실, 치환 및/또는 기타 돌연변이를 포함한다. 일부 실시 형태에 있어서, 천연 프로모터는 삽입, 결실, 치환 및/또는 기타 돌연변이를 포함한다.
일부 실시 형태에 있어서, 프로모터는 Pol II 프로모터이다. 일부 실시 형태에 있어서, 프로모터는 Pol III 프로모터, 예컨대 U6 프로모터이다.
5.
벡터(플라스미드 또는 백미드)
본 명세서에 사용된 바와 같이, “벡터”는 통상적으로 단리된 핵산(DNA 또는 RNA)을 포함하고 세포 내부에 상기 단리된 핵산의 물질을 전달하는 데 사용될 수 있는 조성물을 의미한다.
용어 “발현 벡터”는 재조합 폴리뉴클레오티드를 포함한 벡터를 의미하고, 상기 재조합 폴리뉴클레오티드는 발현될 뉴클레오티드 서열와 조작 가능하게 연결된 발현 제어 서열를 포함한다. 발현 벡터는 충분한 발현을 위한 시스 작용 요소를 포함하고, 발현을 위한 다른 요소는 숙주 세포에서 제공되거나 또는 체외 발현 시스템에서 제공될 수 있다. 발현 벡터는 본 분야의 공지의 모든 발현 벡터, 예컨대 재조합 폴리뉴클레오티드에 혼입된 코스미드, 플라스미드, 백미드(예를 들어, 네이키드 또는 리보솜에 포함) 및 바이러스(예를 들어, 렌티바이러스, 레트로바이러스, 아데노 바이러스 및 아데노 관련 바이러스)를 포함한다.
GOI를 포함한 본 발명의 rRAAV RNA 서열은 벡터의 rRAAV 바이러스 입자를 감싸 상기 GOI를 표적/숙주 세포에 전달하는 데 사용되는 벡터이다.
일부 실시 형태에 있어서, 본 발명의 rRAAV RNA 서열은 DNA발현 벡터, 예컨대 플라스미드 또는 백미드(예를 들어, 곤충세포 내의 바큘로바이러스와 같이 유지하거나 복제할 수 있는 벡터)에 의해 코딩된다. 이러한 DNA발현 벡터는 적합한 숙주 세포에서 본 발명의 RNA 서열, 예컨대 포유동물 패키징 세포(예를 들어, HEK293T세포) 또는 곤충패키징 세포(예를 들어, Sf9세포)를 전사함으로써, rRAAV 패키징에 필요한 기타 요소(예컨대 rep 및 cap 코딩 서열)의 존재 하에서 대상 rRAAV 바이러스 입자를 생성할 수 있다.
여러 벡터는 본 분야에 공지된 것이고, 선형 폴리뉴클레오티드, 이온성 화합물 또는 양친성 화합물에 관련된 폴리뉴클레오티드, 플라스미드 및 바이러스를 포함하나 이에 한정되지 않는다. 따라서, 용어 “벡터”는 자기 복제 플라스미드 또는 바이러스를 포함한다. 상기 용어는 핵산을 세포에 전이하도록 촉진하는 비플라스미드 및 비바이러스 화합물, 예를 들어 폴리라이신 화합물, 리보솜 등을 포함하는 것으로 이해할 수도 있다. 바이러스 벡터의 예시는 아데노 바이러스 벡터, 아데노 관련 바이러스 벡터, 레트로바이러스 벡터 등을 포함하나 이에 한정되지 않는다.
일부 실시 형태에 있어서, RAAV는 플라스미드 또는 백미드로부터 전사된다. 상기 플라스미드 또는 백미드는 관심 유전자 서열을 포함할 수 있다. 일부 실시 형태에 있어서, 프로모터는 관심 유전자와 조작 가능하게 연결되고 관심 유전자의 업스트림에 위치한다. 일부 실시 형태에 있어서, 프로모터는 전사된 RAAV에 존재하지 않는다.
6.
AAV 입자 및 AAV 입자의 군체
일부 실시 형태에 있어서, 본 발명은 단리된 rRAAV 바이러스 입자를 제공하고, 상기 바이러스 입자는 본 명세서에 따른 AAV 캡시드 또는 바이러스 입자 중 어느 하나 내에 캡시드화되는 본 발명의 RNA 서열 중의 어느 하나를 포함한다.
일부 실시 형태에 있어서, AAV 캡시드 또는 바이러스 입자는 본 명세서에 따른 혈청형 또는 하나 이상의 혈청형의 조합이다.
본 발명의 rRAAV 벡터 또는 RNA 서열에서, rRAAV 게놈(RNA)은 단일 가닥(ss) 핵산 또는 이중 가닥(ds), 자가 상보적(sc) 핵산일 수 있다.
본 발명의 하나의 관련 양태는 재조합 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 제공하고, 상기 군체는 본 발명의 복수의 재조합 바이러스 입자(예를 들어, rRAAV 입자)를 포함하며, 여기서 상기 군체 내의 재조합 바이러스 입자(예를 들어, rRAAV 입자) 중의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 이상은 본 발명의 캡시드화RNA 서열을 갖는다.
일부 실시 형태에 있어서, rRAAV 입자의 군체는 본 발명의 복수의 rRAAV 바이러스 입자를 포함하고, 여기서 상기 군체 내의 rRAAV 입자의 약 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 이상은 본 발명의 캡시드화 RNA 서열을 갖는다.
일부 실시 형태에 있어서, 재조합 바이러스 입자(예를 들어, rRAAV 입자)의 군체는 적어도 1 × 104개의 바이러스 입자, 적어도 2 × 104개의 바이러스 입자, 적어도 5 × 104개의 바이러스 입자, 적어도 1 × 105개의 바이러스 입자, 적어도 2 × 105개의 바이러스 입자, 적어도 5 × 105개의 바이러스 입자, 적어도 1 × 106개의 바이러스 입자, 적어도 2 × 106개의 바이러스 입자, 적어도 5 × 106개의 바이러스 입자, 적어도 1 × 107개의 바이러스 입자, 적어도 2 × 107개의 바이러스 입자, 적어도 5 × 107개의 바이러스 입자, 적어도 1 × 108개의 바이러스 입자, 적어도 2 × 108개의 바이러스 입자, 적어도 5 × 108개의 바이러스 입자, 적어도 1 × 109개의 바이러스 입자, 적어도 2 × 109개의 바이러스 입자, 적어도 5 × 109개의 바이러스 입자, 적어도 1 × 1010개의 바이러스 입자, 적어도 2 × 1010개의 바이러스 입자, 적어도 5 × 1010개의 바이러스 입자, 적어도 1 × 1011개의 바이러스 입자, 적어도 2 × 1011개의 바이러스 입자, 적어도 5 × 1011개의 바이러스 입자, 적어도 1 × 1012개의 바이러스 입자, 적어도 2 × 1012개의 바이러스 입자, 적어도 5 × 1012개의 바이러스 입자, 적어도 1 × 1013개의 바이러스 입자, 적어도 2 × 1013개의 바이러스 입자, 적어도 5 × 1013개의 바이러스 입자, 적어도 1 × 1014개의 바이러스 입자, 적어도 2 × 1014개의 바이러스 입자, 적어도 5 × 1014개의 바이러스 입자, 적어도 1 × 1015개의 바이러스 입자, 적어도 2 × 1015개의 바이러스 입자, 적어도 5 × 1015개의 바이러스 입자, 적어도 1 × 1016개의 바이러스 입자, 적어도 2 × 1016개의 바이러스 입자 또는 적어도 5 × 1016개의 바이러스 입자를 포함한다.
일부 실시 형태에 있어서, 재조합 바이러스 입자의 군체 내의 최대 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10%, 5%, 3%, 2%, 1%, 0.1%, 0.01% 이하는 비RNA(예를 들어 DNA)를 바이러스 입자 내에 캡시드화한다.
7.
숙주 세포 및 AAV 생산
rAAV 생산의 일반 원리는 본 분야의 공지된 것이다. 이하 총론, 예를 들어, Carter(Current Opinions in Biotechnology [생물 기술 현재 견해], 1533-539, 1992); 및 Muzyczka, Curr. Topics in Microbial, and Immunol [미생물학 및 면역학의 현재 주제] 158:97-129, 1992, 모두 참조로 본 명세서에 포함됨)을 참조한다. 이하 문헌에 각종 방법이 기재되어 있다: Ratschin et al.(Mol. Cell. Biol. [분자 세포 생물학 저널] 4:2072, 1984; Hermonat et al.(Proc. Natl. Acad. Sci. USA [미국 국립 과학 아카데미 의사록] 81:6466, 1984); Tratschin et al.(Mol. Cell. Biol. [분자 세포 생물학 저널] 5:3251, 1985); McLaughlin et al.(J. Virol [바이러스학 저널] 62:1963, 1988); 및 Lebkowski et al.(Mol. Cell. Biol [ 분자세포 생물학 저널] 7:349, 1988), Samulski et al.(J. Virol [바이러스학 저널] 63:3822-3828, 1989); U.S. 5,173,414; WO 95/13365 및 U.S. 5,658,776; WO 95/13392; WO 96/17947; PCT/US98/18600; WO 97/09441; WO 97/08298; WO 97/21825; WO 97/06243; WO 99/11764; Perrin et al.(Vaccine [백신] 13:1244-1250, 1995; Paul et al.(Human Gene Therapy [인간 유전자 요법] 4:609-615, 1993); Clark et al.(Gene Therapy [유전자 요법] 3:1124-1132, 1996; U.S. 5,786,211; U.S. 5,871,982; 및 U.S. 6,258,595.
AAV 벡터 혈청형은 표적 세포 유형과 일치할 수 있다. 예를 들어, WO 2018002719 A1의 표 2에 지정된 AAV 혈청형에 의해 형질도입될 수 있는 예시적 세포 유형이 열거되어 있다(참조로 본 명세서에 포함됨).
패키징 세포는 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성하는 데 사용된다. 이러한 세포는 HEK293 및 Sf9세포를 포함하고, AAV 및 아데노 바이러스를 패키징하는 데 사용될 수 있다.
통상적으로 핵산 벡터를 바이러스 입자의 생산자 세포계에 패키징하여 유전자 요법에서 사용되는 바이러스 벡터를 생성한다. 벡터는 통상적으로 패키징 및 그 후 숙주 세포(만약 적합하다면)에 통합되는 데 필요한 최소 바이러스 서열을 함유하고, 기타 바이러스 서열은 발현될 단백질이 코딩된 발현 카세트에 의해 대체된다. 결실된 바이러스 기능은 패키징 세포계에서 트랜스 형식으로 제공될 수 있고, 통상적으로 이러한 바이러스 기능/단백질(예컨대 AAV의 rep 및 cap 유전자)가 패키징 세포에 통합되는 전이 유전자 또는 상기 패키징 세포에 도입되는 제2 바이러스 벡터 또는 발현 벡터 상의 전이 유전자로서 발현되는 결과이다.
예를 들어, 유전자 요법에 사용되는 AAV 벡터는 전형적으로 AAV 게놈으로부터 유래된 말단 역반복(ITR) 서열만 가지고, 상기 서열은 숙주 게놈에 패키징 및 통합되는 데 필요한 것이다. 바이러스 DNA를 세포계에 패키징하여, 상기 세포계에 기타 AAV 유전자 즉 rep 및 cap을 코딩하나 ITR 서열이 결핍된 헬퍼 플라스미드를 함유한다. 상기 세포계는 조력자로서의 아데노 바이러스에 의해 감염된다. 헬퍼 바이러스는 AAV 벡터 복제 및 헬퍼 플라스미드에서 유래된 AAV유전자 발현을 촉진한다. 헬퍼 플라스미드는 ITR 서열이 결핍되어 대량으로 패키징되지 않는다. 아데노 바이러스의 오염은 예를 들어 아데노 바이러스가 AAV보다 더욱 민감한 열처리를 통해 감소시킬 수 있다.
일부 실시 형태에 있어서, 삼중 형질감염 방법(미국 특허번호 6,001,650에서 상세하게 설명됨)으로 재조합 AAV를 생상할 수 있다. 전형적으로, AAV 입자에 패키징될 재조합 AAV 벡터(관심 유전자 포함), AAV헬퍼 기능 벡터 및 보조 기능 벡터로 숙주 세포를 형질감염시켜 재조합 AAV를 생성한다. AAV헬퍼 기능 벡터는 “AAV 헬퍼 기능” 서열(예를 들어, rep 및 cap)을 코딩하고, 상기 서열은 트랜스로 작용하여, 생산성 AAV 복제 및 캡시드화에 사용된다. 바람직하게는, AAV헬퍼 기능 벡터는 유효한 AAV 벡터 생산을 지지하나, 임의의 검출 가능한 야생형 AAV비리온(예를 들어, 기능적 rep 및 cap 유전자를 함유하는 AAV비리온)을 생성하지 않는다. 상기 보조 기능 벡터는 AAV가 복제를 진행하는 비AAV유도성 바이러스 및/또는 세포 기능(예를 들어, “부수적 기능”)에 의존하는 뉴클레오티드 서열을 코딩한다. 보조 기능은 AAV 복제에 필요한 기능을 포함하고, AAV 유전자 전사의 활성화 참여, 단계 특이적 AAV mRNA 스플라이싱, AAV DNA 복제, cap 발현 산물 합성 및 AAV 캡시드 조립 부분을 포함하나 이에 한정되지 않는다. 바이러스에 기반하는 보조 기능은 공지의 헬퍼 바이러스의 어느 하나, 예컨대 아데노 바이러스, 헤르페스 바이러스(단순 헤르페스 바이러스-1형 제외) 및 백시니아 바이러스에서 파생될 수 있다.
일부 실시 형태에 있어서, 곤충세포 (예컨대 Sf9세포)에 패키징된 베큘로바이러스 발현 시스템을 이용하여 대상 rRAAV를 생성한다. 예를 들어 WO 2007046703, WO 2007148971, WO 2009014445, WO 2009104964, WO 2013036118, WO 2011112089, WO 2016083560, WO 2015137802 및 WO 2019016349를 참조하고, 모두 참조로 본 명세서에 포함된다.
벡터 역가는 통상적으로 바이러스 게놈/ml(vg/ml)으로 나타낸다. 일부 실시 형태에 있어서, 바이러스 역가는 1 x 109초과, 5 x 1010초과, 1 x 1011초과, 5 x 1011초과, 1 x 1012초과, 5 x 1012초과 또는 1 x 1013 vg/ml를 초과한다.
8.
관심 유전자(GOI) 또는 관심 RNA 서열(RSI)
본 발명의 rRAAV 바이러스 입자는 임의의 관심 유전자(GOI) 또는 관심 RNA 서열(RSI)을 숙주 세포에 전달하는 데 사용될 수 있고, GOI가 선택된 AAV 바이러스 캡시드 또는 AAV 바이러스 입자 쉘의 패키징 한도 내의 RNA이기만 하면 임의의 목적으로 사용될 수 있으며, 예컨대 대다수 AAV 바이러스 입자의 경우 총길이가 약 4,700개의 뉴클레오티드이고, 일부 대용량 AAV 바이러스 입자(예컨대 AAV5)의 경우 총길이가 약 8,900개의 뉴클레오티드에 달할 수 있다.
일부 실시 형태에 있어서, 대표적인(비한정적인) 관심 RNA 서열(RSI)은 예를 들어, 단백질을 코딩하는 RNA, mRNA, 비코딩RNA(ncRNA), tRNA, 리보솜 RNA(rRNA), 전이-메신저 RNA(tmRNA), 안티센스 올리고뉴클레오티드(ASO), RNA 어댑터, CRISPR-Cas시스템의 RNA 성분(예컨대, 단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라), CRISPR RNA(crRNA), tracr RNA), 또는 RISC 복합물 또는 RNAi 경로의 RNA 성분(예컨대 shRNA, miRNA 또는 siRNA), 조절 RNA, Piwi 상호 작용RNA(piRNA), 소핵소체 RNA(snoRNA), 긴 비코딩 RNA(lncRNA)(유전자간 lincRNA, 인트론 ncRNA 및 센스/안티센스 lncRNA 포함), long intervening/유전자 간 비코딩 RNA(lincRNA), 인핸서 RNA, bacterial small RNA(sRNA), snRNA, exRNA, scaRNA, Xist 및 HOTAIR 및 그 전구체를 포함한다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 단백질 또는 폴리펩티드의 코딩 서열을 포함한다.
일부 실시 형태에 있어서, 단백질 또는 폴리펩티드는 표적 세포, 조직 또는 생물체 중의 결함 단백질을 대체하는 데 사용될 수 있는 야생형 단백질 또는 그 기능 등가물 또는 변이체(예컨대 효소 또는 구조 단백질)이다.
일부 실시 형태에 있어서, 단백질 또는 폴리펩티드는 표적 세포, 조직 또는 생물체 중의 화합물(소분자 화합물 또는 대분자, 예컨대 지질, 지방산, 단백질, 핵산 등)을 길항하는 데 사용될 수 있는 야생형 단백질 또는 그 기능 등가물 또는 변이체(예컨대 효소 또는 구조 단백질)이다.
예를 들어, 일부 실시 형태에 있어서, 본 발명의 RNA 서열은 CRISPR/Cas시스템의 이펙터 효소의 코딩 서열을 포함한다.
일부 실시 형태에 있어서, CRISPR-Cas시스템은 1류 시스템이고, 이펙터 효소는 I, III 또는 IV형 이펙터 효소이다.
일부 실시 형태에 있어서, CRISPR-Cas시스템은 2류 시스템이고, 이펙터 효소는 II, V 또는 VI형 이펙터 효소이다.
예를 들어, 일부 실시 형태에 있어서, 이펙터 효소는 2류 II형 효소이고, 예컨대 Cas9이며, 스트렙토코커스 피오게네스(Streptococcus pyogenes)(SpCas9) 또는 SaCas9(WO 2014/093622(PCT/US 2013/074667 참조), 참조로 포함됨)를 포함한다.
일부 실시 형태에 있어서, Cas 이펙터 효소는 2류 V형 Cas 단백질이고, Cas12a(이전에는 Cpf1으로 칭하고, 예컨대 프란시셀라 노비시다(Francisella novicida)Cas12a), C2c1 및 C2c3을 포함한다.
일부 실시 형태에 있어서, Cas 이펙터 효소는 2류 VI형 Cas 단백질이고, Cas13a(C2c2로도 칭함), Cas13b, Cas13c, Cas13d, Cas13e 및 Cas13f를 포함한다. 이러한 Cas 단백질은 이들의 crRNA를 사용하여 Cas9 및 Cas12a 중의 표적 DNA 서열이 아닌 표적 RNA 서열을 인식한다.
일부 실시 형태에 있어서, Cas 이펙터 효소는 WO 2020/028555에서 설명한 Cas 이펙터 효소 중의 어느 하나(전부 내용은 참조로 본 명세서에 통합)이고, Cas9, Cas12(예를 들어, Cas12a, Cas12b, Cas12c, Cas12d 등), Cas13(예를 들어, Cas13a, Cas13b(예를 들어 Cas13b-t1, Cas13b-t2, Cas13b-t3), Cas13c, Cas13d 등), Cas14, CasX 및 CasY 중의 어느 하나를 포함한다.
일부 실시 형태에 있어서, Cas 이펙터 효소는 DNA 및/또는 RNA염기 편집기, 예컨대 사이토신 또는 아데닌염기 편집기(CBE 또는 ABE)에 융합된다. 일부 실시 형태에 있어서, 염기 편집기는 바람직하게는 DNA 염기를 편집하고 선택적으로 오프-타겟 RNA 염기 편집 능력이 저하되거나 거의 없다. 일부 실시 형태에 있어서, 염기 편집기는 바람직하게는 RNA염기를 편집하고 선택적으로 오프-타겟 DNA염기 편집 능력이 저하되거나 또는 거의 없다. 일부 실시 형태에 있어서, 염기 편집기는 DNA 및 RNA염기 둘 모두를 편집한다.
일부 실시 형태에 있어서, 염기 편집기는 1세대, 2세대(BE2), 3세대(BE3) 또는 4세대(BE4) 염기 편집기이다. 일부 실시 형태에 있어서, 염기 편집기는 이중 염기 편집기이다.
일부 실시 형태에 있어서, 염기 편집기는 RNA 아데노신 디아미나제(ADAR), 예컨대 ADAR1, ADAR2 또는 ADAR2DD(E488Q)를 포함한 ADARDD이다.
상기 임의의 실시 형태에서, 본 발명의 RNA 서열은 가이드 RNA 서열을 더 포함할 수 있고, 상기 가이드 RNA 서열은 코딩된 CRISPR/Cas 이펙터 효소에 로딩되어, 가이드 RNA에 상보적인 표적 폴리뉴클레오티드 서열을 결합하는 데 사용되도록 설계된다. 본 발명의 rRAAV 바이러스 입자가 본 발명의 RNA 서열을 표적 숙주 세포에 전달한 후, 이러한 gRNA 서열은 세포 뉴클레아제에 의해 처리되고 본 발명의 RNA 서열로부터 방출/단리될 수 있다. 예를 들어, gRNA는 본 발명의 RNA 서열의 일부인 pri-miRNA 헤어핀 구조의 짝을 이루지 않는 5’ 또는 3’ 플랭킹 부위 서열에 존재할 수 있고, 상기 pri-miRNA은 Drosha와 같은 세포 효소 처리 후, 초기 pri-miRNA전사체로부터 방출/단리된다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 CRISPR/Cas시스템의 이펙터 효소의 코딩 서열을 포함하고, DNA 또는 RNA 염기 편집 효소 또는 도메인의 코딩 서열을 더 포함하여, Cas 이펙터 효소 및 DNA/RNA염기 편집 효소/도메인의 융합물이 RNA 서열에 의해 코딩되도록 한다. 일부 실시 형태에 있어서, Cas 이펙터 효소의 뉴클레아제 활성에 결함이 존재하여, 이에 결합된 가이드 RNA를 통해 표적 폴리뉴클레오티드 서열에 결합될 수 있으나, DNA/RNA 폴리 폴리뉴클레오티드를 절단할 수 없다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 CRISPR/Cas시스템 이펙터 효소의 변이체 또는 유도체의 코딩 서열을 포함하고, 여기서 상기 변이체는 야생형 CRISPR/Cas시스템 이펙터 효소의 결실(예컨대 N 및/또는 C 말단결실, 예를 들어, Cas13e 또는 Cas13f의 N 말단이 210개의 잔기 결실을 초과하지 않거나 및/또는 C 말단이 180개의 잔기 결실을 초과하지 않음), 삽입 또는 치환을 포함하나, 상기 야생형 이펙터 효소와 gRNA의 결합 및/또는 표적 폴리뉴클레오티드 절단 능력을 거의 보류한다. 일부 실시 형태에 있어서, 상기 변이체는 표적 폴리뉴클레오티드를 절단하는 활성이 결핍하다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열에 의해 코딩된 상기 RNA염기 편집 도메인은 아데노신 디아미나제, 예컨대 이중 가닥 RNA 특이적 아데노신 디아미나제(예를 들어, ADAR1 또는 ADAR2); 아포지질 단백질 B mRNA 편집 효소; 촉매 폴리펩티드 유사체(catalytic polypeptide-like)(APOBEC); 또는 활성화 유도 시티딘 탈아미노효소(AID)이다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열에 의해 코딩된 상기 RNA염기 편집 도메인은 아데노신 디아미나제 및/또는 시티딘 탈아미노효소, 예컨대 RNA에 작용하는 시티딘 탈아미노효소(CDAR), 예컨대 이중 가닥 RNA 특이적 아데노신 디아미나제(ADAR)(예를 들어, ADAR1 또는 ADAR2), 아포지질단백질 B mRNA 편집효소, 촉매 폴리펩티드 유사체(APOBEC, 예컨대 APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3E, APOBEC3F, APOBEC3G, APOBEC3H 및 APOBEC4), 활성화 유도 시티딘 탈아미노효소(AID), 시티딘 탈아미노효소1(CDA1) 또는 그 돌연변이체를 포함한다.
일부 실시 형태에 있어서, ADAR은 E488Q/T375G이중 돌연변이 또는 ADAR2DD를 갖는다.
일부 실시 형태에 있어서, 상기 염기 편집 도메인을 MS2와 같은 RNA결합 도메인과 더 융합시킨다.
일부 실시 형태에 있어서, 상기 코딩된 CRISPR/Cas 이펙터 효소의 변이체 또는 유도체는 RNA 메틸트랜스퍼라제, RNA 디메틸라아제, RNA스플라이싱 개질제, 위치화 인자 또는 번역 변형 인자를 더 포함한다.
일부 실시 형태에 있어서, 상기 Cas 이펙터 효소, 상기 변이체/그 유도체 또는 기능적 단편은 핵 위치화 신호(NLS) 서열 또는 핵배출 신호(NES)를 포함한다.
일부 실시 형태에 있어서, 상기 Cas 이펙터 효소, 변이체/그 유도체 또는 그 기능적 단편을 이종 기능적 도메인과 융합시킨다. 일부 실시 형태에 있어서, 상기 이종 기능적 도메인은 핵 위치화 신호(NLS), 리포터 단백질 또는 검출 표지(예를 들어, GST, HRP, CAT, GFP, HcRed, DsRed, CFP, YFP, BFP), 위치화 신호, 단백질 타겟팅 부분, DNA 결합 도메인(예를 들어, MBP, Lex A DBD, Gal4 DBD), 에피토프 태그(예를 들어, His, myc, V5, FLAG, HA, VSV-G, Trx 등), 전사 활성화 도메인(예를 들어, VP64 또는 VPR), 전사 억제 도메인(예를 들어, KRAB 부분 또는 SID 부분), 뉴클레아제(예를 들어, FokI), 탈아미노화 도메인(예를 들어, ADAR1, ADAR2, APOBEC, AID 또는 TAD), 메틸라아제, 디메틸라아제, 전사 방출 인자, HDAC, ssRNA 절단 활성을 갖는 폴리펩티드, dsRNA 절단 활성을 갖는 폴리펩티드, ssDNA 절단 활성을 갖는 폴리펩티드, dsDNA 절단 활성을 갖는 폴리펩티드, DNA 또는 RNA 연결 효소 또는 그 임의의 조합을 포함한다. 일부 실시 형태에 있어서, 상기 이종 기능적 도메인을 상기 융합 단백질의 N-말단, C-말단 또는 내부에서 융합시킨다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 CasPR(제1 류 전구체crRNA 처리를 위한 CRISPR 관련 단백질) 융합 단백질의 코딩 서열, 상기 융합 단백질은 이종 기능적 도메인에 융합된 CasPR(또는 그 상동체, 동원체, 이원체, 변이체, 유도체 또는 기능적 단편); 또는 그 기능적 변이체를 포함한다.
일부 실시 형태에 있어서, CasPR은 Cas5d, Cas6 또는 Csf5이다.
일부 실시 형태에 있어서, CasPR은 MtCas6(I-A)(서열 1), MmCas6(I-B)(서열 2), SpCas5d(I-C1)(서열 3), BhCas5d(I-C2)(서열 4), SaCas6 (I-D)(서열 5), EcCas6e(I-E)(서열6), PaCas6f(I-F)(서열7), MtCas6(III-A)(서열8), PfCas6(III-B)(서열9), PaCsf5(IV-A1)(서열 10) 또는 MtCsf5(IV-A2)(서열 11)이다. 모든서열을 참조로서 본 명세서에 포함된다.
MPLIFKIGYNVIPLQDVILPTPSSKVLKYLIQSGKLIPSLKDLITSRDKYKPIFISHLGFNQRRIFQT NGNLKTITKGSRLSSIIAFSTQANVLSEVADEGIFETVYGKFHIMIESIEIVEVEKLKEEVEKHMNDN IRVRFVSPTLLSSKVLLPPSLSERYKKIHAGYSTLPSVGLIVAYAYNVYCNLIGKKEVEVRAFKFGIL SNALSRIIGYDLHPVTVAIGEDSKGNLRKARGVMGWIEFDIPDERLKRRALNYLLTSSYLGIGRSRGI GFGEIRLEFRKIEEKEG (서열 1)
MDLEYMHISYPNILLNMRDGSKLRGYFAKKYIDEEIVHNHRDNAFVYKYPQIQFKIIDRSPLIIGIGS LGINFLESKRIFFEKELIISNDTNDITEVNVHKDMDHFGTTDKILKYQFKTPWMALNAKNSEIYKNSD EIDREEFLKRVLIGNILSMSKSLGYTIEEKLKVKINLKEVPVKFKNQNMVGFRGEFYINFDIPQYLGI GRNVSRGFGTVVKV (서열 2)
MYRSRDFYVRVSGQRALFTNPATKGGSERSSYSVPTRQALNGIVDAIYYKPTFTNIVTEVKVINQIQT ELQGVRALLHDYSADLSYVSYLSDVVYLIKFHFVWNEDRKDLNSDRLPAKHEAIMERSIRKGGRRDVF LGTRECLGLLDDISQEEYETTVSYYNGVNIDLGIMFHSFAYPKDKKTPLKSYFTKTVMKNGVITFKAQ SECDIVNTLSSYAFKAPEEIKSVNDECMEYDAMEKGEN (서열 3)
MRNEVQFELFGDYALFTDPLTKIGGEKLSYSVPTYQALKGIAESIYWKPTIVFVIDELRVMKPIQMES KGVRPIEYGGGNTLAHYTYLKDVHYQVKAHFEFNLHRPDLAFDRNEGKHYSILQRSLKAGGRRDIFLG ARECQGYVAPCEFGSGDGFYDGQGKYHLGTMVHGFNYPDETGQHQLDVRLWSAVMENGYIQFPRPEDC PIVRPVKEMEPKIFNPDNVQSAEQLLHDLGGE (서열 4)
MPNDPYSLYSIVIELGAAEKGFPTGILGRSLHSQVLQWFKQDNPFLATELHQSQISPFSISPLMGKRH AKLTKAGDRLFFRICLLRGDLLQPLLNGIEQTVNQSVCLDKFRFRLCQTHILPGSHPLAGASHYSLIS QTPVSSKITLDFKSSTSFKVDRKIIQVFPLGEHVFNSLLRRWNNFAPEDLHFSQVDWSIPIAAFDVKT IPIHLKKVEIGAQGWVTYIFPNTEQAKIASVLSEFAFFSGVGRKTTMGMGQVQVRS (서열 5)
MYLSKVIIARAWSRDLYQLHQGLWHLFPNRPDAARDFLFHVEKRNTPEGCHVLLQSAQMPVSTAVATV IKTKQVEFQLQVGVPLYFRLRANPIKTILDNQKRLDSKGNIKRCRVPLIKEAEQIAWLQRKLGNAARV EDVHPISERPQYFSGDGKSGKIQTVCFEGVLTINDAPALIDLVQQGIGPAKSMGCGLLSLAPL (서열 6)
MDHYLDIRLRPDPEFPPAQLMSVLFGKLHQALVAQGGDRIGVSFPDLDESRSRLGERLRIHASADDLR ALLARPWLEGLRDHLQFGEPAVVPHPTPYRQVSRVQAKSNPERLRRRLMRRHDLSEEEARKRIPDTVA RALDLPFVTLRSQSTGQHFRLFIRHGPLQVTAEEGGFTCYGLSKGGFVPWF (서열 7)
MAARRGGIRRTDLLRRSGQPRGRHRASAAESGLTWISPTLILVGFSHRGDRRMTEHLSRLTLTLEVDA PLERARVATLGPHLHGVLMESIPADYVQTLHTVPVNPYSQYALARSTTSLEWKISTLTNEARQQIVGP INDAAFAGFRLRASGIATQVTSRSLEQNPLSQFARIFYARPETRKFRVEFLTPTAFKQSGEYVFWPDP RLVFQSLAQKYGAIVDGEEPDPGLIAEFGQSVRLSAFRVASAPFAVGAARVPGFTGSATFTVRGVDTF ASYIAALLWFGEFSGCGIKASMGMGAIRVQPLAPREKCVPKP (서열 8)
MRFLIRLVPEDKDRAFKVPYNHQYYLQGLIYNAIKSSNPKLATYLHEVKGPKLFTYSLFMAEKREHPK GLPYFLGYKKGFFYFSTCVPEIAEALVNGLLMNPEVRLWDERFYLHEIKVLREPKKFNGSTFVTLSPI AVTVVRKGKSYDVPPMEKEFYSIIKDDLQDKYVMAYGDKPPSEFEMEVLIAKPKRFRIKPGIYQTAWH LVFRAYGNDDLLKVGYEVGFGEKNSLGFGMVKVEGNKTTKEAEEQEKITFNSREELKTGV (서열 9)
MFVTQVIFNIGERTYPDRARAMVAELMDGVQPGLVATLMNYIPGTSTSRTEFPTVQFGGASDGFCLLG FGDGGGAIVRDAVPLIHAALARRMPDRIIQVEHKEHSLSAEARPYVLSYTVPRMVVQKKQRHAERLLH EAEGKAHLEGLFLRSLQRQAAAVGLPLPENLEVEFKGAVGDFAAKHNPNSKVAYRGLRGAVFDVNARL GGIWTAGFMLSKGYGQFNATHQLSGAVNALSE (서열 10)
MHQTLIRINWPKGFKCPPAEFREKLAKSEMFPPEFFHYGTELAVWDKQTAEVEGKIKTVSKEKIIKTF DKPIPLNGRAPVRVIGGQAWAGVIADPEMEGMLIPHLGSILKVASSAAGCAVKIELEQRKFGISYTEY PVKYNLRELVLKRRCEDARSTDIESLIADRIWGGVSGESYYGIDGTCAKFGFEPPSREQLELRIFPMK NIGLHMKSSDGLSKEYMSLIDAEVWMNAKLEGVWQVGNLISRGYGRFIKSIGAQS (서열 11)
서열 12:GATAATCTCTTATAGAATTGAAAG
서열 13:CTAAAAGAATAACTTGCAAAATAACAAGCATTGAAAC
서열 14:GTCTCACCCTTCATGGGTGAGTGGATTGAAAT
서열 15:GTCGCACTCTTCATGGGTGCGTGGATTGAAAT
서열 16:GTTTCAGTCCCGTAGTCGGGATTTAGTGGTTGGAAAG
서열 17:GAGTTCCCCGCGCCAGCGGGGATAAACCG
서열 18:GTTCACTGCCGTATAGGCAGCTAAGAAA
서열 19:GTCGTCAGACCCAAAACCCCGAGAGGGGACGGAAAC
서열 20:GTTACAATAAGACTAAAATAGAATTGAAAG
서열 21:GTATTTCCCGCGTGCGCGGGGGTGAGCGG
서열 22:TATTGGATACACCCACTCATTGGTGGGTGGTTAGAAC
서열 23:GAUAAUCUCUUAUAGAAUUGAAAG
서열 24:CUAAAAGAAUAACUUGCAAAAUAACAAGCAUUGAAAC
서열 25:GUCUCACCCUUCAUGGGUGAGUGGAUUGAAAU
서열 26:GUCGCACUCUUCAUGGGUGCGUGGAUUGAAAU
서열 27:GUUUCAGUCCCGUAGUCGGGAUUUAGUGGUUGGAAAG
서열 28:GAGUUCCCCGCGCCAGCGGGGAUAAACCG
서열 29:GUUCACUGCCGUAUAGGCAGCUAAGAAA
서열 30:GUCGUCAGACCCAAAACCCCGAGAGGGGACGGAAAC
서열 31:GUUACAAUAAGACUAAAAUAGAAUUGAAAG
서열 32:GUAUUUCCCGCGUGCGCGGGGGUGAGCGG
서열 33:UAUUGGAUACACCCACUCAUUGGUGGGUGGUUAGAAC
일부 실시 형태에 있어서, CasPR에 융합된 상기 이종 기능적 도메인은 핵 위치화 신호(NLS), 리포터 단백질 또는 검출 표지(예를 들어, GST, HRP, CAT, GFP, HcRed, DsRed, CFP, YFP, BFP), 위치화 신호, 단백질 타겟팅 부분, DNA결합 도메인(예를 들어, MBP, Lex A DBD, Gal4 DBD), 에피토프 태그(예를 들어, His, myc, V5, FLAG, HA, VSV-G, Trx 등), 전사 활성화 도메인(예를 들어, VP64 또는 VPR), 전사 억제 도메인(예를 들어, KRAB 부분 또는 SID 부분), 뉴클레아제(예를 들어, FokI), 탈아미노화 도메인(예를 들어, ADAR1, ADAR2, APOBEC, AID 또는 TAD), 메틸라아제, 디메틸라아제, 전사 방출 인자, HDAC, ssRNA절단 활성을 갖는 폴리펩티드, dsRNA절단 활성을 갖는 폴리펩티드, ssDNA절단 활성을 갖는 폴리펩티드, dsDNA절단 활성을 갖는 폴리펩티드, DNA 또는 RNA 연결 효소 또는 그 임의의 조합을 포함한다. 일부 실시 형태에 있어서, 이종 기능적 도메인은 RNA염기 편집기를 포함한다. 일부 실시 형태에 있어서, 상기 RNA염기 편집기는 A→G 단일 염기 변화를 편집한다. 일부 실시 형태에 있어서, 상기 RNA염기 편집기는 C→U 단일 염기 변화를 편집한다. 일부 실시 형태에 있어서, 상기 RNA염기 편집기는 ADAR2DD 또는 그 유도체를 포함한다. 일부 실시 형태에 있어서, ADAR2DD 유도체는 E488Q/T375A 이중 돌연변이를 포함한다.
일부 실시 형태에 있어서, 융합 단백질은 서열 45-55 중 어느 하나의 아미노산 서열을 갖는다.
MTCAS6(I-A):
ATGCCCAAGAAGAAGCGGAAGGTGATGCCTCTGATCTTCAAGATCGGCTATAACGTGATCCCCCTGCAGGACGTGATCCTGCCCACCCCTTCCAGCAAGGTGCTGAAGTACCTGATCCAGAGCGGCAAGCTGATCCCCAGCCTGAAGGACCTGATCACCAGCCGGGACAAGTACAAGCCAATCTTCATCTCCCACCTGGGCTTCAACCAGCGGAGGATTTTCCAGACCAACGGCAATCTGAAAACCATCACCAAGGGCAGTAGACTGAGCTCCATCATCGCCTTCAGCACCCAGGCCAACGTGCTGTCCGAGGTGGCCGATGAAGGGATCTTCGAAACCGTGTACGGAAAGTTCCACATCATGATCGAAAGCATCGAGATCGTGGAGGTGGAAAAGCTGAAGGAGGAGGTGGAGAAGCACATGAACGACAACATCAGAGTGAGATTCGTGTCTCCCACACTGCTGAGCTCCAAGGTGCTGCTGCCCCCCAGCCTGTCCGAAAGATACAAGAAGATCCACGCCGGGTACAGCACCCTGCCCAGCGTGGGCCTGATCGTGGCCTACGCCTACAACGTGTACTGCAATCTGATCGGCAAGAAGGAAGTGGAAGTGCGGGCCTTCAAGTTTGGAATCCTGAGCAACGCCCTGTCCAGAATCATCGGCTACGACCTGCACCCTGTGACCGTGGCCATCGGCGAGGACAGCAAGGGGAATCTGAGAAAGGCTCGGGGCGTGATGGGCTGGATCGAGTTCGACATCCCCGACGAAAGACTGAAGCGGCGGGCCCTGAACTATCTGCTGACCAGCAGCTACCTGGGCATCGGGAGATCTCGGGGCATCGGCTTCGGCGAGATCCGGCTGGAGTTCCGGAAGATTGAAGAGAAGGAGGGACCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 45)
MMCAS6 (I-B):
ATGCCCAAGAAGAAGCGGAAGGTGATGGACCTGGAGTACATGCACATCTCCTACCCTAACATCCTGCTGAACATGCGGGACGGCAGCAAGCTGCGGGGCTACTTCGCCAAGAAGTACATCGACGAAGAGATTGTGCACAACCACAGAGACAACGCCTTTGTGTACAAGTACCCCCAGATCCAGTTTAAGATCATCGATAGAAGCCCCCTGATCATCGGCATTGGCTCTCTGGGCATCAATTTCCTGGAGAGCAAGCGGATCTTCTTCGAGAAGGAACTGATTATCAGCAACGACACCAACGACATCACCGAGGTGAACGTGCACAAGGACATGGATCACTTCGGCACGACCGACAAGATCCTGAAGTACCAGTTCAAGACCCCTTGGATGGCACTGAACGCCAAGAATAGCGAGATCTACAAGAACTCTGACGAGATCGACCGGGAGGAGTTCCTGAAGAGAGTGCTGATTGGGAATATCCTGAGCATGTCTAAGAGCCTGGGCTATACCATCGAAGAAAAGCTGAAGGTGAAGATTAACCTGAAGGAAGTGCCCGTGAAGTTCAAGAACCAGAACATGGTGGGCTTTCGGGGCGAGTTCTACATCAACTTCGACATCCCTCAGTATCTGGGCATCGGCCGGAATGTGTCCCGGGGATTCGGCACAGTGGTGAAGGTGCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 46)
SPCAS5D (I-C1):
ATGCCCAAGAAGAAGCGGAAGGTGATGAGAAATGAAGTGCAGTTCGAGCTGTTCGGCGACTACGCCCTGTTCACCGACCCCCTGACCAAGATCGGCGGCGAAAAGCTGAGCTACAGCGTGCCTACCTACCAGGCCCTGAAGGGCATCGCCGAGAGCATCTACTGGAAGCCCACCATCGTGTTCGTGATCGACGAACTGCGGGTCATGAAGCCCATTCAGATGGAGTCTAAGGGCGTGAGGCCCATCGAGTACGGCGGCGGCAACACCCTGGCCCACTACACCTACCTGAAGGATGTGCACTACCAGGTGAAGGCCCACTTCGAGTTCAACCTGCACCGGCCCGACCTGGCCTTCGATAGAAACGAGGGCAAGCACTACTCCATCCTGCAGAGAAGCCTGAAGGCCGGCGGCAGAAGAGATATTTTCCTGGGCGCCCGGGAGTGCCAGGGCTACGTGGCCCCCTGCGAGTTCGGCAGCGGCGACGGCTTCTACGACGGCCAGGGCAAGTACCACCTGGGAACCATGGTGCACGGTTTCAACTACCCCGACGAAACCGGACAGCACCAGCTGGATGTGAGACTGTGGTCTGCCGTCATGGAAAACGGCTACATCCAGTTCCCCCGCCCTGAGGACTGCCCCATCGTGCGGCCTGTGAAGGAGATGGAACCCAAGATCTTCAACCCCGACAACGTGCAGTCCGCCGAACAGCTGCTGCACGACCTGGGCGGCGAACCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 47)
BHCAS5D (I-C2):
ATGCCCAAGAAGAAGCGGAAGGTGATGTACAGAAGCCGGGACTTCTACGTGAGAGTGTCCGGCCAGCGGGCCCTGTTCACCAACCCCGCCACCAAGGGCGGCTCCGAACGGAGCTCCTACTCCGTGCCTACCCGGCAGGCCCTGAACGGGATTGTGGACGCCATCTACTACAAGCCCACGTTCACCAACATCGTGACCGAGGTGAAGGTGATTAACCAGATCCAGACCGAACTGCAGGGCGTGCGGGCCCTGCTGCATGACTACAGCGCCGACCTGAGCTACGTGTCCTACCTGAGCGACGTGGTGTACCTGATTAAGTTTCATTTCGTGTGGAACGAGGATAGAAAGGACCTGAATAGCGACCGGCTGCCAGCCAAGCATGAGGCCATCATGGAGCGGTCTATCCGGAAGGGCGGCAGACGGGACGTGTTCCTGGGCACCAGAGAATGCCTGGGCCTGCTGGACGACATCAGCCAGGAAGAATACGAAACCACAGTGAGCTATTACAATGGGGTGAACATCGACCTGGGCATCATGTTCCACAGCTTCGCTTACCCCAAGGACAAGAAAACCCCCCTGAAGTCCTACTTCACAAAGACCGTGATGAAGAACGGCGTGATCACCTTCAAGGCCCAGTCCGAATGCGATATTGTGAACACCCTGAGCTCCTACGCCTTCAAGGCCCCCGAGGAGATCAAGAGCGTGAACGACGAGTGCATGGAGTACGACGCCATGGAGAAGGGCGAAAACCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 48)
SACAS6 (I-D):
ATGCCCAAGAAGAAGCGGAAGGTGATGCCCAACGATCCCTACAGCCTGTACTCCATCGTGATCGAACTGGGCGCCGCCGAAAAGGGATTCCCCACAGGCATCCTGGGCAGAAGCCTGCATAGCCAGGTGCTGCAGTGGTTCAAGCAGGATAACCCCTTCCTGGCCACCGAGCTGCACCAGAGCCAGATCTCCCCCTTCTCCATCTCTCCACTGATGGGCAAGCGGCACGCCAAGCTGACCAAGGCCGGCGACCGGCTGTTCTTTCGGATCTGCCTGCTGAGAGGAGATCTGCTGCAGCCCCTGCTGAACGGCATTGAGCAGACCGTGAACCAGAGCGTGTGCCTGGACAAGTTCCGGTTCCGGCTGTGCCAGACCCACATCCTGCCCGGCAGCCACCCTCTGGCTGGCGCCTCCCACTATAGCCTGATCAGCCAGACCCCAGTGAGCTCCAAGATTACCCTGGACTTCAAGAGTTCTACCTCCTTCAAGGTGGACCGGAAGATCATCCAAGTGTTCCCTCTGGGCGAACACGTGTTCAACAGCCTGCTCAGACGCTGGAATAACTTCGCCCCCGAGGACCTGCACTTCTCTCAGGTGGACTGGAGCATCCCCATCGCCGCATTCGACGTGAAAACCATCCCCATCCACCTGAAGAAGGTCGAGATCGGCGCACAGGGCTGGGTGACCTACATCTTCCCCAACACAGAACAGGCCAAGATCGCCTCCGTGCTGAGCGAATTCGCCTTCTTCAGCGGAGTGGGACGGAAAACCACCATGGGCATGGGCCAGGTGCAGGTGCGGTCCCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 49)
ECCAS6E (I-E):
ATGCCTAAGAAGAAGCGGAAGGTGTACCTGAGCAAGGTGATCATCGCCAGAGCCTGGAGCAGAGACCTGTACCAGCTGCACCAGGGCCTGTGGCACCTGTTCCCCAACCGGCCCGACGCCGCCCGGGATTTCCTGTTCCACGTGGAGAAGAGAAACACCCCGGAAGGCTGCCACGTGCTGCTGCAGAGCGCACAGATGCCTGTGAGCACCGCCGTGGCCACCGTGATCAAGACCAAGCAGGTGGAGTTCCAGCTGCAGGTGGGCGTGCCCCTGTATTTCAGGCTGCGGGCGAATCCCATCAAGACCATCCTGGACAACCAGAAGCGGCTGGACAGCAAGGGCAACATCAAGAGGTGCAGAGTGCCTCTGATCAAGGAGGCCGAACAGATCGCCTGGCTGCAGCGGAAGCTGGGCAATGCCGCCAGAGTGGAGGACGTGCACCCCATCAGCGAGCGGCCCCAGTACTTCTCCGGCGACGGAAAGAGCGGAAAGATCCAGACCGTGTGCTTCGAGGGCGTGCTGACCATCAACGACGCACCCGCCCTGATCGACCTCGTGCAGCAGGGGATCGGCCCTGCCAAGTCCATGGGCTGCGGACTGCTGTCCCTGGCCCCCCTGCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 50)
PACAS6F (I-F):
ATGCCTAAGAAGAAGAGAAAGGTGGACCACTACCTGGACATTAGACTGCGCCCTGACCCAGAGTTCCCTCCTGCCCAGCTGATGTCTGTGCTGTTTGGCAAGCTGCACCAGGCCCTGGTGGCCCAGGGCGGTGACAGAATCGGAGTGTCTTTCCCTGATCTGGACGAATCTAGATCTAGACTGGGAGAGAGACTGAGAATCCACGCGTCTGCCGACGACCTGAGAGCTCTGCTGGCCAGACCATGGCTGGAAGGACTGCGCGACCACCTGCAGTTCGGTGAACCTGCCGTGGTGCCTCACCCAACTCCATACAGACAGGTGAGTAGAGTGCAGGCAAAGTCTAATCCAGAGAGACTGAGACGCAGACTGATGAGAAGGCATGACCTGTCCGAAGAAGAAGCCAGAAAGAGAATCCCAGACACAGTGGCCAGAGCCCTGGATCTGCCTTTTGTGACCCTGAGAAGCCAGTCTACCGGCCAGCACTTCAGACTGTTTATTCGCCACGGACCACTGCAGGTGACCGCCGAAGAGGGAGGTTTTACCTGCTACGGACTGAGCAAGGGAGGTTTCGTGCCTTGGTTCCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 51)
MTCAS6 (III-A):
ATGCCCAAGAAGAAGCGGAAGGTGATGGCCGCCAGAAGAGGCGGAATCCGGAGAACCGACCTGCTGCGGAGGTCTGGCCAGCCTCGGGGCAGACACCGGGCCTCCGCCGCCGAGAGCGGCCTGACATGGATCTCCCCTACCCTGATCCTGGTGGGCTTCAGCCACAGGGGCGATAGGAGAATGACCGAGCACCTGTCCAGACTGACCCTGACCCTGGAAGTGGATGCCCCCCTGGAGAGAGCCCGGGTGGCCACCCTGGGCCCCCACCTGCATGGCGTGCTGATGGAGTCTATCCCCGCCGACTACGTGCAGACACTGCACACAGTGCCGGTGAACCCTTACAGCCAGTACGCTCTGGCCCGGAGCACCACCAGCCTGGAGTGGAAGATCTCCACCCTGACAAATGAGGCCCGGCAGCAGATCGTCGGCCCCATCAACGACGCCGCCTTCGCCGGCTTCCGGCTGCGGGCCAGCGGCATCGCCACCCAGGTGACAAGCAGAAGCCTGGAGCAGAACCCCCTGTCCCAGTTTGCCAGAATCTTCTACGCCAGGCCCGAAACCCGCAAGTTCAGAGTGGAGTTCCTGACCCCCACCGCCTTCAAGCAGAGCGGCGAGTACGTGTTTTGGCCCGATCCCAGACTGGTGTTCCAGTCCCTGGCCCAGAAGTACGGCGCCATCGTGGACGGAGAAGAGCCCGACCCCGGCCTGATCGCCGAGTTTGGCCAGTCCGTGAGACTGAGCGCCTTCAGAGTGGCCAGCGCCCCTTTTGCCGTGGGCGCCGCCAGGGTGCCCGGATTCACCGGCAGCGCCACCTTCACCGTGCGGGGAGTGGACACCTTCGCCAGCTACATCGCCGCTCTGCTGTGGTTCGGCGAGTTCAGCGGATGCGGCATCAAGGCCTCCATGGGAATGGGCGCCATCCGGGTGCAGCCTCTGGCCCCCCGGGAGAAGTGCGTGCCCAAGCCCCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 52)
PFCAS6 (III-B):
ATGCCCAAGAAGAAGCGGAAGGTGATGAGATTCCTGATCAGACTGGTGCCCGAGGACAAGGACAGAGCCTTCAAGGTGCCTTACAACCACCAGTACTATCTGCAGGGCCTGATCTACAACGCCATCAAGTCCTCCAACCCCAAGCTGGCCACCTACCTGCACGAGGTGAAGGGCCCCAAGCTGTTCACCTACAGCCTGTTCATGGCCGAAAAGCGGGAGCACCCTAAGGGCCTGCCCTACTTTCTGGGCTACAAGAAGGGCTTCTTCTACTTCAGCACCTGCGTGCCCGAGATCGCCGAGGCCCTGGTGAACGGCCTGCTGATGAATCCCGAGGTGCGGCTGTGGGACGAGAGATTCTACCTGCACGAAATCAAGGTCCTGCGGGAGCCCAAGAAGTTCAACGGCAGCACCTTCGTGACCCTGAGCCCCATCGCCGTGACCGTGGTGAGAAAGGGCAAGTCCTACGACGTGCCCCCCATGGAAAAGGAGTTCTACAGCATTATCAAGGATGACCTGCAGGACAAGTACGTGATGGCCTACGGCGACAAGCCCCCCAGTGAGTTCGAGATGGAAGTGCTGATCGCCAAGCCCAAGCGGTTCCGGATCAAGCCCGGCATCTATCAGACCGCCTGGCACCTGGTGTTTCGGGCCTACGGCAATGACGACCTGCTGAAGGTGGGCTACGAAGTGGGATTCGGGGAGAAGAACTCCCTGGGATTCGGAATGGTCAAGGTGGAGGGCAACAAGACCACCAAGGAAGCCGAAGAACAGGAGAAGATCACCTTCAACTCCCGGGAAGAGCTGAAAACAGGCGTGCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 53)
PACSF5 (IV-A1):
ATGCCTAAGAAGAAGCGGAAGGTGTTCGTGACCCAGGTGATCTTCAACATCGGCGAACGGACGTACCCCGACAGGGCTCGGGCTATGGTGGCCGAGCTGATGGATGGCGTCCAGCCTGGCCTGGTGGCCACCCTGATGAACTACATCCCCGGCACCAGCACGAGCCGGACAGAGTTCCCCACCGTGCAGTTCGGCGGCGCCAGCGACGGCTTTTGCCTGCTGGGCTTCGGCGACGGCGGCGGCGCCATCGTGAGAGATGCCGTGCCCCTGATCCACGCCGCCCTGGCAAGGCGGATGCCTGATCGGATCATCCAGGTGGAACACAAGGAGCACAGCCTGTCCGCCGAGGCCCGGCCCTACGTGCTGAGCTACACCGTGCCTCGGATGGTGGTGCAGAAGAAGCAGCGGCACGCCGAGAGACTGCTGCACGAAGCCGAGGGAAAGGCTCACCTGGAGGGCCTGTTCCTGCGGAGCCTGCAGAGGCAGGCCGCCGCCGTGGGCCTGCCCCTGCCCGAGAACCTGGAGGTGGAGTTCAAGGGAGCCGTGGGCGACTTCGCCGCAAAGCACAATCCAAATAGCAAGGTGGCCTACCGGGGACTGAGAGGCGCCGTGTTCGATGTGAACGCCAGACTGGGCGGCATCTGGACCGCCGGATTCATGCTGAGCAAGGGCTACGGCCAGTTTAACGCCACCCACCAGCTGAGCGGCGCCGTGAACGCTCTGTCCGAACCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA(서열 54)
MTCSF5 (IV-A2):
ATGCCCAAGAAGAAGAGAAAGGTGCACCAGACCCTGATCCGGATCAACTGGCCCAAGGGATTCAAGTGCCCCCCTGCCGAGTTCCGGGAAAAGCTGGCCAAGAGCGAGATGTTCCCCCCCGAGTTCTTCCACTACGGCACGGAACTGGCCGTGTGGGACAAGCAGACCGCCGAGGTGGAGGGCAAGATCAAGACCGTGTCCAAGGAGAAGATCATCAAGACCTTTGACAAGCCCATCCCCCTGAATGGCCGGGCCCCGGTCAGAGTGATCGGCGGCCAGGCCTGGGCCGGCGTGATCGCCGACCCCGAGATGGAGGGCATGCTGATCCCACACCTGGGGAGCATCCTGAAGGTGGCCAGCAGCGCGGCCGGATGCGCAGTGAAGATCGAACTGGAACAGAGAAAGTTCGGCATCAGCTACACCGAGTACCCCGTGAAGTACAACCTGCGGGAGCTGGTGCTGAAGAGAAGATGCGAGGACGCCCGGTCTACCGATATCGAGAGCCTGATTGCCGATAGAATCTGGGGCGGCGTGTCCGGCGAGAGCTACTATGGCATCGACGGCACATGCGCCAAGTTTGGCTTCGAACCCCCCAGCAGAGAGCAGCTGGAGCTGCGGATCTTCCCCATGAAGAACATCGGACTGCACATGAAGTCCAGCGACGGACTGTCCAAGGAGTACATGAGCCTGATTGACGCCGAGGTGTGGATGAACGCTAAGCTGGAAGGAGTGTGGCAGGTGGGCAACCTGATCAGCAGGGGCTACGGCCGGTTCATCAAGTCTATCGGCGCCCAGTCCCCCAAGAAGAAGCGGAAGGTGGGTGGAGGCGGAGGTTCTGGGGGAGGAGGTAGTGGCGGTGGTGGTTCAGGAGGCGGCGGAAGCCAGCTGCATTTACCGCAGGTTTTAGCTGACGCTGTCTCACGCCTGGTCATAGGTAAGTTTGGTGACCTGACCGACAACTTCTCCTCCCCTCACGCTCGCAGAATAGGTCTGGCTGGAGTCGTCATGACAACAGGCACAGATGTTAAAGATGCCAAGGTGATATGTGTTTCTACAGGAGCAAAATGTATTAATGGTGAATACCTAAGTGATCGTGGCCTTGCATTAAATGACTGCCATGCAGAAATAGTATCTCGGAGATCCTTGCTCAGATTTCTTTATACACAACTTGAGCTTTACTTAAATAACGAGGATGATCAAAAAAGATCCATCTTTCAGAAATCAGAGCGAGGGGGGTTTAGGCTGAAGGAGAATATACAGTTTCATCTGTACATCAGCACCTCTCCCTGTGGAGATGCCAGAATCTTCTCACCACATGAGGCAATCCTGGAAGAACCAGCAGATAGACACCCAAATCGTAAAGCAAGAGGACAGCTACGGACCAAAATAGAGGCTGGTCAGGGGACGATTCCAGTGCGCAACAATGCGAGCATCCAAACGTGGGACGGGGTGCTGCAAGGGGAGCGGCTGCTCACCATGTCCTGCAGTGACAAGATTGCACGCTGGAACGTGGTGGGCATCCAGGGATCACTGCTCAGCATTTTCGTGGAGCCCATTTACTTCTCGAGCATCATCCTGGGCAGCCTTTACCACGGGGACCACCTTTCCAGGGCCATGTACCAGCGGATCTCCAACATAGAGGACCTGCCACCTCTCTACACCCTCAACAAGCCTTTGCTCACAGGCATCAGCAATGCAGAAGCACGGCAGCCAGGGAAGGCCCCCATATTCAGTGTCAACTGGACGGTAGGCGACTCCGCTATTGAGGTCATCAACGCCACGACTGGGAAGGGAGAGCTGGGCCGCGCGTCCCGCCTGTGTAAGCACGCGTTGTACTGTCGCTGGATGCGTGTGCACGGCAAGGTTCCCTCCCACTTACTACGCTCCAAGATTACCAAGCCCAACGTGTACCATGAGACAAAGCTGGCGGCAAAGGAGTACCAGGCCGCCAAGGCGCGTCTGTTCACAGCCTTCATCAAGGCGGGGCTGGGGGCCTGGGTGGAGAAGCCCACCGAGCAGGACCAGTTCTCACTCACGTAA (서열 55)
일부 실시 형태에 있어서, 상기 이종 기능적 도메인을 상기 융합 단백질의 N-말단, C-말단 또는 내부에서 융합시킨다.
일부 실시 형태에 있어서, CasPR 융합물의 기능적 변이체는 단백질을 포함하고, 상기 단백질은, (1) 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 아미노산 치환, 추가 또는 결실을 제외한 서열 1-11 중의 어느 하나의 아미노산 서열(여기서 상기 단백질은 서열 1-11 중의 하나와 1류 I, III 또는 IV형 CRISPR시스템의 직접 반복 서열(예를 들어, 서열 12-33 중의 어느 하나)과 결합하는 능력을 유지함); 또는 (2) 서열 1-11 중의 어느 하나와 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 갖는 아미노산 서열(여기서 상기 단백질은 서열 1-11의 CasPR 중의 하나가 1류 I, III 또는 IV형 CRISPR시스템의 직접 반복 서열(예를 들어, 서열 12-33 중의 어느 하나)과 결합하는 능력을 유지함);을 갖고, 선택적으로, 조건은 상기 단백질은 서열 1-11 중의 어느 하나가 아닌 것이다. 모든서열을 참조로서 본 명세서에 포함된다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 표적 RNA와 혼성화할 수 있는 가이드 서열을 포함하는 CasPR 가이드 RNA 및 상기 가이드 서열 3’(또는 5’)의 직접 반복(DR) 서열을 더 코딩한다. 일부 실시 형태에 있어서, 상기 DR 서열은 서열 12-33 중의 어느 하나의 2차 구조와 거의 동일한 2차 구조를 가진다. 일부 실시 형태에 있어서, 상기 DR 서열은 서열 12-33 중의 어느 하나 또는 동종 야생형 CasPR에 결합하는 그 기능 부분에 의해 코딩된다. 일부 실시 형태에 있어서, 상기 표적 RNA는 진핵 DNA에 의해 코딩된다. 일부 실시 형태에 있어서, 상기 진핵 DNA는 비인간 포유동물 DNA, 비인간 영장류 동물 DNA, 인간 DNA, 식물 DNA, 곤충 DNA, 조류 DNA, 파충류 DNA, 설치류 DNA, 어류 DNA, 연충/선충 DNA, 효모 DNA이다. 일부 실시 형태에 있어서, 상기 표적 RNA는 mRNA이다.
일부 실시 형태에 있어서, 상기 CasPR가이드 서열은 15-120개의 뉴클레오티드 사이, 20-100개의 뉴클레오티드 사이, 25-80개의 뉴클레오티드 사이, 15-55개의 뉴클레오티드 사이, 25-35개의 뉴클레오티드 사이 또는 약 30개의 뉴클레오티드에 존재한다.
일부 실시 형태에 있어서, 상기 CasPR가이드 서열은 상기 표적 RNA와 90%-100% 상보적이다. 일부 실시 형태에 있어서, 상기 CasPR가이드 RNA는 CasPR이 이전 crRNA전사체를 가공하여 생성되고, 여기서 상기 전구체crRNA는 2개 이상의 가이드 RNA를 포함하며, 상기 2개 이상의 가이드 RNA는 상이한 표적 RNA에 대해 상이한 가이드 서열을 갖는다.
일부 실시 형태에 있어서, 상기 CasPR 융합물의 변이체 또는 유도체는 서열 1-11 중의 어느 하나의 하나 또는 복수의 잔기의 보존된 아미노산 치환을 포함하고, 선택적으로, 상기 CasPR 융합물의 변이체 또는 유도체는 보존된 아미노산 치환만 포함한다. 일부 실시 형태에 있어서, 상기 CasPR 융합물의 유도체는 상기 표적 RNA에 혼성화되는 CasPR가이드 서열과 결합할 수 있으나, 상기 CasPR의 RNA효소 촉매 부위의 돌연변이로 인해 리보뉴클레아제 촉매 활성을 가지지 않는다. 일부 실시 형태에 있어서, 상기 CasPR 융합물의 유도체는 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개 또는 50개의 잔기를 초과하지 않는 N 말단 결실 및/또는 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개 또는 50개의 잔기를 초과하지 않는 C 말단 결실을 갖는다.
일부 실시 형태에 있어서, 상기 CasPR은 Cas5d, Cas6 또는 Csf5, 예컨대 MtCas6(I-A), MmCas6(I-B), SpCas5d(I-C1), BhCas5d(I-C2), SaCas6(I-D), EcCas6e(I-E), PaCas6f(I-F), MtCas6(III-A), PfCas6(III-B), PaCsf5(IV-A1) 또는 MtCsf5(IV-A2)이다.
일부 실시 형태에 있어서, 상기 CasPR 융합물의 이종 기능적 도메인은 RNA염기 편집 도메인을 포함한다. 일부 실시 형태에 있어서, 상기 RNA염기 편집 도메인은 아데노신 디아미나제 및/또는 시티딘 탈아미노효소, 예컨대 RNA에 작용하는 시티딘 탈아미노효소(CDAR), 예컨대 이중 가닥 RNA특이적 아데노신 디아미나제(ADAR)(예를 들어, ADAR1 또는 ADAR2), 아포지질단백질 B mRNA 편집효소, 촉매 폴리펩티드 유사체(APOBEC, 예컨대 APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D, APOBEC3E, APOBEC3F, APOBEC3G, APOBEC3H 및 APOBEC4), 활성화 유도 시티딘 탈아미노효소(AID), 시티딘 탈아미노효소1(CDA1) 또는 그 돌연변이체를 포함한다. 일부 실시 형태에 있어서, ADAR은 E488Q/T375G 이중 돌연변이를 포함하거나 또는 ADAR2DD를 포함한다. 일부 실시 형태에 있어서, 상기 염기 편집 도메인을 MS2와 같은 RNA결합 도메인과 더 융합시킨다.
일부 실시 형태에 있어서, 상기 CasPR 융합물의 유도체는 RNA 메틸트랜스퍼라제, RNA 디메틸라아제, RNA스플라이싱 개질제, 위치화 인자 또는 번역 변형 인자를 더 포함한다.
일부 실시 형태에 있어서, 상기 CasPR, 상동체, 동원체, 이원체, 변이체, 유도체 또는 기능적 단편은 핵 위치화 신호(NLS) 서열 또는 핵배출 신호(NES)를 포함한다.
일부 실시 형태에 있어서, 상기 표적 RNA의 타겟팅은 상기 표적 RNA의 변형으로 이어진다. 일부 실시 형태에 있어서, 상기 표적 RNA 변형은 상기 표적 RNA 절단이다. 일부 실시 형태에 있어서, 상기 표적 RNA 변형은 아데노신(A)의 이노신(I)으로의 탈아미노화 및/또는 시티딘(C)의 우라실(U)로의 탈아미노화이다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 코돈 최적화된 폴리뉴클레오티드를 코딩하고, 상기 폴리뉴클레오티드는 야생형 CasPR(예를 들어, Cas5d, Cas6 또는 Csf5), 그 상동체, 그 동원체, 그 이원체, 그 변이체 또는 유도체 또는 그 기능적 단편을 코딩하며, 여기서 상기 폴리뉴클레오티드는 포유동물 (예를 들어, 인간)의 발현에 대해 코돈 최적화하고, 선택적으로, 상기 야생형 CasPR은 서열 1-11 중 어느 하나의 아미노산 서열을 갖는다. 일부 실시 형태에 있어서, 상기 코돈 최적화된 폴리뉴클레오티드는 서열 34-44 중 어느 하나의 아미노산 서열을 갖는다. 일부 실시 형태에 있어서, 상기 코돈 최적화된 폴리뉴클레오티드는 이종 기능적 도메인을 코딩하는 서열을 더 포함한다. 일부 실시 형태에 있어서, 이종 기능적 도메인은 RNA염기 편집기를 포함한다.
MtCas6(I-A):
ATGCCTCTGATCTTCAAGATCGGCTATAACGTGATCCCCCTGCAGGACGTGATCCTGCCCACCCCTTCCAGCAAGGTGCTGAAGTACCTGATCCAGAGCGGCAAGCTGATCCCCAGCCTGAAGGACCTGATCACCAGCCGGGACAAGTACAAGCCAATCTTCATCTCCCACCTGGGCTTCAACCAGCGGAGGATTTTCCAGACCAACGGCAATCTGAAAACCATCACCAAGGGCAGTAGACTGAGCTCCATCATCGCCTTCAGCACCCAGGCCAACGTGCTGTCCGAGGTGGCCGATGAAGGGATCTTCGAAACCGTGTACGGAAAGTTCCACATCATGATCGAAAGCATCGAGATCGTGGAGGTGGAAAAGCTGAAGGAGGAGGTGGAGAAGCACATGAACGACAACATCAGAGTGAGATTCGTGTCTCCCACACTGCTGAGCTCCAAGGTGCTGCTGCCCCCCAGCCTGTCCGAAAGATACAAGAAGATCCACGCCGGGTACAGCACCCTGCCCAGCGTGGGCCTGATCGTGGCCTACGCCTACAACGTGTACTGCAATCTGATCGGCAAGAAGGAAGTGGAAGTGCGGGCCTTCAAGTTTGGAATCCTGAGCAACGCCCTGTCCAGAATCATCGGCTACGACCTGCACCCTGTGACCGTGGCCATCGGCGAGGACAGCAAGGGGAATCTGAGAAAGGCTCGGGGCGTGATGGGCTGGATCGAGTTCGACATCCCCGACGAAAGACTGAAGCGGCGGGCCCTGAACTATCTGCTGACCAGCAGCTACCTGGGCATCGGGAGATCTCGGGGCATCGGCTTCGGCGAGATCCGGCTGGAGTTCCGGAAGATTGAAGAGAAGGAGGGA (서열 34)
MmCas6 (I-B):
ATGGACCTGGAGTACATGCACATCTCCTACCCTAACATCCTGCTGAACATGCGGGACGGCAGCAAGCTGCGGGGCTACTTCGCCAAGAAGTACATCGACGAAGAGATTGTGCACAACCACAGAGACAACGCCTTTGTGTACAAGTACCCCCAGATCCAGTTTAAGATCATCGATAGAAGCCCCCTGATCATCGGCATTGGCTCTCTGGGCATCAATTTCCTGGAGAGCAAGCGGATCTTCTTCGAGAAGGAACTGATTATCAGCAACGACACCAACGACATCACCGAGGTGAACGTGCACAAGGACATGGATCACTTCGGCACGACCGACAAGATCCTGAAGTACCAGTTCAAGACCCCTTGGATGGCACTGAACGCCAAGAATAGCGAGATCTACAAGAACTCTGACGAGATCGACCGGGAGGAGTTCCTGAAGAGAGTGCTGATTGGGAATATCCTGAGCATGTCTAAGAGCCTGGGCTATACCATCGAAGAAAAGCTGAAGGTGAAGATTAACCTGAAGGAAGTGCCCGTGAAGTTCAAGAACCAGAACATGGTGGGCTTTCGGGGCGAGTTCTACATCAACTTCGACATCCCTCAGTATCTGGGCATCGGCCGGAATGTGTCCCGGGGATTCGGCACAGTGGTGAAGGTG (서열 35)
SpCas5d (I-C1):
ATGAGAAATGAAGTGCAGTTCGAGCTGTTCGGCGACTACGCCCTGTTCACCGACCCCCTGACCAAGATCGGCGGCGAAAAGCTGAGCTACAGCGTGCCTACCTACCAGGCCCTGAAGGGCATCGCCGAGAGCATCTACTGGAAGCCCACCATCGTGTTCGTGATCGACGAACTGCGGGTCATGAAGCCCATTCAGATGGAGTCTAAGGGCGTGAGGCCCATCGAGTACGGCGGCGGCAACACCCTGGCCCACTACACCTACCTGAAGGATGTGCACTACCAGGTGAAGGCCCACTTCGAGTTCAACCTGCACCGGCCCGACCTGGCCTTCGATAGAAACGAGGGCAAGCACTACTCCATCCTGCAGAGAAGCCTGAAGGCCGGCGGCAGAAGAGATATTTTCCTGGGCGCCCGGGAGTGCCAGGGCTACGTGGCCCCCTGCGAGTTCGGCAGCGGCGACGGCTTCTACGACGGCCAGGGCAAGTACCACCTGGGAACCATGGTGCACGGTTTCAACTACCCCGACGAAACCGGACAGCACCAGCTGGATGTGAGACTGTGGTCTGCCGTCATGGAAAACGGCTACATCCAGTTCCCCCGCCCTGAGGACTGCCCCATCGTGCGGCCTGTGAAGGAGATGGAACCCAAGATCTTCAACCCCGACAACGTGCAGTCCGCCGAACAGCTGCTGCACGACCTGGGCGGCGAA (서열 36)
BhCas5d (I-C2):
ATGTACAGAAGCCGGGACTTCTACGTGAGAGTGTCCGGCCAGCGGGCCCTGTTCACCAACCCCGCCACCAAGGGCGGCTCCGAACGGAGCTCCTACTCCGTGCCTACCCGGCAGGCCCTGAACGGGATTGTGGACGCCATCTACTACAAGCCCACGTTCACCAACATCGTGACCGAGGTGAAGGTGATTAACCAGATCCAGACCGAACTGCAGGGCGTGCGGGCCCTGCTGCATGACTACAGCGCCGACCTGAGCTACGTGTCCTACCTGAGCGACGTGGTGTACCTGATTAAGTTTCATTTCGTGTGGAACGAGGATAGAAAGGACCTGAATAGCGACCGGCTGCCAGCCAAGCATGAGGCCATCATGGAGCGGTCTATCCGGAAGGGCGGCAGACGGGACGTGTTCCTGGGCACCAGAGAATGCCTGGGCCTGCTGGACGACATCAGCCAGGAAGAATACGAAACCACAGTGAGCTATTACAATGGGGTGAACATCGACCTGGGCATCATGTTCCACAGCTTCGCTTACCCCAAGGACAAGAAAACCCCCCTGAAGTCCTACTTCACAAAGACCGTGATGAAGAACGGCGTGATCACCTTCAAGGCCCAGTCCGAATGCGATATTGTGAACACCCTGAGCTCCTACGCCTTCAAGGCCCCCGAGGAGATCAAGAGCGTGAACGACGAGTGCATGGAGTACGACGCCATGGAGAAGGGCGAAAAC (서열 37)
SaCas6 (I-D):
ATGCCCAACGATCCCTACAGCCTGTACTCCATCGTGATCGAACTGGGCGCCGCCGAAAAGGGATTCCCCACAGGCATCCTGGGCAGAAGCCTGCATAGCCAGGTGCTGCAGTGGTTCAAGCAGGATAACCCCTTCCTGGCCACCGAGCTGCACCAGAGCCAGATCTCCCCCTTCTCCATCTCTCCACTGATGGGCAAGCGGCACGCCAAGCTGACCAAGGCCGGCGACCGGCTGTTCTTTCGGATCTGCCTGCTGAGAGGAGATCTGCTGCAGCCCCTGCTGAACGGCATTGAGCAGACCGTGAACCAGAGCGTGTGCCTGGACAAGTTCCGGTTCCGGCTGTGCCAGACCCACATCCTGCCCGGCAGCCACCCTCTGGCTGGCGCCTCCCACTATAGCCTGATCAGCCAGACCCCAGTGAGCTCCAAGATTACCCTGGACTTCAAGAGTTCTACCTCCTTCAAGGTGGACCGGAAGATCATCCAAGTGTTCCCTCTGGGCGAACACGTGTTCAACAGCCTGCTCAGACGCTGGAATAACTTCGCCCCCGAGGACCTGCACTTCTCTCAGGTGGACTGGAGCATCCCCATCGCCGCATTCGACGTGAAAACCATCCCCATCCACCTGAAGAAGGTCGAGATCGGCGCACAGGGCTGGGTGACCTACATCTTCCCCAACACAGAACAGGCCAAGATCGCCTCCGTGCTGAGCGAATTCGCCTTCTTCAGCGGAGTGGGACGGAAAACCACCATGGGCATGGGCCAGGTGCAGGTGCGGTCC (서열 38)
EcCas6e (I-E):
ATGTACCTGAGCAAGGTGATCATCGCCAGAGCCTGGAGCAGAGACCTGTACCAGCTGCACCAGGGCCTGTGGCACCTGTTCCCCAACCGGCCCGACGCCGCCCGGGATTTCCTGTTCCACGTGGAGAAGAGAAACACCCCGGAAGGCTGCCACGTGCTGCTGCAGAGCGCACAGATGCCTGTGAGCACCGCCGTGGCCACCGTGATCAAGACCAAGCAGGTGGAGTTCCAGCTGCAGGTGGGCGTGCCCCTGTATTTCAGGCTGCGGGCGAATCCCATCAAGACCATCCTGGACAACCAGAAGCGGCTGGACAGCAAGGGCAACATCAAGAGGTGCAGAGTGCCTCTGATCAAGGAGGCCGAACAGATCGCCTGGCTGCAGCGGAAGCTGGGCAATGCCGCCAGAGTGGAGGACGTGCACCCCATCAGCGAGCGGCCCCAGTACTTCTCCGGCGACGGAAAGAGCGGAAAGATCCAGACCGTGTGCTTCGAGGGCGTGCTGACCATCAACGACGCACCCGCCCTGATCGACCTCGTGCAGCAGGGGATCGGCCCTGCCAAGTCCATGGGCTGCGGACTGCTGTCCCTGGCCCCCCTG (서열 39)
PaCas6f (I-F):
ATGGACCACTACCTGGACATTAGACTGCGCCCTGACCCAGAGTTCCCTCCTGCCCAGCTGATGTCTGTGCTGTTTGGCAAGCTGCACCAGGCCCTGGTGGCCCAGGGCGGTGACAGAATCGGAGTGTCTTTCCCTGATCTGGACGAATCTAGATCTAGACTGGGAGAGAGACTGAGAATCCACGCGTCTGCCGACGACCTGAGAGCTCTGCTGGCCAGACCATGGCTGGAAGGACTGCGCGACCACCTGCAGTTCGGTGAACCTGCCGTGGTGCCTCACCCAACTCCATACAGACAGGTGAGTAGAGTGCAGGCAAAGTCTAATCCAGAGAGACTGAGACGCAGACTGATGAGAAGGCATGACCTGTCCGAAGAAGAAGCCAGAAAGAGAATCCCAGACACAGTGGCCAGAGCCCTGGATCTGCCTTTTGTGACCCTGAGAAGCCAGTCTACCGGCCAGCACTTCAGACTGTTTATTCGCCACGGACCACTGCAGGTGACCGCCGAAGAGGGAGGTTTTACCTGCTACGGACTGAGCAAGGGAGGTTTCGTGCCTTGGTTC(서열 40)
MtCas6 (III-A):
ATGGCCGCCAGAAGAGGCGGAATCCGGAGAACCGACCTGCTGCGGAGGTCTGGCCAGCCTCGGGGCAGACACCGGGCCTCCGCCGCCGAGAGCGGCCTGACATGGATCTCCCCTACCCTGATCCTGGTGGGCTTCAGCCACAGGGGCGATAGGAGAATGACCGAGCACCTGTCCAGACTGACCCTGACCCTGGAAGTGGATGCCCCCCTGGAGAGAGCCCGGGTGGCCACCCTGGGCCCCCACCTGCATGGCGTGCTGATGGAGTCTATCCCCGCCGACTACGTGCAGACACTGCACACAGTGCCGGTGAACCCTTACAGCCAGTACGCTCTGGCCCGGAGCACCACCAGCCTGGAGTGGAAGATCTCCACCCTGACAAATGAGGCCCGGCAGCAGATCGTCGGCCCCATCAACGACGCCGCCTTCGCCGGCTTCCGGCTGCGGGCCAGCGGCATCGCCACCCAGGTGACAAGCAGAAGCCTGGAGCAGAACCCCCTGTCCCAGTTTGCCAGAATCTTCTACGCCAGGCCCGAAACCCGCAAGTTCAGAGTGGAGTTCCTGACCCCCACCGCCTTCAAGCAGAGCGGCGAGTACGTGTTTTGGCCCGATCCCAGACTGGTGTTCCAGTCCCTGGCCCAGAAGTACGGCGCCATCGTGGACGGAGAAGAGCCCGACCCCGGCCTGATCGCCGAGTTTGGCCAGTCCGTGAGACTGAGCGCCTTCAGAGTGGCCAGCGCCCCTTTTGCCGTGGGCGCCGCCAGGGTGCCCGGATTCACCGGCAGCGCCACCTTCACCGTGCGGGGAGTGGACACCTTCGCCAGCTACATCGCCGCTCTGCTGTGGTTCGGCGAGTTCAGCGGATGCGGCATCAAGGCCTCCATGGGAATGGGCGCCATCCGGGTGCAGCCTCTGGCCCCCCGGGAGAAGTGCGTGCCCAAGCCC (서열 41)
PfCas6 (III-B):
ATGAGATTCCTGATCAGACTGGTGCCCGAGGACAAGGACAGAGCCTTCAAGGTGCCTTACAACCACCAGTACTATCTGCAGGGCCTGATCTACAACGCCATCAAGTCCTCCAACCCCAAGCTGGCCACCTACCTGCACGAGGTGAAGGGCCCCAAGCTGTTCACCTACAGCCTGTTCATGGCCGAAAAGCGGGAGCACCCTAAGGGCCTGCCCTACTTTCTGGGCTACAAGAAGGGCTTCTTCTACTTCAGCACCTGCGTGCCCGAGATCGCCGAGGCCCTGGTGAACGGCCTGCTGATGAATCCCGAGGTGCGGCTGTGGGACGAGAGATTCTACCTGCACGAAATCAAGGTCCTGCGGGAGCCCAAGAAGTTCAACGGCAGCACCTTCGTGACCCTGAGCCCCATCGCCGTGACCGTGGTGAGAAAGGGCAAGTCCTACGACGTGCCCCCCATGGAAAAGGAGTTCTACAGCATTATCAAGGATGACCTGCAGGACAAGTACGTGATGGCCTACGGCGACAAGCCCCCCAGTGAGTTCGAGATGGAAGTGCTGATCGCCAAGCCCAAGCGGTTCCGGATCAAGCCCGGCATCTATCAGACCGCCTGGCACCTGGTGTTTCGGGCCTACGGCAATGACGACCTGCTGAAGGTGGGCTACGAAGTGGGATTCGGGGAGAAGAACTCCCTGGGATTCGGAATGGTCAAGGTGGAGGGCAACAAGACCACCAAGGAAGCCGAAGAACAGGAGAAGATCACCTTCAACTCCCGGGAAGAGCTGAAAACAGGCGTG (서열 42)
PaCsf5 (IV-A1):
ATGTTCGTGACCCAGGTGATCTTCAACATCGGCGAACGGACGTACCCCGACAGGGCTCGGGCTATGGTGGCCGAGCTGATGGATGGCGTCCAGCCTGGCCTGGTGGCCACCCTGATGAACTACATCCCCGGCACCAGCACGAGCCGGACAGAGTTCCCCACCGTGCAGTTCGGCGGCGCCAGCGACGGCTTTTGCCTGCTGGGCTTCGGCGACGGCGGCGGCGCCATCGTGAGAGATGCCGTGCCCCTGATCCACGCCGCCCTGGCAAGGCGGATGCCTGATCGGATCATCCAGGTGGAACACAAGGAGCACAGCCTGTCCGCCGAGGCCCGGCCCTACGTGCTGAGCTACACCGTGCCTCGGATGGTGGTGCAGAAGAAGCAGCGGCACGCCGAGAGACTGCTGCACGAAGCCGAGGGAAAGGCTCACCTGGAGGGCCTGTTCCTGCGGAGCCTGCAGAGGCAGGCCGCCGCCGTGGGCCTGCCCCTGCCCGAGAACCTGGAGGTGGAGTTCAAGGGAGCCGTGGGCGACTTCGCCGCAAAGCACAATCCAAATAGCAAGGTGGCCTACCGGGGACTGAGAGGCGCCGTGTTCGATGTGAACGCCAGACTGGGCGGCATCTGGACCGCCGGATTCATGCTGAGCAAGGGCTACGGCCAGTTTAACGCCACCCACCAGCTGAGCGGCGCCGTGAACGCTCTGTCCGAA (서열 43)
MtCsf5 (IV-A2):
ATGCACCAGACCCTGATCCGGATCAACTGGCCCAAGGGATTCAAGTGCCCCCCTGCCGAGTTCCGGGAAAAGCTGGCCAAGAGCGAGATGTTCCCCCCCGAGTTCTTCCACTACGGCACGGAACTGGCCGTGTGGGACAAGCAGACCGCCGAGGTGGAGGGCAAGATCAAGACCGTGTCCAAGGAGAAGATCATCAAGACCTTTGACAAGCCCATCCCCCTGAATGGCCGGGCCCCGGTCAGAGTGATCGGCGGCCAGGCCTGGGCCGGCGTGATCGCCGACCCCGAGATGGAGGGCATGCTGATCCCACACCTGGGGAGCATCCTGAAGGTGGCCAGCAGCGCGGCCGGATGCGCAGTGAAGATCGAACTGGAACAGAGAAAGTTCGGCATCAGCTACACCGAGTACCCCGTGAAGTACAACCTGCGGGAGCTGGTGCTGAAGAGAAGATGCGAGGACGCCCGGTCTACCGATATCGAGAGCCTGATTGCCGATAGAATCTGGGGCGGCGTGTCCGGCGAGAGCTACTATGGCATCGACGGCACATGCGCCAAGTTTGGCTTCGAACCCCCCAGCAGAGAGCAGCTGGAGCTGCGGATCTTCCCCATGAAGAACATCGGACTGCACATGAAGTCCAGCGACGGACTGTCCAAGGAGTACATGAGCCTGATTGACGCCGAGGTGTGGATGAACGCTAAGCTGGAAGGAGTGTGGCAGGTGGGCAACCTGATCAGCAGGGGCTACGGCCGGTTCATCAAGTCTATCGGCGCCCAGTCC (서열 44)
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 비천연적으로 존재하는 폴리뉴클레오티드를 코딩하고, 상기 비천연적으로 존재하는 폴리뉴클레오티드는 서열 12-33 중의 어느 하나의 유도체를 포함하며, 여기서 상기 유도체는 (i) 서열 12-33 중의 어느 하나에 비해 하나 또는 복수의(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의) 뉴클레오티드 추가, 결실, 치환 및/또는 기타 돌연변이를 가지고, (ii) 서열 12-33 중의 어느 하나와 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 97%의 서열 동일성을 가지며, (iii) 엄격한 조건 하에서 서열 12-33 중의 어느 하나 또는 (i) 및 (ii) 중의 어느 하나와 혼성화하거나, 또는 (iv)는 (i) - (iii) 중의 어느 하나의 상보적 서열이고, 조건은 상기 유도체가 서열 12-33 중의 어느 하나가 아니며, 상기 유도체가 RNA을 코딩하고(또는 RNA), 상기 RNA가 서열 12-33에 의해 코딩되는 어느 RNA와 거의 동일한 2차 구조(예를 들어, 줄기, 고리, 돌기, 단일 가닥 영역)를 유지한다. 일부 실시 형태에 있어서, 상기 유도체를 본 발명의 CasPR, 그 동원체, 그 이원체, 그 변이체, 그 유도체 또는 그 기능적 단편 중의 어느 하나의 DR 서열로 한다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 조작된 클러스터화된 규칙적인 회문 반복서열(CRISPR)-Cas13 이펙터 효소의 코딩 서열을 포함하고, 여기서 상기 조작된 Cas13은 (1) 대응되는 야생형 Cas13 이펙터 효소의 엔도뉴클레아제 촉매 도메인 공간에 접근하는 영역에서 돌연변이를 포함하고, (2) 상기 가이드 서열과 상보적인 표적 RNA에 대한 야생형 Cas13의 가이드 서열 특이적 엔도뉴클레아제 절단 활성을 거의 보류하며, 또한 (3) 상기 가이드 서열과 결합하지 않는 비표적 RNA에 대한 야생형 Cas13의 가이드 서열 비의존적 부가적 엔도뉴클레아제 절단 활성이 거의 결핍하다.
일부 실시 형태에 있어서, Cas13은 Cas13a, Cas13b, Cas13c, Cas13d(CasRx 포함), Cas13e 또는 Cas13f이다.
일부 실시 형태에 있어서, 상기 Cas13e는 PCT/CN2020/119559 중 SEQ ID NO: 4의 아미노산 서열을 갖는다(참조로 본 명세서에 포함됨).
일부 실시 형태에 있어서, 상기 영역은 Cas13의 1차 서열에서 엔도뉴클레아제 촉매 도메인(예를 들어, RXXXXH 도메인)의 임의의 잔기로부터 120개, 110개, 100개, 90개 또는 80개의 아미노산 내의 잔기를 포함한다.
일부 실시 형태에 있어서, 상기 영역은 Cas13의 1차 서열에서 엔도뉴클레아제 촉매 도메인의 임의의 잔기로부터 100개, 110개, 120개 또는 130개의 잔기를 초과하는 잔기를 포함하나, 공간적으로 상기 엔도뉴클레아제 촉매 도메인의 잔기의 1-10옹스트롬 또는 5옹스트롬 내에 있다.
일부 실시 형태에 있어서, 상기 엔도뉴클레아제 촉매 도메인은 HEPN 도메인이고, 선택적으로 RXXXXH모티브의 HEPN 도메인을 포함한다. 일부 실시 형태에 있어서, 상기 RXXXXH 모티브는 R{N/H/K}X1X2X3H서열을 포함한다. 일부 실시 형태에 있어서, 상기 R{N/H/K}X1X2X3H 서열에서, X1은 R, S, D, E, Q, N, G 또는 Y이고; X2는 I, S, T, V 또는 L이며; 또한 X3은 L, F, N, Y, V, I, S, D, E 또는 A이다. 일부 실시 형태에 있어서, 상기 RXXXXH모티브는 N 말단 RXXXXH 모티브이고, 상기 N 말단 RXXXXH 모티브는 RNXXXH서열, 예컨대 RN{Y/F}{F/Y}SH 서열을 포함한다. 일부 실시 형태에 있어서, 상기 N 말단 RXXXXH모티브는 RNYFSH 서열을 갖는다. 일부 실시 형태에 있어서, 상기 N 말단 RXXXXH 모티브는 RNFYSH 서열을 갖는다. 일부 실시 형태에 있어서, 상기 RXXXXH 모티브는 R{N/A/R}{A/K/S/F}{A/L/F}{F/H/L}H서열의C 말단 RXXXXH 모티브를 포함한다. 일부 실시 형태에 있어서, 상기 C 말단 RXXXXH 모티브는 RN(A/K)ALH 서열을 갖는다. 일부 실시 형태에 있어서, 상기 C 말단 RXXXXH 모티브는 RAFFHH 또는 RRAFFH 서열을 갖는다.
일부 실시 형태에 있어서, 상기 영역은 PCT/CN2020/119559(참조로 통합)의 SEQ ID NO: 4의 잔기2-187, 227-242 또는 634-755 사이의 잔기에 대응되는 잔기를 포함하거나, 거의 이러한 잔기로 조성되거나 또는 이러한 잔기로 조성된다. 일부 실시 형태에 있어서, 상기 영역은 PCT/CN2020/119559(참조로서 포함됨)의 SEQ ID NO: 4의 잔기 35-51, 52-67, 156-171, 666-682 또는 712-727 사이의 잔기에 대응되는 잔기를 포함하거나, 거의 이러한 잔기로 조성되거나 또는 이러한 잔기로 조성된다.
일부 실시 형태에 있어서, 상기 돌연변이는 상기 영역 내의 한 세그먼트의 15-20개의 연속 아미노산 내의 하나 또는 복수의 전하를 띄거나 또는 극성 잔기에서 전하 중성 단쇄 지방족 잔기(예컨대 A)로의 치환을 포함하거나, 거의 조성되거나 또는 조성된다. 일부 실시 형태에 있어서, 상기 세그먼트는 약 16개 또는 17개의 잔기이다. 일부 실시 형태에 있어서, 1개, 2개 또는 3개 이상을 제외하고, 상기 세그먼트 중의 거의 모든 전하를 띄고 및 극성 잔기를 모두 치환한다. 일부 실시 형태에 있어서, 상기 세그먼트 중 총 약 7개, 8개, 9개 또는 10개의 전하를 띄고 및 극성잔기를 치환한다. 일부 실시 형태에 있어서, 상기 세그먼트의 N- 및 C-말단 2개의 잔기를 그 코딩 서열에 제한효소 인식 서열을 포함하는 아미노산으로 치환한다. 일부 실시 형태에 있어서, N 말단 2개의 잔기는 VF이고, C 말단 2개의 잔기는 ED이며, 제한 효소는 BpiI이다. 일부 실시 형태에 있어서, 상기 하나 또는 복수의 전하를 띄거나 또는 극성 잔기는 N, Q, R, K, H, D, E, Y, S 및 T 잔기를 포함한다. 일부 실시 형태에 있어서, 상기 하나 또는 복수의 전하를 띄거나 또는 극성 잔기는 R, K, H, N, Y 및/또는 Q 잔기를 포함한다. 일부 실시 형태에 있어서, 상기 세그먼트 내의 하나 또는 복수의 Y 잔기를 치환한다. 일부 실시 형태에 있어서, 상기 하나 또는 복수의 Y 잔기는 야생형 Cas13e.1의 Y672, Y676 및/또는 Y751(PCT/CN2020/119559(참조로 포함됨)의 SEQ ID NO: 4)에 대응된다. 일부 실시 형태에 있어서, 상기 세그먼트는 PCT/CN2020/119559(참조로 포함됨) 중 SEQ ID NO: 4의 잔기 35-51, 52-67, 156-171, 666-682 또는 712-727이다. 일부 실시 형태에 있어서, 상기 돌연변이는 PCT/CN2020/119559(참조로 포함됨) 중 SEQ ID NO: 37-39, 45 및 48 중의 임의의 하나 또는 복수에 대응되는 하나 또는 복수의 Ala 치환을 포함한다. 일부 실시 형태에 있어서, 상기 전하 중성 단쇄 지방족 잔기는 Ala(A)이다. 일부 실시 형태에 있어서, 상기 돌연변이는, 15-20개의 연속 아미노산을 갖는 상기 영역 내의 2개, 3개, 4개 또는 5개의 세그먼트 내의 치환,을 포함하거나, 거의 이로 구성되거나 또는 이로 구성된다.
일부 실시 형태에 있어서, 조작된 Cas13은 표적 RNA에 대한 야생형 Cas13의 가이드 서열 특이적 엔도뉴클레아제 절단 활성의 적어도 약 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%를 보류한다.
일부 실시 형태에 있어서, 조작된 Cas13은 비표적 RNA의 가이드 서열에 대한 야생형 Cas13의 비의존적 부차적 엔도뉴클레아제 절단 활성의 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%가 결핍하다.
일부 실시 형태에 있어서, 조작된 Cas13은 표적 RNA에 대한 야생형 Cas13의 가이드 서열 특이적 엔도뉴클레아제 절단 활성의 적어도 약 80%-90%를 보류하고, 비표적 RNA에 대한 야생형 Cas13의 가이드 서열 비의존적 부차적 엔도뉴클레아제 절단 활성의 적어도 약 95%-100%가 결핍하다.
일부 실시 형태에 있어서, 본 발명의 조작된 Cas13은 PCT/CN2020/119559(참조로서 포함됨) 중 SEQ ID NO: 6-10의 어느 하나와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8% 또는 99.86% 동일성을 갖는 아미노산 서열을 갖고, PCT/CN2020/119559(참조로 통합)의 SEQ ID NO: 16, 20, 24, 28 및 32에서 정의한 임의의 하나 또는 복수의 영역을 포함하지 않는다.
일부 실시 형태에 있어서, PCT/CN2020/119559(참조로 서 포함됨)의 SEQ ID NO: 17, 21, 25, 29 및 33에 비해, 아미노산 서열의 PCT/CN2020/119559(참조로서 포함됨)의 SEQ ID NO: 16, 20, 24, 28 및 32에서 정의한 하나 또는 복수의 영역 중의 각각에 각각 1개, 2개, 3개, 4개 또는 5개에 달하는 차이를 포함한다.
일부 실시 형태에 있어서, 본 발명의 조작된 Cas13은 PCT/CN2020/119559(참조로서 포함됨) 중 SEQ ID NO: 6-10의 어느 하나의 아미노산 서열을 갖는다. 일부 실시 형태에 있어서, 본 발명의 조작된 Cas13은 PCT/CN2020/119559(참조로서 포함됨) 중 SEQ ID NO: 9 또는 10의 아미노산 서열을 갖는다.
일부 실시 형태에 있어서, 본 발명의 조작된 Cas13은 핵 위치화 신호(NLS) 서열 또는 핵배출 신호(NES)를 더 포함한다. 일부 실시 형태에 있어서, 조작된 Cas13은 N- 및/또는 C 말단NLS를 포함한다.
일부 실시 형태에 있어서, 본 발명의 조작된 CRISPR/Cas13 이펙터 효소를 코딩하는 본 발명의 RNA 서열은 코돈 최적화를 거쳐, 진핵 생물, 포유동물 (예컨대 인간 또는 비인간 포유동물), 식물, 곤충, 조류, 파충류, 설치류(예컨대 마우스, 래트), 어류, 연충/선충 또는 효모에서 발현되는 데 사용된다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은 조작된 클러스터화된 규칙적인 짧은 회문 반복서열(CRISPR)-Cas13 이펙터 효소의 코딩 서열을 포함하고, 상기 코딩 서열은 (i) 야생형 서열에 비해 하나 또는 복수의(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의)뉴클레오티드 추가, 결실, 치환 및/또는 기타 돌연변이를 포함하고, (ii) 상기 야생형 서열과 적어도 50%, 60%, 70%, 80%, 90%, 95% 또는 97% 서열 동일성을 가지며, (iii) 엄격한 조건 하에서 상기 야생형 서열 또는 (i) 및 (ii) 중의 어느 하나와 혼성화되거나, 또는 (iv)는 (i) - (iii) 중 어느 하나의 상보적 서열이다.
일부 실시 형태에 있어서, 본 발명의 RNA 서열은, siRNA, piRNA, 짧은 헤어핀 RNA 또는 shRNA, 마이크로 RNA 또는 miRNA 또는 그 전구체(전구체miRNA 및 pri-miRNA 포함), 안티센스 서열 또는 올리고뉴클레오티드(ASO), CRISPR/Cas의 가이드 RNA 또는 gRNA, rRNA, tRNA, snoRNA, snRNA, exRNA, scaRNA, lncRNA, Xist 및 HOTAIR 등과 같은 비코딩RNA(ncRNA)를 포함한다.
9.
사용 방법
본 발명의 rRAAV 바이러스 입자 및 RNA 서열은 임의의 GOI/RSI을 임의의 적합한 표적 세포, 조직 또는 생물체에 전달하는 데 사용할 수 있고, 임의의 유전자 요법에 사용된다.
일부 실시 형태에 있어서, 본 발명의 rRAAV 바이러스 입자 및 RNA 서열은 치료 방법에 사용될 수 있고, 여기서 유전자의 기능 버전은 기능 결함 또는 기능 상실 질병 유전자를 대체하여 상실된 기능을 회복할 수 있다. 예를 들어, 일부 실시 형태에 있어서, 야생형 코딩 서열 또는 야생형 단백질의 변이체 단백질을 코딩하고 상기 야생형 단백질의 적어도 하나의 원하는 기능을 보류한 변이체 코딩 서열을 표적 세포 /조직/기관에 전달하여, 그 코딩된 야생형 변이체를 발현하여, 상기 질병 유전자의 상실의 기능을 보상할 수 있다.
일부 다른 실시 형태에 있어서, 본 발명의 rRAAV 바이러스 입자 및 RNA 서열은 치료 방법에 사용될 수 있고, 여기서 기능 결함 또는 기능 획득성 질병유전자는 유전자 표적 제제에 의해 녹아웃,녹다운 또는 다른 방식으로 하향 조절되어, 상기 질별 유전자의 불리한 영향을 경감시킬 수 있다. 상기 유전자 표적 제제는 CRISPR/Cas 이펙터 효소(예컨대 본 명세서에 따른 조작된 Cas9 또는 Cas13 이펙터 효소)일 수 있고, 상기 이펙터 효소는 선택적으로 동시에(또는 단독으로) 제공되는 가이드 RNA를 가지며, 상기 가이드 RNA는 상기 질병 유전자를 공동으로 타켓팅한다. 일부 실시 형태에 있어서, 상기 유전자 표적 제제는 DNA-RNA 염기 편집을 위한 DNA 또는 RNA 염기 편집기와 연결되는 Cas 이펙터 효소일 수 있다. 일부 실시 형태에 있어서, 상기 유전자 표적 제제는 siRNA, shRNA, 마이크로 RNA 또는 안티센스 RNA이다.
일부 실시 형태에 있어서, 본 발명은 표적 세포에서 표적 RNA를 변형시키는 방법을 제공하고, 상기 방법은 상기 표적 세포를 본 명세서에 따른 CasPR 또는 조작된 CRISPR/Cas 이펙터 효소(또는 그 동원체, 이원체, 변이체, 유도체 또는 기능 단편)를 코딩하는 본 발명의 rRAAV 바이러스 입자 또는 RNA 서열에 접촉시키는 단계를 포함하고, 여기서 CasPR/Cas 이펙터 효소의 가이드 서열이 표적 RNA의 적어도 15개의 뉴클레오티드와 상보적이며, 여기서 상기 CasPR/공학적 Cas 이펙터 효소가 가이드 서열과 관련되어 표적 RNA를 결합 및 변형하는 복합물을 형성한다.
일부 실시 형태에 있어서, 본 발명은 필요한 대상체에서 병증 또는 질병을 치료하는 방법을 제공하고, 상기 방법은 대상체에게 조성물을 투여하는 단계를 포함하며, 상기 조성물은 본 명세서에 따른 CasPR 또는 조작된 CRISPR/Cas 이펙터 효소(또는 그 동원체, 이원체, 변이체, 유도체 또는 기능 단편)를 코딩하는 본 발명의 rRAAV 바이러스 입자 또는 RNA 서열을 포함하고, 여기서 CasPR/Cas 이펙터 효소의 가이드 서열은 표적 RNA의 적어도 15개의 뉴클레오티드와 상보적이며, 여기서 상기 CasPR/공학적 Cas 이펙터 효소가 가이드 서열과 관련되어 표적 RNA를 결합 및 변형시키는 복합물을 형성함으로써, 상기 대상체에서 상기 병증 또는 질병을 치료한다.
일부 실시 형태에 있어서, CasPR 또는 조작된 Cas 이펙터 효소 복합물을 통한 절단을 통해 상기 표적 RNA를 변형시킨다. 일부 실시 형태에 있어서, 이중 가닥 RNA특이적 아데노신 및/또는 시티딘 탈아미노 효소를 포함한 유도체로 탈아미노화하여 상기 표적 RNA를 변형시킨다. 일부 실시 형태에 있어서, 상기 표적 RNA는 mRNA, tRNA, rRNA, 비코딩RNA, lncRNA 또는 핵 RNA이다. 일부 실시 형태에 있어서, 상기 표적 RNA는 세포 내에 있다. 일부 실시 형태에 있어서, 상기 세포 는 암세포이다. 일부 실시 형태에 있어서, 상기 세포는 감염원에 의해 감염된다. 일부 실시 형태에 있어서, 상기 감염원은 바이러스, 프라이온, 원생 동물, 진균 또는 기생충이다. 일부 실시 형태에 있어서, 상기 세포는 뉴런세포(예를 들어, 성상교세포, 신경교세포 (예를 들어, Muller 신경교세포, 회돌기교세포, 뇌실막 세포, 슈반(Schwan)세포, NG2 세포 또는 위성세포))이다.
일부 실시 형태에 있어서, 상기 병증 또는 질병은 암증 또는 감염성 질병이다. 일부 실시 형태에 있어서, 상기 암증은 빌름스종양, 유잉육종, 신경내분비종양, 교모세포종, 신경아세포종, 흑색종, 피부암, 유방암, 대장암, 직장암, 전립선암, 간암, 신장암, 췌장암, 폐암, 담도암, 자궁경부암, 자궁내막암, 식도암, 위암, 두경부암, 갑상선수질암, 난소암, 신경교종, 림프종, 백혈병, 골수암, 급성 림프구성 백혈병, 급성 골수성 백혈병, 만성 림프구성 백혈병, 만성 골수성 백혈병, 호지킨 림프종, 비호지킨 림프종 또는 방광암이다. 일부 실시 형태에 있어서, 상기 방법은 체외(in vitro) 방법, 체내(in vivo) 방법 또는 탈체(ex vivo) 방법이다. 일부 실시 형태에 있어서, 상기 복합물이 상기 표적 RNA와 결합한 후, 상기 조작된 Cas13는 대량의(또는 검출 가능한)부가적 RNA효소 활성을 나타내지 않는다.
일부 실시 형태에 있어서, 상기 병증 또는 질병은 신경 병증이고, 예컨대 녹내장, 연령 관련 RGC상실, 시신경 손상, 망막 허혈, 레버 유전 시신경 장애, RGC 뉴런의 퇴화에 관련된 신경 병증, 필요한 대상체의 선조체 중 기능적 뉴런 퇴화에 관련된 신경 병증, 파킨슨병, 알츠하이머병, 헌팅턴병, 정신분열증, 우울증, 약물 중독, 활동 장애, 예컨대 무도병, 무도 무정위 운동 및 운동 장애, 양극성 장애, 자폐증 계통 장애(ASD) 또는 기능장애이다.
일부 실시 형태에 있어서, 본 발명의 방법은 (i) 체외 또는 체내 세포 노화 유도; (ii) 체외 또는 체내 세포 주기 정체; (iii) 체외 또는 체내 세포 성장억제 및/또는 세포 성장억제; (iv) 체외 또는 체외 무반응성 유도; (v) 체외 또는 체외 세포 사멸 유도; 및 (vi) 체외 또는 체외 괴사 유도 중 이하의 하나 이상을 초래한다.
본 발명의 다른 실시 형태
1.
폴리뉴클레오티드 서열에 있어서, 리보핵산(RNA), 디옥시리보핵산(DNA), 트레오스 핵산(TNA), 글리콜핵산(GNA), 펩티드 핵산(PNA), 잠금핵산(LNA, β-D-리보스 배열을 갖는 LNA, α-L-리보스 배열을 갖는 α-LNA(LNA의 부분 입체 이성질체), 2'-아미노 기능화를 갖는 2'-아미노-LNA 및 2'-아미노 기능화를 갖는 2'-아미노-α-LNA 포함) 또는 그 하이브리드체를 포함하나 이에 한정되지 않고, DNA 바이러스의 바이러스 입자에 패키징될 수 있으며, 상기 폴리뉴클레오티드 서열은
(1)
관심 폴리뉴클레오티드 서열(PSI), 예를 들어, 관심 유전자(GOI)의 RNA 코딩 서열, mRNA와 같은 단백질(예를 들어, 치료성 단백질, 항원 단백질, 또는 유전자 편집 단백질예컨대 CRISPR/Cas 이펙터 효소(“Cas 단백질”로 약칭), ZFN 단백질, TALEN 단백질)을 코딩하는 RNA, 또는 비코딩 기능적 RNA(예를 들어 운반 RNA(tRNA), 리보솜 RNA(rRNA), 작은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 안티센스 RNA, 안티센스 올리고뉴클레오티드, 마이크로 RNA(miRNA) 또는 CRISPR-Cas(예를 들어, Cas9, Cas12, Cas13)시스템의 RNA 성분(가이드 RNA(또는 gRNA) 예컨대 단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라), CRISPR RNA(crRNA) 및 tracr RNA 포함)), 또는 그 전구체; 및
(2)
직접 또는 간접적으로 PPS 상호 작용 분자와 상호 작용(예를 들어 결합)할 수 있고, 상기 RPS 상호 작용 분자가 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진하는 폴리뉴클레오티드 패키징 신호(PPS)를 포함하고,
선택적으로, 상기 폴리뉴클레오티드 서열을 코딩하거나 또는 대응되는 DNA 서열 또는 상기 DNA 서열의 역-상보적인 서열은 상기 DNA 바이러스의 바이러스 입자에 패키징되는 능력(예를 들어, 상기 DNA 서열 또는 그 역-상보적인 서열은 DNA 패키징 신호, 예를 들어AAV 패키징을 위한 기능적 AAV ITR 결핍)이 감소되거나, 약화되거나 또는 거의 없다.
2.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 DNA 바이러스의 바이러스 입자는 AAV 바이러스 입자 또는 종양용해 바이러스 입자이다.
3.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 PPS는 상기 PSI의 5’ 말단에 위치하거나 또는 가깝거나, 상기 PSI의 3’ 말단에 위치하거나 또는 상기 PSI의 내부(예를 들어, mRNA의 인트론 내)에 위치한다.
4.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 서로 같거나 다른 하나 이상의(예를 들어, 1개, 2개, 3개 이상의) PPS를 포함한다.
5.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 여기서 상기 하나 이상의 PPS 중의 2개 이상(예를 들어, 3개)은 서로 같거나 다른 링커를 거쳐 서로 인접하거나 또는 직렬 연결된다.
6.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 서로 인접하지 않는(예를 들어, 각자 상기 관심 폴리뉴클레오티드 서열(PSI)의 하나의 말단에 위치하거나 가까움) 2개 이상의 PPS를 포함한다.
7.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 여기서 상기 PPS는 전사되고 변형된 AAV말단 역반복(ITR)를 포함하고, 여기서 상기 전사되고 변형된 AAV ITR은
(a)
전사된 기능적 Rep 결합 요소(RBE)를 포함하고, 선택적으로 전사된 기능적 RBE’를 더 포함하며; 및
(b)
전사된 말단 분해 부위(TRS) 또는 전사된 역-상보적인 TRS(rcTRS) 또는 둘 모두가 결핍되며;
선택적으로, 상기 전사되고 변형된 AAV ITR은 전사된 D 영역 서열(D서열 또는 D’서열)을 더 포함하고; 및/또는
선택적으로, 상기 PPS 상호 작용 분자는 Rep78, Rep68, Rep52 및/또는 Rep40이다.
8.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 전사되고 변형된 AAV ITR은 상기 RNA의 3’말단 1000개의 뉴클레오티드, 800개의 뉴클레오티드, 500개의 뉴클레오티드, 300개의 뉴클레오티드 또는 200개의 뉴클레오티드 내에 존재하고; 선택적으로, 상기 전사되고 변형된 AAV ITR은 폴리A 서열, 폴리A 신호 서열(예를 들어, AAUAAA) 또는 RNA전사 종결 서열(예를 들어, 히스톤 다운스트림 요소)의 5’에 존재한다.
9.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 여기서 상기 전사되고 변형된 AAV ITR은 전사된 야생형 Flip 또는 Flop ITR에 기반하여 변형된 것이고; 선택적으로, 상기 야생형 Flip 또는 Flop ITR은 AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAVrh74, AAV8, AAV9, AAV10, AAV11, AAV12 또는 AAV13으로부터 유래된다(선택적으로, 상기 야생형 Flop ITR은 SEQ ID NO: 1의 뉴클레오티드 서열을 가짐).
10.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 전사되고 변형된 AAV ITR은 상기 전사된 TRS 및 상기 전사된 rcTRS 둘 모두가 결핍하다.
11.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 전사되고 변형된 AAV ITR은 상기 전사된 D 영역 서열을 포함한다(선택적으로, 상기 변형된 AAV ITR은 SEQ ID NO: 3의 뉴클레오티드 서열을 가짐).
12.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 전사되고 변형된 AAV ITR은 상기 전사된 D 영역 서열이 결핍하다(선택적으로, 상기 변형된 AAV ITR은 SEQ ID NO: 2의 뉴클레오티드 서열을 가짐).
13.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 제2 전사되고 변형된 AAV ITR을 더 포함하고, 상기 제2 전사되고 변형된 AAV ITR은 제2 전사된 기능적 RBE 서열을 가지나 제2 전사된 TRS 또는 제2 전사된 rcTRS 또는 둘 모두가 결핍되고; 선택적으로, 상기 제2 전사되고 변형된 AAV ITR은 제2 전사된 D 영역 서열을 더 포함한다.
14.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 전사되고 변형된 AAV ITR 및 상기 제2 전사되고 변형된 AAV ITR은 서로 같다(또는 서로 다르다).
15.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 전사되고 변형된 AAV ITR 및 상기 제2 전사되고 변형된 AAV ITR은 (만약 존재하면)대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 결실, 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 돌연변이 또는 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 삽입을 포함한다.
16.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 제2 전사되고 변형된 AAV ITR은 상기 폴리뉴클레오티드 서열의 5’말단 1000개의 뉴클레오티드, 800개의 뉴클레오티드, 500개의 뉴클레오티드, 250개의 뉴클레오티드 또는 150개의 뉴클레오티드 내에 존재한다.
17.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 PPS는 MS2 서열, PP7 결합 부위 또는 com 결합 부위를 포함하고, 상기 PPS 상호 작용 분자는 직접 또는 간접적으로 상기 PPS와 상호 작용(예를 들어 결합)할 수 있는 PPS 상호 작용 단백질(PPSIP)을 포함하며, 예컨대 MS2 서열의 경우 박테리오파지 유래의 MS2 외피 단백질(MCP), PP7 결합 부위의 경우 PP7 박테리오파지 외피 단백질(PCP) 또는 com 결합 부위의 경우 박테리오파지 COM 단백질(COM)을 포함한다.
18.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 PPSIP는 직접 또는 간접적으로 상기 DNA 바이러스의 바이러스 입자의 바이러스 패키징 시스템의 단백질 성분(예를 들어 아데노 관련 바이러스2(AAV2)의 Rep78 및/또는 Rep68 또는 조립 활성화 단백질(AAP))과 관련된다(예를 들어, 이하에 융합).
19.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 상기 폴리뉴클레오티드 서열은 전사된 DNA 패키징 신호를 포함하거나 바람직하게는 포함하지 않고, 예를 들어, 전사된 야생형 AAV ITR 서열(예를 들어, 상기 폴리뉴클레오티드 서열은 전사되고 변형된 AAV ITR 서열을 포함하고, 상기 전사되고 변형된 AAV ITR 서열은 대응되는 전사된 야생형 AAV ITR 서열의 뉴클레오티드의 추가, 결실 및/또는 치환을 가져 상기 DNA 바이러스의 바이러스 입자의 DNA 패키징 능력을 저하시킨다) 를 포함하거나 바람직하게는 포함하지 않는다.
20.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서,
(1)
전사된 전사 인핸서;
(2)
전사된 인트론 서열 또는 엑손 서열(예를 들어 단백질 발현을 강화하기 위한 전사된 인트론 서열 또는 엑손 서열);
(3)
5’ UTR 서열;
(4)
3’ UTR 서열;
(5)
폴리A 서열 또는 폴리아데닐화(폴리A) 신호 서열 및 선택적으로 상기 폴리A 신호 서열 다운스트림의 GU 풍부 영역;
(6)
전사 후 조절 요소 또는 서열, 예를 들어 전사된 우드척 간염 바이러스(WHP) 전사 후 조절 요소(WPRE) 서열; 및/또는
(7)
전사 종결 서열(예를 들어 히스톤 다운스트림 요소)을 더 포함하고,
선택적으로, 상기 폴리뉴클레오티드 서열은 상기 전사 후조절 요소 또는 서열의 3’ 및 상기 폴리A 서열 또는 폴리A 신호 서열의 5’에 위치한 PPS를 포함한다.
21.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 5’에서 3’방향으로 상기 PSI, 임의의 전사된 WPRE 서열; 상기 PPS(예를 들어상기 전사되고 변형된 AAV ITR, 상기 MS2 서열, 상기 PP7 결합 부위 또는 상기 com 결합 부위); 및 상기 폴리A 서열 또는 상기 폴리A 신호 서열을 포함한다.
22.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 여기서 상기 GOI는 단백질(예를 들어, 형광 단백질, 치료성 단백질, 항원 단백질, 또는 유전자 편집 단백질(예를 들어, Cas 단백질, ZFN 단백질, TALEN 단백질)), 효소(예를 들어 Cre 단백질 또는 CRISPR/Cas 이펙터 효소(예를 들어, Cas9, Cas12, Cas13), 또는 그 변이체), 구조 단백질, mRNA, 비코딩 RNA(ncRNA), siRNA, piRNA, 짧은 헤어핀 RNA 또는 shRNA, 마이크로 RNA(miRNA) 또는 그 전구체(전구체miRNA 및 pri-miRNA 포함), 리보솜 RNA(rRNA), 안티센스 서열 또는 올리고뉴클레오티드(ASO), CRISPR-Cas시스템의 RNA 성분(단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라)와 같은 가이드 RNA(또는 gRNA), CRISPR RNA(crRNA) 및 tracr RNA 포함), CRISPR/Cas 이펙터 효소를 위한 가이드 RNA 또는 gRNA, rRNA, tRNA, snoRNA, snRNA, exRNA, scaRNA, lncRNA, Xist 및 HOTAIR을 포함한다.
23.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열에 있어서, 길이가 약 8,900개의 뉴클레오티드 미만이고, 길이가 약 8,000개의 뉴클레오티드 미만이며, 길이가 약 7,000개의 뉴클레오티드 미만이고, 길이가 약 6,000개의 뉴클레오티드 미만이며, 길이가 약 5,200개의 뉴클레오티드 미만이고, 길이가 약 4,000개의 뉴클레오티드 미만이며, 길이가 약 3,000개의 뉴클레오티드 미만이고, 길이가 약 2,000개의 뉴클레오티드 미만이며, 길이가 약 4,700-5,200개의 뉴클레오티드이고, 길이가 약 4,700-5,000개의 뉴클레오티드이며, 길이가 약 4,700-4,800개의 뉴클레오티드이거나 또는 길이가 약 4,700개의 뉴클레오티드인 단일 가닥 RNA이다.
24.
폴리뉴클레오티드에 있어서, 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열을 코딩하는 카세트를 포함하고; 선택적으로, 상기 폴리뉴클레오티드는 DNA 서열(예를 들어, DNA 플라스미드)이며, 상기 DNA 서열은 선택적으로 상기 DNA 플라스미드의 백본에 스터퍼 서열을 포함하고, 및/또는 선택적으로 AAV ITR과 같은 기능적 DNA 패키징 신호를 포함하지 않는다.
25.
임의의 상기 실시 형태에 따른 폴리뉴클레오티드에 있어서, 상기 카세트를 통해 코딩된 폴리뉴클레오티드 서열에 조작 가능하게 열결되고 전사되도록 구동하는 프로모터를 더 포함한다.
26.
임의의 상기 실시 형태에 따른 폴리뉴클레오티드에 있어서, 상기 프로모터는 편재 프로모터이다.
27.
임의의 상기 실시 형태에 따른 폴리뉴클레오티드에 있어서, 상기 프로모터는 조직 특이적 프로모터이다.
28.
임의의 상기 실시 형태에 따른 폴리뉴클레오티드에 있어서, 상기 프로모터는 전신 발현 프로모터이다.
29.
임의의 상기 실시 형태에 따른 폴리뉴클레오티드에 있어서, 상기 프로모터는 유도성 프로모터이다.
30.
임의의 상기 실시 형태에 따른 폴리뉴클레오티드에 있어서, 상기 프로모터를 통해 구동하는 상기 폴리뉴클레오티드 서열을 강화하는 전사된 인핸서를 더 포함한다.
31.
재조합 DNA 바이러스의 바이러스 입자에 있어서, DNA 바이러스(예컨대 AAV 바이러스 또는 종양용해 바이러스)의 단백질 쉘(예컨대 캡시드) 중에 패키징되는 폴리뉴클레오티드 게놈(예를 들어, 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드로부터 전사된 폴리뉴클레오티드 서열)을 포함한다.
32.
임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자에 있어서, 상기 DNA 바이러스는 AAV이고, 상기 재조합 DNA 바이러스의 바이러스 입자는 재조합 폴리뉴클레오티드 아데노 관련 바이러스(rPAAV) 입자이며, 상기 재조합 폴리뉴클레오티드 아데노 관련 바이러스 입자는
(1)
AAV 캡시드; 및
(2)
상기 AAV 캡시드 내에 패키징되는 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드로부터 전사된 폴리뉴클레오티드 서열을 포함한다.
33.
임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자에 있어서, 상기 AAV 캡시드는 혈청형 AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV-DJ, AAV PHP.eB, Anc80L65, Anc80L65AAP, AAVrh74 또는 7m8의 AAV로부터 유래된 캡시드를 포함한다.
34.
재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체에 있어서, 상기 군체는 복수의 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)를 포함하고, 여기서 상기 군체 내의 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자) 중의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 이상은 이에 패키징된 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드로부터 전사된 폴리뉴클레오티드 서열을 갖는다.
35.
숙주 세포에 있어서, 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열, 임의의 상기 실시 형태에 따른 폴리뉴클레오티드, 임의의 상기 실시 형태에 따른 폴리뉴클레오티드로부터 전사된 폴리뉴클레오티드 서열, 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자 (예를 들어, rPAAV 입자) 및/또는 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자 (예를 들어, rPAAV 입자)의 군체를 포함한다.
36.
임의의 상기 실시 형태에 따른 숙주 세포에 있어서, 바이러스 패키징 시스템을 더 포함하고, 상기 바이러스 패키징 시스템은 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드로부터 전사된 폴리뉴클레오티드 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진한다.
37.
임의의 상기 실시 형태에 따른 숙주 세포에 있어서, 상기 바이러스 패키징 시스템은
(1)
rep 유전자 및 cap 유전자의 전사를 구동하는 하나 또는 복수의 프로모터의 전사 제어 하에 있는 AAV rep 유전자(예를 들어, Rep78, Rep68, Rep52 및/또는 Rep40의 코딩 서열) 및 AAV cap 유전자(예를 들어, VP1, VP2, VP3, AAP 및/또는 MAAP의 코딩 서열) 또는 그 발현 산물;
(2)
아데노 바이러스 E2A, E4 및 VA유전자 또는 상기 하나 이상의 단백질과 같이 AAV 패키징에 필요한 하나 이상의 단백질의 하나 또는 복수의 코딩 서열; 및
(3)
상기 PPS 상호 작용 분자 또는 그 코딩 서열을 포함하고,
선택적으로, 상기 바이러스 패키징 시스템은 (1) 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열을 코딩하는 폴리뉴클레오티드 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며; 및/또는 (3) 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열을 코딩하는 폴리뉴클레오티드 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드의 크기를 확대하는 것을 통해 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징되는 능력을 감소시키거나, 약화시키거나 또는 거의 제거한다.
38.
임의의 상기 실시 형태에 따른 숙주 세포는 포유동물 세포(예컨대 HEK293세포) 또는 곤충세포(예컨대 Sf9 또는 Sf21세포)이다.
39.
임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자) 또는 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체를 생성하는 방법에 있어서, 상기 방법은
a)
임의의 상기 실시 형태에 따른 숙주 세포를 충분한 시간 동안 배양하는 단계, 및
b)
상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 수득하는 단계를 포함한다.
40.
임의의 상기 실시 형태에 따른 방법에 있어서, 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 단리 또는 정제하는 단계를 더 포함한다.
41.
재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자의 군체를 생성하는 방법에 있어서, 상기 방법은
a)
바이러스 패키징 시스템(예를 들어, AAV 패키징 시스템)을 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드로부터 전사된 폴리뉴클레오티드 서열에 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 생성하기에 충분한 시간 동안 접촉시키는 단계, 및
b)
상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 수득하는 단계; 및 선택적으로,
c)
수득한 재조합 DNA 바이러스의 바이러스 입자 또는 재조합 DNA 바이러스의 바이러스 입자의 군체를 단리 또는 정제하는 단계를 포함한다.
42.
임의의 상기 실시 형태에 따른 방법에 있어서, 상기 바이러스 패키징 시스템(예를 들어, AAV 패키징 시스템)은
(1)
상기 폴리뉴클레오티드 서열을 패키징하기 위한 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘을 조립하기 위한 하나 이상의 단백질(예를 들어, AAV 캡시드를 조립하기 위한 VP1, VP2 및/또는 VP3) 또는 그 하나 또는 복수의 코딩 서열;
(2)
상기 단백질 쉘의 조립 및/또는 상기 폴리뉴클레오티드 서열이 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘에 패키징되도록 촉진하기 위한 하나 이상의 단백질(예를 들어, AAV 패키징을 위한 Rep78, Rep68, Rep52 및/또는 Rep40) 또는 그 하나 또는 복수의 코딩 서열(예를 들어, 아데노 바이러스 E2a, E4 및 VA유전자); 및
(3)
상기 PPS 상호 작용 분자 또는 그 코딩 서열을 포함하고,
선택적으로, 상기 바이러스 패키징 시스템은 (1) 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열을 코딩하는 폴리뉴클레오티드 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며; 및/또는 (3) 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열을 코딩하는 폴리뉴클레오티드 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드의 크기를 확대하는 것을 통해 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징되는 능력을 감소시키거나, 약화시키거나 또는 거의 제거한다.
43.
임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드로부터 전사된 폴리뉴클레오티드 서열을 DNA 바이러스의 바이러스 입자에 패키징하는 시스템에 있어서, 상기 시스템은
(1)
상기 폴리뉴클레오티드 서열을 패키징하기 위한 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘을 조립하기 위한 하나 이상의 단백질(예를 들어, AAV 캡시드를 조립하기 위한 VP1, VP2 및/또는 VP3) 또는 그 하나 또는 복수의 코딩 서열;
(2)
상기 단백질 쉘의 조립 및/또는 상기 폴리뉴클레오티드 서열이 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘에 패키징되도록 촉진하기 위한 하나 이상의 단백질(예를 들어, AAV 패키징을 위한 Rep78, Rep68, Rep52 및/또는 Rep40) 또는 그 하나 또는 복수의 코딩 서열(예를 들어, 아데노 바이러스 E2a, E4 및 VA유전자); 및
(3)
상기 PPS 상호 작용 분자 또는 그 코딩 서열을 포함하고,
선택적으로, 상기 바이러스 패키징 시스템은 (1) 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열을 코딩하는 폴리뉴클레오티드 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며; 및/또는 (3) 임의의 상술한 실시 형태에 따른 폴리뉴클레오티드 서열을 코딩하는 폴리뉴클레오티드 또는 임의의 상기 실시 형태에 따른 폴리뉴클레오티드의 크기를 확대하는 것을 통해 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징되는 능력을 감소시키거나, 약화시키거나 또는 거의 제거한다.
44.
관심 유전자(GOI)를 세포, 식물 또는 동물에 전달하는 방법에 있어서, 상기 방법은 상기 세포, 식물 또는 동물을 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자), 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체 또는 임의의 상기 실시 형태에 따른 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체에 접촉시키는 단계를 포함하고, 여기서 상기 GOI는 상기 폴리뉴클레오티드 서열(임의의 상기 실시 형태에 기재)에 의해 코딩된다.
45.
관심 폴리뉴클레오티드 서열(PSI)을 세포, 식물 또는 동물에 전달하는 방법에 있어서, 상기 방법은 상기 세포, 식물 또는 동물을 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자), 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체 또는 임의의 상기 실시 형태에 따른 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체에 접촉시키는 단계를 포함한다.
46.
필요한 대상체에서 질병 또는 장애를 진단, 예방 또는 치료하는 방법에 있어서, 상기 방법은 상기 대상체에게 치료 유효량 또는 조제량의 임의의 상기 실시 형태에 따른 또는 임의의 상기 실시 형태에 따른 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체를 투여하는 단계를 포함한다.
47.
필요한 대상체의 질병 또는 장애를 진단, 예방 또는 치료하기 위한 약물의 제조에서임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자), 임의의 상기 실시 형태에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체 또는 임의의 상기 실시 형태에 따른 방법을 통해 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rPAAV 입자)의 군체의 용도이다.
실시예
이하 제공하는 실시예는 본 발명의 여러 예시적인 실시 형태를 설명하기 위한 것이고, 임의의 방면에서 한정하고자 하는 것이 아니다.
실시예 1
RAAV 바이러스 입자로의 RNA의 고효율적 패키징
이 실시예는 RNA 벡터 게놈이 고효율적으로 AAV 바이러스 캡시드에 패키징될 수 있는 것을 입증하고, 특히 AAV 캡시드 내에 직접 패키징되도록 설계된 변형/재조합된 RNA를 사용한다.
우선, 예상밖으로, 전사(RNA로서) 시, AAV 패키징 신호-ITR(DNA)은 특히 일부 배열로로 존재하는 경우(예를 들어, 전사되고 변형된 AAV ITR 서열이 본 발명의 전사된 RNA 서열의 3’ 말단에 접근하는 경우) 본 발명의 RNA 서열(예를 들어, rRAAV 벡터 게놈RNA)이 AAV 입자에 패키징되도록 촉진할 수 있는 것으로 나타난다.
특히, AAV 벡터 게놈 말단으로부터 유래된 야생형 및 변형된 AAV ITR 서열(DNA)을 각 상응한 전이 유전자 발현 카세트에 이동시켜, 모든 전이 유전자 전사체(RNA)가 모두 후보 패키징 신호를 함유하도록 보장한다. RAAV 생산 과정에서 ssDNA 게놈을 갖는 기존 AAV 벡터의 생산을 차단하기 위해, 최적화된 ITR(dITR 및 dITR-D)을 사용하여 야생형 ITR를 대체한다(표 2).
표 2: 테스트한 ITR의 핵산 서열
특정적으로, Flop 배열 중의 야생형 AAV2 ITR(ITR2) 서열에서, TRS(“TTGGC”)는 상기 ITR의 5’ 말단에 위치하고, 그 역-상보적인 서열 GCCAA에 이중 밑줄을 긋는다. 이러한 서열은 임의의 방향으로 코딩 플라스미드에 클론된다(즉, SEQ ID NO: 1로 표시되는 서열 또는 그 역-상보적인 서열을 주형으로 사용하여 본 발명의 RNA 서열을 전사할 수 있다). 본 명세서의 실험에서, 야생형 AAV2 ITR 서열은 이러한 방향으로 클론되어, 상기 전사된 RNA 중의 T가 U로 치환되는 것을 제외하고, 전사된 RNA가 SEQ ID NO: 1(또는 이하의 SEQ ID NO: 2 또는 3)과 동일한 서열을 갖도록 한다. 어쨌든, 이러한 서열 또는 그 역전사체를 전사한 후, 얻은 야생형 ITR2의 전사된 RNA는 회문의 전사된 RBE(회색 음영)를 포함한다. 본 명세서의 실험에서, 전사된 RNA는 모든 T가U로 치환되는 것을 제외하고, SEQ ID NO: 1과 등가적으로 전사된 야생형 AAV2 ITR을 포함한다. 만약 SEQ ID NO: 1의 역-상보적인 서열을 DNA 주형로 사용하면, 전사된 RNA는 GCCAA로 코딩된 전사된 TRS(UUGGC)를 포함할 것이다. 상기 전사된 TRS는 전사된 RBE와 전사된 D 서열 사이에 위치한다.
변형된 ITR 서열 중의 하나는 “δITR”(또는 “dITR”로 약칭)이고, 이는 결함이 있으며, 첫번째 G를 제외하고, 상기 dITR은 D 영역 서열( 볼드체 이탤릭체 ), 5’ 말단 위치의 TRS 및 역-상보적인 TRS 서열(“GCCAA”)이 결핍하다. 이러한 서열 전사 후, dITR의 전사된 RNA는 회문의 전사된 RBE(회색 음영) 및 GCCAA로 코딩된 전사된 TRS(UUGGC)가 결핍되어 있는 전사된 결함 ITR을 더 포함한다. 그러나 본 실험에서, SEQ ID NO: 2의 역-상보적인 서열을 DNA 주형으로 사용하여, 상기 전사된 RNA가 모든 T가 U에 의해 치환되는 것을 제외하고 SEQ ID NO: 2와 같은 서열을 갖는 전사되고 변형된 AAV2 ITR(전사된 dITR)을 포함하도록 한다.
다른 변형된 ITR 서열은 “dITR-D”이고, 이 또한 결함이 있으며, 이는 D 서열(“CTCCATCACTAGGGGTTCCT”, SEQ ID NO: 4)을 보류하나, 5’ 말단TRS(TTGGC)가 결핍되기 때문이다. 그 외, 역-상보적인 TRS(GCCAA) 중의 첫번째 G만 dITR-D에 보류되고, 나머지 CCAA 서열은 무관한 ACTAG서열에 의해 치환된다. 본 실험에서, SEQ ID NO: 3의 역-상보적인 서열을 DNA 주형으로 사용하여, 상기 전사된 RNA가 모든 T가 U에 의해 치환되는 것을 제외하고 SEQ ID NO: 3과 동일한 서열을 갖는 전사되고 변형된 AAV2 ITR(전사된 dITR-D)을 포함하도록 한다.
유의할 점은 dITR 및 dITR-D 서열은 모두 음영 회문 RBE 서열 SEQ ID NO: 5(CTGCGCGCTCGCTCGCTCACTG . . . CAGTGAGCGAGCGAGCGCGCAG)을 보류하고, 상응한 전사되고 변형된 ITR도 RBE 서열을 갖는다.
이러한 최적화된 ITR 코딩 서열(DNA)을 tdTomato발현 카세트의 2개의 위치에 삽입하되, 하나는 프로모터와 tdTomato 코딩 서열 사이에 위치하며, 다른 하나는 우드척 간염 바이러스(WHP) 전사 후 조절 요소(WPRE)와 SV40 폴리A 신호 사이에 위치한다.
사용된 최적화된 ITR의 서열, 수량 및 위치에 기반하여, 일련의 상이한 ITR에 기반한 RAAV 벡터를 구축하였다(도 3 참조).
ssDNA 벡터 게놈을 갖고 2개의 말단에 ITR 서열(“CTWS”: 서열 요소CAG 프로모터, tdTomato 전이 유전자, WPRE 서열 및 SV40 폴리A 신호 서열)을 갖지 않는 기존 AAV 벡터를 대조로 한다. 이 실험에 대해, AAV 혈청형 DJ를 선택한 것은 사용된 배양 세포에서 우수한 형질도입 효율을 가지기 때문이다. AAV-DJ는 합성 혈청형이고, AAV-2, 8 및 9의 키메릭 캡시드를 갖는다. 그 캡시드에 헤파린 결합 도메인을 함유하고, 상기 캡시드는 고효율적으로 여러 세포 유형을 형질도입하고 면역 중화를 피할 수 있다(Grimm et al., J. Virol. [바이러스학 저널] 82:5887-5911, 2008).
다양한 RAAV-ITR 바이러스 입자 및 대조 바이러스 입자는 모두 삼중 플라스미드 형질감염 시스템을 사용하여 생성된다(도 4).
특히, 전이 유전자 플라스미드, 패키징 플라스미드 및 헬퍼 플라스미드(중량비가 1 : 1 : 2임)를 HEK293T세포에 공동 형질감염시켜 RAAV 벡터를 생성한다. HEK293T세포를 컴피턴트 DMEM배지에서 배양하고, 형질감염 24시간 전에 세포를 접종한다. 형질감염 전, 배지를 2% FBS를 함유한 신선한 DMEM로 교체하였다. PEI-MAX을 형질감염용 시약으로 하였다. 그 후 형질감염 후 2일째 및 5일째에 상등액을 수집하고, 5일째에 형질감염된 세포를 수득하였다. RAAV 벡터를 이오딕사놀 밀도 구배를 사용하여 초원심 분리 및 정제하였다.
바이러스 역가(DNA 역가 및 RNA 역가)는 각각 Q-PCR 및 역전사-PCR(RT-PCT)을 통해 도 5a 중의 프로그램을 사용하여 확정하였다.
요컨대, 수득 및 정제된 RAAV 바이러스 입자를 우선 37°C에서 DNA효소 I 및 RNA효소 I로 2시간 동안 처리하여, 바이러스 입자 단백질 쉘 외의 모든 핵산을 제거하였다. 이어서, 뉴클레아제를 100°C에서 약 30분간 변성시키고, 그 후 RAAV 바이러스 입자를 변성 및 파열시켜 RAAV핵산 내용물을 방출하여 추가적인 분석에 사용하였다.
Q-PCR은 뉴클레아제 내성 산물을 분석에 사용하여, RAAV 바이러스 입자에 캡시드화된 DNA 벡터 게놈을 적정하였다. 특히, 한 그룹의 Q-PCR에 프로모터 서열에 특이적인 프라이머쌍을 사용하여 임의의 기능적 DNA를 검출/정량하고, 다른 그룹의 Q-PCR에 WPRE 서열에 특이적인 프라이머 쌍을 사용하여 RAAV 바이러스 입자에 캡시드화된 임의의 DNA 벡터 게놈에 검출/정량하였다. 도 5b를 참조한다.
아울러, 다른 하나의 샘플에서, 우선 데옥시리보뉴클레아제 I를 통해 임의의 RAAV 캡시드화된 DNA를 제거하고, 그 후 나머지 RNA에 대해 역전사하며, 얻은 cDNA를 Q-PCR주형으로 사용하여, RNA로 전사된 WPRE 서열을 검출/정량하였다. DNA 불완전 제거 후 존재할 수 있는 임의의 잔류 DNA를 검출/정량하기 위해, DNA 제거 단계 후의 샘플에 대해 Q-PCR을 사용하여 직접 증폭하여, 상기 샘플에 존재할 수 있는 임의의 WPRE(DNA) 서열을 검출하였다. 도 5a를 참조한다.
CITWS 작제물의 패키징 효율(도 6a를 참조)을 테스트하기 위해, 기존 pssDNA 작제물(양단에 야생형 ITR 서열을 가짐)을 사용하여 바이러스 입자를 생성하는 경우, 절대 다수의 바이러스 입자는 프로모터서열 및 WPRE 서열을 갖는 기능적 DNA 벡터 게놈을 포함한다. 아주 가끔(2개의 수량급 또는 약 1%의 시간), RNA 벡터 게놈도 바이러스 입자에 패키징된다(표지이 “RNA”의 스트립형 참조, 표지이 “DNA” 및 “기능적 DNA”인 스트립형보다 약 2개의 수량급이 낮다). 잔류 DNA는 패키징된 RNA 벡터 게놈보다 하나의 수량급이 낮다.
아울러, AAV 벡터 게놈 양단에서 ITR 서열을 제거하여 패키징을 거의 취소하였고, 즉,도 6a에서의 CTWS 작제물(무 ITR) 생성에 의한 패키징 DNA는 2-2.5개의 수량급이 낮아졌고, 심지어 RNA는 더 적다.
CTWS대조에 비해, DNA 패키징이 다소 개선되었으나, 프로모터의 3’과 GOI 코딩 서열의 5’ 사이에 하나의 최적화된 ITR 서열(dITR 또는 dITR-D 서열)만 추가하는 경우 RNA 패키징을 강화할 수 없었다. 도 6a를 참조한다.
흥미롭게도, 도 6b에서 매우 상이한 결과를 얻었고, 여기서 CTWIS 작제물을 테스트하였다. 특히, 패키징 pssDNA 작제물(도 6a 및 도 6b 비교)에 관하여, 거의 동일한 결과을 얻었다. 즉, 대다수 패키징된 바이러스 입자는 DNA(99% 이상) 및 무시할 수 있는 양(1% 이하)의 RNA를 함유하였다. 그러나, WPRE 서열의 3’ 말단과 폴리A 서열의 5’ 말단 사이에 최적화된 ITR 서열(dITR)을 추가하여 DNA와 RNA 사이의 패키징 효율의 차이를 현저히 줄이거나 심지어 역전하였다. dITR-D 서열을 사용할 때, 절대 다수의 패키징된 핵산이 RNA(패키징된 DNA보다 1-2개의 수량급이 높음)인 경우, 이러한 작용은 더욱 현저하였다.
만약 CITWIS 작제물 중의 프로모터와 GOI 코딩 서열 사이에 하나의 별도(즉 두번째)의 최적화된 ITR 서열을 삽입하면, 거의 동일한 결과를 얻는다. 도 6c를 참조한다.
이러한 결과에 따르면, 최적화된 ITR(dITR 및 dITR-D)은 기존 AAV 벡터의 복제를 파괴함으로써, RAAV 바이러스 입자에 패키징되는 DNA가 감소되는 것으로 나타났다.
대조 벡터CTWS(무 ITR) 및 RAAV-dITR 벡터에 비해, dITR-D최적화 ITR을 갖는 RAAV 벡터는 특히 dITR-D ITR이 mRNA 코딩 서열 및 WPRE 서열의 다운스트림(예를 들어, 마침 폴리A 신호의 5’에 위치함)에 위치할 때전사된 mRNA를 RAAV 입자에 더욱 우수하게 직접 갭시드화하는 능력을 가지는 것으로 보인다. 도 6a-6c를 참조한다. 이에 비해, mRNA 코딩 서열 업스트림에 위치한 dITR-D 서열(예를 들어, 마침 발현 작제물 중의 프로모터 서열 다음에 위치함)은 거의 mRNA를 RAAV 바이러스 입자에 직접 패키징되도록 촉진하지 않는다. 아울러, 만약 다른 하나의 dITR-D 서열을 mRNA 코딩 서열의 다운스트림(예를 들어, 마침 폴리A 서열의 5’위치함)에 삽입하면, 얻은 RAAV mRNA의 패키징은 유사하게 고도로 증가된다(도 6c).
결론적으로, 비록 수율(mRNA를 휴대하는 입자)이 기존 ssDNA 벡터 게놈을 갖는 AAV 벡터(pssAAV조)에 비해 20배 낮으나, 그 mRNA 게놈 양단에 dITR-D신호를 포함하는 CITWIS-D는 가장 우수한 특이적 mRNA를 캡시드화하는 능력을 가진다. 기존 AAV 벡터와 달리, RAAV 벡터CITWIS-D는 파괴된 DNA 패키징을 갖고, DNA를 포함하는 입자는 RAAV 벡터 저장량의 약 20% 이하만 차지하며, 기능적 DNA를 포함하는 입자의 백분율은 심지어 더 낮다(예를 들어, 10%)(도 6a-6c).
AAV 패키징 용량이 제한적이여서(< 4700 nt), 전이 유전자 플라스미드의 크기를 확대하는 것을 통해 원하지 않는 RAAV DNA 패키징을 줄일 수 있고, 전이 유전자 카세트의 길이를 증가시켜, 예를 들어, 시스 작용 요소(예컨대 인핸서, 인트론 등) 또는 비기능적 스터퍼 서열을 카세트에 삽입하여 기능적 DNA 패키징을 더욱 줄일 수 있다.
실시예 2
기능성을 갖는 RAAV 바이러스 입자
이 실시예는 대상 RAAV-dITR-D 벡터가 감염성을 가지고, 유전자 전달 벡터로 사용될 수 있는 것을 입증하였다.
동일 부피의 정제 RAAV-dITR-D(CITWIS-D) 벡터를 사용하여 체외에서 약 50,000의 동일 MOI(CITWIS-D 벡터의 MOI는 DNA 입자수 및 mRNA 입자수의 합으로 산출) 2 × 105개로 HEK293T세포를 감염시겼다.
특히, 감염 약 24시간 전에 HEK293T세포를 24웰 플레이트에 접종하였다. 그 후 RAAV 벡터와 1 mL DMEM(2% FBS 함유)을 완전히 혼합하였다. 그 후 세포의 배지를 제거하고, 세포를 혼합된 RAAV 벡터와 함께 밤새 인큐베이션하였다. 감염 후 3일 및 5일에 형광 사진을 촬영한다.
결과에 따르면, CITWIS-D 벡터가 tdTomato에 대한 발현은 기타 벡터보다 빠르나, 발현도 신속히 하향 조절된 것으로 나타났다(도 7b 참조). 이러한 쾌속 발현 및 분해 현상은 그 mRNA 게놈의 수명이 짧기 때문일 수 있다(도 7b).
흥미롭게도, 이러한 패키징 배후의 확실한 매커니즘은 명백하지 않으나 임의의 ITR 서열을 갖지 않는 CTWS 작제물은 분명히 어느 정도 패키징되었다. CTWS 벡터를 사용할 때, 이하의 적어도 두가지 가능성으로 mRNA 벡터 게놈의 패키징을 해석할 수 있다. 과발현된 세포 mRNA는 비특이적으로 RAAV 벡터에 패키징될 수 있거나, 또는 CTWS mRNA는 Rep2 또는 Cap-DJ와 상호 작용하는 일부 RNA구조를 가질 수 있다. 아울러, CTWS DNA 패키징은 CTWS플라스미드의 사이즈가 작기 때문이고, CTWS플라스미드의 사이즈를 증가시키면 DNA 패키징을 줄일 수 있다.
실시예 3
RAAV 입자로의 RNA의 고효율적 패키징
이 실시예는 RNA 게놈이 고효율적으로 AAV 캡시드 내에 패키징될 수 있고, 특히 본 명세서에서 설계한 AAV 캡시드 내에 직접 패키징되는 변형/재조합된 RNA를 사용하여, RAAV 입자를 생성하는 것을 입증하였다.
1.
설계
여러 발명자는 박테리오파지 유래 MS2 외피 단백질(MCP)과 그 인식 스템 루프MS2 사이의 강한 상호 작용을 이종 RNA 를 DNA 바이러스의 바이러스 입자에 패키징하는 신규한 패키징 신호로 하는 전략을 설계하였다.
우선, RAAV 생산 과정에서 패키징된 ssDNA 게놈을 갖는 기존 AAV 입자의 생산을 억제/감소시키기 위해, 기존 AAV 패키징 신호,즉 ITR를 제거하였다. 반대로, RNA 패키징 신호(RPS), 즉 MS2 스템 루프(또는 “MS2”로 약칭, 그 RNA 서열은 이하 서열에서 열거됨)의 하나의 복제 또는 3개의 복제를 tdTomato발현 카세트에 삽입하고, 우드척 간염 바이러스(WHP) 전사 후 조절 요소(WPRE)와 SV40 폴리A 신호 사이에 위치시켜, 모든 전사된 mRNA가 모두 RPS를 갖도록 보장함으로써, 결합 단백질, 즉 박테리오파지 유래 MS2 외피 단백질(또는 “MCP”로 약칭, 그 아미노산 서열은 하기 표에 도시됨)(MS2에 대응됨)에 의해 인식된다(도 8a).
AAV Rep 단백질은 비구조 단백질이고, 이들은 통상적으로 AAV 패키징 과정에서 ssDNA 게놈의 ITR과 AAV 캡시드 사이의 매개 역할을 하므로, MCP를 AAV2로부터 유래된 Rep78 단백질 및 Rep68 단백질의 N 말단에 융합하였다(Rep 68은 Rep 78의 C 말단 절단이고, 두 가지 융합물의 아미노산 서열은 이하의 서열표에 열거됨). 이러한 MCP-Rep78/68 융합물과 RNA 게놈 내의 MS2 서열의 상호 작용 및 RNA 게놈이 AAV 캡시드 내에 패키징되도록 촉진하는 능력을 검증하였다.
기존 AAV 벡터pssAAV-tdTomato(2개의 야생형 기능적 ITR 구비) 및 기능적 야생형 ITR을 갖지 않는 CTWS(“CTWS”, 대표 서열 요소CAG 프로모터, tdTomato 전이 유전자, WPRE 서열 및 SV40 폴리A 신호 서열)을 대조로 사용하였다(도 8a). 본 실시예에서, AAV 혈청형 DJ(“AAV-DJ” 또는 “DJ”)는 본 실시예에 사용된 배양 세포 HEK293T 세포에서 우수한 형질도입 효율을 가지므로, 상기 AAV 혈청형DJ를 선택하여 사용하였다. AAV-DJ는 합성 혈청형이고, AAV-2, 8 및 9의 키메릭 캡시드를 갖는다.
2.
RAAV 패키징과 생산
본 명세서에서 기존 삼중 플라스미드 형질감염 시스템을 사용하고 필요한 변통을 응용하여, 상응한 전이 유전자 플라스미드, 패키징 플라스미드 및 헬퍼 플라스미드를 1 : 1 : 2의 질량비로 HEK293T세포에 공동 형질감염하여, RAAV 및 대조 AAV 입자를 생성하였다.
특히, HEK293T 세포를 컴피턴트 DMEM 배지에서 배양하고, 형질감염 24 시간 전에 세포를 접종하였다. 형질감염 직전에, 배지를 2% FBS를 함유한 신선한 DMEM로 교체하였다. PEI-MAX을 형질감염용 시약으로 하였다. 감염 세포에 형질감염시킨 후, RPS를 포함하는 전이 유전자 플라스미드를 전사하여 패키징될 RNA 게놈을 생성하였다. 그 후 형질감염 후 2일째 및 5일째에 상등액을 수집하고, 5일째에 형질감염된 세포를 수득하였다. RAAV 및 대조 AAV 입자는 이오딕사놀 밀도 구배를 통해 초원심 분리 및 정제하였다.
3.
패키징된 게놈의 검출
정제된 RAAV 및 대조 AAV 입자를 우선 37°C에서 2시간 동안 뉴클레아제(데옥시리보뉴클레아제 I 및 리보뉴클레아제 I 포함)로 처리하여, 바이러스 입자를 제외하고 존재할 수 있는 핵산을 제거하였다. 그 다음, 뉴클레아제 및 RAAV 또는 대조 AAV 입자를 단백질 효소 K/SDS 소화에 의해 65°C에서 약 3시간 동안 변성시켜, 상기 바이러스 입자를 파열시켜, 그 중에 패키징된 게놈을 방출하였다. 그 후 페놀/클로로포름 추출을 통해, 방출된 바이러스 게놈을 함유한 뉴클레아제 내성 폴리뉴클레오티드를 추출 및 정제하였다.
대조 AAV 및 RAAV 입자의 DNA 게놈 역가를 검출하기 위해, Q-PCR을 사용하여 뉴클레아제 내성 폴리뉴클레오티드를 직접 분석하였다. Q-PCR에서 바이러스 게놈 상의 WPRE 서열에 특이적인 한쌍의 WPRE 프라이머(이하의 서열표에 도시된 바와 같음)를 사용하여 대조 AAV 또는 RAAV 입자에 캡시드화된 임의의 DNA 게놈을 검출 및 정량하였다.
대조 AAV 및 RAAV 입자의 RNA 게놈 역가를 검출하기 위해, 캡시드화된 RNA 게놈에 대해 역전사를 수행하기 전에, 데옥시리보뉴클레아제 I로 DNA를 소화시켜제거하여 대조 AAV- 또는 RAAV-에 캡시드화된 임의의 DNA 게놈을 제거하고, 얻은 cDNA를 Q-PCR 주형으로 사용하며, 상기 동일한 WPRE 프라이머쌍으로 WPRE 서열을 검출 및 정량하였다. 불완전한 DNA 제거로 인해 존재할 수 있는 임의의 잠재적 잔류 DNA를 검출 및 정량하기 위해, DNA 제거 단계 이후에 Q-PCR을 사용하여 직접 (역전사가 없음)샘플을 증폭시키고, 상기 동일한 WPRE 프라이머쌍으로 WPRE(DNA) 서열을 검출하며, 상기 프라이머는 모든 기타WPRE 서열에 특이적인 PCR 반응에도 사용된다.
4.
패키징 효율의 비교
pssAAV-tdTomato 작제물(양단에 야생형 ITR 구비)을 함유한 기존 전이 유전자 플라스미드 및 AAV-DJ를 위한 기존 패키징 플라스미드를 사용하여 대조AAV 입자를 생산할 때, 절때 다수 입자는 WPRE 서열을 갖는 DNA 게놈을 포함하였다. 아주 가끄ㅁ, RNA 게놈도 입자에 패키징된다(표지이 “RNA”인 스트립은 “DNA”로 표지된 스트립에 비해 약 5 개의 수량급이 낮다). 잔류 DNA의 존재는 RNA의 존재와 상당하고, 이는 역전사 이전에, 패키징된 DNA 게놈에 대한 데옥시리보뉴클레아제 I의 소화 효율이 낮기 때문일 수 있다.
흥미롭게도, 재조합 패키징 플라스미드 DJ-MCP(Rep78 및 68 단백질 N 말단에 융합된 MCP)로 DJ를 대체할 때, DNA 게놈의 패키징은 다소 저하되나(약 0.5개의 수량급이 낮음), 바이러스 게놈 분포 패턴은 거의 같고, 여기서 DNA 패키징은 RNA 패키징보다 약 5개의 수량급이 높았다. 이러한 결과에 따르면, MCP를 Rep78/68 단백질의 N 말단에 융합하는 것은 이들의 자연 기능을 현저하게 파괴하지 않는 것으로 나타났다(도 8b).
아울러, pssAAV-tdTomato 작제물 양단에서 ITR을 제거하여, CTWS 작제물을 생성하고, DNA 패키징이 현저히 제거되었다. 어떠한 패키징 플라스미드(DJ 또는 DJ-MCP)를 사용하든 CTWS 작제물(무 ITR)에 의해 생성된 패키징 DNA는 약 4개의 수량급이 낮아졌고, 심지어 패키징 RNA는 더 적다.
그 외, ITR이 없는 바이러스 게놈 상의 WPRE의 3’과 SV40 폴리A 신호의 5’ 사이에 RPS(MS2)의 하나의 또는 3개의 복제를 추가하는 것을 통해, 각각 RAAV 전이 유전자 플라스미드, CTWMS 및 CTWM3S를 얻었다. MCP가 없는 경우, CTWS의 게놈 분포 패턴과 같이 CTWMS 및 CTWM3S 작제물은 거의 DNA 또는 RNA 게놈으로 캡시드화될 수 없다. 놀랍게도, DJ 대신 DJ-MCP를 패키징 플라스미드로 사용하여 DNA와 RNA 게놈 사이의 패키징 효율 차이를 현저하게 역전하였고, 절때 다수의 패키징된 게놈은 RNA이다.
CTWS/DJ-MCP에 비해, CTWMS/DJ-MCP 및 CTWM3S/DJ-MCP의 패키징된 RNA 게놈수는 각각 100배 및 400배 높으나, 3자의 DNA 패키징수는 현저한 차이가 없다. 이러한 결과에 따르면, MCP-Rep78/68 융합물은 특이적으로 CTWMS 및 CTWM3S플라스미드의 RNA전사체에 삽입된 RPS, MS2를 인식할 수 있고, 이들의 RNA가 RAAV 입자에 패키징되도록 촉진하며, CTWM3S 작제물에서 RPS의 3개의 복제는 하나의 복제에 비해 더욱 우수한 RNA 패키징 효율을 제공하였다(도 8b).
결론적으로, MS2/MCP쌍을 기존 AAV 패키징 시스템에 도입하여 MCP-Rep78/68 융합물의 존재 하에 MS2를 포함하는 RNA 게놈을 AAV 입자에 패키징함으로써, RAAV 입자를 생성하였다. 원하지 않는 DNA 패키징은 CTWM3S/DJ-MCP를 사용하여 생성된 전체 바이러스 입자군의 약 10%만 차지하였다.
다시 말해서, 인공/이종 RNA 패키징 신호(RPS)- MS2 서열을 그 동종 결합 단백질MCP와 함께 사용하여, 천연 DNA 바이러스 패키징 신호 쌍(즉ITR 및 Rep)을 대체하여, RNA가 다른 DNA 바이러스에 패키징되는 효율을 현저하게 강화하는 동시에 동일한 DNA 바이러스에서 DNA의 고유 패키징을 억제할 수 있다.
실시예 4
RAAV의 원하지 않는 DNA 패키징을 줄이는 확대된 플라스미드 백본
이 실시예는 스터퍼 서열을 플라스미드의 백본에 삽입하여 AAV 전이 유전자 플라스미드의 백본 크기를 증가함으로써 원하지 않는 DNA가 RAAV 입자에 패키징되는 것을 줄일 수 있는 것을 입증한다.
실시예 3에서 RAAV 입자를 위한 CTWMS 및 CTWM3S 작제물은 ITR을 갖지 않고, RAAV 생산에 역방향 패키징이 존재하지 않으나, RAAV 전이 유전자 플라스미드의 상대적으로 작은 사이즈(5-6 kb)가 여전히 원하지 않는 DNA 패키징으로 이어질 수 있다고 추측된다.
따라서, 3266 bp의 비코딩 서열(스터퍼 서열; 이하 서열표 참조)을 CTWM3S의 tdTomato 발현 카세트의 업스트림에 삽입하여, CTWM3S 전이 유전자 플라스미드의 백본 길이를 늘리고, 얻은 작제물을 L-CTWM3S로 명명하였다. 플라스미드의 개략도는 도 9a에 나타낸 바와 같다.
실시예 3에 사용된 기존 AAV 게놈 작제물 pssAAV-tdTomato 및 RAAV 게놈 작제물 CTWM3S을 본 명세서의 대조로 사용하였다. 실시예 3과 동일하게, CTWM3S 또는 L-CTWM3S전이 유전자 플라스미드를 패키징 플라스미드DJ-MCP 및 헬퍼 플라스미드와 HEK293T세포에 공동 형질감염시켜 RAAV 입자를 제조하고, 얻은 RAAV 입자를 정제하며 바이러스 게놈을 정량하였다. 동일한 한쌍의 WPRE 프라이머를 AAV 및 RAAV 입자에 캡시드화된 임의의 DNA 및 RNA 게놈의 검출 및 정량에 사용하고, 바이러스 게놈에서 CAG 프로모터 서열과 특이적인 다른 한쌍의 CAG 프라이머를 Q-PCR에 사용하여, 임의의 기능적 DNA(즉 CAG 프로모터 서열을 함유하고 기능적 전이 유전자 단백질을 발현시킬 수 있는 DNA)를 검출 및 정량하였다.
패키징된 RNA 게놈은 CAG 프라이머로 검출할 수 없는 것을 유의하게 되는데, 이에 CAG 프로모터가 포함되지 않고, CAG 프라이머를 갖는 도면 중의 RNA 칼럼은 백그라운드 RNA 신호를 대표하기 때문이다(도 9b 참조).
놀랍게도, Q-PCR에 어떠한 프라이머를 사용하든 L-CTWM3S 군의DNA 게놈 역가는 모두 CTWM3S 군의 역가보다 약 2배 낮았다(도 9b 및 도 9c 참조). CTWM3S 및 L-CTWM3S 군의RNA 게놈 역가는 거의 동등하였다(도 9c 참조). CTWM3S 및 L-CTWM3S전이 유전자 플라스미드로부터 전사된 RNA에 CAG 프로모터 서열이 없으므로, 패키징된 RNA 게놈은 한쌍의 WPRE 프라이머만으로 검출할 수 밖에 없다(도 9c).
결론적으로, 전이 유전자 플라스미드의 백본 길이를 늘리면 그 RNA 패키징에 영향을 미치지 않고 RAAV 입자의 원하지 않는 DNA 패키징을 줄일 수 있고, 이는 AAV 입자에서 DNA 패키징 시스템의 해체 및 RNA 패키징 시스템의 구축은 2개의 단독적인 라인이고, 상기 긴 스터퍼 서열이 후속 실시예의 RAAV 전이 유전자 플라스미드에 사용되는 것을 보여준다.
실시예 5
별도의 전이 유전자를 위한 RAAV-MS2/MCP 시스템 사용
별도의 전이 유전자에 대한 RAAV-MS2/MCP 시스템의 보편적인 적용성을 검증하고, 관찰된 RNA 패키징이 단지 사용된 리포터 유전자와 관련된 허상이 아닌 것을 보장하기 위해, Cre재조합 효소 발현 카세트를 함유하는 일련의 AAV 및 RAAV 전이 유전자 플라스미드를 생성하였다.
기존 pssAAV-Cre(도 8a 중 pssAAV-tdTomato 작제물 중의 tdTomate 코딩 서열을 Cre 코딩 서열로 대체) 및 대응되는 L-CCWS 작제물(도 8a 중 CTWS 중의 tdTomate 코딩 서열을 Cre 코딩 서열로 대체하고, 실시예 4 중의 스터퍼 서열을 삽입)을 대조로 하고, 여기서 두번째 C는 Cre재조합 효소 전이 유전자를 대표한다. tdTomate 코딩 서열을 Cre 코딩 서열로 대체한 후, 실시예 4의 L-CTWM3S 작제물도 L-CCWM3S 작제물로 다시 설계하였다.
Cre 전이 유전자 플라스미드를 패키징 플라스미드 DJ 또는 DJ-MCP 및 헬퍼 플라스미드와 함께 HEK293T세포에 공동 형질감염시켜, 각각 AAV 및 RAAV 입자를 생성하였다. 얻은 바이러스 입자를 정제하고, 실시예 3에서와 같이 바이러스 게놈을 정량하였다.
AAV-Cre 및 RAAV-Cre의 경우, AAV-tdTomato 및 RAAV-tdTomato와 동일한 바이러스 게놈 분포 결과를 얻었다. pssAAV-Cre의 경우, 대다수 바이러스 입자는 DNA 게놈을 포함하고, DNA 게놈 역가는 RNA 게놈 역가보다 약 4-5개의 수량급이 높았다. L-CCWS의 경우, DNA 및 RNA 패키징 신호 둘 모두가 결핍되기에, DNA 및 RNA 게놈은 거의 캡시드화되지 않았다. L-CCWM3S의 경우, L-CCWS/DJ-MCP에 비해, DJ-MCP의 RNA 패키징이 약 200배 현저히 향상되었고, 원하지 않는 DNA를 포함한 바이러스 입자가 전체 바이러스 입자 군체의 약 1%만 차지하였다(도 10a 및 10b).
DJ-MCP 융합물은 RNA 패키징에 도움이 될 뿐만 아니라, DNA 패키징 능력을 보류하므로, 동시에 DNA 패키징 신호(ITR) 및 RNA 패키징 신호(MS2의 3개의 복제)를 함유한 작제물에서 그 성능을 평가하였고, 상기 작제물은 pssAAV-Cre 작제물의 WPRE와 SV40 폴리A 사이에 MS2의 3개의 복제를 삽입하여 구축되었으며, pssAAV-Cre-MS2X3으로 명명하였다. 결과에 따르면, MCP가 없는 경우, 대다수 바이러스 입자는 패키징된 DNA 게놈을 함유하고, RNA 패키징 신호가 있거나 없을 때 무시 가능한 양의 RNA 게놈이 패키징된다. DJ 대신 DJ-MCP를 패키징 플라스미드로 사용하여 RNA결합 신호와 조합하는 경우, RNA 패키징이 현저히 개선되고, 또한 놀랍게도, 증가된 RNA 패키징은 pssAAV-Cre-MS2X3 작제물의 DNA 패키징에 대해 현저한 영향을 미치지 않았다(도 11b). 다른 관점에서도, DNA 패키징 신호-ITR을 제거하지 않아도, MS2/MCP쌍의 도입은 RNA 패키징을 현저히 증가시킬 수 있는 것으로 나타났고, 이는 AAV 입자에서 DNA 패키징 시스템의 해체 및 RNA 패키징 시스템의 구축은 2개의 단독적인 라인이고, ITR을 제거는 RPS/RBP쌍의 도입을 통해 RNA 패키징을 증가시키는 필수적인 기초가 아닌 것을 나타낸다.
결론적으로, 상기 대상 RAAV-MS2/MCP 시스템은 통상적으로 상술한 Cre재조합 효소와 같은 임의의 전이 유전자에 적용될 수 있다. 흥미롭게도, RAAV-Cre 작제물은 RAAV-tdTomato 작제물에 비해 더욱 우수한 수율을 발생하였다. 어떠한 특정 이론에 얽매이기를 원하지 않지만, 이는 tdTomato mRNA에 비해, Cre mRNA의 2차 구조가 더욱 간단하기 때문일 수 있고, 이는, rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi에서 발견한 예측과 같이 온라인 RNA 2차 구조 예측에 기초한 것이다.
실시예 6
RAAV 생산 시스템의 최적화 및 최적화된 RAAV 입자 특성의 감정
Rep68 및 Rep78 단백질(Rep68/78)의 엔도뉴클레아제 활성은 AAV 입자의 기존 DNA 패키징 과정의 DNA 게놈 복제에 지극히 중요하다. 만약 기능적 trs-엔도뉴클레아제가 없다면, 새로 합성된 바이러스 ssDNA를 방출하여 패키징에 사용할 수 없다. 본 실시예에서 trs-엔도뉴클레아제의 활성을 파괴하여 RAAV 입자의 원하지 않는 DNA 패키징을 더욱 줄일 수 있는지 여부에 대해 연구하였다.
이를 연구하기 위해, 3개의 trs-엔도뉴클레아제 음성 돌연변이체, 즉 DJ-MCP(Y156F, 여기서 Y156F 돌연변이가 Rep68 및 Rep78 단백질의 공유 서열에 위치하고, 즉 Rep68-Y156F 및 Rep78-Y156F), DJ-MCP(KDE-mu) 및 DJ-MCP(EKE-mu)(이하 서열표)를 구축하였다.
우선 DNA 및 RNA 패키징 신호 둘 모두를 함유한 전이 유전자 플라스미드 pssAAV-Cre-MS2X3으로 (실시예 5에서와 같이) DJ-MCP(Y156F)의 DNA 및 RNA 패키징 효율을 평가하였다. DJ 및 DJ-MCP를 패키징 플라스미드 대조로 설정하였다. 실시예 3에서와 같이 바이러스 입자를 생성, 정제 및 적정하였다.
결과에 따르면, DJ-MCP의 Y156F 돌연변이는 ITR에 의해 매개되는 pssAAV-Cre-MS2X3의 DNA 패키징을 현저히 감소시키고, RNA 패키징에 영향을 미치지 않는다.
따라서, 상기 실시예에 나타낸 바와 같이 DNA 패키징 신호 ITR을 제거하는 외에, DNA 패키징 과정에 참여하는 기능적 단백질(예컨대 Rep78/68 단백질)을 변형(예를 들어 돌연변이)시켜, DNA 패키징에 관련된 기능을 약화시키거나 제거하고, 이는 AAV 입자의 기존 DNA 패키징을 줄이거나 억제하는 다른 전략으로 할 수 있다(도 13a).
그 후, 실시예 5의 L-CCWM3S를 RAAV 전이 유전자 플라스미드로 사용하여 pssAAV-Cre-MS2X3을 대체하여, 바이러스 게놈을 제공하였다. trs-엔도뉴클레아제 양성의 DJ-MCP를 DJ-MCP(Y156F)에 대한 대조로 사용하였다. 실시예 3에서와 같이 바이러스 입자를 생성, 정제 및 적정하였다. 여기서 2쌍의 프라이머로 바이러스 게놈을 적정하고, 한 쌍은 상기 WPRE 서열을 타겟팅하는 데 사용되며, 다른 한 쌍(이하 서열표 참조)은 Cre 코딩 서열의 5’ 말단을 타겟팅하는 데 사용된다.
결과에 따르면, Rep78/68 단백질의 Y156F 돌연변이는 원하지 않는 DNA 패키징을 약 10배 줄일 뿐만 아니라, 원하는 RNA 패키징을 약 50% 증가시켰다. Q-PCR에서 사용된 2쌍의 프라이머(즉, WPRE 프라이머쌍 및 Cre프라이머쌍)에 대해, 패키징된 DNA와 RNA 게놈 사이의 패키징 효율 차이 패턴은 거의 같았다(도 12a-12b).
두 가지 다른 trs-엔도뉴클레아제 돌연변이체 DJ-MCP(KDE-mu) 및 DJ-MCP(EKE-mu)를 더 테스트하고, 이는 DJ-MCP(Y156F)와 같은 원하지 않는 DNA 패키징을 줄이는 능력을 가지는 것을 입증하였으나, DJ-MCP(Y156F)만이 개선된 RNA 패키징을 보인다(도 13b).
MCP의 2개의 복제를 Rep 78/68 단백질의 N 말단(MCPx2-Rep78 및 MCPx2-Rep68)에 융합하여 원하지 않는 DNA 패키징을 줄이는 결과를 구현할 수도 있는 것을 추가로 입증하였다(도 13b).
은염색 SDS-PAGE로AAV 및 RAAV 입자의 성분을 분석하고, RAAV 캡시드도 3가지 VP 단백질(VP1, VP2 및 VP3)로 구성되며, 여기서 VP1/2/3 비율은 기존 AAV 입자와 유사하였다(도 12c).
RAAV 입자의 형태를 분석하기 위해, 10 μL의 정제된 AAV 및 RAAV 입자를 300 μm의 카본 피복 피올로폼(Pioloform) 코팅 구리망에 놓고, 실온에서 2분간 인큐베이션하였다. 여분의 샘플을 여지로 흡수하고, 즉시 10 μL의 염색제(3% 포스포텅스텐산)로 대체하며, 2분간 정치시킨 후 다시 흡수하였다. Talos L120C 투과 전자 현미경을 사용하여 샘플을 시각화하였다. RAAV 입자는 형태학적으로 기존 AAV 벡터와 유사하고, 여기서 게놈을 감싼 완전 바이러스 입자는 25-nm의 실심 구체이고, 게놈을 감싸지 않은 중공 바이러스 입자는 25-nm의 도넛형 구조이다(도 12d).
결론적으로, AAV 생산의 DNA 패키징 과정에 참여하는 기능적 단백질(Rep 단백질 포함)의 돌연변이는 그 DNA 패키징 관련 기능을 약화시키거나 제거하고, DNA 패키징 신호ITR를 제거하며, 이는 RAAV 입자의 원하지 않는 DNA 패키징을 줄이거나 억제하는 최선의 전략이다. 생성된 RAAV 입자는 기존 AAV 입자와 유사한 조성 및 형태를 가진다.
실시예 7
기능적 단백질을 발현하는 RAAV 벡터
이 실시예는 대상 RAAV 벡터가 감염성을 가지고, 유전자 전달 벡터로 사용할 수 있는 것을 입증한다.
Cre-loxP 시스템는 고도 민감 시스템이고, 본 발명의 RAAV 벡터의 감염성을 연구하는 데 사용된다. homo-Ai9(loxP-tdTomato-리포터 유전자 시스템 포함) 마우스에서 단리된 마우스 배아섬유아세포(MEF)를 실시예 5에서 정제된 AAV(pssAAV-Cre/DJ) 또는 RAAV(L-CCWM3S/DJ-MCP(Y156F)) 벡터와 밤새 인큐베이션하고, 기존 AAV 벡터에 대한 7 MOI 및 RAAV 벡터에 대한 3개의 MOI를 포함한 감염 다중도(MOI)(감염 기간에 세포당 추가된 비리온수)를 설정하였다. 상기 5’ 말단 Cre 프라이머로 Cre 코딩 서열을 검출하고 정량한 우세 게놈 역가를 감염 역가로 하였다. 다시 말해서, DNA 게놈 역가를 기존 AAV 벡터에 사용하고, RNA 게놈 역가를 RAAV 벡터에 사용하였다.
특히, 감염 약 24시간 전에 Ai9-MEF세포를 약 5 × 104개의 세포/웰로 48웰 플레이트에 접종하였다. 그 후 AAV 벡터 또는 RAAV 벡터를 0.5 mL의 2% FBS 함유 DMEM와 완전히 혼합하였다. 접종된 세포 배지를 제거하고, 그 후 상기 세포를 혼합된 AAV 또는 RAAV 벡터와 함께 37°C에서 밤새 인큐베이션하였다. 상이한 시점에서 감염 세포를 수집하고 RNA 및 DNA를 분석하였다. 상술한 바와 같이, Cre 코딩 서열 5’ 말단을 타겟팅하는 한 쌍의 프라이머는 벡터 유래 특이적 Cre 코딩DNA 및 mRNA를 검출하는 데 사용된다. 감염 후 (p.i) 매일 형광 사진을 촬영하고, 감염 5일 후에 유세포 분석법으로 형광 양성 세포를 정량하였다.
mRNA 분석 결과에 따르면, 감염 2시간 후에, RAAV 감염 세포에서 이미 특이적 mRNA가 검출되었고, 감염 후 6시간에 피크값에 달하고, 그후 저하된다. 기존 AAV 벡터 감염 세포에서, 감염 2 시간 후에 현저한 전사가 검출되지 않았으나, 감염 6 시간 내지 20 시간 후에 전사된 mRNA의 쾌속 증가가 관찰되고, 30 시간에 정체기에 도달하였다. RAAV 벡터의 결과와 반대로, 기존 AAV 벡터 감염 세포에서 mRNA 수준은 정체기에 도달한 후 저하되지 않았다. 모든 샘플에서 Cre mRNA의 복제수는 MOI와 유의한 상관 관계를 가진다(도 14a-14b 및 도 15A). 동시에, mGAPDH mRNA를 기준 전사물(하우스키핑 유전자)로 하여 테스트하고, 예상한 바와 같이, 모든 샘플 중의 mGAPDH mRNA 수준은 차이가 없었다(도 15c).
DNA 결과는 mRNA 결과와 완전히 다르다. 기존 AAV 및 RAAV 벡터는 거의 동일한 DNA복제수 패턴을 가지고, 대부분 DNA 게놈은 감염 2시간 후에 감염된 세포에서 검출되고, 그 후 감염 후 2시간에서 20시간에 다소 증가되는 데 이는 RAAV 감염 세포 중 mRNA 수준의 추세와 매우 유사하였다. 그 후, DNA 수준은 정체기에 도달하거나 천천히 저하된다. Cre DNA의 복제수는 모든 샘플 중의 MOI와도 유의한 상관관계를 가지나, RAAV 감염 세포에서 검출된 Cre DNA 수량은 훨씬 낮고(RAAV-CCWM3S MOI = 100 또는 300군의 DNA 복제수가 AAV-Cre MOI = 1군의DNA 복제수 미만이고, RAAV-CCWM3S MOI = 1000군의 DNA 복제수가 AAV-Cre MOI = 3군의 DNA 복제수 미만이다)(도 14c 및 도 15b). 유사하게, 다른 하나의 하우스키핑 유전자36B4의 DNA 수준을 기준 유전자로 정량하고, 예상대로, 모든 샘플에서 DNA 수준의 현저한 차이가 관찰되지 않았다(도 15d).
AAV-Cre 또는 RAAV-CCWM3S 벡터의 성공적인 감염은 기능적 Cre재조합 효소의 발현을 가져다주고 Ai9-MEF세포 중의 tdTomato발현을 구출하며, 따라서 감염 세포의 형광 사진을 촬영 및 분석하여 tdTomato적색 형광을 발산하는 세포의 계수를 통해 바이러스 벡터의 감염성을 평가하였다. 결과로부터 알 수 있다시피 RAAV-CCWM3S에 의해 생성된 형광 양성 세포의 수량은 10배 낮은 MOI를 갖는 AAV-Cre에 의해 생성된 수량에 상당하다(도 14d). RAAV 감염 세포에서 tdTomato의 낮은 형광 강도는 그 중에 전달된 Cre mRNA의 짧은 수명, 및 제한적인 양의 번역된 Cre재조합 효소가 homo-Ai9-MEF세포에서 tdTomato발현 카세트의 2개의 복제를 구출할 수 없기 때문일 수 있다(도 16).
DNA 역가 및 세포 계수 데이터의 결과를 비교하여, RAAV-CCWM3S 감염 세포의 대부분 tdTomato 적색 형광 신호는 Cre mRNA를 포함한 RAAV 입자에 의해 생성된 것을 보여준다.
결론적으로, 본 발명의 RAAV 벡터는 기능적 Cre mRNA를 세포에 전달하고, 기능적 Cre재조합 효소를 발현시킬 수 있다.
실시예 8
RAAV 입자에 의한 세포로의 기능적 유전자 체외 일시적 전이
실시예 7에서와 같이 AAV-Cre 또는 RAAV-CCWM3S 전달을 거쳐 생성된 Cre 단백질의 정확한 수명을 확정하기 위해, 감염 24시간 전에, 5 × 104개의 세포/웰의 세포 컨플루언스로 Ai9-MEF세포를 접종하고, 그 후 상술한 바와 같이, AAV-Cre(MOI = 300) 또는 RAAV-CCWM3S(MOI = 10,000) 벡터와 밤새 인큐베이션하였다. 감염 후, 여러 시간점에 세포를 수집하고, 세포 수집 전에 형광 사진을 촬영하였다.
AAV-Cre의 경우, Cre 발현은 전4일에 증가하고, 그 후 저하된다. 이에 비해, RAAV-CCWM3S 전이 약 24시간 후에 이미 소량의 Cre이 검출되었고, 2일째 이후에 사라졌다. 이러한 쾌속 발현 및 분해 현상은 전달된 기능적 Cre mRNA의 즉각적인 출현 및 짧은 출연에 인한 것일 수 있다(도 17a 및 17b).
실시예 9
RAAV 입자에 의한 Ai9 마우스로의 기능적 유전자의 생체내 일시적 전이
이 실시예는 RAAV 입자를 생체내 유전자전달 공구로 사용할 수 있고 기능적 Cre재조합 효소를 일시적 발현하는 것을 입증한다.
RAAV 입자의 생체내 감염성을 연구하기 위해, Ai9- 마우스(2.5-4개월)를 마취하고 각각 우측 해마 체내(그 좌표: 전후(A/P)= -1.7 mm, 중 외측(M/L)= -1.0 mm, 배복측(D/V)= -2.1 mm)에 1 μL AAV-Cre(pssAAV-Cre/DJ)(고조제량: 1E9 vg/ 마우스; 저조제량: 3E6 vg/ 마우스) 또는 1 μL RAAV-Cre(L-CCWM3S/DJ-MCP(Y156F))(1E9 Vg/ 마우스)를 주사하였다. 그 외, 본 측청에서 AAV 캡시드-DJ를 대조로 사용하였다.
AAV 또는 RAAV 주사 후 6주에, 마우스를 마취하고 실온에서 pH 7.4의 PBS로 경심 관류한 다음 새로 제조한 인산염 완충제(PB) 중의 차가운 4% 파라포름알데히드(PFA)로 관류하였다. 뇌를 4% PFA에서 밤새 후고정하였다. 고정한 뇌는 탈수 후 OCT로 포매하여 동결 절편에 사용된다. 동결절편기(Leica CM1950)를 사용하여 뇌를 20 μm 두께로 자르고, 절편을 직접 슬라이드에 놓았다. 슬라이드는 60°C에서 1-2 시간 동안 베이킹한 후, PBS에서 5% BSA 혈청으로 1시간 동안 차단하였다. 그 후 실온에서 슬라이드와 항 Cre의 1차 항체(10536; 세포신호기술회사(Cell Signaling Technology); 1 : 800 희석)를 PBS(0.1% Triton-X)의 5% BSA에서 밤새 인큐베이션하였다. PBS로 5회 세척 후, 슬라이드를 PBS의 1% BSA에서 인큐베이션하고, 상기 PBS에 1차항체 및 DAPI에 대한 2차 항체가 함유되어 있다(D3571, Invitrogen). 사용된 2차 항체는 Alexa Fluor 488당나귀 항 토끼 IgG(711-545-152, Jackson ImmunoResearch사)(1 : 1000으로 희석). Nikon C2si+공초점 현미경으로 이미지를 획득하였다.
tdTomato발현 시스템의 형광을 도시하는 이미지에 따르면, RAAV-Cre은 Ai9- 마우스의 해마의 세포를 감염시키고 tdTomato의 발현을 구출하였다. 동일한 조제량에서 RAAV-Cre 조의 감염된 세포수는 AAV-Cre 조보다 적다. 그러나, AAV-Cre 감염의 저조제량군(30배 낮은 조제량)에 비해, RAAV-Cre감염은 더 많은 tdTomato양성 세포를 생성하였다.
매우 흥미롭게도, AAV-Cre 감염의 고조제량 및 저조제량군에서 모두 Cre발현이 용이하게 검출되었지만, 비록 검출된 tdTomato 형광은 한때 Cre의 존재만 입증하나 RAAV-Cre 감염 세포에서 현저한 Cre 발현이 검출되지 않았다.
전반적으로, 동일한 고조제량 1E9 vg/마우스에서 둘 모두의 형광 사진(양성세포 계수)에서 도시된 바와 같이(도 21a와 도 21c 대비), RAAV-Cre은 기존 AAV-Cre에 비해 낮은 형질도입 효율을 가지고, 하나의 성공적으로 형질도입된 AAV DNA 게놈에서 단백질 번역을 위한 복수의 mRNA가 전사될 수 있기 때문이다. Cre발현 수준을 추가로 평가하기 위해, 1E9 vg/ 마우스의 고조제량 AAV-Cre를 3E6 vg/ 마우스의 저조제량으로 저하시켜, AAV-Cre의 형질도입 효율을 RAAV-Cre의 형질도입 효율에 대해 정규화하고(도 21b), 또한 결과에 따르면, 비록 형광 사진(양성 세포 계수)에 도시된 바와 같이, RAAV-Cre의 형질도입 효율이 AAV-Cre의 저조제량조보다 우수하나, AAV-Cre조에 비해, RAAV-Cre 감염 세포에서 Cre 발현이 검출되지 않았고, 이는 RAAV-Cre조의 Cre 발현은 일시적이나 기능적임을 보여준다.
실시예 10
RAAV 시스템의 별도의 RPS/RBP 쌍
실시예 3-8에서 사용된 MS2/MCP 쌍을 제외하고, RAAV 패키징에 대해 별도의 두 쌍의 RNA어댑터/어댑터- 결합 단백질(또는 RNA 패키징 신호/RNA 결합 단백질, 본 명세서 중의 “RPS/RBP”)에 대해 테스트하였다: (1) PP7 결합 부위/PP7박테리오파지 외피 단백질(“PP7/PCP” 또는 “PCP” 또는 “P” 또는 L-CCW P 3S 중의 “P”로 약칭) 및 (2) Com 결합 부위/박테리오파지 COM 단백질(“com/COM” 또는 “COM” 또는 L-CCW C 3S 중의 “C”로 약칭) 천연 바이러스 패키징 시스템 MS2/MCP 및 PP7/PCP와 달리, com/COM은 천연적인 바이러스 패키징 시스템이 아니라 박테리오파지 Mu mom유전자의 전사 개시에서 역할을 하는 전사조절 인자로 알려져 있다.
RPS의 3 개의 복제를 휴대하는 전이 유전자 플라스미드(L-CCW P 3S 및 L-CCW C 3S) 및 그 대응되는 패키징 플라스미드[Rep78-Y156F 및 Rep68-Y156F의 N 말단에 융합된 PP7 박테리오파지 외피 단백질(PCP)을 갖는 DJ-PCP(Y156F) 및 Rep78-Y156F 및 Rep68-Y156F의 N 말단에 융합된 박테리오파지 COM 단백질(COM)을 갖는 DJ-COM(Y156F)]를 구축하였다. 실시예 3에서와 같이 바이러스 입자를 생성, 정제 및 적정하였다.
결과에 따르면, 실시예 3-8의 각 측면에서 잘 입증된 MS2/MCP 쌍과 유사하게, PP7/PCP 및 com/COM 이 두쌍도 RAAV 입자의 현저한 RNA 패키징을 가져다줌으로써(도 18), 각종 RAAV 패키징 시스템의 범위를 확대하였다.
실시예 11
다양한 AAV 혈청형에 대한 RAAV 시스템의 응용
실시예 3-9에서 테스트한 AAV-DJ를 제외한 각종 AAV 혈청형에 대한 본 발명 RAAV 패키징 시스템의 응용을 연구하기 위해, AAV-DJ에서 두쌍의 RPS/RBP(MS2/MCP 및 com/COM) 및 다른 3가지 상이한 AAV 혈청형(AAV5, AAV8 및 AAV9)을 검사하였다. 실시예 3에서와 같이 바이러스 입자를 생성, 정제 및 적정하였다.
RAAV-MS2/MCP 및 RAAV-com/COM 시스템은 모든 4가지 혈청형에서 작동이 양호하여, 이는 RAAV 패키징 시스템이 상이한 AAV 혈청형(즉, AAV-DJ에 한정되지 않음)에 대한 보편 적용성을 보여준다. RBP의 존재 하에, 대응되는 RPS를 함유하는 Cre RNA 게놈은 효과적으로 상응한 RAAV 입자에 캡시드화된다. RNA가 패키징된 RAAV 입자의 수율은 혈청형에 따라 다르나, RAAV5, RAAV8 및 RAAV9 입자에서 모두 RAAV-DJ보다 높은 수율을 갖는다(도 19).
실시예 12
AAP 및 MCP 융합 단백질의 RAAV 수율 향상
통상적으로 , AAV는 그 천연 바이러스 게놈에서 독특한 조립 활성화 단백질(AAP)을 코딩하고, 상기 단백질은 캡시드 조립에 대해 극히 중요하다. 특히, AAP가 캡시드 단백질 안정 및 기능적 AAV 입자 생성에 대해 극히 중요한 것으로 밝혀졌다.
AAP-MCP(AAP의 C 말단에 융합되는 MCP를 가짐) 또는 MCP-AAP(AAP의 N 말단에 융합된 MCP를 가짐) 융합 단백질 발현 카세트를 역방향으로 실시예 6-10에서 사용된 패키징 플라스미드 DJ-MCP(Y156F)의 백본에 삽입하고, 얻은 작제물을 각각 DJ-MCP(Y156F)-AM 및 DJ-MCP(Y156F)-MA로 명명하였다. 그 후, 이러한 작제물은 MCP-Rep78/68(Y156F) 융합물 및 AAP-MCP 또는 MCP-AAP 융합물 둘 모두를 발현하고, 단독 MCP-Rep78/68 융합물에 비해, RNA 패키징을 보조하는 RNA 결합 단백질(RBP)의 양을 증가하였다. 실시예 3에서와 같이 바이러스 입자를 생성, 정제 및 적정하였다.
결과에 따르면, 단독 MCP-Rep78/68 융합물에 비해, DJ-MCP(Y156F)-MA 및 DJ-MCP(Y156F)-AM에 RNA가 패키징되어 있는 RAAV 입자의 수율은 각각 약 65% 및 약 35% 향상되었고(도 20a 및 20b), 이는 RBP가 AAV 입자의 패키징 또는 조립에서 작용을 하는 임의의 기타 단백질과 별도로 융합되거나 관련되어, RAAV 입자의 RNA 패키징을 강화할 수 있는 것을 보여준다.
MCP-Rep78/68 없이 단독으로 AAP-MCP 또는 MCP-AAP를 사용하는 것도 본 발명의 범위 내에 포함된다.
서열
이하 상기 실시예에서 참조한 서열을 포함한 일부 서열을 제공한다.
표 A: RBP의 핵산 서열 및 아미노산 서열
표 B: RPS의 핵산 서열
* 서열 요소는 형식 양식(예를 들어, 볼드체 및/또는 이탤릭체 등)에 근거하여 매칭된다.
표 C: Rep 단백질의 핵산 서열 및 아미노산 서열
* 서열 요소는 형식 양식(예를 들어, 이중 밑줄, 볼드체 및/또는 이탤릭체 글꼴 등)에 근거하여 매칭된다.
표 D: AAP 및 MCP 융합 단백질의 핵산 서열 및 아미노산 서열
* 서열 요소는 형식 양식(예를 들어, 이중 밑줄, 볼드체 및/또는 이탤릭체 글꼴 등)에 근거하여 매칭된다.
표 E: 프라이머 서열
* F 및 R는 각각 포워드 프라이머 및 리버스 프라이머를 나타낸다.
표 F: 스터퍼 서열
참조로서 포함
특허 출원 서류, 과학 문헌, 정부 보고, 사이트 및 본 명세서에 인용된 기타 참조 문원을 포함한 각 특허 문서의 모든 개시 내용은 모든 목적을 위해 참조로서 전체가 본 명세서에 포함된다. 용어가 서로 모순되는 경우, 본 명세서를 기준으로 한다. 본 명세서에 공개한 모든 서열표 또는 SEQ ID NO는 전체가 본 명세서에 포함된다.
본 명세서에서 서술한 내용을 보충하는 예시적 프로그램 또는 기타 세부 사항을 제공하는 의미에서 이하 참조 문헌은 명백하게 참조로서 본 명세서에 포함된다.
비록 본 명세서에서 이미 본 발명의 설명적 실시 형태에 대해 설명하였으나, 본 발명은 설명된 것에 한정되지 않고, 본 분야의 당업자가 본 발명의 범위 또는 취지를 벗어나지 않는 전제 하에서 다양한 기타 변경과 변형을 진행할 수 있는 것을 이해해야 한다.
SEQUENCE LISTING
<110> HUIGENE THERAPEUTICS CO., LTD.
<120> RNA ADENO-ASSOCIATED VIRUS (RAAV) VECTOR AND USES THEREOF
<130> 132045-00619
<150> PCT/CN2021/075874
<151> 2021-02-07
<160> 104
<170> PatentIn version 3.5
<210> 1
<211> 145
<212> DNA
<213> Adeno-associated virus - 2
<400> 1
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcct 145
<210> 2
<211> 113
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 2
tccctctctg cgcgctcgct cgctcactga ggccgcccgg gcaaagcccg ggcgtcgggc 60
gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tgg 113
<210> 3
<211> 138
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 3
tccctctctg cgcgctcgct cgctcactga ggccgcccgg gcaaagcccg ggcgtcgggc 60
gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggactagct 120
ccatcactag gggttcct 138
<210> 4
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 4
ctccatcact aggggttcct 20
<210> 5
<211> 145
<212> DNA
<213> Adeno-associated virus - 2
<400> 5
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gccaa 145
<210> 6
<211> 736
<212> PRT
<213> Adeno-associated virus - 1
<400> 6
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 7
<211> 735
<212> PRT
<213> Adeno-associated virus - 2
<400> 7
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 8
<211> 736
<212> PRT
<213> Adeno-associated virus - 3
<400> 8
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Gly
130 135 140
Ala Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Arg Gly Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Gly Thr Val Asn His Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 9
<211> 736
<212> PRT
<213> Adeno-associated virus - 3
<400> 9
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Val Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Arg Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly
145 150 155 160
Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr
435 440 445
Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser
450 455 460
Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn
485 490 495
Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly
530 535 540
Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln
565 570 575
Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr
580 585 590
Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 10
<211> 734
<212> PRT
<213> Adeno-associated virus - 4
<400> 10
Met Thr Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu
1 5 10 15
Gly Val Arg Glu Trp Trp Ala Leu Gln Pro Gly Ala Pro Lys Pro Lys
20 25 30
Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val
50 55 60
Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln
65 70 75 80
Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Gln Arg Leu Gln Gly Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Leu
115 120 125
Gly Leu Val Glu Gln Ala Gly Glu Thr Ala Pro Gly Lys Lys Arg Pro
130 135 140
Leu Ile Glu Ser Pro Gln Gln Pro Asp Ser Ser Thr Gly Ile Gly Lys
145 150 155 160
Lys Gly Lys Gln Pro Ala Lys Lys Lys Leu Val Phe Glu Asp Glu Thr
165 170 175
Gly Ala Gly Asp Gly Pro Pro Glu Gly Ser Thr Ser Gly Ala Met Ser
180 185 190
Asp Asp Ser Glu Met Arg Ala Ala Ala Gly Gly Ala Ala Val Glu Gly
195 200 205
Gly Gln Gly Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys
210 215 220
Asp Ser Thr Trp Ser Glu Gly His Val Thr Thr Thr Ser Thr Arg Thr
225 230 235 240
Trp Val Leu Pro Thr Tyr Asn Asn His Leu Tyr Lys Arg Leu Gly Glu
245 250 255
Ser Leu Gln Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Asn Trp Gly Met Arg Pro Lys Ala Met Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Thr Ser Asn Gly Glu
305 310 315 320
Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Val Gln Ile Phe Ala Asp
325 330 335
Ser Ser Tyr Glu Leu Pro Tyr Val Met Asp Ala Gly Gln Glu Gly Ser
340 345 350
Leu Pro Pro Phe Pro Asn Asp Val Phe Met Val Pro Gln Tyr Gly Tyr
355 360 365
Cys Gly Leu Val Thr Gly Asn Thr Ser Gln Gln Gln Thr Asp Arg Asn
370 375 380
Ala Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly
385 390 395 400
Asn Asn Phe Glu Ile Thr Tyr Ser Phe Glu Lys Val Pro Phe His Ser
405 410 415
Met Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile
420 425 430
Asp Gln Tyr Leu Trp Gly Leu Gln Ser Thr Thr Thr Gly Thr Thr Leu
435 440 445
Asn Ala Gly Thr Ala Thr Thr Asn Phe Thr Lys Leu Arg Pro Thr Asn
450 455 460
Phe Ser Asn Phe Lys Lys Asn Trp Leu Pro Gly Pro Ser Ile Lys Gln
465 470 475 480
Gln Gly Phe Ser Lys Thr Ala Asn Gln Asn Tyr Lys Ile Pro Ala Thr
485 490 495
Gly Ser Asp Ser Leu Ile Lys Tyr Glu Thr His Ser Thr Leu Asp Gly
500 505 510
Arg Trp Ser Ala Leu Thr Pro Gly Pro Pro Met Ala Thr Ala Gly Pro
515 520 525
Ala Asp Ser Lys Phe Ser Asn Ser Gln Leu Ile Phe Ala Gly Pro Lys
530 535 540
Gln Asn Gly Asn Thr Ala Thr Val Pro Gly Thr Leu Ile Phe Thr Ser
545 550 555 560
Glu Glu Glu Leu Ala Ala Thr Asn Ala Thr Asp Thr Asp Met Trp Gly
565 570 575
Asn Leu Pro Gly Gly Asp Gln Ser Asn Ser Asn Leu Pro Thr Val Asp
580 585 590
Arg Leu Thr Ala Leu Gly Ala Val Pro Gly Met Val Trp Gln Asn Arg
595 600 605
Asp Ile Tyr Tyr Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp
610 615 620
Gly His Phe His Pro Ser Pro Leu Ile Gly Gly Phe Gly Leu Lys His
625 630 635 640
Pro Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Ala Asn Pro
645 650 655
Ala Thr Thr Phe Ser Ser Thr Pro Val Asn Ser Phe Ile Thr Gln Tyr
660 665 670
Ser Thr Gly Gln Val Ser Val Gln Ile Asp Trp Glu Ile Gln Lys Glu
675 680 685
Arg Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Tyr Gly
690 695 700
Gln Gln Asn Ser Leu Leu Trp Ala Pro Asp Ala Ala Gly Lys Tyr Thr
705 710 715 720
Glu Pro Arg Ala Ile Gly Thr Arg Tyr Leu Thr His His Leu
725 730
<210> 11
<211> 724
<212> PRT
<213> Adeno-associated virus - 5
<400> 11
Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu
1 5 10 15
Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys
20 25 30
Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val
50 55 60
Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu
65 70 75 80
Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe
115 120 125
Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile
130 135 140
Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser
145 150 155 160
Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln
165 170 175
Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr
180 185 190
Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala
195 200 205
Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp
210 215 220
Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro
225 230 235 240
Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp
245 250 255
Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr
305 310 315 320
Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp
325 330 335
Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys
340 345 350
Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr
355 360 365
Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser
370 375 380
Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn
385 390 395 400
Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser
405 410 415
Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp
420 425 430
Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln
435 440 445
Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp
450 455 460
Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly
465 470 475 480
Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu
485 490 495
Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr
500 505 510
Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile
515 520 525
Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu
530 535 540
Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg
545 550 555 560
Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser
565 570 575
Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro
580 585 590
Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp
595 600 605
Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met
610 615 620
Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn
625 630 635 640
Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser
645 650 655
Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu
660 665 670
Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln
675 680 685
Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp
690 695 700
Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu
705 710 715 720
Thr Arg Pro Leu
<210> 12
<211> 736
<212> PRT
<213> Adeno-associated virus - 6
<400> 12
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 13
<211> 737
<212> PRT
<213> Adeno-associated virus - 7
<400> 13
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Ala Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Ser Val Gly Ser Gly Thr Val Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn
210 215 220
Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Ser Glu Thr Ala Gly Ser Thr Asn Asp Asn
260 265 270
Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Lys Leu Arg Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Ile Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn
370 375 380
Gly Ser Gln Ser Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr Ser
405 410 415
Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ala
435 440 445
Arg Thr Gln Ser Asn Pro Gly Gly Thr Ala Gly Asn Arg Glu Leu Gln
450 455 460
Phe Tyr Gln Gly Gly Pro Ser Thr Met Ala Glu Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Phe Arg Gln Gln Arg Val Ser Lys Thr Leu Asp
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Asp Arg Phe Phe Pro Ser Ser Gly Val Leu Ile
530 535 540
Phe Gly Lys Thr Gly Ala Thr Asn Lys Thr Thr Leu Glu Asn Val Leu
545 550 555 560
Met Thr Asn Glu Glu Glu Ile Arg Pro Thr Asn Pro Val Ala Thr Glu
565 570 575
Glu Tyr Gly Ile Val Ser Ser Asn Leu Gln Ala Ala Asn Thr Ala Ala
580 585 590
Gln Thr Gln Val Val Asn Asn Gln Gly Ala Leu Pro Gly Met Val Trp
595 600 605
Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro
610 615 620
His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly
625 630 635 640
Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro
645 650 655
Ala Asn Pro Pro Glu Val Phe Thr Pro Ala Lys Phe Ala Ser Phe Ile
660 665 670
Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
675 680 685
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser
690 695 700
Asn Phe Glu Lys Gln Thr Gly Val Asp Phe Ala Val Asp Ser Gln Gly
705 710 715 720
Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn
725 730 735
Leu
<210> 14
<211> 738
<212> PRT
<213> Adeno-associated virus - 8
<400> 14
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro
180 185 190
Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly
450 455 460
Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile
530 535 540
Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala
580 585 590
Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 15
<211> 736
<212> PRT
<213> Adeno-associated virus - 9
<400> 15
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 16
<211> 738
<212> PRT
<213> Adeno-associated virus - 10
<400> 16
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Glu Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr
405 410 415
Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu
450 455 460
Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met
530 535 540
Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Ala Asn Thr Gly
580 585 590
Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu
705 710 715 720
Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 17
<211> 733
<212> PRT
<213> Adeno-associated virus - 11
<400> 17
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Leu Glu Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly Lys
145 150 155 160
Lys Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Glu Glu Asp Thr
165 170 175
Gly Ala Gly Asp Gly Pro Pro Glu Gly Ser Asp Thr Ser Ala Met Ser
180 185 190
Ser Asp Ile Glu Met Arg Ala Ala Pro Gly Gly Asn Ala Val Asp Ala
195 200 205
Gly Gln Gly Ser Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys
210 215 220
Asp Ser Thr Trp Ser Glu Gly Lys Val Thr Thr Thr Ser Thr Arg Thr
225 230 235 240
Trp Val Leu Pro Thr Tyr Asn Asn His Leu Tyr Leu Arg Leu Gly Thr
245 250 255
Thr Ser Ser Ser Asn Thr Tyr Asn Gly Phe Ser Thr Pro Trp Gly Tyr
260 265 270
Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln
275 280 285
Arg Leu Ile Asn Asn Asn Trp Gly Leu Arg Pro Lys Ala Met Arg Val
290 295 300
Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Thr Ser Asn Gly Glu
305 310 315 320
Thr Thr Val Ala Asn Asn Leu Thr Ser Thr Val Gln Ile Phe Ala Asp
325 330 335
Ser Ser Tyr Glu Leu Pro Tyr Val Met Asp Ala Gly Gln Glu Gly Ser
340 345 350
Leu Pro Pro Phe Pro Asn Asp Val Phe Met Val Pro Gln Tyr Gly Tyr
355 360 365
Cys Gly Ile Val Thr Gly Glu Asn Gln Asn Gln Thr Asp Arg Asn Ala
370 375 380
Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn
385 390 395 400
Asn Phe Glu Met Ala Tyr Asn Phe Glu Lys Val Pro Phe His Ser Met
405 410 415
Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Leu Asp
420 425 430
Gln Tyr Leu Trp His Leu Gln Ser Thr Thr Ser Gly Glu Thr Leu Asn
435 440 445
Gln Gly Asn Ala Ala Thr Thr Phe Gly Lys Ile Arg Ser Gly Asp Phe
450 455 460
Ala Phe Tyr Arg Lys Asn Trp Leu Pro Gly Pro Cys Val Lys Gln Gln
465 470 475 480
Arg Phe Ser Lys Thr Ala Ser Gln Asn Tyr Lys Ile Pro Ala Ser Gly
485 490 495
Gly Asn Ala Leu Leu Lys Tyr Asp Thr His Tyr Thr Leu Asn Asn Arg
500 505 510
Trp Ser Asn Ile Ala Pro Gly Pro Pro Met Ala Thr Ala Gly Pro Ser
515 520 525
Asp Gly Asp Phe Ser Asn Ala Gln Leu Ile Phe Pro Gly Pro Ser Val
530 535 540
Thr Gly Asn Thr Thr Thr Ser Ala Asn Asn Leu Leu Phe Thr Ser Glu
545 550 555 560
Glu Glu Ile Ala Ala Thr Asn Pro Arg Asp Thr Asp Met Phe Gly Gln
565 570 575
Ile Ala Asp Asn Asn Gln Asn Ala Thr Thr Ala Pro Ile Thr Gly Asn
580 585 590
Val Thr Ala Met Gly Val Leu Pro Gly Met Val Trp Gln Asn Arg Asp
595 600 605
Ile Tyr Tyr Gln Gly Pro Ile Trp Ala Lys Ile Pro His Ala Asp Gly
610 615 620
His Phe His Pro Ser Pro Leu Ile Gly Gly Phe Gly Leu Lys His Pro
625 630 635 640
Pro Pro Gln Ile Phe Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ala
645 650 655
Thr Thr Phe Thr Ala Ala Arg Val Asp Ser Phe Ile Thr Gln Tyr Ser
660 665 670
Thr Gly Gln Val Ala Val Gln Ile Glu Trp Glu Ile Glu Lys Glu Arg
675 680 685
Ser Lys Arg Trp Asn Pro Glu Val Gln Phe Thr Ser Asn Tyr Gly Asn
690 695 700
Gln Ser Ser Met Leu Trp Ala Pro Asp Thr Thr Gly Lys Tyr Thr Glu
705 710 715 720
Pro Arg Val Ile Gly Ser Arg Tyr Leu Thr Asn His Leu
725 730
<210> 18
<211> 742
<212> PRT
<213> Adeno-associated virus - 12
<400> 18
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Lys Gln Leu Glu Gln Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Gln Arg Leu Ala Thr Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Leu Glu Lys Thr Pro Asn Arg Pro Thr Asn Pro Asp Ser Gly Lys
145 150 155 160
Ala Pro Ala Lys Lys Lys Gln Lys Asp Gly Glu Pro Ala Asp Ser Ala
165 170 175
Arg Arg Thr Leu Asp Phe Glu Asp Ser Gly Ala Gly Asp Gly Pro Pro
180 185 190
Glu Gly Ser Ser Ser Gly Glu Met Ser His Asp Ala Glu Met Arg Ala
195 200 205
Ala Pro Gly Gly Asn Ala Val Glu Ala Gly Gln Gly Ala Asp Gly Val
210 215 220
Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp Ser Glu Gly
225 230 235 240
Arg Val Thr Thr Thr Ser Thr Arg Thr Trp Val Leu Pro Thr Tyr Asn
245 250 255
Asn His Leu Tyr Leu Arg Ile Gly Thr Thr Ala Asn Ser Asn Thr Tyr
260 265 270
Asn Gly Phe Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Leu Arg Pro Lys Ser Met Arg Val Lys Ile Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Thr Ser Asn Gly Glu Thr Thr Val Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Ile Phe Ala Asp Ser Thr Tyr Glu Leu Pro Tyr
340 345 350
Val Met Asp Ala Gly Gln Glu Gly Ser Phe Pro Pro Phe Pro Asn Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Cys Gly Val Val Thr Gly Lys
370 375 380
Asn Gln Asn Gln Thr Asp Arg Asn Ala Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Val Ser Tyr Gln
405 410 415
Phe Glu Lys Val Pro Phe His Ser Met Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Met Met Asn Pro Leu Leu Asp Gln Tyr Leu Trp His Leu Gln
435 440 445
Ser Thr Thr Thr Gly Asn Ser Leu Asn Gln Gly Thr Ala Thr Thr Thr
450 455 460
Tyr Gly Lys Ile Thr Thr Gly Asp Phe Ala Tyr Tyr Arg Lys Asn Trp
465 470 475 480
Leu Pro Gly Ala Cys Ile Lys Gln Gln Lys Phe Ser Lys Asn Ala Asn
485 490 495
Gln Asn Tyr Lys Ile Pro Ala Ser Gly Gly Asp Ala Leu Leu Lys Tyr
500 505 510
Asp Thr His Thr Thr Leu Asn Gly Arg Trp Ser Asn Met Ala Pro Gly
515 520 525
Pro Pro Met Ala Thr Ala Gly Ala Gly Asp Ser Asp Phe Ser Asn Ser
530 535 540
Gln Leu Ile Phe Ala Gly Pro Asn Pro Ser Gly Asn Thr Thr Thr Ser
545 550 555 560
Ser Asn Asn Leu Leu Phe Thr Ser Glu Glu Glu Ile Ala Thr Thr Asn
565 570 575
Pro Arg Asp Thr Asp Met Phe Gly Gln Ile Ala Asp Asn Asn Gln Asn
580 585 590
Ala Thr Thr Ala Pro His Ile Ala Asn Leu Asp Ala Met Gly Ile Val
595 600 605
Pro Gly Met Val Trp Gln Asn Arg Asp Ile Tyr Tyr Gln Gly Pro Ile
610 615 620
Trp Ala Lys Val Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu
625 630 635 640
Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Phe Ile Lys
645 650 655
Asn Thr Pro Val Pro Ala Asn Pro Asn Thr Thr Phe Ser Ala Ala Arg
660 665 670
Ile Asn Ser Phe Leu Thr Gln Tyr Ser Thr Gly Gln Val Ala Val Gln
675 680 685
Ile Asp Trp Glu Ile Gln Lys Glu His Ser Lys Arg Trp Asn Pro Glu
690 695 700
Val Gln Phe Thr Ser Asn Tyr Gly Thr Gln Asn Ser Met Leu Trp Ala
705 710 715 720
Pro Asp Asn Ala Gly Asn Tyr His Glu Leu Arg Ala Ile Gly Ser Arg
725 730 735
Phe Leu Thr His His Leu
740
<210> 19
<211> 733
<212> PRT
<213> Adeno-associated virus - 13
<400> 19
Met Thr Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser Glu
1 5 10 15
Gly Val Arg Glu Trp Trp Ala Leu Gln Pro Gly Ala Pro Lys Pro Lys
20 25 30
Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro Gly
35 40 45
Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro Val
50 55 60
Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp Gln
65 70 75 80
Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp
85 90 95
Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly Asn
100 105 110
Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro Leu
115 120 125
Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg Pro
130 135 140
Val Glu Gln Ser Pro Ala Glu Pro Asp Ser Ser Ser Gly Ile Gly Lys
145 150 155 160
Ser Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr Gly
165 170 175
Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro Ala
180 185 190
Ala Pro Ser Gly Val Gly Ser Thr Thr Met Ala Ser Gly Gly Gly Ala
195 200 205
Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser Ser
210 215 220
Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile Thr
225 230 235 240
Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu Tyr
245 250 255
Lys Gln Ile Ser Ser Gln Ser Gly Ala Thr Asn Asp Asn His Tyr Phe
260 265 270
Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Cys
275 280 285
His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly
290 295 300
Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val Lys
305 310 315 320
Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu Thr
325 330 335
Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr Val
340 345 350
Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp Val
355 360 365
Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser Gln
370 375 380
Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln
385 390 395 400
Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu Asp
405 410 415
Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg Leu
420 425 430
Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr Gln
435 440 445
Thr Ala Ser Gly Thr Gln Gln Ser Arg Leu Leu Phe Ser Gln Ala Gly
450 455 460
Pro Thr Ser Met Ser Leu Gln Ala Lys Asn Trp Leu Pro Gly Pro Cys
465 470 475 480
Tyr Arg Gln Gln Arg Leu Ser Lys Gln Ala Asn Asp Asn Asn Asn Ser
485 490 495
Asn Phe Pro Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly Arg Asp
500 505 510
Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp Asp Lys
515 520 525
Glu Lys Phe Phe Pro Met His Gly Thr Leu Ile Phe Gly Lys Glu Gly
530 535 540
Thr Asn Ala Asn Asn Ala Asp Leu Glu Asn Val Met Ile Thr Asp Glu
545 550 555 560
Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr Gly Thr
565 570 575
Val Ser Asn Asn Leu Gln Asn Ser Asn Ala Gly Pro Thr Thr Gly Thr
580 585 590
Val Asn His Gln Gly Ala Leu Pro Gly Met Val Trp Gln Asp Arg Asp
595 600 605
Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly
610 615 620
His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro
625 630 635 640
Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Pro
645 650 655
Thr Asn Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser
660 665 670
Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn
675 680 685
Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys
690 695 700
Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu
705 710 715 720
Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730
<210> 20
<211> 737
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 20
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ala Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr Thr
405 410 415
Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Arg Thr Gln Thr Thr Gly Gly Thr Thr Asn Thr Gln Thr Leu Gly Phe
450 455 460
Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp Leu
465 470 475 480
Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp
485 490 495
Asn Asn Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu
500 505 510
Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His
515 520 525
Lys Asp Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe
530 535 540
Gly Lys Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met
545 550 555 560
Ile Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu
565 570 575
Gln Tyr Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala
580 585 590
Ala Thr Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp
595 600 605
Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro
610 615 620
His Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly
625 630 635 640
Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro
645 650 655
Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe Ile
660 665 670
Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu
675 680 685
Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser
690 695 700
Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu Gly
705 710 715 720
Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn
725 730 735
Leu
<210> 21
<211> 743
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 21
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Arg Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Asp Gly Thr Leu Ala Val
580 585 590
Pro Phe Lys Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile
595 600 605
Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro
610 615 620
Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser Pro
625 630 635 640
Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile Leu Ile
645 650 655
Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe Asn Lys Asp
660 665 670
Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val
675 680 685
Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro
690 695 700
Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe
705 710 715 720
Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr
725 730 735
Arg Tyr Leu Thr Arg Asn Leu
740
<210> 22
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 22
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Asn Thr Met Ala Ala Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Gly Ser Thr Asn Asp Asn Thr
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Lys Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg
435 440 445
Thr Gln Thr Thr Ser Gly Thr Ala Gly Asn Arg Thr Leu Gln Phe Ser
450 455 460
Gln Ala Gly Pro Ser Ser Met Ala Asn Gln Ala Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Thr Asn Gln Asn
485 490 495
Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Thr His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Leu Ile Phe Gly
530 535 540
Lys Gln Gly Ala Gly Asn Ser Asn Val Asp Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Glu
565 570 575
Tyr Gly Thr Val Ala Thr Asn Leu Gln Ser Ala Asn Thr Ala Pro Ala
580 585 590
Thr Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Thr Asn Val Asp Phe Ala Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 23
<211> 736
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 23
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Asn Thr Met Ala Ala Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Gly Ser Thr Asn Asp Asn Thr
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Lys Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg
435 440 445
Thr Gln Thr Thr Ser Gly Thr Ala Gly Asn Arg Thr Leu Gln Phe Ser
450 455 460
Gln Ala Gly Pro Ser Ser Met Ala Asn Gln Ala Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Thr Asn Gln Asn
485 490 495
Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His Leu Asn
500 505 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Thr His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Leu Ile Phe Gly
530 535 540
Lys Gln Gly Ala Gly Asn Ser Asn Val Asp Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Glu
565 570 575
Tyr Gly Thr Val Ala Thr Asn Leu Gln Ser Ala Asn Thr Ala Pro Ala
580 585 590
Thr Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Asn Lys Ser Thr Asn Val Asp Phe Ala Val Asp Thr Asn Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 24
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 24
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Thr
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Leu Ala Leu Gly Glu
580 585 590
Thr Thr Arg Pro Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
595 600 605
Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln
610 615 620
Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro
625 630 635 640
Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile
645 650 655
Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr Phe Ser
660 665 670
Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val
675 680 685
Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp
690 695 700
Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Ile Asn Val
705 710 715 720
Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg Pro Ile
725 730 735
Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 25
<211> 143
<212> DNA
<213> Adeno-associated virus - 1
<400> 25
ttgcccactc cctctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcag agagggagtg 120
ggcaactcca tcactagggg taa 143
<210> 26
<211> 143
<212> DNA
<213> Adeno-associated virus - 1
<400> 26
ttacccctag tgatggagtt gcccactccc tctctgcgcg ctcgctcgct cggtggggcc 60
tgcggaccaa aggtccgcag acggcagagc tctgctctgc cggccccacc gagcgagcga 120
gcgcgcagag agggagtggg caa 143
<210> 27
<211> 145
<212> DNA
<213> Adeno-associated virus - 2
<400> 27
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcct 145
<210> 28
<211> 145
<212> DNA
<213> Adeno-associated virus - 2
<400> 28
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gccaa 145
<210> 29
<211> 143
<212> DNA
<213> Adeno-associated virus - 3
<400> 29
ttggccactc cctctatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgcat agagggagtg 120
gccaactcca tcactagagg tat 143
<210> 30
<211> 143
<212> DNA
<213> Adeno-associated virus - 3
<400> 30
atacctctag tgatggagtt ggccactccc tctatgcgca ctcgctcgct cggtggggcc 60
tggcgaccaa aggtcgccag acggacgtgc tttgcacgtc cggccccacc gagcgagcga 120
gtgcgcatag agggagtggc caa 143
<210> 31
<211> 146
<212> DNA
<213> Adeno-associated virus - 4
<400> 31
ttggccactc cctctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agagggagtg 120
gccaactcca tcatctaggt ttgccc 146
<210> 32
<211> 144
<212> DNA
<213> Adeno-associated virus - 4
<400> 32
ggcaaaccag atgatggagt tggccacatt agctatgcgc gctcgctcac tcactcggcc 60
ctggagacca aaggtctcca gactgccggc ctctggccgg cagggccgag tgagtgagcg 120
agcgcgcata gagggagtgg ccaa 144
<210> 33
<211> 167
<212> DNA
<213> Adeno-associated virus - 5
<400> 33
ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacaggg gggagagtgc cacactctca agcaaggggg ttttgta 167
<210> 34
<211> 167
<212> DNA
<213> Adeno-associated virus - 5
<400> 34
tacaaaacct ccttgcttga gagtgtggca ctctcccccc tgtcgcgttc gctcgctcgc 60
tggctcgttt gggggggtgg cagctcaaag agctgccaga cgacggccct ctggccgtcg 120
cccccccaaa cgagccagcg agcgagcgaa cgcgacaggg gggagag 167
<210> 35
<211> 145
<212> DNA
<213> Adeno-associated virus - 6
<400> 35
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcct 145
<210> 36
<211> 143
<212> DNA
<213> Adeno-associated virus - 6
<400> 36
atacccctag tgatggagtt gcccactccc tctatgcgcg ctcgctcgct cggtggggcc 60
ggcagagcag agctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga 120
gcgcgcatag agggagtggg caa 143
<210> 37
<211> 145
<212> DNA
<213> Adeno-associated virus - 7
<400> 37
ttggccactc cctctatgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcat agagggagtg 120
gccaactcca tcactagggg taccg 145
<210> 38
<211> 145
<212> DNA
<213> Adeno-associated virus - 7
<400> 38
cggtacccct agtgatggag ttggccactc cctctatgcg cgctcgctcg ctcggtgggg 60
cctgcggacc aaaggtccgc agacggcaga gctctgctct gccggcccca ccgagcgagc 120
gagcgcgcat agagggagtg gccaa 145
<210> 39
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 39
gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg 60
ggcactgaca attccgtggt 80
<210> 40
<211> 289
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 40
Met Pro Leu Ile Phe Lys Ile Gly Tyr Asn Val Ile Pro Leu Gln Asp
1 5 10 15
Val Ile Leu Pro Thr Pro Ser Ser Lys Val Leu Lys Tyr Leu Ile Gln
20 25 30
Ser Gly Lys Leu Ile Pro Ser Leu Lys Asp Leu Ile Thr Ser Arg Asp
35 40 45
Lys Tyr Lys Pro Ile Phe Ile Ser His Leu Gly Phe Asn Gln Arg Arg
50 55 60
Ile Phe Gln Thr Asn Gly Asn Leu Lys Thr Ile Thr Lys Gly Ser Arg
65 70 75 80
Leu Ser Ser Ile Ile Ala Phe Ser Thr Gln Ala Asn Val Leu Ser Glu
85 90 95
Val Ala Asp Glu Gly Ile Phe Glu Thr Val Tyr Gly Lys Phe His Ile
100 105 110
Met Ile Glu Ser Ile Glu Ile Val Glu Val Glu Lys Leu Lys Glu Glu
115 120 125
Val Glu Lys His Met Asn Asp Asn Ile Arg Val Arg Phe Val Ser Pro
130 135 140
Thr Leu Leu Ser Ser Lys Val Leu Leu Pro Pro Ser Leu Ser Glu Arg
145 150 155 160
Tyr Lys Lys Ile His Ala Gly Tyr Ser Thr Leu Pro Ser Val Gly Leu
165 170 175
Ile Val Ala Tyr Ala Tyr Asn Val Tyr Cys Asn Leu Ile Gly Lys Lys
180 185 190
Glu Val Glu Val Arg Ala Phe Lys Phe Gly Ile Leu Ser Asn Ala Leu
195 200 205
Ser Arg Ile Ile Gly Tyr Asp Leu His Pro Val Thr Val Ala Ile Gly
210 215 220
Glu Asp Ser Lys Gly Asn Leu Arg Lys Ala Arg Gly Val Met Gly Trp
225 230 235 240
Ile Glu Phe Asp Ile Pro Asp Glu Arg Leu Lys Arg Arg Ala Leu Asn
245 250 255
Tyr Leu Leu Thr Ser Ser Tyr Leu Gly Ile Gly Arg Ser Arg Gly Ile
260 265 270
Gly Phe Gly Glu Ile Arg Leu Glu Phe Arg Lys Ile Glu Glu Lys Glu
275 280 285
Gly
<210> 41
<211> 218
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 41
Met Asp Leu Glu Tyr Met His Ile Ser Tyr Pro Asn Ile Leu Leu Asn
1 5 10 15
Met Arg Asp Gly Ser Lys Leu Arg Gly Tyr Phe Ala Lys Lys Tyr Ile
20 25 30
Asp Glu Glu Ile Val His Asn His Arg Asp Asn Ala Phe Val Tyr Lys
35 40 45
Tyr Pro Gln Ile Gln Phe Lys Ile Ile Asp Arg Ser Pro Leu Ile Ile
50 55 60
Gly Ile Gly Ser Leu Gly Ile Asn Phe Leu Glu Ser Lys Arg Ile Phe
65 70 75 80
Phe Glu Lys Glu Leu Ile Ile Ser Asn Asp Thr Asn Asp Ile Thr Glu
85 90 95
Val Asn Val His Lys Asp Met Asp His Phe Gly Thr Thr Asp Lys Ile
100 105 110
Leu Lys Tyr Gln Phe Lys Thr Pro Trp Met Ala Leu Asn Ala Lys Asn
115 120 125
Ser Glu Ile Tyr Lys Asn Ser Asp Glu Ile Asp Arg Glu Glu Phe Leu
130 135 140
Lys Arg Val Leu Ile Gly Asn Ile Leu Ser Met Ser Lys Ser Leu Gly
145 150 155 160
Tyr Thr Ile Glu Glu Lys Leu Lys Val Lys Ile Asn Leu Lys Glu Val
165 170 175
Pro Val Lys Phe Lys Asn Gln Asn Met Val Gly Phe Arg Gly Glu Phe
180 185 190
Tyr Ile Asn Phe Asp Ile Pro Gln Tyr Leu Gly Ile Gly Arg Asn Val
195 200 205
Ser Arg Gly Phe Gly Thr Val Val Lys Val
210 215
<210> 42
<211> 242
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 42
Met Tyr Arg Ser Arg Asp Phe Tyr Val Arg Val Ser Gly Gln Arg Ala
1 5 10 15
Leu Phe Thr Asn Pro Ala Thr Lys Gly Gly Ser Glu Arg Ser Ser Tyr
20 25 30
Ser Val Pro Thr Arg Gln Ala Leu Asn Gly Ile Val Asp Ala Ile Tyr
35 40 45
Tyr Lys Pro Thr Phe Thr Asn Ile Val Thr Glu Val Lys Val Ile Asn
50 55 60
Gln Ile Gln Thr Glu Leu Gln Gly Val Arg Ala Leu Leu His Asp Tyr
65 70 75 80
Ser Ala Asp Leu Ser Tyr Val Ser Tyr Leu Ser Asp Val Val Tyr Leu
85 90 95
Ile Lys Phe His Phe Val Trp Asn Glu Asp Arg Lys Asp Leu Asn Ser
100 105 110
Asp Arg Leu Pro Ala Lys His Glu Ala Ile Met Glu Arg Ser Ile Arg
115 120 125
Lys Gly Gly Arg Arg Asp Val Phe Leu Gly Thr Arg Glu Cys Leu Gly
130 135 140
Leu Leu Asp Asp Ile Ser Gln Glu Glu Tyr Glu Thr Thr Val Ser Tyr
145 150 155 160
Tyr Asn Gly Val Asn Ile Asp Leu Gly Ile Met Phe His Ser Phe Ala
165 170 175
Tyr Pro Lys Asp Lys Lys Thr Pro Leu Lys Ser Tyr Phe Thr Lys Thr
180 185 190
Val Met Lys Asn Gly Val Ile Thr Phe Lys Ala Gln Ser Glu Cys Asp
195 200 205
Ile Val Asn Thr Leu Ser Ser Tyr Ala Phe Lys Ala Pro Glu Glu Ile
210 215 220
Lys Ser Val Asn Asp Glu Cys Met Glu Tyr Asp Ala Met Glu Lys Gly
225 230 235 240
Glu Asn
<210> 43
<211> 236
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 43
Met Arg Asn Glu Val Gln Phe Glu Leu Phe Gly Asp Tyr Ala Leu Phe
1 5 10 15
Thr Asp Pro Leu Thr Lys Ile Gly Gly Glu Lys Leu Ser Tyr Ser Val
20 25 30
Pro Thr Tyr Gln Ala Leu Lys Gly Ile Ala Glu Ser Ile Tyr Trp Lys
35 40 45
Pro Thr Ile Val Phe Val Ile Asp Glu Leu Arg Val Met Lys Pro Ile
50 55 60
Gln Met Glu Ser Lys Gly Val Arg Pro Ile Glu Tyr Gly Gly Gly Asn
65 70 75 80
Thr Leu Ala His Tyr Thr Tyr Leu Lys Asp Val His Tyr Gln Val Lys
85 90 95
Ala His Phe Glu Phe Asn Leu His Arg Pro Asp Leu Ala Phe Asp Arg
100 105 110
Asn Glu Gly Lys His Tyr Ser Ile Leu Gln Arg Ser Leu Lys Ala Gly
115 120 125
Gly Arg Arg Asp Ile Phe Leu Gly Ala Arg Glu Cys Gln Gly Tyr Val
130 135 140
Ala Pro Cys Glu Phe Gly Ser Gly Asp Gly Phe Tyr Asp Gly Gln Gly
145 150 155 160
Lys Tyr His Leu Gly Thr Met Val His Gly Phe Asn Tyr Pro Asp Glu
165 170 175
Thr Gly Gln His Gln Leu Asp Val Arg Leu Trp Ser Ala Val Met Glu
180 185 190
Asn Gly Tyr Ile Gln Phe Pro Arg Pro Glu Asp Cys Pro Ile Val Arg
195 200 205
Pro Val Lys Glu Met Glu Pro Lys Ile Phe Asn Pro Asp Asn Val Gln
210 215 220
Ser Ala Glu Gln Leu Leu His Asp Leu Gly Gly Glu
225 230 235
<210> 44
<211> 260
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 44
Met Pro Asn Asp Pro Tyr Ser Leu Tyr Ser Ile Val Ile Glu Leu Gly
1 5 10 15
Ala Ala Glu Lys Gly Phe Pro Thr Gly Ile Leu Gly Arg Ser Leu His
20 25 30
Ser Gln Val Leu Gln Trp Phe Lys Gln Asp Asn Pro Phe Leu Ala Thr
35 40 45
Glu Leu His Gln Ser Gln Ile Ser Pro Phe Ser Ile Ser Pro Leu Met
50 55 60
Gly Lys Arg His Ala Lys Leu Thr Lys Ala Gly Asp Arg Leu Phe Phe
65 70 75 80
Arg Ile Cys Leu Leu Arg Gly Asp Leu Leu Gln Pro Leu Leu Asn Gly
85 90 95
Ile Glu Gln Thr Val Asn Gln Ser Val Cys Leu Asp Lys Phe Arg Phe
100 105 110
Arg Leu Cys Gln Thr His Ile Leu Pro Gly Ser His Pro Leu Ala Gly
115 120 125
Ala Ser His Tyr Ser Leu Ile Ser Gln Thr Pro Val Ser Ser Lys Ile
130 135 140
Thr Leu Asp Phe Lys Ser Ser Thr Ser Phe Lys Val Asp Arg Lys Ile
145 150 155 160
Ile Gln Val Phe Pro Leu Gly Glu His Val Phe Asn Ser Leu Leu Arg
165 170 175
Arg Trp Asn Asn Phe Ala Pro Glu Asp Leu His Phe Ser Gln Val Asp
180 185 190
Trp Ser Ile Pro Ile Ala Ala Phe Asp Val Lys Thr Ile Pro Ile His
195 200 205
Leu Lys Lys Val Glu Ile Gly Ala Gln Gly Trp Val Thr Tyr Ile Phe
210 215 220
Pro Asn Thr Glu Gln Ala Lys Ile Ala Ser Val Leu Ser Glu Phe Ala
225 230 235 240
Phe Phe Ser Gly Val Gly Arg Lys Thr Thr Met Gly Met Gly Gln Val
245 250 255
Gln Val Arg Ser
260
<210> 45
<211> 199
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 45
Met Tyr Leu Ser Lys Val Ile Ile Ala Arg Ala Trp Ser Arg Asp Leu
1 5 10 15
Tyr Gln Leu His Gln Gly Leu Trp His Leu Phe Pro Asn Arg Pro Asp
20 25 30
Ala Ala Arg Asp Phe Leu Phe His Val Glu Lys Arg Asn Thr Pro Glu
35 40 45
Gly Cys His Val Leu Leu Gln Ser Ala Gln Met Pro Val Ser Thr Ala
50 55 60
Val Ala Thr Val Ile Lys Thr Lys Gln Val Glu Phe Gln Leu Gln Val
65 70 75 80
Gly Val Pro Leu Tyr Phe Arg Leu Arg Ala Asn Pro Ile Lys Thr Ile
85 90 95
Leu Asp Asn Gln Lys Arg Leu Asp Ser Lys Gly Asn Ile Lys Arg Cys
100 105 110
Arg Val Pro Leu Ile Lys Glu Ala Glu Gln Ile Ala Trp Leu Gln Arg
115 120 125
Lys Leu Gly Asn Ala Ala Arg Val Glu Asp Val His Pro Ile Ser Glu
130 135 140
Arg Pro Gln Tyr Phe Ser Gly Asp Gly Lys Ser Gly Lys Ile Gln Thr
145 150 155 160
Val Cys Phe Glu Gly Val Leu Thr Ile Asn Asp Ala Pro Ala Leu Ile
165 170 175
Asp Leu Val Gln Gln Gly Ile Gly Pro Ala Lys Ser Met Gly Cys Gly
180 185 190
Leu Leu Ser Leu Ala Pro Leu
195
<210> 46
<211> 187
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 46
Met Asp His Tyr Leu Asp Ile Arg Leu Arg Pro Asp Pro Glu Phe Pro
1 5 10 15
Pro Ala Gln Leu Met Ser Val Leu Phe Gly Lys Leu His Gln Ala Leu
20 25 30
Val Ala Gln Gly Gly Asp Arg Ile Gly Val Ser Phe Pro Asp Leu Asp
35 40 45
Glu Ser Arg Ser Arg Leu Gly Glu Arg Leu Arg Ile His Ala Ser Ala
50 55 60
Asp Asp Leu Arg Ala Leu Leu Ala Arg Pro Trp Leu Glu Gly Leu Arg
65 70 75 80
Asp His Leu Gln Phe Gly Glu Pro Ala Val Val Pro His Pro Thr Pro
85 90 95
Tyr Arg Gln Val Ser Arg Val Gln Ala Lys Ser Asn Pro Glu Arg Leu
100 105 110
Arg Arg Arg Leu Met Arg Arg His Asp Leu Ser Glu Glu Glu Ala Arg
115 120 125
Lys Arg Ile Pro Asp Thr Val Ala Arg Ala Leu Asp Leu Pro Phe Val
130 135 140
Thr Leu Arg Ser Gln Ser Thr Gly Gln His Phe Arg Leu Phe Ile Arg
145 150 155 160
His Gly Pro Leu Gln Val Thr Ala Glu Glu Gly Gly Phe Thr Cys Tyr
165 170 175
Gly Leu Ser Lys Gly Gly Phe Val Pro Trp Phe
180 185
<210> 47
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 47
Met Ala Ala Arg Arg Gly Gly Ile Arg Arg Thr Asp Leu Leu Arg Arg
1 5 10 15
Ser Gly Gln Pro Arg Gly Arg His Arg Ala Ser Ala Ala Glu Ser Gly
20 25 30
Leu Thr Trp Ile Ser Pro Thr Leu Ile Leu Val Gly Phe Ser His Arg
35 40 45
Gly Asp Arg Arg Met Thr Glu His Leu Ser Arg Leu Thr Leu Thr Leu
50 55 60
Glu Val Asp Ala Pro Leu Glu Arg Ala Arg Val Ala Thr Leu Gly Pro
65 70 75 80
His Leu His Gly Val Leu Met Glu Ser Ile Pro Ala Asp Tyr Val Gln
85 90 95
Thr Leu His Thr Val Pro Val Asn Pro Tyr Ser Gln Tyr Ala Leu Ala
100 105 110
Arg Ser Thr Thr Ser Leu Glu Trp Lys Ile Ser Thr Leu Thr Asn Glu
115 120 125
Ala Arg Gln Gln Ile Val Gly Pro Ile Asn Asp Ala Ala Phe Ala Gly
130 135 140
Phe Arg Leu Arg Ala Ser Gly Ile Ala Thr Gln Val Thr Ser Arg Ser
145 150 155 160
Leu Glu Gln Asn Pro Leu Ser Gln Phe Ala Arg Ile Phe Tyr Ala Arg
165 170 175
Pro Glu Thr Arg Lys Phe Arg Val Glu Phe Leu Thr Pro Thr Ala Phe
180 185 190
Lys Gln Ser Gly Glu Tyr Val Phe Trp Pro Asp Pro Arg Leu Val Phe
195 200 205
Gln Ser Leu Ala Gln Lys Tyr Gly Ala Ile Val Asp Gly Glu Glu Pro
210 215 220
Asp Pro Gly Leu Ile Ala Glu Phe Gly Gln Ser Val Arg Leu Ser Ala
225 230 235 240
Phe Arg Val Ala Ser Ala Pro Phe Ala Val Gly Ala Ala Arg Val Pro
245 250 255
Gly Phe Thr Gly Ser Ala Thr Phe Thr Val Arg Gly Val Asp Thr Phe
260 265 270
Ala Ser Tyr Ile Ala Ala Leu Leu Trp Phe Gly Glu Phe Ser Gly Cys
275 280 285
Gly Ile Lys Ala Ser Met Gly Met Gly Ala Ile Arg Val Gln Pro Leu
290 295 300
Ala Pro Arg Glu Lys Cys Val Pro Lys Pro
305 310
<210> 48
<211> 264
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 48
Met Arg Phe Leu Ile Arg Leu Val Pro Glu Asp Lys Asp Arg Ala Phe
1 5 10 15
Lys Val Pro Tyr Asn His Gln Tyr Tyr Leu Gln Gly Leu Ile Tyr Asn
20 25 30
Ala Ile Lys Ser Ser Asn Pro Lys Leu Ala Thr Tyr Leu His Glu Val
35 40 45
Lys Gly Pro Lys Leu Phe Thr Tyr Ser Leu Phe Met Ala Glu Lys Arg
50 55 60
Glu His Pro Lys Gly Leu Pro Tyr Phe Leu Gly Tyr Lys Lys Gly Phe
65 70 75 80
Phe Tyr Phe Ser Thr Cys Val Pro Glu Ile Ala Glu Ala Leu Val Asn
85 90 95
Gly Leu Leu Met Asn Pro Glu Val Arg Leu Trp Asp Glu Arg Phe Tyr
100 105 110
Leu His Glu Ile Lys Val Leu Arg Glu Pro Lys Lys Phe Asn Gly Ser
115 120 125
Thr Phe Val Thr Leu Ser Pro Ile Ala Val Thr Val Val Arg Lys Gly
130 135 140
Lys Ser Tyr Asp Val Pro Pro Met Glu Lys Glu Phe Tyr Ser Ile Ile
145 150 155 160
Lys Asp Asp Leu Gln Asp Lys Tyr Val Met Ala Tyr Gly Asp Lys Pro
165 170 175
Pro Ser Glu Phe Glu Met Glu Val Leu Ile Ala Lys Pro Lys Arg Phe
180 185 190
Arg Ile Lys Pro Gly Ile Tyr Gln Thr Ala Trp His Leu Val Phe Arg
195 200 205
Ala Tyr Gly Asn Asp Asp Leu Leu Lys Val Gly Tyr Glu Val Gly Phe
210 215 220
Gly Glu Lys Asn Ser Leu Gly Phe Gly Met Val Lys Val Glu Gly Asn
225 230 235 240
Lys Thr Thr Lys Glu Ala Glu Glu Gln Glu Lys Ile Thr Phe Asn Ser
245 250 255
Arg Glu Glu Leu Lys Thr Gly Val
260
<210> 49
<211> 236
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 49
Met Phe Val Thr Gln Val Ile Phe Asn Ile Gly Glu Arg Thr Tyr Pro
1 5 10 15
Asp Arg Ala Arg Ala Met Val Ala Glu Leu Met Asp Gly Val Gln Pro
20 25 30
Gly Leu Val Ala Thr Leu Met Asn Tyr Ile Pro Gly Thr Ser Thr Ser
35 40 45
Arg Thr Glu Phe Pro Thr Val Gln Phe Gly Gly Ala Ser Asp Gly Phe
50 55 60
Cys Leu Leu Gly Phe Gly Asp Gly Gly Gly Ala Ile Val Arg Asp Ala
65 70 75 80
Val Pro Leu Ile His Ala Ala Leu Ala Arg Arg Met Pro Asp Arg Ile
85 90 95
Ile Gln Val Glu His Lys Glu His Ser Leu Ser Ala Glu Ala Arg Pro
100 105 110
Tyr Val Leu Ser Tyr Thr Val Pro Arg Met Val Val Gln Lys Lys Gln
115 120 125
Arg His Ala Glu Arg Leu Leu His Glu Ala Glu Gly Lys Ala His Leu
130 135 140
Glu Gly Leu Phe Leu Arg Ser Leu Gln Arg Gln Ala Ala Ala Val Gly
145 150 155 160
Leu Pro Leu Pro Glu Asn Leu Glu Val Glu Phe Lys Gly Ala Val Gly
165 170 175
Asp Phe Ala Ala Lys His Asn Pro Asn Ser Lys Val Ala Tyr Arg Gly
180 185 190
Leu Arg Gly Ala Val Phe Asp Val Asn Ala Arg Leu Gly Gly Ile Trp
195 200 205
Thr Ala Gly Phe Met Leu Ser Lys Gly Tyr Gly Gln Phe Asn Ala Thr
210 215 220
His Gln Leu Ser Gly Ala Val Asn Ala Leu Ser Glu
225 230 235
<210> 50
<211> 259
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 50
Met His Gln Thr Leu Ile Arg Ile Asn Trp Pro Lys Gly Phe Lys Cys
1 5 10 15
Pro Pro Ala Glu Phe Arg Glu Lys Leu Ala Lys Ser Glu Met Phe Pro
20 25 30
Pro Glu Phe Phe His Tyr Gly Thr Glu Leu Ala Val Trp Asp Lys Gln
35 40 45
Thr Ala Glu Val Glu Gly Lys Ile Lys Thr Val Ser Lys Glu Lys Ile
50 55 60
Ile Lys Thr Phe Asp Lys Pro Ile Pro Leu Asn Gly Arg Ala Pro Val
65 70 75 80
Arg Val Ile Gly Gly Gln Ala Trp Ala Gly Val Ile Ala Asp Pro Glu
85 90 95
Met Glu Gly Met Leu Ile Pro His Leu Gly Ser Ile Leu Lys Val Ala
100 105 110
Ser Ser Ala Ala Gly Cys Ala Val Lys Ile Glu Leu Glu Gln Arg Lys
115 120 125
Phe Gly Ile Ser Tyr Thr Glu Tyr Pro Val Lys Tyr Asn Leu Arg Glu
130 135 140
Leu Val Leu Lys Arg Arg Cys Glu Asp Ala Arg Ser Thr Asp Ile Glu
145 150 155 160
Ser Leu Ile Ala Asp Arg Ile Trp Gly Gly Val Ser Gly Glu Ser Tyr
165 170 175
Tyr Gly Ile Asp Gly Thr Cys Ala Lys Phe Gly Phe Glu Pro Pro Ser
180 185 190
Arg Glu Gln Leu Glu Leu Arg Ile Phe Pro Met Lys Asn Ile Gly Leu
195 200 205
His Met Lys Ser Ser Asp Gly Leu Ser Lys Glu Tyr Met Ser Leu Ile
210 215 220
Asp Ala Glu Val Trp Met Asn Ala Lys Leu Glu Gly Val Trp Gln Val
225 230 235 240
Gly Asn Leu Ile Ser Arg Gly Tyr Gly Arg Phe Ile Lys Ser Ile Gly
245 250 255
Ala Gln Ser
<210> 51
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 51
gataatctct tatagaattg aaag 24
<210> 52
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 52
ctaaaagaat aacttgcaaa ataacaagca ttgaaac 37
<210> 53
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 53
gtctcaccct tcatgggtga gtggattgaa at 32
<210> 54
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 54
gtcgcactct tcatgggtgc gtggattgaa at 32
<210> 55
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 55
gtttcagtcc cgtagtcggg atttagtggt tggaaag 37
<210> 56
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 56
gagttccccg cgccagcggg gataaaccg 29
<210> 57
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 57
gttcactgcc gtataggcag ctaagaaa 28
<210> 58
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 58
gtcgtcagac ccaaaacccc gagaggggac ggaaac 36
<210> 59
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 59
gttacaataa gactaaaata gaattgaaag 30
<210> 60
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 60
gtatttcccg cgtgcgcggg ggtgagcgg 29
<210> 61
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 61
tattggatac acccactcat tggtgggtgg ttagaac 37
<210> 62
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 62
gauaaucucu uauagaauug aaag 24
<210> 63
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 63
cuaaaagaau aacuugcaaa auaacaagca uugaaac 37
<210> 64
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 64
gucucacccu ucauggguga guggauugaa au 32
<210> 65
<211> 32
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 65
gucgcacucu ucaugggugc guggauugaa au 32
<210> 66
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 66
guuucagucc cguagucggg auuuaguggu uggaaag 37
<210> 67
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 67
gaguuccccg cgccagcggg gauaaaccg 29
<210> 68
<211> 28
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 68
guucacugcc guauaggcag cuaagaaa 28
<210> 69
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 69
gucgucagac ccaaaacccc gagaggggac ggaaac 36
<210> 70
<211> 30
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 70
guuacaauaa gacuaaaaua gaauugaaag 30
<210> 71
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 71
guauuucccg cgugcgcggg ggugagcgg 29
<210> 72
<211> 37
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 72
uauuggauac acccacucau uggugggugg uuagaac 37
<210> 73
<211> 2133
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 73
atgcccaaga agaagcggaa ggtgatgcct ctgatcttca agatcggcta taacgtgatc 60
cccctgcagg acgtgatcct gcccacccct tccagcaagg tgctgaagta cctgatccag 120
agcggcaagc tgatccccag cctgaaggac ctgatcacca gccgggacaa gtacaagcca 180
atcttcatct cccacctggg cttcaaccag cggaggattt tccagaccaa cggcaatctg 240
aaaaccatca ccaagggcag tagactgagc tccatcatcg ccttcagcac ccaggccaac 300
gtgctgtccg aggtggccga tgaagggatc ttcgaaaccg tgtacggaaa gttccacatc 360
atgatcgaaa gcatcgagat cgtggaggtg gaaaagctga aggaggaggt ggagaagcac 420
atgaacgaca acatcagagt gagattcgtg tctcccacac tgctgagctc caaggtgctg 480
ctgcccccca gcctgtccga aagatacaag aagatccacg ccgggtacag caccctgccc 540
agcgtgggcc tgatcgtggc ctacgcctac aacgtgtact gcaatctgat cggcaagaag 600
gaagtggaag tgcgggcctt caagtttgga atcctgagca acgccctgtc cagaatcatc 660
ggctacgacc tgcaccctgt gaccgtggcc atcggcgagg acagcaaggg gaatctgaga 720
aaggctcggg gcgtgatggg ctggatcgag ttcgacatcc ccgacgaaag actgaagcgg 780
cgggccctga actatctgct gaccagcagc tacctgggca tcgggagatc tcggggcatc 840
ggcttcggcg agatccggct ggagttccgg aagattgaag agaaggaggg acccaagaag 900
aagcggaagg tgggtggagg cggaggttct gggggaggag gtagtggcgg tggtggttca 960
ggaggcggcg gaagccagct gcatttaccg caggttttag ctgacgctgt ctcacgcctg 1020
gtcataggta agtttggtga cctgaccgac aacttctcct cccctcacgc tcgcagaata 1080
ggtctggctg gagtcgtcat gacaacaggc acagatgtta aagatgccaa ggtgatatgt 1140
gtttctacag gagcaaaatg tattaatggt gaatacctaa gtgatcgtgg ccttgcatta 1200
aatgactgcc atgcagaaat agtatctcgg agatccttgc tcagatttct ttatacacaa 1260
cttgagcttt acttaaataa cgaggatgat caaaaaagat ccatctttca gaaatcagag 1320
cgaggggggt ttaggctgaa ggagaatata cagtttcatc tgtacatcag cacctctccc 1380
tgtggagatg ccagaatctt ctcaccacat gaggcaatcc tggaagaacc agcagataga 1440
cacccaaatc gtaaagcaag aggacagcta cggaccaaaa tagaggctgg tcaggggacg 1500
attccagtgc gcaacaatgc gagcatccaa acgtgggacg gggtgctgca aggggagcgg 1560
ctgctcacca tgtcctgcag tgacaagatt gcacgctgga acgtggtggg catccaggga 1620
tcactgctca gcattttcgt ggagcccatt tacttctcga gcatcatcct gggcagcctt 1680
taccacgggg accacctttc cagggccatg taccagcgga tctccaacat agaggacctg 1740
ccacctctct acaccctcaa caagcctttg ctcacaggca tcagcaatgc agaagcacgg 1800
cagccaggga aggcccccat attcagtgtc aactggacgg taggcgactc cgctattgag 1860
gtcatcaacg ccacgactgg gaagggagag ctgggccgcg cgtcccgcct gtgtaagcac 1920
gcgttgtact gtcgctggat gcgtgtgcac ggcaaggttc cctcccactt actacgctcc 1980
aagattacca agcccaacgt gtaccatgag acaaagctgg cggcaaagga gtaccaggcc 2040
gccaaggcgc gtctgttcac agccttcatc aaggcggggc tgggggcctg ggtggagaag 2100
cccaccgagc aggaccagtt ctcactcacg taa 2133
<210> 74
<211> 1920
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 74
atgcccaaga agaagcggaa ggtgatggac ctggagtaca tgcacatctc ctaccctaac 60
atcctgctga acatgcggga cggcagcaag ctgcggggct acttcgccaa gaagtacatc 120
gacgaagaga ttgtgcacaa ccacagagac aacgcctttg tgtacaagta cccccagatc 180
cagtttaaga tcatcgatag aagccccctg atcatcggca ttggctctct gggcatcaat 240
ttcctggaga gcaagcggat cttcttcgag aaggaactga ttatcagcaa cgacaccaac 300
gacatcaccg aggtgaacgt gcacaaggac atggatcact tcggcacgac cgacaagatc 360
ctgaagtacc agttcaagac cccttggatg gcactgaacg ccaagaatag cgagatctac 420
aagaactctg acgagatcga ccgggaggag ttcctgaaga gagtgctgat tgggaatatc 480
ctgagcatgt ctaagagcct gggctatacc atcgaagaaa agctgaaggt gaagattaac 540
ctgaaggaag tgcccgtgaa gttcaagaac cagaacatgg tgggctttcg gggcgagttc 600
tacatcaact tcgacatccc tcagtatctg ggcatcggcc ggaatgtgtc ccggggattc 660
ggcacagtgg tgaaggtgcc caagaagaag cggaaggtgg gtggaggcgg aggttctggg 720
ggaggaggta gtggcggtgg tggttcagga ggcggcggaa gccagctgca tttaccgcag 780
gttttagctg acgctgtctc acgcctggtc ataggtaagt ttggtgacct gaccgacaac 840
ttctcctccc ctcacgctcg cagaataggt ctggctggag tcgtcatgac aacaggcaca 900
gatgttaaag atgccaaggt gatatgtgtt tctacaggag caaaatgtat taatggtgaa 960
tacctaagtg atcgtggcct tgcattaaat gactgccatg cagaaatagt atctcggaga 1020
tccttgctca gatttcttta tacacaactt gagctttact taaataacga ggatgatcaa 1080
aaaagatcca tctttcagaa atcagagcga ggggggttta ggctgaagga gaatatacag 1140
tttcatctgt acatcagcac ctctccctgt ggagatgcca gaatcttctc accacatgag 1200
gcaatcctgg aagaaccagc agatagacac ccaaatcgta aagcaagagg acagctacgg 1260
accaaaatag aggctggtca ggggacgatt ccagtgcgca acaatgcgag catccaaacg 1320
tgggacgggg tgctgcaagg ggagcggctg ctcaccatgt cctgcagtga caagattgca 1380
cgctggaacg tggtgggcat ccagggatca ctgctcagca ttttcgtgga gcccatttac 1440
ttctcgagca tcatcctggg cagcctttac cacggggacc acctttccag ggccatgtac 1500
cagcggatct ccaacataga ggacctgcca cctctctaca ccctcaacaa gcctttgctc 1560
acaggcatca gcaatgcaga agcacggcag ccagggaagg cccccatatt cagtgtcaac 1620
tggacggtag gcgactccgc tattgaggtc atcaacgcca cgactgggaa gggagagctg 1680
ggccgcgcgt cccgcctgtg taagcacgcg ttgtactgtc gctggatgcg tgtgcacggc 1740
aaggttccct cccacttact acgctccaag attaccaagc ccaacgtgta ccatgagaca 1800
aagctggcgg caaaggagta ccaggccgcc aaggcgcgtc tgttcacagc cttcatcaag 1860
gcggggctgg gggcctgggt ggagaagccc accgagcagg accagttctc actcacgtaa 1920
<210> 75
<211> 1974
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 75
atgcccaaga agaagcggaa ggtgatgaga aatgaagtgc agttcgagct gttcggcgac 60
tacgccctgt tcaccgaccc cctgaccaag atcggcggcg aaaagctgag ctacagcgtg 120
cctacctacc aggccctgaa gggcatcgcc gagagcatct actggaagcc caccatcgtg 180
ttcgtgatcg acgaactgcg ggtcatgaag cccattcaga tggagtctaa gggcgtgagg 240
cccatcgagt acggcggcgg caacaccctg gcccactaca cctacctgaa ggatgtgcac 300
taccaggtga aggcccactt cgagttcaac ctgcaccggc ccgacctggc cttcgataga 360
aacgagggca agcactactc catcctgcag agaagcctga aggccggcgg cagaagagat 420
attttcctgg gcgcccggga gtgccagggc tacgtggccc cctgcgagtt cggcagcggc 480
gacggcttct acgacggcca gggcaagtac cacctgggaa ccatggtgca cggtttcaac 540
taccccgacg aaaccggaca gcaccagctg gatgtgagac tgtggtctgc cgtcatggaa 600
aacggctaca tccagttccc ccgccctgag gactgcccca tcgtgcggcc tgtgaaggag 660
atggaaccca agatcttcaa ccccgacaac gtgcagtccg ccgaacagct gctgcacgac 720
ctgggcggcg aacccaagaa gaagcggaag gtgggtggag gcggaggttc tgggggagga 780
ggtagtggcg gtggtggttc aggaggcggc ggaagccagc tgcatttacc gcaggtttta 840
gctgacgctg tctcacgcct ggtcataggt aagtttggtg acctgaccga caacttctcc 900
tcccctcacg ctcgcagaat aggtctggct ggagtcgtca tgacaacagg cacagatgtt 960
aaagatgcca aggtgatatg tgtttctaca ggagcaaaat gtattaatgg tgaataccta 1020
agtgatcgtg gccttgcatt aaatgactgc catgcagaaa tagtatctcg gagatccttg 1080
ctcagatttc tttatacaca acttgagctt tacttaaata acgaggatga tcaaaaaaga 1140
tccatctttc agaaatcaga gcgagggggg tttaggctga aggagaatat acagtttcat 1200
ctgtacatca gcacctctcc ctgtggagat gccagaatct tctcaccaca tgaggcaatc 1260
ctggaagaac cagcagatag acacccaaat cgtaaagcaa gaggacagct acggaccaaa 1320
atagaggctg gtcaggggac gattccagtg cgcaacaatg cgagcatcca aacgtgggac 1380
ggggtgctgc aaggggagcg gctgctcacc atgtcctgca gtgacaagat tgcacgctgg 1440
aacgtggtgg gcatccaggg atcactgctc agcattttcg tggagcccat ttacttctcg 1500
agcatcatcc tgggcagcct ttaccacggg gaccaccttt ccagggccat gtaccagcgg 1560
atctccaaca tagaggacct gccacctctc tacaccctca acaagccttt gctcacaggc 1620
atcagcaatg cagaagcacg gcagccaggg aaggccccca tattcagtgt caactggacg 1680
gtaggcgact ccgctattga ggtcatcaac gccacgactg ggaagggaga gctgggccgc 1740
gcgtcccgcc tgtgtaagca cgcgttgtac tgtcgctgga tgcgtgtgca cggcaaggtt 1800
ccctcccact tactacgctc caagattacc aagcccaacg tgtaccatga gacaaagctg 1860
gcggcaaagg agtaccaggc cgccaaggcg cgtctgttca cagccttcat caaggcgggg 1920
ctgggggcct gggtggagaa gcccaccgag caggaccagt tctcactcac gtaa 1974
<210> 76
<211> 1992
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 76
atgcccaaga agaagcggaa ggtgatgtac agaagccggg acttctacgt gagagtgtcc 60
ggccagcggg ccctgttcac caaccccgcc accaagggcg gctccgaacg gagctcctac 120
tccgtgccta cccggcaggc cctgaacggg attgtggacg ccatctacta caagcccacg 180
ttcaccaaca tcgtgaccga ggtgaaggtg attaaccaga tccagaccga actgcagggc 240
gtgcgggccc tgctgcatga ctacagcgcc gacctgagct acgtgtccta cctgagcgac 300
gtggtgtacc tgattaagtt tcatttcgtg tggaacgagg atagaaagga cctgaatagc 360
gaccggctgc cagccaagca tgaggccatc atggagcggt ctatccggaa gggcggcaga 420
cgggacgtgt tcctgggcac cagagaatgc ctgggcctgc tggacgacat cagccaggaa 480
gaatacgaaa ccacagtgag ctattacaat ggggtgaaca tcgacctggg catcatgttc 540
cacagcttcg cttaccccaa ggacaagaaa acccccctga agtcctactt cacaaagacc 600
gtgatgaaga acggcgtgat caccttcaag gcccagtccg aatgcgatat tgtgaacacc 660
ctgagctcct acgccttcaa ggcccccgag gagatcaaga gcgtgaacga cgagtgcatg 720
gagtacgacg ccatggagaa gggcgaaaac cccaagaaga agcggaaggt gggtggaggc 780
ggaggttctg ggggaggagg tagtggcggt ggtggttcag gaggcggcgg aagccagctg 840
catttaccgc aggttttagc tgacgctgtc tcacgcctgg tcataggtaa gtttggtgac 900
ctgaccgaca acttctcctc ccctcacgct cgcagaatag gtctggctgg agtcgtcatg 960
acaacaggca cagatgttaa agatgccaag gtgatatgtg tttctacagg agcaaaatgt 1020
attaatggtg aatacctaag tgatcgtggc cttgcattaa atgactgcca tgcagaaata 1080
gtatctcgga gatccttgct cagatttctt tatacacaac ttgagcttta cttaaataac 1140
gaggatgatc aaaaaagatc catctttcag aaatcagagc gaggggggtt taggctgaag 1200
gagaatatac agtttcatct gtacatcagc acctctccct gtggagatgc cagaatcttc 1260
tcaccacatg aggcaatcct ggaagaacca gcagatagac acccaaatcg taaagcaaga 1320
ggacagctac ggaccaaaat agaggctggt caggggacga ttccagtgcg caacaatgcg 1380
agcatccaaa cgtgggacgg ggtgctgcaa ggggagcggc tgctcaccat gtcctgcagt 1440
gacaagattg cacgctggaa cgtggtgggc atccagggat cactgctcag cattttcgtg 1500
gagcccattt acttctcgag catcatcctg ggcagccttt accacgggga ccacctttcc 1560
agggccatgt accagcggat ctccaacata gaggacctgc cacctctcta caccctcaac 1620
aagcctttgc tcacaggcat cagcaatgca gaagcacggc agccagggaa ggcccccata 1680
ttcagtgtca actggacggt aggcgactcc gctattgagg tcatcaacgc cacgactggg 1740
aagggagagc tgggccgcgc gtcccgcctg tgtaagcacg cgttgtactg tcgctggatg 1800
cgtgtgcacg gcaaggttcc ctcccactta ctacgctcca agattaccaa gcccaacgtg 1860
taccatgaga caaagctggc ggcaaaggag taccaggccg ccaaggcgcg tctgttcaca 1920
gccttcatca aggcggggct gggggcctgg gtggagaagc ccaccgagca ggaccagttc 1980
tcactcacgt aa 1992
<210> 77
<211> 2046
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 77
atgcccaaga agaagcggaa ggtgatgccc aacgatccct acagcctgta ctccatcgtg 60
atcgaactgg gcgccgccga aaagggattc cccacaggca tcctgggcag aagcctgcat 120
agccaggtgc tgcagtggtt caagcaggat aaccccttcc tggccaccga gctgcaccag 180
agccagatct cccccttctc catctctcca ctgatgggca agcggcacgc caagctgacc 240
aaggccggcg accggctgtt ctttcggatc tgcctgctga gaggagatct gctgcagccc 300
ctgctgaacg gcattgagca gaccgtgaac cagagcgtgt gcctggacaa gttccggttc 360
cggctgtgcc agacccacat cctgcccggc agccaccctc tggctggcgc ctcccactat 420
agcctgatca gccagacccc agtgagctcc aagattaccc tggacttcaa gagttctacc 480
tccttcaagg tggaccggaa gatcatccaa gtgttccctc tgggcgaaca cgtgttcaac 540
agcctgctca gacgctggaa taacttcgcc cccgaggacc tgcacttctc tcaggtggac 600
tggagcatcc ccatcgccgc attcgacgtg aaaaccatcc ccatccacct gaagaaggtc 660
gagatcggcg cacagggctg ggtgacctac atcttcccca acacagaaca ggccaagatc 720
gcctccgtgc tgagcgaatt cgccttcttc agcggagtgg gacggaaaac caccatgggc 780
atgggccagg tgcaggtgcg gtcccccaag aagaagcgga aggtgggtgg aggcggaggt 840
tctgggggag gaggtagtgg cggtggtggt tcaggaggcg gcggaagcca gctgcattta 900
ccgcaggttt tagctgacgc tgtctcacgc ctggtcatag gtaagtttgg tgacctgacc 960
gacaacttct cctcccctca cgctcgcaga ataggtctgg ctggagtcgt catgacaaca 1020
ggcacagatg ttaaagatgc caaggtgata tgtgtttcta caggagcaaa atgtattaat 1080
ggtgaatacc taagtgatcg tggccttgca ttaaatgact gccatgcaga aatagtatct 1140
cggagatcct tgctcagatt tctttataca caacttgagc tttacttaaa taacgaggat 1200
gatcaaaaaa gatccatctt tcagaaatca gagcgagggg ggtttaggct gaaggagaat 1260
atacagtttc atctgtacat cagcacctct ccctgtggag atgccagaat cttctcacca 1320
catgaggcaa tcctggaaga accagcagat agacacccaa atcgtaaagc aagaggacag 1380
ctacggacca aaatagaggc tggtcagggg acgattccag tgcgcaacaa tgcgagcatc 1440
caaacgtggg acggggtgct gcaaggggag cggctgctca ccatgtcctg cagtgacaag 1500
attgcacgct ggaacgtggt gggcatccag ggatcactgc tcagcatttt cgtggagccc 1560
atttacttct cgagcatcat cctgggcagc ctttaccacg gggaccacct ttccagggcc 1620
atgtaccagc ggatctccaa catagaggac ctgccacctc tctacaccct caacaagcct 1680
ttgctcacag gcatcagcaa tgcagaagca cggcagccag ggaaggcccc catattcagt 1740
gtcaactgga cggtaggcga ctccgctatt gaggtcatca acgccacgac tgggaaggga 1800
gagctgggcc gcgcgtcccg cctgtgtaag cacgcgttgt actgtcgctg gatgcgtgtg 1860
cacggcaagg ttccctccca cttactacgc tccaagatta ccaagcccaa cgtgtaccat 1920
gagacaaagc tggcggcaaa ggagtaccag gccgccaagg cgcgtctgtt cacagccttc 1980
atcaaggcgg ggctgggggc ctgggtggag aagcccaccg agcaggacca gttctcactc 2040
acgtaa 2046
<210> 78
<211> 1860
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 78
atgcctaaga agaagcggaa ggtgtacctg agcaaggtga tcatcgccag agcctggagc 60
agagacctgt accagctgca ccagggcctg tggcacctgt tccccaaccg gcccgacgcc 120
gcccgggatt tcctgttcca cgtggagaag agaaacaccc cggaaggctg ccacgtgctg 180
ctgcagagcg cacagatgcc tgtgagcacc gccgtggcca ccgtgatcaa gaccaagcag 240
gtggagttcc agctgcaggt gggcgtgccc ctgtatttca ggctgcgggc gaatcccatc 300
aagaccatcc tggacaacca gaagcggctg gacagcaagg gcaacatcaa gaggtgcaga 360
gtgcctctga tcaaggaggc cgaacagatc gcctggctgc agcggaagct gggcaatgcc 420
gccagagtgg aggacgtgca ccccatcagc gagcggcccc agtacttctc cggcgacgga 480
aagagcggaa agatccagac cgtgtgcttc gagggcgtgc tgaccatcaa cgacgcaccc 540
gccctgatcg acctcgtgca gcaggggatc ggccctgcca agtccatggg ctgcggactg 600
ctgtccctgg cccccctgcc caagaagaag cggaaggtgg gtggaggcgg aggttctggg 660
ggaggaggta gtggcggtgg tggttcagga ggcggcggaa gccagctgca tttaccgcag 720
gttttagctg acgctgtctc acgcctggtc ataggtaagt ttggtgacct gaccgacaac 780
ttctcctccc ctcacgctcg cagaataggt ctggctggag tcgtcatgac aacaggcaca 840
gatgttaaag atgccaaggt gatatgtgtt tctacaggag caaaatgtat taatggtgaa 900
tacctaagtg atcgtggcct tgcattaaat gactgccatg cagaaatagt atctcggaga 960
tccttgctca gatttcttta tacacaactt gagctttact taaataacga ggatgatcaa 1020
aaaagatcca tctttcagaa atcagagcga ggggggttta ggctgaagga gaatatacag 1080
tttcatctgt acatcagcac ctctccctgt ggagatgcca gaatcttctc accacatgag 1140
gcaatcctgg aagaaccagc agatagacac ccaaatcgta aagcaagagg acagctacgg 1200
accaaaatag aggctggtca ggggacgatt ccagtgcgca acaatgcgag catccaaacg 1260
tgggacgggg tgctgcaagg ggagcggctg ctcaccatgt cctgcagtga caagattgca 1320
cgctggaacg tggtgggcat ccagggatca ctgctcagca ttttcgtgga gcccatttac 1380
ttctcgagca tcatcctggg cagcctttac cacggggacc acctttccag ggccatgtac 1440
cagcggatct ccaacataga ggacctgcca cctctctaca ccctcaacaa gcctttgctc 1500
acaggcatca gcaatgcaga agcacggcag ccagggaagg cccccatatt cagtgtcaac 1560
tggacggtag gcgactccgc tattgaggtc atcaacgcca cgactgggaa gggagagctg 1620
ggccgcgcgt cccgcctgtg taagcacgcg ttgtactgtc gctggatgcg tgtgcacggc 1680
aaggttccct cccacttact acgctccaag attaccaagc ccaacgtgta ccatgagaca 1740
aagctggcgg caaaggagta ccaggccgcc aaggcgcgtc tgttcacagc cttcatcaag 1800
gcggggctgg gggcctgggt ggagaagccc accgagcagg accagttctc actcacgtaa 1860
<210> 79
<211> 1824
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 79
atgcctaaga agaagagaaa ggtggaccac tacctggaca ttagactgcg ccctgaccca 60
gagttccctc ctgcccagct gatgtctgtg ctgtttggca agctgcacca ggccctggtg 120
gcccagggcg gtgacagaat cggagtgtct ttccctgatc tggacgaatc tagatctaga 180
ctgggagaga gactgagaat ccacgcgtct gccgacgacc tgagagctct gctggccaga 240
ccatggctgg aaggactgcg cgaccacctg cagttcggtg aacctgccgt ggtgcctcac 300
ccaactccat acagacaggt gagtagagtg caggcaaagt ctaatccaga gagactgaga 360
cgcagactga tgagaaggca tgacctgtcc gaagaagaag ccagaaagag aatcccagac 420
acagtggcca gagccctgga tctgcctttt gtgaccctga gaagccagtc taccggccag 480
cacttcagac tgtttattcg ccacggacca ctgcaggtga ccgccgaaga gggaggtttt 540
acctgctacg gactgagcaa gggaggtttc gtgccttggt tccccaagaa gaagcggaag 600
gtgggtggag gcggaggttc tgggggagga ggtagtggcg gtggtggttc aggaggcggc 660
ggaagccagc tgcatttacc gcaggtttta gctgacgctg tctcacgcct ggtcataggt 720
aagtttggtg acctgaccga caacttctcc tcccctcacg ctcgcagaat aggtctggct 780
ggagtcgtca tgacaacagg cacagatgtt aaagatgcca aggtgatatg tgtttctaca 840
ggagcaaaat gtattaatgg tgaataccta agtgatcgtg gccttgcatt aaatgactgc 900
catgcagaaa tagtatctcg gagatccttg ctcagatttc tttatacaca acttgagctt 960
tacttaaata acgaggatga tcaaaaaaga tccatctttc agaaatcaga gcgagggggg 1020
tttaggctga aggagaatat acagtttcat ctgtacatca gcacctctcc ctgtggagat 1080
gccagaatct tctcaccaca tgaggcaatc ctggaagaac cagcagatag acacccaaat 1140
cgtaaagcaa gaggacagct acggaccaaa atagaggctg gtcaggggac gattccagtg 1200
cgcaacaatg cgagcatcca aacgtgggac ggggtgctgc aaggggagcg gctgctcacc 1260
atgtcctgca gtgacaagat tgcacgctgg aacgtggtgg gcatccaggg atcactgctc 1320
agcattttcg tggagcccat ttacttctcg agcatcatcc tgggcagcct ttaccacggg 1380
gaccaccttt ccagggccat gtaccagcgg atctccaaca tagaggacct gccacctctc 1440
tacaccctca acaagccttt gctcacaggc atcagcaatg cagaagcacg gcagccaggg 1500
aaggccccca tattcagtgt caactggacg gtaggcgact ccgctattga ggtcatcaac 1560
gccacgactg ggaagggaga gctgggccgc gcgtcccgcc tgtgtaagca cgcgttgtac 1620
tgtcgctgga tgcgtgtgca cggcaaggtt ccctcccact tactacgctc caagattacc 1680
aagcccaacg tgtaccatga gacaaagctg gcggcaaagg agtaccaggc cgccaaggcg 1740
cgtctgttca cagccttcat caaggcgggg ctgggggcct gggtggagaa gcccaccgag 1800
caggaccagt tctcactcac gtaa 1824
<210> 80
<211> 2208
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 80
atgcccaaga agaagcggaa ggtgatggcc gccagaagag gcggaatccg gagaaccgac 60
ctgctgcgga ggtctggcca gcctcggggc agacaccggg cctccgccgc cgagagcggc 120
ctgacatgga tctcccctac cctgatcctg gtgggcttca gccacagggg cgataggaga 180
atgaccgagc acctgtccag actgaccctg accctggaag tggatgcccc cctggagaga 240
gcccgggtgg ccaccctggg cccccacctg catggcgtgc tgatggagtc tatccccgcc 300
gactacgtgc agacactgca cacagtgccg gtgaaccctt acagccagta cgctctggcc 360
cggagcacca ccagcctgga gtggaagatc tccaccctga caaatgaggc ccggcagcag 420
atcgtcggcc ccatcaacga cgccgccttc gccggcttcc ggctgcgggc cagcggcatc 480
gccacccagg tgacaagcag aagcctggag cagaaccccc tgtcccagtt tgccagaatc 540
ttctacgcca ggcccgaaac ccgcaagttc agagtggagt tcctgacccc caccgccttc 600
aagcagagcg gcgagtacgt gttttggccc gatcccagac tggtgttcca gtccctggcc 660
cagaagtacg gcgccatcgt ggacggagaa gagcccgacc ccggcctgat cgccgagttt 720
ggccagtccg tgagactgag cgccttcaga gtggccagcg ccccttttgc cgtgggcgcc 780
gccagggtgc ccggattcac cggcagcgcc accttcaccg tgcggggagt ggacaccttc 840
gccagctaca tcgccgctct gctgtggttc ggcgagttca gcggatgcgg catcaaggcc 900
tccatgggaa tgggcgccat ccgggtgcag cctctggccc cccgggagaa gtgcgtgccc 960
aagcccccca agaagaagcg gaaggtgggt ggaggcggag gttctggggg aggaggtagt 1020
ggcggtggtg gttcaggagg cggcggaagc cagctgcatt taccgcaggt tttagctgac 1080
gctgtctcac gcctggtcat aggtaagttt ggtgacctga ccgacaactt ctcctcccct 1140
cacgctcgca gaataggtct ggctggagtc gtcatgacaa caggcacaga tgttaaagat 1200
gccaaggtga tatgtgtttc tacaggagca aaatgtatta atggtgaata cctaagtgat 1260
cgtggccttg cattaaatga ctgccatgca gaaatagtat ctcggagatc cttgctcaga 1320
tttctttata cacaacttga gctttactta aataacgagg atgatcaaaa aagatccatc 1380
tttcagaaat cagagcgagg ggggtttagg ctgaaggaga atatacagtt tcatctgtac 1440
atcagcacct ctccctgtgg agatgccaga atcttctcac cacatgaggc aatcctggaa 1500
gaaccagcag atagacaccc aaatcgtaaa gcaagaggac agctacggac caaaatagag 1560
gctggtcagg ggacgattcc agtgcgcaac aatgcgagca tccaaacgtg ggacggggtg 1620
ctgcaagggg agcggctgct caccatgtcc tgcagtgaca agattgcacg ctggaacgtg 1680
gtgggcatcc agggatcact gctcagcatt ttcgtggagc ccatttactt ctcgagcatc 1740
atcctgggca gcctttacca cggggaccac ctttccaggg ccatgtacca gcggatctcc 1800
aacatagagg acctgccacc tctctacacc ctcaacaagc ctttgctcac aggcatcagc 1860
aatgcagaag cacggcagcc agggaaggcc cccatattca gtgtcaactg gacggtaggc 1920
gactccgcta ttgaggtcat caacgccacg actgggaagg gagagctggg ccgcgcgtcc 1980
cgcctgtgta agcacgcgtt gtactgtcgc tggatgcgtg tgcacggcaa ggttccctcc 2040
cacttactac gctccaagat taccaagccc aacgtgtacc atgagacaaa gctggcggca 2100
aaggagtacc aggccgccaa ggcgcgtctg ttcacagcct tcatcaaggc ggggctgggg 2160
gcctgggtgg agaagcccac cgagcaggac cagttctcac tcacgtaa 2208
<210> 81
<211> 2058
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 81
atgcccaaga agaagcggaa ggtgatgaga ttcctgatca gactggtgcc cgaggacaag 60
gacagagcct tcaaggtgcc ttacaaccac cagtactatc tgcagggcct gatctacaac 120
gccatcaagt cctccaaccc caagctggcc acctacctgc acgaggtgaa gggccccaag 180
ctgttcacct acagcctgtt catggccgaa aagcgggagc accctaaggg cctgccctac 240
tttctgggct acaagaaggg cttcttctac ttcagcacct gcgtgcccga gatcgccgag 300
gccctggtga acggcctgct gatgaatccc gaggtgcggc tgtgggacga gagattctac 360
ctgcacgaaa tcaaggtcct gcgggagccc aagaagttca acggcagcac cttcgtgacc 420
ctgagcccca tcgccgtgac cgtggtgaga aagggcaagt cctacgacgt gccccccatg 480
gaaaaggagt tctacagcat tatcaaggat gacctgcagg acaagtacgt gatggcctac 540
ggcgacaagc cccccagtga gttcgagatg gaagtgctga tcgccaagcc caagcggttc 600
cggatcaagc ccggcatcta tcagaccgcc tggcacctgg tgtttcgggc ctacggcaat 660
gacgacctgc tgaaggtggg ctacgaagtg ggattcgggg agaagaactc cctgggattc 720
ggaatggtca aggtggaggg caacaagacc accaaggaag ccgaagaaca ggagaagatc 780
accttcaact cccgggaaga gctgaaaaca ggcgtgccca agaagaagcg gaaggtgggt 840
ggaggcggag gttctggggg aggaggtagt ggcggtggtg gttcaggagg cggcggaagc 900
cagctgcatt taccgcaggt tttagctgac gctgtctcac gcctggtcat aggtaagttt 960
ggtgacctga ccgacaactt ctcctcccct cacgctcgca gaataggtct ggctggagtc 1020
gtcatgacaa caggcacaga tgttaaagat gccaaggtga tatgtgtttc tacaggagca 1080
aaatgtatta atggtgaata cctaagtgat cgtggccttg cattaaatga ctgccatgca 1140
gaaatagtat ctcggagatc cttgctcaga tttctttata cacaacttga gctttactta 1200
aataacgagg atgatcaaaa aagatccatc tttcagaaat cagagcgagg ggggtttagg 1260
ctgaaggaga atatacagtt tcatctgtac atcagcacct ctccctgtgg agatgccaga 1320
atcttctcac cacatgaggc aatcctggaa gaaccagcag atagacaccc aaatcgtaaa 1380
gcaagaggac agctacggac caaaatagag gctggtcagg ggacgattcc agtgcgcaac 1440
aatgcgagca tccaaacgtg ggacggggtg ctgcaagggg agcggctgct caccatgtcc 1500
tgcagtgaca agattgcacg ctggaacgtg gtgggcatcc agggatcact gctcagcatt 1560
ttcgtggagc ccatttactt ctcgagcatc atcctgggca gcctttacca cggggaccac 1620
ctttccaggg ccatgtacca gcggatctcc aacatagagg acctgccacc tctctacacc 1680
ctcaacaagc ctttgctcac aggcatcagc aatgcagaag cacggcagcc agggaaggcc 1740
cccatattca gtgtcaactg gacggtaggc gactccgcta ttgaggtcat caacgccacg 1800
actgggaagg gagagctggg ccgcgcgtcc cgcctgtgta agcacgcgtt gtactgtcgc 1860
tggatgcgtg tgcacggcaa ggttccctcc cacttactac gctccaagat taccaagccc 1920
aacgtgtacc atgagacaaa gctggcggca aaggagtacc aggccgccaa ggcgcgtctg 1980
ttcacagcct tcatcaaggc ggggctgggg gcctgggtgg agaagcccac cgagcaggac 2040
cagttctcac tcacgtaa 2058
<210> 82
<211> 1971
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 82
atgcctaaga agaagcggaa ggtgttcgtg acccaggtga tcttcaacat cggcgaacgg 60
acgtaccccg acagggctcg ggctatggtg gccgagctga tggatggcgt ccagcctggc 120
ctggtggcca ccctgatgaa ctacatcccc ggcaccagca cgagccggac agagttcccc 180
accgtgcagt tcggcggcgc cagcgacggc ttttgcctgc tgggcttcgg cgacggcggc 240
ggcgccatcg tgagagatgc cgtgcccctg atccacgccg ccctggcaag gcggatgcct 300
gatcggatca tccaggtgga acacaaggag cacagcctgt ccgccgaggc ccggccctac 360
gtgctgagct acaccgtgcc tcggatggtg gtgcagaaga agcagcggca cgccgagaga 420
ctgctgcacg aagccgaggg aaaggctcac ctggagggcc tgttcctgcg gagcctgcag 480
aggcaggccg ccgccgtggg cctgcccctg cccgagaacc tggaggtgga gttcaaggga 540
gccgtgggcg acttcgccgc aaagcacaat ccaaatagca aggtggccta ccggggactg 600
agaggcgccg tgttcgatgt gaacgccaga ctgggcggca tctggaccgc cggattcatg 660
ctgagcaagg gctacggcca gtttaacgcc acccaccagc tgagcggcgc cgtgaacgct 720
ctgtccgaac ccaagaagaa gcggaaggtg ggtggaggcg gaggttctgg gggaggaggt 780
agtggcggtg gtggttcagg aggcggcgga agccagctgc atttaccgca ggttttagct 840
gacgctgtct cacgcctggt cataggtaag tttggtgacc tgaccgacaa cttctcctcc 900
cctcacgctc gcagaatagg tctggctgga gtcgtcatga caacaggcac agatgttaaa 960
gatgccaagg tgatatgtgt ttctacagga gcaaaatgta ttaatggtga atacctaagt 1020
gatcgtggcc ttgcattaaa tgactgccat gcagaaatag tatctcggag atccttgctc 1080
agatttcttt atacacaact tgagctttac ttaaataacg aggatgatca aaaaagatcc 1140
atctttcaga aatcagagcg aggggggttt aggctgaagg agaatataca gtttcatctg 1200
tacatcagca cctctccctg tggagatgcc agaatcttct caccacatga ggcaatcctg 1260
gaagaaccag cagatagaca cccaaatcgt aaagcaagag gacagctacg gaccaaaata 1320
gaggctggtc aggggacgat tccagtgcgc aacaatgcga gcatccaaac gtgggacggg 1380
gtgctgcaag gggagcggct gctcaccatg tcctgcagtg acaagattgc acgctggaac 1440
gtggtgggca tccagggatc actgctcagc attttcgtgg agcccattta cttctcgagc 1500
atcatcctgg gcagccttta ccacggggac cacctttcca gggccatgta ccagcggatc 1560
tccaacatag aggacctgcc acctctctac accctcaaca agcctttgct cacaggcatc 1620
agcaatgcag aagcacggca gccagggaag gcccccatat tcagtgtcaa ctggacggta 1680
ggcgactccg ctattgaggt catcaacgcc acgactggga agggagagct gggccgcgcg 1740
tcccgcctgt gtaagcacgc gttgtactgt cgctggatgc gtgtgcacgg caaggttccc 1800
tcccacttac tacgctccaa gattaccaag cccaacgtgt accatgagac aaagctggcg 1860
gcaaaggagt accaggccgc caaggcgcgt ctgttcacag ccttcatcaa ggcggggctg 1920
ggggcctggg tggagaagcc caccgagcag gaccagttct cactcacgta a 1971
<210> 83
<211> 2040
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 83
atgcccaaga agaagagaaa ggtgcaccag accctgatcc ggatcaactg gcccaaggga 60
ttcaagtgcc cccctgccga gttccgggaa aagctggcca agagcgagat gttccccccc 120
gagttcttcc actacggcac ggaactggcc gtgtgggaca agcagaccgc cgaggtggag 180
ggcaagatca agaccgtgtc caaggagaag atcatcaaga cctttgacaa gcccatcccc 240
ctgaatggcc gggccccggt cagagtgatc ggcggccagg cctgggccgg cgtgatcgcc 300
gaccccgaga tggagggcat gctgatccca cacctgggga gcatcctgaa ggtggccagc 360
agcgcggccg gatgcgcagt gaagatcgaa ctggaacaga gaaagttcgg catcagctac 420
accgagtacc ccgtgaagta caacctgcgg gagctggtgc tgaagagaag atgcgaggac 480
gcccggtcta ccgatatcga gagcctgatt gccgatagaa tctggggcgg cgtgtccggc 540
gagagctact atggcatcga cggcacatgc gccaagtttg gcttcgaacc ccccagcaga 600
gagcagctgg agctgcggat cttccccatg aagaacatcg gactgcacat gaagtccagc 660
gacggactgt ccaaggagta catgagcctg attgacgccg aggtgtggat gaacgctaag 720
ctggaaggag tgtggcaggt gggcaacctg atcagcaggg gctacggccg gttcatcaag 780
tctatcggcg cccagtcccc caagaagaag cggaaggtgg gtggaggcgg aggttctggg 840
ggaggaggta gtggcggtgg tggttcagga ggcggcggaa gccagctgca tttaccgcag 900
gttttagctg acgctgtctc acgcctggtc ataggtaagt ttggtgacct gaccgacaac 960
ttctcctccc ctcacgctcg cagaataggt ctggctggag tcgtcatgac aacaggcaca 1020
gatgttaaag atgccaaggt gatatgtgtt tctacaggag caaaatgtat taatggtgaa 1080
tacctaagtg atcgtggcct tgcattaaat gactgccatg cagaaatagt atctcggaga 1140
tccttgctca gatttcttta tacacaactt gagctttact taaataacga ggatgatcaa 1200
aaaagatcca tctttcagaa atcagagcga ggggggttta ggctgaagga gaatatacag 1260
tttcatctgt acatcagcac ctctccctgt ggagatgcca gaatcttctc accacatgag 1320
gcaatcctgg aagaaccagc agatagacac ccaaatcgta aagcaagagg acagctacgg 1380
accaaaatag aggctggtca ggggacgatt ccagtgcgca acaatgcgag catccaaacg 1440
tgggacgggg tgctgcaagg ggagcggctg ctcaccatgt cctgcagtga caagattgca 1500
cgctggaacg tggtgggcat ccagggatca ctgctcagca ttttcgtgga gcccatttac 1560
ttctcgagca tcatcctggg cagcctttac cacggggacc acctttccag ggccatgtac 1620
cagcggatct ccaacataga ggacctgcca cctctctaca ccctcaacaa gcctttgctc 1680
acaggcatca gcaatgcaga agcacggcag ccagggaagg cccccatatt cagtgtcaac 1740
tggacggtag gcgactccgc tattgaggtc atcaacgcca cgactgggaa gggagagctg 1800
ggccgcgcgt cccgcctgtg taagcacgcg ttgtactgtc gctggatgcg tgtgcacggc 1860
aaggttccct cccacttact acgctccaag attaccaagc ccaacgtgta ccatgagaca 1920
aagctggcgg caaaggagta ccaggccgcc aaggcgcgtc tgttcacagc cttcatcaag 1980
gcggggctgg gggcctgggt ggagaagccc accgagcagg accagttctc actcacgtaa 2040
<210> 84
<211> 867
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 84
atgcctctga tcttcaagat cggctataac gtgatccccc tgcaggacgt gatcctgccc 60
accccttcca gcaaggtgct gaagtacctg atccagagcg gcaagctgat ccccagcctg 120
aaggacctga tcaccagccg ggacaagtac aagccaatct tcatctccca cctgggcttc 180
aaccagcgga ggattttcca gaccaacggc aatctgaaaa ccatcaccaa gggcagtaga 240
ctgagctcca tcatcgcctt cagcacccag gccaacgtgc tgtccgaggt ggccgatgaa 300
gggatcttcg aaaccgtgta cggaaagttc cacatcatga tcgaaagcat cgagatcgtg 360
gaggtggaaa agctgaagga ggaggtggag aagcacatga acgacaacat cagagtgaga 420
ttcgtgtctc ccacactgct gagctccaag gtgctgctgc cccccagcct gtccgaaaga 480
tacaagaaga tccacgccgg gtacagcacc ctgcccagcg tgggcctgat cgtggcctac 540
gcctacaacg tgtactgcaa tctgatcggc aagaaggaag tggaagtgcg ggccttcaag 600
tttggaatcc tgagcaacgc cctgtccaga atcatcggct acgacctgca ccctgtgacc 660
gtggccatcg gcgaggacag caaggggaat ctgagaaagg ctcggggcgt gatgggctgg 720
atcgagttcg acatccccga cgaaagactg aagcggcggg ccctgaacta tctgctgacc 780
agcagctacc tgggcatcgg gagatctcgg ggcatcggct tcggcgagat ccggctggag 840
ttccggaaga ttgaagagaa ggaggga 867
<210> 85
<211> 654
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 85
atggacctgg agtacatgca catctcctac cctaacatcc tgctgaacat gcgggacggc 60
agcaagctgc ggggctactt cgccaagaag tacatcgacg aagagattgt gcacaaccac 120
agagacaacg cctttgtgta caagtacccc cagatccagt ttaagatcat cgatagaagc 180
cccctgatca tcggcattgg ctctctgggc atcaatttcc tggagagcaa gcggatcttc 240
ttcgagaagg aactgattat cagcaacgac accaacgaca tcaccgaggt gaacgtgcac 300
aaggacatgg atcacttcgg cacgaccgac aagatcctga agtaccagtt caagacccct 360
tggatggcac tgaacgccaa gaatagcgag atctacaaga actctgacga gatcgaccgg 420
gaggagttcc tgaagagagt gctgattggg aatatcctga gcatgtctaa gagcctgggc 480
tataccatcg aagaaaagct gaaggtgaag attaacctga aggaagtgcc cgtgaagttc 540
aagaaccaga acatggtggg ctttcggggc gagttctaca tcaacttcga catccctcag 600
tatctgggca tcggccggaa tgtgtcccgg ggattcggca cagtggtgaa ggtg 654
<210> 86
<211> 708
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 86
atgagaaatg aagtgcagtt cgagctgttc ggcgactacg ccctgttcac cgaccccctg 60
accaagatcg gcggcgaaaa gctgagctac agcgtgccta cctaccaggc cctgaagggc 120
atcgccgaga gcatctactg gaagcccacc atcgtgttcg tgatcgacga actgcgggtc 180
atgaagccca ttcagatgga gtctaagggc gtgaggccca tcgagtacgg cggcggcaac 240
accctggccc actacaccta cctgaaggat gtgcactacc aggtgaaggc ccacttcgag 300
ttcaacctgc accggcccga cctggccttc gatagaaacg agggcaagca ctactccatc 360
ctgcagagaa gcctgaaggc cggcggcaga agagatattt tcctgggcgc ccgggagtgc 420
cagggctacg tggccccctg cgagttcggc agcggcgacg gcttctacga cggccagggc 480
aagtaccacc tgggaaccat ggtgcacggt ttcaactacc ccgacgaaac cggacagcac 540
cagctggatg tgagactgtg gtctgccgtc atggaaaacg gctacatcca gttcccccgc 600
cctgaggact gccccatcgt gcggcctgtg aaggagatgg aacccaagat cttcaacccc 660
gacaacgtgc agtccgccga acagctgctg cacgacctgg gcggcgaa 708
<210> 87
<211> 726
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 87
atgtacagaa gccgggactt ctacgtgaga gtgtccggcc agcgggccct gttcaccaac 60
cccgccacca agggcggctc cgaacggagc tcctactccg tgcctacccg gcaggccctg 120
aacgggattg tggacgccat ctactacaag cccacgttca ccaacatcgt gaccgaggtg 180
aaggtgatta accagatcca gaccgaactg cagggcgtgc gggccctgct gcatgactac 240
agcgccgacc tgagctacgt gtcctacctg agcgacgtgg tgtacctgat taagtttcat 300
ttcgtgtgga acgaggatag aaaggacctg aatagcgacc ggctgccagc caagcatgag 360
gccatcatgg agcggtctat ccggaagggc ggcagacggg acgtgttcct gggcaccaga 420
gaatgcctgg gcctgctgga cgacatcagc caggaagaat acgaaaccac agtgagctat 480
tacaatgggg tgaacatcga cctgggcatc atgttccaca gcttcgctta ccccaaggac 540
aagaaaaccc ccctgaagtc ctacttcaca aagaccgtga tgaagaacgg cgtgatcacc 600
ttcaaggccc agtccgaatg cgatattgtg aacaccctga gctcctacgc cttcaaggcc 660
cccgaggaga tcaagagcgt gaacgacgag tgcatggagt acgacgccat ggagaagggc 720
gaaaac 726
<210> 88
<211> 780
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 88
atgcccaacg atccctacag cctgtactcc atcgtgatcg aactgggcgc cgccgaaaag 60
ggattcccca caggcatcct gggcagaagc ctgcatagcc aggtgctgca gtggttcaag 120
caggataacc ccttcctggc caccgagctg caccagagcc agatctcccc cttctccatc 180
tctccactga tgggcaagcg gcacgccaag ctgaccaagg ccggcgaccg gctgttcttt 240
cggatctgcc tgctgagagg agatctgctg cagcccctgc tgaacggcat tgagcagacc 300
gtgaaccaga gcgtgtgcct ggacaagttc cggttccggc tgtgccagac ccacatcctg 360
cccggcagcc accctctggc tggcgcctcc cactatagcc tgatcagcca gaccccagtg 420
agctccaaga ttaccctgga cttcaagagt tctacctcct tcaaggtgga ccggaagatc 480
atccaagtgt tccctctggg cgaacacgtg ttcaacagcc tgctcagacg ctggaataac 540
ttcgcccccg aggacctgca cttctctcag gtggactgga gcatccccat cgccgcattc 600
gacgtgaaaa ccatccccat ccacctgaag aaggtcgaga tcggcgcaca gggctgggtg 660
acctacatct tccccaacac agaacaggcc aagatcgcct ccgtgctgag cgaattcgcc 720
ttcttcagcg gagtgggacg gaaaaccacc atgggcatgg gccaggtgca ggtgcggtcc 780
<210> 89
<211> 597
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 89
atgtacctga gcaaggtgat catcgccaga gcctggagca gagacctgta ccagctgcac 60
cagggcctgt ggcacctgtt ccccaaccgg cccgacgccg cccgggattt cctgttccac 120
gtggagaaga gaaacacccc ggaaggctgc cacgtgctgc tgcagagcgc acagatgcct 180
gtgagcaccg ccgtggccac cgtgatcaag accaagcagg tggagttcca gctgcaggtg 240
ggcgtgcccc tgtatttcag gctgcgggcg aatcccatca agaccatcct ggacaaccag 300
aagcggctgg acagcaaggg caacatcaag aggtgcagag tgcctctgat caaggaggcc 360
gaacagatcg cctggctgca gcggaagctg ggcaatgccg ccagagtgga ggacgtgcac 420
cccatcagcg agcggcccca gtacttctcc ggcgacggaa agagcggaaa gatccagacc 480
gtgtgcttcg agggcgtgct gaccatcaac gacgcacccg ccctgatcga cctcgtgcag 540
caggggatcg gccctgccaa gtccatgggc tgcggactgc tgtccctggc ccccctg 597
<210> 90
<211> 561
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 90
atggaccact acctggacat tagactgcgc cctgacccag agttccctcc tgcccagctg 60
atgtctgtgc tgtttggcaa gctgcaccag gccctggtgg cccagggcgg tgacagaatc 120
ggagtgtctt tccctgatct ggacgaatct agatctagac tgggagagag actgagaatc 180
cacgcgtctg ccgacgacct gagagctctg ctggccagac catggctgga aggactgcgc 240
gaccacctgc agttcggtga acctgccgtg gtgcctcacc caactccata cagacaggtg 300
agtagagtgc aggcaaagtc taatccagag agactgagac gcagactgat gagaaggcat 360
gacctgtccg aagaagaagc cagaaagaga atcccagaca cagtggccag agccctggat 420
ctgccttttg tgaccctgag aagccagtct accggccagc acttcagact gtttattcgc 480
cacggaccac tgcaggtgac cgccgaagag ggaggtttta cctgctacgg actgagcaag 540
ggaggtttcg tgccttggtt c 561
<210> 91
<211> 942
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 91
atggccgcca gaagaggcgg aatccggaga accgacctgc tgcggaggtc tggccagcct 60
cggggcagac accgggcctc cgccgccgag agcggcctga catggatctc ccctaccctg 120
atcctggtgg gcttcagcca caggggcgat aggagaatga ccgagcacct gtccagactg 180
accctgaccc tggaagtgga tgcccccctg gagagagccc gggtggccac cctgggcccc 240
cacctgcatg gcgtgctgat ggagtctatc cccgccgact acgtgcagac actgcacaca 300
gtgccggtga acccttacag ccagtacgct ctggcccgga gcaccaccag cctggagtgg 360
aagatctcca ccctgacaaa tgaggcccgg cagcagatcg tcggccccat caacgacgcc 420
gccttcgccg gcttccggct gcgggccagc ggcatcgcca cccaggtgac aagcagaagc 480
ctggagcaga accccctgtc ccagtttgcc agaatcttct acgccaggcc cgaaacccgc 540
aagttcagag tggagttcct gacccccacc gccttcaagc agagcggcga gtacgtgttt 600
tggcccgatc ccagactggt gttccagtcc ctggcccaga agtacggcgc catcgtggac 660
ggagaagagc ccgaccccgg cctgatcgcc gagtttggcc agtccgtgag actgagcgcc 720
ttcagagtgg ccagcgcccc ttttgccgtg ggcgccgcca gggtgcccgg attcaccggc 780
agcgccacct tcaccgtgcg gggagtggac accttcgcca gctacatcgc cgctctgctg 840
tggttcggcg agttcagcgg atgcggcatc aaggcctcca tgggaatggg cgccatccgg 900
gtgcagcctc tggccccccg ggagaagtgc gtgcccaagc cc 942
<210> 92
<211> 792
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 92
atgagattcc tgatcagact ggtgcccgag gacaaggaca gagccttcaa ggtgccttac 60
aaccaccagt actatctgca gggcctgatc tacaacgcca tcaagtcctc caaccccaag 120
ctggccacct acctgcacga ggtgaagggc cccaagctgt tcacctacag cctgttcatg 180
gccgaaaagc gggagcaccc taagggcctg ccctactttc tgggctacaa gaagggcttc 240
ttctacttca gcacctgcgt gcccgagatc gccgaggccc tggtgaacgg cctgctgatg 300
aatcccgagg tgcggctgtg ggacgagaga ttctacctgc acgaaatcaa ggtcctgcgg 360
gagcccaaga agttcaacgg cagcaccttc gtgaccctga gccccatcgc cgtgaccgtg 420
gtgagaaagg gcaagtccta cgacgtgccc cccatggaaa aggagttcta cagcattatc 480
aaggatgacc tgcaggacaa gtacgtgatg gcctacggcg acaagccccc cagtgagttc 540
gagatggaag tgctgatcgc caagcccaag cggttccgga tcaagcccgg catctatcag 600
accgcctggc acctggtgtt tcgggcctac ggcaatgacg acctgctgaa ggtgggctac 660
gaagtgggat tcggggagaa gaactccctg ggattcggaa tggtcaaggt ggagggcaac 720
aagaccacca aggaagccga agaacaggag aagatcacct tcaactcccg ggaagagctg 780
aaaacaggcg tg 792
<210> 93
<211> 708
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 93
atgttcgtga cccaggtgat cttcaacatc ggcgaacgga cgtaccccga cagggctcgg 60
gctatggtgg ccgagctgat ggatggcgtc cagcctggcc tggtggccac cctgatgaac 120
tacatccccg gcaccagcac gagccggaca gagttcccca ccgtgcagtt cggcggcgcc 180
agcgacggct tttgcctgct gggcttcggc gacggcggcg gcgccatcgt gagagatgcc 240
gtgcccctga tccacgccgc cctggcaagg cggatgcctg atcggatcat ccaggtggaa 300
cacaaggagc acagcctgtc cgccgaggcc cggccctacg tgctgagcta caccgtgcct 360
cggatggtgg tgcagaagaa gcagcggcac gccgagagac tgctgcacga agccgaggga 420
aaggctcacc tggagggcct gttcctgcgg agcctgcaga ggcaggccgc cgccgtgggc 480
ctgcccctgc ccgagaacct ggaggtggag ttcaagggag ccgtgggcga cttcgccgca 540
aagcacaatc caaatagcaa ggtggcctac cggggactga gaggcgccgt gttcgatgtg 600
aacgccagac tgggcggcat ctggaccgcc ggattcatgc tgagcaaggg ctacggccag 660
tttaacgcca cccaccagct gagcggcgcc gtgaacgctc tgtccgaa 708
<210> 94
<211> 777
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 94
atgcaccaga ccctgatccg gatcaactgg cccaagggat tcaagtgccc ccctgccgag 60
ttccgggaaa agctggccaa gagcgagatg ttcccccccg agttcttcca ctacggcacg 120
gaactggccg tgtgggacaa gcagaccgcc gaggtggagg gcaagatcaa gaccgtgtcc 180
aaggagaaga tcatcaagac ctttgacaag cccatccccc tgaatggccg ggccccggtc 240
agagtgatcg gcggccaggc ctgggccggc gtgatcgccg accccgagat ggagggcatg 300
ctgatcccac acctggggag catcctgaag gtggccagca gcgcggccgg atgcgcagtg 360
aagatcgaac tggaacagag aaagttcggc atcagctaca ccgagtaccc cgtgaagtac 420
aacctgcggg agctggtgct gaagagaaga tgcgaggacg cccggtctac cgatatcgag 480
agcctgattg ccgatagaat ctggggcggc gtgtccggcg agagctacta tggcatcgac 540
ggcacatgcg ccaagtttgg cttcgaaccc cccagcagag agcagctgga gctgcggatc 600
ttccccatga agaacatcgg actgcacatg aagtccagcg acggactgtc caaggagtac 660
atgagcctga ttgacgccga ggtgtggatg aacgctaagc tggaaggagt gtggcaggtg 720
ggcaacctga tcagcagggg ctacggccgg ttcatcaagt ctatcggcgc ccagtcc 777
<210> 95
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<220>
<221> VARIANT
<222> (3)..(3)
<223> /replace="Phe"
<220>
<221> VARIANT
<222> (4)..(4)
<223> /replace="Tyr"
<220>
<221> SITE
<222> (1)..(6)
<223> /note="Variant residues given in the sequence have no
preference with respect to those in the annotations
for variant positions"
<400> 95
Arg Asn Tyr Phe Ser His
1 5
<210> 96
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 96
Arg Asn Tyr Phe Ser His
1 5
<210> 97
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 97
Arg Asn Phe Tyr Ser His
1 5
<210> 98
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<220>
<221> VARIANT
<222> (3)..(3)
<223> /replace="Lys"
<220>
<221> SITE
<222> (1)..(6)
<223> /note="Variant residues given in the sequence have no
preference with respect to those in the annotations
for variant positions"
<400> 98
Arg Asn Ala Ala Leu His
1 5
<210> 99
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 99
Arg Ala Phe Phe His His
1 5
<210> 100
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 100
Arg Arg Ala Phe Phe His
1 5
<210> 101
<211> 145
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (70)..(70)
<223> a, c, t, or g
<220>
<221> variation
<222> (145)..(145)
<223> /replace=" "
<220>
<221> misc_feature
<222> (1)..(145)
<223> /note="Variant nucleotides given in the sequence have no
preference with respect to those in the annotations
for variant positions"
<400> 101
ttggccactc cctcthtgcg cgctcgctcg ctcgctgggg cctggvgacc aaaggtcgcc 60
agacggccgn gctctgcccg gccggcccca gcgagcgagc gagcgcgcad agagggagtg 120
gccaactcca tcactagggg tdccb 145
<210> 102
<211> 144
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> variation
<222> (1)..(1)
<223> /replace=" "
<220>
<221> modified_base
<222> (89)..(89)
<223> a, c, t, or g
<220>
<221> misc_feature
<222> (1)..(144)
<223> /note="Variant nucleotides given in the sequence have no
preference with respect to those in the annotations
for variant positions"
<400> 102
rdtaccccta gtgatggagt tggccactcc ctctatgcgc gctcgctcgc tcggtggggc 60
ctgcvgacca aaggtcbcca gacggcvgng ctctgchcgg ccggccccac cgagcgagcg 120
agcgcgcata gagggagtgg ccaa 144
<210> 103
<211> 22
<212> DNA
<213> Adeno-associated virus - 2
<400> 103
ctgcgcgctc gctcgctcac tg 22
<210> 104
<211> 22
<212> DNA
<213> Adeno-associated virus - 2
<400> 104
cagtgagcga gcgagcgcgc ag 22
Claims (47)
- DNA 바이러스의 바이러스 입자에 패키징될 수 있는 리보뉴클레오티드(RNA) 서열로서,
상기 RNA 서열은
(1) 관심 유전자(GOI)의 RNA 코딩 서열, mRNA와 같은 단백질(예를 들어, 치료성 단백질, 항원 단백질, 또는 CRISPR/Cas 이펙터 효소(“Cas 단백질”로 약칭)와 같은 유전자 편집 단백질, ZFN 단백질, TALEN 단백질)을 코딩하는 RNA, 또는 비코딩 기능적 RNA(예를 들어, 운반 RNA(tRNA), 리보솜 RNA(rRNA), 작은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 안티센스 RNA, 안티센스 올리고뉴클레오티드, 마이크로 RNA(miRNA), 또는 CRISPR-Cas(예를 들어, Cas9, Cas12, Cas13) 시스템의 RNA 성분(단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라)와 같은 가이드 RNA(또는 gRNA), CRISPR RNA(crRNA) 및 tracr RNA 포함)), 또는 그 전구체와 같은 관심 RNA 서열(RSI); 및
(2) 직접 또는 간접적으로 RPS 상호 작용 분자와 상호 작용(예를 들어 결합)할 수 있고, 상기 RPS 상호 작용 분자가 상기 RNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진하는 RNA 패키징 신호(RPS);를 포함하고,
선택적으로, 상기 RNA 서열을 코딩하거나 이에 대응되는 DNA 서열 또는 상기 DNA 서열의 역-상보적인 서열은 상기 DNA 바이러스의 바이러스 입자에 패키징되는 능력(AAV 패키징을 위한 기능적 AAV ITR과 같은 상기 DNA 서열 또는 그 역-상보적인 서열은 DNA 패키징 신호가 결핍)이 감소되거나, 약화되거나 또는 거의 없는, DNA 바이러스의 바이러스 입자에 패키징될 수 있는 리보뉴클레오티드(RNA) 서열. - 제1항에 있어서,
상기 DNA 바이러스의 바이러스 입자는 AAV 바이러스 입자 또는 종양용해 바이러스 입자인, RNA 서열. - 제1항 또는제2항에 있어서,
상기 RPS는 상기 RSI의 5’ 말단에 위치하거나 가깝거나, 상기 RSI의 3’ 말단에 위치하거나 가깝거나 또는 상기 RSI의 내부(예를 들어, mRNA의 인트론 내)에 위치하는, RNA 서열. - 제1항 내지 제3항 중 어느 한 항에 있어서,
서로 같거나 다른 하나 이상(예를 들어, 1개, 2개, 3개 이상)의 RPS를 포함하는, RNA 서열. - 제4항에 있어서,
상기 하나 이상의 RPS 중의 2개 이상(예를 들어, 3개)은 서로 같거나 다른 링커를 통해 서로 인접하거나 또는 직렬 연결되는, RNA 서열. - 제4항 또는 제5항에 있어서,
서로 인접하지 않는(예를 들어, 각자 상기 관심 RNA 서열(RSI)의 하나의 말단에 위치하거나 가까움) 2개 이상의 RPS를 포함하는, RNA 서열. - 제2항 내지 제6항 중 어느 한 항에 있어서,
상기 RPS는 전사되고 변형된 AAV말단 역반복(ITR)을 포함하고, 상기 전사되고 변형된 AAV ITR은
(a) 전사된 기능적 Rep 결합 요소(RBE)를 포함하고, 선택적으로 전사된 기능적 RBE’를 더 포함하며; 및
(b) 전사된 말단 분해 부위(TRS) 또는 전사된 역-상보적인 TRS(rcTRS) 또는 둘 모두가 결핍되며;
선택적으로, 상기 전사되고 변형된 AAV ITR은 전사된 D 영역 서열(D서열 또는 D’서열)을 더 포함하고; 및/또는
선택적으로, 상기 RPS 상호 작용 분자는 Rep78, Rep68, Rep52 및/또는 Rep40인, RNA 서열. - 제7항에 있어서,
상기 전사되고 변형된 AAV ITR은 상기 RNA의 3’말단 1000개의 뉴클레오티드, 800개의 뉴클레오티드, 500개의 뉴클레오티드, 300개의 뉴클레오티드 또는 200개의 뉴클레오티드 내에 존재하고, 선택적으로, 상기 전사되고 변형된 AAV ITR은 폴리A 서열, 폴리A 신호 서열(예를 들어, AAUAAA) 또는 RNA전사 종결 서열(예를 들어, 히스톤 다운스트림 요소)의 5’에 존재하는, RNA 서열. - 제7항 내지 제8항 중 어느 한 항에 있어서,
상기 전사되고 변형된 AAV ITR은 전사된 야생형 Flip 또는 Flop ITR에 기반하여 변형된 것이고; 선택적으로, 상기 야생형 Flip 또는 Flop ITR은 AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAVrh74, AAV8, AAV9, AAV10, AAV11, AAV12 또는 AAV13으로부터 유래되는(선택적으로, 상기 야생형 Flop ITR은 SEQ ID NO: 1의 뉴클레오티드 서열을 가짐), RNA 서열. - 제7항 내지 제9항 중 어느 한 항에 있어서,
상기 전사되고 변형된 AAV ITR은 상기 전사된 TRS 및 상기 전사된 rcTRS 둘 모두가 결핍된, RNA 서열. - 제7항 내지 제10항 중 어느 한 항에 있어서,
상기 전사되고 변형된 AAV ITR은 상기 전사된 D 영역 서열을 포함하는(선택적으로, 상기 변형된 AAV ITR은 SEQ ID NO: 3의 뉴클레오티드 서열을 가짐), RNA 서열. - 제7항 내지 제10항 중 어느 한 항에 있어서,
상기 전사되고 변형된 AAV ITR은 상기 전사된 D 영역 서열이 결핍된(선택적으로, 상기 변형된 AAV ITR은 SEQ ID NO: 2의 뉴클레오티드 서열을 가짐), RNA 서열. - 제7항 내지 제12항 중 어느 한 항에 있어서,
제2 전사되고 변형된 AAV ITR을 더 포함하고, 상기 제2 전사되고 변형된 AAV ITR은 제2 전사된 기능적 RBE 서열을 가지나 제2 전사된 TRS 또는 제2 전사된 rcTRS 또는 둘 모두가 결핍되며, 선택적으로, 상기 제2 전사되고 변형된 AAV ITR은 제2 전사된 D 영역 서열을 더 포함하는, RNA 서열. - 제13항에 있어서,
상기 전사되고 변형된 AAV ITR과 상기 제2 전사되고 변형된 AAV ITR은 서로 같은(또는 다른), RNA 서열. - 제7항 내지 제14항 중 어느 한 항에 있어서,
상기 전사되고 변형된 AAV ITR 및 상기 제2 전사되고 변형된 AAV ITR은 (만약 존재하면)대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 결실, 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 돌연변이 또는 대응되는 전사된 야생형 AAV ITR D 영역 서열 또는 대응되는 전사된 야생형 TRS/rcTRS 중의 삽입을 포함하는, RNA 서열. - 제13항 내지 제15항 중 어느 한 항에 있어서,
상기 제2 전사되고 변형된 AAV ITR은 상기 RNA 서열의 5’ 말단 1000개의 뉴클레오티드, 800개의 뉴클레오티드, 500개의 뉴클레오티드, 250개의 뉴클레오티드 또는 150개의 뉴클레오티드 내에 존재하는, RNA 서열. - 제2항 내지 제6항 중 어느 한 항에 있어서,
상기 RPS는 MS2 서열, PP7 결합 부위 또는 com 결합 부위를 포함하고, 상기 RPS 상호 작용 분자는 직접 또는 간접적으로 상기 RPS와 상호 작용(예를 들어 결합)할 수 있는 RPS 상호 작용 단백질(RPSIP)을 포함하며, 예를 들어 MS2 서열의 경우 박테리오파지 유래의 MS2 외피 단백질(MCP), PP7 결합 부위의 경우 PP7 박테리오파지 외피 단백질(PCP) 또는 com 결합 부위의 경우 박테리오파지 COM 단백질(COM)을 포함하는, RNA 서열. - 제17항에 있어서,
상기 RPSIP는 직접 또는 간접적으로 상기 DNA 바이러스의 바이러스 입자의 바이러스 패키징 시스템의 단백질 성분(예를 들어 아데노 관련 바이러스 2(AAV2)의 Rep78 및/또는 Rep68 또는 조립 활성화 단백질(AAP))과 관련(예를 들어, 융합)되는, RNA 서열. - 제1항 내지 제18항 중 어느 한 항에 있어서,
상기 RNA 서열은 전사된 DNA 패키징 신호, 예를 들어, 전사된 야생형 AAV ITR 서열(예를 들어, 상기 RNA 서열은 전사되고 변형된 AAV ITR 서열을 포함하고, 상기 전사되고 변형된 AAV ITR 서열은 대응되는 전사된 야생형 AAV ITR 서열의 뉴클레오티드의 추가, 결실 및/또는 치환을 가져 상기 DNA 바이러스의 바이러스 입자의 DNA 패키징 능력을 저하)를 포함하거나 바람직하게는 포함하지 않는, RNA 서열. - 제1항 내지 제19항 중 어느 한 항에 있어서,
(1) 전사된 전사 인핸서;
(2) 전사된 인트론 서열 또는 엑손 서열(예를 들어 단백질 발현을 강화하기 위한 전사된 인트론 서열 또는 엑손 서열);
(3) 5’ UTR 서열;
(4) 3’ UTR 서열;
(5) 폴리A 서열 또는 폴리아데닐화(폴리A) 신호 서열 및 선택적으로 상기 폴리A 신호 서열 다운스트림의 GU 풍부 영역;
(6) 전사 후 조절 요소 또는 서열, 예를 들어 전사된 우드척 간염 바이러스(WHP) 전사 후 조절 요소(WPRE) 서열; 및/또는
(7) 전사 종결 서열(예를 들어 히스톤 다운스트림 요소)을 더 포함하고,
선택적으로, 상기 RNA 서열은 상기 전사 후 조절 요소 또는 서열의 3’ 및 상기 폴리A 서열 또는 폴리A 신호 서열의 5’에 위치하는 RPS를 포함하는, RNA 서열. - 제20항에 있어서,
5’ 에서 3’ 방향으로 상기 RSI, 상기 임의의 전사된 WPRE 서열; 상기 RPS(예를 들어 상기 전사되고 변형된 AAV ITR, 상기 MS2 서열, 상기 PP7 결합 부위 또는 상기 com 결합 부위); 및 상기 폴리A 서열 또는 상기 폴리A 신호 서열을 포함하는, RNA 서열. - 제1항 내지 제21항 중 어느 한 항에 있어서,
상기 GOI는 단백질(예를 들어, 형광 단백질, 치료성 단백질, 항원 단백질, 또는 유전자 편집 단백질, 예를 들어 Cas 단백질, ZFN 단백질, TALEN 단백질), 효소(예를 들어 Cre 단백질 또는 CRISPR/Cas 이펙터 효소(예를 들어, Cas9, Cas12, Cas13),또는 그 변이체), 구조 단백질, mRNA, 비코딩 RNA(ncRNA), siRNA, piRNA, 짧은 헤어핀 RNA 또는 shRNA, 마이크로 RNA(miRNA) 또는 그 전구체(전구체 miRNA 및 pri-miRNA 포함), 리보솜 RNA(rRNA), 안티센스 서열 또는 올리고뉴클레오티드(ASO), CRISPR-Cas시스템의 RNA 성분(단일 가이드 RNA(또는 sgRNA, 키메릭 RNA, RNA 키메라)와 같은 가이드 RNA(또는 gRNA), CRISPR RNA(crRNA) 및 tracr RNA 포함), CRISPR/Cas 이펙터 효소를 위한 가이드 RNA 또는 gRNA, rRNA, tRNA, snoRNA, snRNA, exRNA, scaRNA, lncRNA, Xist 및 HOTAIR을 포함하는, RNA 서열. - 제1항 내지 제22항 중 어느 한 항에 있어서,
길이가 약 8,900개의 뉴클레오티드 미만이고, 길이가 약 8,000개의 뉴클레오티드 미만이며, 길이가 약 7,000개의 뉴클레오티드 미만이고, 길이가 약 6,000개의 뉴클레오티드 미만이며, 길이가 약 5,200개의 뉴클레오티드 미만이고, 길이가 약 4,000개의 뉴클레오티드 미만이며, 길이가 약 3,000개의 뉴클레오티드 미만이고, 길이가 약 2,000개의 뉴클레오티드 미만이며, 길이가 약 4,700-5,200개의 뉴클레오티드이고, 길이가 약 4,700-5,000개의 뉴클레오티드이며, 길이가 약 4,700-4,800개의 뉴클레오티드이거나 또는 길이가 약 4,700개의 뉴클레오티드인 단일 가닥 RNA인, RNA 서열. - 폴리뉴클레오티드로서,
제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열을 코딩하는 카세트를 포함하고, 선택적으로, 상기 폴리뉴클레오티드는 DNA 서열(예를 들어, DNA 플라스미드)이며, 상기 DNA 서열은 선택적으로 상기 DNA 플라스미드의 백본에 스터퍼 서열을 포함하고, 및/또는 선택적으로 AAV ITR과 같은 기능적 DNA 패키징 신호를 포함하지 않는, 폴리뉴클레오티드. - 제24항에 있어서,
상기 카세트에 의해 코딩되는 상기 RNA 서열에 조작 가능하게 연결되고 전사되도록 구동하는 프로모터를 더 포함하는, 폴리뉴클레오티드. - 제25항에 있어서,
상기 프로모터는 편재 프로모터인, 폴리뉴클레오티드. - 제25항에 있어서,
상기 프로모터는 조직 특이적 프로모터인, 폴리뉴클레오티드. - 제25항 내지 제27항 중 어느 한 항에 있어서,
상기 프로모터는 전신 발현 프로모터인, 폴리뉴클레오티드. - 제25항 내지 제27항 중 어느 한 항에 있어서,
상기 프로모터는 유도성 프로모터인, 폴리뉴클레오티드. - 제25항 내지 제29항 중 어느 한 항에 있어서,
상기 프로모터에 의해 구동되는 상기 RNA 서열의 전사를 강화하는 인핸서를 더 포함하는, 폴리뉴클레오티드. - DNA 바이러스(예를 들어AAV 바이러스 또는 종양용해 바이러스)의 단백질 쉘(예를 들어 캡시드) 내에 패키징되는 RNA 게놈(예를 들어, 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드로부터 전사된 RNA 서열)을 포함하는, 재조합 DNA 바이러스의 바이러스 입자.
- 제31항에 있어서,
상기 DNA 바이러스는 AAV이고, 상기 재조합 DNA 바이러스의 바이러스 입자는 재조합 RNA 아데노 관련 바이러스(rRAAV) 입자이며, 상기 재조합 RNA 아데노 관련 바이러스 입자는
(1) AAV 캡시드; 및
(2) 상기 AAV 캡시드 내에 패키징되는 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드로부터 전사된 RNA 서열을 포함하는, 재조합 DNA 바이러스의 바이러스 입자. - 제32항에 있어서,
상기 AAV 캡시드는 혈청형 AAV1, AAV2, AAV3A, AAV3B, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV-DJ, AAV PHP.eB, Anc80L65, Anc80L65AAP, AAVrh74 또는 7m8의 AAV로부터 유래된 캡시드를 포함하는, 재조합 DNA 바이러스의 바이러스 입자. - 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체로서,
상기 군체는 복수의 제31항 내지 제33항 중 어느 한 항에 따는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)를 포함하고, 상기 군체 내의 상기 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 중의 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 이상은 이에 패키징된 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드로부터 전사된 RNA 서열을 갖는, 재조합 DNA 바이러스의 바이러스 입자의 군체. - 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열, 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드, 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드로부터 전사된 RNA 서열, 제31항 내지 제33항 중 어느 한 항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 및/또는 제34항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 포함하는, 숙주 세포.
- 제35항에 있어서,
바이러스 패키징 시스템을 더 포함하고, 상기 바이러스 패키징 시스템은 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드로부터 전사된 RNA 서열이 상기 DNA 바이러스의 바이러스 입자 중에 패키징되도록 촉진하는, 숙주 세포. - 제36항에 있어서,
상기 바이러스 패키징 시스템은
(1) rep 유전자 및 cap 유전자의 전사를 구동하는 하나 또는 복수의 프로모터의 전사 제어 하에 있는 AAV rep 유전자(예를 들어, Rep78, Rep68, Rep52 및/또는 Rep40의 코딩 서열) 및 AAV cap 유전자(예를 들어, VP1, VP2, VP3, AAP 및/또는 MAAP의 코딩 서열) 또는 그 발현 산물;
(2) 아데노 바이러스 E2A, E4 및 VA유전자 또는 상기 하나 이상의 단백질과 같이 AAV 패키징에 필요한 하나 이상의 단백질의 하나 또는 복수의 코딩 서열; 및
(3) 상기 RPS 상호 작용 분자 또는 그 코딩 서열;을 포함하고,
선택적으로, 상기 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 상기 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며; 및/또는 (3) 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거되는, 숙주 세포. - 제35항 내지 제37항 중 어느 한 항에 있어서,
포유동물 세포 (예를 들어 HEK293세포) 또는 곤충세포(예를 들어 Sf9 또는 Sf21세포)인, 숙주 세포. - 제31항 내지 제33항 중 어느 한 항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 제34항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 생성하는 방법에 있어서,
상기 방법은
a) 제35항 내지 제38항 중 어느 한 항에 따른 숙주 세포를 충분한 시간 동안 배양하는 단계; 및
b) 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 수득하는 단계를 포함하는, 방법. - 제39항에 있어서,
상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 단리 또는 정제하는 단계를 더 포함하는, 방법. - 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자의 군체를 생성하는 방법에 있어서,
상기 방법은
a) 바이러스 패키징 시스템(예를 들어, AAV 패키징 시스템)을 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드로부터 전사된 RNA 서열와 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 생성하기에 충분한 시간 동안 접촉시키는 단계; 및
b) 상기 재조합 DNA 바이러스의 바이러스 입자 또는 상기 재조합 DNA 바이러스의 바이러스 입자의 군체를 수득하는 단계; 및 선택적으로,
c) 수득한 재조합 DNA 바이러스의 바이러스 입자 또는 재조합 DNA 바이러스의 바이러스 입자의 군체를 단리 또는 정제하는 단계를 포함하는, 방법. - 제41항에 있어서,
상기 바이러스 패키징 시스템(예를 들어, AAV 패키징 시스템)은
(1) 상기 RNA 서열을 패키징하기 위한 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘을 조립하기 위한 하나 이상의 단백질(예를 들어, AAV 캡시드를 조립하기 위한 VP1, VP2 및/또는 VP3) 또는 그 하나 또는 복수의 코딩 서열;
(2) 상기 단백질 쉘의 조립 및/또는 상기 RNA 서열이 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘에 패키징되도록 촉진하기 위한 하나 이상의 단백질(예를 들어, AAV 패키징을 위한 Rep78, Rep68, Rep52 및/또는 Rep40) 또는 이의 하나 또는 복수의 코딩 서열(예를 들어, 아데노 바이러스 E2a, E4 및 VA유전자); 및
(3) 상기 RPS 상호 작용 분자 또는 그 코딩 서열;을 포함하고,
선택적으로, 상기 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며; 및/또는 (3) 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거되는, 방법. - 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드로부터 전사된 RNA 서열을 DNA 바이러스의 바이러스 입자에 패키징하는 시스템에 있어서,
상기 시스템은
(1) 상기 RNA 서열을 패키징하기 위한 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘을 조립하기 위한 하나 이상의 단백질(예를 들어, AAV 캡시드를 조립하기 위한 VP1, VP2 및/또는 VP3) 또는 그 하나 또는 복수의 코딩 서열;
(2) 상기 단백질 쉘의 조립 및/또는 상기 RNA 서열이 상기 DNA 바이러스의 바이러스 입자의 단백질 쉘에 패키징되도록 촉진하기 위한 하나 이상의 단백질(예를 들어, AAV 패키징을 위한 Rep78, Rep68, Rep52 및/또는 Rep40) 또는 이의 하나 또는 복수의 코딩 서열(예를 들어, 아데노 바이러스 E2a, E4 및 VA유전자); 및
(3) 상기 RPS 상호 작용 분자 또는 그 코딩 서열;을 포함하고,
선택적으로, 상기 바이러스 패키징 시스템은 DNA 서열을 상기 DNA 바이러스의 바이러스 입자에 패키징하는 능력은 예를 들어 (1) 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드 상의 DNA 패키징 신호(예를 들어 AAV ITR의 일부 또는 전부)를 제거하고, (2) 상기 AAV rep 유전자, 상기 AAV cap 유전자 및/또는 AAV 패키징에 필요한 하나 이상의 단백질의 하나 또는 복수의 코딩 서열을 변형(예를 들어 돌연변이)시켜, 상응한 번역된 단백질이 상기 DNA 서열이 상기 DNA 바이러스의 바이러스 입자에 패키징되도록 촉진하는 능력(예를 들어, Rep78 및 Rep68 단백질의 공유 서열 중의 Y156F 돌연변이, KDE-mu 또는 EKE-mu)을 감소시키거나, 약화시키거나 또는 거의 제거하며; 및/또는 (3) 제1항 내지 제23항 중 어느 한 항에 따른 RNA 서열을 코딩하는 폴리뉴클레오티드 또는 제24항 내지 제30항 중 어느 한 항에 따른 폴리뉴클레오티드의 크기를 확대하는 것을 통해 감소되거나, 약화되거나 또는 거의 제거되는, 시스템. - 관심 유전자(GOI)를 세포, 식물 또는 동물에 전달하는 방법으로서,
상기 방법은 상기 세포, 상기 식물 또는 상기 동물을 제31항 내지 제33항 중 어느 한 항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자), 제34항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체 또는 제39항 내지 제42항 중 어느 한 항에 따른 방법으로 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체에 접촉시키는 단계를 포함하고, 상기 GOI는 상기 RNA 서열(제1항 내지 제23항 중 어느 한 항에 따름)에 의해 코딩되는, 관심 유전자(GOI)를 세포, 식물 또는 동물에 전달하는 방법. - 관심 RNA 서열(RSI)을 세포, 식물 또는 동물에 전달하는 방법으로서,
상기 방법은 상기 세포, 상기 식물 또는 상기 동물을 제31항 내지 제33항 중 어느 한 항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자), 제34항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체 또는 제39항 내지 제42항 중 어느 한 항에 따른 방법으로 생성한 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체에 접촉시키는 단계를 포함하는, 관심 RNA 서열(RSI)을 세포, 식물 또는 동물에 전달하는 방법. - 필요한 대상체에서 질병 또는 장애를 진단, 예방 또는 치료하는 방법으로서,
상기 방법은 상기 대상체에게 치료 유효량 또는 조제량의 제34항에 따른 재조합 DNA 바이러스의 바이러스 입자 또는 제39항 내지 제42항 중 어느 한 항에 따른 방법으로 생성된 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체를 투여하는 단계를 포함하는, 필요한 대상체에서 질병 또는 장애를 진단, 예방 또는 치료하는 방법. - 필요한 대상체의 질병 또는 장애를 진단, 예방 또는 치료하기 위한 약물의 제조에서 제31항 내지 제33항 중 어느 한 항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자), 제34항에 따른 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체 또는 제39항 내지 제42항 중 어느 한 항에 따른 방법으로 생성한 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자) 또는 재조합 DNA 바이러스의 바이러스 입자(예를 들어, rRAAV 입자)의 군체의 용도.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNPCT/CN2021/075874 | 2021-02-07 | ||
CN2021075874 | 2021-02-07 | ||
PCT/CN2022/075366 WO2022166954A1 (en) | 2021-02-07 | 2022-02-07 | Rna adeno-associated virus (raav) vector and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230142776A true KR20230142776A (ko) | 2023-10-11 |
Family
ID=74946911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237030365A KR20230142776A (ko) | 2021-02-07 | 2022-02-07 | Rna 아데노 관련 바이러스(raav) 벡터 및 그 용도 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20230062529A1 (ko) |
EP (1) | EP4288112A1 (ko) |
JP (1) | JP2024508696A (ko) |
KR (1) | KR20230142776A (ko) |
CN (1) | CN115209924A (ko) |
AU (1) | AU2022217349A1 (ko) |
BR (1) | BR112023015769A2 (ko) |
CA (1) | CA3207601A1 (ko) |
IL (1) | IL305002A (ko) |
WO (1) | WO2022166954A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024120528A1 (en) * | 2022-12-08 | 2024-06-13 | Huidagene Therapeutics (Singapore) Pte. Ltd. | Improved system for producing rna-packaged aav particles |
CN117778431A (zh) * | 2023-12-04 | 2024-03-29 | 广州派真生物技术有限公司 | 一种用于重组腺相关病毒包装的质粒系统及其应用 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9790490B2 (en) * | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
WO2018035388A1 (en) * | 2016-08-17 | 2018-02-22 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
US20200283743A1 (en) * | 2016-08-17 | 2020-09-10 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
WO2018131551A1 (ja) * | 2017-01-13 | 2018-07-19 | 学校法人自治医科大学 | 肝臓ゲノム上の凝固関連因子遺伝子を破壊するためのaavベクター |
CN109055375B (zh) * | 2018-07-26 | 2021-11-12 | 东南大学 | 一种crispr辅助反式增强子激活基因表达的方法及其应用 |
CN111349148A (zh) * | 2020-03-13 | 2020-06-30 | 辉大(上海)生物科技有限公司 | 一种腺相关病毒载体及其用途 |
-
2022
- 2022-02-07 JP JP2023548288A patent/JP2024508696A/ja active Pending
- 2022-02-07 CA CA3207601A patent/CA3207601A1/en active Pending
- 2022-02-07 BR BR112023015769A patent/BR112023015769A2/pt unknown
- 2022-02-07 WO PCT/CN2022/075366 patent/WO2022166954A1/en active Application Filing
- 2022-02-07 IL IL305002A patent/IL305002A/en unknown
- 2022-02-07 KR KR1020237030365A patent/KR20230142776A/ko unknown
- 2022-02-07 EP EP22749233.7A patent/EP4288112A1/en active Pending
- 2022-02-07 AU AU2022217349A patent/AU2022217349A1/en active Pending
- 2022-02-07 CN CN202280002654.0A patent/CN115209924A/zh active Pending
- 2022-06-09 US US17/836,222 patent/US20230062529A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2022166954A1 (en) | 2022-08-11 |
IL305002A (en) | 2023-10-01 |
CA3207601A1 (en) | 2022-08-11 |
JP2024508696A (ja) | 2024-02-28 |
AU2022217349A1 (en) | 2023-08-31 |
CN115209924A (zh) | 2022-10-18 |
US20230062529A1 (en) | 2023-03-02 |
EP4288112A1 (en) | 2023-12-13 |
BR112023015769A2 (pt) | 2023-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022121364A (ja) | 無カプシドaavベクター、組成物ならびにベクター製造および遺伝子運搬のための方法 | |
JP2023106391A (ja) | Crispr/cas9核送達による細胞rnaの狙いを定めた編集 | |
JP4063319B2 (ja) | 組換えウイルスベクター系 | |
US20210054405A1 (en) | Closed-ended dna (cedna) vectors for insertion of transgenes at genomic safe harbors (gsh) in humans and murine genomes | |
KR20230002401A (ko) | C9orf72의 표적화를 위한 조성물 및 방법 | |
US20230062529A1 (en) | Rna adeno-associated virus (raav) vector and uses thereof | |
JP2021522273A (ja) | Cns変性のための遺伝子治療法 | |
CN113454232A (zh) | 封闭端dna(cedna)产生中对rep蛋白活性的调节 | |
CN113897396A (zh) | 一种用于在昆虫细胞中表达包含重叠开放阅读框的基因的表达盒及其应用 | |
TW202111122A (zh) | 藉靶向dmpk基因治療肌肉萎縮症之方法 | |
US20220411819A1 (en) | Nucleic acid molecules containing spacers and methods of use thereof | |
JP2022513376A (ja) | レトロウイルスインテグラーゼ-Cas9融合タンパク質を使用した指向性非相同DNA挿入によるゲノム編集 | |
JP7173490B2 (ja) | 核酸封入aav中空粒子 | |
KR20220018410A (ko) | 세포질에서 자가전사가 가능하고 유전체 편집을 제공하는 rna/dna 시스템 | |
WO2024120528A1 (en) | Improved system for producing rna-packaged aav particles | |
RU2811724C2 (ru) | РЕДАКТИРОВАНИЕ ГЕНОВ С ИСПОЛЬЗОВАНИЕМ МОДИФИЦИРОВАННОЙ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК) | |
WO2023172926A1 (en) | Precise excisions of portions of exons for treatment of duchenne muscular dystrophy | |
CA3216146A1 (en) | Genome editing by directed non-homologous dna insertion using a retroviral integrase-cas fusion protein and methods of treatment | |
WO2023235726A2 (en) | Crispr interference therapeutics for c9orf72 repeat expansion disease | |
KR20230037586A (ko) | Mapt 유전자를 표적으로 하는 알츠하이머병의 치료 방법 | |
WO2023235725A2 (en) | Crispr-based therapeutics for c9orf72 repeat expansion disease | |
JP2023548860A (ja) | Casとdnaポリメラーゼとの会合による、予測可能かつテンプレートフリーの遺伝子編集の強化 | |
KR20240055835A (ko) | 치료용 단백질의 발현을 위한 간 특이적 발현 카세트, 벡터 및 이들의 용도 | |
WO2023147558A2 (en) | Crispr methods for correcting bag3 gene mutations in vivo | |
WO2024091907A1 (en) | Compositions and methods for modifying the hpv16 genome |