CN115023242A - 腺相关病毒载体变体 - Google Patents
腺相关病毒载体变体 Download PDFInfo
- Publication number
- CN115023242A CN115023242A CN202080094086.2A CN202080094086A CN115023242A CN 115023242 A CN115023242 A CN 115023242A CN 202080094086 A CN202080094086 A CN 202080094086A CN 115023242 A CN115023242 A CN 115023242A
- Authority
- CN
- China
- Prior art keywords
- capsid protein
- modified
- aav capsid
- seq
- modified aav
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000013598 vector Substances 0.000 title claims abstract description 54
- 241000702421 Dependoparvovirus Species 0.000 title claims description 16
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 488
- 230000008685 targeting Effects 0.000 claims abstract description 247
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 231
- 210000004556 brain Anatomy 0.000 claims abstract description 188
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 31
- 239000013603 viral vector Substances 0.000 claims abstract description 30
- 239000003795 chemical substances by application Substances 0.000 claims abstract description 29
- 108090000565 Capsid Proteins Proteins 0.000 claims description 578
- 102100023321 Ceruloplasmin Human genes 0.000 claims description 578
- 229920001184 polypeptide Polymers 0.000 claims description 206
- 108090000623 proteins and genes Proteins 0.000 claims description 140
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims description 120
- 238000000034 method Methods 0.000 claims description 98
- 239000002245 particle Substances 0.000 claims description 97
- 102000004169 proteins and genes Human genes 0.000 claims description 91
- 150000007523 nucleic acids Chemical class 0.000 claims description 82
- 210000004027 cell Anatomy 0.000 claims description 68
- 108091033409 CRISPR Proteins 0.000 claims description 58
- 102000039446 nucleic acids Human genes 0.000 claims description 53
- 108020004707 nucleic acids Proteins 0.000 claims description 53
- 241000700605 Viruses Species 0.000 claims description 40
- 150000001413 amino acids Chemical class 0.000 claims description 39
- 210000000278 spinal cord Anatomy 0.000 claims description 37
- 210000000133 brain stem Anatomy 0.000 claims description 36
- 210000003710 cerebral cortex Anatomy 0.000 claims description 36
- 239000012528 membrane Substances 0.000 claims description 36
- 210000004379 membrane Anatomy 0.000 claims description 36
- 210000001328 optic nerve Anatomy 0.000 claims description 36
- 230000003612 virological effect Effects 0.000 claims description 36
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 35
- 210000001320 hippocampus Anatomy 0.000 claims description 35
- 108020004459 Small interfering RNA Proteins 0.000 claims description 34
- 210000004281 subthalamic nucleus Anatomy 0.000 claims description 34
- 238000010354 CRISPR gene editing Methods 0.000 claims description 32
- 210000001905 globus pallidus Anatomy 0.000 claims description 32
- 210000003198 cerebellar cortex Anatomy 0.000 claims description 31
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 31
- 210000002418 meninge Anatomy 0.000 claims description 31
- 210000002637 putamen Anatomy 0.000 claims description 31
- 210000001103 thalamus Anatomy 0.000 claims description 31
- 210000003523 substantia nigra Anatomy 0.000 claims description 30
- 201000010099 disease Diseases 0.000 claims description 28
- 210000001159 caudate nucleus Anatomy 0.000 claims description 24
- 241000124008 Mammalia Species 0.000 claims description 23
- 108091070501 miRNA Proteins 0.000 claims description 23
- 239000008194 pharmaceutical composition Substances 0.000 claims description 23
- 230000009368 gene silencing by RNA Effects 0.000 claims description 19
- 241000282414 Homo sapiens Species 0.000 claims description 18
- 238000001727 in vivo Methods 0.000 claims description 18
- 239000002679 microRNA Substances 0.000 claims description 17
- 210000000056 organ Anatomy 0.000 claims description 15
- 210000003059 ependyma Anatomy 0.000 claims description 13
- 210000004940 nucleus Anatomy 0.000 claims description 13
- 239000004055 small Interfering RNA Substances 0.000 claims description 13
- 210000004962 mammalian cell Anatomy 0.000 claims description 12
- 230000001225 therapeutic effect Effects 0.000 claims description 12
- 239000003814 drug Substances 0.000 claims description 11
- 102000004190 Enzymes Human genes 0.000 claims description 10
- 108090000790 Enzymes Proteins 0.000 claims description 10
- 238000000338 in vitro Methods 0.000 claims description 10
- 108091027967 Small hairpin RNA Proteins 0.000 claims description 9
- 229940124597 therapeutic agent Drugs 0.000 claims description 9
- 230000004770 neurodegeneration Effects 0.000 claims description 8
- 208000015122 neurodegenerative disease Diseases 0.000 claims description 8
- 108091027963 non-coding RNA Proteins 0.000 claims description 8
- 102000042567 non-coding RNA Human genes 0.000 claims description 8
- 210000003169 central nervous system Anatomy 0.000 claims description 7
- 210000004899 c-terminal region Anatomy 0.000 claims description 6
- 108020005198 Long Noncoding RNA Proteins 0.000 claims description 5
- 210000001638 cerebellum Anatomy 0.000 claims description 5
- 210000003477 cochlea Anatomy 0.000 claims description 5
- 208000023105 Huntington disease Diseases 0.000 claims description 4
- 239000003937 drug carrier Substances 0.000 claims description 4
- 208000024827 Alzheimer disease Diseases 0.000 claims description 3
- 210000005260 human cell Anatomy 0.000 claims description 3
- 238000007914 intraventricular administration Methods 0.000 claims description 3
- 210000005240 left ventricle Anatomy 0.000 claims description 3
- 206010068597 Bulbospinal muscular atrophy congenital Diseases 0.000 claims description 2
- 206010019468 Hemiplegia Diseases 0.000 claims description 2
- 208000027747 Kennedy disease Diseases 0.000 claims description 2
- 208000018737 Parkinson disease Diseases 0.000 claims description 2
- 208000032319 Primary lateral sclerosis Diseases 0.000 claims description 2
- 206010046298 Upper motor neurone lesion Diseases 0.000 claims description 2
- 208000006269 X-Linked Bulbo-Spinal Atrophy Diseases 0.000 claims description 2
- 210000003703 cisterna magna Anatomy 0.000 claims description 2
- 238000007913 intrathecal administration Methods 0.000 claims description 2
- 201000010901 lateral sclerosis Diseases 0.000 claims description 2
- 208000005264 motor neuron disease Diseases 0.000 claims description 2
- 108010040003 polyglutamine Proteins 0.000 claims description 2
- 229920000155 polyglutamine Polymers 0.000 claims description 2
- 210000005241 right ventricle Anatomy 0.000 claims description 2
- 201000008417 spastic hemiplegia Diseases 0.000 claims description 2
- 208000002320 spinal muscular atrophy Diseases 0.000 claims description 2
- 210000002330 subarachnoid space Anatomy 0.000 claims description 2
- 241001655883 Adeno-associated virus - 1 Species 0.000 claims 65
- 230000018883 protein targeting Effects 0.000 claims 14
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims 3
- 108091030071 RNAI Proteins 0.000 claims 1
- 210000003591 cerebellar nuclei Anatomy 0.000 claims 1
- 210000000337 motor cortex Anatomy 0.000 claims 1
- 210000002442 prefrontal cortex Anatomy 0.000 claims 1
- 230000002123 temporal effect Effects 0.000 claims 1
- 210000000857 visual cortex Anatomy 0.000 claims 1
- 210000000234 capsid Anatomy 0.000 abstract description 33
- 230000015572 biosynthetic process Effects 0.000 description 114
- 238000003786 synthesis reaction Methods 0.000 description 107
- 235000018102 proteins Nutrition 0.000 description 83
- 230000014509 gene expression Effects 0.000 description 51
- 235000001014 amino acid Nutrition 0.000 description 38
- 108020004414 DNA Proteins 0.000 description 35
- 102000053602 DNA Human genes 0.000 description 35
- 239000000203 mixture Substances 0.000 description 34
- 229940024606 amino acid Drugs 0.000 description 33
- 230000000694 effects Effects 0.000 description 32
- 239000002773 nucleotide Substances 0.000 description 27
- 125000003729 nucleotide group Chemical group 0.000 description 27
- 102000040430 polynucleotide Human genes 0.000 description 27
- 108091033319 polynucleotide Proteins 0.000 description 27
- 239000002157 polynucleotide Substances 0.000 description 27
- 230000000875 corresponding effect Effects 0.000 description 24
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 23
- 108020004705 Codon Proteins 0.000 description 20
- 108010079364 N-glycylalanine Proteins 0.000 description 20
- 230000006870 function Effects 0.000 description 20
- 238000010361 transduction Methods 0.000 description 20
- 230000026683 transduction Effects 0.000 description 20
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 18
- 210000001519 tissue Anatomy 0.000 description 18
- 238000006467 substitution reaction Methods 0.000 description 16
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 15
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 15
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 14
- 108700019146 Transgenes Proteins 0.000 description 14
- 238000013518 transcription Methods 0.000 description 14
- 230000035897 transcription Effects 0.000 description 14
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 13
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 12
- 241000282560 Macaca mulatta Species 0.000 description 12
- 108020001507 fusion proteins Proteins 0.000 description 12
- 102000037865 fusion proteins Human genes 0.000 description 12
- 230000001939 inductive effect Effects 0.000 description 12
- 230000001105 regulatory effect Effects 0.000 description 12
- 108700026244 Open Reading Frames Proteins 0.000 description 11
- 108010077245 asparaginyl-proline Proteins 0.000 description 11
- 230000027455 binding Effects 0.000 description 11
- 238000002347 injection Methods 0.000 description 11
- 239000007924 injection Substances 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 11
- 239000013608 rAAV vector Substances 0.000 description 11
- 239000013646 rAAV2 vector Substances 0.000 description 11
- 208000024891 symptom Diseases 0.000 description 11
- 239000013607 AAV vector Substances 0.000 description 10
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 10
- 238000003780 insertion Methods 0.000 description 10
- 230000037431 insertion Effects 0.000 description 10
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 108010061238 threonyl-glycine Proteins 0.000 description 10
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 9
- 108010050848 glycylleucine Proteins 0.000 description 9
- 230000002401 inhibitory effect Effects 0.000 description 9
- 108010034529 leucyl-lysine Proteins 0.000 description 9
- 108010057821 leucylproline Proteins 0.000 description 9
- 238000011282 treatment Methods 0.000 description 9
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 8
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 8
- -1 ITRs) Chemical class 0.000 description 8
- 241001465754 Metazoa Species 0.000 description 8
- 108010092854 aspartyllysine Proteins 0.000 description 8
- 239000003623 enhancer Substances 0.000 description 8
- 230000010354 integration Effects 0.000 description 8
- 239000007788 liquid Substances 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 8
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 7
- 108020005004 Guide RNA Proteins 0.000 description 7
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 7
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 7
- 101710163270 Nuclease Proteins 0.000 description 7
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 7
- 230000002411 adverse Effects 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 108010040030 histidinoalanine Proteins 0.000 description 7
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 7
- 238000004806 packaging method and process Methods 0.000 description 7
- 108010051242 phenylalanylserine Proteins 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 108010077112 prolyl-proline Proteins 0.000 description 7
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 6
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 6
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 6
- YCTIYBUTCKNOTI-UWJYBYFXSA-N Ala-Tyr-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCTIYBUTCKNOTI-UWJYBYFXSA-N 0.000 description 6
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 6
- AYZAWXAPBAYCHO-CIUDSAMLSA-N Asn-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N AYZAWXAPBAYCHO-CIUDSAMLSA-N 0.000 description 6
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 6
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 6
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 6
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 6
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 6
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 6
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 6
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 6
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 6
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 6
- BDHUXUFYNUOUIT-SRVKXCTJSA-N His-Asp-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BDHUXUFYNUOUIT-SRVKXCTJSA-N 0.000 description 6
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 6
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 6
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 6
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 6
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 6
- 241000699666 Mus <mouse, genus> Species 0.000 description 6
- 241000699670 Mus sp. Species 0.000 description 6
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 6
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 6
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 6
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 6
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 6
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 6
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 6
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 6
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 6
- YRSOERSDNRSCBC-XIRDDKMYSA-N Trp-His-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CS)C(=O)O)N YRSOERSDNRSCBC-XIRDDKMYSA-N 0.000 description 6
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 6
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 6
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 6
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 6
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 6
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 6
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 6
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 6
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 6
- 108010077515 glycylproline Proteins 0.000 description 6
- 108010025306 histidylleucine Proteins 0.000 description 6
- 238000011065 in-situ storage Methods 0.000 description 6
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 6
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 6
- 238000003752 polymerase chain reaction Methods 0.000 description 6
- 108010031719 prolyl-serine Proteins 0.000 description 6
- 108010053725 prolylvaline Proteins 0.000 description 6
- 230000000069 prophylactic effect Effects 0.000 description 6
- 230000010076 replication Effects 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 6
- 108010045269 tryptophyltryptophan Proteins 0.000 description 6
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 5
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 5
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 5
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 5
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 5
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 5
- 241000649045 Adeno-associated virus 10 Species 0.000 description 5
- 241000649046 Adeno-associated virus 11 Species 0.000 description 5
- 241000649047 Adeno-associated virus 12 Species 0.000 description 5
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 5
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 5
- 241000701022 Cytomegalovirus Species 0.000 description 5
- 230000004543 DNA replication Effects 0.000 description 5
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 5
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 5
- 241000880493 Leptailurus serval Species 0.000 description 5
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 5
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 5
- 241000700584 Simplexvirus Species 0.000 description 5
- 241000193996 Streptococcus pyogenes Species 0.000 description 5
- 108020004566 Transfer RNA Proteins 0.000 description 5
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 5
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000002490 cerebral effect Effects 0.000 description 5
- 239000002552 dosage form Substances 0.000 description 5
- 238000009472 formulation Methods 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 238000001415 gene therapy Methods 0.000 description 5
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 5
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 5
- 208000015181 infectious disease Diseases 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 108091005573 modified proteins Proteins 0.000 description 5
- 102000035118 modified proteins Human genes 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 230000036961 partial effect Effects 0.000 description 5
- 239000000546 pharmaceutical excipient Substances 0.000 description 5
- 108010026333 seryl-proline Proteins 0.000 description 5
- 238000002560 therapeutic procedure Methods 0.000 description 5
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical group C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 4
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 4
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 4
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 4
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 4
- BHTBAVZSZCQZPT-GUBZILKMSA-N Ala-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N BHTBAVZSZCQZPT-GUBZILKMSA-N 0.000 description 4
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 4
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 4
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 4
- JQFJNGVSGOUQDH-XIRDDKMYSA-N Arg-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JQFJNGVSGOUQDH-XIRDDKMYSA-N 0.000 description 4
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 4
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 4
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 4
- 239000004475 Arginine Substances 0.000 description 4
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 4
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 4
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 4
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 4
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 4
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 4
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 4
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 4
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 4
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 4
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 4
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 4
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 4
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 4
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 4
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 4
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 4
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 4
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 4
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 4
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 4
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 4
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 4
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 4
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 4
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 4
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 4
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 4
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 4
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 4
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 4
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 4
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 4
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 4
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 4
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 4
- 108010079005 RDV peptide Proteins 0.000 description 4
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 4
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 4
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 4
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 4
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 4
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 4
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 4
- 108091028113 Trans-activating crRNA Proteins 0.000 description 4
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 4
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 4
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 4
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 4
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 4
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 4
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 4
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 4
- 108020005202 Viral DNA Proteins 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 108010070944 alanylhistidine Proteins 0.000 description 4
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 239000006185 dispersion Substances 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 238000010362 genome editing Methods 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 4
- 108010089804 glycyl-threonine Proteins 0.000 description 4
- 108010087823 glycyltyrosine Proteins 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 229960000310 isoleucine Drugs 0.000 description 4
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 4
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 4
- 210000004185 liver Anatomy 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 4
- 230000008488 polyadenylation Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 4
- 108010015796 prolylisoleucine Proteins 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 239000002904 solvent Substances 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 101100524321 Adeno-associated virus 2 (isolate Srivastava/1982) Rep68 gene Proteins 0.000 description 3
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 3
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 3
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 3
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 3
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 3
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 3
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 3
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 3
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 3
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 3
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 3
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 3
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 3
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 3
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 3
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 3
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 3
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 3
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 3
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 3
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 3
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 3
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 3
- 102000005720 Glutathione transferase Human genes 0.000 description 3
- 108010070675 Glutathione transferase Proteins 0.000 description 3
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 3
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 3
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 3
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 3
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 3
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 3
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- LEHPJMKVGFPSSP-ZQINRCPSSA-N Ile-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 LEHPJMKVGFPSSP-ZQINRCPSSA-N 0.000 description 3
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 3
- 108010065920 Insulin Lispro Proteins 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 3
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 3
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 3
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 3
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 3
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 3
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 3
- 108090000157 Metallothionein Proteins 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 3
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 3
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 3
- 241000288906 Primates Species 0.000 description 3
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 3
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 3
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- 108091027981 Response element Proteins 0.000 description 3
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 3
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 3
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 3
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 3
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 3
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 3
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 3
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 3
- 108700009124 Transcription Initiation Site Proteins 0.000 description 3
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 3
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 3
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 3
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 3
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 3
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000010171 animal model Methods 0.000 description 3
- 230000000692 anti-sense effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- 235000009582 asparagine Nutrition 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 210000005013 brain tissue Anatomy 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 230000001054 cortical effect Effects 0.000 description 3
- 108010082025 cyan fluorescent protein Proteins 0.000 description 3
- 210000000805 cytoplasm Anatomy 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 239000003085 diluting agent Substances 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 230000030279 gene silencing Effects 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 3
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 210000002216 heart Anatomy 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 238000001802 infusion Methods 0.000 description 3
- 210000003140 lateral ventricle Anatomy 0.000 description 3
- 208000032839 leukemia Diseases 0.000 description 3
- 108010054155 lysyllysine Proteins 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 239000005022 packaging material Substances 0.000 description 3
- 108091007428 primary miRNA Proteins 0.000 description 3
- 108010004914 prolylarginine Proteins 0.000 description 3
- 108020001580 protein domains Proteins 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000009256 replacement therapy Methods 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 239000004094 surface-active agent Substances 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 2
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 2
- PQFMROVJTOPVDF-JBDRJPRFSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]-4-carboxybutanoyl]amino]butanedioic acid Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PQFMROVJTOPVDF-JBDRJPRFSA-N 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 102100033647 Activity-regulated cytoskeleton-associated protein Human genes 0.000 description 2
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 2
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 2
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 2
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 2
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 2
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 2
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 2
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 2
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 2
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 2
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 2
- JNJHNBXBGNJESC-KKXDTOCCSA-N Ala-Tyr-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JNJHNBXBGNJESC-KKXDTOCCSA-N 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 2
- OCOZPTHLDVSFCZ-BPUTZDHNSA-N Arg-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N OCOZPTHLDVSFCZ-BPUTZDHNSA-N 0.000 description 2
- ALOVURZCXKYKJC-NAKRPEOUSA-N Arg-Asp-Gln-Ser Chemical compound N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O ALOVURZCXKYKJC-NAKRPEOUSA-N 0.000 description 2
- ASQYTJJWAMDISW-BPUTZDHNSA-N Arg-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N ASQYTJJWAMDISW-BPUTZDHNSA-N 0.000 description 2
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- BQBPFMNVOWDLHO-XIRDDKMYSA-N Arg-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N BQBPFMNVOWDLHO-XIRDDKMYSA-N 0.000 description 2
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 2
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 2
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 2
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 2
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 2
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 2
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 2
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 2
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 2
- HUZGPXBILPMCHM-IHRRRGAJSA-N Asn-Arg-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HUZGPXBILPMCHM-IHRRRGAJSA-N 0.000 description 2
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 2
- JRVABKHPWDRUJF-UBHSHLNASA-N Asn-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N JRVABKHPWDRUJF-UBHSHLNASA-N 0.000 description 2
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 2
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- MOHUTCNYQLMARY-GUBZILKMSA-N Asn-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MOHUTCNYQLMARY-GUBZILKMSA-N 0.000 description 2
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 2
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 2
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 2
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 2
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 2
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 2
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 2
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 2
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 2
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 2
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 2
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 2
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 2
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 2
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 2
- VBVKSAFJPVXMFJ-CIUDSAMLSA-N Asp-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N VBVKSAFJPVXMFJ-CIUDSAMLSA-N 0.000 description 2
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 2
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 2
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 2
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 2
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 2
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 2
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 2
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 2
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 2
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 2
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 2
- LLRJPYJQNBMOOO-QEJZJMRPSA-N Asp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N LLRJPYJQNBMOOO-QEJZJMRPSA-N 0.000 description 2
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 2
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 2
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 2
- 102000007372 Ataxin-1 Human genes 0.000 description 2
- 108010032963 Ataxin-1 Proteins 0.000 description 2
- 238000011746 C57BL/6J (JAX™ mouse strain) Methods 0.000 description 2
- 108091007914 CDKs Proteins 0.000 description 2
- 238000010453 CRISPR/Cas method Methods 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 102000003903 Cyclin-dependent kinases Human genes 0.000 description 2
- 108090000266 Cyclin-dependent kinases Proteins 0.000 description 2
- XIZWKXATMJODQW-KKUMJFAQSA-N Cys-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N XIZWKXATMJODQW-KKUMJFAQSA-N 0.000 description 2
- XLLSMEFANRROJE-GUBZILKMSA-N Cys-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N XLLSMEFANRROJE-GUBZILKMSA-N 0.000 description 2
- HBHMVBGGHDMPBF-GARJFASQSA-N Cys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N HBHMVBGGHDMPBF-GARJFASQSA-N 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 241001492222 Epicoccum Species 0.000 description 2
- 108010046649 GDNP peptide Proteins 0.000 description 2
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 2
- 102000053171 Glial Fibrillary Acidic Human genes 0.000 description 2
- 101710193519 Glial fibrillary acidic protein Proteins 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 2
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 2
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 2
- ULXXDWZMMSQBDC-ACZMJKKPSA-N Gln-Asp-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ULXXDWZMMSQBDC-ACZMJKKPSA-N 0.000 description 2
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 2
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 2
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 2
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 2
- HVQCEQTUSWWFOS-WDSKDSINSA-N Gln-Gly-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N HVQCEQTUSWWFOS-WDSKDSINSA-N 0.000 description 2
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 2
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 2
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 2
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 2
- UESYBOXFJWJVSB-AVGNSLFASA-N Gln-Phe-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O UESYBOXFJWJVSB-AVGNSLFASA-N 0.000 description 2
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 2
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 2
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 2
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 2
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 2
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 2
- ZMXZGYLINVNTKH-DZKIICNBSA-N Gln-Val-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZMXZGYLINVNTKH-DZKIICNBSA-N 0.000 description 2
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 2
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 2
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 2
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 2
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 2
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 2
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 2
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 2
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 2
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 2
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 2
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 2
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 2
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 2
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 2
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 2
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 2
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 2
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 2
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 2
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 2
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 2
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 2
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 2
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 2
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 2
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 2
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 2
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 2
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 2
- MUGLKCQHTUFLGF-WPRPVWTQSA-N Gly-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)CN MUGLKCQHTUFLGF-WPRPVWTQSA-N 0.000 description 2
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- AASLOGQZZKZWKH-SRVKXCTJSA-N His-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AASLOGQZZKZWKH-SRVKXCTJSA-N 0.000 description 2
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 2
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 2
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 2
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 2
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- 102000018251 Hypoxanthine Phosphoribosyltransferase Human genes 0.000 description 2
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 2
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 2
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 2
- HTDRTKMNJRRYOJ-SIUGBPQLSA-N Ile-Gln-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HTDRTKMNJRRYOJ-SIUGBPQLSA-N 0.000 description 2
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 2
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 2
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 2
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 2
- JTBFQNHKNRZJDS-SYWGBEHUSA-N Ile-Trp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](C)C(=O)O)N JTBFQNHKNRZJDS-SYWGBEHUSA-N 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 2
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 2
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 2
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 2
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 2
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 2
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 2
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 2
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 2
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 2
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 2
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 2
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 2
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 2
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 2
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 2
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 2
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 2
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 2
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 2
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 2
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 2
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 2
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 2
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 2
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 2
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 2
- VWJFOUBDZIUXGA-AVGNSLFASA-N Lys-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N VWJFOUBDZIUXGA-AVGNSLFASA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 2
- DTICLBJHRYSJLH-GUBZILKMSA-N Met-Ala-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O DTICLBJHRYSJLH-GUBZILKMSA-N 0.000 description 2
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 2
- HZLSUXCMSIBCRV-RVMXOQNASA-N Met-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N HZLSUXCMSIBCRV-RVMXOQNASA-N 0.000 description 2
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 2
- OTKQHDPECKUDSB-SZMVWBNQSA-N Met-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OTKQHDPECKUDSB-SZMVWBNQSA-N 0.000 description 2
- 102000003792 Metallothionein Human genes 0.000 description 2
- 208000002678 Mucopolysaccharidoses Diseases 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 241000701945 Parvoviridae Species 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- 108010067902 Peptide Library Proteins 0.000 description 2
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 2
- BRDYYVQTEJVRQT-HRCADAONSA-N Phe-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BRDYYVQTEJVRQT-HRCADAONSA-N 0.000 description 2
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 2
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 2
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 2
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 2
- OPEVYHFJXLCCRT-AVGNSLFASA-N Phe-Gln-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O OPEVYHFJXLCCRT-AVGNSLFASA-N 0.000 description 2
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 2
- VJLLEKDQJSMHRU-STQMWFEESA-N Phe-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O VJLLEKDQJSMHRU-STQMWFEESA-N 0.000 description 2
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 2
- WFHRXJOZEXUKLV-IRXDYDNUSA-N Phe-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 WFHRXJOZEXUKLV-IRXDYDNUSA-N 0.000 description 2
- HQCSLJFGZYOXHW-KKUMJFAQSA-N Phe-His-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O)N HQCSLJFGZYOXHW-KKUMJFAQSA-N 0.000 description 2
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 2
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 2
- QRUOLOPKCOEZKU-HJWJTTGWSA-N Phe-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N QRUOLOPKCOEZKU-HJWJTTGWSA-N 0.000 description 2
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 2
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 2
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 2
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 2
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 2
- CVAUVSOFHJKCHN-BZSNNMDCSA-N Phe-Tyr-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=CC=C1 CVAUVSOFHJKCHN-BZSNNMDCSA-N 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 2
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 2
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 2
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 2
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 2
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 2
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 2
- YKQNVTOIYFQMLW-IHRRRGAJSA-N Pro-Cys-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 YKQNVTOIYFQMLW-IHRRRGAJSA-N 0.000 description 2
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 2
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 2
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 2
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 2
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 2
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 2
- GNADVDLLGVSXLS-ULQDDVLXSA-N Pro-Phe-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O GNADVDLLGVSXLS-ULQDDVLXSA-N 0.000 description 2
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 2
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 2
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 2
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 2
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 2
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 2
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 2
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 2
- DMNANGOFEUVBRV-GJZGRUSLSA-N Pro-Trp-Gly Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)O)C(=O)[C@@H]1CCCN1 DMNANGOFEUVBRV-GJZGRUSLSA-N 0.000 description 2
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 2
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 2
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 2
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 2
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 2
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 2
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 2
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 2
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 2
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 2
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 2
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 2
- CLKKNZQUQMZDGD-SRVKXCTJSA-N Ser-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CN=CN1 CLKKNZQUQMZDGD-SRVKXCTJSA-N 0.000 description 2
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 2
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 2
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 2
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 2
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 2
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 2
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 2
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 2
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 2
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 2
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 2
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 2
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 2
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 2
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 2
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 2
- 208000009415 Spinocerebellar Ataxias Diseases 0.000 description 2
- 241000193998 Streptococcus pneumoniae Species 0.000 description 2
- 108700026226 TATA Box Proteins 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 2
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 2
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 2
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 2
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 2
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 2
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 2
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 2
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 2
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 2
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 2
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 2
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 2
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 2
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 2
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 2
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 2
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 2
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- QNTBGBCOEYNAPV-CWRNSKLLSA-N Trp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O QNTBGBCOEYNAPV-CWRNSKLLSA-N 0.000 description 2
- GTNCSPKYWCJZAC-XIRDDKMYSA-N Trp-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GTNCSPKYWCJZAC-XIRDDKMYSA-N 0.000 description 2
- XZLHHHYSWIYXHD-XIRDDKMYSA-N Trp-Gln-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XZLHHHYSWIYXHD-XIRDDKMYSA-N 0.000 description 2
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 2
- NOFFAYIYPAUNRM-HKUYNNGSSA-N Trp-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC2=CNC3=CC=CC=C32)N NOFFAYIYPAUNRM-HKUYNNGSSA-N 0.000 description 2
- WVHUFSCKCBQKJW-HKUYNNGSSA-N Trp-Gly-Tyr Chemical compound C([C@H](NC(=O)CNC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 WVHUFSCKCBQKJW-HKUYNNGSSA-N 0.000 description 2
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 2
- RERRMBXDSFMBQE-ZFWWWQNUSA-N Trp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RERRMBXDSFMBQE-ZFWWWQNUSA-N 0.000 description 2
- WMIUTJPFHMMUGY-ZFWWWQNUSA-N Trp-Pro-Gly Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)NCC(=O)O WMIUTJPFHMMUGY-ZFWWWQNUSA-N 0.000 description 2
- SEXRBCGSZRCIPE-LYSGOOTNSA-N Trp-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O SEXRBCGSZRCIPE-LYSGOOTNSA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- SDNVRAKIJVKAGS-LKTVYLICSA-N Tyr-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N SDNVRAKIJVKAGS-LKTVYLICSA-N 0.000 description 2
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 2
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 2
- YLRLHDFMMWDYTK-KKUMJFAQSA-N Tyr-Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 YLRLHDFMMWDYTK-KKUMJFAQSA-N 0.000 description 2
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 2
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 2
- NMKJPMCEKQHRPD-IRXDYDNUSA-N Tyr-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NMKJPMCEKQHRPD-IRXDYDNUSA-N 0.000 description 2
- QSFJHIRIHOJRKS-ULQDDVLXSA-N Tyr-Leu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QSFJHIRIHOJRKS-ULQDDVLXSA-N 0.000 description 2
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 2
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 2
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 2
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 2
- PLVVHGFEMSDRET-IHPCNDPISA-N Tyr-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC3=CC=C(C=C3)O)N PLVVHGFEMSDRET-IHPCNDPISA-N 0.000 description 2
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 2
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 2
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 2
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 2
- QVYFTFIBKCDHIE-ACRUOGEOSA-N Tyr-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O QVYFTFIBKCDHIE-ACRUOGEOSA-N 0.000 description 2
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 2
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 2
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 2
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 2
- XEYUMGGWQCIWAR-XVKPBYJWSA-N Val-Gln-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N XEYUMGGWQCIWAR-XVKPBYJWSA-N 0.000 description 2
- UZDHNIJRRTUKKC-DLOVCJGASA-N Val-Gln-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UZDHNIJRRTUKKC-DLOVCJGASA-N 0.000 description 2
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 2
- ZEBRMWPTJNHXAJ-JYJNAYRXSA-N Val-Phe-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N ZEBRMWPTJNHXAJ-JYJNAYRXSA-N 0.000 description 2
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 2
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 2
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 2
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 2
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 2
- 108700005077 Viral Genes Proteins 0.000 description 2
- 150000001242 acetic acid derivatives Chemical class 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 230000000844 anti-bacterial effect Effects 0.000 description 2
- 239000003429 antifungal agent Substances 0.000 description 2
- 229940121375 antifungal agent Drugs 0.000 description 2
- 230000000890 antigenic effect Effects 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 235000010323 ascorbic acid Nutrition 0.000 description 2
- 229960005070 ascorbic acid Drugs 0.000 description 2
- 239000011668 ascorbic acid Substances 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 108010021908 aspartyl-aspartyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 238000011021 bench scale process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 108091005948 blue fluorescent proteins Proteins 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- OSASVXMJTNOKOY-UHFFFAOYSA-N chlorobutanol Chemical compound CC(C)(O)C(Cl)(Cl)Cl OSASVXMJTNOKOY-UHFFFAOYSA-N 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000009260 cross reactivity Effects 0.000 description 2
- 108010069495 cysteinyltyrosine Proteins 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 238000012377 drug delivery Methods 0.000 description 2
- 238000009510 drug design Methods 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 210000000981 epithelium Anatomy 0.000 description 2
- 238000002073 fluorescence micrograph Methods 0.000 description 2
- 210000004055 fourth ventricle Anatomy 0.000 description 2
- 238000001476 gene delivery Methods 0.000 description 2
- 238000003197 gene knockdown Methods 0.000 description 2
- 210000005046 glial fibrillary acidic protein Anatomy 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 2
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 210000002149 gonad Anatomy 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 230000000971 hippocampal effect Effects 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 230000002458 infectious effect Effects 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 241001515942 marmosets Species 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 229910021645 metal ion Inorganic materials 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 206010028093 mucopolysaccharidosis Diseases 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 235000021317 phosphate Nutrition 0.000 description 2
- 239000002953 phosphate buffered saline Substances 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 229920005862 polyol Polymers 0.000 description 2
- 150000003077 polyols Chemical class 0.000 description 2
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 2
- 229920000053 polysorbate 80 Polymers 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 230000001177 retroviral effect Effects 0.000 description 2
- 229920002477 rna polymer Polymers 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 239000013605 shuttle vector Substances 0.000 description 2
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 201000003624 spinocerebellar ataxia type 1 Diseases 0.000 description 2
- 210000000952 spleen Anatomy 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 108091006107 transcriptional repressors Proteins 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- ARNGIGOPGOEJCH-KKUMJFAQSA-N (3s)-3-[[2-[[(2s)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]acetyl]amino]-4-[[(1s)-1-carboxy-2-phenylethyl]amino]-4-oxobutanoic acid Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ARNGIGOPGOEJCH-KKUMJFAQSA-N 0.000 description 1
- HXUVTXPOZRFMOY-NSHDSACASA-N 2-[[(2s)-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]-3-phenylpropanoyl]amino]acetic acid Chemical compound NCC(=O)NCC(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 HXUVTXPOZRFMOY-NSHDSACASA-N 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- KISWVXRQTGLFGD-UHFFFAOYSA-N 2-[[2-[[6-amino-2-[[2-[[2-[[5-amino-2-[[2-[[1-[2-[[6-amino-2-[(2,5-diamino-5-oxopentanoyl)amino]hexanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carbonyl]amino]-3-hydroxypropanoyl]amino]-5-oxopentanoyl]amino]-5-(diaminomethylideneamino)p Chemical compound C1CCN(C(=O)C(CCCN=C(N)N)NC(=O)C(CCCCN)NC(=O)C(N)CCC(N)=O)C1C(=O)NC(CO)C(=O)NC(CCC(N)=O)C(=O)NC(CCCN=C(N)N)C(=O)NC(CO)C(=O)NC(CCCCN)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 KISWVXRQTGLFGD-UHFFFAOYSA-N 0.000 description 1
- 108020005065 3' Flanking Region Proteins 0.000 description 1
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 1
- 102100038954 60S ribosomal export protein NMD3 Human genes 0.000 description 1
- 241000649044 Adeno-associated virus 9 Species 0.000 description 1
- 102000055025 Adenosine deaminases Human genes 0.000 description 1
- 108010024878 Adenovirus E1A Proteins Proteins 0.000 description 1
- 108010087905 Adenovirus E1B Proteins Proteins 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- BLTRAARCJYVJKV-QEJZJMRPSA-N Ala-Lys-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](Cc1ccccc1)C(O)=O BLTRAARCJYVJKV-QEJZJMRPSA-N 0.000 description 1
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 1
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 1
- FSXDWQGEWZQBPJ-HERUPUMHSA-N Ala-Trp-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FSXDWQGEWZQBPJ-HERUPUMHSA-N 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 208000031873 Animal Disease Models Diseases 0.000 description 1
- 108020004491 Antisense DNA Proteins 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- 108010010777 Arg-Gly-Asp-Gly Proteins 0.000 description 1
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- NGTYEHIRESTSRX-UWVGGRQHSA-N Arg-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NGTYEHIRESTSRX-UWVGGRQHSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 1
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 1
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 1
- FSPQNLYOFCXUCE-BPUTZDHNSA-N Arg-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FSPQNLYOFCXUCE-BPUTZDHNSA-N 0.000 description 1
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 1
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 1
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 1
- BKZFBJYIVSBXCO-KKUMJFAQSA-N Asn-Phe-His Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O BKZFBJYIVSBXCO-KKUMJFAQSA-N 0.000 description 1
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 1
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 1
- ZVTDYGWRRPMFCL-WFBYXXMGSA-N Asp-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)O)N ZVTDYGWRRPMFCL-WFBYXXMGSA-N 0.000 description 1
- NRIFEOUAFLTMFJ-AAEUAGOBSA-N Asp-Gly-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NRIFEOUAFLTMFJ-AAEUAGOBSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- DONWIPDSZZJHHK-HJGDQZAQSA-N Asp-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)O DONWIPDSZZJHHK-HJGDQZAQSA-N 0.000 description 1
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 1
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- 108010029692 Bisphosphoglycerate mutase Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 238000011740 C57BL/6 mouse Methods 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 208000032170 Congenital Abnormalities Diseases 0.000 description 1
- 206010010904 Convulsion Diseases 0.000 description 1
- IVOMOUWHDPKRLL-KQYNXXCUSA-N Cyclic adenosine monophosphate Chemical compound C([C@H]1O2)OP(O)(=O)O[C@H]1[C@@H](O)[C@@H]2N1C(N=CN=C2N)=C2N=C1 IVOMOUWHDPKRLL-KQYNXXCUSA-N 0.000 description 1
- 108050006400 Cyclin Proteins 0.000 description 1
- 102000016736 Cyclin Human genes 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 1
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- UQKVUFGUSVYJMQ-IRIUXVKKSA-N Gln-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N)O UQKVUFGUSVYJMQ-IRIUXVKKSA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 1
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 1
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 1
- WVYJNPCWJYBHJG-YVNDNENWSA-N Glu-Ile-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O WVYJNPCWJYBHJG-YVNDNENWSA-N 0.000 description 1
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 1
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 1
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- DHNXGWVNLFPOMQ-KBPBESRZSA-N Gly-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN DHNXGWVNLFPOMQ-KBPBESRZSA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- FULZDMOZUZKGQU-ONGXEEELSA-N Gly-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN FULZDMOZUZKGQU-ONGXEEELSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 101001023784 Heteractis crispa GFP-like non-fluorescent chromoprotein Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- MJNWEIMBXKKCSF-XVYDVKMFSA-N His-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N MJNWEIMBXKKCSF-XVYDVKMFSA-N 0.000 description 1
- DFHVLUKTTVTCKY-PBCZWWQYSA-N His-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N)O DFHVLUKTTVTCKY-PBCZWWQYSA-N 0.000 description 1
- LSQHWKPPOFDHHZ-YUMQZZPRSA-N His-Asp-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LSQHWKPPOFDHHZ-YUMQZZPRSA-N 0.000 description 1
- VUUFXXGKMPLKNH-BZSNNMDCSA-N His-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N VUUFXXGKMPLKNH-BZSNNMDCSA-N 0.000 description 1
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 1
- YEKYGQZUBCRNGH-DCAQKATOSA-N His-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CO)C(=O)O YEKYGQZUBCRNGH-DCAQKATOSA-N 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- 101000603190 Homo sapiens 60S ribosomal export protein NMD3 Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 241001135569 Human adenovirus 5 Species 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 1
- CPELXLSAUQHCOX-UHFFFAOYSA-N Hydrogen bromide Chemical compound Br CPELXLSAUQHCOX-UHFFFAOYSA-N 0.000 description 1
- 241000282596 Hylobatidae Species 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 1
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 1
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- YSKSXVKQLLBVEX-SZMVWBNQSA-N Leu-Gln-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 YSKSXVKQLLBVEX-SZMVWBNQSA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- QYOXSYXPHUHOJR-GUBZILKMSA-N Lys-Asn-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYOXSYXPHUHOJR-GUBZILKMSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- IRRZDAIFYHNIIN-JYJNAYRXSA-N Lys-Gln-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IRRZDAIFYHNIIN-JYJNAYRXSA-N 0.000 description 1
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- ALEVUGKHINJNIF-QEJZJMRPSA-N Lys-Phe-Ala Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ALEVUGKHINJNIF-QEJZJMRPSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 1
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 1
- 230000027311 M phase Effects 0.000 description 1
- 241000282553 Macaca Species 0.000 description 1
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 1
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 1
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 1
- JOYFULUKJRJCSX-IUCAKERBSA-N Met-Met-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O JOYFULUKJRJCSX-IUCAKERBSA-N 0.000 description 1
- VOAKKHOIAFKOQZ-JYJNAYRXSA-N Met-Tyr-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=C(O)C=C1 VOAKKHOIAFKOQZ-JYJNAYRXSA-N 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 241000122159 Modiolus Species 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- 108010006140 N-sulfoglucosamine sulfohydrolase Proteins 0.000 description 1
- 102100027661 N-sulphoglucosamine sulphohydrolase Human genes 0.000 description 1
- 208000009668 Neurobehavioral Manifestations Diseases 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 1
- 102000011025 Phosphoglycerate Mutase Human genes 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 241000282405 Pongo abelii Species 0.000 description 1
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 1
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 1
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 1
- ZTMLZUNPFDGPKY-VKOGCVSHSA-N Pro-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ZTMLZUNPFDGPKY-VKOGCVSHSA-N 0.000 description 1
- HATVCTYBNCNMAA-AVGNSLFASA-N Pro-Leu-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O HATVCTYBNCNMAA-AVGNSLFASA-N 0.000 description 1
- VGFFUEVZKRNRHT-ULQDDVLXSA-N Pro-Trp-Glu Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)O)C(=O)O VGFFUEVZKRNRHT-ULQDDVLXSA-N 0.000 description 1
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- XBDQKXXYIPTUBI-UHFFFAOYSA-N Propionic acid Chemical class CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 201000004681 Psoriasis Diseases 0.000 description 1
- 208000001431 Psychomotor Agitation Diseases 0.000 description 1
- 102000013009 Pyruvate Kinase Human genes 0.000 description 1
- 108020005115 Pyruvate Kinase Proteins 0.000 description 1
- 108090000944 RNA Helicases Proteins 0.000 description 1
- 102000004409 RNA Helicases Human genes 0.000 description 1
- 230000007022 RNA scission Effects 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 206010038743 Restlessness Diseases 0.000 description 1
- 108020005543 Satellite RNA Proteins 0.000 description 1
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 1
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 1
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 1
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- MLSQXWSRHURDMF-GARJFASQSA-N Ser-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N)C(=O)O MLSQXWSRHURDMF-GARJFASQSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 1
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 1
- OCWWJBZQXGYQCA-DCAQKATOSA-N Ser-Lys-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O OCWWJBZQXGYQCA-DCAQKATOSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 1
- 201000003629 Spinocerebellar ataxia type 8 Diseases 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- LHUBVKCLOVALIA-HJGDQZAQSA-N Thr-Arg-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LHUBVKCLOVALIA-HJGDQZAQSA-N 0.000 description 1
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- UNURFMVMXLENAZ-KJEVXHAQSA-N Thr-Arg-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UNURFMVMXLENAZ-KJEVXHAQSA-N 0.000 description 1
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 1
- UBDDORVPVLEECX-FJXKBIBVSA-N Thr-Gly-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UBDDORVPVLEECX-FJXKBIBVSA-N 0.000 description 1
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 206010044565 Tremor Diseases 0.000 description 1
- 108010039203 Tripeptidyl-Peptidase 1 Proteins 0.000 description 1
- 102100034197 Tripeptidyl-peptidase 1 Human genes 0.000 description 1
- UHXOYRWHIQZAKV-SZMVWBNQSA-N Trp-Pro-Arg Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O UHXOYRWHIQZAKV-SZMVWBNQSA-N 0.000 description 1
- AUZADXNWQMBZOO-JYJNAYRXSA-N Tyr-Pro-Arg Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 AUZADXNWQMBZOO-JYJNAYRXSA-N 0.000 description 1
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 1
- IVOMOUWHDPKRLL-UHFFFAOYSA-N UNPD107823 Natural products O1C2COP(O)(=O)OC2C(O)C1N1C(N=CN=C2N)=C2N=C1 IVOMOUWHDPKRLL-UHFFFAOYSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 1
- AAOPYWQQBXHINJ-DZKIICNBSA-N Val-Gln-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AAOPYWQQBXHINJ-DZKIICNBSA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 1
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- NGXQOQNXSGOYOI-BQFCYCMXSA-N Val-Trp-Gln Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 NGXQOQNXSGOYOI-BQFCYCMXSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 108010047506 alanyl-glutaminyl-glycyl-valine Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- SHGAZHPCJJPHSC-YCNIQYBTSA-N all-trans-retinoic acid Chemical compound OC(=O)\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C SHGAZHPCJJPHSC-YCNIQYBTSA-N 0.000 description 1
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 150000003862 amino acid derivatives Chemical class 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000003708 ampul Substances 0.000 description 1
- 238000011558 animal model by disease Methods 0.000 description 1
- 229940121363 anti-inflammatory agent Drugs 0.000 description 1
- 239000002260 anti-inflammatory agent Substances 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 239000003816 antisense DNA Substances 0.000 description 1
- 239000003443 antiviral agent Substances 0.000 description 1
- 239000003125 aqueous solvent Substances 0.000 description 1
- 239000007900 aqueous suspension Substances 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010057412 arginyl-glycyl-aspartyl-phenylalanine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 150000001510 aspartic acids Chemical class 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 150000001558 benzoic acid derivatives Chemical class 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 102000005936 beta-Galactosidase Human genes 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 239000011111 cardboard Substances 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000006369 cell cycle progression Effects 0.000 description 1
- 230000011712 cell development Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 229960004926 chlorobutanol Drugs 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 230000024321 chromosome segregation Effects 0.000 description 1
- 150000001860 citric acid derivatives Chemical class 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 229940095074 cyclic amp Drugs 0.000 description 1
- 229940043378 cyclin-dependent kinase inhibitor Drugs 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- UGMCXQCYOVCMTB-UHFFFAOYSA-K dihydroxy(stearato)aluminium Chemical compound CCCCCCCCCCCCCCCCCC(=O)O[Al](O)O UGMCXQCYOVCMTB-UHFFFAOYSA-K 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 239000002612 dispersion medium Substances 0.000 description 1
- 238000011833 dog model Methods 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 210000003038 endothelium Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 230000010429 evolutionary process Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 108010021843 fluorescent protein 583 Proteins 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 125000005908 glyceryl ester group Chemical group 0.000 description 1
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 210000002768 hair cell Anatomy 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 230000007954 hypoxia Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 238000012750 in vivo screening Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 239000007972 injectable composition Substances 0.000 description 1
- 210000000067 inner hair cell Anatomy 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 208000028867 ischemia Diseases 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 108010043612 kentsin Proteins 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 210000002415 kinetochore Anatomy 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 210000005228 liver tissue Anatomy 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 150000002690 malonic acid derivatives Chemical class 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 108091050539 miR-107 stem-loop Proteins 0.000 description 1
- 108091070946 miR-128 stem-loop Proteins 0.000 description 1
- 108091063796 miR-206 stem-loop Proteins 0.000 description 1
- 108091047268 miR-208b stem-loop Proteins 0.000 description 1
- 108091074082 miR-548f-2 stem-loop Proteins 0.000 description 1
- 108091046865 miR-569 stem-loop Proteins 0.000 description 1
- 108091024411 miR-590 stem-loop Proteins 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 230000011278 mitosis Effects 0.000 description 1
- 230000000394 mitotic effect Effects 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000000926 neurological effect Effects 0.000 description 1
- 230000002276 neurotropic effect Effects 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 239000000346 nonvolatile oil Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000006179 pH buffering agent Substances 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 239000000123 paper Substances 0.000 description 1
- 239000011087 paperboard Substances 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 230000003285 pharmacodynamic effect Effects 0.000 description 1
- 229960003742 phenol Drugs 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000032361 posttranscriptional gene silencing Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 101150002764 purA gene Proteins 0.000 description 1
- 239000013645 rAAV1 vector Substances 0.000 description 1
- 239000013648 rAAV12 vector Substances 0.000 description 1
- 239000013647 rAAV8 vector Substances 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 229930002330 retinoic acid Natural products 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000000405 serological effect Effects 0.000 description 1
- 239000002924 silencing RNA Substances 0.000 description 1
- 230000001743 silencing effect Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000007909 solid dosage form Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000003270 steroid hormone Substances 0.000 description 1
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 1
- 210000004895 subcellular structure Anatomy 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 229910021653 sulphate ion Inorganic materials 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 230000009747 swallowing Effects 0.000 description 1
- 239000006188 syrup Substances 0.000 description 1
- 235000020357 syrup Nutrition 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 238000011285 therapeutic regimen Methods 0.000 description 1
- AYEKOFBPNLCAJY-UHFFFAOYSA-O thiamine pyrophosphate Chemical compound CC1=C(CCOP(O)(=O)OP(O)(O)=O)SC=[N+]1CC1=CN=C(C)N=C1N AYEKOFBPNLCAJY-UHFFFAOYSA-O 0.000 description 1
- 239000002562 thickening agent Substances 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 229960001727 tretinoin Drugs 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 1
- 230000009452 underexpressoin Effects 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 239000008215 water for injection Substances 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0075—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the delivery route, e.g. oral, subcutaneous
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/28—Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/06—Linear peptides containing only normal peptide links having 5 to 11 amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/33—Fusion polypeptide fusions for targeting to specific cell types, e.g. tissue specific targeting, targeting of a bacterial subspecies
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14145—Special targeting system for viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14171—Demonstrated in vivo effect
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Virology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Neurology (AREA)
- Neurosurgery (AREA)
- Gastroenterology & Hepatology (AREA)
- General Chemical & Material Sciences (AREA)
- Epidemiology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Hospice & Palliative Care (AREA)
- Psychiatry (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
本文提供靶向肽和含有编码所述靶向肽的序列的载体,所述靶向肽将药剂递送到脑中的特定亚结构。本文提供了各自包含经修饰的衣壳的病毒载体,其中所述经修饰的衣壳包含至少一种将所述病毒载体靶向独特脑结构的氨基酸序列。
Description
相关申请的引用
本申请要求2019年11月22日提交的美国临时申请序列号62/939,315和2020年9月29日提交的美国临时申请序列号63/084,709的优先权,这两个申请的全部内容均在此以引用方式整体并入。
对序列表的引用
本申请包含序列表,该序列表已经由EFS-Web以ASCII格式提交,并在此以引用方式整体并入。创建于2020年11月19目的所述ASCII副本名为CHOPP0038WO_ST25.txt并且大小为63.8千字节。
技术领域
本发明大体上涉及医学、病毒学和神经学领域。更特定地说,本发明涉及靶向肽,所述靶向肽将病毒载体靶向递送到脑中的独特结构。
背景技术
已经开发了不同的策略来生成AAV载体变体,包括合理设计和定向进化。合理设计方法利用AAV衣壳的知识对衣壳进行靶向变化,以改变转导效率或特异性,诸如衣壳表面上用于增加转导效率的酪氨酸突变。定向进化方法不需要任何衣壳结构知识,而是通过随机诱变、衣壳改组或随机肽插入来完成。这些策略通常使用体外系统或小鼠,这对于基于细胞或小鼠的研究是理想的,但并不暗示着向临床的转化。实际上,没有任何AAV变体专门或有效地靶向独特脑结构。因此,需要能够靶向独特灵长类脑结构的AAV变体。
发明内容
本文提供各自包含经修饰的衣壳的病毒载体,其中经修饰的衣壳包含至少一个将病毒载体靶向独特脑结构的氨基酸序列。
在一个实施方案中,提供经修饰的腺相关病毒(AAV)衣壳蛋白,其包含靶向肽,所述靶向肽将包含经修饰的AAV衣壳蛋白的病毒载体靶向独特的器官或脑结构,并且靶向肽的长度为3到10个氨基酸。在一些方面,经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白、经修饰的AAV2衣壳蛋白或经修饰的AAV9衣壳蛋白。
在一些方面,经修饰的AAV衣壳蛋白衍生自AAV1衣壳蛋白(参见SEQ ID NO:138),并且靶向肽插入AAV1衣壳蛋白的残基590之后。在一些方面,靶向肽的侧翼为接头序列,并且靶向肽的每侧上的接头序列均为两个或三个氨基酸长。在一些方面,接头序列是靶向肽的N末端侧上的SSA和靶向肽的C末端侧上的AS。在一些方面,经修饰的AAV1衣壳蛋白具有与SEQ ID NO:141至少95%相同的序列。
在一些方面,经修饰的AAV衣壳蛋白衍生自AAV2衣壳蛋白(参见SEQ ID NO:139),并且靶向肽插入AAV2衣壳蛋白的残基587之后。在一些方面,靶向肽的侧翼为接头序列,并且靶向肽的每侧上的接头序列均为两个或三个氨基酸长。在一些方面,接头序列是靶向肽的N末端侧上的AAA和靶向肽的C末端侧上的AA。在一些方面,经修饰的AAV2衣壳蛋白具有与SEQ ID NO:142至少95%相同的序列。
在一些方面,经修饰的AAV衣壳蛋白衍生自AAV9衣壳蛋白(参见SEQ ID NO:140),并且靶向肽插入AAV9衣壳蛋白的残基588之后。在一些方面,靶向肽的侧翼为接头序列,并且靶向肽的每侧上的接头序列均为两个或三个氨基酸长。在一些方面,接头序列是靶向肽的N末端侧上的AAA和靶向肽的C末端侧上的AS。在一些方面,经修饰的AAV9衣壳蛋白具有与SEQ ID NO:143至少95%相同的序列。
在一些方面,靶肽包含长度最多达10个氨基酸的序列,其中具有选自由SEQ IDNO:1-137和144组成的组的氨基酸序列。在一些方面,靶向肽的长度为7个氨基酸。
在一些方面,独特脑结构是脑干、尾核、小脑皮质、大脑皮质、室管膜、苍白球、海马、脑脊膜、视神经、壳核、脊髓、黑质、底丘脑核或丘脑。在某些方面,经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,并且靶向肽选自表1中列出的那些以靶向对应的脑结构。在某些方面,经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,并且靶向肽选自表2中列出的那些以靶向对应的脑结构。在某些方面,经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,并且靶向肽选自表3中列出的那些以靶向对应的脑结构。
在一些方面,独特器官是脑、肾脏、心脏、肝脏、生殖腺、脾或肝脏。在某些方面,经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,并且靶向肽选自表4中列出的那些以靶向对应的器官。在某些方面,经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,并且靶向肽选自表5中列出的那些以靶向对应的器官。在某些方面,经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,并且靶向肽选自表6中列出的那些以靶向对应的器官。
在一个实施方案中,本文提供包含编码本实施方案中任一项的经修饰的衣壳蛋白的序列的核酸。
在一个实施方案中,本文提供了包含本实施方案中任一项的经修饰的衣壳蛋白的重组腺相关病毒(rAAV)。在一些方面,提供rAAV的组合。例如,提供具有经修饰的AAV1衣壳蛋白和SEQ ID NO:21的靶向肽的rAAV、具有经修饰的AAV2衣壳蛋白和SEQ ID NO:53的靶向肽的rAAV、具有经修饰的AAV2的rAAV衣壳蛋白和SEQ ID NO:80的靶向肽以及具有经修饰的AAV9衣壳蛋白和SEQ ID NO:113的靶向肽的rAAV的组合。
在一个实施方案中,本文提供包含编码本实施方案中任一项的经修饰的衣壳蛋白的核酸的病毒载体。在一些方面,病毒载体进一步包含编码目的核酸的核酸序列。在一些方面,目的核酸是治疗剂。在一些方面,治疗剂是酶或RNAi分子。
在一个实施方案中,本文提供包含本实施方案中任一项的病毒载体的细胞。在一些方面,细胞是哺乳动物细胞,诸如人细胞。在一些方面,细胞在体外或体内。
在一个实施方案中,本文提供包含本实施方案的病毒载体和药学上可接受的载剂的药物组合物。
在一个实施方案中,本文提供向受试者的独特脑结构递送药剂的方法,其包括向受试者施用本实施方案的病毒。在一些方面,独特脑结构是脑干、尾核、小脑皮质、大脑皮质、室管膜、苍白球、海马、脑脊膜、视神经、壳核、脊髓、黑质、底丘脑核或丘脑。在某些方面,使用具有经修饰的AAV1衣壳蛋白的rAAV,并且靶向肽选自表1中列出的那些以靶向对应的脑结构。在某些方面,使用具有经修饰的AAV2衣壳蛋白的rAAV,并且靶向肽选自表2中列出的那些以靶向对应的脑结构。在某些方面,使用具有经修饰的AAV9衣壳蛋白的rAAV,并且靶向肽选自表3中列出的那些以靶向对应的脑结构。在各个方面,使用任何rAAV的组合。例如,使用具有经修饰的AAV1衣壳蛋白和SEQ ID NO:21的靶向肽的rAAV、具有经修饰的AAV2衣壳蛋白和SEQ ID NO:53的靶向肽的rAAV、具有经修饰的AAV2的rAAV衣壳蛋白和SEQ ID NO:80的靶向肽以及具有经修饰的AAV9衣壳蛋白和SEQ ID NO:113的靶向肽的rAAV的组合。
在一个实施方案中,本文提供将药剂递送到受试者的独特器官的方法,其包括向受试者施用本实施方案的病毒。在一些方面,器官是脑、肾脏、心脏、肝脏、生殖腺、脾或肝脏。在某些方面,使用具有经修饰的AAV1衣壳蛋白的rAAV,并且靶向肽选自表4中列出的那些以靶向对应的器官。在某些方面,使用具有经修饰的AAV2衣壳蛋白的rAAV,并且靶向肽选自表5中列出的那些以靶向对应的器官。在某些方面,使用具有经修饰的AAV9衣壳蛋白的rAAV,并且靶向肽选自表6中列出的那些以靶向对应的器官。在各个方面,使用任何rAAV的组合。
在一些方面,药剂是siRNA、shRNA、miRNA、非编码RNA、lncRNA、治疗性蛋白或CRISPR系统。在一些方面,施用是针对中枢神经系统。在一些方面,施用针对小脑延髓池、脑室内空间、室管膜、脑室、蛛网膜下腔和/或鞘内空间。在一些方面,脑室是前侧脑室、和/或后侧脑室、和/或右侧脑室、和/或左侧脑室、和/或右前侧脑室、和/或左前侧脑室、和/或右后侧脑室、和/或左后侧脑室。
在一些方面,施用多个病毒颗粒。在一些方面,以约1×106到约1×1018个载体基因组每千克(vg/kg)的剂量施用病毒。在一些方面,以约1×107-1×1017、约1×108-1×1016、约1×109-1×1015、约1×1010-1×1014、约1×1010-1×1013、约1×1010-1×1013、约1×1010-1×1011、约1×1011-1×1012、约1×1012-1×1013或约1×1013-1×1014vg/kg患者的剂量施用病毒。在一些方面,受试者是人。
在一个实施方案中,本文提供治疗哺乳动物的疾病的方法,其包括向哺乳动物施用本实施方案的病毒。在一些方面,疾病是神经退行性疾病。在一些方面,神经退行性疾病是亨延顿病(Huntington's disease)、ALS、遗传性痉挛性偏瘫、原发性侧索硬化、脊髓性肌萎缩、肯尼迪病(Kennedy’s disease)、阿尔茨海默病(Alzheimer's disease)、聚谷氨酰胺重复病或帕金森病(Parkinson's disease)。在一些方面,哺乳动物是人。
如本文所用,就指定组分来说,“基本上不含”在本文中用于意指没有任何指定组分被有目的地配制到组合物中和/或仅作为污染物或以痕量存在。因此由组合物的任何意外污染产生的指定组分的总量远低于0.05%,优选低于0.01%。最优选用标准分析方法不能检测到任何量的指定组分的组合物。
如本文说明书中所用,“一(a或an)”可意指一或多。如本文权利要求书中所用,当结合词语“包含”使用时,词语“一(a或an)”可意指一或多于一。
在权利要求书中,除非明确指示是指仅二选一或两种选择相互排斥,否则术语“或”的使用用于意指“和/或”,但本公开支持指仅二选一及“和/或”的定义。如本文所用的“另一”可意指至少第二或更多。
在本申请通篇内,术语“约”用于指示值包括用于确定所述值的装置、方法的固有误差变化、研究对象之间存在的变化或在所述值的10%内的值。
根据下文详细描述将明了本发明的其他目标、特征和优点。然而,应当理解,尽管具体实施方式和具体实施例显示了本发明的优选实施方案,但其仅以举例方式给出,因为本领域技术人员根据此详细描述将明了属于本发明精神和范围内的各种变化和修改。
附图说明
附图形成本说明书的一部分并且被包括以进一步证实本发明的某些方面。可通过与本文所呈现的具体实施方案的详细说明组合参考这些附图中的一个或多个来更好地理解本发明。
图1.AAV肽展示文库示意图。
图2体内筛选策略示意图。
图3.输入文库多样性的图形表示。在第1轮ICV注射之前,从AAV1、AAV2和AAV9病毒载体的等分试样测量输入病毒文库的多样性。
图4.逐轮(round-over-round)条形码富集的图形表示。所收集的每个组织在恒河猕猴中在第1轮和第2轮富集后恢复的唯一条形码的总数。显示了DNA和RNA的第2轮值。
图5.小脑皮质的AAV1、AAV2和AAV9血清型中条形码的逐轮富集图示。
图6.AAV9 1999的富集图示。来自AAV9的条形码富集的热图描绘图,通过从所指示的组织检测到的条形码的百分比对细胞进行着色。从DNA中恢复的条形码显示在左侧,而从RNA恢复的条形码在右侧。
图7A-C.来自AAV1(图7A)、AAV2(图7B)和AAV9(图7C)的opool条形码富集的热图描绘图。
图8.AAV9 1999体内恒河猕猴验证。将eGFP表达构建体包装到由CAG启动子驱动的AAV9 1999中。通过ICV注射将1.5E13 vg的AAV9 1999递送到5岁龄的雌性恒河猕猴。显示了描绘AAV9 1999的转导模式的H&E染色小脑的代表性图像。
图9A-D.AAV9 1999体内小鼠验证。将eGFP表达构建体包装到由CAG启动子驱动的AAV9 1999中。通过以1E10 vg的ICV注射将含有eGFP构建体的AAV9-1999和AAV9衣壳递送到C57BL/6 p0小鼠幼崽。eGFP荧光信号的代表性图像是全脑(图9A)、全脑矢状切面(图9B)、S1皮质切面(图9C,左)、海马切面(图9C,中)、小脑矢状切面(图9C,右)和腰脊髓冠状切面(图9D)。
图10A-C.体内恒河猕猴侧脑室(A)、第四脑室(B)和脑脊膜(C)中AAV混合物的荧光图像。
图11A-C.在将含有eGFP构建体的AAV9 1999衣壳施用于小鼠耳蜗后,耳蜗转(turn)(A)、内毛细胞(B)、皮质器官(C)和远端蜗轴(C)的荧光图像。
具体实施方式
本文提供各自包含经修饰的衣壳的病毒载体,其中经修饰的衣壳包含至少一个将病毒载体靶向独特脑结构的氨基酸序列。在某些实施方案中,脑结构是脑干、尾核、小脑皮质、大脑皮质、室管膜、苍白球、海马、脑脊膜、视神经、壳核、脊髓、黑质、底丘脑核或丘脑。表1-3中提供用于每种脑结构的靶向肽。
在某些实施方案中,病毒载体是腺相关病毒载体(AAV)。在某些实施方案中,AAV是AAV1、AAV2或AAV9。示例性的野生型参考AAV1衣壳蛋白序列提供于SEQ ID NO:138中。示例性的野生型参考AAV2衣壳蛋白序列提供于SEQ ID NO:139中。示例性的野生型参考AAV9衣壳蛋白序列提供于SEQ ID NO:140中。在某些方面,将靶向肽插入AAV1衣壳的590位、AAV2衣壳的587位或AAV9衣壳的588位。示例性的经修饰的AAV1衣壳蛋白序列提供于SEQ ID NO:141中,其显示作为SSAX7AS在位置590之后的靶向肽插入,其中前导SSA和尾随AS是接头序列并且X7代表靶向肽。示例性的经修饰的AAV2衣壳蛋白序列提供于SEQ ID NO:142中,其显示作为AAAX7AA在位置587之后的靶向肽插入,其中前导AAA和尾随AA是接头序列并且X7代表靶向肽。示例性的经修饰的AAV9衣壳蛋白序列提供于SEQ ID NO:143中,其显示作为AAAX7AS在位置588之后的靶向肽插入,其中前导AAA和尾随AS是接头序列并且X7代表靶向肽。
表1.用于每种脑结构的AAV1靶向肽.
表2.用于每种脑结构的AAV2靶向肽.
表3.用于每种脑结构的AAV9靶向肽.
表4.用于各种器官的AAV1靶向肽.
表5.用于各种器官的AAV2靶向肽.
表6.用于各种器官的AAV9靶向肽.
I.腺相关病毒(AAV)载体
腺相关病毒(AAV)是细小病毒科(parvoviridae)的非病原性小病毒。迄今为止,已鉴别出许多血清学上独特的AAV,并且已从人或灵长类动物中分离出超过一打AAV。AAV区别于该科的其他成员,因为它依赖于辅助病毒进行复制。
AAV基因组可以染色体外状态存在而不整合到宿主细胞基因组中;具有宽宿主范围;在体外和体内转导分裂细胞和非分裂细胞两者,并维持受转导基因的高水平表达。AAV病毒颗粒是热稳定的;耐溶剂、洗涤剂、pH值和温度变化;并且可在CsCl梯度上或通过其他手段进行柱纯化和/或浓缩。AAV基因组包含正义或负义的单链脱氧核糖核酸(ssDNA)。AAV的大约4.7kb基因组由一段正极性或负极性的单链DNA组成。基因组的末端是短的反向末端重复(ITR),其可折叠成发夹结构并用作病毒DNA复制的起点。
AAV“基因组”是指最终被包装或封装以形成AAV颗粒的重组核酸序列。AAV颗粒经常包含用AAV衣壳蛋白包装的AAV基因组。在使用重组质粒构建或制造重组载体的情况下,AAV载体基因组不包含不对应于重组质粒的载体基因组序列的“质粒”部分。重组质粒的该非载体基因组部分被称为“质粒骨架”,其对于质粒的克隆和扩增(质粒繁殖和产生所需的过程)是重要的,但其本身不被包装或封装到病毒颗粒中。因此,AAV载体“基因组”是指由AAV衣壳蛋白包装或封装的核酸。
AAV病毒体(颗粒)是直径为大约25nm的包含AAV衣壳的无包膜二十面体颗粒。AAV颗粒包括二十面体对称性,其包含三种相关的衣壳蛋白VP1、VP2和VP3,所述衣壳蛋白一起相互作用以形成衣壳。大多数天然AAV的基因组经常含有两个开放阅读框(ORF),有时被称为左侧ORF和右侧ORF。右侧ORF经常编码衣壳蛋白VP1、VP2和VP3。这些蛋白经常分别以1∶1∶10的比率被发现,但可能比率有变化,并且全部来自右手ORF。VP1、VP2和VP3衣壳蛋白的不同之处在于使用了选择性剪接和不寻常的起始密码子。缺失分析已证明,从选择性剪接的信息翻译的VP1的去除或改变会导致感染性颗粒的产率降低。VP3编码区内的突变导致不能产生任何单链子代DNA或感染性颗粒。在某些实施方案中,AAV颗粒的基因组编码一种、两种或所有三种VP1、VP2和VP3多肽。
左侧ORF经常编码非结构性Rep蛋白(Rep 40、Rep 52、Rep 68和Rep 78),它们除了参与单链子代基因组的产生之外,还参与复制和转录的调控。已将Rep蛋白中的两种与AAV基因组优先整合到人19号染色体q臂区域相关联。已证明Rep68/78具有NTP结合活性以及DNA和RNA解旋酶活性。一些Rep蛋白具有核定位信号以及若干潜在的磷酸化位点。在某些实施方案中,AAV(例如,rAAV)的基因组编码一些或所有Rep蛋白。在某些实施方案中,AAV(例如,rAAV)的基因组不编码Rep蛋白。在某些实施方案中,一种或多种Rep蛋白可以反式递送,因此不包括在包含编码多肽的核酸的AAV颗粒中。
AAV基因组的末端包含短的反向末端重复(ITR),其具有折叠成用作病毒DNA复制起点的T形发夹结构的潜力。因此,AAV的基因组包含一个或多个(例如,一对)位于单链病毒DNA基因组两侧的ITR序列。ITR序列经常各自具有约145个碱基的长度。在ITR区域内,已描述两个元件,它们被认为是ITR功能的核心,即GAGC重复基序和末端解链位点(trs)。已证明当ITR处于线性或发夹构象时,重复基序结合Rep。该结合被认为将Rep68/78定位为在trs处以位点和链特异性方式发生的切割。除了在复制中的作用之外,这两个元件似乎还是病毒整合的核心。在染色体19整合基因座内含有具有相邻trs的Rep结合位点。已证明这些元件是功能性的,并且对于基因座特异性整合是必需的。
术语“重组”,作为载体的修饰语(诸如重组病毒载体,例如,慢病毒或细小病毒(例如,AAV)载体),以及序列的修饰语(诸如重组核酸序列和多肽),意指组合物已经以自然界中通常不发生的方式被操作(即工程改造)。重组载体(诸如AAV病毒载体、逆转录病毒载体或慢病毒载体)的特定示例将是在病毒基因组内插入野生型病毒基因组中通常不存在的核酸序列。重组核酸序列的示例将是核酸(例如,基因)编码克隆到载体中的抑制性RNA的情形,该载体具有或不具有该基因的通常在病毒基因组内缔合的5′、3′和/或内含子区。尽管术语“重组”在本文中并不始终参考载体(诸如病毒载体)以及序列(诸如多核苷酸)来使用,但包括核酸序列、多核苷酸、转基因等的“重组”形式被明确包括在内,尽管有任何此类省略。
重组病毒“载体”通过以下方式而来源于病毒的野生型基因组:使用分子方法从病毒中去除部分野生型基因组,并用非天然核酸(诸如核酸序列)替代。通常,例如,对于AAV,AAV基因组的一个或两个反向末端重复(ITR)序列保留在重组AAV载体中。“重组”病毒载体(例如,rAAV)区别于病毒(例如,AAV)基因组,因为病毒基因组的一部分已相对于病毒基因组核酸(诸如编码反式激活子的核酸或编码抑制性RNA的核酸或编码治疗性蛋白的核酸)用非天然序列替代。因此,此类非天然核酸序列的掺入将病毒载体定义为“重组”载体,所述载体在AAV的情况下可称为“rAAV载体”。
在某些实施方案中,AAV(例如,rAAV)包含两个ITR。在某些实施方案中,AAV(例如,rAAV)包含一对ITR。在某些实施方案中,AAV(例如,rAAV)包含一对ITR,所述ITR位于至少编码具有功能或活性的多肽的核酸序列的侧翼(即,在所述核酸序列的每个5′和3′端)。
AAV载体(例如,rAAV载体)可被包装并且在本文中被称为“AAV颗粒”,用于细胞的随后离体、体外或体内感染(转导)。在将重组AAV载体封装或包装到AAV颗粒中的情况下,该颗粒还可被称为“rAAV颗粒”。在某些实施方案中,AAV颗粒是rAAV粒子。rAAV颗粒经常包含rAAV载体或其一部分。rAAV颗粒可以是一个或多个rAAV颗粒(例如,多个AAV颗粒)。rAAV颗粒通常包含封装或包装rAAV载体基因组的蛋白(例如,衣壳蛋白)。值得注意的是,对rAAV载体的提及也可用于提及rAAV颗粒。
任何适合的AAV颗粒(例如,rAAV颗粒)均可用于本文的方法或用途。rAAV颗粒和/或其中所包含的基因组可来源于任何适合的AAV血清型或毒株。rAAV颗粒和/或其中所包含的基因组可来源于两种或更多种AAV血清型或毒株。因此,rAAV可包含AAV的任何血清型或毒株的蛋白和/或核酸或其部分,其中AAV颗粒适于哺乳动物细胞的感染和/或转导。AAV血清型的非限制性示例包括AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV-rh74、AAV-rn10和AAV-2i8。
在某些实施方案中,多个rAAV颗粒包括相同毒株或血清型(或亚型或变体)的颗粒,或来源于相同菌株或血清型的颗粒。在某些实施方案中,多个rAAV颗粒包括两种或更多种不同rAAV颗粒(例如,不同血清型和/或毒株)的混合物。
如本文所用,术语“血清型”是用于指代具有在血清学上区别于其他AAV血清型的衣壳的AAV的区别。血清学区别性是基于针对一种AAV的抗体与另一种AAV之间缺乏交叉反应性来确定的。此类交叉反应性差异通常归因于衣壳蛋白序列/抗原决定簇的差异(例如,归因于AAV血清型的VP1、VP2和/或VP3序列差异)。尽管有包括衣壳变体在内的AAV变体可能在血清学上并不区别于参考AAV或其他AAV血清型的可能性,但它们与参考AAV血清型或其他AAV血清型相比相差至少一个核苷酸或氨基酸残基。
在某些实施方案中,基于第一血清型基因组的rAAV载体对应于包装该载体的一种或多种衣壳蛋白的血清型。例如,包含AAV载体基因组的一种或多种AAV核酸(例如,ITR)的血清型对应于包含rAAV颗粒的衣壳的血清型。
在某些实施方案中,rAAV载体基因组可基于区别于包装载体的一种或多种AAV衣壳蛋白的血清型的AAV(例如,AAV2)血清型基因组。例如,rAAV载体基因组可包含AAV2来源的核酸(例如,ITR),而三种衣壳蛋白中的至少一种或多种来源于不同的血清型,例如,AAV1、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、Rh10、Rh74或AAV-2i8血清型或其变体。
在某些实施方案中,与参考血清型有关的rAAV颗粒或其载体基因组的多核苷酸、多肽或亚序列包含与AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、Rh10、Rh74或AAV-2i8颗粒的多核苷酸、多肽或子序列至少60%或更高(例如,65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%等)相同的序列或由该序列组成。在特定实施方案中,与参考血清型有关的rAAV颗粒或其载体基因组的衣壳或ITR序列包含与AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、Rh10、Rh74或AAV-2i8血清型的衣壳或ITR序列至少60%或更高(例如,65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%等)相同的序列或由该序列组成。
在某些实施方案中,本文的方法包括使用、施用或递送rAAV1、rAAV2、rAAV3、rAAV4、rAAV5、rAAV6、rAAV7、rAAV8、rAAV9、rAAV10、rAAV11、rAAV12、rRh10、rRh74或rAAV-2i8颗粒。
在某些实施方案中,本文的方法包括使用、施用或递送rAAV2颗粒。在某些实施方案中,rAAV2颗粒包含AAV2衣壳。在某些实施方案中,rAAV2颗粒包含与天然或野生型AAV2颗粒的对应衣壳蛋白至少60%、65%、70%、75%或更高相同(例如,80%、85%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%等,最高达100%相同)的一种或多种衣壳蛋白(例如,VP1、VP2和/或VP3)。在某些实施方案中,rAAV2颗粒包含与天然或野生型AAV2颗粒的对应衣壳蛋白至少75%或更高相同(例如,80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%等,最高达100%相同)的VP1、VP2和VP3衣壳蛋白。在某些实施方案中,rAAV2颗粒是天然或野生型AAV2颗粒的变体。在一些方面,AAV2变体的一种或多种衣壳蛋白与天然或野生型AAV2颗粒的衣壳蛋白相比具有1、2、3、4、5、5-10、10-15、15-20或更多个氨基酸取代。
在某些实施方案中,rAAV9颗粒包含AAV9衣壳。在某些实施方案中,rAAV9颗粒包含与天然或野生型AAV9颗粒的对应衣壳蛋白至少60%、65%、70%、75%或更高相同(例如,80%、85%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%等,最高达100%相同)的一种或多种衣壳蛋白(例如,VP1、VP2和/或VP3)。在某些实施方案中,rAAV9颗粒包含与天然或野生型AAv9颗粒的对应衣壳蛋白至少75%或更高相同(例如,80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%等,最高达100%相同)的VP1、VP2和VP3衣壳蛋白。在某些实施方案中,rAAV9颗粒是天然或野生型AAV9颗粒的变体。在一些方面,AAV9变体的一种或多种衣壳蛋白与天然或野生型AAV9颗粒的衣壳蛋白相比具有1、2、3、4、5、5-10、10-15、15-20或更多个氨基酸取代。
在某些实施方案中,rAAV颗粒包含与天然或野生型AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV-rh74、AAV-rh10或AAV-2i8的对应ITR至少75%或更高相同(例如,80%、85%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%等,最高达100%相同)的一个或两个ITR(例如,一对ITR),只要它们保留一种或多种期望的ITR功能(例如,形成允许DNA复制的发夹的能力;将AAV DNA整合到宿主细胞基因组中;和/或如果期望,包装)即可。
在某些实施方案中,rAAV2颗粒包含与天然或野生型AAV2颗粒的对应ITR至少75%或更高相同(例如,80%、85%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%等,最高达100%相同)的一个或两个ITR(例如,一对ITR),只要它们保留一种或多种期望的ITR功能(例如,形成允许DNA复制的发夹的能力;将AAV DNA整合到宿主细胞基因组中;和/或如果期望,包装)即可。
在某些实施方案中,rAAV9颗粒包含与天然或野生型AAV2颗粒的对应ITR至少75%或更高相同(例如,80%、85%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%等,最高达100%相同)的一个或两个ITR(例如,一对ITR),只要它们保留一种或多种期望的ITR功能(例如,形成允许DNA复制的发夹的能力;将AAV DNA整合到宿主细胞基因组中;和/或如果期望,包装)即可。
rAAV颗粒可包含具有任何适合数目的“GAGC”重复的ITR。在某些实施方案中,AAV2颗粒的ITR包含1、2、3、4、5、6、7、8、9或10个或更多个“GAGC”重复。在某些实施方案中,rAAV2颗粒包含包括三个“GAGC”重复的ITR。在某些实施方案中,rAAV2颗粒包含具有少于四个“GAGC”重复的ITR。在某些实施方案中,rAAV2颗粒包含具有多于四个“GAGC”重复的ITR。在某些实施方案中,rAAV2颗粒的ITR包含Rep结合位点,其中前两个“GAGC”重复中的第四个核苷酸是C而不是T。
可掺入rAAV载体中用于包装/衣壳化到rAAV颗粒中的DNA的示例性适合长度可为约5千碱基(kb)或更小。在特定实施方案中,DNA的长度小于约5kb、小于约4.5kb、小于约4kb、小于约3.5kb、小于约3kb或小于约2.5kb。
可使用本领域已知的适合的重组技术生成包含指导RNAi或多肽表达的核酸序列的rAAV载体(例如,参见Sambrook等,1989)。重组AAV载体通常被包装成具有转导能力的AAV颗粒,并使用AAV病毒包装系统进行繁殖。具有转导能力的AAV颗粒能够结合到哺乳动物细胞并进入其中,并随后将核酸货物(例如,异源基因)递送到细胞核。因此,具有转导能力的完整rAAV颗粒被配置为转导哺乳动物细胞。配置为转导哺乳动物细胞的rAAV颗粒经常不具备复制能力,并且需要额外的蛋白机器来自我复制。因此,配置为转导哺乳动物细胞的rAAV颗粒被工程改造为结合哺乳动物细胞并进入其中并且将核酸递送到该细胞,其中用于递送的核酸经常位于rAAV基因组中的一对AAV ITR之间。
用于产生具有转导能力的AAV颗粒的适合宿主细胞包括但不限于可以或已经用作异源rAAV载体的受体的微生物、酵母细胞、昆虫细胞和哺乳动物细胞。可使用来自稳定的人细胞系HEK293(可通过例如美国典型培养物保藏中心(American Type CultureCollection)以保藏号ATCC CRL1573容易地获得)的细胞。在某些实施方案中,使用用腺病毒5型DNA片段转化并表达腺病毒E1a和E1b基因的经修饰的人胚肾细胞系(例如,HEK293)来生成重组AAV颗粒。经修饰的HEK293细胞系易于被转染,并提供了产生rAAV颗粒的特别方便的平台。生成能够转导哺乳动物细胞的高效价AAV颗粒的方法是本领域已知的。例如,AAV颗粒可如Wright,2008和Wright,2009中所述制得。
在某些实施方案中,通过在转染AAV表达载体之前或同时用AAV辅助构建体转染宿主细胞,将AAV辅助功能引入宿主细胞中。因此,AAV辅助构建体有时用于提供AAV rep和/或cap基因的至少瞬时表达,以补充生产性AAV转导所需的缺失AAV功能。AAV辅助构建体经常缺少AAV ITR,并且既不能自我复制也不能自我包装。这些构建体可以是质粒、噬菌体、转座子、粘粒、病毒或病毒体的形式。已经描述了许多AAV辅助构建体,诸如编码Rep和Cap表达产物两者的常用质粒pAAV/Ad和pIM29+45。已知许多编码Rep和/或Cap表达产物的其他载体。
“表达载体”是含有基因或核酸序列的特化载体,该基因或核酸序列具有在宿主细胞中表达所需的必要调控区。表达载体可含有至少用于在细胞中繁殖的复制起点和任选地额外的元件,诸如异源核酸序列、表达控制元件(例如,启动子、增强子)、内含子、一个或多个ITR和多聚腺苷酸化信号。
II.治疗剂
在一些实施方案中,可使用病毒基因转移方法在哺乳动物细胞或靶组织中引入核酸。此类方法可用于将编码抑制性RNA、非编码RNA和/或治疗性蛋白的核酸施用于培养中或宿主生物体中的细胞。
A.抑制性RNA
“RNA干扰(RNAi)”是由siRNA起始的序列特异性转录后基因沉默过程。在RNAi期间,siRNA诱导靶mRNA的降解,从而导致基因表达的序列特异性抑制。
“抑制性RNA”、“RNAi”、“小干扰RNA”或“短干扰RNA”或“siRNA”分子、“短发夹RNA”或“shRNA”分子或“miRNA”是核苷酸的靶向目的核酸序列的RNA双链体。如本文所用,术语“siRNA”是涵盖shRNA和miRNA的子集的通用术语。“RNA双链体”是指由RNA分子的两个区域之间的互补配对形成的结构。siRNA被“靶向”基因,因为siRNA的双链体部分的核苷酸序列与靶向基因的核苷酸序列互补。在某些实施方案中,siRNA靶向编码亨延顿蛋白(huntingtin)的序列。在一些实施方案中,siRNA双链体的长度小于30个碱基对。在一些实施方案中,双链体的长度可为29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11或10个碱基对。在一些实施方案中,双链体的长度为19到25个碱基对长。在某些实施方案中,双链体的长度为19或21个碱基对长。siRNA的RNA双链体部分可以是发夹结构的一部分。除了双链体部分之外,发夹结构还可含有位于形成双链体的两个序列之间的环部分。环的长度可以变化。在一些实施方案中,环的长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个核苷酸。在某些实施方案中,环的长度为18个核苷酸。发夹结构还可含有3′和/或5′突出端部分。在一些实施方案中,突出端是长度为0、1、2、3、4或5个核苷酸的3′和/或5′突出端。
shRNA包含茎环结构,所述茎-环结构被设计成含有5′侧翼区、siRNA区区段、环区、3′siRNA区和3′侧翼区。大多数RNAi表达策略利用了由基于polIII的强启动子驱动的短发夹RNA(shRNA)。许多shRNA在体外以及体内均表现出对靶序列的有效敲低,然而,还发现一些表现出对靶基因有效敲低的shRNA在体内具有毒性。
miRNA是由前体茎环转录物加工而成的小细胞RNA(约22nt)。已知的miRNA茎环可经修饰以含有对目的基因特异的RNAi序列。miRNA分子可能优于shRNA分子,因为miRNA是内源性表达的。因此,miRNA分子不太可能诱导dsRNA应答性干扰素途径,它们比shRNA更有效地被加工,并且它们已被证明沉默效率高80%。
最近发现的替代方法是使用人工miRNA(穿梭siRNA序列的原始-miRNA支架)作为RNAi载体。人工miRNA更自然地类似于内源性RNAi底物,并且更适于Pol-II转录(例如,允许RNAi的组织特异性表达)和多顺反子策略(例如,允许递送多个siRNA序列)。参见美国专利号10,093,927,其以引用方式并入。
“shRNA”的转录单位包含由未配对核苷酸的环连接的有义序列和反义序列。shRNA通过输出蛋白-5从细胞核中输出,且一旦进入细胞质中,就被Dicer加工以生成功能性siRNA。“miRNA”茎-环包含由未配对的核苷酸环连接的有义序列和反义序列,通常作为较大原始转录物(原始-miRNA)的一部分表达,所述原始-miRNA由Drosha-DGCR8复合物切除,生成称为前体miRNA的中间体,所述中间体随后由输出蛋白-5从细胞核中输出,且一旦进入细胞质中,就由Dicer加工以生成功能性siRNA。如本文可互换使用的“人工miRNA”或“人工miRNA穿梭载体”是指原始miRNA转录物,其具有经由Drosha和Dicer加工切除的双链体茎环的区域(至少约9-20个核苷酸),该区域被针对靶基因的siRNA序列替代,同时保留茎环内对于有效Drosha加工所需的结构元件。术语“人工”源于如下事实,即侧翼序列(上游约35个核苷酸和下游约40个核苷酸)产生于siRNA的多克隆位点内的限制酶位点。如本文所用,术语“miRNA”涵盖天然存在的miRNA序列以及人工生成的miRNA穿梭载体两者。
siRNA可由核酸序列编码,并且所述核酸序列还可包含启动子。核酸序列还可包含多聚腺苷酸化信号。在一些实施方案中,多聚腺苷酸化信号是合成的最小多聚腺苷酸化信号或六个T的序列。
在设计RNAi时,有若干需要考虑的因素,诸如siRNA的性质、沉默效应的耐久性以及传递系统的选择。为了产生RNAi效应,引入生物体中的siRNA通常将含有外显子序列。此外,RNAi过程依赖于同源性,因此必须仔细选择序列以最大限度地提高基因特异性,同时最大限度地降低同源但不是基因特异性的序列之间的交叉干扰可能性。优选地,siRNA在siRNA序列和待抑制基因之间展现出大于80%、85%、90%、95%、98%或甚至100%的同一性。与靶基因小于约80%相同的序列基本上不太有效。因此,siRNA与待抑制基因之间的同源性越大,不相关基因的表达受到影响的可能性就越小。
另外,siRNA的大小是重要的考虑因素。在一些实施方案中,本发明涉及siRNA分子,其包含至少约19-25个核苷酸并且能够调节基因表达。在本发明的上下文中,siRNA的长度优选地小于500、200、100、50或25个核苷酸。更优选地,siRNA的长度为约19个核苷酸到约25个核苷酸。
siRNA靶标通常意指包含编码多肽的区域的多核苷酸,或调控复制、转录或翻译或对多肽表达重要的其他过程的多核苷酸区域,或包含编码多肽的区域和与其可操作地连接的调控表达的区域的多核苷酸。可靶向在细胞中表达的任何基因。优选地,靶基因是参与对疾病重要或作为研究对象特别感令人兴趣的细胞活动的进展或与其相关的基因。
B.非编码RNA
如通过cDNA克隆计划和基因组嵌合阵列所证明的那样,超过90%的人基因组经历了转录但不编码蛋白。这些转录产物被称为非蛋白编码RNA(ncRNA)。多种ncRNA转录物(诸如核糖体RNA、转移RNA、竞争性内源性RNA(ceRNA)、小核RNA(snRNA)和小核仁RNA(snoRNA))对细胞功能至关重要。类似地,还已知大量的短ncRNA,诸如微小RNA(miRNA)、内源性短干扰RNA(siRNA)、PIWI相互作用RNA(piRNA)和小核仁RNA(snoRNA)在真核细胞中发挥重要的调控作用。最近的研究已证实展现出细胞类型特异性表达并定位到特定亚细胞区室中的一组长ncRNA(lncRNA)转录物。还已知lncRNA在细胞发育和分化期间发挥重要作用,支持它们在进化过程期间被选择的观点。
LncRNA似乎具有许多不同的功能。在许多情况下,它们似乎在调控蛋白的活性或定位方面发挥作用,或者充当用于亚细胞结构的组织框架。在其他情况下,lncRNA被加工以产生多个小RNA,或者它们可调节其他RNA被加工的方式。由公共研究联盟(publicresearch consortium)GenCode(版本号27)产生的最新版本的数据对人类基因组中略低16,000个的lncRNA进行了编目,产生了近28,000个转录物;当包括其他数据库时,已知超过40,000个lncRNA。
有趣的是,lncRNA可影响特定基因组基因座处特定靶蛋白的表达,调节蛋白结合配偶体的活性,将染色质修饰复合物引导到其作用位点,并经过转录后加工以产生大量5′加帽的小RNA。表观遗传途径也可调控lncRNA的差异表达。
越来越多的证据也表明,异常表达的lncRNA在正常生理过程以及多种疾病状态中发挥着重要作用。lncRNA在各种疾病中被误调控,包括缺血、心脏病、阿尔茨海默病、银屑病和脊髓小脑性共济失调8型。这种误调控也表现在各种类型的癌症(诸如乳腺癌、结肠癌、前列腺癌、肝细胞癌和白血病)中。若干lncRNA(例如gadd74和lncRNA-RoR5)调节细胞周期调控物,诸如细胞周期蛋白、细胞周期蛋白依赖性激酶(CDK)、CDK抑制剂和p53,因此为细胞周期进程提供一层额外的灵活性和稳健性。另外,一些lncRNA与有丝分裂过程关联,诸如着丝粒卫星RNA,它是动粒形成必不可少的,因此对于人和果蝇有丝分裂期间的染色体分离至关重要。另一种核lncRNA(MA-lincl)通过顺式发挥作用来调控M期退出,以阻抑其邻近基因Pura的表达,Pura是细胞增殖的调控物。
lncRNA是通常被定义为缺乏延伸开放阅读框(ORF)的超过200个核苷酸(例如约200到约1200nt、约2500nt或更多)的转录物的群组。术语“非编码RNA”(ncRNA)包括lncRNA以及例如小于约200nt(诸如约30到200nt)的更短转录物。
因此,在一些实施方案中,将ncRNA递送到诸如目的特定脑结构纠正了异常RNA表达水平或调节致病性lncRNA的水平。因此,在一些实施方案中,本发明提供rAAV,其中病毒基因组被工程改造为编码治疗性非编码RNA(ncRNA)。在一些实施方案中,ncRNA是长度为约200个核苷酸(nt)或更大的长非编码RNA(lncRNA)。在一些实施方案中,治疗剂是长度为约25nt或约30nt到约200nt的ncRNA。在一些实施方案中,lncRNA的长度为约200nt到约1,200nt。在一些实施方案中,lncRNA的长度为约200nt至约1,100nt、约1,000nt、约900nt、约800nt、约700nt、约600nt、约500nt、约400nt或约300nt。
C.CRISPR系统
基因编辑是允许在活细胞内修饰靶基因的技术。最近,利用CRISPR的细菌免疫系统进行按需基因编辑彻底改变了科学工作者处理基因组编辑的方式。CRISPR系统的Cas9蛋白(其为RNA引导的DNA内切核酸酶)可通过改变其引导RNA序列进行工程改造以相对容易地靶向新位点。这一发现使序列特异性基因编辑在功能上有效。
通常,“CRISPR系统”统指参与CRISPR相关(“Cas”)基因活性表达或引导其活性的转录物和其他元件,包括编码Cas基因的序列、tracr(反式激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr-伴侣(mate)序列(在内源CRISPR系统的背景下涵盖“同向重复”和tracrRNA加工的部分同向重复)、引导序列(在内源性CRISPR系统的背景下也被称为“间隔物”)和/或来自CRISPR基因座的其他序列和转录物。
CRISPR/Cas核酸酶或CRISPR/Cas核酸酶系统可包含序列特异性结合到DNA的非编码RNA分子(引导)RNA和具有核酸酶功能性(例如,两个核酸酶结构域)的Cas蛋白(例如,Cas9)。CRISPR系统的一个或多个元件可来源于I型、II型或III型CRISPR系统,例如,来源于包含内源性CRISPR系统的特定生物体,诸如酿脓链球菌(Streptococcus pyogenes)。
CRISPR系统可在靶位点诱导双链断裂(DSB),之后是如本文所讨论的碎裂。在其他实施方案中,使用被认为是“切口酶”的Cas9变体在靶位点切割单链。可使用配对的切口酶,例如,以改善特异性,每种切口酶由一对不同的gRNA靶向序列指导,使得在同时引入切口后,引入5′突出端。在其他实施方案中,催化无活性的Cas9与异源效应物结构域(诸如转录阻遏物(例如,KRAB)或激活物)融合,以影响基因表达。或者,具有催化无活性的Cas9的CRISPR系统进一步包含与核糖体结合蛋白融合的转录阻遏物或激活物。
在一些方面,将Cas核酸酶和gRNA(包括对靶序列特异的crRNA和固定的tracrRNA的融合物)引入细胞中。一般来说,gRNA的5′端处的靶位点使用互补碱基配对将Cas核酸酶靶向靶位点,例如基因。靶位点可基于其紧邻原型间隔物(protospacer)相邻基序(PAM)序列(诸如通常为NGG或NAG)的5′位置来选择。在这方面,通过修饰引导RNA的前20、19、18、17、16、15、14、14、12、11或10个核苷酸以对应于靶DNA序列,将gRNA靶向期望序列。通常,CRISPR系统的特征在于促进在靶序列位点形成CRISPR复合物的元件。通常,“靶序列”一般是指引导序列被设计成具有互补性的序列,其中靶序列和引导序列之间的杂交促进了CRISPR复合物的形成。不一定需要完全互补性,条件是存在足够的互补性以引起杂交并促进CRISPR复合物的形成。
靶序列可包含任何多核苷酸,诸如DNA或RNA多核苷酸。靶序列可定位于细胞的细胞核或细胞质中,诸如细胞的细胞器内。通常,可用于重组到包含靶序列的靶向基因座中的序列或模板被称为“编辑模板”或“编辑多核苷酸”或“编辑序列”。在一些方面,外源模板多核苷酸可被称为编辑模板。在一些方面,重组是同源重组。
通常,在内源性CRISPR系统的背景下,CRISPR复合物(包含与靶序列杂交并与一种或多种Cas蛋白复合的引导序列)的形成导致靶序列中或附近(例如1、2、3、4、5、6、7、8、9、10、20、50或更多个碱基对内)的一条或两条链的切割。tracr序列(其可包含野生型tracr序列的全部或部分(例如野生型tracr序列的约或超过约20、26、32、45、48、54、63、67、85或更多个核苷酸)或由其组成)也可诸如通过沿着tracr序列的至少一部分与可操作地连接到引导序列的tracr伴侣序列的全部或部分杂交来形成CRISPR复合物的一部分。tracr序列与trac伴侣序列具有足够的互补性以杂交并参与CRISPR复合物的形成,诸如当最佳比对时,沿着tracr伴侣序列的长度具有至少50%、60%、70%、80%、90%、95%或99%的序列互补性。
可将驱动CRISPR系统的一个或多个元件的表达的一个或多个载体引入细胞中,使得CRISPR系统的元件的表达在一个或多个靶位点处直接形成CRISPR复合物。组分还可作为蛋白和/或RNA递送到细胞。例如,Cas酶、连接到tracr-伴侣序列的引导序列和tracr序列可各自可操作地连接到单独载体上的单独调控元件。Cas酶可以是如本文所公开的处于受调控的选择性剪接事件控制之下的靶基因,其作为嵌合靶基因小基因或作为用于嵌合小基因反式激活子的靶基因。gRNA可能处于组成型启动子的控制之下。
或者,从相同或不同调控元件表达的元件中的两个或更多个可在单个载体中组合,其中一个或多个额外的载体提供不包括在第一载体中的CRISPR系统的任何组分。载体可包含一个或多个插入位点,诸如限制性内切核酸酶识别序列(也被称为“克隆位点”)。在一些实施方案中,一个或多个插入位点定位于一个或多个载体的一个或多个序列元件的上游和/或下游。当使用多个不同的引导序列时,可使用单个表达构建体将CRISPR活性靶向细胞内的多个不同的对应靶序列。
载体可包含可操作地连接到编码CRISPR酶(诸如Cas蛋白)的酶编码序列的调控元件,。Cas蛋白的非限制性示例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也被称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csfl、Csf2、Csf3、Csf4、它们的同源物或它们的修饰形式。这些酶是已知的;例如,酿脓链球菌Cas9蛋白的氨基酸序列可在SwissProt数据库中以保藏号Q99ZW2找到。
CRISPR酶可以是Cas9(例如,来自酿脓链球菌或肺炎链球菌(S.pneumonia))。CRISPR酶可在靶序列的位置(诸如在靶序列内和/或在靶序列的互补序列内)指导一条或两条链的切割。载体可编码相对于对应的野生型酶突变的CRISPR酶,使得突变的CRISPR酶缺乏切割含有靶序列的靶多核苷酸的一条或两条链的能力。例如,来自酿脓链球菌Cas9的RuvC I催化结构域中的天冬氨酸到丙氨酸的取代(D10A)将Cas9从切割两条链的核酸酶转化为切口酶(切割单链)。在一些实施方案中,Cas9切口酶可与一个或多个引导序列(例如,两个引导序列,其分别靶向DNA靶标的有义链和反义链)组合使用。该组合允许两条链都带切口并用于诱导NHEJ或HDR。
在一些实施方案中,编码CRISPR酶的酶编码序列经密码子优化以用于在特定细胞(诸如真核细胞)中表达。真核细胞可以是特定生物体的那些或来源于特定生物体,所述特定生物体诸如哺乳动物,包括但不限于人、小鼠、大鼠、兔、狗或非人灵长类动物。通常,密码子优化是指通过以下方式修饰核酸序列以增强在目的宿主细胞中表达的过程:用该宿主细胞的基因中更频繁或最频繁使用的密码子替代天然序列的至少一个密码子,同时维持天然氨基酸序列。各种物种对特定氨基酸的某些密码子展现出特定的偏好。密码子偏倚(生物体之间密码子使用的差异)经常与信使RNA(mRNA)的翻译效率相关,所述翻译效率进而认为取决于被翻译密码子的性质和特定转移RNA(tRNA)分子的可用性等因素。所选tRNA在细胞中的优势通常反映了肽合成中最频繁使用的密码子。因此,可基于密码子优化为给定生物体中的最佳基因表达定制基因。
通常,引导序列是与靶多核苷酸序列具有足够互补性以与靶序列杂交并指导CRISPR复合物与靶序列的序列特异性结合的任何多核苷酸序列。在一些实施方案中,当使用适合的比对算法进行最佳比对时,引导序列与其对应的靶序列之间的互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更高。
可使用用于比对序列的任何适合算法来确定最佳比对,所述算法的非限制性示例包括Smith-Waterman算法、Needleman-Wunsch算法、基于Burrows-Wheeler变换的算法(例如Burrows Wheeler Aligner)、Clustal W、Clustal X、BLAT、Novoalign(NovocraftTechnologies,ELAND(Illumina,San Diego,Calif.)、SOAP(可在soap.genomics.org.cn获得)和Maq(可在maq.sourceforge.net获得)。
CRISPR酶可以是包含一个或多个异源蛋白结构域的融合蛋白的一部分。CRISPR酶融合蛋白可包含任何额外的蛋白序列,以及任选地任两个结构域之间的接头序列。可与CRISPR酶融合的蛋白结构域的示例包括但不限于表位标签、报告基因序列和具有以下一种或多种活性的蛋白结构域:甲基化酶活性、脱甲基酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。表位标签的非限制性示例包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签。报告基因的示例包括但不限于谷胱甘肽-5-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰基转移酶(CAT)、β半乳糖苷酶、β-葡糖醛酸糖苷酶、荧光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和自发荧光蛋白,包括蓝色荧光蛋白(BFP)。CRISPR酶可与编码结合DNA分子或结合其他细胞分子的蛋白或蛋白片段的基因序列融合,所述其他细胞分子包括但不限于麦芽糖结合蛋白(MBP)、S-tag、Lex A DNA结合结构域(DBD)融合物、GAL4A DNA结合结构域融合物和单纯疱疹病毒(HSV)BP16蛋白融合物。可形成包含CRISPR酶的融合蛋白的一部分的额外结构域描述于US20110059502(其以引用方式并入本文)中。
D.治疗性蛋白
一些实施方案涉及重组蛋白和多肽的表达。在一些方面,可修饰蛋白或多肽以增加血清稳定性。因此,当本申请提到“经修饰的蛋白”或“经修饰的多肽”的功能或活性时,本领域普通技术人员将理解,这包括例如具有优于未修饰的蛋白或多肽的额外优点的蛋白或多肽。特别预期关于“经修饰的蛋白”的实施方案可相对于“经修饰的多肽”来实施,反之亦然。
重组蛋白可具有氨基酸的缺失和/或取代;因此,具有缺失的蛋白、具有取代的蛋白以及具有缺失和取代的蛋白是经修饰的蛋白。在一些实施方案中,这些蛋白可进一步包含插入或添加的氨基酸,诸如例如融合蛋白或具有接头的蛋白。“经修饰的缺失蛋白”缺少天然蛋白的一个或多个残基,但可能具有天然蛋白的特异性和/或活性。“经修饰的缺失蛋白”还可具有降低的免疫原性或抗原性。经修饰的缺失蛋白的示例是具有从至少一个抗原区(即确定在特定生物体(诸如正在施用修饰蛋白的生物体)中具有抗原性的蛋白区)缺失的氨基酸残基的蛋白。
取代或替代变体通常蛋白内一个或多个位点处的一个氨基酸交换为另一个氨基酸,并且可被设计为调节多肽的一种或多种性质,特别是其效应子功能和/或生物利用度。取代可能是保守的,也可能不是保守的,也就是说,一个氨基酸被具有相似形状和电荷的氨基酸替代。保守取代在本领域中是众所周知的,并且包括例如以下变化:丙氨酸到丝氨酸;精氨酸到赖氨酸;天冬酰胺到谷氨酰胺或组氨酸;天冬氨酸到谷氨酸;半胱氨酸到丝氨酸;谷氨酰胺到天冬酰胺;谷氨酸到天冬氨酸;甘氨酸到脯氨酸;组氨酸到天冬酰胺或谷氨酰胺;异亮氨酸到亮氨酸或缬氨酸;亮氨酸到缬氨酸或异亮氨酸;赖氨酸到精氨酸;蛋氨酸到亮氨酸或异亮氨酸;苯丙氨酸到酪氨酸、亮氨酸或甲硫氨酸;丝氨酸到苏氨酸;苏氨酸到丝氨酸;色氨酸到酪氨酸;酪氨酸到色氨酸或苯丙氨酸;和缬氨酸到异亮氨酸或亮氨酸。
除了缺失或取代之外,经修饰的蛋白还可具有残基的插入,这通常涉及在多肽中添加至少一个残基。这可包括靶向肽或多肽或仅单个残基的插入。下文讨论称为融合蛋白的末端添加。
术语“生物功能等同物”在本领域中是众所周知的并且在本文中进一步被详细定义。因此,包括约70%到约80%、或约81%到约90%、或甚至约91%到约99%的氨基酸与对照多肽的氨基酸相同或功能等同的序列,条件是维持蛋白的生物活性。在某些方面,重组蛋白可在生物学功能上等同于其天然对应物。
还应当理解,氨基酸和核酸序列可包含额外的残基,诸如额外的N-或C末端氨基酸或5′或3′序列,但仍然基本上如本文所公开的序列之一中所示,只要序列满足上述准则,包括在涉及蛋白表达的情况下维持生物蛋白活性。末端序列的添加特别适用于如下核酸序列:可例如包括位于编码区5′或3′部分侧翼的各种非编码序列,或者可包括已知发生在基因内的各种内部序列,即内含子。
如本文所用,蛋白或肽通常是指但不限于大于约200个氨基酸、最多达从基因翻译的全长序列的蛋白;大于约100个氨基酸的多肽;和/或约3到约100个氨基酸的肽。为方便起见,术语“蛋白”、“多肽”和“肽”在本文中可互换使用。
如本文所用,“氨基酸残基”是指本领域已知的任何天然存在的氨基酸、任何氨基酸衍生物或任何氨基酸模拟物。在某些实施方案中,蛋白或肽的残基是连续的,没有任何非氨基酸中断氨基酸残基的序列。在其他实施方案中,该序列可包含一个或多个非氨基酸部分。在特定实施方案中,蛋白或肽的残基序列可被一个或多个非氨基酸部分中断。
因此,术语“蛋白或肽”涵盖氨基酸序列,所述氨基酸序列包含在天然存在的蛋白中发现的20种常见氨基酸中的至少一种,或至少一种经修饰或不寻常的氨基酸。
本发明的某些实施方案涉及融合蛋白。这些分子可能具有在N末端或C末端连接到异源结构域的治疗性蛋白。例如,融合还可采用来自其他物种的前导序列以允许蛋白在异源宿主中的重组表达。另一有用的融合包括添加蛋白亲和标签(诸如血清白蛋白亲和标签或六个组氨酸残基)或免疫活性结构域(诸如优选可切割的抗体表位),以促进融合蛋白的纯化。非限制性亲和标签包括多组氨酸、几丁质结合蛋白(CBP)、麦芽糖结合蛋白(MBP)和谷胱甘肽-S-转移酶(GST)。
生成融合蛋白的方法是本领域技术人员众所周知的。可例如通过从头合成完整融合蛋白,或通过附着编码异源结构域的DNA序列,之后表达完整的融合蛋白来产生此类蛋白。
可通过连接基因与编码肽接头的桥接DNA区段来促进恢复亲本蛋白功能活性的融合蛋白的产生,所述肽接头在串联连接的多肽之间剪接。接头将有足够的长度以允许所得融合蛋白的恰当折叠。
II.施用方法
在一些方面,病毒载体可直接施用于患者(体内),或者它们可用于在体外或离体处理细胞,然后施用于患者。术语“载体”是指小载剂核酸分子、质粒、病毒(例如,AAV载体、逆转录病毒载体、慢病毒载体),或可通过插入或掺入核酸进行操作的其他载体。载体(诸如病毒载体)可用于将核酸序列引入/转移到细胞中,使得其中的核酸序列被转录,并且如果编码蛋白,则随后被细胞翻译。
任何适合的细胞或哺乳动物均可通过本文所述的方法或用途来施用或处理。通常,需要本文所述方法的哺乳动物被怀疑具有或表达与疾病状态相关的异常或不正常蛋白。或者,哺乳动物受体可患有适于基因替代疗法的病况。如本文所用,“基因替代疗法”是指向受体施用编码治疗剂的外源遗传物质并随后原位表达所施用的遗传物质。因此,短语“适于基因替代疗法的病况”涵盖诸如以下的病况:遗传疾病(即,可归因于一种或多种基因缺陷的疾病病况)、获得性病状(即,不可归因于先天缺陷的病理病况)、癌症和预防过程(即,疾病或不期望的医学病况的预防)。因此,如本文所用,术语“治疗剂”是指对哺乳动物受体具有有益作用的任何药剂或材料。因此,“治疗剂”涵盖具有核酸或蛋白组分的治疗性分子和预防性分子。
哺乳动物的非限制性示例包括人、非人灵长类动物(例如,类人猿、长臂猿、黑猩猩、猩猩、猴、猕猴等)、家畜(例如狗和猫)、农场动物(例如,马、牛、山羊、绵羊、猪)和实验动物(例如,小鼠、大鼠、兔、豚鼠)。在某些实施方案中,哺乳动物是人。在某些实施方案中,哺乳动物是非啮齿类哺乳动物(例如,人、猪、山羊、绵羊、马、狗等)。在某些实施方案中,非啮齿类哺乳动物是人。哺乳动物可以是任何年龄或处于任何发育阶段(例如,成人、青少年、儿童、婴儿或子宫内的哺乳动物)。哺乳动物可以是雄性或雌性。在某些实施方案中,哺乳动物可以是动物疾病模型,例如,具有或表达与疾病状态相关的异常或不正常蛋白的动物模型、或具有引起疾病状态的蛋白表达不足的动物模型。
通过本文所述的方法或组合物治疗的哺乳动物(受试者)包括成人(18岁或更大)和儿童(年龄小于18岁)。成人包括老年人。代表性的成人是50岁或以上。儿童的年龄范围为1-2岁,或2-4、4-6、6-18、8-10、10-12、12-15和15-18岁。儿童还包括婴儿。婴儿的年龄通常在1-12个月范围。
在某些实施方案中,方法包括向哺乳动物施用如本文所述的多个病毒颗粒,其中降低、减少、预防、抑制或延迟疾病状态(诸如神经退行性疾病)的一种或多种症状的严重性、频率、进展或发作时间。在某些实施方案中,方法包括向哺乳动物施用多个病毒颗粒以治疗疾病状态(诸如神经退行性疾病)的不利症状。在某些实施方案中,方法包括向哺乳动物施用多个病毒颗粒以稳定、延迟或预防疾病状态(诸如神经退行性疾病)的恶化或进展、或逆转和不利的症状。
在某些实施方案中,方法包括向哺乳动物的中枢神经系统或其如本文所述的部分施用多个病毒颗粒,并且将疾病状态(诸如神经退行性疾病)的一种或多种症状的严重性、频率、进展或发作时间降低、减少、预防、抑制或延迟至少约5到约10、约10到约25、约25到约50或约50到约100天。
在某些实施方案中,症状或不利作用包括早期、中期或晚期症状;行为、性格或语言症状;吞咽、运动、癫痫发作、震颤或坐立不安的症状;共济失调;和/或认知症状,诸如记忆力、组织能力。
III.药物组合物
如本文所用,术语“药学上可接受的”和“生理上可接受的”意指适于一种或多种施用途径、体内递送或接触的生物学上可接受的组合物、制剂、液体或固体或其混合物。“药学上可接受的”或“生理上可接受的”组合物是在生物学或其他方面不是不期望的材料,例如,该材料可施用于受试者而不会引起实质上不期望的生物学效应。此类组合物、“药学上可接受的”和“生理上可接受的”制剂和组合物可以是无菌的。此类药物制剂和组合物可用于例如向受试者施用病毒颗粒。
此类制剂和组合物包含与药物施用或体内接触或递送相容的溶剂(水性或非水性)、溶液(水性或非水性)、乳液(例如,水包油或油包水)、悬浮液、糖浆、酏剂、分散和悬浮介质、包衣、等渗剂和吸收促进剂或延迟剂。水性和非水性溶剂、溶液和悬浮液可包含悬浮剂和增稠剂。补充的活性化合物(例如,防腐剂、抗细菌剂、抗病毒剂和抗真菌剂)也可掺入制剂和组合物中。
药物组合物通常含有药学上可接受的赋形剂。此类赋形剂包括本身不诱导产生对接受组合物的个体有害的抗体并且可被施用而无过度毒性的任何药剂。药学上可接受的赋形剂包括但不限于山梨糖醇、吐温80(Tween80)和液体,诸如水、盐水、甘油和乙醇。其中可包括药学上可接受的盐,例如矿物酸盐,诸如盐酸盐、氢溴酸盐、磷酸盐、硫酸盐等;和有机酸盐,诸如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等。另外,辅助物质(诸如表面活性剂、润湿剂或乳化剂、pH缓冲物质等)可存在于此类媒介物中。
如本文所述或本领域技术人员已知的,可将药物组合物配制成与特定施用或递送途径相容。因此,药物组合物包含适于通过各种途径施用或递送的载剂、稀释剂或赋形剂。
适于注射或输注病毒颗粒的药物形式可包括适于当场制备无菌可注射或可输注溶液或分散液的无菌水溶液或分散液,其任选地封装在脂质体中。在所有情况下,最终形式都应当是无菌流体,并且在制造、使用和储存条件下稳定。液体载剂或媒介物可以是溶剂或液体分散介质,其包含例如水、乙醇、多元醇(例如,甘油、丙二醇、液体聚乙二醇等)、植物油、无毒甘油酯和它们适合的混合物。可例如通过形成脂质体、在分散液的情况下通过维持所需的粒径或通过使用表面活性剂来维持适当的流动性。可包含等渗剂,例如糖、缓冲剂或盐(例如,氯化钠)。可通过在组合物中使用延迟吸收的试剂(例如,单硬脂酸铝和明胶)来产生可注射组合物的延长吸收。
病毒颗粒的溶液或悬浮液可任选地包含以下组分中的一种或多种:无菌稀释剂,诸如注射用水、盐水溶液(诸如磷酸盐缓冲盐水(PBS))、人工CSF、表面活性剂、不挥发油、多元醇(例如,甘油、丙二醇和液体聚乙二醇等)、甘油或其他合成溶剂;抗细菌剂和抗真菌剂,诸如对羟基苯甲酸酯、氯丁醇、苯酚、抗坏血酸等;抗氧化剂,诸如抗坏血酸或亚硫酸氢钠;螯合剂,诸如乙二胺四乙酸;缓冲剂,诸如乙酸盐、柠檬酸盐或磷酸盐,以及用于调节张力的试剂,诸如氯化钠或右旋糖。
适于本发明的组合物、方法和用途的药物制剂、组合物和递送系统是本领域已知的(参见,例如,雷明顿:药学科学与实践(Remington:The Science and Practice ofPharmacy)(2003)第20版,Mack Publishing Co.,Easton,PA;雷明顿药物科学(Remington's Pharmaceutical Sciences)(1990)第18版,Mack Publishing Co.,Easton,PA;默克索引(The Merck Index)(1996)第12版,Merck Publishing Group,Whitehouse,NJ;固体剂型的药学原理(Pharmaceutical Principles of Solid Dosage Forms)(1993),TechnonicPublishing Co.,Inc.,Lancaster,Pa.;Ansel和Stoklosa,药物计算(PharmaceuticalCalculations)(2001)第11版,Lippincott Williams&Wilkins,Baltimore,MD;和Poznansky等,药物递送系统(Drug Delivery Systems)(1980),R.L.Juliano编辑,Oxford,N.Y.,第253-315页)。
可将病毒颗粒和它们的组合物配制成剂量单位形式,以便于施用和剂量的均匀性。如本文所用的剂量单位形式是指适合作为单位剂量用于待治疗个体的物理离散单位;每个单位含有经计算与所需药物载剂联合产生期望治疗作用的预定量的活性化合物。剂量单位形式取决于认为产生一种或多种期望效应所必需的病毒颗粒的数目。必要的量可配制成单剂量,或者可配制成多个剂量单位。可将剂量调整到适合的病毒颗粒浓度,任选地与抗炎剂组合,并包装以供使用。
在一个实施方案中,药物组合物将包含足够的遗传物质以提供治疗有效量,即足以减少或改善所讨论疾病状态的症状或不利作用的量或足以赋予期望益处的量。
如本文所用的“单位剂型”是指适合作为单位剂量用于待治疗受试者的物理离散单位;每个单位含有任选地与药物载剂(赋形剂、稀释剂、媒介物或填充剂)联合的预定的量,当以一个或多个剂量施用时,经计算产生期望作用(例如,预防或治疗作用)。单位剂型可在例如安瓿和小瓶内,其可包括液体组合物,或处于冷冻干燥或冻干状态的组合物;例如,可在体内施用或递送之前添加无菌液体载剂。单个单位剂型可被包含在多剂量试剂盒或容器中。因此,例如,可将病毒颗粒和其药物组合物包装在单个或多个单位剂型中,以便于施用和剂量的均匀性。
含有病毒颗粒的制剂通常含有有效量,该有效量容易由本领域技术人员确定病毒颗粒通常可在组合物的约1%到约95%(w/w)范围,或者如果适合的话甚至更高。待施用的量取决于诸如以下的因素:考虑治疗的哺乳动物或人受试者的年龄、体重和身体状况。本领域普通技术人员可通过建立剂量反应曲线的常规试验来建立有效剂量。
IV.定义
术语“多核苷酸”、“核酸”和“转基因”在本文中可互换用于指代所有形式的核酸、寡核苷酸,包括脱氧核糖核酸(DNA)和核糖核酸(RNA)以及它们的聚合物。多核苷酸包括基因组DNA、cDNA和反义DNA,以及剪接或未剪接的mRNA、rRNA、tRNA和抑制性DNA或RNA(RNAi,例如,小或短发夹(sh)RNA、微小RNA(miRNA)、小或短干扰(si)RNA、反式剪接RNA或反义RNA)。多核苷酸可包括天然存在的、合成的和有意修饰或改变的多核苷酸(例如,变体核酸)。多核苷酸可以是单链的、双链的或三联的、线性的或环状的,并且可具有任何适合的长度。在讨论多核苷酸时,可根据在5′到3′方向上提供序列的惯例在本文中描述特定多核苷酸的序列或结构。
编码多肽的核酸经常包含编码多肽的开放阅读框。除非另外指明,否则特定的核酸序列还包含简并密码子取代。
核酸可包含一种或多种可操作地连接到开放阅读框的表达控制或调控元件,其中一种或多种调控元件被配置为指导哺乳动物细胞中由开放阅读框编码的多肽的转录和翻译。表达控制/调控元件的非限制性示例包括转录起始序列(例如,启动子、增强子、TATA盒等)、翻译起始序列、mRNA稳定性序列、多聚A序列、分泌序列等。可从任何适合生物体的基因组获得表达控制/调控元件。
“启动子”是指通常位于编码序列上游(5′)的核苷酸序列,其通过提供对RNA聚合酶和正确转录所需的其他因子的识别来指导和/或控制编码序列的表达。pol II启动子包括最小启动子,该最小启动子是包含TATA盒和任选地用于指定转录起始位点的其他序列的短DNA序列,调控元件被添加到这些序列以控制表达。1型pol III启动子包含转录起始位点下游的三个顺式作用序列元件:a)5′序列元件(A块(block));b)中间序列元件(I块);c)3′序列元件(C块)。2型pol III启动子包含转录起始位点下游的两个必需的顺式作用序列元件:a)A盒(5′序列元件);和b)B盒(3′序列元件)。3型pol III启动子包含转录起始位点上游的若干顺式作用启动子元件,诸如传统的TATA盒、近端序列元件(PSE)和远端序列元件(DSE)。
“增强子”是可刺激转录活性的DNA序列,并且可以是启动子的固有元件或增强表达的水平或组织特异性的异源元件。它能够以任一取向(5’->3’或3’->5’)操作,并且即使在位于启动子的上游或下游时也可能能够发挥作用。
启动子和/或增强子可全部来源于天然基因,或由来源于自然界中发现的不同元件的不同元件构成,或者甚至包含合成DNA区段。启动子或增强子可包含参与蛋白因子结合的DNA序列,所述蛋白因子调节/控制响应于刺激、生理或发育条件的转录起始的有效性。
启动子的非限制性示例包括SV40早期启动子、小鼠乳腺肿瘤病毒LTR启动子;腺病毒主要晚期启动子(Ad MLP);单纯疱疹病毒(HSV)启动子、巨细胞病毒(CMV)启动子(诸如CMV立即早期启动子区(CMVIE))、劳氏肉瘤病毒(rous sarcoma virus)(RSV)启动子、polII启动子、pol III启动子、合成启动子、杂合启动子等。另外,来源于非病毒基因的序列(诸如鼠金属硫蛋白基因)也可用于本文中。示例性组成型启动子包括编码某些组成型或“管家”功能的以下基因的启动子:次黄嘌呤磷酸核糖基转移酶(HPRT)、二氢叶酸还原酶(DHFR)、腺苷脱氨酶、磷酸甘油激酶(PGK)、丙酮酸激酶、磷酸甘油变位酶、肌动蛋白启动子、U6和本领域技术人员已知的其他组成型启动子。另外,许多病毒启动子在真核细胞中组成型地发挥作用。这些尤其包括:SV40的早期和晚期启动子;莫洛尼氏白血病病毒(MoloneyLeukemia Virus)和其他逆转录病毒的长末端重复(LTR);和单纯疱疹病毒的胸苷激酶启动子。另外,来源于内含子miRNA启动子的序列(诸如例如,miR107、miR206、miR208b、miR548f-2、miR569、miR590、miR566和miR128启动子)也可用于本文中(参见例如Monteys等,2010)。因此,任何上文所提及的组成型启动子均可用于控制异源基因插入物的转录。
“转基因”在本文中用于方便地指代所意欲的或已经被引入细胞或生物体中的核酸序列/多核苷酸。转基因包括任何核酸,诸如编码抑制性RNA或多肽或蛋白的基因,并且相对于天然存在的AAV基因组序列通常是异源的。
术语“转导”是指通过载体(例如,病毒颗粒)将核酸序列引入细胞或宿主生物体中。因此,通过病毒颗粒将转基因引入细胞中可被称为细胞的“转导”。可以或可以不将转基因整合到受转导细胞的基因组核酸中。如果引入的转基因整合到受体细胞或生物体的核酸(基因组DNA)中,则它可稳定地维持在该细胞或生物体中,并进一步传递给受体细胞或生物体的子代细胞或生物体或由其遗传。最后,所引入的转基因可在受体细胞或宿主生物体中存在于染色体外,或仅短暂存在。因此,“转导的细胞”是已通过转导方式将转基因引入其中的细胞。因此,“转导”的细胞是已将转基因引入其中的细胞或其子代。可繁殖转导的细胞,转录转基因,并表达编码的抑制性RNA或蛋白。对于基因治疗用途和方法,转导的细胞可在哺乳动物中。
处于诱导型启动子控制之下的转基因仅在诱导剂存在下表达或在更大程度上表达(例如,处于金属硫蛋白启动子控制之下的转录在某些金属离子存在下大大增加)。诱导型启动子包括在结合其诱导因子时刺激转录的响应元件(RE)。例如,存在用于血清因子、类固醇激素、视黄酸和环AMP的RE。可选择含有特定RE的启动子以获得可诱导应答,并且在一些情况下,RE本身可附着到不同的启动子,从而赋予重组基因可诱导性。因此,通过选择适合的启动子(组成型相对于诱导型;强相对于弱),可控制遗传修饰细胞中多肽的存在和表达水平。如果编码多肽的基因处于诱导型启动子的控制之下,则通过将遗传修饰细胞原位暴露于允许多肽转录的条件,例如通过腹膜内注射控制药剂转录的诱导型启动子的特异性诱导物来触发多肽的原位递送。例如,由处于金属硫蛋白启动子控制之下的基因编码的多肽的由遗传修饰细胞的原位表达通过使遗传修饰细胞与含有适当(即诱导性)金属离子的溶液原位接触而得到增强。
当核酸/转基因被置于与另一核酸序列的功能关系中时,它是“可操作地连接的”。编码RNAi或多肽的核酸/转基因,或指导多肽表达的核酸可包括诱导型启动子,或用于控制所编码多肽的转录的组织特异性启动子。可操作地连接到表达控制元件的核酸还可被称为表达盒。
在某些实施方案中,在本文所述的方法和用途中采用CNS特异性或诱导型启动子、增强子等。CNS特异性启动子的非限制性示例包括从来自髓鞘碱性蛋白(MBP)、胶质原纤维酸性蛋白(GFAP)和神经元特异性烯醇化酶(NSE)的基因中分离的那些。诱导型启动子的非限制性示例包括用于蜕皮激素、四环素、缺氧和IFN的DNA响应元件。
在某些实施方案中,表达控制元件包括CMV增强子。在某些实施方案中,表达控制元件包括β肌动蛋白启动子。在某些实施方案中,表达控制元件包括鸡β肌动蛋白启动子。在某些实施方案中,表达控制元件包括CMV增强子和鸡β肌动蛋白启动子。
如本文所用,术语“修饰”或“变体”和其语法变型意指核酸、多肽或其子序列偏离参考序列。因此,修饰的序列和变体序列可具有与参考序列相比基本上相同、更大或更少的表达、活性或功能,但至少保留了参考序列的部分活性或功能。特定类型的变体是突变蛋白,它是指由具有突变(例如,错义或无义突变)的基因编码的蛋白。
“核酸”或“多核苷酸”变体是指与野生型相比已被遗传改变的经修饰序列。序列可被遗传修饰而不改变编码的蛋白序列。或者,序列可被遗传修饰以编码变体蛋白。核酸或多核苷酸变体还可指代组合序列,其已被密码子修饰以编码与参考序列(诸如野生型蛋白序列)仍保持至少部分序列同一性的蛋白,并且还已被密码子修饰以编码变体蛋白。例如,此类核酸变体的一些密码子将被改变而不改变由其编码的蛋白的氨基酸,并且核酸变体的一些密码子将被改变,这进而改变由其编码的蛋白的氨基酸。
术语“蛋白”和“多肽”在本文中可互换使用。由本文所公开的“核酸”或“多核苷酸”或“转基因”编码的“多肽”包括部分或全长的天然序列,正如天然存在的野生型和功能性多态性蛋白、其功能性子序列(片段)和其序列变体一样,只要多肽保留一定程度的功能或活性即可。因此,在本发明的方法和用途中,由核酸序列编码的此类多肽不需要与在被处理的哺乳动物中有缺陷或活性、功能或表达不足、缺乏或不存在的内源蛋白相同。
修饰的非限制性示例包括一个或多个核苷酸或氨基酸取代(例如,约1到约3、约3到约5、约5到约10、约10到约15、约15到约20、约20到约25、约25到约30、约30到约40、约40到约50、约50到约100、约100到约150、约150到约200、约200到约250、约250到约500、约500到约750、约750到约1000或更多个核苷酸或残基)。
氨基酸修饰的示例是保守氨基酸取代或缺失。在特定实施方案中,经修饰的序列或变体序列保留了未修饰序列(例如,野生型序列)的至少部分功能或活性。
氨基酸修饰的另一示例是引入病毒颗粒的衣壳蛋白中的靶向肽。已鉴别出将重组病毒载体靶向中枢神经系统(诸如靶向独特脑区)的肽。
如此修饰的重组病毒可相对于另一种类型的组织(例如,肝组织)优先结合到一种类型的组织(例如,CNS组织)。在某些实施方案中,携带经修饰的衣壳蛋白的重组病毒可通过以高于相当的未修饰衣壳蛋白的水平结合来“靶向”脑血管上皮组织。例如,具有经修饰的衣壳蛋白的重组病毒可以比未经修饰的重组病毒大50%到100%的水平结合到脑血管上皮组织。
“核酸片段”是给定核酸分子的一部分。大多数生物体中的脱氧核糖核酸(DNA)是遗传物质,而核糖核酸(RNA)参与将DNA内所含的信息转移到蛋白中。本发明还涵盖所公开的核苷酸序列的片段和变体以及由其编码的蛋白或部分长度的蛋白。“片段”或“部分”意指全长或小于全长的编码多肽或蛋白或其氨基酸序列的核苷酸序列。在某些实施方案中,片段或部分具有生物学功能(即,保留野生型的5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%活性或功能)。
分子的“变体”是与天然分子的序列基本上相似的序列。对于核苷酸序列,变体包括由于遗传密码的简并性而编码天然蛋白的相同氨基酸序列的那些序列。可使用分子生物学技术(如例如使用聚合酶链式反应(PCR)和杂交技术)来鉴别诸如这些的天然存在的等位基因变体。变体核苷酸序列还包括合成来源的核苷酸序列,诸如例如通过使用定点诱变生成的编码天然蛋白的核苷酸序列,以及编码具有氨基酸取代的多肽的核苷酸序列。通常,本发明的核苷酸序列变体将与天然(内源性)核苷酸序列具有至少40%、50%、60%到70%(例如,71%、72%、73%、74%、75%、76%、77%、78%,到79%,通常至少80%,例如,81%-84%,至少85%,例如,86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%,到98%)的序列同一性。在某些实施方案中,变体具有生物学功能(即,保留野生型的5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%活性或功能)。
特定核酸序列的“保守变异”是指那些编码相同或基本相同的氨基酸序列的核酸序列。由于遗传密码的简并性,大量功能相同的核酸编码任何给定的多肽。例如,密码子CGT、CGC、CGA、CGG、AGA和AGG都编码氨基酸精氨酸。因此,在精氨酸由密码子指定的每个位置,可将密码子改变为所描述的任何对应密码子而不改变所编码的蛋白。此类核酸变异是“沉默变异”,其是“保守修饰的变异”中的一种。除非另有说明,否则本文所述的编码多肽的每个核酸序列还描述了每种可能的沉默变异。本领域技术人员将认识到可通过标准技术修饰核酸中的每个密码子(除了ATG,其通常是甲硫氨酸的唯一密码子)以产生功能上相同的分子。因此,编码多肽的核酸的每种“沉默变异”均隐含在每个所述序列中。
术语多核苷酸序列的“基本相同”意指多核苷酸包含与使用标准参数描述的比对程序之一的参考序列相比具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%或79%、或至少80%、81%、82%、83%、84%、85%、86%、87%、88%或89%、或至少90%、91%、92%、93%或94%、或甚至至少95%、96%、97%、98%或99%序列同一性的序列。本领域技术人员将认识到,可通过考虑密码子简并性、氨基酸相似性、阅读框定位等,适当地调整这些值以确定由两个核苷酸序列编码的蛋白的对应同一性。用于这些目的的氨基酸序列的基本相同通常意指至少70%、至少80%、90%或甚至至少95%的序列同一性。
术语“基本相同”在多肽的背景下指示多肽包含在指定的比较窗口内与参考序列具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%或79%、或80%、81%、82%、83%、84%、85%、86%、87%、88%或89%、或至少90%、91%、92%、93%或94%、或甚至95%、96%、97%、98%或99%序列相同的序列。两个多肽序列相同指示在于一种多肽与针对第二种多肽产生的抗体具有免疫反应性。因此,多肽与第二多肽是相同的,例如,其中两种肽的差异仅在于保守取代。
术语“治疗(treat/treatment)”是指治疗性治疗和预防性或防范性措施,其中目的是预防、抑制、降低或减少不期望的生理变化或病症,诸如病症的发展、进展或恶化。出于本发明的目的,有益的或期望的临床结果包括但不限于症状的减轻、疾病程度的减小、使疾病的症状或不利作用稳定(即,不恶化或进展)、疾病进展的延迟或减慢、疾病状态的改善或缓和以及缓解(无论是部分还是全部),无论是可检测的还是不可检测的。“治疗”还可意指与不接受治疗时的预期存活相比延长存活。那些需要治疗者包括那些已患有病况或病症者以及那些易患病者(例如,如通过基因测定所确定)。
V.试剂盒
本发明提供具有包装材料和其中的一种或多种组分的试剂盒。试剂盒通常包括标签或包装插页,所述标签或包装插页包括组分的描述或其中组分的体外、体内或离体使用说明。试剂盒可装有一批此类组分,例如核酸、重组载体和/或病毒颗粒。
试剂盒是指容纳试剂盒的一种或多种组分的物理结构。包装材料可无菌地维持组分,并且可由通常用于此类目的的材料(例如,纸、波纹纤维、玻璃、塑料、箔、安瓿、小瓶、管等)制成。
标签或插页可包括其中的一种或多种组分、剂量量、一种或多种活性成分的临床药理学(包括作用机制、药物代谢动力学和药物效应动力学)的标识信息。标签或插页可包括标识制造商、批号、制造地点和日期、有效日期的信息。标签或插页可包括标识制造商信息、批号、制造商位置和日期的信息。标签或插页可包括关于可使用试剂盒组分的疾病的信息。标签或插页可包括临床医生或受试者在方法、用途或治疗规程或治疗方案中使用一种或多种试剂盒组分的说明。说明可包括剂量量、频率或持续时间,以及实施本文所述的任何方法、用途、治疗规程或预防或治疗方案的说明。
标签或插页可包括关于组分可提供的任何益处(诸如预防或治疗益处)的信息。标签或插页可包括关于潜在不利副作用、并发症或反应的信息,诸如关于不适合使用特定组合物的情况向受试者或临床医生发出的警告。当受试者已经、将要或当前正在服用一种或多种可能与组合物不相容的其他药物时,或者当受试者已经、将要或当前正在接受将与组合物不相容的另一种治疗规程或治疗方案时,也可能发生不利副作用或并发症,因此,说明可包括关于此类不相容性的信息。
标签或插页包括“印刷品”,例如,纸张或纸板,它们或者是单独的,或者粘贴到组件、试剂盒或包装材料(例如,盒子)上,或附着到装有试剂盒组分的安瓿、试管或小瓶上。标签或插页可另外包括计算机可读介质,诸如条形码印刷标签、磁盘、光盘(诸如CD-或DVD-ROM/RAM、DVD、MP3)、或电存储介质(诸如RAM和ROM)或这些的混合体,诸如磁/光存储介质、闪存、混合体和存储器型卡。
VI.实施例
包括以下实施例以证实本发明的优选实施方案。本领域技术人员应当了解,以下实施例中所公开的技术代表了本发明人发现的在本发明的实施中良好地发挥作用的技术,因此可被视为构成其优选实施模式。然而,本领域技术人员根据本公开应当了解,可在不脱离本发明精神和范围的情况下对所公开的具体实施方案作出许多改变,并且仍然获得相同或类似的结果。
实施例1-靶向脑实质的AAV变体的鉴别
使用AAV1、AAV2和AAV9衣壳作为起始平台开发了高级的条形码AAV文库。AAV1、AAV2和AAV9肽展示文库是通过分别在AAV1衣壳的590位、AAV2衣壳的587位和AAV9衣壳的588位插入随机序列生成的(图1)。该文库具有1×107个独特克隆的多样性(图3)。
为了测试文库的实用性,用实验台级(bench-grade)(低效价、低纯度)衣壳修饰的AAV2进行先导研究。将AAV2文库以每只动物8×1010个载体基因组静脉内注射到两只C57BL/6小鼠中。在72小时后,解剖大脑皮质、小脑和脊髓。值得注意的是,单独收获心脏、骨骼肌和膈膜,以鉴别肌肉向性。分离病毒基因组DNA,并通过PCR扩增回收的随机寡核苷酸序列。汇集来自脑的PCR产物以生成第二轮文库,将该文库以每只动物4×1010个载体基因组注射到两只小鼠中。在第二次注射后,如前所述回收载体基因组,并与起始文库和第1轮组织一起进行NexGen测序。为了测试显示在脑组织中富集的序列是否确实可将AAV2延伸到脑,将单个命中物(hit)克隆到AAV2衣壳包装质粒中,并生成表达eGFP的AAV2。制得实验台级载体,并将基于AAV2的衣壳修饰病毒的3×1010个载体基因组注射到小鼠中。在4周后,即使对于这些低滴度变体,在脑中也可以看到eGFP荧光。
使用这些高级的条形码AAV文库,鉴别出可靶向非人灵长类动物中独特灵长类动物脑结构的AAV变体。经由脑室内注射将AAV1、AAV2和AAV9文库递送到一种非人灵长类动物中(图2)。在输注后72小时,对脑区进行显微解剖以用于病毒DNA分离并通过PCR扩增AAVDNA。将产物汇集并用于包装第二轮文库,将该文库输注到额外的NHP中。然后在输注后12天对脑区进行显微解剖。在两轮淘选(panning)后,将载体基因组回收并进行下一代测序。具体地说,对从第1轮和第2轮组织提取的基因组DNA进行PCR扩增,以在载体条形码位置处生成Illumina扩增子测序文库。将所得文库汇集并使用100bp单端读取化学方法在IlluminaHiSeq 4000的单泳道上运行。为了说明该方法的实用性,以若干目标区域作为示例进行了测试:室管膜、脑脊膜和小脑。一般来说,将AAVx引导到室管膜、脑脊膜和小脑的序列是不同的,并且对于不同的血清型是不同的。
生成以下组织的逐轮富集图(图4)和热图(图5和图6):脑干、尾核、小脑皮质(图5)、大脑皮质、室管膜、苍白球、海马、脑脊膜、视神经、壳核、脊髓、黑质、底丘脑核和丘脑。这些说明了在基线(第0轮)以及通过恒河猕猴体内传代的第一轮和第二轮之后,所指示条形码的富集。为了生成这些,使用自定义Python脚本处理每个组织和轮次组合的fastq结果文件,该脚本被设计成对在DNA水平下观察到的唯一条形码配置进行提取和定量。使用自定义R脚本来计算每个样品中存在的条形码的百分比,并将DNA条形码转换为氨基酸条形码。表1对应于用AAV1衍生文库处理的样品;表2代表用AAV2衍生文库处理的组织;表3对应于用AAV9衍生文库处理的样品。从这三个文库中选择最高命中物,并且将其组装并生成为含有50个(AAV1)、58个(AAV2)和30个(AAV9)衍生条形码的验证文库。通过ICV注射将该验证文库递送到额外的恒河猕猴中。再次收集并加工组织以有助于通过深度测序恢复条形码丰度。在回收的组织和输入病毒文库中评价条形码丰度。每个条形码的富集值是相对于它们在输入病毒文库中的丰度计算的。所得到的相对富集值是评价的各种组织中载体性能的稳健指标,有助于鉴别宽泛和特异性的AAV载体变体(图7A-C)。
为了验证所鉴别的细胞类型特异性,选择AAV9-1999(具有KGGGFHG SEQ ID NO:110的靶向肽序列)用于体内验证。将eGFP表达构建体包装到由CAG启动子驱动的AAV9-1999中。通过ICV注射到左侧脑室向5岁龄的雌性恒河猕猴施用1.5E13 vg的AAV9-1999。在注射后30天收集脑,用于组织学分析。对小脑切片进行H&E染色以描绘AAV9-1999的转导模式(图8)。还从该动物采集耳蜗,并且它令人惊讶地具有强的毛细胞转导。另外,通过以每半球1E10 vg的ICV注射将含有eGFP构建体的AAV9-1999和AAV9衣壳递送到C57BL/6p0小鼠幼崽。在21天后,对小鼠进行灌注。对封固全脑(图9A)、40μm全脑矢状切面(图9B)、40μm S1皮质切面(图9C,左)、40μm海马切面(图9C,中)、40μm小脑矢状切面(图9C,右)和40μm腰脊髓冠状切面(图9D)进行eGFP荧光信号成像。注射到B1/6新生小鼠幼崽中的AAV9-1999显示出大于剂量匹配注射的AAV9的遍在表达。
向一只成年恒河猕猴注射四种经修饰的AAV的混合物:具有RGDLQWV(SEQ ID NO:113)靶向肽序列和mTAGBFP2标签的AAV9;具有ERDRTRG(SEQ ID NO:21)靶向肽序列和mTFP1标签的AAV1;具有GRGAPGG(SEQ ID NO:80)靶向肽序列和mNG标签的AAV2;以及具有DDPSARR(SEQ ID NO:53)靶向肽序列和mRuby3标签的AAV2。将病毒以等体积直接混合,以实现如下每种病毒的最终总剂量:
AAV9.RGDL mTagBFP2 6.13E12总vg
AAV1.ERDR mTFP1 1.23E13总vg
AAV2.GRGA mNG 8.8E12总vg
AAV2.DDPS mRuby3 1.32E13总vg
在注射后30天收集脑,用于荧光成像。针对mTagBFP2、mTFP2、mNG和mRuby3荧光信号对侧脑室切面(图10A)、第四脑室切面(图10B)和脑脊膜切面(图10C)进行成像。
通过将AAV9-1999注射到恒河猕猴的耳蜗中来进行额外的实验。基于耳蜗转导的结果,动物的侧脑室接受AAV9-1999。单只动物接受3E11 vg的AAV9-1999,以管开窗术直接注射到它们的圆窗(图11A-C)。
根据本公开,无需过度实验即可制备和实施本文所公开和要求保护的所有方法。虽然已经按照优选实施方案对本发明的组合物和方法进行了描述,但对于本领域技术人员将显而易见的是,在不脱离本发明的构思、精神和范围的情况下可对所述方法以及本文所描述的方法的步骤或步骤的顺序作出改变。更具体地,将显而易见的是,与化学上和生理学上两者均相关的某些药剂可代替本文所述的药剂,而仍将实现相同或类似的结果。对于本领域技术人员显而易见的所有此类类似的代替物和修改均被认为在由所附权利要求所定义的本发明的精神、范围和概念内。
参考文献
以下参考文献以引用方式明确地并入本文中,其引用程度为它们为本文的公开提供补充性的示例性程序性细节或其他细节。
美国专利号8,299,215
美国专利号8,691,948
美国专利申请公开号2018/0142259
Chen等,患病脑内皮的分子标记为CNS导向性酶疗法提供新的位点(Molecularsignatures of disease brain endothelia provide new sites for CNS-directedenzyme therapy).Nat Med,2009.15(10):第1215-8页。
Chen等,克服磺酰胺酶固有的限制以改善粘多糖贮积症IIIA基因疗法(Overcoming Limitations Inherent in Sulfamidase to ImproveMucopolysaccharidosis IIIA Gene Therapy).Mol Ther,2018.26(4):第1118-1126页。
Deverman等,Cre依赖性选择产生用于将基因广泛地转移到成人脑的AAV变体(Cre-dependent selection yields AAV variants for widespread gene transfer tothe adult brain).Nat Biotechnol,2016.34(2):第204-9页。
Hartz等,从新鲜人脑组织中分离大脑毛细血管(Isolation of CerebralCapillariesfrom Fresh Human Brain Tissue).J Vis Exp,2018(139)。
Hordeaux等,AAV-PHP.B的嗜神经性质仅限于C57BL/6J小鼠(The NeurotropicProperties of AAV-PHP.B Are Limited to C57BL/6J Mice).Mol Ther,2018.26(3):第664-668页。
Katz等,AAV基因转移延迟晚期婴儿型巴腾病的TPP1缺陷犬模型中的疾病发作(AAV gene transfer delays disease onset in a TPP1-deficient canine model ofthe late infantile form of Batten disease).Sci Transl Med,2015.7(313):第313ra180页。
Keiser等,用于脊髓小脑共济失调1型治疗的恒河猴小脑中共济失调蛋白1沉默的广泛分布(Broad distribution of ataxin 1 silencing in rhesus cerebella forspinocerebellar ataxia type 1 therapy).Brain,2015.138(Pt 12):第3555-66页。
Koerber等,腺相关病毒的DNA改组产生功能多样的病毒子代(DNA shuffling ofadeno-associated virus yields functionally diverse viral progeny).Mol Ther,2008.16(10):第1703-9页。
Matsuzaki等,静脉内施用腺相关病毒-PHP.B衣壳未能上调狨猴脑中的转导效率(Intravenous administration of the adeno-associated virus-PHP.B capsid failsto upregulate transduction efficiency in the marmoset brain).Neurosci Lett,2018.665:第182-188页。
McBride等,RNAi介导的HTT阻抑在恒河猕猴中作为用于亨延顿病的潜在疗法的临床前安全性(Preclinical safety of RNAi-mediated HTT suppression in the rhesusmacaque as a potential therapy for Huntington′s disease).Mol Ther,2011.19(12):第2152-62页。
Monteys等,突变亨延顿蛋白等位基因的体外和体内CRISPR/Cas9编辑(CRISPR/Cas9 Editing of the Mutant Huntingtin Allele In Vitro and In Vivo).Mol Ther,2017.25(1):第12-23页。
Muller等,用于选择靶向基因治疗载体的展示在腺相关病毒上的随机肽文库(Random peptide libraries displayed on adeno-associated virus to select fortargeted gene therapy vectors).Nat Biotechnol,2003.21(9):第1040-6页。
Schaffer和Maheshri,用于增强基因递送的AAV突变体的定向进化(Directedevolution of AAV mutants for enhanced gene delivery).Conf Proc IEEE Eng MedBiol Soc,2004.5:第3520-3页。
Zhong等,下一代腺相关病毒2载体:酪氨酸点突变导致较低剂量下的高效转导(Next generation of adeno-associated virus 2 vectors:point mutations intyrosines lead to high-efficiency transduction at lower doses).Proc Natl AcadSci U S A,2008.105(22):第7827-32页。
序列表
<110> 费城儿童医院
<120> 腺相关病毒载体变体
<130> CHOP.P0038WO
<140> 尚不清楚
<141> 2020-11-20
<150> 63/084,709
<151> 2020-09-29
<150> 62/939,315
<151> 2019-11-22
<160> 144
<170> PatentIn version 3.5
<210> 1
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 1
Arg Pro Gly Arg Glu Gln Ala
1 5
<210> 2
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 2
Arg Gly Val Leu Val Thr Thr
1 5
<210> 3
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 3
Arg Pro Gly Arg Glu Ser Ala
1 5
<210> 4
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 4
Asn Glu Ser Leu Lys Lys Lys
1 5
<210> 5
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 5
Asp Lys Thr Arg Ala Gly Ser
1 5
<210> 6
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 6
Thr Ala Lys Ser Lys Gln Ala
1 5
<210> 7
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 7
Pro Val Lys Lys Lys Asp Ala
1 5
<210> 8
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 8
Gly Arg Glu Thr Leu Lys Gly
1 5
<210> 9
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 9
Pro Ile Pro Ala Gly Lys Lys
1 5
<210> 10
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 10
Asn Val Val Arg Ala Gly Thr
1 5
<210> 11
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 11
Lys Ala Thr Ala Asn Thr Arg
1 5
<210> 12
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 12
Arg Asp Ala Thr Arg Ser Ser
1 5
<210> 13
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 13
Val Pro Thr Lys Ser Pro Lys
1 5
<210> 14
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 14
Ala Gly Val Ala Arg Ser Lys
1 5
<210> 15
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 15
Arg Ser Arg Ser Glu Val Leu
1 5
<210> 16
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 16
Glu Val Lys Gly Lys Gly Lys
1 5
<210> 17
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 17
Ala Lys Leu Asn Lys Ser Ser
1 5
<210> 18
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 18
Asn Ser Val His Asn Thr Ala
1 5
<210> 19
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 19
Asn Val Val Arg Gly Gly Ala
1 5
<210> 20
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 20
Asn Arg Leu Val Ala Gly Gly
1 5
<210> 21
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 21
Glu Arg Asp Arg Thr Arg Gly
1 5
<210> 22
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 22
Val Gln Gly Ser Lys Met Lys
1 5
<210> 23
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 23
Asn Ser Val Arg Pro Leu Thr
1 5
<210> 24
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 24
Asn Lys Ile His Ala Asn Pro
1 5
<210> 25
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 25
Thr Ala Pro Lys Ser Leu Lys
1 5
<210> 26
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 26
Arg Asp Ser Thr Arg Gln Leu
1 5
<210> 27
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 27
Asn Ser Val Lys Ser Val Leu
1 5
<210> 28
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 28
Asn Val Thr Ile Lys Ser Lys
1 5
<210> 29
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 29
Val Ser Leu Lys Glu Arg Val
1 5
<210> 30
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 30
Asp Glu Thr Ser Arg Leu Val
1 5
<210> 31
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 31
Asp Arg Leu Lys Gly Ile Val
1 5
<210> 32
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 32
Ser Gly Val Leu Val Gln Arg
1 5
<210> 33
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 33
Ser Gly Thr Phe Val Lys Ala
1 5
<210> 34
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 34
Asn Ser Ile Ala Arg Pro Val
1 5
<210> 35
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 35
Asn Arg Ala Arg Ala Gly Glu
1 5
<210> 36
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 36
Ala Arg His Ala Leu Gly Gly
1 5
<210> 37
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 37
His Ser Ser Arg Pro Val Ala
1 5
<210> 38
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 38
Lys Thr Gly Thr Ala Arg Leu
1 5
<210> 39
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 39
Val Lys Ala Leu Gly Arg Pro
1 5
<210> 40
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 40
Asn Asp Val Arg Ala Lys Gly
1 5
<210> 41
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 41
Gln Gly Val Leu Val Val Arg
1 5
<210> 42
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 42
Lys Gln Tyr Ala Gly Ser Gln
1 5
<210> 43
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 43
Thr Asn Arg Met Ala Leu Ser
1 5
<210> 44
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 44
Gly Ile Thr Leu Gly Arg Leu
1 5
<210> 45
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 45
Ala Gly Ile Met Val Arg Val
1 5
<210> 46
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 46
Lys Ala Ala Gly Arg Thr Val
1 5
<210> 47
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 47
His Val Ile Arg Leu Pro Ser
1 5
<210> 48
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 48
Ser Val Ala Ser Ala Lys Lys
1 5
<210> 49
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 49
Thr Ala Thr Pro Arg Lys Gly
1 5
<210> 50
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 50
Thr Lys Thr Gly Leu Lys Leu
1 5
<210> 51
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 51
Lys Gly Leu Arg Thr Pro Thr
1 5
<210> 52
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 52
Leu Thr Ser Arg Thr Ser Pro
1 5
<210> 53
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 53
Asp Asp Pro Ser Ala Arg Arg
1 5
<210> 54
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 54
Gly Glu Gln Asp Leu Arg Arg
1 5
<210> 55
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 55
Val Ser Thr Ala Leu Pro Arg
1 5
<210> 56
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 56
Arg Asp Asp Val Pro Leu Arg
1 5
<210> 57
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 57
Thr Arg Val Gly Thr Ala Gly
1 5
<210> 58
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 58
Ser Ser Ser Lys Thr Gly Ser
1 5
<210> 59
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 59
Ser Leu Ser Thr Gly Pro Lys
1 5
<210> 60
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 60
Val Gln Gly Arg Gln Gly Gly
1 5
<210> 61
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 61
Arg Gly Ala Ser Gly Ala Val
1 5
<210> 62
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 62
Asn Ala Arg Ala Gln Gly Val
1 5
<210> 63
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 63
Thr Ser Asn Arg Gly Gln Val
1 5
<210> 64
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 64
Ala Val Arg Gly Gly Met Ala
1 5
<210> 65
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 65
Arg Gly Leu Asp Lys Gly Thr
1 5
<210> 66
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 66
Lys Gly Val Asp Leu Lys Pro
1 5
<210> 67
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 67
Thr Ala Val Arg Glu Glu Arg
1 5
<210> 68
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 68
Gly Asn Ala Gly Ile Thr Lys
1 5
<210> 69
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 69
Ser Ala Arg Ala Gly Ala Pro
1 5
<210> 70
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 70
Ser Gly Glu Phe Val Gly Arg
1 5
<210> 71
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 71
Ser Gly Arg Lys Leu Glu Val
1 5
<210> 72
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 72
Ser Ala Arg Ser Gly Ser Val
1 5
<210> 73
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 73
Glu Ser Thr Gly Arg Glu Arg
1 5
<210> 74
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 74
Val Thr Gln Ser Lys Gly Ala
1 5
<210> 75
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 75
Arg Gly Ser Gly Ser Ala Val
1 5
<210> 76
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 76
Asn Ala Arg Pro Val Ser Ala
1 5
<210> 77
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 77
Thr Ala Arg Gly Gly Gly Gly
1 5
<210> 78
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 78
Gly Arg Ser Ala Ser Gly Ser
1 5
<210> 79
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 79
Lys Ala Gln Gly Val Gly Gly
1 5
<210> 80
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 80
Gly Arg Gly Ala Pro Gly Gly
1 5
<210> 81
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 81
Val Pro Gly Arg Thr Ala Gly
1 5
<210> 82
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 82
Ala Arg Gly Ser Gly Val Asn
1 5
<210> 83
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 83
Ser Val Arg Val Gly Gly Gln
1 5
<210> 84
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 84
Arg Ala Val Pro Ala Gly Gly
1 5
<210> 85
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 85
Val Met Ser Ser Gly Lys Pro
1 5
<210> 86
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 86
Ser Thr Pro Ala Pro Lys Ser
1 5
<210> 87
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 87
Arg Gly Gly Ala Gln Val Val
1 5
<210> 88
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 88
Lys Ala Ser Gly Ala Gly Gly
1 5
<210> 89
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 89
Thr Gly Thr Ala Gly Leu Lys
1 5
<210> 90
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 90
Arg Ser Asn Ala Pro Gln Thr
1 5
<210> 91
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 91
Glu Ala Gln Ser His Pro Arg
1 5
<210> 92
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 92
Thr Lys Ser Leu Ser Ser Gly
1 5
<210> 93
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 93
Ala Ala Gly Ala Lys Val Met
1 5
<210> 94
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 94
Arg Gly Ser Thr Gln Val Gly
1 5
<210> 95
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 95
Gly Arg Ser Thr Gly Met Thr
1 5
<210> 96
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 96
Arg Ala Thr Ser Gln Ser Thr
1 5
<210> 97
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 97
Val Gly Arg Ser Val Gly Ala
1 5
<210> 98
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 98
Gly Glu Gly Gly Gly Gly Arg
1 5
<210> 99
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 99
Thr Ala Ala Gly Gly Gln Arg
1 5
<210> 100
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 100
Gly Arg Gly Gly Ala Ala Leu
1 5
<210> 101
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 101
Val Ala Pro Ile Ser Lys Ser
1 5
<210> 102
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 102
Ala Pro Pro Val Lys Leu Ser
1 5
<210> 103
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 103
His Asp Gly Gly Ala Ser Arg
1 5
<210> 104
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 104
Arg Ser Gly Gly Ala Ala Val
1 5
<210> 105
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 105
Gly Ser Arg Ala Gly Val Gly
1 5
<210> 106
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 106
Lys Leu Ser Ile Ser Gly Asn
1 5
<210> 107
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 107
Gly Ala Val Gly Gly Val Lys
1 5
<210> 108
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 108
Lys Asn Glu Ser Gly Lys Val
1 5
<210> 109
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 109
Ala Gly Gln Leu Ala Gly Arg
1 5
<210> 110
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 110
Lys Gly Gly Gly Phe His Gly
1 5
<210> 111
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 111
Arg Ala Lys Pro Gly Met Glu
1 5
<210> 112
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 112
Gly Arg Asp Val Thr Arg Ser
1 5
<210> 113
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 113
Arg Gly Asp Leu Gln Trp Val
1 5
<210> 114
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 114
Gly Gly Asp Arg Thr Arg Gly
1 5
<210> 115
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 115
Arg Gly Asp Leu Ala Ser Val
1 5
<210> 116
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 116
Arg Asp Thr Thr Arg Asn Leu
1 5
<210> 117
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 117
Lys Gly Gly Gly Val His Gly
1 5
<210> 118
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 118
Arg Gly Asp Met Tyr Arg Val
1 5
<210> 119
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 119
Arg Gly Asp Arg Pro Val Ser
1 5
<210> 120
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 120
Arg Ser Asp Val Gly Ser Leu
1 5
<210> 121
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 121
Ala Gly Val Lys Pro Gly Arg
1 5
<210> 122
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 122
Arg Gly Asp Trp Pro Arg Gly
1 5
<210> 123
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 123
Gly Gly Arg Pro Gly Ser Trp
1 5
<210> 124
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 124
Arg Gly Asp Tyr Pro Arg Ser
1 5
<210> 125
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 125
Arg Gly Asp Leu Arg Phe Ile
1 5
<210> 126
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 126
Arg Gly Gly Gly Val Tyr Gly
1 5
<210> 127
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 127
Gly Ala Asp Arg Thr Arg Gly
1 5
<210> 128
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 128
Arg Gly Asp Phe Met Gly Leu
1 5
<210> 129
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 129
Arg Arg Asp Glu Thr Arg Thr
1 5
<210> 130
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 130
Ala Glu Ser Pro Trp Glu Arg
1 5
<210> 131
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 131
Ala Trp Asp Gly Thr Arg Val
1 5
<210> 132
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 132
Ala Arg Gly Asp Gly Trp Arg
1 5
<210> 133
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 133
Gly Arg Asp Tyr Thr Arg Leu
1 5
<210> 134
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 134
Arg Arg Gly Asp Ala Trp Ser
1 5
<210> 135
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 135
Met Asp Leu Thr Lys Ala Val
1 5
<210> 136
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 136
Met Met Gly Arg Pro Gly Arg
1 5
<210> 137
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 137
Thr Gly Arg Pro Gly Val Trp
1 5
<210> 138
<211> 736
<212> PRT
<213> 肽相关病毒1
<400> 138
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 139
<211> 735
<212> PRT
<213> 肽相关病毒2
<400> 139
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 140
<211> 736
<212> PRT
<213> 肽相关病毒9
<400> 140
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 141
<211> 748
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<220>
<221> MISC_FEATURE
<222> (594)..(600)
<223> X是任何氨基酸
<400> 141
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Ser Ser
580 585 590
Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ala Ser Pro Ala Thr Gly Asp Val
595 600 605
His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val
610 615 620
Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His
625 630 635 640
Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys Asn Pro Pro
645 650 655
Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Pro Ala
660 665 670
Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr
675 680 685
Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser
690 695 700
Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn Tyr Ala Lys Ser
705 710 715 720
Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu Tyr Thr Glu Pro
725 730 735
Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
740 745
<210> 142
<211> 747
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<220>
<221> MISC_FEATURE
<222> (591)..(597)
<223> X是任何氨基酸
<400> 142
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Ala Ala Ala Xaa Xaa
580 585 590
Xaa Xaa Xaa Xaa Xaa Ala Ala Arg Gln Ala Ala Thr Ala Asp Val Asn
595 600 605
Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr
610 615 620
Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe
625 630 635 640
His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro
645 650 655
Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr
660 665 670
Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly
675 680 685
Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys
690 695 700
Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Asn Lys Ser Val
705 710 715 720
Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg
725 730 735
Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 143
<211> 748
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<220>
<221> MISC_FEATURE
<222> (592)..(598)
<223> X是任何氨基酸
<400> 143
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Ala Ala Xaa
580 585 590
Xaa Xaa Xaa Xaa Xaa Xaa Ala Ser Ala Gln Ala Gln Thr Gly Trp Val
595 600 605
Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val
610 615 620
Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn
625 630 635 640
Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met Lys His Pro Pro
645 650 655
Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr
660 665 670
Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr
675 680 685
Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser
690 695 700
Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser
705 710 715 720
Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro
725 730 735
Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
740 745
<210> 144
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 合成多肽
<400> 144
Arg Pro Gly Arg Glu Ala Ser
1 5
Claims (196)
1.一种经修饰的腺相关病毒(AAV)衣壳蛋白,其包含靶向肽,所述靶向肽将包含所述经修饰的AAV衣壳蛋白的病毒载体靶向独特的器官或脑结构,其中所述靶向肽的长度为3到10个氨基酸。
2.根据权利要求1所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是具有与SEQ ID NO:143至少95%相同的序列的经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQID NO:110,其中所述独特脑结构是脑干、尾核、小脑、耳蜗(耳)、皮质、大脑皮质、小脑深核、室管膜、苍白球、海马、脑脊膜、运动皮质、视神经、前额皮质、壳核、脊髓、黑质、底丘脑核、颞叶皮质、丘脑或视皮质。
3.根据权利要求1所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白、经修饰的AAV2衣壳蛋白或经修饰的AAV9衣壳蛋白。
4.根据权利要求1所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白衍生自AAV1衣壳蛋白(参见SEQ ID NO:138),其中所述靶向肽插入所述AAV1衣壳蛋白的残基590之后。
5.根据权利要求4所述的经修饰的AAV衣壳蛋白,其中所述靶向肽的侧翼为接头序列,其中所述靶向肽的每一侧的所述接头序列为两个或三个氨基酸长。
6.根据权利要求5所述的经修饰的AAV衣壳蛋白,其中所述接头序列是所述靶向肽的N末端侧的SSA和所述靶向肽的C末端侧的AS。
7.根据权利要求6所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV1衣壳蛋白具有与SEQ ID NO:141至少95%相同的序列。
8.根据权利要求1所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白衍生自AAV2衣壳蛋白(参见SEQ ID NO:139),其中所述靶向肽插入所述AAV2衣壳蛋白的残基587之后。
9.根据权利要求8所述的经修饰的AAV衣壳蛋白,其中所述靶向肽的侧翼为接头序列,其中所述靶向肽的每一侧上的所述接头序列为两个或三个氨基酸长。
10.根据权利要求9所述的经修饰的AAV衣壳蛋白,其中所述接头序列是所述靶向肽的N末端侧上的AAA和所述靶向肽的C末端侧上的AA。
11.根据权利要求10所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV2衣壳蛋白具有与SEQ ID NO:142至少95%相同的序列。
12.根据权利要求1所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白衍生自AAV9衣壳蛋白(参见SEQ ID NO:140),其中所述靶向肽插入所述AAV9衣壳蛋白的残基588之后。
13.根据权利要求12所述的经修饰的AAV衣壳蛋白,其中所述靶向肽的侧翼为接头序列,其中所述靶向肽的每一侧上的所述接头序列为两个或三个氨基酸长。
14.根据权利要求13所述的经修饰的AAV衣壳蛋白,其中所述接头序列是所述靶向肽的N末端侧上的AAA和所述靶向肽的C末端侧上的AS。
15.根据权利要求14中任一项所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV9衣壳蛋白具有与SEQ ID NO:143至少95%相同的序列。
16.根据权利要求1所述的经修饰的AAV衣壳蛋白,其中所述靶向肽包含长度最多达10个氨基酸的序列,其具有选自由SEQ ID NO:1-137或144组成的组的氨基酸序列。
17.根据权利要求16所述的经修饰的AAV衣壳蛋白,其中所述靶向肽的长度为7个氨基酸。
18.根据权利要求1-17中任一项所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是脑干、尾核、小脑皮质、大脑皮质、室管膜、苍白球、海马、脑脊膜、视神经、壳核、脊髓、黑质、底丘脑核或丘脑。
19.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是脑干,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽选自SEQ ID NO:1-9。
20.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是尾核,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽选自SEQ ID NO:1、3、5、7、10-16、25、26、32和144。
21.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是小脑皮质,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽选自SEQ IDNO:1、3、4、9和17-21。
22.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是大脑皮质,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽选自SEQ IDNO:1、3、5、12和21-26。
23.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是室管膜,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽选自SEQ ID NO:2-4、7、9、21、22、27和28。
24.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是苍白球,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽选自SEQ ID NO:3、5、12、14、16、21、22和29-31。
25.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是海马,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽选自SEQ ID NO:1-4、7和32-34。
26.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是脑脊膜,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽选自SEQ ID NO:3、5、7、9、12、21和35-37。
27.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是视神经,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽选自SEQ ID NO:2、3、7、14-16、21、31和38。
28.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是壳核,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽选自SEQ ID NO:3、4、12、13、21、30和39-42。
29.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是脊髓,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽选自SEQ ID NO:2-4、7、9、21、32、33和43。
30.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是黑质,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽选自SEQ ID NO:2、3、9、44和45。
31.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是底丘脑核,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽选自SEQ IDNO:2-4、12、16、30、46和47。
32.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是丘脑,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽选自SEQ ID NO:1、2、8、12、21、28和48-51。
33.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是脑干,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽选自SEQ ID NO:52-60。
34.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是尾核,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽选自SEQ ID NO:59和61-69。
35.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是小脑皮质,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽选自SEQ IDNO:56、58、60和70-75。
36.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是大脑皮质,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽选自SEQ IDNO:53、58、60、62、63、66和76-79。
37.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是室管膜,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽选自SEQ ID NO:53、60、62、63、66、74-77和80。
38.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是苍白球,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽选自SEQ ID NO:60、75和81-87。
39.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是海马,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽选自SEQ ID NO:53、55、58、60、63、76、79、88和89。
40.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是脑脊膜,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽选自SEQ ID NO:58、60、66、73、76、80和90-93。
41.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是视神经,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽选自SEQ ID NO:53、54、57、58、60、75、79、87、88和94。
42.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是壳核,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽选自SEQ ID NO:55、59、60、61和95-100。
43.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是脊髓,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽选自SEQ ID NO:53、58-61、63、77、88、95和101。
44.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是黑质,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽选自SEQ ID NO:52、53、57、58、75、76、87、102和103。
45.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是底丘脑核,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽选自SEQ IDNO:57、58、60、75、79、87、88、102、104和105。
46.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是丘脑,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽选自SEQ ID NO:52、55、56、74、85、88和106-109。
47.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是脑干,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽选自SEQ ID NO:110-117。
48.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是尾核,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽选自SEQ ID NO:110、113、115、116和118-121。
49.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是小脑皮质,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽选自SEQ IDNO:110、111、113、119和122-125。
50.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是大脑皮质,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽选自SEQ IDNO:110、111、113、114、116和125-127。
51.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是室管膜,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽选自SEQ ID NO:110、111、113、118-120和128。
52.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是苍白球,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽选自SEQ ID NO:110-112、114、119、120和129。
53.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是海马,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽选自SEQ ID NO:110、111、113、116、123、125、129和130。
54.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是脑脊膜,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽选自SEQ ID NO:110、111、113、114、118、119、122和131。
55.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是视神经,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽选自SEQ ID NO:110、111、114、115、117、129和132。
56.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是壳核,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽选自SEQ ID NO:110、112、113、116、123、127、133和134。
57.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是脊髓,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽选自SEQ ID NO:110、113、119、120、122、123、128和134。
58.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是黑质,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽选自SEQ ID NO:110-114、117和129。
59.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是底丘脑核,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽选自SEQ IDNO:110、111、113、119、120、122、132和135。
60.根据权利要求18所述的经修饰的AAV衣壳蛋白,其中所述独特脑结构是丘脑,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽选自SEQ ID NO:110、112-114、125、133、136和137。
61.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:1,其中所述独特脑结构是脑干、尾核、小脑皮质、大脑皮质、海马或丘脑。
62.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:2,其中所述独特脑结构是脑干、室管膜、海马、视神经、脊髓、黑质、底丘脑核或丘脑。
63.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:3,其中所述独特脑结构是脑干、尾核、小脑皮质、大脑皮质、室管膜、苍白球、海马、脑脊膜、视神经、壳核、脊髓、黑质或底丘脑核。
64.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:4,其中所述独特脑结构是脑干、小脑皮质、室管膜、海马、壳核、脊髓或底丘脑核。
65.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:5,其中所述独特脑结构是脑干、大脑皮质、苍白球或脑脊膜。
66.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:6,其中所述独特脑结构是脑干。
67.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:7,其中所述独特脑结构是脑干、尾核、室管膜、海马、脑脊膜、视神经或脊髓。
68.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:8,其中所述独特脑结构是脑干或丘脑。
69.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:9,其中所述独特脑结构是脑干、小脑皮质、室管膜、脑脊膜、脊髓或黑质。
70.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:10或11,其中所述独特脑结构是尾核。
71.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:12,其中所述独特脑结构是尾核、大脑皮质、苍白球、脑脊膜、壳核、底丘脑核或丘脑。
72.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:13,其中所述独特脑结构是尾核或壳核。
73.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:14,其中所述独特脑结构是尾核、苍白球或视神经。
74.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:15,其中所述独特脑结构是尾核或视神经。
75.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:16,其中所述独特脑结构是尾核、苍白球、视神经或底丘脑核。
76.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:17-20中的任一个,其中所述独特脑结构是小脑皮质。
77.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:21,其中所述独特脑结构是小脑皮质、大脑皮质、室管膜、苍白球、脑脊膜、视神经、壳核、脊髓或丘脑。
78.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:22,其中所述独特脑结构是大脑皮质、室管膜或苍白球。
79.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:23-26中的任一个,其中所述独特脑结构是大脑皮质。
80.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:27,其中所述独特脑结构是室管膜。
81.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:28,其中所述独特脑结构是室管膜或丘脑。
82.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:29,其中所述独特脑结构是苍白球。
83.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:30,其中所述独特脑结构是苍白球、壳核或底丘脑核。
84.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:31,其中所述独特脑结构是苍白球或视神经。
85.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:32或33,其中所述独特脑结构是海马或脊髓。
86.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:34,其中所述独特脑结构是海马。
87.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:35-37中的任一个,其中所述独特脑结构是脑脊膜。
88.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:38,其中所述独特脑结构是视神经。
89.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:39-42中的任一个,其中所述独特脑结构是壳核。
90.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:43,其中所述独特脑结构是脊髓。
91.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:44或45,其中所述独特脑结构是黑质。
92.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:46或47,其中所述独特脑结构是底丘脑核。
93.根据权利要求1或7所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV1衣壳蛋白,其中所述靶向肽是SEQ ID NO:48-51中的任一个,其中所述独特脑结构是丘脑。
94.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:52,其中所述独特脑结构是脑干、黑质或丘脑。
95.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:53,其中所述独特脑结构是脑干、大脑皮质、室管膜、海马、脑脊膜、视神经、脊髓或黑质。
96.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:54,其中所述独特脑结构是脑干或视神经。
97.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:55,其中所述独特脑结构是脑干、海马、壳核或丘脑。
98.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:56,其中所述独特脑结构是脑干、小脑皮质或丘脑。
99.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:57,其中所述独特脑结构是脑干、视神经、黑质或底丘脑核。
100.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:58,其中所述独特脑结构是脑干、小脑皮质、大脑皮质、海马、脑脊膜、视神经、脊髓、黑质或底丘脑核。
101.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:59,其中所述独特脑结构是脑干、尾核、壳核或脊髓。
102.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:60,其中所述独特脑结构是脑干、小脑皮质、大脑皮质、室管膜、苍白球、海马、脑脊膜、视神经、壳核、脊髓或底丘脑核。
103.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:61,其中所述独特脑结构是尾核、壳核或脊髓。
104.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:62,其中所述独特脑结构是尾核、大脑皮质或室管膜。
105.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:63,其中所述独特脑结构是尾核、大脑皮质、室管膜、海马或脊髓。
106.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:64、65和67-69中的任一个,其中所述独特脑结构是尾核。
107.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:66,其中所述独特脑结构是尾核、大脑皮质、室管膜或脑脊膜。
108.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:70-72中的任一个,其中所述独特脑结构是小脑皮质。
109.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:73,其中所述独特脑结构是小脑皮质或脑脊膜。
110.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:74,其中所述独特脑结构是小脑皮质、室管膜或丘脑。
111.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:75,其中所述独特脑结构是小脑皮质、室管膜、苍白球、视神经、黑质或底丘脑核。
112.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:76,其中所述独特脑结构是大脑皮质、室管膜、海马、脑脊膜或黑质。
113.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:77,其中所述独特脑结构是大脑皮质、室管膜或脊髓。
114.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:78,其中所述独特脑结构是大脑皮质。
115.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:79,其中所述独特脑结构是大脑皮质、海马、视神经或底丘脑核。
116.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:80,其中所述独特脑结构是室管膜、海马或脑脊膜。
117.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:81-84和86中的任一个,其中所述独特脑结构是苍白球。
118.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:85,其中所述独特脑结构是苍白球或丘脑。
119.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:87,其中所述独特脑结构是苍白球、视神经、黑质或底丘脑核。
120.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:88,其中所述独特脑结构是海马、视神经、脊髓、底丘脑核或丘脑。
121.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:89,其中所述独特脑结构是海马。
122.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:90-93中的任一个,其中所述独特脑结构是脑脊膜。
123.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:94,其中所述独特脑结构是视神经。
124.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:95,其中所述独特脑结构是壳核或脊髓。
125.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:96-100中的任一个,其中所述独特脑结构是壳核。
126.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:101,其中所述独特脑结构是脊髓。
127.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:102,其中所述独特脑结构是黑质或底丘脑核。
128.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:103,其中所述独特脑结构是黑质。
129.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:104或105,其中所述独特脑结构是底丘脑核。
130.根据权利要求1或11所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV2衣壳蛋白,其中所述靶向肽是SEQ ID NO:106-109中的任一个,其中所述独特脑结构是丘脑。
131.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:110,其中所述独特脑结构是脑干、尾核、小脑皮质、大脑皮质、室管膜、苍白球、海马、脑脊膜、视神经、壳核、脊髓、黑质、底丘脑核或丘脑。
132.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:111,其中所述独特脑结构是脑干、小脑皮质、大脑皮质、室管膜、苍白球、海马、脑脊膜、视神经、黑质或底丘脑核。
133.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:112,其中所述独特脑结构是脑干、苍白球、壳核、黑质或丘脑。
134.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:113,其中所述独特脑结构是脑干、尾核、小脑皮质、大脑皮质、室管膜、海马、脑脊膜、壳核、脊髓、黑质、底丘脑核或丘脑。
135.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:114,其中所述独特脑结构是脑干、大脑皮质、苍白球、脑脊膜、视神经、黑质或丘脑。
136.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:115,其中所述独特脑结构是脑干或尾核。
137.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:116,其中所述独特脑结构是脑干、尾核、大脑皮质、海马、视神经或壳核。
138.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:117,其中所述独特脑结构是脑干、视神经或黑质。
139.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:118,其中所述独特脑结构是尾核、室管膜或脑脊膜。
140.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:119,其中所述独特脑结构是尾核、小脑皮质、室管膜、苍白球、脑脊膜、脊髓或底丘脑核。
141.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:120,其中所述独特脑结构是尾核、室管膜、苍白球、脑脊膜、脊髓或底丘脑核。
142.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:121,其中所述独特脑结构是尾核。
143.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:122,其中所述独特脑结构是小脑皮质、脑脊膜、脊髓或底丘脑核。
144.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:123,其中所述独特脑结构是小脑皮质、海马、壳核或脊髓。
145.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:124,其中所述独特脑结构是小脑皮质。
146.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:125,其中所述独特脑结构是小脑皮质、大脑皮质、海马或丘脑。
147.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:126,其中所述独特脑结构是大脑皮质。
148.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:127,其中所述独特脑结构是大脑皮质或壳核。
149.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:128,其中所述独特脑结构是室管膜或脊髓。
150.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:129,其中所述独特脑结构是苍白球、海马、视神经或黑质。
151.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:130,其中所述独特脑结构是海马。
152.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:131,其中所述独特脑结构是脑脊膜。
153.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:132,其中所述独特脑结构是视神经或底丘脑核。
154.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:133,其中所述独特脑结构是壳核或丘脑。
155.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:134,其中所述独特脑结构是壳核或脊髓。
156.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:135,其中所述独特脑结构是底丘脑核。
157.根据权利要求1或15所述的经修饰的AAV衣壳蛋白,其中所述经修饰的AAV衣壳蛋白是经修饰的AAV9衣壳蛋白,其中所述靶向肽是SEQ ID NO:136或137,其中所述独特脑结构是丘脑。
158.一种核酸,其包含编码根据权利要求1-157中任一项所述的经修饰的衣壳蛋白的序列。
159.一种重组腺相关病毒(rAAV)病毒,其包含根据权利要求1-157中任一项所述的经修饰的衣壳蛋白。
160.一种病毒载体,其包含编码根据权利要求1-157中任一项所述的经修饰的衣壳蛋白的核酸。
161.根据权利要求160所述的病毒载体,其进一步包含编码目的核酸的核酸序列。
162.根据权利要求161所述的病毒载体,其中所述目的核酸是治疗剂。
163.根据权利要求162所述的病毒载体,其中所述治疗剂是酶或RNAi分子。
164.一种细胞,其包含根据权利要求160-163中任一项所述的病毒载体。
165.根据权利要求164所述的细胞,其中所述细胞是哺乳动物细胞。
166.根据权利要求164所述的细胞,其中所述细胞是人细胞。
167.根据权利要求164所述的细胞,其中所述细胞在体外。
168.根据权利要求164所述的细胞,其中所述细胞在体内。
169.一种药物组合物,其包含根据权利要求159所述的病毒载体和药学上可接受的载剂。
170.一种向受试者的独特脑结构递送药剂的方法,其包括向所述受试者施用根据权利要求159所述的病毒。
171.根据权利要求170所述的方法,其中所述方法是将药剂递送到受试者的脑干的方法,其包括施用包含具有选自SEQ ID NO:1-9的靶向肽的经修饰的衣壳蛋白的AAV1病毒、包含具有选自SEQ ID NO:52-60的靶向肽的经修饰的衣壳蛋白的AAV2病毒或包含具有选自SEQ ID NO:110-117的靶向肽的经修饰的衣壳蛋白的AAV9病毒。
172.根据权利要求170所述的方法,其中所述方法是将药剂递送到受试者的尾核的方法,其包括施用包含具有选自SEQ ID NO:1、3、7和10-16的靶向肽的经修饰的衣壳蛋白的AAV1病毒、包含具有选自SEQ ID NO:59和61-69的靶向肽的经修饰的衣壳蛋白的AAV2病毒或包含具有选自SEQ ID NO:110、113、115、116和118-121的靶向肽的经修饰的衣壳蛋白的AAV9病毒。
173.根据权利要求170所述的方法,其中所述方法是将药剂递送到受试者的小脑皮质的方法,其包括施用包含具有选自SEQ ID NO:1、3、4、9和17-21的靶向肽的经修饰的衣壳蛋白的AAV1病毒、包含具有选自SEQ ID NO:56、58、60和70-75的靶向肽的经修饰的衣壳蛋白的AAV2病毒或包含具有选自SEQ ID NO:110、111、113、119和122-125的靶向肽的经修饰的衣壳蛋白的AAV9病毒。
174.根据权利要求170所述的方法,其中所述方法是将药剂递送到受试者的大脑皮质的方法,其包括施用包含具有选自SEQ ID NO:1、3、5、12和21-26的靶向肽的经修饰的衣壳蛋白的AAV1病毒、包含具有选自SEQ ID NO:53、58、60、62、63、66和76-79的靶向肽的经修饰的衣壳蛋白的AAV2病毒或包含具有选自SEQ ID NO:110、111、113、114、116和125-127的靶向肽的经修饰的衣壳蛋白的AAV9病毒。
175.根据权利要求170所述的方法,其中所述方法是将药剂递送到受试者的室管膜的方法,其包括施用包含具有选自SEQ ID NO:2-4、7、9、21、22、27和28的靶向肽的经修饰的衣壳蛋白的AAV1病毒、包含具有选自SEQ ID NO:53、60、62、63、66、74-77和80的靶向肽的经修饰的衣壳蛋白的AAV2病毒或包含具有选自SEQ ID NO:110、111、113、118-120和128的靶向肽的经修饰的衣壳蛋白的AAV9病毒。
176.根据权利要求170所述的方法,其中所述方法是将药剂递送到受试者的苍白球的方法,其包括施用包含具有选自SEQ ID NO:3、5、12、14、16、21、22和29-31的靶向肽的经修饰的衣壳蛋白的AAV1病毒、包含具有选自SEQ ID NO:60、75和81-87的靶向肽的经修饰的衣壳蛋白的AAV2病毒或包含具有选自SEQ ID NO:110-112、114、119、120和129的靶向肽的经修饰的衣壳蛋白的AAV9病毒。
177.根据权利要求170所述的方法,其中所述方法是将药剂递送到受试者的海马的方法,其包括施用包含具有选自SEQ ID NO:1-4、7和32-34和28的靶向肽的经修饰的衣壳蛋白的AAV1病毒、包含具有选自SEQ ID NO:53、55、58、60、63、76、79、80、88和89的靶向肽的经修饰的衣壳蛋白的AAV2病毒或包含具有选自SEQ ID NO:110、111、113、116、123、125、129和130的靶向肽的经修饰的衣壳蛋白的AAV9病毒。
178.根据权利要求170所述的方法,其中所述方法是将药剂递送到受试者的脑脊膜的方法,其包括施用包含具有选自SEQ ID NO:3、5、7、9、12、21和35-37和28的靶向肽的经修饰的衣壳蛋白的AAV1病毒、包含具有选自SEQ ID NO:53、58、60、66、73、76、80和90-93的靶向肽的经修饰的衣壳蛋白的AAV2病毒或包含具有选自SEQ ID NO:110、111、113、114、118、119、122和131的靶向肽的经修饰的衣壳蛋白的AAV9病毒。
179.根据权利要求170所述的方法,其中所述方法是将药剂递送到受试者的视神经的方法,其包括施用包含具有选自SEQ ID NO:2、3、7、14-16、21、31和38的靶向肽的经修饰的衣壳蛋白的AAV1病毒、包含具有选自SEQ ID NO:53、54、57、58、60、75、79、87、88和94的靶向肽的经修饰的衣壳蛋白的AAV2病毒或包含具有选自SEQ ID NO:110、111、114、115、117、129和132的靶向肽的经修饰的衣壳蛋白的AAV9病毒。
180.根据权利要求170所述的方法,其中所述方法是将药剂递送到受试者的壳核的方法,其包括施用包含具有选自SEQ ID NO:3、4、12、13、21、30和39-42的靶向肽的经修饰的衣壳蛋白的AAV1病毒、包含具有选自SEQ ID NO:55、59、60、61和95-100的靶向肽的经修饰的衣壳蛋白的AAV2病毒或包含具有选自SEQ ID NO:110、112、113、116、123、127、133和134的靶向肽的经修饰的衣壳蛋白的AAV9病毒。
181.根据权利要求170所述的方法,其中所述方法是将药剂递送到受试者的脊髓的方法,其包括施用包含具有选自SEQ ID NO:2-4、7、9、21、32、33和43的靶向肽的经修饰的衣壳蛋白的AAV1病毒、包含具有选自SEQ ID NO:53、58-61、63、77、88、95和101的靶向肽的经修饰的衣壳蛋白的AAV2病毒或包含具有选自SEQ ID NO:110、113、119、120、122、123、128和134的靶向肽的经修饰的衣壳蛋白的AAV9病毒。
182.根据权利要求170所述的方法,其中所述方法是将药剂递送到受试者的黑质的方法,其包括施用包含具有选自SEQ ID NO:2、3、9、44和45和28的靶向肽的经修饰的衣壳蛋白的AAV1病毒、包含具有选自SEQ ID NO:52、53、57、58、75、76、87、102和103的靶向肽的经修饰的衣壳蛋白的AAV2病毒或包含具有选自SEQ ID NO:110-114、117和129的靶向肽的经修饰的衣壳蛋白的AAV9病毒。
183.根据权利要求170所述的方法,其中所述方法是将药剂递送到受试者的底丘脑核的方法,其包括施用包含具有选自SEQ ID NO:2-4、12、16、30、46和47的靶向肽的经修饰的衣壳蛋白的AAV1病毒、包含具有选自SEQ ID NO:57、58、60、75、79、87、88、102、104和105的靶向肽的经修饰的衣壳蛋白的AAV2病毒或包含具有选自SEQ ID NO:110、111、113、119、120、122、132和135的靶向肽的经修饰的衣壳蛋白的AAV9病毒。
184.根据权利要求170所述的方法,其中所述方法是将药剂递送到受试者的丘脑的方法,其包括施用包含具有选自SEQ ID NO:1、2、8、12、21、28和48-51的靶向肽的经修饰的衣壳蛋白的AAV1病毒、包含具有选自SEQ ID NO:52、55、56、74、85、88和106-109的靶向肽的经修饰的衣壳蛋白的AAV2病毒或包含具有选自SEQ ID NO:110、112-114、125、133、136和137的靶向肽的经修饰的衣壳蛋白的AAV9病毒。
185.根据权利要求170-184中任一项所述的方法,其中所述药剂是siRNA系统、shRNA、miRNA、非编码RNA、lncRNA、治疗性蛋白或CRISPR系统。
186.根据权利要求170-184中任一项所述的方法,其中所述施用是针对中枢神经系统。
187.根据权利要求186所述的方法,其中所述施用针对小脑延髓池、脑室内空间、室管膜、脑室、蛛网膜下腔、耳蜗和/或鞘内空间。
188.根据权利要求187所述的方法,其中所述脑室是前侧脑室、和/或后侧脑室、和/或右侧脑室、和/或左侧脑室、和/或右前侧脑室、和/或左前侧脑室、和/或右后侧脑室、和/或左后侧脑室。
189.根据权利要求170-188中任一项所述的方法,其中施用多个病毒颗粒。
190.根据权利要求189所述的方法,其中以约1×106到约1×1018个载体基因组每千克(Vg/kg)的剂量施用所述病毒。
191.根据权利要求189所述的方法,其中以约1×107-1×1017、约1×108-1×1016、约1×109-1×1015、约1×1010-1×1014、约1×1010-1×1013、约1×1010-1×1013、约1×1010-1×1011、约1×1011-1×1012、约1×1012-1×1013或约1×1013-1×1014vg/kg所述患者的剂量施用所述病毒。
192.根据权利要求170-191中任一项所述的方法,其中所述受试者是人。
193.一种治疗哺乳动物的疾病的方法,其包括向所述哺乳动物施用根据权利要求159所述的病毒。
194.根据权利要求193所述的方法,其中所述疾病是神经退行性疾病。
195.根据权利要求194所述的方法,其中所述神经退行性疾病是亨延顿病、ALS、遗传性痉挛性偏瘫、原发性侧索硬化、脊髓性肌萎缩、肯尼迪病、阿尔茨海默病、聚谷氨酰胺重复病或帕金森病。
196.根据权利要求193所述的方法,其中所述哺乳动物是人。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962939315P | 2019-11-22 | 2019-11-22 | |
US62/939,315 | 2019-11-22 | ||
US202063084709P | 2020-09-29 | 2020-09-29 | |
US63/084,709 | 2020-09-29 | ||
PCT/US2020/061464 WO2021102234A1 (en) | 2019-11-22 | 2020-11-20 | Adeno-associated viral vector variants |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115023242A true CN115023242A (zh) | 2022-09-06 |
Family
ID=75980202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080094086.2A Pending CN115023242A (zh) | 2019-11-22 | 2020-11-20 | 腺相关病毒载体变体 |
Country Status (12)
Country | Link |
---|---|
US (2) | US20230346981A1 (zh) |
EP (1) | EP4061427A4 (zh) |
JP (1) | JP2023503455A (zh) |
KR (1) | KR20220116459A (zh) |
CN (1) | CN115023242A (zh) |
AU (1) | AU2020388404A1 (zh) |
BR (1) | BR112022009864A2 (zh) |
CA (1) | CA3159113A1 (zh) |
CO (1) | CO2022008507A2 (zh) |
IL (1) | IL293140A (zh) |
MX (1) | MX2022006188A (zh) |
WO (1) | WO2021102234A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023205397A1 (en) * | 2022-04-22 | 2023-10-26 | The Children's Hospital Of Philadelphia | Human ependyma-specific promoter and uses thereof |
WO2023220287A1 (en) * | 2022-05-11 | 2023-11-16 | The Children's Hospital Of Philadelphia | Adeno-associated viral vectors for targeting deep brain structures |
WO2023220386A1 (en) * | 2022-05-13 | 2023-11-16 | The Children's Hospital Of Philadelphia | Adeno-associated viral vectors for targeting brain microvasculature |
US20230398192A1 (en) | 2022-05-16 | 2023-12-14 | Genzyme Corporation | Methods of treating metachromatic leukodystrophy |
WO2024017387A1 (en) * | 2022-07-22 | 2024-01-25 | Shanghai Vitalgen Biopharma Co., Ltd. | Novel aav capsids for targeting nervous system and uses thereof |
KR20240029316A (ko) * | 2022-08-26 | 2024-03-05 | 경희대학교 산학협력단 | 활막 표적화 화합물 및 이의 용도 |
WO2024064673A2 (en) * | 2022-09-19 | 2024-03-28 | The Children's Hospital Of Philadelphia | Aav evolution at single-cell resolution using split-seq |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040031072A1 (en) * | 1999-05-06 | 2004-02-12 | La Rosa Thomas J. | Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement |
WO2018152333A1 (en) * | 2017-02-15 | 2018-08-23 | The University Of North Carolina At Chapel Hill | Methods and compositions for gene transfer across the vasculature |
WO2018209317A1 (en) * | 2017-05-12 | 2018-11-15 | The Children's Hospital Of Philadelphia | Sulfamidase (sgsh) variants, vectors, compositions and methods and uses for treating mucopolysaccharidosis type iiia (mps iiia) |
WO2019060454A2 (en) * | 2017-09-20 | 2019-03-28 | 4D Molecular Therapeutics Inc. | CAPSID VARIANT ADENO-ASSOCIATED VIRUSES AND METHODS OF USE |
WO2019067840A1 (en) * | 2017-09-29 | 2019-04-04 | Voyager Therapeutics, Inc. | RESTRICTING CENTRAL AND PERIPHERAL NEUROLOGICAL PHENOTYPE FROM FRIEDREICH ATAXIA BY INTRAVENOUS ADMINISTRATION |
US20190175763A1 (en) * | 2017-12-07 | 2019-06-13 | California Institute Of Technology | Methods and systems for noninvasive control of brain cells and related vectors and compositions |
WO2019222329A1 (en) * | 2018-05-15 | 2019-11-21 | Voyager Therapeutics, Inc. | Compositions and methods for delivery of aav |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2002360291A1 (en) * | 2001-12-17 | 2003-06-30 | The Trustees Of The University Of Pennsylvania | Adeno-associated virus (aav) serotype 8 sequences |
-
2020
- 2020-11-20 EP EP20890214.8A patent/EP4061427A4/en active Pending
- 2020-11-20 US US17/778,783 patent/US20230346981A1/en active Pending
- 2020-11-20 KR KR1020227021143A patent/KR20220116459A/ko unknown
- 2020-11-20 MX MX2022006188A patent/MX2022006188A/es unknown
- 2020-11-20 CA CA3159113A patent/CA3159113A1/en active Pending
- 2020-11-20 BR BR112022009864A patent/BR112022009864A2/pt unknown
- 2020-11-20 AU AU2020388404A patent/AU2020388404A1/en active Pending
- 2020-11-20 CN CN202080094086.2A patent/CN115023242A/zh active Pending
- 2020-11-20 WO PCT/US2020/061464 patent/WO2021102234A1/en active Application Filing
- 2020-11-20 JP JP2022529681A patent/JP2023503455A/ja active Pending
- 2020-11-20 IL IL293140A patent/IL293140A/en unknown
-
2022
- 2022-06-16 CO CONC2022/0008507A patent/CO2022008507A2/es unknown
-
2023
- 2023-10-20 US US18/491,365 patent/US20240100194A1/en active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040031072A1 (en) * | 1999-05-06 | 2004-02-12 | La Rosa Thomas J. | Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement |
WO2018152333A1 (en) * | 2017-02-15 | 2018-08-23 | The University Of North Carolina At Chapel Hill | Methods and compositions for gene transfer across the vasculature |
WO2018209317A1 (en) * | 2017-05-12 | 2018-11-15 | The Children's Hospital Of Philadelphia | Sulfamidase (sgsh) variants, vectors, compositions and methods and uses for treating mucopolysaccharidosis type iiia (mps iiia) |
WO2019060454A2 (en) * | 2017-09-20 | 2019-03-28 | 4D Molecular Therapeutics Inc. | CAPSID VARIANT ADENO-ASSOCIATED VIRUSES AND METHODS OF USE |
WO2019067840A1 (en) * | 2017-09-29 | 2019-04-04 | Voyager Therapeutics, Inc. | RESTRICTING CENTRAL AND PERIPHERAL NEUROLOGICAL PHENOTYPE FROM FRIEDREICH ATAXIA BY INTRAVENOUS ADMINISTRATION |
US20190175763A1 (en) * | 2017-12-07 | 2019-06-13 | California Institute Of Technology | Methods and systems for noninvasive control of brain cells and related vectors and compositions |
WO2019222329A1 (en) * | 2018-05-15 | 2019-11-21 | Voyager Therapeutics, Inc. | Compositions and methods for delivery of aav |
Also Published As
Publication number | Publication date |
---|---|
EP4061427A4 (en) | 2024-01-10 |
BR112022009864A2 (pt) | 2022-08-02 |
CO2022008507A2 (es) | 2022-07-08 |
JP2023503455A (ja) | 2023-01-30 |
US20230346981A1 (en) | 2023-11-02 |
AU2020388404A1 (en) | 2022-06-09 |
WO2021102234A1 (en) | 2021-05-27 |
EP4061427A1 (en) | 2022-09-28 |
US20240100194A1 (en) | 2024-03-28 |
KR20220116459A (ko) | 2022-08-23 |
IL293140A (en) | 2022-07-01 |
CA3159113A1 (en) | 2021-05-27 |
MX2022006188A (es) | 2022-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230346981A1 (en) | Adeno-associated viral vector variants | |
US11155817B2 (en) | Therapeutic for treatment of diseases including the central nervous system | |
JP2023126919A (ja) | バリアントカプシドを有するアデノ随伴ウイルスビリオン及びその使用方法 | |
CA3050894A1 (en) | Multicistronic expression constructs | |
US20230295725A1 (en) | Compositions and methods for treating cep290-associated disease | |
CN110809626A (zh) | 磺酰胺酶(sgsh)变体、载体、组合物以及用于治疗iiia型粘多糖病(mps iiia)的方法和用途 | |
KR20230051208A (ko) | 신규 aav 캡시드 및 이를 함유하는 조성물 | |
CN112805382A (zh) | 针对α-突触核蛋白的变体RNAi | |
US20220288101A1 (en) | Combined transgene and intron-derived mirna therapy for treatment of sca1 | |
US20220098614A1 (en) | Compositions and Methods for Treating Oculopharyngeal Muscular Dystrophy (OPMD) | |
WO2023220386A1 (en) | Adeno-associated viral vectors for targeting brain microvasculature | |
WO2023220287A1 (en) | Adeno-associated viral vectors for targeting deep brain structures | |
US20240197920A1 (en) | Adeno-associated viral vectors for transduction of cochlea | |
WO2023205397A1 (en) | Human ependyma-specific promoter and uses thereof | |
WO2023102549A1 (en) | Cell lines with improved aav production capacity | |
WO2023198745A1 (en) | Nucleic acid regulation of apoe | |
CN116801901A (zh) | 用于治疗1型强直性肌营养不良的靶向rna的组合物和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |