KR20180099719A - 눈 장애에 대한 유전자 요법 - Google Patents
눈 장애에 대한 유전자 요법 Download PDFInfo
- Publication number
- KR20180099719A KR20180099719A KR1020187019811A KR20187019811A KR20180099719A KR 20180099719 A KR20180099719 A KR 20180099719A KR 1020187019811 A KR1020187019811 A KR 1020187019811A KR 20187019811 A KR20187019811 A KR 20187019811A KR 20180099719 A KR20180099719 A KR 20180099719A
- Authority
- KR
- South Korea
- Prior art keywords
- aav
- sequence
- glu
- promoter
- ser
- Prior art date
Links
- 208000030533 eye disease Diseases 0.000 title abstract description 14
- 238000001415 gene therapy Methods 0.000 title description 20
- 102100022881 Rab proteins geranylgeranyltransferase component A 1 Human genes 0.000 claims abstract description 178
- 101710108890 Rab proteins geranylgeranyltransferase component A 1 Proteins 0.000 claims abstract description 176
- 239000000203 mixture Substances 0.000 claims abstract description 103
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 88
- 238000000034 method Methods 0.000 claims abstract description 71
- 239000013603 viral vector Substances 0.000 claims abstract description 56
- 241000282414 Homo sapiens Species 0.000 claims abstract description 46
- 230000014509 gene expression Effects 0.000 claims description 197
- 101710088575 Rab escort protein 1 Proteins 0.000 claims description 175
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 156
- 239000013598 vector Substances 0.000 claims description 140
- 239000013612 plasmid Substances 0.000 claims description 111
- 108090000623 proteins and genes Proteins 0.000 claims description 106
- 102000004169 proteins and genes Human genes 0.000 claims description 81
- 210000000234 capsid Anatomy 0.000 claims description 65
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 58
- 241000700605 Viruses Species 0.000 claims description 50
- 238000004519 manufacturing process Methods 0.000 claims description 37
- 241000702421 Dependoparvovirus Species 0.000 claims description 33
- 108020004705 Codon Proteins 0.000 claims description 32
- 239000013607 AAV vector Substances 0.000 claims description 30
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 claims description 28
- 239000002299 complementary DNA Substances 0.000 claims description 24
- 208000015181 infectious disease Diseases 0.000 claims description 22
- 238000011282 treatment Methods 0.000 claims description 19
- 230000003612 virological effect Effects 0.000 claims description 19
- 208000006992 Color Vision Defects Diseases 0.000 claims description 18
- 201000007254 color blindness Diseases 0.000 claims description 18
- 101000620777 Homo sapiens Rab proteins geranylgeranyltransferase component A 1 Proteins 0.000 claims description 17
- 239000003623 enhancer Substances 0.000 claims description 17
- 206010003694 Atrophy Diseases 0.000 claims description 16
- 230000037444 atrophy Effects 0.000 claims description 16
- 239000002773 nucleotide Substances 0.000 claims description 16
- 125000003729 nucleotide group Chemical group 0.000 claims description 16
- 102000049762 human CHM Human genes 0.000 claims description 15
- 238000004806 packaging method and process Methods 0.000 claims description 14
- 238000002560 therapeutic procedure Methods 0.000 claims description 14
- 239000008194 pharmaceutical composition Substances 0.000 claims description 11
- 108091006146 Channels Proteins 0.000 claims description 9
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 claims description 9
- 108090000565 Capsid Proteins Proteins 0.000 claims description 7
- 102100023321 Ceruloplasmin Human genes 0.000 claims description 7
- 230000001105 regulatory effect Effects 0.000 claims description 7
- 210000003161 choroid Anatomy 0.000 claims description 6
- 239000003814 drug Substances 0.000 claims description 5
- 239000003937 drug carrier Substances 0.000 claims description 5
- 230000002458 infectious effect Effects 0.000 claims description 5
- NCYCYZXNIZJOKI-IOUUIBBYSA-N 11-cis-retinal Chemical group O=C/C=C(\C)/C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C NCYCYZXNIZJOKI-IOUUIBBYSA-N 0.000 claims description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 4
- 102000004437 G-Protein-Coupled Receptor Kinase 1 Human genes 0.000 claims description 4
- 102000004330 Rhodopsin Human genes 0.000 claims description 4
- 108090000820 Rhodopsin Proteins 0.000 claims description 4
- 230000001939 inductive effect Effects 0.000 claims description 4
- 241001634120 Adeno-associated virus - 5 Species 0.000 claims description 3
- 108091004242 G-Protein-Coupled Receptor Kinase 1 Proteins 0.000 claims description 3
- 241000282412 Homo Species 0.000 claims description 3
- 108090000799 Rhodopsin kinases Proteins 0.000 claims description 3
- 102000000806 Basic-Leucine Zipper Transcription Factors Human genes 0.000 claims description 2
- 108010001572 Basic-Leucine Zipper Transcription Factors Proteins 0.000 claims description 2
- 102000010175 Opsin Human genes 0.000 claims description 2
- 108050001704 Opsin Proteins 0.000 claims description 2
- 108091023040 Transcription factor Proteins 0.000 claims description 2
- 102000040945 Transcription factor Human genes 0.000 claims description 2
- 238000012258 culturing Methods 0.000 claims description 2
- 229940011871 estrogen Drugs 0.000 claims description 2
- 239000000262 estrogen Substances 0.000 claims description 2
- 239000000833 heterodimer Substances 0.000 claims description 2
- 230000001124 posttranscriptional effect Effects 0.000 claims description 2
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 claims description 2
- 229960002930 sirolimus Drugs 0.000 claims description 2
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 claims description 2
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims 2
- 241000124008 Mammalia Species 0.000 claims 2
- 102100038300 Metabotropic glutamate receptor 6 Human genes 0.000 claims 2
- 108010038450 metabotropic glutamate receptor 6 Proteins 0.000 claims 2
- 108091081062 Repeated sequence (DNA) Proteins 0.000 claims 1
- 239000002858 neurotransmitter agent Substances 0.000 claims 1
- 101000771083 Homo sapiens Cyclic nucleotide-gated cation channel beta-3 Proteins 0.000 abstract description 57
- 102100029140 Cyclic nucleotide-gated cation channel beta-3 Human genes 0.000 abstract description 53
- 241000282326 Felis catus Species 0.000 abstract description 35
- 102000039446 nucleic acids Human genes 0.000 abstract description 20
- 108020004707 nucleic acids Proteins 0.000 abstract description 20
- 101000771071 Homo sapiens Cyclic nucleotide-gated cation channel alpha-3 Proteins 0.000 abstract description 7
- 241001494479 Pecora Species 0.000 abstract description 3
- 102100029142 Cyclic nucleotide-gated cation channel alpha-3 Human genes 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 240
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 53
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 52
- 241001465754 Metazoa Species 0.000 description 52
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 52
- 108700019146 Transgenes Proteins 0.000 description 47
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 44
- 238000012360 testing method Methods 0.000 description 38
- 108020004414 DNA Proteins 0.000 description 37
- 238000001262 western blot Methods 0.000 description 32
- 206010057190 Respiratory tract infections Diseases 0.000 description 30
- 238000002347 injection Methods 0.000 description 30
- 239000007924 injection Substances 0.000 description 30
- 108010005233 alanylglutamic acid Proteins 0.000 description 28
- 210000001519 tissue Anatomy 0.000 description 28
- 108010034529 leucyl-lysine Proteins 0.000 description 26
- 241000701022 Cytomegalovirus Species 0.000 description 23
- 108010050848 glycylleucine Proteins 0.000 description 22
- 241000699670 Mus sp. Species 0.000 description 21
- 239000000523 sample Substances 0.000 description 21
- 108010065920 Insulin Lispro Proteins 0.000 description 20
- 238000001890 transfection Methods 0.000 description 20
- 108091008695 photoreceptors Proteins 0.000 description 19
- 239000003085 diluting agent Substances 0.000 description 18
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 18
- 108010064235 lysylglycine Proteins 0.000 description 18
- 210000001525 retina Anatomy 0.000 description 18
- 241000880493 Leptailurus serval Species 0.000 description 17
- 238000002474 experimental method Methods 0.000 description 17
- 230000002207 retinal effect Effects 0.000 description 17
- 210000003583 retinal pigment epithelium Anatomy 0.000 description 17
- 108091026890 Coding region Proteins 0.000 description 16
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 16
- 201000010099 disease Diseases 0.000 description 16
- 108010057821 leucylproline Proteins 0.000 description 16
- 229920001184 polypeptide Polymers 0.000 description 16
- 102000004196 processed proteins & peptides Human genes 0.000 description 16
- 108090000765 processed proteins & peptides Proteins 0.000 description 16
- 238000010790 dilution Methods 0.000 description 15
- 239000012895 dilution Substances 0.000 description 15
- 108010009298 lysylglutamic acid Proteins 0.000 description 15
- 108010054155 lysyllysine Proteins 0.000 description 15
- 108010070643 prolylglutamic acid Proteins 0.000 description 15
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 14
- 241000699666 Mus <mouse, genus> Species 0.000 description 14
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 14
- 239000013592 cell lysate Substances 0.000 description 14
- 238000000338 in vitro Methods 0.000 description 14
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 14
- 108010003700 lysyl aspartic acid Proteins 0.000 description 14
- 238000010361 transduction Methods 0.000 description 14
- 230000026683 transduction Effects 0.000 description 14
- 108010073969 valyllysine Proteins 0.000 description 14
- 201000004569 Blindness Diseases 0.000 description 13
- 238000010367 cloning Methods 0.000 description 13
- 238000003753 real-time PCR Methods 0.000 description 13
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 12
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 12
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 12
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 12
- 108010038633 aspartylglutamate Proteins 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 108010078274 isoleucylvaline Proteins 0.000 description 12
- 108010017391 lysylvaline Proteins 0.000 description 12
- 230000035772 mutation Effects 0.000 description 12
- 230000010076 replication Effects 0.000 description 12
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 11
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 11
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 11
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 11
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 11
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 11
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 11
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 11
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 11
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical group [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 11
- 239000006166 lysate Substances 0.000 description 11
- 239000002245 particle Substances 0.000 description 11
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 10
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 10
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 10
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 10
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 10
- FCWFBHMAJZGWRY-XUXIUFHCSA-N Ile-Leu-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N FCWFBHMAJZGWRY-XUXIUFHCSA-N 0.000 description 10
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 10
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 10
- 108700026244 Open Reading Frames Proteins 0.000 description 10
- 108010003201 RGH 0205 Proteins 0.000 description 10
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 10
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 10
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 10
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 10
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 10
- 108010068265 aspartyltyrosine Proteins 0.000 description 10
- 108010069495 cysteinyltyrosine Proteins 0.000 description 10
- 230000002950 deficient Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 238000011156 evaluation Methods 0.000 description 10
- 239000000499 gel Substances 0.000 description 10
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 10
- 108010027338 isoleucylcysteine Proteins 0.000 description 10
- 108010038320 lysylphenylalanine Proteins 0.000 description 10
- 238000005259 measurement Methods 0.000 description 10
- 230000001404 mediated effect Effects 0.000 description 10
- 108010048818 seryl-histidine Proteins 0.000 description 10
- 108010020532 tyrosyl-proline Proteins 0.000 description 10
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 9
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 108010068380 arginylarginine Proteins 0.000 description 9
- 108010062796 arginyllysine Proteins 0.000 description 9
- 239000000969 carrier Substances 0.000 description 9
- 238000004113 cell culture Methods 0.000 description 9
- 239000006143 cell culture medium Substances 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 9
- 238000001990 intravenous administration Methods 0.000 description 9
- 239000000463 material Substances 0.000 description 9
- 108010056582 methionylglutamic acid Proteins 0.000 description 9
- 239000000546 pharmaceutical excipient Substances 0.000 description 9
- 239000000126 substance Substances 0.000 description 9
- 230000014616 translation Effects 0.000 description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 9
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 8
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 8
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 8
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 8
- NHSDEZURHWEZPN-SXTJYALSSA-N Asp-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC(=O)O)N NHSDEZURHWEZPN-SXTJYALSSA-N 0.000 description 8
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 8
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 8
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 8
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 8
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 8
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 8
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 8
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 8
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 8
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 8
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 8
- LIIXIZKVWNYQHB-STECZYCISA-N Met-Tyr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LIIXIZKVWNYQHB-STECZYCISA-N 0.000 description 8
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 8
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 8
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 8
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 8
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 8
- WDIWOIRFNMLNKO-ULQDDVLXSA-N Val-Leu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WDIWOIRFNMLNKO-ULQDDVLXSA-N 0.000 description 8
- 238000003556 assay Methods 0.000 description 8
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 8
- 108010028295 histidylhistidine Proteins 0.000 description 8
- 238000001727 in vivo Methods 0.000 description 8
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 8
- 230000013823 prenylation Effects 0.000 description 8
- 238000002360 preparation method Methods 0.000 description 8
- 238000011002 quantification Methods 0.000 description 8
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 7
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 7
- 239000002671 adjuvant Substances 0.000 description 7
- 108010047495 alanylglycine Proteins 0.000 description 7
- 150000001413 amino acids Chemical class 0.000 description 7
- 108010047857 aspartylglycine Proteins 0.000 description 7
- 239000000872 buffer Substances 0.000 description 7
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 7
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 7
- 238000011068 loading method Methods 0.000 description 7
- 239000012528 membrane Substances 0.000 description 7
- 210000000608 photoreceptor cell Anatomy 0.000 description 7
- 108010077112 prolyl-proline Proteins 0.000 description 7
- 239000013608 rAAV vector Substances 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 7
- 108010061238 threonyl-glycine Proteins 0.000 description 7
- 230000004393 visual impairment Effects 0.000 description 7
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 6
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 6
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 6
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 6
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 6
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 6
- OILNWMNBLIHXQK-ZLUOBGJFSA-N Ala-Cys-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O OILNWMNBLIHXQK-ZLUOBGJFSA-N 0.000 description 6
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 6
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 6
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 6
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 6
- HULHGJZIZXCPLD-FXQIFTODSA-N Arg-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HULHGJZIZXCPLD-FXQIFTODSA-N 0.000 description 6
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 6
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 6
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 6
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 6
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 6
- CRCCTGPNZUCAHE-DCAQKATOSA-N Arg-His-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 CRCCTGPNZUCAHE-DCAQKATOSA-N 0.000 description 6
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 6
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 6
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 6
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 6
- KSHJMDSNSKDJPU-QTKMDUPCSA-N Arg-Thr-His Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KSHJMDSNSKDJPU-QTKMDUPCSA-N 0.000 description 6
- YHZQOSXDTFRZKU-WDSOQIARSA-N Arg-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 YHZQOSXDTFRZKU-WDSOQIARSA-N 0.000 description 6
- BRCVLJZIIFBSPF-ZLUOBGJFSA-N Asn-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BRCVLJZIIFBSPF-ZLUOBGJFSA-N 0.000 description 6
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 6
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 6
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 6
- OFQPMRDJVWLMNJ-CIUDSAMLSA-N Asn-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N OFQPMRDJVWLMNJ-CIUDSAMLSA-N 0.000 description 6
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 6
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 6
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 6
- HGGIYWURFPGLIU-FXQIFTODSA-N Asn-Met-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(N)=O HGGIYWURFPGLIU-FXQIFTODSA-N 0.000 description 6
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 6
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 6
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 6
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 6
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 6
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 6
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 6
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 6
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 6
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 6
- OZBXOELNJBSJOA-UBHSHLNASA-N Asp-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N OZBXOELNJBSJOA-UBHSHLNASA-N 0.000 description 6
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 6
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 6
- RRIJEABIXPKSGP-FXQIFTODSA-N Cys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CS RRIJEABIXPKSGP-FXQIFTODSA-N 0.000 description 6
- SURTWIXUHQNUGN-GUBZILKMSA-N Cys-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N SURTWIXUHQNUGN-GUBZILKMSA-N 0.000 description 6
- SDXQKJAWASHMIZ-CIUDSAMLSA-N Cys-Glu-Met Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O SDXQKJAWASHMIZ-CIUDSAMLSA-N 0.000 description 6
- LBOLGUYQEPZSKM-YUMQZZPRSA-N Cys-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N LBOLGUYQEPZSKM-YUMQZZPRSA-N 0.000 description 6
- CAXGCBSRJLADPD-FXQIFTODSA-N Cys-Pro-Asn Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CAXGCBSRJLADPD-FXQIFTODSA-N 0.000 description 6
- BCFXQBXXDSEHRS-FXQIFTODSA-N Cys-Ser-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BCFXQBXXDSEHRS-FXQIFTODSA-N 0.000 description 6
- IWVNIQXKTIQXCT-SRVKXCTJSA-N Cys-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N)O IWVNIQXKTIQXCT-SRVKXCTJSA-N 0.000 description 6
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 6
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 6
- LPJVZYMINRLCQA-AVGNSLFASA-N Gln-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N LPJVZYMINRLCQA-AVGNSLFASA-N 0.000 description 6
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 6
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 6
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 6
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 6
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 6
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 6
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 6
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 6
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 6
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 6
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 6
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 6
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 6
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 6
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 6
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 6
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 6
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 6
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 6
- DAHLWSFUXOHMIA-FXQIFTODSA-N Glu-Ser-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O DAHLWSFUXOHMIA-FXQIFTODSA-N 0.000 description 6
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 6
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 6
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 6
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 6
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 6
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 6
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 6
- RQZGFWKQLPJOEQ-YUMQZZPRSA-N Gly-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN)CN=C(N)N RQZGFWKQLPJOEQ-YUMQZZPRSA-N 0.000 description 6
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 6
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 6
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 6
- QGZSAHIZRQHCEQ-QWRGUYRKSA-N Gly-Asp-Tyr Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QGZSAHIZRQHCEQ-QWRGUYRKSA-N 0.000 description 6
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 6
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 6
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 6
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 6
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 6
- UVTSZKIATYSKIR-RYUDHWBXSA-N Gly-Tyr-Glu Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O UVTSZKIATYSKIR-RYUDHWBXSA-N 0.000 description 6
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 6
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 6
- FYVHHKMHFPMBBG-GUBZILKMSA-N His-Gln-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FYVHHKMHFPMBBG-GUBZILKMSA-N 0.000 description 6
- YEKYGQZUBCRNGH-DCAQKATOSA-N His-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CO)C(=O)O YEKYGQZUBCRNGH-DCAQKATOSA-N 0.000 description 6
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 6
- SYPULFZAGBBIOM-GVXVVHGQSA-N His-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SYPULFZAGBBIOM-GVXVVHGQSA-N 0.000 description 6
- 108700039609 IRW peptide Proteins 0.000 description 6
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 6
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 6
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 6
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 6
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 6
- UDLAWRKOVFDKFL-PEFMBERDSA-N Ile-Asp-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UDLAWRKOVFDKFL-PEFMBERDSA-N 0.000 description 6
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 6
- AWTDTFXPVCTHAK-BJDJZHNGSA-N Ile-Cys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N AWTDTFXPVCTHAK-BJDJZHNGSA-N 0.000 description 6
- GTSAALPQZASLPW-KJYZGMDISA-N Ile-His-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N GTSAALPQZASLPW-KJYZGMDISA-N 0.000 description 6
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 6
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 6
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 6
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 6
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 6
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 6
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 6
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 6
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 6
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 6
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 6
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 6
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 6
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 6
- DDEMUMVXNFPDKC-SRVKXCTJSA-N Leu-His-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CS)C(=O)O)N DDEMUMVXNFPDKC-SRVKXCTJSA-N 0.000 description 6
- ORWTWZXGDBYVCP-BJDJZHNGSA-N Leu-Ile-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(C)C ORWTWZXGDBYVCP-BJDJZHNGSA-N 0.000 description 6
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 6
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 6
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 6
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 6
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 6
- NJMXCOOEFLMZSR-AVGNSLFASA-N Leu-Met-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O NJMXCOOEFLMZSR-AVGNSLFASA-N 0.000 description 6
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 6
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 6
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 6
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 6
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 6
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 6
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 6
- CKSXSQUVEYCDIW-AVGNSLFASA-N Lys-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N CKSXSQUVEYCDIW-AVGNSLFASA-N 0.000 description 6
- YVSHZSUKQHNDHD-KKUMJFAQSA-N Lys-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N YVSHZSUKQHNDHD-KKUMJFAQSA-N 0.000 description 6
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 6
- XTONYTDATVADQH-CIUDSAMLSA-N Lys-Cys-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XTONYTDATVADQH-CIUDSAMLSA-N 0.000 description 6
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 6
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 6
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 6
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 6
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 6
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 6
- CWFYZYQMUDWGTI-GUBZILKMSA-N Met-Arg-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O CWFYZYQMUDWGTI-GUBZILKMSA-N 0.000 description 6
- JPCHYAUKOUGOIB-HJGDQZAQSA-N Met-Glu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPCHYAUKOUGOIB-HJGDQZAQSA-N 0.000 description 6
- AXHNAGAYRGCDLG-UWVGGRQHSA-N Met-Lys-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AXHNAGAYRGCDLG-UWVGGRQHSA-N 0.000 description 6
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 6
- WSPQHZOMTFFWGH-XGEHTFHBSA-N Met-Thr-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(O)=O WSPQHZOMTFFWGH-XGEHTFHBSA-N 0.000 description 6
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 6
- FSTWDRPCQQUJIT-NHCYSSNCSA-N Met-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N FSTWDRPCQQUJIT-NHCYSSNCSA-N 0.000 description 6
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 6
- MPGJIHFJCXTVEX-KKUMJFAQSA-N Phe-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O MPGJIHFJCXTVEX-KKUMJFAQSA-N 0.000 description 6
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 6
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 6
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 6
- VLZGUAUYZGQKPM-DRZSPHRISA-N Phe-Gln-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VLZGUAUYZGQKPM-DRZSPHRISA-N 0.000 description 6
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 6
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 6
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 6
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 6
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 6
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 6
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 6
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 6
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 6
- KQCCDMFIALWGTL-GUBZILKMSA-N Pro-Asn-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 KQCCDMFIALWGTL-GUBZILKMSA-N 0.000 description 6
- TXPUNZXZDVJUJQ-LPEHRKFASA-N Pro-Asn-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O TXPUNZXZDVJUJQ-LPEHRKFASA-N 0.000 description 6
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 6
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 6
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 6
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 6
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 6
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 6
- VAIZFHMTBFYJIA-ACZMJKKPSA-N Ser-Asp-Gln Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O VAIZFHMTBFYJIA-ACZMJKKPSA-N 0.000 description 6
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 6
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 6
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 6
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 6
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 6
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 6
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 6
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 6
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 6
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 6
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 6
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 6
- DSLHSTIUAPKERR-XGEHTFHBSA-N Thr-Cys-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O DSLHSTIUAPKERR-XGEHTFHBSA-N 0.000 description 6
- BIENEHRYNODTLP-HJGDQZAQSA-N Thr-Glu-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N)O BIENEHRYNODTLP-HJGDQZAQSA-N 0.000 description 6
- LKEKWDJCJSPXNI-IRIUXVKKSA-N Thr-Glu-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LKEKWDJCJSPXNI-IRIUXVKKSA-N 0.000 description 6
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 6
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 6
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 6
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 6
- WRUWXBBEFUTJOU-XGEHTFHBSA-N Thr-Met-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N)O WRUWXBBEFUTJOU-XGEHTFHBSA-N 0.000 description 6
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 6
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 6
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 6
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 6
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 6
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 6
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 6
- HKIUVWMZYFBIHG-KKUMJFAQSA-N Tyr-Arg-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O HKIUVWMZYFBIHG-KKUMJFAQSA-N 0.000 description 6
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 6
- NJLQMKZSXYQRTO-FHWLQOOXSA-N Tyr-Glu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NJLQMKZSXYQRTO-FHWLQOOXSA-N 0.000 description 6
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 6
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 6
- YMUQBRQQCPQEQN-CXTHYWKRSA-N Tyr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YMUQBRQQCPQEQN-CXTHYWKRSA-N 0.000 description 6
- WDGDKHLSDIOXQC-ACRUOGEOSA-N Tyr-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WDGDKHLSDIOXQC-ACRUOGEOSA-N 0.000 description 6
- BGFCXQXETBDEHP-BZSNNMDCSA-N Tyr-Phe-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O BGFCXQXETBDEHP-BZSNNMDCSA-N 0.000 description 6
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 6
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 6
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 6
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 6
- LMSBRIVOCYOKMU-NRPADANISA-N Val-Gln-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N LMSBRIVOCYOKMU-NRPADANISA-N 0.000 description 6
- KVRLNEILGGVBJX-IHRRRGAJSA-N Val-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CN=CN1 KVRLNEILGGVBJX-IHRRRGAJSA-N 0.000 description 6
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 6
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 6
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 6
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 6
- SBJCTAZFSZXWSR-AVGNSLFASA-N Val-Met-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SBJCTAZFSZXWSR-AVGNSLFASA-N 0.000 description 6
- YQMILNREHKTFBS-IHRRRGAJSA-N Val-Phe-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YQMILNREHKTFBS-IHRRRGAJSA-N 0.000 description 6
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 6
- QWCZXKIFPWPQHR-JYJNAYRXSA-N Val-Pro-Tyr Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QWCZXKIFPWPQHR-JYJNAYRXSA-N 0.000 description 6
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 6
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 6
- NGXQOQNXSGOYOI-BQFCYCMXSA-N Val-Trp-Gln Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 NGXQOQNXSGOYOI-BQFCYCMXSA-N 0.000 description 6
- 108010070944 alanylhistidine Proteins 0.000 description 6
- 108010092854 aspartyllysine Proteins 0.000 description 6
- 239000003153 chemical reaction reagent Substances 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 6
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 6
- 108010087823 glycyltyrosine Proteins 0.000 description 6
- 108010025306 histidylleucine Proteins 0.000 description 6
- 102000045623 human CNGA3 Human genes 0.000 description 6
- 239000012535 impurity Substances 0.000 description 6
- 238000007918 intramuscular administration Methods 0.000 description 6
- 229930027917 kanamycin Natural products 0.000 description 6
- 229960000318 kanamycin Drugs 0.000 description 6
- 229930182823 kanamycin A Natural products 0.000 description 6
- 108010012058 leucyltyrosine Proteins 0.000 description 6
- 108010068488 methionylphenylalanine Proteins 0.000 description 6
- 239000013642 negative control Substances 0.000 description 6
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 6
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 6
- 239000002953 phosphate buffered saline Substances 0.000 description 6
- 108010015796 prolylisoleucine Proteins 0.000 description 6
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 6
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 108010003137 tyrosyltyrosine Proteins 0.000 description 6
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 6
- 108010000998 wheylin-2 peptide Proteins 0.000 description 6
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 5
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 5
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 5
- PZBSKYJGKNNYNK-ULQDDVLXSA-N Arg-Leu-Tyr Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O PZBSKYJGKNNYNK-ULQDDVLXSA-N 0.000 description 5
- ZRNWJUAQKFUUKV-SRVKXCTJSA-N Arg-Met-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O ZRNWJUAQKFUUKV-SRVKXCTJSA-N 0.000 description 5
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 5
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 5
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 5
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 5
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 5
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 5
- GIQCDTKOIPUDSG-GARJFASQSA-N Asn-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N)C(=O)O GIQCDTKOIPUDSG-GARJFASQSA-N 0.000 description 5
- IPPFAOCLQSGHJV-WFBYXXMGSA-N Asn-Trp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O IPPFAOCLQSGHJV-WFBYXXMGSA-N 0.000 description 5
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 5
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 5
- PMEHKVHZQKJACS-PEFMBERDSA-N Asp-Gln-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PMEHKVHZQKJACS-PEFMBERDSA-N 0.000 description 5
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 5
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 5
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 5
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 5
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 5
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 5
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 5
- KSMSFCBQBQPFAD-GUBZILKMSA-N Cys-Pro-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 KSMSFCBQBQPFAD-GUBZILKMSA-N 0.000 description 5
- 102000053602 DNA Human genes 0.000 description 5
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 5
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 5
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 5
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 5
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 5
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 5
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 5
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 5
- ZWMYUDZLXAQHCK-CIUDSAMLSA-N Glu-Met-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O ZWMYUDZLXAQHCK-CIUDSAMLSA-N 0.000 description 5
- WIKMTDVSCUJIPJ-CIUDSAMLSA-N Glu-Ser-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WIKMTDVSCUJIPJ-CIUDSAMLSA-N 0.000 description 5
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 5
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 5
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 5
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 5
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 5
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 5
- SDTPKSOWFXBACN-GUBZILKMSA-N His-Glu-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O SDTPKSOWFXBACN-GUBZILKMSA-N 0.000 description 5
- HIJIJPFILYPTFR-ACRUOGEOSA-N His-Tyr-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HIJIJPFILYPTFR-ACRUOGEOSA-N 0.000 description 5
- 101000611338 Homo sapiens Rhodopsin Proteins 0.000 description 5
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 5
- DGTOKVBDZXJHNZ-WZLNRYEVSA-N Ile-Thr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N DGTOKVBDZXJHNZ-WZLNRYEVSA-N 0.000 description 5
- PMAOIIWHZHAPBT-HJPIBITLSA-N Ile-Tyr-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CS)C(=O)O)N PMAOIIWHZHAPBT-HJPIBITLSA-N 0.000 description 5
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 5
- KUEVMUXNILMJTK-JYJNAYRXSA-N Leu-Gln-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KUEVMUXNILMJTK-JYJNAYRXSA-N 0.000 description 5
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 5
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 5
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 5
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 5
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 5
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 5
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 5
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 5
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 5
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 5
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 5
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 5
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 5
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 5
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 5
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 5
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 5
- NLDXSXDCNZIQCN-ULQDDVLXSA-N Met-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=CC=C1 NLDXSXDCNZIQCN-ULQDDVLXSA-N 0.000 description 5
- HQVPQHLNOVTLDD-IHRRRGAJSA-N Phe-Cys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N HQVPQHLNOVTLDD-IHRRRGAJSA-N 0.000 description 5
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 5
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 5
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 5
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 5
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 5
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 5
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 5
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 5
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 5
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 5
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 5
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 5
- 208000017442 Retinal disease Diseases 0.000 description 5
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 5
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 5
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 5
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 5
- UICKAKRRRBTILH-GUBZILKMSA-N Ser-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N UICKAKRRRBTILH-GUBZILKMSA-N 0.000 description 5
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 5
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 5
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 5
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 5
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 5
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 5
- FVFUOQIYDPAIJR-XIRDDKMYSA-N Ser-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FVFUOQIYDPAIJR-XIRDDKMYSA-N 0.000 description 5
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 5
- 108091081024 Start codon Proteins 0.000 description 5
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 5
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 5
- UZJDBCHMIQXLOQ-HEIBUPTGSA-N Thr-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O UZJDBCHMIQXLOQ-HEIBUPTGSA-N 0.000 description 5
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 5
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 5
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 5
- BQASAMYRHNCKQE-IHRRRGAJSA-N Tyr-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N BQASAMYRHNCKQE-IHRRRGAJSA-N 0.000 description 5
- 108010064997 VPY tripeptide Proteins 0.000 description 5
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 5
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 5
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 5
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 5
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 5
- 108010087049 alanyl-alanyl-prolyl-valine Proteins 0.000 description 5
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 5
- 108010011559 alanylphenylalanine Proteins 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 108010093581 aspartyl-proline Proteins 0.000 description 5
- 239000007640 basal medium Substances 0.000 description 5
- 208000003571 choroideremia Diseases 0.000 description 5
- 238000009472 formulation Methods 0.000 description 5
- 238000001476 gene delivery Methods 0.000 description 5
- 108010089804 glycyl-threonine Proteins 0.000 description 5
- 108010092114 histidylphenylalanine Proteins 0.000 description 5
- 238000001802 infusion Methods 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 108091033319 polynucleotide Proteins 0.000 description 5
- 102000040430 polynucleotide Human genes 0.000 description 5
- 239000002157 polynucleotide Substances 0.000 description 5
- 108010031719 prolyl-serine Proteins 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 241001529453 unidentified herpesvirus Species 0.000 description 5
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 5
- 108010009962 valyltyrosine Proteins 0.000 description 5
- 210000002845 virion Anatomy 0.000 description 5
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 4
- OGILYBDMVOATLU-CQJMVLFOSA-N (2s)-2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]-n-[(2s)-1-[[(2s)-1-amino-1-oxo-3-phenylpropan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]-4-methylpentanamide Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(N)=O)C1=CC=C(O)C=C1 OGILYBDMVOATLU-CQJMVLFOSA-N 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 4
- XQGIRPGAVLFKBJ-CIUDSAMLSA-N Ala-Asn-Lys Chemical compound N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)O XQGIRPGAVLFKBJ-CIUDSAMLSA-N 0.000 description 4
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 4
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 4
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 4
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 4
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 4
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 4
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 4
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 4
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 4
- JTKLCCFLSLCCST-SZMVWBNQSA-N Arg-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JTKLCCFLSLCCST-SZMVWBNQSA-N 0.000 description 4
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 4
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 4
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 4
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 4
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 4
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 4
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 4
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 4
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 4
- OISWSORSLQOGFV-AVGNSLFASA-N Arg-Met-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N OISWSORSLQOGFV-AVGNSLFASA-N 0.000 description 4
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 4
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 4
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 4
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 4
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 4
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 4
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 4
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 4
- JZDZLBJVYWIIQU-AVGNSLFASA-N Asn-Glu-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JZDZLBJVYWIIQU-AVGNSLFASA-N 0.000 description 4
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 4
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 4
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 4
- FTNRWCPWDWRPAV-BZSNNMDCSA-N Asn-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CC(N)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FTNRWCPWDWRPAV-BZSNNMDCSA-N 0.000 description 4
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 4
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 4
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 4
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 4
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 4
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 4
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 4
- LBFYTUPYYZENIR-GHCJXIJMSA-N Asp-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N LBFYTUPYYZENIR-GHCJXIJMSA-N 0.000 description 4
- KFAFUJMGHVVYRC-DCAQKATOSA-N Asp-Leu-Met Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O KFAFUJMGHVVYRC-DCAQKATOSA-N 0.000 description 4
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 4
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 4
- QOCFFCUFZGDHTP-NUMRIWBASA-N Asp-Thr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QOCFFCUFZGDHTP-NUMRIWBASA-N 0.000 description 4
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 4
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 4
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 4
- WDQXKVCQXRNOSI-GHCJXIJMSA-N Cys-Asp-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WDQXKVCQXRNOSI-GHCJXIJMSA-N 0.000 description 4
- LWYKPOCGGTYAIH-FXQIFTODSA-N Cys-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N LWYKPOCGGTYAIH-FXQIFTODSA-N 0.000 description 4
- MFMDKTLJCUBQIC-MXAVVETBSA-N Cys-Phe-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MFMDKTLJCUBQIC-MXAVVETBSA-N 0.000 description 4
- NRVQLLDIJJEIIZ-VZFHVOOUSA-N Cys-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N)O NRVQLLDIJJEIIZ-VZFHVOOUSA-N 0.000 description 4
- WVWRADGCZPIJJR-IHRRRGAJSA-N Cys-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CS)N WVWRADGCZPIJJR-IHRRRGAJSA-N 0.000 description 4
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 4
- KJRXLVZYJJLUCV-DCAQKATOSA-N Gln-Arg-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KJRXLVZYJJLUCV-DCAQKATOSA-N 0.000 description 4
- MGJMFSBEMSNYJL-AVGNSLFASA-N Gln-Asn-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MGJMFSBEMSNYJL-AVGNSLFASA-N 0.000 description 4
- KYFSMWLWHYZRNW-ACZMJKKPSA-N Gln-Asp-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KYFSMWLWHYZRNW-ACZMJKKPSA-N 0.000 description 4
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 4
- OOLCSQQPSLIETN-JYJNAYRXSA-N Gln-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)O OOLCSQQPSLIETN-JYJNAYRXSA-N 0.000 description 4
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 4
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 4
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 4
- GURIQZQSTBBHRV-SRVKXCTJSA-N Gln-Lys-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GURIQZQSTBBHRV-SRVKXCTJSA-N 0.000 description 4
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 4
- JUUNNOLZGVYCJT-JYJNAYRXSA-N Gln-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JUUNNOLZGVYCJT-JYJNAYRXSA-N 0.000 description 4
- QFXNFFZTMFHPST-DZKIICNBSA-N Gln-Phe-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)N)N QFXNFFZTMFHPST-DZKIICNBSA-N 0.000 description 4
- RWQCWSGOOOEGPB-FXQIFTODSA-N Gln-Ser-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O RWQCWSGOOOEGPB-FXQIFTODSA-N 0.000 description 4
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 4
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 4
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 4
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 4
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 4
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 4
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 4
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 4
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 4
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 4
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 4
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 4
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 4
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 4
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 4
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 4
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 4
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 4
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 4
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 4
- BKMOHWJHXQLFEX-IRIUXVKKSA-N Glu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N)O BKMOHWJHXQLFEX-IRIUXVKKSA-N 0.000 description 4
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 4
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 4
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 4
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 4
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 4
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 4
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 4
- YZPVGIVFMZLQMM-YUMQZZPRSA-N Gly-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN YZPVGIVFMZLQMM-YUMQZZPRSA-N 0.000 description 4
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 4
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 4
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 4
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 4
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 4
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 4
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 4
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 4
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 4
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 4
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 4
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 4
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 4
- CKONPJHGMIDMJP-IHRRRGAJSA-N His-Val-His Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CKONPJHGMIDMJP-IHRRRGAJSA-N 0.000 description 4
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 4
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 4
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 4
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 4
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 4
- VNDQNDYEPSXHLU-JUKXBJQTSA-N Ile-His-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N VNDQNDYEPSXHLU-JUKXBJQTSA-N 0.000 description 4
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 4
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 4
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 4
- XDUVMJCBYUKNFJ-MXAVVETBSA-N Ile-Lys-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N XDUVMJCBYUKNFJ-MXAVVETBSA-N 0.000 description 4
- CIJLNXXMDUOFPH-HJWJTTGWSA-N Ile-Pro-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CIJLNXXMDUOFPH-HJWJTTGWSA-N 0.000 description 4
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 4
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 4
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 4
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 4
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 4
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 4
- CNNQBZRGQATKNY-DCAQKATOSA-N Leu-Arg-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N CNNQBZRGQATKNY-DCAQKATOSA-N 0.000 description 4
- QUAAUWNLWMLERT-IHRRRGAJSA-N Leu-Arg-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O QUAAUWNLWMLERT-IHRRRGAJSA-N 0.000 description 4
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 4
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 4
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 4
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 4
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 4
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 4
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 4
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 4
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 4
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 4
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 4
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 4
- ARNIBBOXIAWUOP-MGHWNKPDSA-N Leu-Tyr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ARNIBBOXIAWUOP-MGHWNKPDSA-N 0.000 description 4
- SEOXPEFQEOYURL-PMVMPFDFSA-N Leu-Tyr-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SEOXPEFQEOYURL-PMVMPFDFSA-N 0.000 description 4
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 4
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 4
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 4
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 4
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 4
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 4
- MRWXLRGAFDOILG-DCAQKATOSA-N Lys-Gln-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRWXLRGAFDOILG-DCAQKATOSA-N 0.000 description 4
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 4
- DKTNGXVSCZULPO-YUMQZZPRSA-N Lys-Gly-Cys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O DKTNGXVSCZULPO-YUMQZZPRSA-N 0.000 description 4
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 4
- OIYWBDBHEGAVST-BZSNNMDCSA-N Lys-His-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OIYWBDBHEGAVST-BZSNNMDCSA-N 0.000 description 4
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 4
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 4
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 4
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 4
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 4
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 4
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 4
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 4
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 4
- PPNCMJARTHYNEC-MEYUZBJRSA-N Lys-Tyr-Thr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)CC1=CC=C(O)C=C1 PPNCMJARTHYNEC-MEYUZBJRSA-N 0.000 description 4
- AFVOKRHYSSFPHC-STECZYCISA-N Met-Ile-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFVOKRHYSSFPHC-STECZYCISA-N 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- DFPAKSUCGFBDDF-UHFFFAOYSA-N Nicotinamide Chemical compound NC(=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-UHFFFAOYSA-N 0.000 description 4
- 108091005461 Nucleic proteins Proteins 0.000 description 4
- DPUOLKQSMYLRDR-UBHSHLNASA-N Phe-Arg-Ala Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 DPUOLKQSMYLRDR-UBHSHLNASA-N 0.000 description 4
- OXUMFAOVGFODPN-KKUMJFAQSA-N Phe-Asn-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OXUMFAOVGFODPN-KKUMJFAQSA-N 0.000 description 4
- LXUJDHOKVUYHRC-KKUMJFAQSA-N Phe-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N LXUJDHOKVUYHRC-KKUMJFAQSA-N 0.000 description 4
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 4
- MIICYIIBVYQNKE-QEWYBTABSA-N Phe-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MIICYIIBVYQNKE-QEWYBTABSA-N 0.000 description 4
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 4
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 4
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 4
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 4
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 4
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 4
- GTMSCDVFQLNEOY-BZSNNMDCSA-N Phe-Tyr-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N GTMSCDVFQLNEOY-BZSNNMDCSA-N 0.000 description 4
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 4
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 4
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 4
- VPFGPKIWSDVTOY-SRVKXCTJSA-N Pro-Glu-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O VPFGPKIWSDVTOY-SRVKXCTJSA-N 0.000 description 4
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 4
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 4
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 4
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 4
- APIAILHCTSBGLU-JYJNAYRXSA-N Pro-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@@H]2CCCN2 APIAILHCTSBGLU-JYJNAYRXSA-N 0.000 description 4
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 4
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 4
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 4
- 108010079005 RDV peptide Proteins 0.000 description 4
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 4
- IDCKUIWEIZYVSO-WFBYXXMGSA-N Ser-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C)C(O)=O)=CNC2=C1 IDCKUIWEIZYVSO-WFBYXXMGSA-N 0.000 description 4
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 4
- COAHUSQNSVFYBW-FXQIFTODSA-N Ser-Asn-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O COAHUSQNSVFYBW-FXQIFTODSA-N 0.000 description 4
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 4
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 4
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 4
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 4
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 4
- YMDNFPNTIPQMJP-NAKRPEOUSA-N Ser-Ile-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O YMDNFPNTIPQMJP-NAKRPEOUSA-N 0.000 description 4
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 4
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 4
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 4
- JUTGONBTALQWMK-NAKRPEOUSA-N Ser-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N JUTGONBTALQWMK-NAKRPEOUSA-N 0.000 description 4
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 4
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 4
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 4
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 4
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 4
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 4
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 4
- DFTCYYILCSQGIZ-GCJQMDKQSA-N Thr-Ala-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFTCYYILCSQGIZ-GCJQMDKQSA-N 0.000 description 4
- JVTHIXKSVYEWNI-JRQIVUDYSA-N Thr-Asn-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JVTHIXKSVYEWNI-JRQIVUDYSA-N 0.000 description 4
- MQUZMZBFKCHVOB-HJGDQZAQSA-N Thr-Gln-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O MQUZMZBFKCHVOB-HJGDQZAQSA-N 0.000 description 4
- XXNLGZRRSKPSGF-HTUGSXCWSA-N Thr-Gln-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O XXNLGZRRSKPSGF-HTUGSXCWSA-N 0.000 description 4
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 4
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 4
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 4
- QNCFWHZVRNXAKW-OEAJRASXSA-N Thr-Lys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNCFWHZVRNXAKW-OEAJRASXSA-N 0.000 description 4
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 4
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 4
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 4
- NDLHSJWPCXKOGG-VLCNGCBASA-N Thr-Trp-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N)O NDLHSJWPCXKOGG-VLCNGCBASA-N 0.000 description 4
- GUWJWCHZNGDKBG-UBHSHLNASA-N Trp-Asn-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N GUWJWCHZNGDKBG-UBHSHLNASA-N 0.000 description 4
- LTLBNCDNXQCOLB-UBHSHLNASA-N Trp-Asp-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 LTLBNCDNXQCOLB-UBHSHLNASA-N 0.000 description 4
- WKCFCVBOFKEVKY-HSCHXYMDSA-N Trp-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WKCFCVBOFKEVKY-HSCHXYMDSA-N 0.000 description 4
- GQEXFCQNAJHJTI-IHPCNDPISA-N Trp-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GQEXFCQNAJHJTI-IHPCNDPISA-N 0.000 description 4
- DVLHKUWLNKDINO-PMVMPFDFSA-N Trp-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DVLHKUWLNKDINO-PMVMPFDFSA-N 0.000 description 4
- WGBFZZYIWFSYER-BVSLBCMMSA-N Trp-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N WGBFZZYIWFSYER-BVSLBCMMSA-N 0.000 description 4
- DKKHULUSOSWGHS-UWJYBYFXSA-N Tyr-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N DKKHULUSOSWGHS-UWJYBYFXSA-N 0.000 description 4
- MPKPIWFFDWVJGC-IRIUXVKKSA-N Tyr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O MPKPIWFFDWVJGC-IRIUXVKKSA-N 0.000 description 4
- DAOREBHZAKCOEN-ULQDDVLXSA-N Tyr-Leu-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O DAOREBHZAKCOEN-ULQDDVLXSA-N 0.000 description 4
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 4
- BJCILVZEZRDIDR-PMVMPFDFSA-N Tyr-Leu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 BJCILVZEZRDIDR-PMVMPFDFSA-N 0.000 description 4
- KYPMKDGKAYQCHO-RYUDHWBXSA-N Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KYPMKDGKAYQCHO-RYUDHWBXSA-N 0.000 description 4
- QPBJXNYYQTUTDD-KKUMJFAQSA-N Tyr-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QPBJXNYYQTUTDD-KKUMJFAQSA-N 0.000 description 4
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 4
- PYJKETPLFITNKS-IHRRRGAJSA-N Tyr-Pro-Asn Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O PYJKETPLFITNKS-IHRRRGAJSA-N 0.000 description 4
- QKXAEWMHAAVVGS-KKUMJFAQSA-N Tyr-Pro-Glu Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O QKXAEWMHAAVVGS-KKUMJFAQSA-N 0.000 description 4
- ZYVAAYAOTVJBSS-GMVOTWDCSA-N Tyr-Trp-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O ZYVAAYAOTVJBSS-GMVOTWDCSA-N 0.000 description 4
- FZADUTOCSFDBRV-RNXOBYDBSA-N Tyr-Tyr-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 FZADUTOCSFDBRV-RNXOBYDBSA-N 0.000 description 4
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 4
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 4
- XIFAHCUNWWKUDE-DCAQKATOSA-N Val-Cys-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N XIFAHCUNWWKUDE-DCAQKATOSA-N 0.000 description 4
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 4
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 4
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 4
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 4
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 4
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 4
- 210000001766 X chromosome Anatomy 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 4
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 4
- 108010070783 alanyltyrosine Proteins 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 4
- 108010066270 beta-lactorphin Proteins 0.000 description 4
- 108010006025 bovine growth hormone Proteins 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 125000004122 cyclic group Chemical group 0.000 description 4
- 108010004073 cysteinylcysteine Proteins 0.000 description 4
- 230000007850 degeneration Effects 0.000 description 4
- 238000001739 density measurement Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 231100000673 dose–response relationship Toxicity 0.000 description 4
- 239000012091 fetal bovine serum Substances 0.000 description 4
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 108010079547 glutamylmethionine Proteins 0.000 description 4
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 4
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 4
- 108010036413 histidylglycine Proteins 0.000 description 4
- 102000050037 human CNGB3 Human genes 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 4
- 108010059573 lysyl-lysyl-glycyl-glutamic acid Proteins 0.000 description 4
- 108010075702 lysyl-valyl-aspartyl-leucine Proteins 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 108010082117 matrigel Proteins 0.000 description 4
- 108700023046 methionyl-leucyl-phenylalanine Proteins 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000002577 ophthalmoscopy Methods 0.000 description 4
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 4
- 108010084572 phenylalanyl-valine Proteins 0.000 description 4
- 108010018625 phenylalanylarginine Proteins 0.000 description 4
- 210000001778 pluripotent stem cell Anatomy 0.000 description 4
- 239000013641 positive control Substances 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 4
- 108010079317 prolyl-tyrosine Proteins 0.000 description 4
- 108010029020 prolylglycine Proteins 0.000 description 4
- 108010033990 rab27 GTP-Binding Proteins Proteins 0.000 description 4
- 102000006581 rab27 GTP-Binding Proteins Human genes 0.000 description 4
- 230000008672 reprogramming Effects 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- 108010080629 tryptophan-leucine Proteins 0.000 description 4
- 108010084932 tryptophyl-proline Proteins 0.000 description 4
- 108010051110 tyrosyl-lysine Proteins 0.000 description 4
- 241000701161 unidentified adenovirus Species 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 101150042233 Chm gene Proteins 0.000 description 3
- 208000033810 Choroidal dystrophy Diseases 0.000 description 3
- 102100030074 Dickkopf-related protein 1 Human genes 0.000 description 3
- 101710099518 Dickkopf-related protein 1 Proteins 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 3
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 3
- 101000599951 Homo sapiens Insulin-like growth factor I Proteins 0.000 description 3
- 102100037852 Insulin-like growth factor I Human genes 0.000 description 3
- 241000711408 Murine respirovirus Species 0.000 description 3
- 108091061960 Naked DNA Proteins 0.000 description 3
- JVTMTFMMMHAPCR-UBHSHLNASA-N Phe-Ala-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JVTMTFMMMHAPCR-UBHSHLNASA-N 0.000 description 3
- 206010034960 Photophobia Diseases 0.000 description 3
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 3
- 201000007737 Retinal degeneration Diseases 0.000 description 3
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 3
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 3
- 108010041407 alanylaspartic acid Proteins 0.000 description 3
- 238000010171 animal model Methods 0.000 description 3
- 230000003416 augmentation Effects 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 238000011109 contamination Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 210000000744 eyelid Anatomy 0.000 description 3
- 230000004438 eyesight Effects 0.000 description 3
- 210000002950 fibroblast Anatomy 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 238000012014 optical coherence tomography Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 3
- 230000005043 peripheral vision Effects 0.000 description 3
- 230000001566 pro-viral effect Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000004258 retinal degeneration Effects 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 239000003381 stabilizer Substances 0.000 description 3
- 210000000130 stem cell Anatomy 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000004448 titration Methods 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- 210000003462 vein Anatomy 0.000 description 3
- HGHOBRRUMWJWCU-FXQIFTODSA-N (4s)-4-[[(2s)-2-aminopropanoyl]amino]-5-[[(2s)-3-carboxy-1-(carboxymethylamino)-1-oxopropan-2-yl]amino]-5-oxopentanoic acid Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O HGHOBRRUMWJWCU-FXQIFTODSA-N 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- ZOOGRGPOEVQQDX-UUOKFMHZSA-N 3',5'-cyclic GMP Chemical compound C([C@H]1O2)OP(O)(=O)O[C@H]1[C@@H](O)[C@@H]2N1C(N=C(NC2=O)N)=C2N=C1 ZOOGRGPOEVQQDX-UUOKFMHZSA-N 0.000 description 2
- 102100026396 ADP/ATP translocase 2 Human genes 0.000 description 2
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 2
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 2
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 2
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 2
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 2
- OOBVTWHLKYJFJH-FXQIFTODSA-N Arg-Ala-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O OOBVTWHLKYJFJH-FXQIFTODSA-N 0.000 description 2
- DGFXIWKPTDKBLF-AVGNSLFASA-N Arg-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N DGFXIWKPTDKBLF-AVGNSLFASA-N 0.000 description 2
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 2
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 2
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 2
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 2
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 2
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 2
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 2
- LGCVSPFCFXWUEY-IHPCNDPISA-N Asn-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N LGCVSPFCFXWUEY-IHPCNDPISA-N 0.000 description 2
- DXHINQUXBZNUCF-MELADBBJSA-N Asn-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O DXHINQUXBZNUCF-MELADBBJSA-N 0.000 description 2
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 2
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 2
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 2
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 2
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 2
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 2
- 101150078806 BCAT2 gene Proteins 0.000 description 2
- 102100026413 Branched-chain-amino-acid aminotransferase, mitochondrial Human genes 0.000 description 2
- -1 CNGA3 Proteins 0.000 description 2
- 208000033825 Chorioretinal atrophy Diseases 0.000 description 2
- YUZPQIQWXLRFBW-ACZMJKKPSA-N Cys-Glu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O YUZPQIQWXLRFBW-ACZMJKKPSA-N 0.000 description 2
- YNJBLTDKTMKEET-ZLUOBGJFSA-N Cys-Ser-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O YNJBLTDKTMKEET-ZLUOBGJFSA-N 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 102100024785 Fibroblast growth factor 2 Human genes 0.000 description 2
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 2
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 2
- YADSXULAFMJZRL-QEJZJMRPSA-N Gln-Trp-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N YADSXULAFMJZRL-QEJZJMRPSA-N 0.000 description 2
- UGEZSPWLJABDAR-KKUMJFAQSA-N Gln-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N UGEZSPWLJABDAR-KKUMJFAQSA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 2
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 2
- ZTVGZOIBLRPQNR-KKUMJFAQSA-N Glu-Met-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZTVGZOIBLRPQNR-KKUMJFAQSA-N 0.000 description 2
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 2
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 2
- UCZXXMREFIETQW-AVGNSLFASA-N Glu-Tyr-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O UCZXXMREFIETQW-AVGNSLFASA-N 0.000 description 2
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 2
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 2
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 2
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 2
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 2
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 2
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 2
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 2
- UMBDRSMLCUYIRI-DVJZZOLTSA-N Gly-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN)O UMBDRSMLCUYIRI-DVJZZOLTSA-N 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- ZXJFURYTPZMUNY-VKOGCVSHSA-N Ile-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 ZXJFURYTPZMUNY-VKOGCVSHSA-N 0.000 description 2
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 2
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 2
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 2
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 2
- DZMWFIRHFFVBHS-ZEWNOJEFSA-N Ile-Tyr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N DZMWFIRHFFVBHS-ZEWNOJEFSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 2
- NTRAGDHVSGKUSF-AVGNSLFASA-N Leu-Arg-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NTRAGDHVSGKUSF-AVGNSLFASA-N 0.000 description 2
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 2
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 2
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 2
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 2
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 2
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 2
- YESNGRDJQWDYLH-KKUMJFAQSA-N Leu-Phe-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YESNGRDJQWDYLH-KKUMJFAQSA-N 0.000 description 2
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 2
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 2
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 2
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 2
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 2
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 2
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 2
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 2
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 2
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 2
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 2
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 2
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 2
- DCHHUGLTVLJYKA-FXQIFTODSA-N Met-Asn-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DCHHUGLTVLJYKA-FXQIFTODSA-N 0.000 description 2
- VBGGTAPDGFQMKF-AVGNSLFASA-N Met-Lys-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O VBGGTAPDGFQMKF-AVGNSLFASA-N 0.000 description 2
- NWIBSHFKIJFRCO-WUDYKRTCSA-N Mytomycin Chemical compound C1N2C(C(C(C)=C(N)C3=O)=O)=C3[C@@H](COC(N)=O)[C@@]2(OC)[C@@H]2[C@H]1N2 NWIBSHFKIJFRCO-WUDYKRTCSA-N 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 208000001140 Night Blindness Diseases 0.000 description 2
- 239000000020 Nitrocellulose Substances 0.000 description 2
- 229930182555 Penicillin Natural products 0.000 description 2
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 2
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 2
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 2
- XMPUYNHKEPFERE-IHRRRGAJSA-N Phe-Asp-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMPUYNHKEPFERE-IHRRRGAJSA-N 0.000 description 2
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 2
- SXJGROGVINAYSH-AVGNSLFASA-N Phe-Gln-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SXJGROGVINAYSH-AVGNSLFASA-N 0.000 description 2
- OYQBFWWQSVIHBN-FHWLQOOXSA-N Phe-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OYQBFWWQSVIHBN-FHWLQOOXSA-N 0.000 description 2
- APZNYJFGVAGFCF-JYJNAYRXSA-N Phe-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccccc1)C(C)C)C(O)=O APZNYJFGVAGFCF-JYJNAYRXSA-N 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 102000004861 Phosphoric Diester Hydrolases Human genes 0.000 description 2
- 108090001050 Phosphoric Diester Hydrolases Proteins 0.000 description 2
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 2
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 2
- ZTHYODDOHIVTJV-UHFFFAOYSA-N Propyl gallate Chemical compound CCCOC(=O)C1=CC(O)=C(O)C(O)=C1 ZTHYODDOHIVTJV-UHFFFAOYSA-N 0.000 description 2
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 2
- 239000012083 RIPA buffer Substances 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 206010038910 Retinitis Diseases 0.000 description 2
- 101710137010 Retinol-binding protein 3 Proteins 0.000 description 2
- 102100038247 Retinol-binding protein 3 Human genes 0.000 description 2
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 2
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 2
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 2
- GRSLLFZTTLBOQX-CIUDSAMLSA-N Ser-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N GRSLLFZTTLBOQX-CIUDSAMLSA-N 0.000 description 2
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 2
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 2
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 2
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 2
- RAHZWNYVWXNFOC-UHFFFAOYSA-N Sulphur dioxide Chemical compound O=S=O RAHZWNYVWXNFOC-UHFFFAOYSA-N 0.000 description 2
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 2
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 2
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 2
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 2
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 2
- BRBCKMMXKONBAA-KWBADKCTSA-N Trp-Ala-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 BRBCKMMXKONBAA-KWBADKCTSA-N 0.000 description 2
- BDWDMRSGCXEDMR-WFBYXXMGSA-N Trp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N BDWDMRSGCXEDMR-WFBYXXMGSA-N 0.000 description 2
- CPZTZWFFGVKHEA-SZMVWBNQSA-N Trp-Gln-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N CPZTZWFFGVKHEA-SZMVWBNQSA-N 0.000 description 2
- XOLLWQIBBLBAHQ-WDSOQIARSA-N Trp-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O XOLLWQIBBLBAHQ-WDSOQIARSA-N 0.000 description 2
- GSCPHMSPGQSZJT-JYBASQMISA-N Trp-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GSCPHMSPGQSZJT-JYBASQMISA-N 0.000 description 2
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 2
- VYQQQIRHIFALGE-UWJYBYFXSA-N Tyr-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VYQQQIRHIFALGE-UWJYBYFXSA-N 0.000 description 2
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 2
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 2
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 2
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 2
- AIWLHFZYOUUJGB-UFYCRDLUSA-N Val-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 AIWLHFZYOUUJGB-UFYCRDLUSA-N 0.000 description 2
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 2
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- 206010047571 Visual impairment Diseases 0.000 description 2
- 108010023082 activin A Proteins 0.000 description 2
- 108010084217 alanyl-glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 2
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 230000030833 cell death Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- OSASVXMJTNOKOY-UHFFFAOYSA-N chlorobutanol Chemical compound CC(C)(O)C(Cl)(Cl)Cl OSASVXMJTNOKOY-UHFFFAOYSA-N 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 230000004064 dysfunction Effects 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 210000000981 epithelium Anatomy 0.000 description 2
- HQPMKSGTIOYHJT-UHFFFAOYSA-N ethane-1,2-diol;propane-1,2-diol Chemical compound OCCO.CC(O)CO HQPMKSGTIOYHJT-UHFFFAOYSA-N 0.000 description 2
- CBOQJANXLMLOSS-UHFFFAOYSA-N ethyl vanillin Chemical compound CCOC1=CC(C=O)=CC=C1O CBOQJANXLMLOSS-UHFFFAOYSA-N 0.000 description 2
- 230000000763 evoking effect Effects 0.000 description 2
- 238000002599 functional magnetic resonance imaging Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 235000011187 glycerol Nutrition 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 230000034217 membrane fusion Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 239000008267 milk Substances 0.000 description 2
- 235000013336 milk Nutrition 0.000 description 2
- 210000004080 milk Anatomy 0.000 description 2
- 238000010172 mouse model Methods 0.000 description 2
- 229960003966 nicotinamide Drugs 0.000 description 2
- 235000005152 nicotinamide Nutrition 0.000 description 2
- 239000011570 nicotinamide Substances 0.000 description 2
- 229920001220 nitrocellulos Polymers 0.000 description 2
- 102000045246 noggin Human genes 0.000 description 2
- 108700007229 noggin Proteins 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 229940049954 penicillin Drugs 0.000 description 2
- 108010024607 phenylalanylalanine Proteins 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 229920001993 poloxamer 188 Polymers 0.000 description 2
- 230000002028 premature Effects 0.000 description 2
- 239000003755 preservative agent Substances 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 238000002731 protein assay Methods 0.000 description 2
- 230000001179 pupillary effect Effects 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 210000000964 retinal cone photoreceptor cell Anatomy 0.000 description 2
- 239000000790 retinal pigment Substances 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000003345 scintillation counting Methods 0.000 description 2
- 230000037432 silent mutation Effects 0.000 description 2
- DAEPDZWVDSPTHF-UHFFFAOYSA-M sodium pyruvate Chemical compound [Na+].CC(=O)C([O-])=O DAEPDZWVDSPTHF-UHFFFAOYSA-M 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000007920 subcutaneous administration Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 239000003104 tissue culture media Substances 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000003146 transient transfection Methods 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- 208000029257 vision disease Diseases 0.000 description 2
- 230000004304 visual acuity Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- CHHHXKFHOYLYRE-UHFFFAOYSA-M 2,4-Hexadienoic acid, potassium salt (1:1), (2E,4E)- Chemical compound [K+].CC=CC=CC([O-])=O CHHHXKFHOYLYRE-UHFFFAOYSA-M 0.000 description 1
- OINNEUNVOZHBOX-QIRCYJPOSA-K 2-trans,6-trans,10-trans-geranylgeranyl diphosphate(3-) Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CC\C(C)=C\COP([O-])(=O)OP([O-])([O-])=O OINNEUNVOZHBOX-QIRCYJPOSA-K 0.000 description 1
- PUMRUSBKNSBTAL-UHFFFAOYSA-N 3,4-dihydro-2h-chromene-2-carbaldehyde Chemical compound C1=CC=C2OC(C=O)CCC2=C1 PUMRUSBKNSBTAL-UHFFFAOYSA-N 0.000 description 1
- WXNZTHHGJRFXKQ-UHFFFAOYSA-N 4-chlorophenol Chemical compound OC1=CC=C(Cl)C=C1 WXNZTHHGJRFXKQ-UHFFFAOYSA-N 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 1
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- GIMTZGADWZTZGV-DCAQKATOSA-N Arg-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GIMTZGADWZTZGV-DCAQKATOSA-N 0.000 description 1
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- 102100024081 Aryl-hydrocarbon-interacting protein-like 1 Human genes 0.000 description 1
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 102100022794 Bestrophin-1 Human genes 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108091005462 Cation channels Proteins 0.000 description 1
- 206010057248 Cell death Diseases 0.000 description 1
- 229930186147 Cephalosporin Natural products 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 102000012003 Cyclic Nucleotide-Gated Cation Channels Human genes 0.000 description 1
- 108010036281 Cyclic Nucleotide-Gated Cation Channels Proteins 0.000 description 1
- 102100029157 Cyclic nucleotide-gated cation channel alpha-4 Human genes 0.000 description 1
- POSRGGKLRWCUBE-CIUDSAMLSA-N Cys-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N POSRGGKLRWCUBE-CIUDSAMLSA-N 0.000 description 1
- WTXCNOPZMQRTNN-BWBBJGPYSA-N Cys-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)O WTXCNOPZMQRTNN-BWBBJGPYSA-N 0.000 description 1
- 101150026402 DBP gene Proteins 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 101001031598 Dictyostelium discoideum Probable serine/threonine-protein kinase fhkC Proteins 0.000 description 1
- 241000289427 Didelphidae Species 0.000 description 1
- 101000771077 Drosophila melanogaster Cyclic nucleotide-gated cation channel subunit A Proteins 0.000 description 1
- 101100464671 Drosophila melanogaster pnr gene Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 206010058314 Dysplasia Diseases 0.000 description 1
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 241000701148 Equine adenovirus Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 208000002111 Eye Abnormalities Diseases 0.000 description 1
- 241001200922 Gagata Species 0.000 description 1
- 208000003098 Ganglion Cysts Diseases 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- OINNEUNVOZHBOX-XBQSVVNOSA-N Geranylgeranyl diphosphate Natural products [P@](=O)(OP(=O)(O)O)(OC/C=C(\CC/C=C(\CC/C=C(\CC/C=C(\C)/C)/C)/C)/C)O OINNEUNVOZHBOX-XBQSVVNOSA-N 0.000 description 1
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 1
- RGAOLBZBLOJUTP-GRLWGSQLSA-N Gln-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N RGAOLBZBLOJUTP-GRLWGSQLSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- AKDOUBMVLRCHBD-SIUGBPQLSA-N Gln-Tyr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AKDOUBMVLRCHBD-SIUGBPQLSA-N 0.000 description 1
- 108010044091 Globulins Proteins 0.000 description 1
- 102000006395 Globulins Human genes 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 1
- BIHMNDPWRUROFZ-JYJNAYRXSA-N Glu-His-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BIHMNDPWRUROFZ-JYJNAYRXSA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 1
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 1
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- SCJJPCQUJYPHRZ-BQBZGAKWSA-N Gly-Pro-Asn Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O SCJJPCQUJYPHRZ-BQBZGAKWSA-N 0.000 description 1
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 101150064935 HELI gene Proteins 0.000 description 1
- 101710088172 HTH-type transcriptional regulator RipA Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000833576 Homo sapiens Aryl-hydrocarbon-interacting protein-like 1 Proteins 0.000 description 1
- 101000903449 Homo sapiens Bestrophin-1 Proteins 0.000 description 1
- 101000771069 Homo sapiens Cyclic nucleotide-gated cation channel alpha-4 Proteins 0.000 description 1
- 101000887490 Homo sapiens Guanine nucleotide-binding protein G(z) subunit alpha Proteins 0.000 description 1
- 101000597428 Homo sapiens Nucleoredoxin-like protein 1 Proteins 0.000 description 1
- 101000594760 Homo sapiens Nucleoredoxin-like protein 2 Proteins 0.000 description 1
- 101000729271 Homo sapiens Retinoid isomerohydrolase Proteins 0.000 description 1
- 101001104102 Homo sapiens X-linked retinitis pigmentosa GTPase regulator Proteins 0.000 description 1
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 1
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- WXLYNEHOGRYNFU-URLPEUOOSA-N Ile-Thr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N WXLYNEHOGRYNFU-URLPEUOOSA-N 0.000 description 1
- 101800001691 Inter-alpha-trypsin inhibitor light chain Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 102000004310 Ion Channels Human genes 0.000 description 1
- 108090000862 Ion Channels Proteins 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 1
- 208000010415 Low Vision Diseases 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 101710081079 Minor spike protein H Proteins 0.000 description 1
- 108010025020 Nerve Growth Factor Proteins 0.000 description 1
- 102000007072 Nerve Growth Factors Human genes 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 102100035399 Nucleoredoxin-like protein 1 Human genes 0.000 description 1
- 102100036205 Nucleoredoxin-like protein 2 Human genes 0.000 description 1
- 208000022873 Ocular disease Diseases 0.000 description 1
- 102000012547 Olfactory receptors Human genes 0.000 description 1
- 108050002069 Olfactory receptors Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 108010046016 Peanut Agglutinin Proteins 0.000 description 1
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 102100029533 Photoreceptor-specific nuclear receptor Human genes 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- 102100032859 Protein AMBP Human genes 0.000 description 1
- 101710136297 Protein VP2 Proteins 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 101710118046 RNA-directed RNA polymerase Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 241001068295 Replication defective viruses Species 0.000 description 1
- 208000004453 Retinal Dysplasia Diseases 0.000 description 1
- 102100031176 Retinoid isomerohydrolase Human genes 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101100221606 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) COS7 gene Proteins 0.000 description 1
- 101000980867 Schizosaccharomyces pombe (strain 972 / ATCC 24843) Curved DNA-binding protein Proteins 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 1
- 101000982319 Shallot virus X Uncharacterized ORF4 protein Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- UIIMBOGNXHQVGW-DEQYMQKBSA-M Sodium bicarbonate-14C Chemical compound [Na+].O[14C]([O-])=O UIIMBOGNXHQVGW-DEQYMQKBSA-M 0.000 description 1
- 208000027073 Stargardt disease Diseases 0.000 description 1
- 229910001347 Stellite Inorganic materials 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 208000005400 Synovial Cyst Diseases 0.000 description 1
- ZBKDBZUTTXINIX-RWRJDSDZSA-N Thr-Ile-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZBKDBZUTTXINIX-RWRJDSDZSA-N 0.000 description 1
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 1
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- OHGNSVACHBZKSS-KWQFWETISA-N Trp-Ala Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)N[C@@H](C)C([O-])=O)=CNC2=C1 OHGNSVACHBZKSS-KWQFWETISA-N 0.000 description 1
- RRVUOLRWIZXBRQ-IHPCNDPISA-N Trp-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RRVUOLRWIZXBRQ-IHPCNDPISA-N 0.000 description 1
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 1
- YLRLHDFMMWDYTK-KKUMJFAQSA-N Tyr-Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 YLRLHDFMMWDYTK-KKUMJFAQSA-N 0.000 description 1
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 1
- 101150008036 UL29 gene Proteins 0.000 description 1
- 101150099617 UL5 gene Proteins 0.000 description 1
- 101150011902 UL52 gene Proteins 0.000 description 1
- 101150033561 UL8 gene Proteins 0.000 description 1
- HIZMLPKDJAXDRG-FXQIFTODSA-N Val-Cys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N HIZMLPKDJAXDRG-FXQIFTODSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- 208000012886 Vertigo Diseases 0.000 description 1
- 102100040092 X-linked retinitis pigmentosa GTPase regulator Human genes 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- CUJRVFIICFDLGR-UHFFFAOYSA-N acetylacetonate Chemical compound CC(=O)[CH-]C(C)=O CUJRVFIICFDLGR-UHFFFAOYSA-N 0.000 description 1
- 201000000761 achromatopsia Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000011374 additional therapy Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 210000000411 amacrine cell Anatomy 0.000 description 1
- 238000003975 animal breeding Methods 0.000 description 1
- 230000002424 anti-apoptotic effect Effects 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 239000003855 balanced salt solution Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000008436 biogenesis Effects 0.000 description 1
- 230000008236 biological pathway Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 238000011095 buffer preparation Methods 0.000 description 1
- 239000007975 buffered saline Substances 0.000 description 1
- 239000006172 buffering agent Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 210000003986 cell retinal photoreceptor Anatomy 0.000 description 1
- 229940124587 cephalosporin Drugs 0.000 description 1
- 150000001780 cephalosporins Chemical class 0.000 description 1
- 229960004926 chlorobutanol Drugs 0.000 description 1
- AHICWQREWHDHHF-UHFFFAOYSA-N chromium;cobalt;iron;manganese;methane;molybdenum;nickel;silicon;tungsten Chemical compound C.[Si].[Cr].[Mn].[Fe].[Co].[Ni].[Mo].[W] AHICWQREWHDHHF-UHFFFAOYSA-N 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000004456 color vision Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000004452 decreased vision Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 238000011833 dog model Methods 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 238000002001 electrophysiology Methods 0.000 description 1
- 230000007831 electrophysiology Effects 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- BEFDCLMNVWHSGT-UHFFFAOYSA-N ethenylcyclopentane Chemical compound C=CC1CCCC1 BEFDCLMNVWHSGT-UHFFFAOYSA-N 0.000 description 1
- 229940073505 ethyl vanillin Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 230000004424 eye movement Effects 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 239000003365 glass fiber Substances 0.000 description 1
- 229960005150 glycerol Drugs 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000002443 hepatoprotective effect Effects 0.000 description 1
- 210000002287 horizontal cell Anatomy 0.000 description 1
- 102000052301 human GNAZ Human genes 0.000 description 1
- 238000010166 immunofluorescence Methods 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000010874 in vitro model Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 208000017532 inherited retinal dystrophy Diseases 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 208000013469 light sensitivity Diseases 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000003137 locomotive effect Effects 0.000 description 1
- 101710121537 mRNA (guanine-N(7))-methyltransferase Proteins 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 229960004857 mitomycin Drugs 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 230000000508 neurotrophic effect Effects 0.000 description 1
- 239000003900 neurotrophic factor Substances 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000004297 night vision Effects 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 206010029864 nystagmus Diseases 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 239000006174 pH buffer Substances 0.000 description 1
- 229940090668 parachlorophenol Drugs 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 1
- 235000020030 perry Nutrition 0.000 description 1
- 239000008177 pharmaceutical agent Substances 0.000 description 1
- 229960003742 phenol Drugs 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 235000010241 potassium sorbate Nutrition 0.000 description 1
- 239000004302 potassium sorbate Substances 0.000 description 1
- 229940069338 potassium sorbate Drugs 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 125000001844 prenyl group Chemical group [H]C([*])([H])C([H])=C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 239000000473 propyl gallate Substances 0.000 description 1
- 229940075579 propyl gallate Drugs 0.000 description 1
- 235000010388 propyl gallate Nutrition 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 239000012474 protein marker Substances 0.000 description 1
- 210000001747 pupil Anatomy 0.000 description 1
- 239000013014 purified material Substances 0.000 description 1
- 229940076788 pyruvate Drugs 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000012207 quantitative assay Methods 0.000 description 1
- 238000012113 quantitative test Methods 0.000 description 1
- 238000010814 radioimmunoprecipitation assay Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 210000005084 renal tissue Anatomy 0.000 description 1
- 101150003680 rep-1 gene Proteins 0.000 description 1
- 102000029752 retinol binding Human genes 0.000 description 1
- 108091000053 retinol binding Proteins 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 230000002000 scavenging effect Effects 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 108010079094 short-wavelength opsin Proteins 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 229940054269 sodium pyruvate Drugs 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 235000010199 sorbic acid Nutrition 0.000 description 1
- 229940075582 sorbic acid Drugs 0.000 description 1
- 239000004334 sorbic acid Substances 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 229940044609 sulfur dioxide Drugs 0.000 description 1
- 235000010269 sulphur dioxide Nutrition 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 231100000027 toxicology Toxicity 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000012762 unpaired Student’s t-test Methods 0.000 description 1
- 238000003828 vacuum filtration Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 231100000889 vertigo Toxicity 0.000 description 1
- 230000003945 visual behavior Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0058—Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/0012—Galenical forms characterised by the site of application
- A61K9/0048—Eye, e.g. artificial tears
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/02—Ophthalmic agents
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K2300/00—Mixtures or combinations of active ingredients, wherein at least one active ingredient is fully defined in groups A61K31/00 - A61K41/00
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2799/00—Uses of viruses
- C12N2799/02—Uses of viruses as vector
- C12N2799/021—Uses of viruses as vector for the expression of a heterologous nucleic acid
- C12N2799/022—Uses of viruses as vector for the expression of a heterologous nucleic acid where the vector is derived from an adenovirus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2799/00—Uses of viruses
- C12N2799/02—Uses of viruses as vector
- C12N2799/04—Uses of viruses as vector in vivo
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/106—Plasmid DNA for vertebrates
- C12N2800/107—Plasmid DNA for vertebrates for mammalian
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/002—Vectors comprising a special translation-regulating system controllable or inducible
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/007—Vectors comprising a special translation-regulating system cell or tissue specific
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Biophysics (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Ophthalmology & Optometry (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Virology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Cell Biology (AREA)
- Immunology (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
대상체의 눈 장애를 치료하기 위한 조성물 및 방법이 제공된다. 한 측면으로, CNGA3을 암호화하는 서열을 포함하는 핵산 분자를 포함하는 아데노-관련 바이러스 벡터가 제공된다. 다른 측면으로, CNGB3을 암호화하는 서열을 포함하는 핵산 분자를 포함하는 아데노-관련 바이러스 벡터가 제공된다. 측면으로, REP-1을 암호화하는 서열을 포함하는 핵산 분자를 포함하는 아데노-관련 바이러스 벡터가 제공된다. 바람직한 구체예에서, 대상체는 인간, 고양이, 개, 양 또는 비-인간 영장류이다.
Description
본 발명은 눈 장애에 대한 유전자 요법에 관한 것이다.
전자 형태로 제출된 자료의 참조에 의한 통합
출원인은 전자 형태로 별첨하여 제출된 서열 목록 자료를 참조로 통합한다. 이 파일의 제목은 "16-7660PCT_Seq_Listing_ST25.txt"이다.
범맥락막 위축 (CHM)은 광수용체, 망막 색소 상피 (RPE) 및 맥락막 모세혈관층의 변성을 특징으로 하는 X-결합된 유전성 망막 질환이다. 증상은 생애 중 십대 또는 이십대 안에 불량한 야간 시야 (야맹증) 및 주변 시야의 점진적 상실의 합병증과 함께 나타난다. 이것은 결국 중심 시야 (시력)의 상실 및 생애 중 사십대에 조기 실명으로 끝이 난다. CHM 유전자의 140개 이상의 돌연변이가 범맥락막 위축을 유발하는 것으로 밝혀졌다. 돌연변이는 비정상적으로 작은, 비기능성 및/또는 불안정한 Rab 에스코트(Escort) 단백질-1 (REP-1) 단백질의 생성, 단백질 기능의 감소 또는 REP-1 단백질 생성의 상실을 유발할 수 있다. 정상적인 REP-1의 부족은 세포내 교환을 보조하는 Rab 단백질의 능력을 파괴한다. 세포 내에서 단백질 및 소기관의 고정은 세포가 불량하게 기능하고 시기상조로 사멸하는 것을 유발한다.
범맥락막 위축 유전자, CHM은 막 교환의 조절에 포함된 653개의 아미노산 단백질인 Rab 에스코트 단백질-1 (REP-1)을 암호화한다. CHM 유전자좌가 X-염색체상에 있기 때문에, 범맥락막 위축은 전형적으로 남성에서만 진단된다. 비록 질환의 여성 보균자가 보통은 무증상이긴 하지만, 망막 검사는 때로 망막 및 RPE의 군데군데의 변성을 드러내고 여성 개인은 정상 X 염색체의 X-비활성화 (라이온화(lyonization))정도에 따라 영향을 받을 수 있다. Coussa, RG, Traboulsi, EI (2012) Choroidermia: a review of general findings and pathogenesis, Ophthalmic Genet 33(2):57-65 (본원에 참조로 포함됨). 또한 Vasireddy et al, AAV-mediated gene therapy for Choroidermia: preclinical studies in personalized models. PLoS One. 2013 May 7;8(5):e61396 참조 (본원에 참조로 포함됨).
색맹은 조기에 시작된 시력 감소, 손상된 또는 완전한 색맹, 안구진탕증, 광선 공포증(photoa버전) 및 추상체 광수용체 기능의 상실을 특징으로 하는 상염색체 열성 유전성 망막 질환의 이질적 그룹이다. 색맹 환자의 약 80%가 추상체 광수용체의 cGMP 조절된 양이온 채널 고리형 뉴클레오타이드-게이트 채널 (CNG)의 알파 또는 베타 하위유닛 (A3 및 B3)의 돌연변이를 보인다. 인간 질환과 상동하게, Cnga3 결핍 마우스들은 질병에 걸린 추상체 광수용체의 기능 부전 및 변성을 유발하는 추상체 특이적 기능성의 상실을 나타낸다.
그러므로 인간 대상체에서 CNGA3 또는 CNGB3을 발현하는데 유용한 조성물이 요구된다.
범맥락막 위축 (CHM)은 야맹증 및 주변 시야의 상실을 유발하는 생애의 10대 또는 20대에 증상을 보이는 X-결합된 망막 변성이다. 질환은 중년기를 통해 진행되고, 대부분의 환자가 그때에 실명하게 된다. CHM은 질환이 CHM 유전자에 의해 암호화되는, 망막 세포 건강에 필요한 단백질인 Rab 에스코트 단백질 1 (REP1)의 기능의 상실로 인한 것이기 때문에, 유전자 증대 요법에 대해 선호되는 표적이다. CHM cDNA는 인간 유전자 요법 연구에서 수립된 실적이 있는 재조합 아데노-관련 바이러스 (rAAV)에서 포장될 수 있다. 또한, REP1 활성을, 그것이 Rab27과 같은 Rab 단백질을 프레닐화하고 REP-1 결핍 세포에서 프레닐화의 부족으로 인한 Rab27 정위 및 교환에서의 결함을 보정하는 능력을 포함하여 증명하기 위한 민감하고 정량적인 검정법이 있다.
한 측면으로, Rab 에스코트 단백질-1 (REP-1)을 암호화하는 코돈 최적화된 cDNA 서열이 제공된다. 한 구체예에서, 코돈 최적화된 cDNA 서열은 SEQ ID NO: 3의 변종이다. 다른 구체예에서, 코돈 최적화된 cDNA 서열은 SEQ ID NO: 1의 변종이다. 또 다른 구체예에서, cDNA 서여른 인간에서의 발현을 위해 코돈 최적화된다.
다른 측면으로, 발현 카세트는 REP-1을 암호화하는 코돈 최적화된 핵산 서열을 포함한다. 한 구체예에서, 발현 카세트는 SEQ ID NO: 1의 cDNA 서열을 포함한다. 또 다른 구체예에서, REP-1 암호화 서열은 5'와 3' AAV ITR 서열 사이에 위치한다. 한 구체예에서, 벡터 게놈은 5' ITR 및 3' ITR을 포함하여 그 사이의 모든 핵산 서열을 포함한다.
다른 구체예에서, 아데노-관련 바이러스 (AAV) 벡터가 제공된다. AAV 벡터는 AAV 캡시드 및 AAV 역 말단 반복부 서열을 포함하는 핵산 서열 및 인간 Rab 에스코트 단백질-1 (REP-1)을 암호화하는 핵산 서열, 및 숙주 세포에서 REP-1의 발현을 지시하는 발현 제어 서열을 포함한다. 한 구체예에서, REP-1 서열은 전체 길이 REP-1 단백질을 암호화한다. 한 구체예에서, REP-1 서열은 SEQ ID NO: 2의 단백질 서열이다.
한 측면으로, 고리형 뉴클레오타이드 게이트 채널 알파 3 (CNGA3)을 암호화하는 코돈 최적화된 cDNA 서열이 제공된다. 한 구체예에서, 코돈 최적화된 cDNA 서열은 SEQ ID NO: 13 또는 SEQ ID NO: 15의 변종이다. 다른 구체예에서, 코돈 최적화된 cDNA 서열은 SEQ ID NO: 9 또는 SEQ ID NO: 11이다. 또 다른 구체예에서, cDNA 서열은 인간에서의 발현을 위해 코돈 최적화된다.
다른 측면으로, 발현 카세트는 고리형 뉴클레오타이드 게이트 채널 알파 3 (CNGA3)을 암호화하는 코돈 최적화된 핵산 서열을 포함한다. 한 구체예에서, 발현 카세트는 SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, 또는 SEQ ID NO: 15의 cDNA 서열을 포함한다. 또 다른 구체예에서, CNGA3 암호화 서열은 5'와 3' AAV ITR 서열 사이에 위치한다.
또 다른 측면으로, 발현 카세트는 고리형 뉴클레오타이드 게이트 채널 알파 3 (CNGB3)을 암호화하는 코돈 최적화된 핵산 서열을 포함한다. 한 구체예에서, 발현 카세트는 SEQ ID NO: 19 또는 SEQ ID NO: 21 또는 SEQ ID NO: 23의 cDNA 서열을 포함한다. 또 다른 구체예에서, CNGB3 암호화 서열은 5'와 3' AAV ITR 서열 사이에 위치한다.
또 다른 구체예에서, 아데노-관련 바이러스 (AAV) 벡터가 제공된다. AAV 벡터는 AAV 캡시드 및 AAV 역 말단 반복부 서열을 포함하는 핵산 서열 및 인간 CNGA3을 암호화하는 핵산 서열, 및 숙주 세포에서 CNGA3의 발현을 지시하는 발현 제어 서열을 포함한다. 한 구체예에서, CNGA3 서열은 전체 길이 CNGA3 단백질을 암호화한다. 한 구체예에서, CNGA3 서열은 SEQ ID NO: 10, SEQ ID NO: 12 또는 SEQ ID NO: 14의 단백질 서열이다.
또 다른 구체예에서, 아데노-관련 바이러스 (AAV) 벡터가 제공된다. AAV 벡터는 AAV 캡시드 및 AAV 역 말단 반복부 서열을 포함하는 핵산 서열 및 인간 CNGB3을 암호화하는 핵산 서열, 및 숙주 세포에서 CNGB3의 발현을 지시하는 발현 제어 서열을 포함한다. 한 구체예에서, CNGB3 서열은 전체 길이 CNGB3 단백질을 암호화한다. 한 구체예에서, CNGB3 서열은 SEQ ID NO: 20의 단백질 서열이다.
다른 측면으로, AAV8 캡시드 및 발현 카세트를 포함하는 아데노-관련 바이러스 (AAV) 벡터가 제공되며, 상기 발현 카세트는 REP-1을 암호화하는 핵산 서열, 역 말단 반복부 서열 및 숙주 세포에서 REP-1의 발현을 지시하는 발현 제어 서열을 포함한다.
또 다른 측면으로, AAV8 캡시드 및 발현 카세트를 포함하는 아데노-관련 바이러스 (AAV) 벡터가 제공되며, 상기 발현 카세트는 CNGA3을 암호화하는 핵산 서열, 역 말단 반복부 서열 및 숙주 세포에서 CNGA3의 발현을 지시하는 발현 제어 서열을 포함한다.
또 다른 측면으로, AAV8 캡시드 및 발현 카세트를 포함하는 아데노-관련 바이러스 (AAV) 벡터가 제공되며, 상기 발현 카세트는 CNGB3을 암호화하는 핵산 서열, 역 말단 반복부 서열 및 숙주 세포에서 CNGB3의 발현을 지시하는 발현 제어 서열을 포함한다.
다른 측면으로, AAV2 캡시드 및 발현 카세트를 포함하는 아데노-관련 바이러스 (AAV) 벡터가 제공되며, 상기 발현 카세트는 REP-1을 암호화하는 핵산 서열, 역 말단 반복부 서열 및 숙주 세포에서 REP-1의 발현을 지시하는 발현 제어 서열을 포함한다.
또 다른 측면으로, AAV2 캡시드 및 발현 카세트를 포함하는 아데노-관련 바이러스 (AAV) 벡터가 제공되며, 상기 발현 카세트는 CNGA3을 암호화하는 핵산 서열, 역 말단 반복부 서열 및 숙주 세포에서 CNGA3의 발현을 지시하는 발현 제어 서열을 포함한다.
또 다른 측면으로, AAV2 캡시드 및 발현 카세트를 포함하는 아데노-관련 바이러스 (AAV) 벡터가 제공되며, 상기 발현 카세트는 CNGB3을 암호화하는 핵산 서열, 역 말단 반복부 서열 및 숙주 세포에서 CNGB3의 발현을 지시하는 발현 제어 서열을 포함한다.
다른 측면으로, 제약학적으로 허용되는 담체, 희석제, 부형제 및/또는 보조제 및 적어도 본원에서 기술된 바이러스 벡터를 포함하는 제약학적 조성물이 제공된다.
추가의 측면으로, 제약학적 조성물은 제약학적으로 허용되는 담체, 희석제, 부형제 및/또는 보조제 및 본원에서 구체적으로 기술된 핵산 서열, 플라스미드, 벡터, 또는 바이러스 벡터, 예컨대 rAAV를 포함한다.
다른 측면으로, 범맥락막 위축을 치료하는 방법이 제공된다. 한 구체예에서, 방법은 본원에서 기술된 REP-1을 암호화하는 AAV 벡터를 포함하는 조성물을, 그것을 필요로 하는 대상체에게 투여하는 단계를 포함한다.
또 다른 측면으로, 색맹을 치료하는 방법이 제공된다. 한 구체예에서, 방법은 본원에서 기술된 CNGA3을 암호화하는 AAV 벡터를 포함하는 조성물을, 그것을 필요로 하는 대상체에게 투여하는 단계를 포함한다.
또 다른 측면으로, 색맹을 치료하는 방법이 제공된다. 한 구체예에서, 방법은 본원에서 기술된 CNGB3을 암호화하는 AAV 벡터를 포함하는 조성물을, 그것을 필요로 하는 대상체에게 투여하는 단계를 포함한다.
또 다른 측면으로, AAV 벡터의 제조를 위한 플라스미드가 제공된다. 한 구체예에서, 플라스미드는 본원에서 기술된 REP-1을 암호화하는 코돈 최적화된 cDNA 서열을 포함한다. 다른 구체예에서, 플라스미드는 본원에 기술된 CNGA3을 암호화하는 코돈 최적화된 cDNA 서열을 포함한다. 또 다른 구체예에서, 플라스미드는 SEQ ID NO: 19 또는 SEQ ID NO: 21과 적어도 70%의 동일성을 공유하는 서열인 CNGB3을 암호화하는 코돈 최적화된 cDNA 서열을 포함한다. 한 구체예에서, 플라스미드는 모듈식이다.
다른 측면으로, rAAV 바이러스를 생성하는 방법이 제공된다. 방법은 유전자 발현 카세트 바이러스 게놈을 감염성 AAV 엔벨로프 또는 캡시드 안으로 포장하는 것을 허용하는 충분한 바이러스 서열의 존재하에 본원에서 기술된 플라스미드를 지닌 포장 세포를 배양하는 단계를 포함한다. 다른 측면에서, 그 방법에 따라 제조된 재조합 AAV가 제공된다.
발명의 다른 측면 및 장점들은 이어지는 발명의 상세한 설명으로부터 쉽게 드러날 것이다.
도 1A 및 도 1B는 배양된 84-31 HEK 세포의 트랜스펙션 후에 시험관내에서의 REP-1 단백질 발현을 보여주는 겔이다. 각 겔의 제 1 레인은 플라스미드 p944로부터 발현된, 본원에 기술된 코돈-최적화된 REP-1의 발현을 나타낸다. 제 2 레인은 플라스미드 p742로부터의 천연 REP-1의 발현을 나타낸다. 제 3 레인은 플라스미드로 트랜스펙션되지 않은 84-31 세포에 의한 REP-1의 내인성 발현을 나타낸다. 마지막 레인은 블랭크이다. 겔은 본원에 기술된 코돈-최적화된 REP-1 서열이 REP-1 서열보다 높은 수준의 단백질 발현을 초래하고, 외인성으로 트랜스펙션된 플라스미드로부터의 발현 수준이 내인성 REP-1 발현보다 수-배 더 높은 것을 증명한다.
도 2는 SEQ ID NO: 1의 천연 REP-1 코딩 서열 대비 SEQ ID NO: 3의 코돈 최적화된 REP-1 코딩 서열의 배열을 도시한다.
도 3은 SEQ ID NO: 13의 천연 CNGA3 코딩 서열 대비 SEQ ID NO: 9의 코돈 최적화된 CNGA3 코딩 서열의 배열을 도시한다.
도 4는 CNGB3 천연 ORF (SEQ ID NO: 19) 대비 CNGB3 변형된 ORF (SEQ ID NO: 21) 대비 변형된 단부를 가진 CNGB3 변형된 orf (SEQ ID NO: 23)의 배열을 도시한다. 점 돌연변이가 강조된다.
도 5는 본원에 기술된 p584의 플라스미드 지도를 도시한다. p584의 서열은 SEQ ID NO: 7에 나타낸다.
도 6은 본원에 기술된 AAV.hCHMco.버전 2a의 플라스미드 지도를 도시한다. 버전 2a의 서열은 SEQ ID NO: 25에 나타낸다.
도 7은 본원에 기술된 AAV.hCHMco.버전 2b의 플라스미드 지도를 도시한다. 버전 2b의 서열은 SEQ ID NO: 26에 나타낸다.
도 8은 본원에 기술된 AAV.hCHMco.버전 3a의 플라스미드 지도를 도시한다. 버전 3a의 서열은 SEQ ID NO: 27에 나타낸다.
도 9는 본원에 기술된 AAV.hCHMco.버전 3b의 플라스미드 지도를 도시한다. 버전 3b의 서열은 SEQ ID NO: 28에 나타낸다.
도 10은 본원에 기술된 AAV.hCHM.버전 1의 플라스미드 지도를 도시한다. 버전 1의 서열은 SEQ ID NO: 29에 나타낸다.
도 11은 AAV 생성물 불순물에 대한 람다 삽입물의 효과를 그래프로 도시한다. 모든 a-버전 (람다 함유) 벡터를 qPCR 테스트로부터 훨씬 감소된 Kan+ 신호를 가진다.
도 12A는 5E9 (고용량) 벡터 게놈 복사물의 AAV8.2b로 주입된 CD-1 마우스의 눈 조직에서 ~75 내지 80 kDa의 단백질의 인간 항-REP-1 항체 검출을 보여주는 웨스턴 블롯을 도시한다. 5E8 (저용량)의 AAV8.2b로 주입된 동물들은 ~75 내지 80 kDa에서 매우 희미한 단백질 밴드를 나타냈다. 도 12B는 항-REP-1 항체로 검출된 AAV8.3b 주입된 CD1 (2마리 마우스/그룹)의 눈 조직의 웨스턴 블롯 분석을 도시하는데, 분석은 저용량으로 주입된 한 눈에서 및 고용량의 AAV8.3b로 주입된 양 눈에서 ~75 내지 80 kDa의 단백질의 존재를 나타냈다. 미주입 마우스의 눈 조직에서는 REP-1 발현이 검출되지 않았다.
도 2는 SEQ ID NO: 1의 천연 REP-1 코딩 서열 대비 SEQ ID NO: 3의 코돈 최적화된 REP-1 코딩 서열의 배열을 도시한다.
도 3은 SEQ ID NO: 13의 천연 CNGA3 코딩 서열 대비 SEQ ID NO: 9의 코돈 최적화된 CNGA3 코딩 서열의 배열을 도시한다.
도 4는 CNGB3 천연 ORF (SEQ ID NO: 19) 대비 CNGB3 변형된 ORF (SEQ ID NO: 21) 대비 변형된 단부를 가진 CNGB3 변형된 orf (SEQ ID NO: 23)의 배열을 도시한다. 점 돌연변이가 강조된다.
도 5는 본원에 기술된 p584의 플라스미드 지도를 도시한다. p584의 서열은 SEQ ID NO: 7에 나타낸다.
도 6은 본원에 기술된 AAV.hCHMco.버전 2a의 플라스미드 지도를 도시한다. 버전 2a의 서열은 SEQ ID NO: 25에 나타낸다.
도 7은 본원에 기술된 AAV.hCHMco.버전 2b의 플라스미드 지도를 도시한다. 버전 2b의 서열은 SEQ ID NO: 26에 나타낸다.
도 8은 본원에 기술된 AAV.hCHMco.버전 3a의 플라스미드 지도를 도시한다. 버전 3a의 서열은 SEQ ID NO: 27에 나타낸다.
도 9는 본원에 기술된 AAV.hCHMco.버전 3b의 플라스미드 지도를 도시한다. 버전 3b의 서열은 SEQ ID NO: 28에 나타낸다.
도 10은 본원에 기술된 AAV.hCHM.버전 1의 플라스미드 지도를 도시한다. 버전 1의 서열은 SEQ ID NO: 29에 나타낸다.
도 11은 AAV 생성물 불순물에 대한 람다 삽입물의 효과를 그래프로 도시한다. 모든 a-버전 (람다 함유) 벡터를 qPCR 테스트로부터 훨씬 감소된 Kan+ 신호를 가진다.
도 12A는 5E9 (고용량) 벡터 게놈 복사물의 AAV8.2b로 주입된 CD-1 마우스의 눈 조직에서 ~75 내지 80 kDa의 단백질의 인간 항-REP-1 항체 검출을 보여주는 웨스턴 블롯을 도시한다. 5E8 (저용량)의 AAV8.2b로 주입된 동물들은 ~75 내지 80 kDa에서 매우 희미한 단백질 밴드를 나타냈다. 도 12B는 항-REP-1 항체로 검출된 AAV8.3b 주입된 CD1 (2마리 마우스/그룹)의 눈 조직의 웨스턴 블롯 분석을 도시하는데, 분석은 저용량으로 주입된 한 눈에서 및 고용량의 AAV8.3b로 주입된 양 눈에서 ~75 내지 80 kDa의 단백질의 존재를 나타냈다. 미주입 마우스의 눈 조직에서는 REP-1 발현이 검출되지 않았다.
본원에 기술된 방법 및 조성물은 눈의 장애, 주로 범맥락막 위축과 같은, 실명에 이르는 질환의 치료를 위해 포유류 대상체에게 REP-1을 암호화하는 최적화된 CHM을 전달하기 위한 조성물 및 방법을 포함한다. 또한, 본원에 기술된 방법 및 조성물은 눈의 장애, 주로 색맹과 같은 실명에 이르는 질환의 치료를 위해 포유류 대상체에게 최적화된 CNGA3 또는 CNGB3을 전달하기 위한 조성물 및 방법을 포함한다. 한 구체예에서, 그러한 조성물은 REP-1, CNGA3 또는 CNGB3 코딩 서열의 코돈 최적화를 포함한다. 이 특징들은 생성물의 효능을 증가시키고, 저용량의 시약이 사용되기 때문에, 안전성을 증가시킨다. 도입유전자 카세트의 이런 최적화는 내인성 서열을 사용하여 생성될 수 있는 수준과 비교하여 실험 단백질의 생성 수준을 이론적으로는 최대화시킬 수 있을 것으로 예상된다. 그러나, 또한 본원에는 SEQ ID NO: 3, SEQ ID NO: 13 및 SEQ ID NO: 19에서 각각 나타난 것과 같은 천연 REP1, CNGA3, 및 CNGB3 코딩 서열을 포함하는 조성물이 포함된다. 구체예가 REP-1, CNGA3 또는 CNGB3 중 어느 하나에 대해 기술될 때 유사한 구체예는 다른 것에 인용될 것으로 의도된다는 것이 인지되어야 한다.
본원에서 사용된 기술적이고 과학적인 용어들은 본 발명이 속하는 기술분야의 숙련자에 의해 통상적으로 이해되는 것과 같은 의미를 가지며, 공개된 텍스트를 참조로, 기술분야의 숙련자에게 본 출원에서 사용되는 많은 용어들에 대한 일반적인 가이드를 제공한다. 본 명세서에 포함된 정의는 본원의 성분 및 조성물을 기술함에 있어 명료함을 위해 제공되며 청구된 발명을 제한하려는 의도는 아니다.
범맥락막 위축 유전자, CHM는 막 교환에 포함된 것으로 여겨지는 653개의 아미노산 단백질인 Rab 에스코트 단백질-1 (REP-1)을 암호화한다. 본원에서 사용되는 용어 "REP-1" 및 "CHM"은 코딩 서열을 언급할 때에는 상호교환적으로 사용된다. CHM 유전자좌가 X-염색체 상에 있기 때문에, 범맥락막 위축은 전형적으로 남성에서만 진단된다. 비록 질환의 여성 보균자는 보통 무증상이긴 하지만, 망막 검사는 때로 망막 및 RPE의 군데군데의 변성을 드러내고 여성 개인은 정상 X 염색체의 X-비활성화 (라이온화)정도에 따라 영향을 받을 수 있다. 상기 인용된 Coussa 참조. 인간 REP-1을 암호화하는 천연 아미노산 서열은 GenBank 승인 번호 P24386으로 기록되고, 본원에서는 SEQ ID NO: 2로 재생된다. CHM의 천연 인간 핵산 서열은 본원에서 SEQ ID NO: 3 (승인 번호 NM_000390.2)으로 재생된다.
고리형 뉴클레오타이드-게이트 (CNG) 이온 채널은 망막 및 후각 수용체에서 신호 변환 기저에 있는 핵심 매개체이다. 추상체 CNG 채널의 2개의 구조적으로 관련된 하위유닛을 암호화하는, CNGA3 및 CNGB3의 유전적 결함은 색맹을 유발하는 것으로 알려져 있다. CNGA3은 694개의 아미노산 단백질이다. CNGB는 809개의 아미노산 단백질이다.
색맹은 조기에 시작된 추상체 광수용체 기능부전, 심각하게 감소된 시력, 손상된 또는 완전한 색맹 및 광선공포증을 나타내는 선천성, 상염색체 열성 망막 장애의 이질적 그룹이다. 인간 CNGA3을 암호화하는 천연 핵산 서열은 GenBank 승인 번호 XM_011210554.1로 기록되고, SEQ ID NO: 13으로 재생된다. 인간 CNGA3을 암호화하는 천연 핵산 서열은 GenBank 승인 번호 XM_011210554.1로 기록되고, SEQ ID NO: 13으로 재생된다. 추가의 엑손을 포함하는, 인간 CNGA3 X1 변종에 대한 천연 핵산 서열은 GenBank 승인 번호 NM_001298.2로 기록되고, SEQ ID NO: 15로 재생된다. 인간 CNGB3을 암호화하는 천연 핵산 서열은 SEQ ID NO: 19로 재생된다.
본 발명의 특정 구체예에서, 대상체는 그것의 치료를 위해 본 발명의 성분, 조성물 및 방법이 디자인되는 "눈 장애"를 가진다. 본원에서 사용되는 용어 "대상체"는 본원에서 포유류 동물, 이를테면 인간, 수의학적 또는 사육 동물, 가축 또는 애완동물, 및 임상 연구를 위해 정상적으로 사용된 동물을 의미한다. 한 구체예에서, 이 방법 및 조성물들의 대상체는 인간이다. 또 다른 적합한 대상체는, 제한 없이, 쥐과, 래트, 개, 고양이, 돼지, 소, 양, 비-인간 영장류 등이다. 본원에서 사용되는 용어 "대상체"는 "환자"와 상호교환적으로 사용된다.
본원에서 사용되는 "눈 장애"는 추상체-간상체 이영양증 및 망막 질환, 이를테면 제한 없이, 스타트가르트병 (상염색체 우성 또는 상염색체 열성), 색소성 망막염, 무늬 이상증을 포함한다. 한 구체예에서, 대생체는 색맹을 가진다. 다른 구체예에서, 대상체는 범맥락막 위축 또는 X-결합 유전성 망막 변성을 가진다. 그러한 눈 질환의 임상적 신호는, 한정하는 것은 아니지만, 감소된 주변 시야, 감소된 중심 (독서) 시야, 감소된 야간 시야, 색 지각의 상실, 시력의 감소, 감소된 광수용체 기능, 색소 변화 및 궁극적으로 실명을 포함한다.
본원에서 사용되는 용어 "치료" 또는 "치료하는"는 대상체에게 하나 이상의 눈 질환 증상의 개선을 목적으로 본원에 기술된 하나 이상의 화합물 또는 조성물을 투여하는 것을 포함하는 것으로 정의된다. 그러므로 "치료"는 주어진 대상체의 눈 질환의 시작 또는 진행의 감소, 질환의 예방, 질환 증상의 심각성의 감소, 또는 실명의 진행을 포함하여 그것들의 진행의 지연, 질환 증상의 제거, 질환의 시작의 지연 또는 질환의 진행 또는 치료법의 효능의 모니터링 중 하나 이상을 포함할 수 있다.
핵산 서열 또는 단백질을 기술하기 위해 사용된 용어 "외인성"은 핵산 또는 단백질이 그것이 염색체, 또는 숙주 세포에 존재하는 위치에서 자연적으로 발생하지 않는 것을 의미한다. 외인성 핵산 서열은 또한 동일한 숙주 세포 또는 대상체로부터 유래되고 삽입되지만, 비-천연 상태, 예컨대 상이한 복사물 수로 존재하거나, 상이한 조절 요소의 제어 하에 있는 서열을 나타낸다.
핵산 서열 또는 단백질을 기술하기 위해 사용된 용어 "이종성"은 핵산 또는 단백질이 그것이 발현되는 숙주 세포 또는 대상체보다는 상이한 유기체로부터 또는 동일한 유기체의 상이한 종으로부터 유래되는 것을 의미한다. 용어 "이종성"은 플라스미드, 발현 카세트 또는 벡터의 단백질 또는 핵산을 참조로 사용될 때, 단백질 또는 핵산이 문제의 그 단백질 또는 핵산이 자연적으로 서로 동일한 관계에서 발견되지 않는 또 다른 서열 또는 하위서열과 함께 존재하는 것을 가리킨다.
용어 "퍼센트 (%) 동일성", "서열 동일성", "퍼센트 서열 동일성" 또는 "동일한 퍼센트"는 핵산 서열의 맥락에서 상응성을 위해 배열될 때 동일한 두 서열의 염기를 나타낸다. 퍼센트 동일성은 비교될 서열에 걸쳐 최적의 조건 하에서 배열된 두 서열을 비교함으로써 측정된다. 서열 동일성 비교의 길이는 REP-1, CNGA3 또는 CNGB3 코딩 서열의 전체 길이에 걸쳐 있거나, 또는 적어도 약 100 내지 150개의 뉴클레오타이드의 단편, 또는 원하는 대로일 수 있다. 그러나, 예컨대 적어도 약 9개의 뉴클레오타이드, 보통 적어도 약 20 내지 24개의 뉴클레오타이드, 적어도 약 28 내지 32개의 뉴클레오타이드, 적어도 약 36개 이상의 뉴클레오타이드의 더 작은 단편들 사이의 동일성이 또한 바람직할 수 있다. 다중 서열 배열 그로프갬 또한 핵산 서열에 대해 이용할 수 있다. 그러한 프로그램의 예로는 "Clustal W", "CAP 서열 어셈블리", "BLAST", "MAP" 및 "MEME"을 포함하고, 그것들은 인터넷 상에서 웹 서버를 통해 접근 가능하다. 그런 프로그램들에 대한 다른 공급원은 기술분야의 숙련자들에게 알려져 있다. 다르게는, 벡터 NTI 유틸리티가 또한 사용된다. 기술분야에는 상기 기술된 프로그램들에 함유된 것들을 포함하여, 뉴클레오타이드 서열 동일성을 측정하기 위해 사용될 수 있는 많은 알고리즘이 알려져 있다. 다른 예로서, 폴리뉴클레오타이드 서열은 GCG 버전 6.1의 프로그램인 FastaTM을 사용하여 비교될 수 있다. 흔하게 이용할 수 있는 서열 분석 소프트웨어, 보다 구체적으로, BLAST 또는 공공 데이터베이스에 의해 제공된 분석 도구가 또한 사용될 수 있다.
용어 "분리된"은 물질이 그것의 원래의 환경 (예컨대 자연적으로 발생한 것이라면 자연 환경)으로부터 제거된 것을 의미한다. 예를 들어, 살아있는 동물에 존재하는 자연적으로 발생하는 폴리뉴클레오타이드 또는 폴리펩타이드는 분리되지 않지만, 자연계에서 공존하는 물질의 일부 또는 전부로부터 분리된 동일한 폴리뉴클레오타이드 또는 폴리펩타이드는, 계속해서 자연계로 재도입된다 하더라도 분리된다. 그러한 폴리뉴클레오타이드는 벡터의 일부가 되거나 및/또는 그러한 폴리뉴클레오타이드 또는 폴리펩타이드는 조성물의 일부가 될 수 있고, 그러한 벡터 또는 조성물이 그것의 자연적 환경의 일부가 아니라는 점에서 분리될 수 있다.
"엔지니어링된"은 본원에 기술된 REP-1 또는 CNGA3 또는 CNGB3 단백질을 암호화하는 핵산 서열이 조립되고, 예컨대 비-바이러스 전달 시스템 (예컨대 RNA-기반 시스템, 네이키드 DNA 등)을 생성하기 위해 또는 포장 숙주 세포에서 바이러스 벡터를 생성하거나 및/또는 대상체의 숙주 세포에의 전달을 위해 그 위에 담긴 EP-1 또는 CNGA3 또는 CNGB3 서열을 숙주 세포에 전달하는, 임의의 적합한 유전자 요소, 예컨대 네이키드 DNA, 파지, 트랜스포존, 코스미드, 에피좀 등에 놓이는 것을 의미한다. 한 구체예에서, 유전자 요소는 플라스미드이다. 그러한 엔지니어링된 구성물을 제조하기 위해 사용된 방법은 핵산 조작에 능숙한 사람들에게 알려져 있고 유전자 엔지니어링, 재조합 엔지니어링 및 합성 기법들을 포함한다. 예컨대 Green and Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY (2012) 참조.
본원에서 사용된 용어 "도입유전자"는 발현 카세트, rAAV 게놈, 재조합 플라스미드 또는 제조 플라스미드, 벡터, 또는 본 명세서에서 기술된 숙주 세포에서 프로모터 또는 발현 제어 서열의 제어 하에 있는 외인성 또는 엔지니어링된 단백질-암호화 핵산 서열을 의미한다. 특정 구체예에서, 도입유전자는 기능성 REP-1 단백질을 암호화하는 인간 CHM (REP-1) 서열이다. 일부 구체예에서, 도입유전자는 SEQ ID NO: 2에 나타낸 EP-1 아미노산 서열을 암호화하는 코돈 최적화된 핵산 CHM (REP-1)이다. 특정 구체예에서, 도입유전자는 SEQ ID NO: 1에 나타낸 서열에 의해 암호화된다. 특정 구체예에서, REP-1 도입유전자는 SEQ ID NO: 5에 나타낸 서열에 의해 암호화된다. SEQ ID NO: 5는 변형된 단부를 포함하는데, 그것은 플라스미드, 예컨대 본원에서 기술된 제조 플라스미드 안으로 클로닝하기 위한 제한 부위들을 포함한다.
특정 구체예에서, 도입유전자는 기능성 CNGA3 단백질을 암호화하는 인간 CNGA3 서열이다. 특정 구체예에서, 도입유전자는 코돈 최적화된 CNGA3 암호화 서열 SEQ ID NO: 10이다. 특정 구체예에서, 도입유전자는 SEQ ID NO: 9에 나타낸 서열에 의해 암호화된다. 한 구체예에서, 도입유전자는 플라스미드, 예컨대 본원에서 기술된 플라스미드 안으로 클로닝하기 위한 제한 부위들을 포함하는, SEQ ID NO: 16, SEQ IDNO 17 또는 SEQ ID NO: 18에 나타낸 것과 같은 변형된 단부를 포함한다. 특정 구체예에서, 도입유전자는 코돈 최적화된 CNGA3 암호화 서열 SEQ ID NO: 12이다. 특정 구체예에서, 도입유전자는 SEQ ID NO: 11에 나타낸 서열에 의해 암호화된다. 특정 구체예에서, 도입유전자는 SEQ ID NO: 13에 나타낸, CNGA3의 천연 코딩 서열에 의해 암호화된다.
특정 구체예에서, 도입유전자는 기능성 CNGB3 단백질을 암호화하는 인간 CNGB3 서열이다. 특정 구체예에서, 도입유전자는 SEQ ID NO: 19 또는 21과 적어도 70%의 동일성을 공유하는 서열인 코돈 최적화된 CNGB3 암호화 서열이다. 특정 구체예에서, 도입유전자는 SEQ ID NO: 23에 의해 나타낸 서열에 의해 암호화된다. SEQ ID NO: 23은 플라스미드, 예컨대 본원에서 기술된 제조 플라스미드 안으로 클로닝하기 위한 제한 부위들을 포함하는 변형된 단부를 포함한다. SEQ ID NO: 23의 뉴클레오타이드 13 내지 2448은 CNGB3에 대한 ORF를 제공한다. 특정 구체예에서, 도입유전자는 코돈 최적화된 CNGB3 암호화 서열 SEQ ID NO: 20이다. 특정 구체예에서, 도입유전자는 SEQ ID NO: 19에 의해 나타낸 서열에 의해 암호화된다. 특정 구체예에서, 도입유전자는 SEQ ID NO: 21에 의해 나타낸 서열에 의해 암호화된다. 특정 구체예에서, 도입유전자는 플라스미드, 예컨대 본원에서 기술된 플라스미드 안으로 클로닝하기 위한 변형된 단부를 포함한다. SEQ ID NO: 21은 천연 코딩 서열에 대해 특정 침묵 돌연변이가 만들어져 있는 신규한 cDNA 서열이다. 본원에서 기술되는, 천연 서열에 대한 추가의 변형들이 발명에 의해 포함된다.
한 구체예에서, REP-1, CNGA 또는 CNGB를 암호화하는 핵산 서열은 추가로 그것에 공유 결합된 태그 폴리펩타이드를 암호화하는 핵산을 포함한다. 태그 폴리펩타이드는 제한 없이, myc 태그 폴리펩타이드, 글루타티온-S-트란스페라제 태그 폴리펩타이드, 녹색 형광 단백질 태그 폴리펩타이드, myc-피루베이트 키나아제 태그 폴리펩타이드, His6 태그 폴리펩타이드, 인플루엔자 바이러스 헤마글루티닌 태그 폴리펩타이드, 플래그(flag) 태그 폴리펩타이드, 및 말토오스 결합 단백질 태그 폴리펩타이드를 포함하여, 공지된 "에피토프 태그"로부터 선택될 수 있다.
본원에서 사용된 "벡터"는 외인성 또는 이종성 또는 엔지니어링된 핵산 도입유전자가 삽입된 후 적절한 숙주 세포로 도입될 수 있는 핵산 분자이다. 벡터는 바람직하게 하나 이상의 복제 기원, 및 재조합 DNA가 삽입될 수 있는 하나 이상의 부위를 가진다. 벡터는 자주 벡터를 가진 세포가 벡터가 없는 세포로부터 선택될 수 있는 편리한 수단을 가지는데, 예컨대 벡터는 약물 내성 유전자를 암호화한다. 통상적인 벡터는 플라스미드, 바이러스 게놈, 및 (주로 효모 및 박테리아에서) "인공 염색체"를 포함한다. 특정 플라스미드는 본원에서 기술된다.
"바이러스 벡터"는 외인성 또는 이종성 CHM (REP-1) 또는 CNGA3 또는 CNGB3 핵산 도입유전자(들)를 함유하는 복제 결핍 바이러스로서 규정된다. 한 구체예에서, 본원에서 기술된 발현 카세트는 약물 전달 또는 바이러스 벡터의 제조를 위해 사용된 플라스미드 위에서 엔지니어링될 수 있다. 적합한 바이러스 벡터는 바람직하게는 복제 결핍성이고 눈 세포를 표적으로 하는 것들 중에서 선택된다. 바이러스 벡터는 한정하는 것은 아니지만 아데노바이러스; 헤르페스 바이러스; 렌티바이러스; 레트로바이러스; 파르보바이러스 등을 포함하여, 유전자 요법에 적합한 임의의 바이러스를 포함할 수 있다. 그러나, 이해를 쉽게 하기 위해, 본원에서 아데노-관련 바이러스가 예시의 바이러스 벡터로서 참조된다.
"복제-결핍 바이러스" 또는 "바이러스 벡터"는 관심의 유전자를 함유한 발현 카세트가 바이러스 캡시드 또는 엔벨로프에 포장되는 합성 또는 재조합 바이러스 입자를 나타내고고, 이때 또한 바이러스 캡시드 또는 엔벨로프 내에 포장된 임의의 바이러스 게놈 서열은 복제-결핍성이다; 즉 그것들은 자손 비리온을 생성할 수 없지만 표적 세포를 감염시키는 능력을 보유한다. 한 구체예에서, 바이러스 벡터의 게놈은 복제에 필요한 효소들을 암호화하는 유전자를 포함하지 않지만 (게놈은 "거트리스(gutless)"가 되도록 엔지니어링될 수 있다 - 인공 게놈의 증폭 및 포장에 필요한 신호들이 양 옆에 있는 관심의 도입유전자를 함유함), 이 유전자들은 제조 중에 공급될 수 있다. 그러므로, 자손 비리온에 의한 복제 및 감염은 복제에 필요한 바이러스 효소의 존재하에 있는 것을 제외하고 일어날 수 없기 때문에 유전자 요법에 사용하기에 안전한 것으로 보인다.
또 다른 구체예에서, 본원에서 기술된 것들 중 임의의 것을 포함하는 발현 카세트가 재조합 AAV 게놈을 생성하기 위해 사용된다.
본원에서 사용되는 용어 "숙주 세포"는 재조합 AAV가 제조 플라스미드로부터 제조되는 포장 세포주를 나타낼 수 있다. 다르게는, 용어 "숙주 세포"는 도입유전자의 발현이 바람직한 임의의 표적 세포를 나타낼 수 있다. 그러므로, "숙주 세포"는 임의의 수단, 예컨대 전기천공법, 인산칼슘 침전법, 마이크로주입, 형질전환, 바이러스 감염, 트랜스펙션, 리포좀 전달, 막융합 기법, 고속 DNA-코팅된 펠릿, 바이러스 감염 및 원형질 융합에 의해 세포 안으로 도입된 외인성 또는 이종성 DNA를 함유하는 원핵 또는 진핵 세포를 나타낸다.
본원의 특정 구체예에서, 용어 "숙주 세포"는 본원에 기술된 조성물의 시험관내 평가를 위한 다양한 포유류 종의 눈 세포의 배양물을 나타낸다. 본원의 다른 구체예에서, 용어 "숙주 세포"는 바이러스 벡터 또는 재조합 바이러스를 생성하고 포장하기 위해 사용된 세포를 나타낸다. 다른 구체예에서, 용어 "숙주 세포"는 눈 질환에 대해 생체내에서 치료되는 대상체의 눈 세포를 참조하기 위한 것으로 의도된다.
본원에서 용어 "눈 세포"는 눈의 임의의 세포, 또는 눈의 기능과 관련된 임의의 세포를 나타낸다. 용어는 간상체 광수용체, 추상체 광수용체 및 감광성 신경절 세포, 망막 색소 상피 (RPE) 세포, 뮐러 세포, 맥락막 세포, 양극성 세포, 수평 세포 및 무축삭 세포를 포함하여, 광수용체 세포 중 임의의 것을 나타낼 수 있다. 한 구체예에서, 눈 세포는 광수용체 세포이다. 다른 구체예에서, 눈 세포는 RPE 세포이다.
"플라스미드"는 일반적으로 본원에서 기술분야의 숙련자들에게 친숙한 표준 명명 관례에 따라, 소문자 p가 앞에 있고 및/또는 이어서 대문자 및/또는 번호로 본원에서 지정된다. 본 발명에 따라 사용될 수 있는 많은 플라스미드 및 다른 클로닝 및 발현 벡터들이 잘 알려져 있고 기술분야의 숙련자들에게 쉽게 이용될 수 있다. 더욱이, 숙련자들은 본 발명에 사용하기에 적합한 임의의 수의 다른 플라스미드를 쉽게 구성할 수 있다. 본 발명에서 그러한 플라스미드, 뿐만 아니라 다른 벡터의 특성, 구성 및 사용은 본 개시로부터 숙련자들에게 쉽게 드러날 것이다.
본원에서 사용되는 용어 "전사 제어 서열" 또는 "발현 제어 서열"은 그것들이 작동 가능하게 연결된 단백질 암호화 핵산 서열의 전사를 유도, 억제 또는 그렇지 않으면 제어하는 DNA 서열, 예컨대 개시자 서열, 인핸서 서열 및 프로모터 서열을 나타낸다.
본원에서 사용되는 용어 "작동 가능하게 연결된" 또는 "작동 가능하게 결합된"은 둘 다 REP-1 또는 CNGA3을 암호화하는 핵산 서열 및/또는 그것의 전사 및 발현을 제어하기 위하여 트란스로 또는 떨어져서 작용하는 발현 제어 서열과 연속적인 발현 제어 서열을 나타낸다.
본원에서 사용된 용어 "AAV" 또는 "AAV 혈청형"은 수십 개의 자연적으로 발생하는 및 이용 가능한 아데노-관련 바이러스, 뿐만 아니라 인공 AAV를 나타낸다. 인간 또는 비-인간 영장류 (NHP)로부터 분리되거나 엔지니어링되고 특성화가 잘 되어 있는 AAV 중에서, 인간 AAV2가 유전자 전달 벡터로서 개발된 첫 번째 AAV이다; 그것은 상이한 표적 조직 및 동물 모델에서 효과적인 유전자 전달 실험을 위해 광범위하게 사용되었다. 다르게 명시되지 않는 한, AAV 캡시드, ITR, 및 본원에서 기술된 다른 선택된 AAV 성분들은, 제한 없이, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV8bp, AAV7M8 및 AAVAnc80, 공지된 또는 언급된 AAV의 변종 또는 아직 발견되지 않은 AAV 또는 그것들의 변종 또는 혼합물을 포함하여, 임의의 AAV로부터 쉽게 선택될 수 있다. 예컨대 WO 2005/033321 (본원에 참조로 포함됨) 참조. 다른 구체예에서, AAV 캡시드는 우선적으로 양극서 세포를 표적으로 하는 AAV8bp 캡시드이다. WO 2014/024282 (본원에 참조로 포함됨) 참조. 다른 구체예에서, AAV 캡시드는 외망막에 우선적으로 전달되는 것으로 나타난 AAV7m8 캡시드이다. Dalkara et al, In Vivo-Directed Evolution of a New Adeno-Associated Virus for Therapeutic Outer Retinal Gene Delivery from the Vitreous, Sci Transl Med 5, 189ra76 (2013) (본원에 참조로 포함됨) 참조. 한 구체예에서, AAV 캡시드는 AAV8 캡시드이다. 다른 구체예에서, AAV 캡시드는 AAV9 캡시드이다. 또 다른 구체예에서, AAV 캡시드는 AAV5 캡시드이다. 또 다른 구체예에서, AAV 캡시드는 AAV2 캡시드이다.
AAV와 관련하여, 본원에서 사용된 용어 변종은 아미노산 또는 핵산 서열에 걸쳐 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 99% 또는 그 이상의 서열 동일성을 공유하는 것들을 포함하여, 공지된 AAV 서열로부터 유래된 임의의 AAV 서열을 의미한다. 다른 구체에에서, AAV 캡시드는 임의의 기술된 또는 공지된 AAV 캡시드 서열로부터 최대 약 10% 편차를 포함할 수 있는 변종을 포함한다. 즉, AAV 캡시드는 본원에 제공된 및/또는 기술분야에 공지된 AAV 캡시드에 대해 약 90% 동일성 내지 약 99.9% 동일성, 약 95% 내지 약 99% 동일성 또는 약 97% 내지 약 97% 동일성을 공유한다. 한 구체예에서, AAV 캡시드는 AAV 캡사드와 적어도 95%의 동일성을 공유한다. AAV 캡시드의 퍼센트 동일성을 측정할 때, 비교는 가변 단백질 (예컨대 vp1, vp2, 또는 vp3)의 어느 것에 대해 이루어질 수 있다. 한 구체예에서, AAV 캡시드는 AAV8 vp3과 적어도 95%의 동일성을 공유한다. 다른 구체예에서, 자체-상보성 AAV가 사용된다.
ITR 또는 다른 AAV 성분은 기술분야의 숙련자들이 입수 가능한 기법들을 사용하여 AAV로부터 쉽게 분리되거나 엔지니어링될 수 있다. 그러한 AAV는 학구적, 상업적 또는 공공연한 공급원 (예컨대 아메리칸 타입 컬춰 콜렉션, Manassas, VA)으로부터 분리되거나, 엔지니어링되거나 또는 얻어질 수 있다. 다르게는, AAV 서열은 합성 또는 다른 적합한 수단을 통해 문헌에서 또는 예컨대 GenBank, PubMed, 등과 같은 데이터베이스에서 입수 가능한 것과 같은 공개된 서열을 참조로 하여 엔지니어링될 수 있다. AAV 바이러스는 종래의 분자 생물학 기법에 의해 엔지니어링될 수 있어서, 핵산 서열의 세포 특이적 전달을 위해, 면역원성을 최소화하기 위해, 안정성 및 입자 수명을 조율하기 위해, 효과적인 분해를 위해, 핵으로의 정확한 전달을 위해서, 등에 이 입자들을 최적의 상태로 만다는 것이 가능하다.
본원에서 사용된 "인공 AAV"는, 제한 없이 자연적으로 발생하지 않는 캡시드 단백질을 가진 AAV를 의미한다. 그러한 인공 캡시드는 임의의 적합한 기법에 의하여, 선택된 AAV 서열 (예컨대 vp1 캡시드 단백질의 단편)을 상이한 선택된 AAV, 동일한 AAV의 비-연속성 부분, 비-AAV 바이러스 공급원 또는 비-바이러스 공급원으로부터 얻어질 수 있는 이종성 서열과 조합하여 사용하여 생성될 수 있다. 인공 AAV는, 제한 없이, 위형 (pseudotyped) AAV, 키메라 AAV 캡시드, 재조합 AAV 캡시드, 또는 "인간화된" AAV 캡시드일 수 있다. 한 AAV의 캡시드가 이종성 캡시드 단백질로 대체되어 있는 위형 벡터는 본 발명에 유용하다. 한 구체예에서, AAV2/5 및 AAV2/8이 예시의 위형 벡터이다.
"자체-상보성 AAV"는 재조합 AAV 핵산 서열에 의해 지니게 된 코딩 영역이 분자내 이중-가닥 DNA 주형을 형성하기 위해 디자인되어 있는 발현 카세트를 가지는 플라스미드 또는 벡터를 나타낸다. 감염시, 제 2 가닥의 세포 매개된 합성을 기다리기보다는 scAAV의 두 상보성 절반은 회합하여 즉각적인 복제 및 전사의 준비가 된 하나의 이중 가닥 DNA (dsDNA) 유닛을 형성할 것이다. 예컨대 D M McCarty et al, "Self-complementary recombinant aden-associated virus (scAAV) vectors promote efficient transduction independently of DNA synthesis", Gene Therapy, (August 2001), Vol 8, Number 16, Pages 1248-1254 참조. 자체-조립성 AAV는 예컨대 미국 특허 번호 6,596,535; 7,125,717; 및 7,456,683에서 기술되고, 이것들은 각각 본원에 그 전문이 참조로 포함된다.
방법에 사용된 "투여하는"은 눈 질환을 특징으로 하는 선택된 표적 세포에 조성물을 전달하는 것을 의미한다. 한 구체예에서, 방법은 RPE, 광수용체 세포 또는 다른 눈 세포에 망막밑 주입에 의해 조성물을 전달하는 것을 포함한다. 다른 구체예에서, 눈 세포에 대한 유리체강내 주입이 사용된다. 또 다른 방법에서, 안검 정맥을 통해 눈 세포에의 주입이 사용될 수 있다. 또 다른 투여 방법은 본 개시에서 기술분야의 숙련자에 의해 선택될 수 있다. "투여하는" 또는 "투여 경로"에 의해 제약학적 담체 또는 부형제와 함께 또는 그것들 없이, 본원에 기술된 조성물이 대상체에 전달된다. 투여 경로는 필요에 따라 조합될 수 있다. 일부 구체예에서, 투여는 주기적으로 반복된다. 본원에 기술된 제약학적 조성물은 임의의 적합한 경로 또는 상이한 경로들의 조합에 의해 그것을 필요로 하는 대상체에의 전달을 위해 디자인된다. 눈으로의 직접 전달 (선택적으로 눈 전달, 망막밑 주입, 망막내 주입, 유리체강내, 국소적 경로를 통해), 또는 전신성 경로를 통한 전달, 예컨대 동맥내, 안내 (intra ocular), 정맥내, 근육내, 피하, 피내, 및 다른 비경구 투여 경로. 본원에 기술된 핵산 분자 및/또는 벡터는 단일 조성물로 또는 다중 조성물로 전달될 수 있다. 선택적으로, 둘 이상의 상이한 AAV가 전달되거나, 또는 다중 바이러스가 전달될 수 있다 [예컨대 WO20 2011/126808 및 WO 2013/049493 참조]. 다른 구체예에서, 다중 바이러스는 상이한 복제-결핍 바이러스 (예컨대 AAV 및 아데노바이러스)를 단독으로 또는 단백질과 조합하여 함유할 수 있다.
본원에 기술된 특정 조성물은 REP-1 또는 CNGA3 또는 CNGB3을 암호화하는 신규한 코돈-최적화된 서열을 제공하는 분리된, 또는 합성적으로 또는 재조합적으로 엔지니어링된 핵산 서열이다. 한 구체예에서, 인간 REP-1을 암호화하는 분리된 또는 엔지니어링된 코돈 최적화된 핵산 서열이 제공된다. 한 구체예에서, 코돈-최적화된 서열은 SEQ ID NO: 1이다. 다른 구체예에서, 코돈 최적화된 서열은 클로닝을 위한 N-말단 및 C-말단 제한 부위를 포함한다. 한 구체예에서, 예컨대 SEQ ID NO: 5에서 개시된 REP-1 코딩 서열은 Kozak 공통 서열에 더불어 N-말단 NotI 제한 부위 및 C-말단 BamHI 제한 부위를 포함한다. 또한, 코돈 최적화된 서열은, 일부 구체예에서, 마커, 예컨대 에피토프 태그의 첨가를 허용하기 위해 하나 이상의 추가의 제한 부위를 포함한다. 천연 핵산 서열과 배열될 때, 코돈 최적화된 REP-1은 임의 범위들 사이의 임의의 정수를 포함하여, 적어도 50%, 또는 적어도 60%, 또는 적어도 70%, 또는 적어도 80% 또는 적어도 90%의 퍼센트 동일성을 가질 수 있다. 한 구체예에서, 코돈 최적화된 REP-1은 적어도 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 천연 서열과의 퍼센트 동일성을 가진다. 한 구체예에서, 천연 핵산 서열 SEQ ID NO: 3과 배열될 때, 코돈 최적화된 REP-1 (SEQ ID NO: 1)은 단지 74%의 퍼센트 서열 동일성을 가지는 것으로 나타난다 (도 2 참조).
다른 구체예에서, 인간 CNGA3을 암호화하는 분리된 또는 엔지니어링된 코돈 최적화된 핵산 서열이 제공된다. 한 구체예에서, 코돈-최적화된 서열은 SEQ ID NO: 9이다. 한 구체예에서, 코돈-최적화된 서열은 SEQ ID NO: 11에 나타낸 CNGA3 변종이다. 다른 구체예에서, 코돈 최적화된 서열은 클로닝을 위한 N-말단 및 C-말단 제한 부위를 포함한다. 한 구체예에서, CNGA3 코딩 서열은 Kozak 공통 서열에 더불어, N-말단 NotI 제한 부위 및 C-말단 BglII 제한 부위를 포함한다. 그러한 변형을 포함하는 CNGA3 서열의 예는 SEQ ID NO: 16, SEQ ID NO: 17 및 SEQ ID NO: 18에서 찾을 수 있다. 또한, 코돈 최적화된 서열은, 일부 구체예에서, 마커, 예컨대 에피토프 태그의 첨가를 허용하기 위해 하나 이상의 추가의 제한 부위를 포함한다. 천연 핵산 서열과 배열될 때, 코돈 최적화된 CNGA3은 임의의 범위들 사이의 임의의 정수를 포함하여, 적어도 50%, 또는 적어도 60%, 또는 적어도 70%, 또는 적어도 80% 또는 적어도 90%의 퍼센트 동일성을 가질 수 있다. 한 구체예에서, 코돈 최적화된 CNGA3은 적어도 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 천연 서열과의 퍼센트 동일성을 가진다. 한 구체예에서, 천연 핵산 서열 SEQ ID NO: 13과 배열될 때, 코돈 최적화된 CNGA3 (SEQ ID NO: 9)은 단지 80%의 퍼센트 서열 동일성을 가지는 것으로 나타난다 (도 3 참조).
다른 구체예에서, 인간 CNGB3을 암호화하는 분리된 또는 엔지니어링된 코돈 최적화된 핵산 서열이 제공된다. 한 구체예에서, 코돈-최적화된 서열은 SEQ ID NO: 19 또는 SEQ ID NO: 21과 적어도 70%의 동일성을 공유하는 서열이다. 다른 구체예에서, 코돈 최적화된 서열은 SEQ ID NO: 23에 나타낸 것과 같이, 클로닝을 위한 N-말단 및 C-말단 제한 부위를 포함한다. 또한, 코돈 최적화된 서열은, 일부 구체예에서, 마커, 예컨대 에피토프 태그의 첨가를 허용하기 위해 하나 이상의 추가의 제한 부위를 포함한다. 천연 핵산 서열과 배열될 때 (SEQ ID NO: 19에 나타낸 것과 같이), 코돈 최적화된 CNGB3은 임의의 범위들 사이의 임의의 정수를 포함하여, 적어도 50%, 또는 적어도 60%, 또는 적어도 70%, 또는 적어도 80% 또는 적어도 90%의 퍼센트 동일성을 가질 수 있다. 한 구체예에서, 코돈 최적화된 CNGB3은 적어도 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99%의 천연 서열과의 퍼센트 동일성을 가진다.
한 구체예에서, 본원에 기술된 REP-1 또는 CNGA3 구성물을 암호화하는 최적화된 핵산 서열은 예컨대 DNA 또는 RNA, 바이러스 벡터를 지닌 나노입자를 포장 숙주 세포에서 생성하기 위해 및/또는 대상체의 숙주 세포에 전달하기 위해 그 위에 담긴 REP-1 또는 CNGA3 서열을 숙주 세포에 전달하는 임의의 적합한 유전자 요소, 예컨대 네이키드 DNA, 파지, 트랜스포존, 코스미드, RNA 분자 (예컨대 mRNA), 에피좀 등에 엔지니어링된다. 한 구체예에서, 유전자 요소는 플라스미드이다.
선택된 유전자 요소는 트랜스펙션, 전기천공법, 리포좀 전달, 막 융합 기법, 고속 DNA-코팅된 펠릿, 바이러스 감염 및 원형질 융합을 포함하여, 임의의 적합한 방법에 의해 전달될 수 있다. 그러한 구성물을 만들기 위해 사용된 방법은 핵산 조작에 숙련된 사람들에게 알려져 있고 유전자 엔지니어링, 재조합 엔지니어링 및 합성 기법들을 포함한다. 예컨대 Green and Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY (2012) 참조.
REP-1 단백질의 발현을 위해 SEQ ID No. 1 또는 5를 사용하는 다양한 발현 카세트가 제공된다. 한 구체예에서, 그러한 발현 카세트를 함유하는 플라스미드의 예가 SEQ ID NO. 25에 나타난다. 한 구체예에서, 그러한 발현 카세트를 함유하는 플라스미드의 예가 SEQ ID NO. 26에 나타난다. 한 구체예에서, 그러한 발현 카세트를 함유하는 플라스미드의 예가 SEQ ID NO. 27에 나타난다. 한 구체예에서, 그러한 발현 카세트를 함유하는 플라스미드의 예가 SEQ ID NO. 28에 나타난다. 본원에서 사용되는 "벡터 게놈"은 ITR 자체를 포함하여, 5'와 3' ITR 사이에 포장된 핵산 서열이다. 일부 구체예에서, 용어 "벡터 게놈"은 "발현 카세트"와 상호교환적으로 사용된다. 그러므로, 한 구체예에서, 벡터 게놈은 5' ITR, CMV 인핸서, 닭의 베타-액틴 프로모터, CBA 엑손 1 및 인트론, Kozak 서열, 코돈 최적화된 CHM, bGH 폴리 A 및 3' ITR을 포함한다. 한 구체예에서, 벡터 게놈은 SEQ ID NO: 25의 nt 1 내지 4233을 포함한다. 다른 구체예에서, 벡터 게놈은 SEQ ID NO: 26의 nt 1 내지 4233을 포함한다. 또 다른 구체예에서, 벡터 게놈은 SEQ ID NO: 27의 nt 1 내지 4233을 포함한다. 또 다른 구체예에서, 벡터 게놈은 SEQ ID NO: 28의 nt 1 내지 4233을 포함한다.
다른 구체예에서, CNGA3 단백질의 발현을 위해 SEQ ID No. 9, 11 또는 13을 사용하는 다양한 발현 카세트가 제공된다. 다른 구체예에서, CNGAB 단백질의 발현을 위해 SEQ ID No. 19, 21 또는 23을 사용하는 다양한 발현 카세트가 제공된다. 본원에서 사용되는 "발현 카세트"는 최적화된 REP-1 또는 CNGA3 또는 CNGB3 단백질, 프로모터에 대한 코딩 서열들을 포함하고, 그것에 대한 다른 조절 서열을 포함할 수 있는 핵산 분자를 나타내며, 카세트는 유전자 요소 또는 플라스미드로 엔지니어링될 수 있고, 및/또는 바이러스 벡터의 캡시드 안으로 포장될 수 있다 (예컨대 바이러스 입자). 한 구체예에서, 발현 카세트는 REP-1을 암호화하는 코돈 최적화된 핵산 서열을 포함한다. 한 구체예에서, 카세트는 숙주 세포에서 REP-1을 암호화하는 코돈 최적화된 핵산 서열의 발현을 지시하는 발현 제어 서열과 작동가능하게 회합된 코돈 최적화된 REP-1을 제공한다.
다른 구체예에서, 발현 카세트는 CNGA3을 암호화하는 코돈 최적화된 핵산 서열을 포함한다. 한 구체예에서, 카세트는 숙주 세포에서 CNGA3을 암호화하는 코돈 최적화된 핵산 서열의 발현을 지시하는 발현 제어 서열과 작동가능하게 회합된 코돈 최적화된 CNGA3을 제공한다.
다른 구체예에서, 발현 카세트는 CNGB3을 암호화하는 코돈 최적화된 핵산 서열을 포함한다. 한 구체예에서, 카세트는 숙주 세포에서 CNGB3을 암호화하는 코돈 최적화된 핵산 서열의 발현을 지시하는 발현 제어 서열과 작동가능하게 회합된 코돈 최적화된 CNGB3을 제공한다.
다른 구체예에서, AAV 벡터에 사용하기 위한 발현 카세트가 제공된다. 그 구체예에서, AAV 발현 카세트는 적어도 하나의 AAV 역 말단 반복부 (ITR) 서열을 포함한다. 다른 구체예에서, 발현 카세트는 5' ITR 서열 및 3' ITR 서열을 포함한다. 한 구체예에서, 5' 및 3' ITR은 선택적으로 숙주 세포에서 REP-1 또는 CNGA3 또는 CNGB3을 암호화하는 코돈 최적화된 핵산 서열의 발현을 지시하는 추가의 서열과 함께, REP-1 또는 CNGA3 또는 CNGB3을 암호화하는 코돈 최적화된 핵산 서열의 양 옆에 있다. 그러므로, 본원에서 기술된 것과 같이, AAV 발현 카세트는 그것의 5' 단부 옆에 5'AAV 역 말단 반복부 서열 (ITR)이 있고 그것의 3' 단부 옆에 3' AAV ITR이 있는 상기 기술된 발현 카세트를 묘사하는 것을 의미한다. 그러므로, 이 rAAV 게놈은 발현 카세트를 AAV 바이러스 입자 안에 포장하기 위해 필요한 최소 서열, 즉 AAV 5' 및 3' ITR을 함유한다. AAV ITR은 본원에 기술된 것과 같은, 임의의 AAV의 ITR 서열로부터 얻어질 수 있다. 이런 ITR은 결과적으로 생성되는 재조합 AAV에 사용된 캡시드와 동일한 AAV 기원의 것이거나, 또는 상이한 AAV 기원의 것 (AAV 위형을 제조하기 위함)일 수 있다. 한 구체예에서, AAV2로부터의 ITR 서열, 또는 그것 (ITR)의 삭제된 버전이 조절 승인을 편리를 위해 및 규제 승인을 가속화하기 위해 사용된다. 그러나, 다른 AAV 공급원으로부터의 ITR이 선택될 수도 있다. 각각의 rAAV 게놈은 그런 다음 제조 플라스미드에 도입될 수 있다. 한 구체예에서, 제조 플라스미드는 본원에서 기술되거나 WO2012/158757 (참조로 본원에 포함됨)에서 기술된 것과 같다. rAAV 벡터를 제조하는 데 사용하기 위한, 그리고 본원에서 유용한 다양한 플라스미드가 기술분야에 알려져 있다. 제조 플라스미드는 AAV cap 및/또는 rep 단백질을 발현하는 숙주 세포에서 배양된다. 숙주 세포에서, 각각의 rAAV 게놈은 구제(rescue)되고 캡시드 단백질 또는 엔벨로프 단백질에 포장되어 감염성 바이러스 입자가 형성된다.
제조 플라스미드의 한 유형은 SEQ ID NO: 7에 나타낸 것으로, p584로 명명된다. 이 플라스미드는 rAAV-REP-1 벡터의 생성을 위해 실시예에서 사용된다. 그러한 플라스미드는 5' AAV ITR 서열; 선택된 프로모터; 폴리A 서열; 및 3' ITR을 포함하고; 추가적으로, 또한 스터퍼(stuffer) 서열, 예컨대 람다를 함유한다. 한 구체예에서, 비-코딩 람다 스터퍼 영역은 벡터 골격에 포함된다. REP-1, CNGA3 또는 CNGB2를 암호화하는 핵산 서열은 선택된 프로모터와 폴리A 서열, 또는 유사한 플라스미드 사이에 대신 삽입된다. REP-1 암호화 서열을 포함하는 p584의 예는 SEQ ID NO: 8에서 찾을 수 있다. 다른 구체예에서, 제조 플라스미드는 최적화된 벡터 플라스미드 제조 효율을 위해 변형된다. 그러한 변형은 다른 중립적인 서열(neutral sequence)의 첨가, 또는 벡터 플라스미드의 슈퍼코일 수준을 조절하기 위하여 람다 스터퍼 서열의 부분(들) 또는 전체의 결실을 포함한다. 그러한 변형은 본원에서 고려된다. 다른 구체예에서, 터미네이터 및 다른 서열들이 플라스미드에 포함된다.
추가의 구체예에서, 본원에서 기술된 REP-1, CNGA3 및 CNGB3 구성물 및 최적화된 서열의 전달을 위해 재조합 아데노-관련 바이러스 (AAV) 벡터가 제공된다. 아데노-관련 바이러스 (AAV) 바이러스 벡터는 그 안에 표적 세포로의 전달을 위해 핵산 서열이 포장되어 있는 AAV 단백질 캡시드를 가지는 AAV Dnase-내성 입자이다. AAV 캡시드는 60개의 캡시드 (cap) 단백질 하위유닛, VP1, VP2, 및 VP3으로 구성되며, 그것들은 선택된 AAV에 따라 대략 1:1:10 내지 1:1:20의 비율로 정20면체 대칭으로 배열된다. AAV는 상기에서 확인된 것과 같이 AAV 바이러스 벡터의 캡시드에 대한 공급원으로서 선택될 수 있다. 예컨대 미국 공개 특허 출원 번호 2007-0036760-A1; 미국 공개 특허 출원 번호 2009-0197338-A1; EP 1310571 참조. 또한, WO 2003/042397 (AAV7 및 다른 유인원 AAV), 미국 특허 7790449 및 미국 특허 및 미국 특허 7282199 (AAV8), WO 2005/033321 및 US 7,906,111 (AAV9), 및 WO 2006/110689, 및 WO 2003/042397 (rh.10) 참조. 이 문서들은 또한 AAV를 생성하기 위해 선택될 수 있는 다른 AAV를 기술하고 참조로 포함된다. 일부 구체예에서, 바이러스 벡터에 사용하기 위한 AAV cap은 상기 언급된 AAV 캡시드 또는 그것의 암호화 핵산들 중 하나의 돌연변이생성에 의해 (즉, 삽입, 결실 또는 치환에 의해) 생성될 수 있다. 일부 구체예에서, AAV 캡시드는 상기 언급된 AAV 캡시드 단백질 중 둘 또는 셋 또는 넷 이상으로부터의 도메인들을 포함하는, 키메릭이다. 일부 구체예에서, AAV 캡시드는 둘 또는 세 개의 상이한 AAV 또는 재조합 AAV로부터의 Vp1, Vp2 및 Vp3 모노머의 모자이크이다. 일부 구체예에서, rAAV 조성물은 하나 이상의 상기 언급된 Cap을 포함한다.
다른 구체예에서, AAV 캡시드는 임의의 기술된 또는 공지의 AAV 캡시드 서열로부터 최대 약 10%의 변화를 포함할 수 있는 변종을 포함한다. 즉, AAV 캡시드는 본원에 제공된 및/또는 기술분야에 공지된 AAV 캡시드에 대해 약 90% 동일성 내지 약 99.9 % 동일성, 약 95% 내지 약 99% 동일성 또는 약 97% 내지 약 98% 동일성을 공유한다. 한 구체예에서, AAV 캡시드는 AAV 캡시드와 적어도 95% 동일성을 공유한다. AAV 캡시드의 퍼센트 동일성을 측정할 때, 비교는 가변 단백질들 (예컨대 vp1, vp2, 또는 vp3) 중 임의의 것에 대해 이루어질 수 있다. 한 구체예에서, AAV 캡시드는 AAV8 vp3과 적어도 95% 동일성을 공유한다. 다른 구체예에서, 자체-상보성 AAV가 사용된다. 한 구체예에서, 원하는 표적 세포, 예컨대 광수용체, RPE 또는 다른 눈 세포에 대해 향성을 보이는 AAV 캡시드를 활용하는 것이 바람직하다. 한 구체예에서, AAV 캡시드는 특정 표면 노출된 티로신 잔기가 페닐알라닌 (F)으로 치환된 티로신 캡시드-돌연변이체이다. 그러한 AAV 변종은 예컨대 Mowat et al, Tyrosine capsid-mutant AAV vectors for gene delivery to the canine retina from a subretinal or intravitreal approach, Gene Therapy 21, 96-105 (January 2014) (본원에 참조로 포함됨)에서 기술된다.
발현 카세트 또는 rAAV 게놈 또는 제조 플라스미드의 비리온으로의 포장을 위해, 도입유전자와 동일한 구성물에서 시스로 필요한 유일한 AAV 성분은 ITR이다. 한 구체예에서, 복제 (rep) 및/또는 캡시드 (cap)를 위한 코딩 서열은 AAV 게놈으로부터 제거되고 AAV 벡터를 생성하기 위하여 트란스로 또는 포장 세포주에 의해 공급된다. 예를 들어, 상기 기술된 것과 같이, 위형 AAV는 AAV 캡시드의 공급원과는 상이한 공급원으로부터의 ITR을 함유할 수 있다. 추가적으로 또는 다르게는, 키메라 캡시드가 이용될 수 있다. 또 다른 AAV 성분이 선택될 수도 있다. 그러한 AAV 서열의 공급원들은 본원에서 기술되고 또한 학구적, 상업적 또는 공공연한 공급원 (예컨대 아메리칸 타입 컬춰 콜렉션, Manassas, VA)으로부터 분리되거나 엔지니어링되거나 얻어질 수 있다. 다르게는, AAV 서열은 문헌에서 또는 GenBank®, PubMed®, 등과 같은 데이터베이스에서 이용할 수 있는 것과 같은 공개된 서열을 참조로 합성 또는 다른 적합한 수단을 통해 얻어질 수 있다.
대상체에게 전달하기에 적합한 AAV 바이러스 벡터를 생성하고 분리하는 방법은 기술분야에 공지되어 있다. 예컨대 미국 특허 779044; 미국 특허 7282199; WO 2003/042397; WO 2005/033321, WO 2006/110689; 및 US 7588772 B2 참조. 한 시스템에서, 생성자 세포주는 ITR이 양옆에 있는 도입유전자를 암호화하는 구성물 및 rep와 cap을 암호화하는 구성물(들)로 일시적으로 트랜스펙션된다. 두 번째 시스템에서, rep 및 cap을 안정하게 공급하는 포장 세포주는 양옆에 ITR을 가진 도입유전자를 암호화하는 구성물로 일시적으로 트랜스펙션된다. 이 각각의 시스템에서, AAV 비리온은 헬퍼 아데노바이러스 또는 헤르페스바이러스로의 감염에 대한 반응으로 생성되고, 오염시키는 바이러스로부터의 rAAV의 분리를 필요로 한다. 보다 최근에, AAV를 회수하기 위하여 헬퍼 바이러스로의 감염 - 필요한 헬퍼 기능을 필요로 하지 않는 시스템 (즉 아데노바이러스 E1, E2a, VA 및 E4 또는 헤르페스바이러스 UL5, UL8, UL52 및 UL29, 및 헤르페스바이러스 중합효소)이 개발되었다 (즉 또한, 트란스로, 시스템에 의해 공급된다). 이런 더 새로운 시스템들에서, 헬퍼 기능은 필요한 헬퍼 기능을 암호화하는 구성물로의 세포의 일시적 트랜스펙션에 의해 공급되거나, 또는 세포는 헬퍼 기능을 암호화하는 유전자를 안정적으로 함유하기 위해 엔지니어링될 수 잇으며, 그것의 발현은 전사 또는 번역후 수준에서 제어될 수 있다.
또 다른 시스템에서, 양옆에 ITR 및 rep/cap 유전자가 있는 도입유전자는 배큘로바이러스-기반 벡터로의 감염에 의해 곤충 세포에 도입된다. 이 제조 시스템에 대한 리뷰를 위해서는, 일반적으로, 예컨대 Zhang et al., 2009, "Adenovirus-adeno-associated virus hybrid for large-scale recombinant adeno-associated 바이러스 production," Human Gene Therapy 20:922-929를 참조하며, 그것의 내용은 그 전문이 본원에 참조로 포함된다. 이것들 및 다른 AAV 제조 시스템을 제조 및 사용하는 방법은 또한 다음의 미국 특허에서 기술되며, 각각의 내용은 그 전문이 참조로 본원에 포함된다.5,139,941; 5,741,683; 6,057,152; 6,204,059; 6,268,213; 6,491,907; 6,660,514; 6,951,753; 7,094,604; 7,172,893; 7,201,898; 7,229,823; 및 7,439,065. 일반적으로, 예컨대 Grieger & Samulski, 2005, "Adeno-associated virus as a gene therapy Vector: Vector development, production and clinical applications," Adv. Biochem. Engin/Biotechnol. 99: 119-145; Buning et al., 2008, "Recent developments in adeno-associated virus vector technology," J. Gene Med. 10:717-733; 및 하기 인용된 참고문헌을 참고하고, 각각은 그 전문이 참조로 본원에 포함된다.
본 발명의 임의의 구체예를 구성하기 위해 사용된 방법은 핵산 조작분야에 숙련된 사람들에게 공지이고 유전자 엔지니어링, 재조합 엔지니어링 및 합성 기법들을 포함한다. 예컨대 Green and Sambrook et al, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY (2012) 참조. 유사하게, rAAV 비리온의 생성 방법도 잘 알려져 있고 적합한 방법의 선택은 본 발명에 대한 제한 사항이 아니다. 예컨대 K. Fisher et al, (1993) J. Virol., 70:520-532 및 미국 특허 번호 5,478,745 참조.
rAAV 벡터는 AAV 캡시드 및 상기 기술된 것과 같이 REP-1 또는 CNGA3 또는 CNGB3을 암호화하는 서열들을 포함하는 AAV 발현 카세트를 포함한다. 특정 구체예에서, 발현 카세트는 AAV 역 말단 반복부 서열, REP-1 또는 CNGA3 또는 CNGB3을 암호화하는 코돈 최적화된 핵산 서열 및 숙주 세포에서 암호화된 단백질의 발현을 지시하는 발현 제어 서열을 포함한다. rAAV 발현 카세트는, 다른 구체예에서, 추가로 하나 이상의 인트론, Kozak 서열, 폴리A 및 전사 후 조절 요소들을 포함한다. 눈에 전달하기 위한 제약학적 조성물에 사용하기 위한 그러한 rAAV 벡터는 상기 확인된 많은 공지된 AAV 중 임의의 것으로부터의 캡시드를 사용할 수 있다.
발현 카세트 및 벡터의 다른 종래의 성분들은 예컨대 본원에서 기술된 코돈 최적화를 포함하여, 기술분야에서 공지되어 있는 기법들을 사용하여 특이적 종에 최적화될 수 있는 다른 성분들을 포함한다. 본원에 기술된 카세트, 벡터, 플라스미드 및 바이러스 또는 다른 조성물의 성분들은 발현 제어 서열의 일부로서 프로모터 서열을 포함한다. 다른 구체예에서, 프로모터는 세포-특이적이다. 용어 "세포-특이적"은 재조합 백터를 위해 선택된 특정 프로모터가 특정한 눈 세포 유형에서 최적화된 REP-1 또는 CNGA3 또는 CNGB3 도입유전자의 발현을 지시할 수 있는 것을 의미한다. 한 구체예에서, 프로모터는 광수용체 세포에서 도입유전자의 발현에 대해 특이적이다. 다른 구체예에서, 프로모터는 간상체 및 추상체에서의 발현에 대해 특이적이다. 다른 구체예에서, 프로모터는 간상체에서의 발현에 대해 특이적이다. 다른 구체예에서, 프로모터는 추상체에서의 발현에 대해 특이적이다. 한 구체예에서, 광수용체-특이적 프로모터는 인간 로돕신 키나아제 프로모터이다. 로돕신 키나아제 프로모터는 간상체 및 추상체 둘 다에서 활성적인 것으로 나타났다. 예컨대 Sun et al, Gene Therapy with a Promoter Targeting Both Rods and Cones Rescues Retinal Degeneration Caused by AIPL1 Mutations, Gene Ther. 2010 January; 17(1): 117-131 (그 전문이 참조로 본원에 포함됨) 참조. 한 구체예에서, 프로모터는 클로닝을 용이하게 하기 위해 하나 이상의 제한 부위를 첨가하도록 변형된다.
다른 구체예에서, 프로모터는 인간 로돕신 프로모터이다. 한 구체예에서, 프로모터는 클로닝을 위한 제한 부위를 단부들에 포함하도록 변형된다. 예컨대 Nathans and Hogness, Isolation and nucleotide sequence of the gene encoding human rhodopsin, PNAS, 81:4851-5 (August 1984) (그 전문이 참조로 본원에 포함됨) 참조. 다른 구체예에서, 프로모터는 인간 로돕신 프로모터의 일부 또는 단편이다. 다른 구체예에서, 프로모터는 인간 로돕신 프로모터의 변종이다.
다른 예시의 프로모터는 인간 G-단백질-결합된 수용체 단백질 키나아제 1 (GRK1) 프로모터 (Genbank 승인 번호 AY327580)를 포함한다. 다른 구체예에서, 프로모터는 GRK1 프로모터의 292 nt 단편 (위치 1793 내지 2087)이다 (Beltran et al, Gene Therapy 2010 17:1162-74 참조, 전문이 참조로 본원에 포함됨). 다른 바람직한 구체예에서, 프로모터는 인간 광수용체간 레티노이드-결합 단백질 근접(proximal) (IRBP) 프로모터이다. 한 구체예에서, 프로모터는 hIRBP 프로모터의 235 nt 단편이다. 한 구체예에서, 프로모터는 RPGR 근접 프로모터이다 (Shu et al, IOVS, May 2102, 그 전문이 팜조로 포함됨). 발명에 유용한 다른 프로모터로는, 제한 없이 간상체 옵신 프로모터, 적녹색 옵신 프로모터, 청색 옵신 프로모터, cGMP-β-포스포다이에스테라제 프로모터 (Qgueta et al, IOVS, Invest Ophthalmol Vis Sci. 2000 Dec;41(13):4059-63), 마우스 옵신 프로모터 (Beltran et al 2010, 상기 인용됨), 로돕신 프로모터 (Mussolino et al, Gene Ther, July 2011, 18(7):637-45); 추상체 트랜스듀신의 알파-하위유닛 (Morrissey et al, BMC Dev, Biol, Jan 2011, 11:3); 베타 포스포다이에스테라제 (PDE) 프로모터; 색소성 망막염 (RP1) 프로모터 (Nicord et al, J. Gene Med, Dec 2007, 9(12):1015-23); NXNL2/NXNL1 프로모터 (Lambard et al, PloS One, Oct. 2010, 5(10):e13025), RPE65 프로모터; 느린 망막 변성/페리페린 2 (Rds/perph2) 프로모터 (Cai et al, Exp Eye Res. 2010 Aug;91(2):186-94); 및 VMD2 프로모터 (Kachi et al, Human Gene Therapy, 2009 (20:31-9))를 포함한다. 상기 문헌들은 각각 그 전문이 본원에 참조로 포함된다. 다른 구체예에서, 프로모터는 인간 인간 EF1α 프로모터, 로돕신 프로모터, 로돕신 키나아제, 광수용체간 결합 단백질 (IRBP), 간상체 옵신 프로모터 (적녹색, 청색), 적녹색 추상체 유전자좌 제어 영역을 함유하는 추상체 옵신 상류 서열, 추상체 형질도입, 및 전사 인자 프로모터 (신경 망막 류신 지퍼 (Nrl) 및 광수용체-특이적 핵 수용체 Nr2e3, bZIP)로부터 선택된다.
다른 구체예에서, 프로모터는 아주 흔하거나 구성적 프로모터이다. 적합한 프로모터의 예는 사이토메갈로바이러스 (CMV) 인핸서 요소를 가진 하이브리드 닭 β-액틴 (CBA) 프로모터이다. 다른 구체예에서, 프로모터는 CB7 프로모터이다. 다른 적합한 프로모터는 인간 β-액틴 프로모터, 인간 신장 인자-1α 프로모터, 사이토메갈로바이러스 (CMV) 프로모터, 유인원 바이러스 40 프로모터, 및 단순 헤르페스 바이러스 티미딘 키나아제 프로모터를 포함한다. 예컨대 Damdindorj et al, (August 2014) A Comparative Analysis of Constitutive Promoters Located in Adeno-Associated Viral Vectors. PloS ONE 9(8): e106472 참조. 또 다른 적합한 프로모터는 바이러스 프로모터, 구성적 프로모터, 조절 가능한 프로모터를 포함한다 [예컨대 WO 2011/126808 및 WO 2013/04943 참조]. 다르게는 생리적 신호에 반응하는 프로모터는 본원에서 기술된 발현 카세트, rAAV 게놈, 벡터, 플라스미드 및 바이러스에서 이용될 수 있다. 한 구체예에서, 프로모터는 AAV 벡터의 크기 제한으로 인해, 1000 bp 아래의 작은 크기의 것이다. 다른 구체예에서, 프로모터는 400 bp 아래이다. 다른 프로모터들은 기술분야의 숙련자에 의해 선택될 수 있다. 한 구체예에서, REP-1 구성물은 편재하는 프로모터를 포함한다. 다른 구체예에서, CNGA3 구성물은 광수용체-특이적 프로모터를 포함한다. 한 구체예에서, REP-1 구성물은 CMV 인핸서 요소를 가진 CBA 프로모터를 포함한다.
다른 구체예에서, 프로모터는 유도성 프로모터이다. 유도성 프로모터는 라파마이신/라파로그 프로모터, 엑디손 프로모터, 에스트로겐-반응성 프로모터, 및 테트라사이클린-반응성 프로모터, 또는 헤테로다이머 억제자 스위치를 포함하여, 공지의 프로모터로부터 선택될 수 있다. Sochor et al, An Autogenously Regulated Expression System for Gene Therapeutic Ocular Applications. Scientific Reports, 2015 Nov 24;5:17105 및 Daber R, Lewis M., A novel molecular switch. J Mol Biol. 2009 Aug 28;391(4):661-70, Epub 2009 Jun 21 참조 (둘 다 그 전문이 참조로 본원에 포함됨).
다른 구체예에서, 본원에 기술된 카세트, 벡터, 플라스미드 및 바이러스 구성물은 다른 적절한 전사 개시, 종결, 인핸서 서열, 효율적인 RNA 처리 신호, 예컨대 스플라이싱 및 폴리아데닐화(폴리A) 신호; TATA 서열; 세포질 mRNA를 안정화시키는 서열; 번역 효율을 향상시키는 서열 (즉 Kozak 공통 서열); 인트론; 단백질 안정성을 향상시키는 서열; 및 필요하다면 암호화된 생성물의 분비를 향상시키는 서열을 함유한다. 발현 카세트 또는 벡터는 본원에 기술된 요소들 중 아무것도 함유하지 않거나, 하나 이상을 함유할 수 있다. 적합한 폴리A 서열의 예는, 예컨대 SV40, 소 성장 호르몬 (bGH) 및 TK 폴리A를 포함한다. 적합한 인핸서의 예는 예컨대, 다른 것들 중에서도 CMV 인핸서, RSV 인핸서, 알파 피토단백질 인핸서, TTR 최소 프로모터/인핸서, LSP (TH-결합 글로불린 프로모터/알파1-마이크로블로불린/비쿠닌(bikunin) 인핸서)를 포함한다. 한 구체예에서, Kozak 서열은 정확한 개시 코돈으로부터의 번혁을 향상시키기 DLN하여 도입유전자 코딩 서열의 상류에 포함된다. 다른 구체예에서, CBA 엑손 1 및 인트론은 발현 카세트에 포함된다. 한 구체예에서, 도입유전자는 하이브리드 닭 β 액틴 (CBA) 프로모터의 제어하에 놓인다. 이 프로모터는 사이토메갈로바이러스 (CMV) 즉시 조기 인핸서, 근접 닭 β 액틴 프로모터, 및 양옆에 인트론 1 서열이 있는 CBA 엑손 1로 구성된다.
한 구체예에서, 발현 카세트는 5' ITR, CBA 프로모터, CMV 인핸서, CBA 엑손 1 및 인트론, kozak 서열, 인간 코돈 최적화된 CHM 서열 (SEQ ID NO: 1), bGH 폴리 A 및 3' ITR을 함유한다.
또 다른 측면으로, 이 핵산 서열, 벡터, 발현 카세트 및 rAAV 바이러스 벡터 들은 제약학적 조성물에 유용하며, 조성물은 또한 제약학적으로 허용되는 담체, 완충제, 희석제 및/또는 보조제, 등을 포함한다. 그러한 제약학적 조성물은 눈 세포에서 그러한 재조합적으로 엔지니어링된 AAV 또는 인공 AAV에 의한 전달을 통해 최적화된 REP-1 또는 CNGA3 또는 CNGB3을 발현하기 위해 사용된다.
핵산 서열s, 벡터s, 발현 카세트 및 rAAV 바이러스 벡터를 함유하는 이 제약학적 조성물을 제조하기 위하여, 서열 또는 벡터 또는 바이러스 벡터가 바람직하게 종래 방법에 의해 오염에 대해 평가된 후 눈에 투여하기에 적합한 제약학적 조성물로 제제화된다. 그러한 제제는 적절한 생리적 수준으로 pH를 유지하기 위하여, 제약학적으로 및/또는 생리적으로 허용되는 비히클 또는 담체, 특히 눈에 투여하기에 적합한 비히클 또는 담체, 예컨대 완충된 식염수 또는 다른 완충제, 예컨대 HEPES, 및 선택적으로 다른 의학적 작용제, 약학적 작용제, 안정화제, 완충제, 담체, 보조제, 희석제, 등의 사용을 포함한다. 주입을 위해, 담체는 전형적으로 액체일 것이다. 예시의 생리적으로 허용되는 담체는 멸균된, 발열원-없는 물 및 멸균된, 발열원-없는 인산염 완충된 식염수를 포함한다. 다양한 그러한 공지의 담체들은 미국 특허 공개 번호 7,629,322 (참조로 본원에 포함됨)에 제공된다. 한 구체예에서, 담체는 등장성 염화나트륨 용액이다. 다른 구체예에서, 담체는 균형잡힌 염 용액이다. 한 구체예에서, 담체는 트윈(tween)을 포함한다. 만약 바이러스가 장기간 보관되어야 한다면, 글리세롤 또는 트윈20의 존재하에 냉동될 수 있다.
한 예시의 특정 구체예에서, 담체 또는 부형제의 조성물은 0.0001% - 0.01% 플루로닉 F68 (PF68)이 첨가된 180 mM NaCl, 10 mM NaPi, pH7.3을 함유한다. 완충제의 식염수 성분의 정확한 조성은 160 mM 내지 180 mM NaCl의 범위이다. 선택적으로, 상이한 pH 완충제 (잠재적으로 HEPES, 중탄산 나트륨, TRIS)가 특이적으로 기술된 완충제 대신 사용된다. 또 다르게는, 0.9% NaCl을 함유한 완충제가 유용하다.
선택적으로, 발명의 조성물은 rAAV 및/또는 변종 및 담체(들)에 더불어, 다른 종래의 제약학적 성분들, 예컨대 보존제, 또는 화학적 안정화제를 함유할 수 있다. 적합한 예시의 보존제는 클로로부탄올, 소르브산 칼륨, 소르브산, 이산화황, 프로필 갈레이트, 파라벤, 에틸 바닐린, 글리세린, 페놀, 및 파라클로로페놀을 포함한다. 적합한 화학적 안정화제는 젤라틴 및 알부민을 포함한다.
본원에 기술된 것과 같이, 적어도 하나의 복제-결핍 rAAV 바이러스를 함유하는 제약학적 조성물은 유전자 전달 및 유전자 요법 적용에 사용하기 위해 생리적으로 허용되는 담체, 희석제, 부형제 및/또는 보조제와 함께 제제화될 수 있다. AAV 바이러스 벡터의 경우, 게놈 복사물 ("GC"), 벡터 게놈 ("VG"), 또는 바이러스 입자의 정량은 제제 또는 현탁액에 함유된 용량의 척도로서 사용될 수 있다. 기술분야에 공지된 임의의 방법이 발명의 복제-결핍 바이러스 조성물의 게놈 복사물 (GC) 수를 측정하기 위해 사용될 수 있다. AAV GC 수 적정을 수행하기 위한 한 가지 방법은 다음과 같다: 정제된 AAV 벡터 샘플이 먼저 Dnase로 처리되어 캡시드화되지 않은 AAV 게놈 DNA 또는 오염 플라스미드 DNA가 제조 과정으로부터 제거된다. Dnase 내성 입자들은 다음에 열 처리 대상이 되어 캡시드로부터 게놈이 방출된다. 방출된 게놈은 다음에 실시간 PCR에 의하여 바이러스 게놈의 특정 영역 (통상적으로 폴리 A 신호)을 표적화하는 프라이머/프로브 세트를 사용하여 정량된다. 다른 방법으로 최적화된 REP-1 또는 CNGA3 도입유전자를 암호화하는 핵산 서열을 지닌 유효 용량의 재조합 아데노-관련 바이러스가 S.K. McLaughlin et al, 1988 J. Virol., 62:1963 (그 전문이 참조로 포함됨)에서 기술된 것과 같이 측정된다.
본원에서 사용되는 바, 용어 "투여량"은 치료 과정에서 대상체에게 전달된 총 투여량, 또는 단일 단위 (또는 다중 단위 또는 스틀릿 투여량) 투여로 전달된 양을 나타낼 수 있다. 제약학적 바이러스 조성물은 본원에 기술된 REP-1 또는 CNGA3 또는 CNGB3을 암호화하는 코돈 최적화된 핵산 서열을 지닌, 범위 내의 모든 정수 또는 분수의 양을 포함하여, 약 1.0 x 109 GC 내지 약 1.0 x 1015 GC의 범위의 양의 복제-결핍 바이러스를 함유하기 위한 투약 단위로 제제화될 수 있다. 한 구체예에서, 조성물은 범위 내의 모든 정수 또는 분수의 양을 포함하여, 용량당 적어도 1x109, 2x109, 3x109, 4x109, 5x109, 6x109, 7x109, 8x109, 또는 9x109 GC를 함유하도록 제제화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 분수의 양을 포함하여, 용량당 적어도 1x1010, 2x1010, 3x1010, 4x1010, 5x1010, 6x1010, 7x1010, 8x1010, 또는 9x1010 GC를 함유하도록 제제화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 분수의 양을 포함하여, 용량당 적어도 1x1011, 2x1011, 3x1011, 4x1011, 5x1011, 6x1011, 7x1011, 8x1011, 또는 9x1011 GC를 함유하도록 제제화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 분수의 양을 포함하여, 용량당 적어도 1x1012, 2x1012, 3x1012, 4x1012, 5x1012, 6x1012, 7x1012, 8x1012, 또는 9x1012 GC를 함유하도록 제제화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 분수의 양을 포함하여, 용량당 적어도 1x1013, 2x1013, 3x1013, 4x1013, 5x1013, 6x1013, 7x1013, 8x1013, 또는 9x1013 GC를 함유하도록 제제화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 분수의 양을 포함하여, 용량당 적어도 1x1014, 2x1014, 3x1014, 4x1014, 5x1014, 6x1014, 7x1014, 8x1014, 또는 9x1014 GC를 함유하도록 제제화된다. 다른 구체예에서, 조성물은 범위 내의 모든 정수 또는 분수의 양을 포함하여, 용량당 적어도 1x1015, 2x1015, 3x1015, 4x1015, 5x1015, 6x1015, 7x1015, 8x1015, 또는 9x1015 GC를 함유하도록 제제화된다. 한 구체예에서, 인간 적용을 위해 용량은 범위 내의 모든 정수 또는 분수의 양을 포함하여, 용량당 1x1010 내지 약 1x1012 GC의 범위일 수 있다. 모든 용량은 예컨대 M. Lock et al, Hum Gene Ther Methods. 2014 Apr;25(2):115-25. Doi: 10.1089/hgtb.2013.131에 기술된 oqPCR 또는 디지털 드로플렛 PCR (ddPCR)에 의해 측정되는 것을 포함하여, 임의의 공지의 방법에 의해 측정될 수 있다.
이런 상기의 용량들은 치료될 구역의 크기, 사용된 바이러스 역가, 투여 경로 및 방법의 원하는 효과에 따라, 범위 내의 모든 수를 포함하여, 약 25 to 약 1000 마이크로리터의, 다양한 부피의 담체, 부형제 또는 완충제 제제로 투여될 수 있다. 한 구체예에서, 담체, 부형제 또는 완충제의 부피는 적어도 약 25 μL이다. 한 구체예에서, 부피는 약 50 μL이다. 다른 구체예에서, 부피는 약 75 μL이다. 다른 구체예에서, 부피는 약 100 μL이다. 다른 구체예에서, 부피는 약 125 μL이다. 다른 구체예에서, 부피는 약 150 μL이다. 다른 구체예에서, 부피는 약 175 μL이다. 또 다른 구체예에서, 부피는 약 200 μL이다. 다른 구체예에서, 부피는 약 225 μL이다. 또 다른 구체예에서, 부피는 약 250 μL이다. 또 다른 구체예에서, 부피는 약 275 μL이다. 또 다른 구체예에서, 부피는 약 300 μL이다. 또 다른 구체예에서, 부피는 약 325 μL이다. 다른 구체예에서, 부피는 약 350 μL이다. 다른 구체예에서, 부피는 약 375 μL이다. 다른 구체예에서, 부피는 약 400 μL이다. 다른 구체예에서, 부피는 약 450 μL이다. 다른 구체예에서, 부피는 약 500 μL이다. 다른 구체예에서, 부피는 약 550 μL이다. 다른 구체예에서, 부피는 약 600 μL이다. 다른 구체예에서, 부피는 약 650 μL이다. 다른 구체예에서, 부피는 약 700 μL이다. 다른 구체예에서, 부피는 약 700 내지 1000 μL이다.
한 구체예에서, 바이러스 구성물은 마우스같은 작은 동물 대상체에 대해 약 1μL 내지 약 3 μL의 부피로 적어도 1x109 내지 약 최소한 1x1011 GC의 용량으로 전달될 수 있다. 인간의 눈과 동일한 크기 정도의 눈을 가지는 더 큰 수의학적 대상체에 대해서는, 상기 진술된 것보다 더 큰 인간 투여량 및 부피가 유용하다. 다양한 수의학적 동물에 대한 피하 투여를 위한 양호한 실시의 논의에 대해 예컨대 Diehl et al, J. Applied Toxicology, 21:15-23 (2001) 참조. 상기 문서는 참조로 본원에 포함된다.
바람직하지 못한 효과, 예컨대 독성, 망막 이형성 및 분리의 위험을 감소시키기 위하여 바이러스 또는 다른 전달 비히클의 최저 유효 농도가 이용될 수 있는 것이 바람직하다. 이 범위의 또 다른 투여량이 담당의사에 의해, 치료받는 대상체, 바람직하게는 인간의 신체적 상태, 대상체의 나이, 특정 눈 장애 및 그 장애가 진행성이라면 발달된 정도를 고려하여 선택될 수 있다.
본원에서 기술된 또 다른 측면은 범맥락막 위축을 가진, 또는 그것에 걸릴 위험이 있는 포유류 대상체에서 실명의 진행을 치료, 지연 또는 중단시키는 방법이다. 한 구체예에서, 바람직하게는 생리적으로 부합하는 담체, 희석제, 부형제 및/또는 보조제에 현탁된, REP-1 코돈 최적화된 서열을 지닌 rAAV가 인간 대상체를 포함하여 원하는 대상체에 투여될 수 있다. 이 방법은 핵산 서열, 발현 카세트, rAAV 게놈, 플라스미드, 벡터 또는 rAAV 벡터 또는 그것을 함유하는 조성물 중 임의의 것을 그것을 필요로 하는 대상체에 투여하는 단계를 포함한다. 한 구체예에서, 조성물은 망막밑으로 전달된다. 다른 구체예에서, 조성물은 유리체강내로 전달된다. 또 다른 구체예에서, 조성물은 눈 질환의 치료를 위해 적합한 투여 경로들의 조합을 사용하여 전달되고, 또한 안검 정맥 또는 다른 정맥내 또는 종래의 투여 경로를 통한 투여를 포함할 수 있다.
본원에서 기술된 또 다른 측면은 색맹을 가진, 또는 색맹을 나타낼 위험이 있는 포유류 대상체에서 실명의 진행을 치료, 지연 또는 중단시키는 방법이다. 한 구체예에서, 바람직하게는 생리적으로 부합하는 담체, 희석제, 부형제 및/또는 보조제에 현탁된, CNGA3 또는 CNGB3 천연, 변형된 또는 코돈 최적화된 서열을 지닌 rAAV가 인간 대상체를 포함하여 원하는 대상체에 투여될 수 있다. 이 방법은 핵산 서열, 발현 카세트, rAAV 게놈, 플라스미드, 벡터 또는 rAAV 벡터 또는 그것을 함유하는 조성물 중 임의의 것을 그것을 필요로 하는 대상체에 투여하는 단계를 포함한다. 한 구체예에서, 조성물은 망막밑으로 전달된다. 다른 구체예에서, 조성물은 유리체강내로 전달된다. 또 다른 구체예에서, 조성물은 눈 질환의 치료를 위해 적합한 투여 경로들의 조합을 사용하여 전달되고, 또한 안검 정맥 또는 다른 정맥내 또는 종래의 투여 경로를 통한 투여를 포함할 수 있다.
이 방법들에 사용하기 위하여, 각 투여량의 부피 및 바이러스 역가가 본원에서 추가로 기술되는 것과 같이 개별적으로 측정되고, 동일한, 또는 반대쪽 눈에서 수행된 다른 치료와 동일하거나 상이할 수 있다. 투여량, 투여 및 처방은 본 명세서의 교시를 참조로 담당의에 의해 결정될 수 있다. 한 구체예에서, 조성물은 상기 열거된 것들로부터 선택된 단일 투여량으로 질병에 걸린 단일한 눈에 투여된다. 다른 구체예에서, 조성물은 질병에 걸린 두 눈에 상기 열거된 것들로부터 선택된 단일 투여량으로서, 동시에 또는 순차적으로 투여된다. 순차적 투여는 분, 시간, 일, 주 또는 개월의 간격으로 한 눈에서 다른 눈으로 투여되는 시간 갭을 함축할 수 있다. 다른 구체예에서, 방법은 둘 이상의 투여량 (예컨대 스플릿 투여량)으로 한 눈에 조성물을 투여하는 것을 포함한다. 다른 구체예에서, 다중 주입이 동일한 눈의 상이한 부분에서 이루어진다. 다른 구체예에서, 선택된 발현 카세트 (예컨대, CHM 함유 카세트)를 포함하는 rAAV의 제 2 투여는 후기 시점에서 수행된다. 그러한 시점은 제 1 투여 후 수 주, 수 개월 또는 수 년 후일 수 있다. 그러한 제 2 투여는, 한 구체예에서, 제 1 투여로부터의 rAAV와는 상이한 캡시드를 가지는 rAAV로 수행된다. 다른 구체예에서, 제 1 및 제 2 투여로부터의 rAAV는 동일한 캡시드를 가진다.
또 다른 구체예에서, 본원에서 기술된 조성물은 단일 조성물 또는 다중 조성물로 전달될 수 있다. 선택적으로, 둘 이상의 상이한 AAV가 전달되거나, 또는 다중 바이러스가 전달될 수 있다 [예컨대 WO 2011/126808 및 WO 2013/049493]. 다른 구체예에서, 다중 바이러스는 상이한 복제-결핍 바이러스들을 함유할 수 있다 (예컨대 AAV 및 아데노바이러스).
발명의 특정 구체예에서, 치료법에 대해 표적화된 간상체 및 추상체 광수용체의 구역을 확인하기 위하여 비-침습성 망막 영상화 및 기능적 연구를 수행하는 것이 바람직하다. 이런 구체예에서, 임상적인 진단 테스트가 하나 이상의 망막밑 주입(들)에 대한 정확한 위치(들)을 결정하기 위해 사용된다. 이 테스트들은 치료되는 대상체의 종, 그들의 신체 상태 및 건강 및 투여량에 따라, 망막전위도검사 (ERG), 시야 측정, 망막층의 위상학적 지도작성 및 공초점 주사 레이저 검안경 검사 (cSLO) 및 광간섭 단층촬영 (OCT)에 의한 그 층의 두께의 측정, 보정 광학 (AO)을 통한 추상체 밀도의 위상학적 지도작성, 기능적 눈 검사, 등을 포함할 수 있다. 지도작성 및 기능적 연구의 관점에서, 발명의 일부 구체예에서, 병에 걸린 눈의 상이한 구역을 표적으로 하기 위해 하나 이상의 주입이 동일한 눈에 수행된다. 각 주입의 부피 및 바이러스 역가는 추가로 본원에서 기술되는 것과 같이 개별적으로 결정되며, 동일한, 또는 반대쪽 눈에서 수행된 다른 주입과 동일하거나 상이할 수 있다. 다른 구체예에서, 단일한, 더 큰 부피의 주입이 전체 눈을 치료하기 위해 이루어진다. 한 구체예에서, rAAV 조성물의 부피 및 농도는 손상된 눈 세포의 영역만이 영향을 받도록 선택된다. 다른 구체예에서, rAAV 조성물의 부피 및 농도는 손상되지 않은 광수용체를 포함하여, 눈의 더 큰 부분에 도달하기 위해, 더 많은 양이다.
본원에 기술된 방법의 한 구체예에서, 본원에 기술된 조성물의 1회 안내 전달, 예컨대 최적화된 REP-1 카세트의 AAV 전달은 범맥락막 위축이 발생할 위험이 있는 대상체에서 시력 상실 및 실명을 예방하는 데 유용하다. 본원에 기술된 방법의 다른 구체예에서, 본원에 기술된 조성물의 1회 안내 전달, 예컨대 최적화된 CNGA3 또는 CNGB3 카세트의 rAAV 전달은 색맹이 발생할 위험이 있는 대상체에서 시력 상실 및 실명을 예방하는 데 유용하다.
그러므로, 한 구체예에서, 조성물은 질환이 시작되기 전에 투여된다. 다른 구체예에서, 조성물은 시력 손상 또는 상실이 시작되기 전에 투여된다. 다른 구체예에서, 조성물은 시력 손상 또는 상실이 시작된 후에 투여된다. 또 다른 구체예에서, 조성물은 질환이 없는 눈과 비교하여 간상체 및/또는 추상체 또는 광수용체의 90% 미만이 기능하거나 남아있을 때 투여된다.
다른 구체예에서, 방법은 추가의 연구, 예컨대 치료의 효능을 측정하기 위해 기능적 및 영상화 연구를 수행하는 단계를 포함한다. 동물에서의 조사를 위해, 그러한 테스트는 간상체 및 추상체 광수용체 기능을 살피는 망막전위도검사 (ERG), 시운동성 안진, 동공측정, 수중 미로 검사, 명암 선호도, 광간섭 단층촬영 (망막의 다양한 층의 두께를 측정하기 위함), 조직학 (망막 두께, 외핵층의 핵의 열, 도입유전자 발현을 증명하기 위한 면역형광, 추상체 광수용체 계수, 땅콩 응집소 (peanut agglutinin)를 가진 망막 부분의 염색 (추상체 광수용체 싸개를 확인함)을 통한 망막 및 시기능 평가를 포함한다.
인간 대상체에 대해 특이적으로, 본 명세서에서 기술된 조성물의 투여량의 투여 후에, 대상체는 간상체 및 추상체 광수용체 기능을 살피는 망막전위도검사 (ERG), 동공측정 시력, 대비 민감도 색각 검사, 시계 검사 (Humphrey 시계/Goldmann 시계), 시야측정 기동성 검사 (장애물 코스), 및 독서 속도 테스트를 사용하여 치료 효능에 대해 테스트된다. 본원에 기술된 제약학적 조성물로 치료한 후에 대상체가 노출되는 다른 유용한 치료 후 효능 테스트는 기능적 자기 공명 영상화 (fMRI), 전장 (full-field) 광민감도 검사, 광간섭 단층촬영을 포함한 망막 구조 연구, 안저촬영, 펀더스 자동형광, 적응제어 광학 레이저 주사 검안경 검사, 기동성 검사, 독서 속도 및 정확도 테스트, 미세 시야측정 및/또는 검안경 검사이다. 이것들 및 다른 효능 테스트는 미국 특허 번호 8,147,823; 공동 계류중인 국제 특허 출원 공개 WO 2014/011210 또는 WO 2014/124282 (참조로 포함됨)에서 기술된다.
또 다른 구체예에서, 상기 기술된 방법들 중 어느 것이라도 다른, 또는 이차 치료법과 조합되어 수행된다. 또 다른 구체예에서, 이 눈 질환들의 치료 방법은 다른 치료법, 예컨대 항생물질 치료, 통증 완화 치료, 등과 조합하여 본원에서 상세하게 기술된 조성물로 대상체를 치료하는 단계를 포함한다. 추가의 치료법은 이들 돌연변이 또는 결함 또는 그것들과 관련된 효과 중 어느 것이라도 예방, 저지 또는 개선하는 것을 돕는 임의의, 현재 알려져 있는, 또는 아직은 알려져 있지 않은 치료법일 수 있다. 이차 치료법은 상기 기술된 조성물의 투여 전에, 동시에 또는 투여 후에 투여될 수 있다. 한 구체예에서, 이차 치료법은 망막 세포의 건강을 유지하기 위한 비-특이적 접근법, 예컨대 신경영양 인자, 항-산화제, 세포사멸 방지제의 투여를 포함한다. 비-특이적 접근법은 단백질, 재조합 DNA, 재조합 바이러스 벡터, 줄기 세포, 또는 유전자적으로 변형된 세포의 주입을 통해 이루어진다. 후자는 캡슐화된 유전자적으로 변형된 세포를 포함할 수 있을 것이다.
한 구체예에서, 재조합 rAAV의 생성 방법은 상기 기술된 AAV 발현 카세트를 함유하는 플라스미드를 얻는 단계 및 그 플라스미드를 지닌 포장 세포를 AAV 바이러스 게놈의 감염성 AAV 엔벨로프 또는 캡시드 안으로 포장하는 것을 허용하기에 충분한 바이러스 서열의 존재하에 배양하는 단계를 포함한다. rAAV 벡터 생성의 특이적 방법은 상기 기술되며 상기에서 및 하기 실시예에서 기술된 발현 카세트 및 게놈에 코돈 최적화된 REP-1 또는 CNGA3 또는 CNGB3을 전달할 수 있는 rAAV 벡터를 생성하는 데 사용될 수 있다.
또 다른 구체예에서, 본원에 기술된 발현 카세트들 중 임의의 발현 카세트를 포함하는 벡터가 제공된다. 상기에서 기술된 것과 같이, 그러한 벡터는 다양한 기원의 플라스미드일 수 있고 본원에서 추가로 기술되는 재조합 복제 결핍 바이러스들의 생성을 위한 특정 구체예에 유용하다.
하나의 다른 구체예에서, 벡터는 발현 카세트를 포함하는 플라스미드이고, 여기서 발현 카세트는 AAV 역 말단 반복부 서열 및 REP-1을 암호화하는 코돈 최적화된 핵산 서열, 및 숙주 세포에서 암호화된 단백질의 발현을 지시하는 발현 제어 서열을 포함한다.
다른 구체예에서, 벡터는 발현 카세트를 포함하는 플라스미드이고, 여기서 발현 카세트는 AAV 역 말단 반복부 서열 및 CNGA3을 암호화하는 코돈 최적화된 핵산 서열, 및 숙주 세포에서 암호화된 단백질의 발현을 지시하는 발현 제어 서열을 포함한다.
다른 구체예에서, 벡터는 발현 카세트를 포함하는 플라스미드이고, 여기서 발현 카세트는 AAV 역 말단 반복부 서열 및 CNGB3을 암호화하는 코돈 최적화된 핵산 서열, 및 숙주 세포에서 암호화된 단백질의 발현을 지시하는 발현 제어 서열을 포함한다.
"하나"를 나타내는 용어는 하나 이상을 나타내는 것이 주지되어야 한다. 그러므로, 용어 "하나"를 지칭하는 단어, "하나 이상" 및 "적어도 하나"는 본원에서 상호교환적으로 사용된다.
단어 "포함하다 (복수형 포함)" 및 "포함하는"은 배타적이기보다는 포괄적으로 해석되어야 한다. 단어 "구성되다", "구성되는" 및 그것의 변형은 포괄적이기보다는 배타적으로 해석되어야 한다. 명세서에서 다양한 구체예들이 "포함하는"이란 언어를 사용하여 제공되는 한편으로, 다른 상황 하에서, 관련된 구체예는 또한 "구성되는" 또는 "본질적으로 구성되는"이란 언어를 사용하여 해석되고 기술되어야 하는 것으로 의도된다.
본원에서 사용되는 용어 "약"은 다르게 명시되지 않는 한, 제공된 기준으로부터 10%의 가변성을 의미한다.
본원에서 사용되는 용어 "조절" 또는 그것의 변형은 생물학적 경로의 하나 이상의 성분을 억제하는 조성물의 능력을 나타낸다.
본 명세서에서 다르게 정의되지 않는 한, 본원에서 사용된 기술적이고 과학적인 용어는 기술분야에 통상의 지식을 가진 자가 공개된 텍스트를 참조로 통상적으로 이해하는 것과 동일한 의미를 가지며, 기술분야의 숙련자에게 본 출원에서 사용된 많은 용어들에 대한 일반적인 가이드를 제공한다.
다음의 실시예는 단지 예시적인 것이고 본 발명을 제한하려는 의도가 아니다.
실시예 1 - 다능성 줄기 세포의 RPE로의 분화
범맥락막 위축은 관련된 마우스 모델이 없고 개과의 모델이 없으므로, 형질도입 및 발현을 질환의 인간 망막 세포 모델에서 테스트한다. 망막 세포를 살아있는 환자로부터 얻는 것이 불가능하기 때문에, RPE를 유도된 다능성 줄기 세포로부터 생성한다. 다능성 줄기 세포는 Buchholz et al, Rapid and Efficient Directed Differentiation of Human Pluripotent Stem Cells Into Retinal Pigmented Epithelium, Stem Cells Translational Medicine, 2013;2:384-393 (그 전문이 참조로 포함됨)에 의해 기술된 프로토콜을 사용하여 RPE에 대해 지시된다. 또한, Cereso et al, Proof of concept for AAV2/5-mediated gene therapy in iPSC-derived retinal pigment epithelium of a choroideremia patient, Molecular Therapy ― Methods & Clinical Development (2014) 1, 14011 (그 전문이 참조로 포함됨) 참조. RPE를 제조하기 위한 다른 방법들은 기술분야에 알려져 있다.
간단히 설명하면, 인간 유도 다능성 줄기 세포주를 미토마이신 C-처리된 또는 방사선 조사된 마우스 배아 섬유모세포 공급기 층에서 둘베코 변형 이글스 배지: 2 mM GlutaMAX-I, 20% 녹아웃 혈청 대체물, 0.1 mM 변형 이글스 배지 비-필수 아미노산 (MEM NEAA), 0.1 mM β-머캡토에탄올 및 4 ng/ml의 bFGF를 함유한 영양 혼합물 F-12 (DMEM/F12)에서 유지하였다.
다능성 줄기 세포를 1X B27, 1X N2 및 1X NEAA (Invitrogen)가 포함된 DMEM/F2에서 Matrigel (BD Biosciences) 위로 직접 통과시킨다. 0일부터 제 2일까지, 50 ng/ml Noggin, 10 ng/ml Dkk1, 10 ng/ml IGF1 및 10mM 니코틴아마이드를 베이스 배지에 첨가한다. 제 2일부터 제 4일까지, 10 ng/ml Noggin, 10 ng/ml Dkk1, 10 ng/ml IGF1, 5 ng/ml bFGF 및 10 mM 니코틴아마이드를 베이스 배지에 첨가한다. 제 4일부터 제 6일까지, 10 ng/ml Dkk1, 10 ng/ml IGF1 및 100 ng/ml Activin A (R&D Systems)를 베이스 배지에 첨가한다. 제 6일부터 제 14일까지, 00 ng/ml Activin A, 10 μM SU5402 (EMD Millipore, Darmstadt, Germany), 및 1 mM VIP를 베이스 배지에 첨가한다. 대조 실험을 베이스 배지 단독에서 수행한다 (DMEM/F12, B27, N2, 및 NEAA).
세포를 비-RPE 형태를 가진 세포를 긁어냄으로써 기계적으로 풍부화한다. 계속해서, 남아 있는 RPE를 TrypLE Express (Invitrogen)를 사용하여 5분 동안 37℃에서 소화시킨다. 세포를 30-μm 단일-세포 스트레이너를 통해 통과시키고 Matrigel-코팅된 조직 배양 플라스틱, 트랜스웰 막 또는 CC2-처리된 챔버 슬라이드 위로 시딩한다. 풍부해진 세포를 1% 소 태아 혈청 (FBS), GlutaMAX 및 피루브산 나트륨이 첨가된 DMEM-고글루코오스에서 30일 동안 배양한다.
실시예 2 - AAV-REP-1으로 형질도입된 세포
간단히 설명하면, REP-1 코돈 최적화된 서열을 통합하는 AAV2/8CMV.CBA-REP-1 바이러스 벡터를 HEK293 세포의 일시적 트랜스펙션에 의해 제조하고, 바이러스 입자를 폴리에틸렌 글리콜을 사용하여 상층액으로부터 침전시킨다. 예컨대 Guo et al, Rapid and simplified purification of recombinant adeno-associated virus, J Virol Methods. 2012 Aug; 183(2): 139-146 (본원에 참조로 포함됨) 참조. 벡터를 이중 CsCl 원심분리에 의해 정제하고, 투석한 후, 돗트 블롯 검정에 의해 적정한다.
프레닐화 실험을 위해, RPE를 24-웰 플레이트에 시딩하고, 1.2x106 세포를 집밀도로 추정한다. 세포를 세포당 100,000 vg로 형질도입시키고, 프레닐화 검정을 형질도입 후 4주 후에 수행한다. 실험을 삼중으로 수행한다.
실시예 3 - 프레닐화
시험관내 프레닐화 검정을 상기에서 인용된 Vasireddy et al, PloS One. 2013 May 7;8(5):e61396에서 기술한 것과 같이, [3H]-게라닐게라닐 피로포스페이트 (GGPP) (Perkin Elmer, Boston, MA, USA)를 프레닐기 도너로서 사용하여, 재조합 Rab 게라닐게라닐 트랜스퍼라제 및 RAB27의 존재하에 수행한다. 방사성 표지된 프레닐기의 RAB27 단백질 안으로의 통합을 신틸레이션 카운팅에 의해 측정한다. 일관성을 위해 대조군 값을 100으로 표준화하고 기준 값으로서 사용한다. 모든 실험을 삼중으로 수행하고, 실험군과 대조군 사이의 프레닐화의 통계학적 비교를 양측 일방 스튜던트 t-테스트 (two-tailed unpaired student's t-test)를 사용하여 평가한다.
간단히 설명하면, 형질도입 후 48시간 후, 형질도입된 REP 세포를 저온 PBS로 세척한다. 세포 펠릿을 수집하고 저온 PBS로 철저하게 세척한다. 세포를 얼음에서 30분 동안 RIPA + 프로테아제 억제제를 사용하여 용해시킨다. 다른 프로토콜에서는, 세포를 음파처리한다. 용해물을 75,000 내지 100,000 g에서 1 내지 2시간 동안 4℃에서 원심분리함으로써 시토졸 분획을 수집한다.
프레닐화 반응을 위해 스톡을 다음과 같이 제조한다.
프레닐화에 사용한 최종 반응 부피는 25 μL이다.
반응 혼합물을 37℃에서 30분 동안 인큐베이션한다. 반응을 9:1 에탄올/HCL을 첨가함으로써 중단시키고, 30분 동안 인큐베이션한다. 단백질을 진공 여과 (0.1 ml)에 의하여 유리 섬유 필터지 (Whatman papers)에서 수집한다. 필터를 저온 포스페이트 완충제로 조심스럽게 3회 세척하여 미결합 물질을 제거한다. 막을 조심스럽게 건조시킨다. 필터를 5 ml 신틸레이션 칵테일에 넣고 신틸레이션 카운팅을 수행한다. 또한, Tolmachova et al, CHM/REP1 cDNA delivery by lentivirus vectors provides functional expression of the transgene in the retinal pigment epithelium of choroideremia mice, The Journal of Gene Medicine, 2012; 14-158-68 (그 전문이 참조로 본원에 포함됨) 참조.
CNGA3 또는 CNGB3 개념 입증을 위한 검정은 자발적 돌연변이 동물 모델 (예를 들어, Cnga3-/- 마우스 또는 Awassi 양)의 사용을 포함할 수 있다. 마우스 모델은 이중 녹아웃을 얻기 위해 "모든-추상체" 광수용체 마우스, Nrl-/- 마우스로 사육될 수 있을 것이다. 후자의 (Cnga3-/-Nrl-/-) 마우스가 효능의 확인을 더 신속하게 처리할 수 있다. 효능은 동공측정, 시력 및 대비의 측정 (예를 들어 시선이동을 사용함), 망막전위도, 및 시각적 행동에 의해 측정될 수 있을 것이다. 궁극적으로, 조직학이 다른 척도에 대한 개선된 결과로 도입유전자의 발현을 증명할 것이다. 조직학적 접근법 또한 추상체 광수용체 (추상체 광수용체의 총 수, 밀도, 위치 등)에 대한 발명의 임의의 효과를 증명하기 위해 사용될 것이다.
상기 논의된 범맥락막 위축과 유사하게, CNGA3- 또는 CNGB3-관련된 색맹에 대한 유전자 증대 치료법에 대한 개념 입증을 위한 검정은 유도된 다능성 줄기 세포 (Ipsc) 모델의 사용을 포함할 수 있다. CNGA3 또는 CNGB3 돌연변이로 인한 색맹을 가진 환자들로부터 생성된 iPSC 모델은 시험관내에서 망막 전구체 및/또는 광수용체 세포로 분화될 것이다. 야생형 CNGA3 (또는 CNGB3) cDNA가 재조합 AAV를 사용하여 이들 세포에 전달될 것이고, 세포는 이들 하위유닛에 의해 구성된 관련된 (고리형 뉴클레오타이드-게이트, CNG) 채널의 기능의 생물발생 및 보존에 대해 분석될 것이다. 채널 기능은 막 패치상에서의 전기생리학에 의해 평가될 것이다. 채널의 복원은 cGMP-활성화된 전류를 구제해야 한다. 추가 연구는 야생형 CNG cDNA의 생리적 리간드로의 전달 전 및 후의 채널 기능의 민감도에 대해 테스트할 수 있다.
실시예 4: AAV.코돈-최적화된 인간 CHM의 시험관내 발현
이 연구의 목적은 84-31 및 COS-7 세포주에서 코돈 최적화된 CHM 유전자 (SEQ ID NO: 1)를 암호화하는 일련의 차세대 AAV 2 및 AAV8 벡터를 사용한 유전자 전달 후에 AAV 매개된 CHM 발현의 능력을 평가하는 것이었다.
CHM의 발현을 최대화하기 위하여, 코돈 최적화된 CHM 서열(SEQ ID NO: 1)을 제조하였다. 코돈 최적화된 플라스미드를 합성하여 모든 차세대 CHM 도입유전자 발현 카세트의 생성에 사용하였다. 비-기능적 AAV 게놈의 오염의 잠재적 문제를 극복하기 위하여, 비-코딩 람다 스터퍼 영역을 벡터 골격에 포함시켰다. 스터퍼의 통합은 플라스미드의 길이를 증가시킬뿐 아니라, 플라스미드 DNA 골격 오염의 가능성을 감소시키는 한편, AAV를 포장한다. 플라스미드 DNA 불순물을 제거하기 위한 스터퍼 영역의 벡터 골격에의 통합의 영향은 독립적인 연구로서 수행하였다. 두 재조합 AAV 프로바이러스 플라스미드 (높고 낮은 복사물) 골격을 사용하여 상이한 구성물을 생성하였다. 높은 복사물 플라스미드를 pUC 플라스미드 기원을 기반으로 디자인하였다. 낮은 복사물 플라스미드를 p15A 기원을 기반으로 디자인하였다. 정확한 개시 코돈으로부터의 번역을 추가로 향상시키기 위하여, 출발 코돈의 상류에 Kozak 서열을 통합시켰다.
총 4개의 플라스미드를 현재의 연구를 위해 엔지니어링하였고 그것들을 다음의 실시예에서 기술하였다 (표 1). 또한, 임상 실험에 현재 사용되고 있는, CHM 천연 서열을 지닌 플라스미드를 또한 생성하였다 (버전 1). 버전 2a, 2b, 3a 및 3b, 및 버전 1의 각각에 대한 플라스미드 지도를 각각 도 6 내지 10에 도시한다.
명칭 | REP 서열 | 람다 스터퍼 | Kozak 서열 | 기원 | 복사물 수 | 프로모터 /인트론 |
|
버전 1 (V1) | 천연 | 존재함 | 부재 | pUC | 높은 복사물 |
CMV-CBA 프로모터+인핸서 연장 | |
버전 2a (V2a) |
코돈- 최적화됨 |
존재함 | 존재함 | pUC | 높은 복사물 |
CMV-CBA 프로모터+인핸서 연장 | |
버전 2b (V2b) |
코돈- 최적화됨 |
존재하지 않음 |
존재함 | pUC | 높은 복사물 |
CMV-CBA 프로모터+인핸서 연장 | |
버전 3a (V3a) |
코돈- 최적화됨 |
존재함 | 존재함 | p15A | 낮은 복사물 |
CMV-CBA 프로모터+인핸서 연장 | |
버전 3b (V3b) |
코돈- 최적화됨 |
존재하지 않음 |
존재함 | p15A | 낮은 복사물 |
CMV-CBA 프로모터+인핸서 연장 |
이 구성물들의 시험관내 발현을 COS-7 및 84-31 세포주에서 테스트하였다. 차세대 CHM 구성물의 엔지니어링된 특징은 표 1에 나타낸다.
재조합 AAV 프로바이러스 높은 및 낮은 복사물 플라스미드를 코돈 최적화된 인간 CHM cDNA (hCHM) (SEQ ID NO: 1)를 도입유전자 카세트에 클로닝함으로써 생성하였다. 도입유전자를 하이브리드 닭 β 액틴 (CBA) 프로모터의 제어하에 놓았다. 이 프로모터는 사이토메갈로바이러스 (CMV) 즉시 조기 인핸서, 근접 닭 β 액틴 프로모터, 및 양 옆에 인트론 1 서열이 있는 CBA 엑손 1로 구성된다. 프로바이러스 높은 및 낮은 복사물 수 플라스미드 또한 AAV 역 말단 반복부 및 폴리A 서열을 함유한다. 본 연구에서 사용한 차세대 플라스미드 골격은 람다 파지 단편 스터퍼와 이어서 카나마이신 박테리아 선택 유전자를 함유한다. 추가의 플라스미드는 스터퍼가 결핍되었지만 카나마이신 선택 유전자를 함유한다. 높은-복사물 수 벡터는 pUC 플라스미드 (~300 복사물/박테리아 세포)의 그것과 유사하다. 낮은 복사물 수 플라스미드 (~10 복사물/박테리아 세포)는 p15A의 기원을 가진다. 정확한 개시 코돈으로부터의 번역을 향상시키기 위하여, 모든 차세대 구성물은 출발 코돈, ATG의 상류에 KOZAK 공통 서열을 함유한다. 생성된 플라스미드는 프로모터+인핸서 연장 서열 및 코돈 최적화된 CHM 서열 중 어느 하나를 특이적으로 표적화할 수 있는 프라이머를 사용하여 서열이 확인된다. 5개의 모든 구성물의 플라스미드 지도 및 서열을 도 6 내지 10에 나타낸다. 칼슘 포스페이트로의 표준 삼중 트랜스펙션을 사용하여 하기에 열거하는 AAV 벡터를 생성하였다 (벡터 자격에 대해서는 표 2 참조). 결과를 보장하기 위해 생성된 벡터의 AAV 및 AAVB 혈청형은 둘 다 혈청형-독립적이다.
명칭 | 혈청형 | 플라스미드 명칭 | 롯트 번호 | 트톡 농도 (vg/ml) |
AAV2.V1 | AAV2 | 버전 1 (V1) | KA892* | 4.47E+12 |
AAV2.V2a | AAV2 | 버전 2a (V2a) | CT239 | 2.16E+12 |
AAV2.V2b | AAV2 | 버전 2b (V2b) | CT238 | 7.40E+12 |
AAV2.V3a | AAV2 | 버전 3a (V3a) | CT258 | 4.82E+12 |
AAV2.V3b | AAV2 | 버전 3b (V3b) | CT256 | 5.91E+12 |
AAV8.V1 | AAV8 | 버전 1 (V1) | KA808* | 1.39E+13 |
AAV8.V2a | AAV8 | 버전 2a (V2a) | CT245 | 1.04E+13 |
AAV8.V2b | AAV8 | 버전 2b (V2b) | CT244 | 1.11E+13 |
AAV8.V3a | AAV8 | 버전 3a (V3a) | CT259 | 8.67E+12 |
AAV8.V3b | AAV8 | 버전 3b (V3b) | CT255 | 1.36E+13 |
84-31 세포주는 293 HEK 세포주 (인간 배아 신장 세포)의 하위클론이고 AAV 바이러스의 형질도입을 향상시키기 위하여 아데노바이러스 E4 단백질을 구성적으로 발현한다. COS-7 세포는 원숭이 신장 조직으로부터 유래된 세푸주와 같이 섬유모세포이다. 84-31 세포 및 COS-7 세포를 둘 다, 별도로 6-웰 세포 배양 플레이트에 플레이팅하고 10개의 테스트물 (AAV2 또는 AAV8 중 하나) 중 하나로 5가지의 상이한 감염 다중도 (MOI)로 형질도입하였다. 36 내지 48시간 후, 세포를 수득하고, 용해시키고 단백질 샘플을 SDS-PAGE를 위해 준비하고, 이어서 웨스턴 블롯 분석에 의해 외인성 CHM의 발현을 검출하였다.
84-31 세포 및 COS-7 세포를 둘 다 10% 소 태아 혈청 및 1% 페니실린/스트렙토마이신이 첨가된 둘베코 변형 이글 배지 (DMEM)-고글르코오스에서 37℃에서 5% CO2가 공급된 환경에서 배양하였다. 형질도입 전날 (18 내지 24시간 전) 세포를 3E5의 밀도로 6-웰 세포 배양 접시의 각 웰에서 2 ml의 세포 배양 배지에 시딩하였다. 시딩한 세포를 37℃에서 5% CO2가 공급된 환경에서 인큐베이션하였다. 84-31 세포 및 COS-7 세포 둘 다의 웰을 하기 열거하는 AAV 벡터로 다양한 감염 다중도 (MOI) (표 3 및 표 4)로 감염시켰다. 네거티브 대조군 세포 (형질도입되지 않은 세포)에는 바이러스를 첨가하지 않았다. 간단히 설명하면, 조직 배양 배지를 제거하고 신선한 2 ml의 배지 분취액을 6 웰 배양 접시의 각 웰에 첨가하였다. 그런 다음 소정량의 AAV 벡터를 측정하고 (스톡으로부터 직접) 각 웰에 첨가하였다 (표 3 및 4). 1E4의 MOI를 위해, 1 μL의 각각의 바이러스 스톡을 세포 배양 배지로 10 μL 로 희석하였다. 이 용액으로부터, 소정 부피의 바이러스를 각각의 웰에 첨가하였다 (표 3 및 4). 세포를 AAV 바이러스와 함께 36 내지 48시간 동안 37℃에서 5% CO2에서 수득할 때까지 인큐베이션하였다. 세포를 현미경으로 관찰한 후 수득하여 비정상을 조사하였다.
사용한 벡터 | 세포주 | 세포 밀도 | 사용한 벡터 (μL) | MOI |
AAV 없음 | COS-7 | 3E5 | - | - |
AAV2.V2a | COS-7 | 3E5 | 1.5 | 1E4 |
COS-7 | 3E5 | 15 | 1E5 | |
COS-7 | 3E5 | 45 | 3E5 | |
COS-7 | 3E5 | 75 | 5E5 | |
COS-7 | 3E5 | 150 | 1E6 | |
AAV2.V2b | COS-7 | 3E5 | 4.2 (스톡의 1 내지 10 회 희석) | 1E45 |
COS-7 | 3E5 | 4.2 | 1E5 | |
COS-7 | 3E5 | 12.6 | 3E5 | |
COS-7 | 3E5 | 21 | 5E5 | |
COS-7 | 3E5 | 42 | 1E6 | |
AAV8.V2a | COS-7 | 3E5 | 2.9 (스톡의 1 내지 10 회 희석) | 1E4 |
COS-7 | 3E5 | 2.88 | 1E5 | |
COS-7 | 3E5 | 8.65 | 3E5 | |
COS-7 | 3E5 | 14.42 | 5E5 | |
COS-7 | 3E5 | 28.85 | 1E6 | |
AAV8.V2b | COS-7 | 3E5 | 2.7 (스톡의 1 내지 10 회 희석) | 1E4 |
COS-7 | 3E5 | 2.7 | 1E5 | |
COS-7 | 3E5 | 8.1 | 3E5 | |
COS-7 | 3E5 | 13.5 | 5E5 | |
COS-7 | 3E5 | 27 | 1E6 |
사용한 벡터 | 세포주 | 세포 밀도 | 사용한 벡터 (uL) | MOI |
No AAV | 84-31 | 3E5 | - | - |
AAV2.V2a | 84-31 | 3E5 | 1.5 | 1E4 |
84-31 | 3E5 | 15 | 1E5 | |
84-31 | 3E5 | 45 | 3E5 | |
84-31 | 3E5 | 75 | 5E5 | |
84-31 | 3E5 | 150 | 1E6 | |
AAV2.V2b | 84-31 | 3E5 | 4.2 (스톡의 1 내지 10 회 희석) | 1E4 |
84-31 | 3E5 | 4.2 | 1E5 | |
84-31 | 3E5 | 12.6 | 3E5 | |
84-31 | 3E5 | 21 | 5E5 | |
84-31 | 3E5 | 42 | 1E6 | |
AAV8.V2a | 84-31 | 3E5 | 2.9 (스톡의 1 내지 10 회 희석) | 1E4 |
84-31 | 3E5 | 2.88 | 1E5 | |
84-31 | 3E5 | 8.65 | 3E5 | |
84-31 | 3E5 | 14.42 | 5E5 | |
84-31 | 3E5 | 28.85 | 1E6 | |
AAV8.V2b | 84-31 | 3E5 | 2.7 (스톡의 1 내지 10 회 희석) | 1E4 |
84-31 | 3E5 | 2.7 | 1E5 | |
84-31 | 3E5 | 8.1 | 3E5 | |
84-31 | 3E5 | 13.5 | 5E5 | |
84-31 | 3E5 | 27 | 1E6 |
먼저, 두, COS7 및 84-31 세포주를 사용하여 CHM의 시험관내 발현이 세포주 독립적인지를 테스트하였다. 일단 독립성이 수립되면, 모든 후속 실험을 AAV로 월등한 형질도입 효율을 보였던 84-31 세포에서만 수행하였다. 84-31 세포의 웰을 하기 열거한 AAV 벡터로 다양한 MOI로 감염시켰다 (표 3 및 4 참조).
웨스턴 블롯 분석: 1. 세포 용해물을 제조하였다. 미처리된 대조군 세포와 함께 AAV 형질도입된 세포를 감염 후 36 내지 48시간 후 수득하고 PBS로 철저하게 세척하였다. 그런 다음 세포를 프로테아제 억제제를 포함한 RIPA 완충제를 사용하여 얼음에서 용해시켰다. 세포 용해물을 13,000 rpm에서의 10분 동안의 원심분리에 의하여 정화시켰다. 2. 단백질의 정량 및 제조. 세포 용해물의 단백질 정량을 ThermoFisher Micro BCATM 단백질 검정 키트를 제조자의 설명서를 따라 사용하여 수행하였다. 단배질 농도를 562 nm에서의 OD 판독을 취함으로써 측정하였다. CHM의 시험관내 발현을 평가하기 위하여, 40 내지 60 ug의 측정된 단백질을 4 내지 12% Bis-Tris 겔에 로딩하였다. 3. SDS-PAGE 및 블롯팅 SDS-PAGE 및 웨스턴 블롯 분석을 공지의 프로토콜에 따라 수행하였다. 간단히 설명하면, 단백질 겔은 니트로셀룰로오스 막에 옮기고, 밀크로 차단한 후 일차 항체와 함께 인큐베이션하였다. 항인간 REP-1 2F1 항체 (2F1, 1:1000 희석) 및 다음: 항-GAPDH 항체 (1:1000 희석), 항 액틴 항체 (1:1000 희석) 및 항-튜불린 항체 (1:5000 희석) 중 하나를 각 블롯에 대한 일차 항체로서 사용하였다. 블롯을 세척한 후, 1:5000의 농도의 HRP 콘쥬게이트된 항-마우스 IgG 항체 및/또는 항-토끼 IgG 항체를 이차 항체로서 사용하였다. 블롯을 ECL 시약을 제조자의 설명에 따라 사용하여 화학발광에 의해 전개시켰다. 대조군: 1. 로딩 대조군: 다음: 항-액틴 항체, 항-튜불린 항체 및 항-GAPDH 항체 중 하나를 겔의 각 웰에서 단백질의 동등한 로딩을 증명하기 위한 로딩 대조군으로서 사용하였다. 항- 튜불린 항체는 ~51 kDa의 단백질을 검출한다. 항-액틴 항체는 ~42 kDa의 단백질을 검출하고, 항-GAPDH 항체는 ~39 kDa의 단백질을 검출한다. 초기 블롯을 항- 튜불린 항체 및 항-액틴 항체 및 항- GAPDH 항체 중 하나로 그것들의 이용도에 따라 프로빙하였다. 초기 실험 후에, 일관성이 있도록, 항-GAPDH 항체를 로딩 대조군으로서 사용하였다. 2. 포지티브 대조군: AAV2.V2a 형질도입된 COS-7 세포에서 수립된 hREP-1 단백질의 제조 후에, AAV2.V2a- Cos-7 세포 용해물을 후자의 웨스턴 블롯 실험에서 포지티브 대조군으로서 사용하였다. 3. 네거티브 대조군: 미처리 세포를 네거티브 대조군으로서 사용하였다. 다양한 세포주에서의 REP-1 단백질 제조의 웨스턴 블롯 결과의 분석을 표 5에 요약한다.
명칭 | 혈청형 | 세포주 | 도면 | 사용한 MOI | CHM 발현 (관찰) |
AAV2.V2a | AAV2 | COS-7 | 도 1 | 1E4- 1E6 | 테스트된 모든 MOI에서 CHM의 검출 가능한 발현 |
AAV2.V2a | AAV2 | 84-31 | 도 1 | 1E4- 1E6 | |
AAV2.V2b | AAV2 | COS-7 | 도 2 | 1E4- 1E6 | |
AAV2.V2b | AAV2 | 84-31 | 도 2 | 1E4- 1E6 | |
AAV2.V3a | AAV2 | 84-31 | 도 3 | 1E4- 1E6 | |
AAV2.V3b | AAV2 | 84-31 | 도 3 | 1E4- 1E6 | |
AAV8.V2a | AAV8 | COS-7 | 도 4 | 1E4- 1E6 | 1E5-1E6의 MOI에서 CHM의 검출 가능한 발현 |
AAV8.V2a | AAV8 | 84-31 | 도 4 | 1E4- 1E6 | |
AAV8.V2b | AAV8 | COS-7 | 도 5 | 1E4- 1E6 | 3E5-1E6의 MOI보다 위에서 CHM의 검출 가능한 발현 |
AAV8.V2b | AAV8 | 84-31 | 도 5 | 1E4- 1E6 | |
AAV8.V3a | AAV8 | 84-31 | 도 6 | 1E4- 1E6 | 3E5-1E6의 MOI보다 위에서 CHM의 검출 가능한 발현 |
AAV8.V3b | AAV8 | 84-31 | 도 6 | 1E4- 1E6 |
차세대 AAV2.copt.CHM/ AAV8.copt.CHM으로 형질도입된 세포에서 하나의 ~ 75 내지 80 kDa hREP-1 단백질인, 단클론성 인간 REP-1-특이적 항체. 75 내지 80 kDa 밴드는 미처리된 대조군 세포의 세포 용해물에서는 관찰되지 않았다. 항-액틴/항튜불린/항-GAPDH 항체 중 하나로의 블롯의 프로빙은 미처리 대조군을 포함하여 웨스턴 블롯의 모든 레인에서 동일한 밀도의 밴드를 나타냈다. 항-액틴 항체는 ~42 kDa에서 단백질 분자량 밴드를 검출하였고, 항-튜불린 항체는 ~ 51 kDa에서 단백질을 검출하였으며, 항-GAPDH 항체는 ~39 kDa에서 단백질을 검출하였다. 모든 항체는 예상된 크기 분자량의 특이적 밴드만을 검출하였다. 블롯의 어느 곳에서도 특이적이지 않은 밴드가 관찰되지 않았다. 사전-염색된 분자량 마커를 사용하여 관심의 단백질의 분자량을 비교하였다.
간단히 설명하면, REP-1 단백질을 AAV2.V2a, AAV2.V2b, AAV2.hCHM.V3a 및 AAV2.hCHM.V3b로 형질도입된 COS-7 및 84-31 세포에서 예상된 크기에서 관찰하였다. 미처리 대조군은 예상된 크기의 인간 REP-1 단백질의 존재를 나타내지 않았다. 항-액틴 항체로의 블롯의 표지화는 겔의 모든 레인에서 ~ 42 kDa에서 동일한 강도의 단백질 밴드를 검출하였다. 사전-염색된 단백질 래더(ladder)를 사용하여 REP-1 및 액틴의 분자량을 비교하였다. 데이터는 제시하지 않음.
결과는 차세대 플라스미드들을 함유한 AAV2 및 AAV8 혈청형 벡터가 84-31 및 COS-7 세포를 효율적으로 형질도입할 수 있음을 나타낸다. 차세대 플라스미드에서 CHM의 발현은 검출가능한 범위에 있었고, 용량 의존적 경향을 입증하였다. 세포의 차세대 hCHM 바이러스들로의 형질도입은 예측된 크기의 REP-1 단백질의 생성을 초래하였다.
실시예 5: AAV 천연.인간 CHM과 AAV.코돈-최적화된.인간 CHM의 시험관내 단백질 발현의 비교
이 연구의 목적은 다양한 버전의 CHM-함유 도입유전자 카세트를 함유한 AAV 벡터 (혈청형 2 및 8)의 형질도입 효율을 84-31 세포주 기반 연구 모델에서 REP-1 단백질의 수준을 측정함으로써 기술하는 것이었다.
플라스미드 및 벡터: 총 5개의 도입유전자 플라스미드를 AAV2 및 AAV8에서 비교하였다: 버전 1 (앞서 진행중인 임상 실험에서 사용되고 있음) 및 4개의 차세대 버전 (V2a, V2b, V3a 및 V3b). 플라스미드를 실시예 4에서 기술한 것과 같이 엔지니어링하였고, 그것의 특징을 표 1에 나타낸다. 상기 표 2는 생성된 AAV2 및 AAV8 벡터의 요약 및 바이러스 스톡의 농도를 나타낸다.
연구 디자인 (예컨대 치료 그룹)
1. 파일럿 실험으로, COS-7 및 84-31 세포를 AAV2.hCHM.버전1, 버전2a 및 버전 2b로 형질도입시켰다. 웨스턴 블롯을 수행하여 두 세포주에서 형질도입 효율 수준을 비교하였다.
2. 6-웰 플레이트에 플레이팅한 84-31 세포를 10개의 테스트물 (AAV2 및 AAV8 배경 중 어느 하나의 버전 1, 2a, 2b, 3a 및 3b) 중 하나로 3E5의 MOI에서 형질도입하였다. 36 내지 48시간 후, 세포를 수득하고 용해시켰다. 용해물을 SDS-PAGE에 로딩하고, 추가로 웨스턴 블롯 분석을 수행하였다. 두 개의 별도의 용해물을 각각의 AAV2.CHM 및 AAV8.CHM 실험에 대해 구성하고, 별도로 분석하였다.
테스트 물질 투여
3.4.1 세포 배양
83-41 세포 및 COS-7를 둘 다, 10% 소 태아 혈청 및 1% 페니실린/스트렙토마이신이 첨가된 둘베코 변형 이글 배지 (DMEM)-고 글루코오스에서 37℃에서 5% CO2가 첨가된 환경에서 배양하였다.
3.4.2 형질도입을 위한 세포의 제조:
형질도입 전날 (18 내지 24시간 전)에 83-41 및 COS-7 세포를 6-웰 세포 배양 접시에서 웰당 2 ml의 세포 배양 배지에 3E5의 밀도로 시딩하였다. 시딩한 세포를 37℃에서 5% CO2가 첨가된 환경에서 인큐베이션하였다.
3.4.3 형질도입:
83-41 세포 및 COS-7의 웰을 하기에서 기술된 것과 같이 AAV 벡터로 3E5의 MOI에서 감염시켰다 (파일럿 실험에 대해 표 6 참조 및 실험의 제 2 세트에 대해 표 7 참조). 네거티브 (미처리) 대조군에는 바이러스를 첨가하지 않았다. 간단히 설명하면, 먼저, 6 웰 세포 배양 접시의 각 웰에서 조직 배양 배지를 제거하고 2 ml의 신선한 배지/웰로 교체하였다. 그런 다음 소정량의 AAV 벡터 (형질도입을 위해 사용한 벡터 부피에 대해서는 표 2 참조)를 측정하고 (스톡으로부터) 직접 각 웰에 첨가하였다. 세포를 AAV 바이러스와 함께 36 내지 48시간 동안 37℃에서 5% CO2에서 수득할 때까지 인큐베이션하였다. 세포를 현미경으로 관찰한 후 수득하여 임의의 비정상을 조사하였다. 웨스턴 블롯 분석을 실시예 4에서 기술한 것과 같이 수행하였다.
사용한 벡터 | 세포주 | 세포 밀도 | 사용한 벡터 (μL) | MOI | |
없음 | 84-31 | 3E5 | 0 | ||
AAV2.V1 | 84-31 | 3E5 | 13.42 | 3E5 | |
AAV2.V2b | 84-31 | 3E5 | 8.11 | 3E5 | |
AAV2.V2a | 84-31 | 3E5 | 27.78 | 3E5 | |
AAV2.V1 | COS-7 | 3E5 | 13.42 | 3E5 | |
AAV2.V2b | COS-7 | 3E5 | 8.11 | 3E5 | |
AAV2.V2a | COS-7 | 3E5 | 27.78 | 3E5 | |
없음 | COS-7 | 3E5 | 0 | 0 |
사용한 벡터 | 세포주 | 세포 밀도 | 사용한 벡터 (μL) | MOI |
없음 | 84-31 | 3E5 | 0 | 0 |
AAV8.V2a | 84-31 | 3E5 | 5.77 | 3E5 |
AAV8.V2b | 84-31 | 3E5 | 5.41 | 3E5 |
AAV8.V3a1 | 84-31 | 3E5 | 6.92 | 3E5 |
AAV8.V3b | 84-31 | 3E5 | 4.41 | 3E5 |
AAV8.V1 | 84-31 | 3E5 | 4.32 | 3E5 |
없음 | 84-31 | 3E5 | 0 | 0 |
AAV2.V2a | 84-31 | 3E5 | 27.78 | 3E5 |
AAV2.V2b | 84-31 | 3E5 | 8.11 | 3E5 |
AAV2.V3a | 84-31 | 3E5 | 12.45 | 3E5 |
AAV2.V3b | 84-31 | 3E5 | 10.15 | 3E5 |
AAV2.V1 | 84-31 | 3E5 | 13.42 | 3E5 |
결과: 84-31 및 COS-7 세포에서 천연 hCHM (AAV2.hCHM.V1) 대비 코돈-최적화된 CHM AAV2a 및 2b 벡터의 발현의 비교
이 실험에서 84-31 및 COS-7 세포를 벡터 없이 (미처리 대조군), AAV2.hCHM.버전1, AAV2.hCHM.버전2a 또는 Aav2.hCHM.버전2b로 형질도입시켰다. 항-인간 REP-1 항체로의 웨스턴 블롯 분석은 REP-1 단백질 수준이 모든 AAV2 (V1, V2a, V2b) 형질도입된 샘플 및 둘 다의 세포주에서 ~ 75 내지 80 kDa에서 검출 가능하였음을 나타냈다 (데이터는 제시하지 않음). 약간 더 나은 단백질 발현을 84-31 세포주에서 볼 수 있었다 (표 8). 항-REP1 항체는 미처리 세포에서 무시할 정도의 양의 REP-1 단백질을 검출하였다. GAPDH 항체로의 블롯의 표지화는 미처리 세포를 포함한 모든 세포 용해물에서 ~39 kDa에서 밴드를 검출하였다.
ImageJ 소프트웨어를 사용한 블롯의 밀도측정에 의한 평가 (단백질 수준의 정량)는, 내인성 GAPDH 단백질의 발현에 대한 값을 표준화한 후에, 형질도입 효율이 84-31 및 COS-7 세포에서 유사하였음을 증명하였다. (결과에 대해서는 표 8 참조). 이것을 기반으로, 인간 기원으로부터의 84-31 세포주를 추가의 실험에 사용하였다.
결론적으로, AAV2.V1, AAV2.V2a 및 Aav2.V2b는 84-31 및 COS-7 세포 둘 다에서, REP-1 단백질의 생성을 유사한 형질도입 효율로 유도하였다.
REP-1 | GAPDH | V1의 GAPDH에 대해 표준화된 GAPDH | 각각의 GAPDH에 대해 표준화된 REP-1 | V1의 REP-1에 대해 표준화된 REP-1 (%) | ||
84-31 | AAV2.V1 | 23416.844 | 19350.773 | 1 | 23416.844 | 100 |
AAV2.V2b | 36626.765 | 20357.894 | 1.011 | 36203.838 | 154.605 | |
AAV2.V2a | 31114.844 | 20315.945 | 1.009 | 30819.0684 | 131.610 | |
분자량 마커 | ||||||
COS-7 | AAV2.V1 | 12880.459 | 15479.288 | 1 | 12880.459 | 100 |
AAV2.V2b | 14321.167 | 14321.167 | 0.711 | 26991.925 | 209.557 | |
AAV2.V2a | 13145.924 | 13145.924 | 0.849 | 17818.595 | 138.338 |
84-31 세포에서 천연 CHM 대비 코돈-최적화된 CHM AAV2 벡터의 발현의 비교: 항-인간 REP-1 항체를 사용하여, AAV2.hCHM.V2a, V3a, V2b, V3b 및 V1로 형질도입된 84-31 세포의 웨스턴 블롯 분석은 모든 조건에서 ~ 75 내지 80 kDa에서 밴드를 검출하였다 (데이터는 제시하지 않음). 항-REP1 항체는 미처리 세포에서 무시할정도의 양의 REP-1 단백질을 검출하엿다. GAPDH 항체로의 블롯의 표지화는 미처리 세포를 포함한 모든 세포 용해물에서 ~ 39 kDa에서 밴드를 검출하였다. ImageJ 소프트웨어를 사용한 블롯의 밀도측정에 의한 평가 (발현 수준의 정량)는, 내인성 GAPDH 단백질의 생성에 대한 값을 표준화한 후에, AAV2.hCHM.V1과 비교하여 AAV2.hCHM.V2a, 3a, 2b 및 3b의 발현의 증가를 증명하였다. 결과에 대해서는 표 9 및 10을 참조한다.
구성물 | 원래의 값 | V1의 GAPDH에 대해 표준화된 GAPDH | 각각의 GAPDH에 대해 표준화된 REP-1 | V1의 REP-1에 대해 표준화된 REP-1 (%) | ||
명칭 | 레인 번호 | REP-1 | GAPDH | |||
AAV2.V1 | 1 | 23367.593 | 15155.602 | 1 | 23367.593 | 100 |
AAV2.V2a | 3 | 26949.421 | 10969.581 | 0.723797115 | 37233.39103 | 159.3377248 |
AAV2.V3a | 5 | 29867.714 | 14595.894 | 0.963069233 | 31013.0497 | 132.7182038 |
AAV2.V2b | 7 | 32728.128 | 14133.551 | 0.932562824 | 35094.82381 | 150.1858741 |
AAV2.V3b | 9 | 33986.543 | 13670.066 | 0.901981063 | 37679.88531 | 161.2484662 |
구성물 | 원래의 값 | V1의 GAPDH에 대해 표준화된 GAPDH | 각각의 GAPDH에 대해 표준화된 REP-1 |
V1의 REP-1에 대해 표준화된 REP-1 (%) |
||
명칭 | 레인 번호 | REP-1 | GAPDH | |||
AAV2.V1 | 2 | 23128.593 | 11993.823 | 1 | 23128.593 | 100 |
AAV2.V2a | 4 | 23623.836 | 10982.798 | 0.915704526 | 25798.53582 | 111.5439051 |
AAV2.V3a | 6 | 28832.543 | 13176.359 | 1.098595419 | 26244.91465 | 113.473892 |
AAV2.V2b | 8 | 31349.229 | 16028.329 | 1.336381986 | 23458.28463 | 101.4254721 |
AAV2.V3b | 10 | 33273.856 | 14760 | 1.230633469 | 27037.99047 | 116.9028763 |
84-31 세포에서 AAV8.V1, V2a, V3a, V2b, V3b 벡터의 천연 CHM 대비 코돈-최적화된 CHM의 발현의 비교: AAV8.V1, AAV8.V2a, AAV8.V3a, AAV8.2b, AAV8.3b로, 항-인간 REP-1 항체로 형질도입된 세포들의 분석은 모든 형질도입된 세포에서 ~75 내지 80 kDa에서 밴드를 검출하였다 (데이터는 제시하지 않음). 항-REP1 항체는 미처리 세포에서 무시해도 좋을 양의 REP-1 단백질을 검출하였다. 블롯의 GAPDH 항체로의 표지화는 미처리 세포를 포함하여, 모든 세포 용해물에서 ~ 39 kDa에서 밴드를 검출하였다. ImageJ 소프트웨어를 사용한 블롯의 밀도측정에 의한 평가는 AAV8.V1에 비교하여 AAV8.hCHM.V2a; 3a; 2b; 3b의 더 높은 발현을 증명하였다. 값들은 각각의 내인성 GAPDH 단백질의 발현에 대하여 CHM 값을 먼저 표준화한 훼, 버전 1의 평균 발현 수준에 대해 표준화하였다. 결과에 대해서는 표 11 및 표 12를 참조한다.
구성물 | 원래의 값 | V1의 GAPDH에 대해 표준화된 GAPDH | 각각의 GAPDH에 대해 표준화된 REP-1 | V1의 REP-1에 대해 표준화된 REP-1 (%) | ||
명칭 | 레인 번호 | REP-1 | GAPDH | |||
AAV8.V1 | 11 | 3630.589 | 20309.924 | 1 | 3630.589 | 100 |
AAV8.V2a | 13 | 7133.439 | 17051.48 | 0.839 | 8496.599 | 234.028 |
AAV8.V3a | 15 | 5828.418 | 15801.045 | 0.777 | 7491.575 | 206.346 |
AAV8.V2b | 17 | 11411.702 | 19249.681 | 0.947 | 12040.241 | 331.633 |
AAV8.V3b | 19 | 17610.066 | 18727.024 | 0.922 | 19098.555 | 526.045 |
구성물 | 원래의 값 | V1의 GAPDH에 대해 표준화된 GAPDH | 각각의 GAPDH에 대해 표준화된 REP-1 |
V1의 REP-1에 대해 표준화된 REP-1 (%) |
||
명칭 | 레인 번호 | REP-1 | GAPDH | |||
AAV8.V1 | 12 | 3507.468 | 19082.681 | 1 | 3507.468 | 100 |
AAV8.V2a | 14 | 4369.296 | 13274.731 | 0.695642871 | 6266.571801 | 178.6636913 |
AAV8.V3a | 16 | 6533.246 | 20720.246 | 1.0858142 | 6016.909708 | 171.5456765 |
AAV8.V2b | 18 | 13962.045 | 17842.167 | 0.934992677 | 14932.7854 | 425.7425983 |
AAV8.V3b | 20 | 16049.823 | 13836.368 | 0.725074637 | 22135.40811 | 631.0936581 |
결론: 비슷한 발현 연구는 차세대 AAV. hCHM. 버전 2a, 2b, 3a 및 3b를 지닌 AAV 벡터의 적용이 84-31 세포에서 AAV2 및 AAV8 혈청형 벡터 둘 다의 버전 1 (현재 임상 시험에서 사용됨)과 비교하여 REP-1 단백질의 증가된 생성을 유도하였음을 증명하였다.
실시예 6: qPCR 역가 분석에 의한 AAV 벡터 생성에 미치는 람다 스터퍼 효과의 평가
단일 qPCR (정량적 중합효소 사슬 반응) 작동을, DNA 불순물의 양에 미치는 람다 스터퍼 서열의 효과를 평가하기 위하여, 상기 표 2에 나타낸 8개의 모든 AAV 벡터에서 수행하였다. 선형화된 AAV 플라스미드 표준을 사용하여 검정 표준을 생성하였다. 프라이머-프로브 세트를 적절하게 포장된 AAV 게놈의 정량을 위해 CMV/CBA 프로모터 영역에 대해 또는 역 포장을 위해 카나마이신 내성 (KanR) 암호화 영역에 대해 디자인하였다. 표준 및 벡터 샘플을 두 세트에서 작동시켰는데, 하나에는 CMV/CBA 프라이머-프로브 세트가 있고 다른 하나에는 kANr 세트가 있었다. 벡터 샘플 값 (mL당 바이러스 게놈 복사물)을 각각의 표준 곡선으로부터 측정하였다. CMV/CBA 함유 서열에 반하는 각 벡터 로트의 KanR-함유 불순물의 상대적인 양을 비교함으로써 스터퍼 서열의 효과를 평가하였다.
시약:
도입유전자-함유 바이러스 벡터 역가:
기준: CMV-CBA 프로모터
프라이머: CMV-F: CCC ACT TGG CAG TAC ATC AA
CMV-R: GCC AAG 태그 GAA AGT CCC ATA A
FAM-프로브: /56-FAM/CA TAA TGC C/ZEN/A GGC GGG CCA TTT AC/3IABkFQ/
불순물-함유 바이러스 벡터 역가:
기준: 카나마이신 내성 유전자
프라이머:
KAN-F: GAT GGT CGG AAG TGG CAT AA
KAN-R: TGC GCC AGA GTT GTT TCT
FAM-프로브: /56-FAM/CC GTC AGC C/ZEN/A GTT 태그 TCT GAC CA/3IABkFQ/
희석 시약: 희석제 Q (뉴클레아제 유리 물 중의 0.001% PF-68): 멸균수로 100-배 희석된 1% PF-68 용액. 희석제 S: 희석제 Q + 2 ng/μL 연어 정자 DNA (Agilent technologies Cat# 201190)
ABI TaqManTM Universal 마스터 믹스 (Applied Biosystems 4304437/4326708)
Qiagen PCR 생성물 정제 키트 (Qiagen 28104)
* ABI QuantStudio 6 Flex 시스템
샘플 제조
Dnase 소화 용액을 다음을 조합함으로써 제조하였다: Dnase 완충제 (10X) 5 μL, 뉴클레아제-유리 H2O 30 μL, Dnase I (Invitrogen, 18068-015) 5 μL.
10 μL의 각각의 AAV 벡터 샘플을 혼합하고 주변 온도에서 10분 동안 인큐베이션하였다. 소화 혼합물을 50 μL의 SDS/EDTA/NaCl 용액 (0.2% SDS/5mM EDTA/0.2M NaCl)을 첨가하고 95℃에서 10분 동안 인큐베이션함으로써 비활성화하였다. 각각의 AAV 벡터 샘플을 qPCR 분석을 위해 희석제 S로 10 내지 100,000배 희석하였다.
qPCR 표준 제조
기준 표준 DNA (선형화됨)를 플라스미드 p1008 (스터퍼 없는 저 복사물 도입유전자 플라스미드)을 XhoI로 소화시키고 Qiagen PCR 정제 키트로 정제함으로써 준비하였다. 정제된 물질을 아가로오스 겔에서 분석하여 정체를 확인하고, Nanodrop에 의해 정량하였다. DNA 복사물 수를 다음의 등가물: 1 bp = 1.096E-21 g를 사용하여 스톡 농도로부터 측정하였다. qPCR 표준을 다음 표에 따라 제조하였다:
DNA 표준 | 농도 [복사물/10 μL] | 희석 |
표준 스톡 | 2 x 109 | NA |
S1 | 1 x 108 | 10 μL 스톡 + 190 μL 희석제 S |
S2 | 1 x 107 | 10 μL S1 + 90 μL 희석제 S |
S3 | 1 x 106 | 10 μL S2 + 90 μL 희석제 S |
S4 | 1 x 105 | 10 μL S3 + 90 μL 희석제 S |
S5 | 1 x 104 | 10 μL S4 + 90 μL 희석제 S |
S6 | 1 x 103 | 10 μL S5 + 90 μL 희석제 S |
PCR 반응 구성
추출한 DNA 샘플을 삼중으로 (3 웰) 단일 qPCR 작동으로 분석하였다. 작동은 삼중의 기준 DNA 표준을 웰당 103 내지 108 복사물 범위로 포함하였다. 주형이 없는 대조군 (NTC)을 음성 대조군으로서 포함시켰다. 각각의 AAV 벡터 제제를 CMV/CBA 및 KanR 프라이머/프로브 세트 두 가지로 분석하였다. 유사하게, 각 세트의 정량을 위해, 표준을 또한 CMV/CBA 및 KanR 프라이머/프로브 세트로 분석하였다.
시약 | 반응의 최종 농도 | 25 μL 반응당 부피 |
유니버살 마스터 믹스 (2x) | 1x | 12.5 μL |
최적화된 프라이머 믹스 (20 μM) | 0.8 μM | 1.0 μL |
Taqman 프로브 (10 μM) | 0.2 μM | 0.5 μL |
뉴클레아제-유리 물 | NA | 1.0 μL |
샘플/표준 | NA | 10.0 μL |
PCR 반응 서열을 다음과 같이 구성하였다: 50℃ 2분 1 사이클; 95℃ 10분 1 사이클; 95℃ 15초 40 사이클; 60℃ 1분 40 사이클.
작동 성능. 표준을 준비하여 웰당 103 내지 108 DNA 복사물로 작동시켰다. 검정 민감도가 이 실험에 대해서는 중요한 인자가 아니었기 때문에 검정의 하한선을 1000 복사물로 설정하였다. 표준 곡선을 표준의 표준 복사물 수 및 CT (한계 사이클) 값을 사용하여 작동에 대해 생성하였다. 표준의 선형 회귀를 ABI 소프트웨어를 사용하여 수행하였다 (데이터는 제시하지 않음). 표준 곡선 맞춤은 0.998 이상의 상관 계수 (R2 값)를 가졌고, 그것은 믿을만한 맞춤 모델임을 가리킨다. 표준 곡선의 기울기는 -3.5였다. 기울기를 증폭 반응의 효율을 계산하기 위해 사용하였고, -3.2 내지 -3.6의 값은 90% 내지 110%의 증폭 효율을 나타냈다. 두 표준 곡선은 92.6 내지 93.8% 효율로 작동되었다. 삼중 웰들의 정확도 범위는 2 내지 10%였는데, 그것은 복제물들 중에서 양호한 일치를 가리킨다. 주형이 없는 대조군 (NTC)은 검정의 하한선 아래의 정량할 수 없는 증폭을 초래하였다.
리포터 | 표적 | 기울기 | Y-절편 | R | 효율 (%) |
FAM | CMV | -3.513 | 41.896 | 0.998 | 92.597 |
FAM | KAN | -3.481 | 39.968 | 1.000 | 93.761 |
결과:
샘플 값 측정: 샘플 값 (AAV 게놈 및 역-포장 복사물 수)을 각각의 매칭 표준 곡선 (CMV/CBA 또는 KanR)으로부터, CT 값을 사용하여 내삽하였다. 내삽된 DNA 복사물 수를 초기 희석 및/또는 소화 희석에 대해 교정하였다. 2의 추가의 교정 인자를 샘플 중의 이중-가닥 DNA 표준과 단일-가닥 DNA 사이의 차이를 설명하기 위해 적용하였다.
8개의 AAV 벡터에 대한 분석 결과를, 도입유전자-함유 AAV 농도 (CMV/CBA)와 KanR-함유 불순물 농도 사이의 정량적 비교를 포함하여, 하기 표에 요약한다. 결과의 분석은 람다 스터퍼의 도입유전자 플라스미드로의 삽입이 AAV 생성 중에 플라스미드-골격 DNA (즉 KanR) 포장의 발생을 ~7 내지 20배나 효율적으로 감소시켰음을 증명한다 (도 11).
샘플 명칭 | 람다 스터퍼 | CMV/CBA qPCR (vg/ml) |
KanR qPCR (vg/ml) |
Kan 대비 CMV/CBA (%) |
AAV2.V2b | 없음 | 1.23E+13 | 6.46E+11 | 5.25% |
AAV2.V2a | 있음 | 4.61E+12 | 3.60E+10 | 0.78% |
AAV8.V2b | 없음 | 3.19E+13 | 1.43E+12 | 4.48% |
AAV8.V2a | 있음 | 2.90E+13 | 1.19E+11 | 0.41% |
AAV2.V3b | 없음 | 1.26E+13 | 6.69E+11 | 5.31% |
AAV2.V3a | 있음 | 6.33E+12 | 4.56E+10 | 0.72% |
AAV8.V3b | 없음 | 5.19E+13 | 3.07E+12 | 5.92% |
AAV8.V3a | 있음 | 2.60E+13 | 8.00E+10 | 0.31% |
실시예 6: 웨스턴 블롯에 의한 iPS 세포에서 차세대 AAV8 벡터의 시험관내 발현.
이 연구의 목적은 유도된 다능성 세포주 (iPSC)에서 코돈 최적화된 REP-1-암호화 유전자를 지닌 일련의 차세대 AAV2 및 AAV8 벡터를 사용한 유전자 전달 후에 AAV 매개된 CHM 발현의 능력을 평가하는 것이었다.
유도된 다능성 줄기 (iPS) 세포 기술은 눈 질환을 포함한 여러 개념 입증 및 유전자 요법 연구에서 유전자 요법 벡터를 시험하기 위한 플랫폼으로서 성공적으로 이용되어 왔다. 이런 환자-특이적 iPS 세포들은 질환 발병을 연구하고 관련된 동물 모델이 활용될 수 없는 유전자 요법의 개념 입증을 테스트하기 위한 모델을 수립하기 위한 가치있는 시험관내 모델 시스템을 제공한다. 범맥락막 위축 (CHM)에 대한 본 발명자들의 AAV-매개된 유전자 증대 요법을 테스트하기 위한 예비 단계로서, 본 발명자들은 Rab 에스코트 단백질 1 (REP-1)을 암호화하는, 원인이 되는 유전자, CHM에 돌연변이를 은닉하고 있는 인간 환자로부터 iPS 세포를 생성하였다 (실시예 1 참조)(방법은 NCP.003에서 기술됨). 생성된 iPS 세포를 본 발명자들의 차세대 AAV.코돈 최적화된.CHM 구성물의 시험관내 발현을 평가하기 위해 사용하였다.
플라스미드 및 벡터를 실시예 4에서 기술한 것과 같았다. 유도된 다능성 줄기 (iPS) 세포는 실험실에서, 다능성 상태로 역 리프로그래밍된 체세포, 말초혈 단핵 세포로부터 생성된 줄기 세포이다. 혈액 세포의 리프로그래밍은 치료 적용을 위해 개인화된 시험관내 세포 모델의 발생을 가능하게 한다. 이 보고서에서, CHM에 의해 영향을 받은 개체로부터의 iPS 세포를 웨스턴 블롯 분석을 통해 REP-1 단백질의 시험관내 생성을 테스트하기 위해 사용하였다. 다음의 표 (표 17)는 연구된 iPS 세포 및 그것들의 각각의 CHM 질환-유발 돌연변이의 상세한 설명을 기술한다.
세포주 | 영향 여부 | CHM의 돌연변이 | iPSC 생성 방법 |
JB 588 | 영향을 받음 | Arg 555 중단 | Sendai 바이러스 매개 리프로그래밍 |
JB 527* | 영향을 받음 | 엑손 2 내지 4 결실 | Sendai 바이러스 매개 리프로그래밍 |
JB 500* | 영향을 받음 | Ex 10c.1327_1327 del AT (확인 필요) |
Sendai 바이러스 매개 리프로그래밍 |
* iPS 세포주 정량 테스트는 진행 중이다.
연구 디자인 (예컨대 치료 그룹)
1. 12 웰 세포 배양 플레이트에 플레이팅된 iPS 세포를 AAV2. hCHM 버전 1, 버전 2a; 버전 2b; 버전 3a; 버전 3b (AAV2.V1; V2a; V2b; V3a; V3b)로 1E5 또는 3E5 중 어느 하나의 MOI로 감염시킨다. 24시간 동안의 형질도입 후에, 1 ml의 iPS 세포 배양 배지를 세포에 첨가하였다. 36 내지 48시간의 형질도입 후에, 세포를 수득하고, 용해시킨 후 SDS-PAGE와 이어서 웨스턴 블롯 분석에 대해 처리하였다. REP-1 단백질의 생성을 모든 버전의 구성물로 형질도입된 세포에서 평가하고 미처리 대조군과 비교하였다.
2. 파일럿 실험으로서, 12 웰 세포 배양 플레이트에 플레이팅된 3개의 상이한 iPS 세포주를 AAV8. hCHM 버전 1 및 AAV8. hCHM 버전 2a (AAV8.V1; AAV8.V2a)로 1E6의 MOI로 형질도입시킨다. iPS 세포주를 REP1 유전자에 미관련 돌연변이를 가진, 3명의 CHM 영향을 받은 개체로부터 취하여 이 목적에 대한 별도의 플레이트에 플레이팅하였다. 36 내지 48시간 후에, 세포를 수득하고 용해시켜서 웨스턴 블롯 분석을 수행한 후 미처리 세포 용해물과 비교하였다.
테스트 물질 투여
3.4.1 세포 배양
CHM 환자로부터 iPS 세포의 배양. 간단히 설명하면, iPS 세포를 5% CO2 및 5% O2가 보충된 환경에서 iPS 세포 배양 배지에서 37℃에서 마우스 배아 섬유모세포 (MEF, 공급자)에서 배양하였다.
3.4.2 형질도입을 위한 세포의 제조
세포를 시딩하기 전날에, 12-웰 접시를 참조 NCP.003 (NCP.003: CHM 환자 및 대조군으로부터의 iPS 세포의 배양)에서 기술한 것과 같이 Matrigel로 코팅하였다. iPS 세포를 각각의 AAV2 또는 AAV8 바이러스 벡터로 형질도입하기 전에, MEF에서 배양한 세포를 MEF가 없는 Matrigel에 시딩하였다 (공급자 없는 배양). 세포를 12-웰 세포 배양 접시의 각 웰에서 1 ml의 iPS 세포 배양 배지에 4.5+E5 내지 6+E5의 밀도로 시딩하였다. 시딩한 세포를 37℃에서 5% CO2, 5% O2가 보충된 환경에서 인큐베이션하였다.
3.4.3 형질도입
iPS 세포를 바이러스 벡터로 감염시키기 위하여, 세포를 대략 50 내지 60%의 집밀도까지 성장시켰다. (이것은 공급자 없는 조건에서 2 내지 4일이 걸릴 수 있다). 일단 50 내지 60%의 집밀도가 이루어지면, 12-웰 중 한개의 웰을 분리하고 세포 카운트를 수행하여 웰당 세포의 총 수를 측정한다. 그런 다음 iPS 세포의 웰을 소정의 MOI에서 하기 열거한 AAV 벡터로 감염시킨다 (표 18 및 19 참조). 형질도입 전에, 오래된 iPS 세포 배양 배지를 플레이트로부터 제거하고 신선한 1 ml의 iPS 세포 배양 배지를 각 웰에 첨가하였다. 스톡으로부터의 소정 부피의 바이러스를 직접 각 웰에 첨가하였다. 표 18 및 표 19 참조. 감염된 세포의 총수, 감염에 사용된 바이러스의 MOI 및 부피에 대한 정보에 대해. 세포를 다음에 37℃에서 5% CO2, 5% O2가 보충된 환경에서 18 내지 24시간 동안 인큐베이션하였다. 18 내지 24시간의 형질도입 후에, 세포를 현미경 하에서 임의의 비정상 또는 세포 사망에 대해 관찰하였다. 이 지점에서, 1 ml의 신선한 iPS 세포 배양 배지를 다시 감염 및 비감염 세포를 함유하고 있는 각 웰에 첨가하고, 추가로 37℃에서 5% CO2, 5% O2가 보충된 환경에서 추가의 18 내지 24시간 동안 인큐베이션하였다. 세포를 수득 전에 임의의 세포 사망 또는 비정상 출현에 대해 현미경 하에서 관찰하였다.
사용한 벡터 | 세포주 | 세포주 번호 | 세포 밀도 | 바이러스 스톡 농도 (vg/ml) | 사용한 벡터 (μL) |
MOI |
AAV2.V2a | iPSC | JB 588 | 6E5 | 2.16E+12 | 30 | 1E5 |
iPSC | JB 588 | 6E5 | 2.16E+12 | 90 | 3E5 | |
AAV2.V2b | iPSC | JB 588 | 6E5 | 7.4 E+12 | 8.1 | 1E5 |
iPSC | JB 588 | 6E5 | 7.4 E+12 | 24.3 | 3E5 | |
AAV2.V3a | iPSC | JB 588 | 6E5 | 4.82E+12 | 12.4 | 1E5 |
iPSC | JB 588 | 6E5 | 4.82E+12 | 37.3 | 3E5 | |
AAV2.V3b | iPSC | JB 588 | 6E5 | 5.91E+12 | 10.2 | 1E5 |
iPSC | JB 588 | 6E5 | 5.91E+12 | 30.5 | 3E5 | |
AAV2.V1 | iPSC | JB 588 | 6E5 | 4.47E+12 | 30.6 | 1E5 |
iPSC | JB 588 | 6E5 | 4.47E+12 | 40.9 | 3E5 |
사용한 벡터 |
세포주 | 세포주 번호 | 세포 밀도 | 바이러스 스톡 농도(vg/ml) | 사용한 벡터 (μL) | MOI |
미처리 | iPSC | JB 588 | 4.5 E5 | |||
AAV8.V2a | iPSC | JB 588 | 4.5 E5 | 1.04 E+13 | 43 | 1E6 |
미처리 | iPSC | JB 500 | 4.5 E5 | |||
AAV8.V1 | iPSC | JB 500 | 4.5 E5 | 1.39 E+13 | 32 | 1E6 |
미처리 | iPSC | JB 527 | 4.5 E5 | |||
AAV8.V1 | iPSC | JB 527 | 4.5 E5 | 1.39 E+13 | 32 | 1E6 |
AAV8.2a | iPSC | JB 527 | 4.5 E5 | 1.04 E+13 | 43 | 1E6 |
결과 측정 방법 - 웨스턴 블롯 분석을 본원에서 기술한 것과 같이 수행하였다.
결과
5.1 JB588 iPS 세포주에서 AAV2-hCHM V1, V2a, V2b, V3a, V3b의 발현: 단클론성 인간 REP-1-특이적 항체는 형질도입된 JB 588 iPS 세포에서 ~75 내지 80 kDa의 hREP-1 단백질을 검출하였다 (데이터는 제시하지 않음). 미처리 대조군의 경우에 밴드는 관찰되지 않았고, 그것은 질환의 존재를 확인해 주었다 (데이터는 제시하지 않음). 3E5의 MOI에서 REP-1 단백질 밴드의 강도는 1E5의 MOI에 비교하여 모든 벡터에서 더 강력한 것으로 관찰되었다. iPS 세포로의 hCHM 유전자의 재조합 AAV2. hCHM 바이러스 매개된 전달은 REP-1 단백질의 용량-의존성 생성을 초래하였다. 블롯의 GAPDH 항체로의 프로빙(probing)은 모든 용해물에서 동일한 밀도의 밴드를 나타냈다. GAPDH는 ~39 kDa에서 단백질을 검출하였다. REP-1 및 GAPDH 항체는 둘 다 예상한 분자량의 유일한 특이적 밴드를 검출하였다. 블롯에서 비특이적인 밴드는 관찰되지 않았다.
iPS 세포에서 AAV8 -hCHM. V1, V2a의 발현: 단클론성 인간 REP-1-특이적 항체는 형질도입된 JB527, JB500 및 JB588 환자 유래된 iPS 세포에서 하나의 단일한 ~75 내지 80 kDa의 REP-1 단백질을 검출하였다 (데이터는 제시하지 않음). 미처리 대조군의 경우에 밴드는 관찰되지 않았다 (데이터는 제시하지 않음). 블롯의 GAPDH 항체로의 프로빙은 미처리 세포로부터의 세포 용해물을 포함하여 모든 세포 용해물에서 동일한 밀도의 밴드를 나타냈다. 항-GAPDH 항체는 특이적인 ~39 kDa 단백질 밴드를 검출하였다. REP-1 및 GAPDH 항체는 둘 다 예상한 크기의 분자량에서 유일한 특이적 단백질 밴드를 검출하였다. 블롯에서 검출 가능한 비특이적 단백질 밴드는 관찰되지 않았다.
결론
현재 보고서에서 제공된 예비 결과는 다음의 관찰사항을 드러냈다: 웨스턴 블롯 분석은 3명의 환자-유래된 iPSC (JB588, JB500, JB527)의 각각에서 CHM의 존재 (REP-1 단백질의 결핍)를 확인해주었다. 시험관내 발현 연구는 CHM 환자로부터의 iPS 세포를 AAV2.hCHM. 버전 2a, 2b, 3a, 3b 및 AAV2.hCHM 버전 1 (현재 임상 시험 후보)로 감염시키는 것이 테스트된 모든 MOI에서 REP-1 단백질의 생성을 유도하였음을 증명하였다. iPS 세포를 1E6의 MOI에서 AAV8. hCHM.버전 2a 및 AAV8.hCHM 버전 1로 감염시키는 것은 3개의 모든 CHM iPS 세포주에서 REP1 단백질의 생성을 초래하였다. REP1 생성 수준은 AAV8.hCHM.V1보다 AAV8.hCHM.V2a로 감염된 iPS에서 더 높았다.
실시예 7: AAV8.코돈 최적화된.인간 CHM 대비 AAV.천연.인간 CHM의 생체내 발현의 비교
많은 망막 질환에 대한 유전자 요법은 적절한 표적 세포, 범맥락막 위축에 대해서는, 망막 색소 상피 (REP) 세포 및 광수용체 세포의 효율적인 형질도입에 의존한다. 이 연구 보고서는 천연 CHM 서열 기반 구성물, (버전 1) 및 야생형 마우스에서 AAV8 골격에 포장된 4개의 차세대 도입유전자 카세트에 의해 유도된 생체내 발현의 비교에 초점을 맞춘다. 여기서 본 발명자들은 광수용체 세포로의 유전자 전달을 개선할 목적으로 AAV8 혈청형을 평가하였다.
본 발명자들의 실험을 다음의 질문들에 답하기 위해 디자인하였다: a. 이 벡터들은 광수용체의 생체내 형질도입에 대해 어떻게 비교할 것인가? 특히, 차세대 AAV8. CHM은 각각의 테스트물의 망막밑 주입 후에 버전1.b와 비교하여 얼마나 효율적으로 광수용체를 형질도입시키는가? b. 용량 반응: 차세대 AAV8. CHM 및 AAV8. CHM-버전1 벡터는 유전자 발현의 용량 반응에서 상이할 것인가?
실험의 상세:
플라스미드 및 벡터는 실시예 4에서 기술한 것과 같았다. 마우스 (동물): 야생형, CD1 마우스를 REP-1 단백질의 생성에 의해 평가되는 것과 같이 CHM의 생체내 발현을 테스트하기 위해 사용하였다. CD1 마우스 스트레인은 이계교배된 스위스 마우스 스트레인이고, 본 발명자들은 내부에서 그 집단을 유지하였다. 연구의 상세는 CAROT 연구 프로토콜 PCPR02.01 하에 기술한다.
3.3 연구 디자인 (예컨대 치료 그룹)
3.3.1 동물 사육: 체중이 ~20 내지 30 그램인 수컷 및 암컷 마우스들 (~ 3 내지 4개월령)을 기술된 테스트물로 주입하였다. 동물들을 펜실베니아 대학교 (University of Pennsylvania)의 존 모르간 유니버시티 실험실 동물 자원 (John Morgan University Laboratory Animal Resources (ULAR)) 시설에서 펜실베니아 대학의 ULAR 규정에 따라 수용하였다. 마우스들을 12시간-빛/12시간-어둠 사이클로 유지하였다. 사료 및 물은 마음대로 먹을 수 있도록 제공하였다. 모든 동물을 귀의 태그 번호로 식별하였다.
3.4 테스트 물질 투여: CAROT Vector Core에 의해 제공된 테스트물 제제를 용량 투여를 위해 사용하였다. 테스트 물질을 -60 내지 -80℃에서 보관하였다. 테스트 물질을 투약 전에 얼음에서 해동시켰다. 안내 주입을 위해, 테스트물을 제제 표 20에 기술된 것과 같이 포스페이트-완충된 식염수로 표적 농도로 희석하였다. 총 60 μl의 마스터 믹스를 제조하였다.
확인 | 롯트 번호 | 벡터 농도 (vg/ml) |
총 60 μl에 대한 부피(μl) |
총 60 μl에 대한 PBS의 부피(μl) | 주입된 농도 (vg) | 총 부피 주입 (μl) |
AAV8.V2a | CT245 | 1.04E+13 | 1.92 | 58.1 | 5E8 | 1.5 μl |
19.2 | 40.8 | 5E9 | 1.5 μl | |||
AAV8.V2b | CT244 | 1.11E+13 | 1.8 | 58.2 | 5E8 | 1.5 μl |
18 | 42 | 5E9 | 1.5 μl | |||
AAV8.V3a | CT259 | 8.67E+12 | 2.31 | 57.7 | 5E8 | 1.5 μl |
23.1 | 36.9 | 5E9 | 1.5 μl | |||
AAV8.V3b | CT255 | 1.36E+13 | 1.47 | 58.53 | 5E8 | 1.5 μl |
14.7 | 45.3 | 5E9 | 1.5 μl | |||
AAV8.V1 | KA808 | 1.39E+13 | 1.44 | 58.6 | 5E8 | 1.5 μl |
14.4 | 45.6 | 5E9 | 1.5 μl |
망막밑 주입 전 주입 로그의 제조:
주입 로그를 테스트물의 망막밑 주입 전에 다음의 정보로 유지하였다:
* 케이지 번호/마우스 번호
* 연구 식별
* 스트레인
* 출생일
* 주입일
* 연구자/주입자 이름
* 주입된 눈 (좌측 또는 우측)
* 주입 물질 (벡터/혈청형)
* 용량 및 부피
* 투여 경로 (ROA)
망막밑 주입: 주입을 외과의사에 의해 망막밑 주입에 의해 수행하였다. 간단히 설명하면, 동물을 주입 전에 마취시켰다. 테스트물의 망막밑 주입을 Hamilton 33G 주사기를 사용하여 수행하였다. 테스트물 및 주입의 상세는 표 21에 기술한다. 제조된 주입 마스트 믹스로부터, 주입당 1.5 μl의 부피를 투여하였다. 동물 당 한 눈에 5E8 vg/눈으로 주입하고 반대쪽 눈에는 5E9 vg/눈으로 주입하였다.
Gr. 번호 | 동물의 최소 수 | ROA | 테스트 물질 확인 | 벡터 용량 (vg/ml) |
용량 부피 (μL/눈) |
투약일 (PD) |
||
좌안 | 우안 | 좌안 | 우안 | |||||
1 | 2 | 망막밑 | AAV8.V2a | 5+E8 | 5+E9 | 1.5 μL | 1.5 μL | 90 내지 120일 |
2 | 2 | 망막밑 | AAV8.V2b | 5+E8 | 5+E9 | 1.5 μL | 1.5 μL | 90 내지 120일 |
3 | 2 | 망막밑 | AAV8.V3a | 5+E8 | 5+E9 | 1.5 μL | 1.5 μL | 90 내지 120일 |
4 | 2 | 망막밑 | AAV8.V3b | 5+E8 | 5+E9 | 1.5 μL | 1.5 μL | 90 내지 120일 |
5 | 2 | 망막밑 | AAV8.V1 | 5+E8 | 5+E9 | 1.5 μL | 1.5 μL | 90 내지 120일 |
6 | 2 | 주입하지 않음 | 적용할 수 없음(N/A) | N/A | N/A | N/A | N/A | N/A |
결과 측정 방법
동물 희생; a. 테스트물을 동물에 주입한 후, 모든 동물을 48시간 동안 주입 후 관련 비정상에 대해 관찰하였다. B. 주입 후 21 내지 35일 동안, 동물을 검안경 검사에 의해 눈 비정상에 대해 관찰하였다. C. 주입 후 90 내지 12-일에 동물을 희생시키고 눈 조직을 수집하여 SDS-PAGE와 이어서 웨스턴 블롯 분석에 의해 외인성 REP-1 단백질의 생성을 평가하였다.
눈 조직의 수집: 웨스턴 블롯 분석을 위한 눈 조직을 예리한 수술용 칼을 사용하여 눈으로부터 수정체를 제거한 후에 수집하였다. 눈 (수정체 없음)을 적절하게 표지한 냉동기 튜브에 수집하였다.
웨스턴 블롯 분석
간단하게: 1. 조직 용해물의 제조
a. 차세대 AAV8. CHM 및 AAV8.V1의 2가지 상이한 용량을 주입한 동물들의 눈 조직을, 미주입 대조군 동물 조직과 함께, 주입 후 21 내지 35일 후에 동물을 희생시킴으로써 수집하였다. B. 그런 다음 조직을 프로테아제 억제제가 포함된 RIPA 완충액을 사용하여 얼음에서 용해시켰다.
c. 조직 용해물을 13,000 rpm에서 10분 동안의 원심분리에 의해 정화하였다.
2. 단백질의 정량 및 제조
a. 세포 용해물의 단백질 정량을 ThermoFisher Micro BCATM 단백질 검정 키트를 제조자의 설명을 따라 사용하여 수행하였다. B. 단백질 농도를 562 nm에서의 OD 판독값을 취함으로써 측정하였다. C. CHM의 생체내 발현을 평가하기 위하여, 20 내지 40 ug의 측정된 단백질을 4 내지 12%의 Bis-Tris 겔에 로딩하였다.
3. SDS-PAGE 및 웨스턴 블롯
단백질 겔을 니트로셀룰로오스 막에 옮기고, 우유로 차단한 후 일차 항체와 함께 인큐베이션하였다. 항-인간 REP-1 2F1 항체 (2F1, 1:1000 희석) 및/또는 항-GAPDH 항체 (1:1000 희석)를 일차 항체로서 사용하였다. 블롯을 세척한 후에, 1:5000의 농도의 HRP 콘쥬게이트된 항-마우스 IgG 항체 및/또는 항-토끼 IgG 항체를 이차 항체로서 사용하였다. 블롯을 ECL 시약을 제조자의 설명을 따라 사용하여 화학발광에 의해 전개시켰다.
4. 대조군
a) 로딩 대조군: 항-GAPDH 항체를 겔의 각 웰에서 단백질의 동등한 로딩을 증명하기 위한 로딩 대조군으로서 사용하였다. 항-GAPDH 항체는 ~39 kDa의 단백질을 검출한다. B) 양성 대조군: AAV2.V2a 형질도입된 COS-7 세포 용해물을 양성 대조군으로서 사용하였다. C) 음성 대조군: 미주입 동물의 눈 조직을 음성 대조군으로서 사용하였다.
샘플 값 측정
Image J 소프트웨어를 사용하는 웨스턴 블롯 분석의 정량. 간단히 설명하면, 이 보고서에서 제공된 밀도측정에 의한 평가는 먼저, 상응하는 샘플의 GAPDH 단백질의 내인성 발현 수준에 대해 표준화한다. 그런 다음 발현 수준은 다시 미주입 대조군의 평균 REP-1 발현 수준에 대해 표준화한다.
밀도측정에 의한 평가 및 REP-1 단백질의 발현을 나타내기 위한 배수 변화 계산의 상세를 표 22 및 23에 제시한다.
간단한 설명:
1. 표 22 및 23에서, 제 2 열은 GAPDH 단백질의 원래의 값을 나타내고 제 3 열은 REP-1 단백질의 원래의 값을 나타낸다.
2. 각 샘플의 GAPDH 값을 먼저 AAV8.V1의 동물-1의 GAPDH 값에 대해 표준화하였고, 표 22에서 네 번째 열에 나타낸다.
3. 각 샘플의 값을 또한 AAV8.V1의 동물-2의 GAPDH 값에 대해 표준화하였고, 표 22에서 다섯 번째 열에 나타낸다.
4. 그런 다음 REP-1 값 (제 3 열)을 동물 1에 대해 표준화된 GAPDH (제 4 열) 또는 앞서 동물 2에 대해 표준화된 GAPDH (제 5 열)에 대해 표준화한다. 이것들을 각각 제 6 및 제 7 열에 나타낸다.
5. 그런 다음 표준화된 REP-1 값을 배수 변화로 전환시킨다.
6. 각각의 REP-1 값을 AAV8.V1 주입된 그룹의 동물 1 또는 동물 2에서의 REP-1 발현에 대해 표준화하고 배수 변화로서 표시한다 (제 8 및 9 열).
7. 제 10 열은 REP-1 단백질 발현의 평균 배수 변화를 나타낸다.
결과
천연 CHM AAV8.V1 대비 코돈 최적화된 CHM 벡터: AAV8.V2a, V2b, V3a 및 V3b를 사용하는 CHM 발현의 비교: 야생형 마우스들을 2가지 상이한 용량: 5E9 vg/눈의 고용량 및 5E8 vg/눈의 저용량의 각각의 AAV8 벡터으로 주입하였다. 다음은 고용량 및 저용량의 AAV8.V1, AAV8.V2a 및 AAV8.V3a로 주입된 후의 REP1 단백질의 수준을 기술한다.
고용량 (5E9 vg/눈)의 바이러스 벡터로 주입된 동물에서 AAV8.V1 대비 AAV8.V2a 및 AAV8.V3a (스터퍼를 포함한 벡터)의 발현의 비교. 인간 항 REP-1 항체로의 웨스턴 블롯 분석은 차세대 AAV8.V2a 또는 V3a 또는 원래의 AAV8.버전1로 처리된 각 동물의 두 (저 및 고용량 주입) 눈 조직에서 ~ 75 내지 80 kDa hREP-1 단백질 밴드를 검출하였다. 매우 희미한 (최소) 밴드가 둘 다의 미주입 대조군 마우스의 경우에 관찰된다. 버전.1로 형질도입된 조직과 비교하여 증가된 강도의 밴드를 차세대 벡터 (AAV8V.2a 및 AAV8.V3a)로 형질도입된 조직에서 관찰하였다. 항-GAPDH 항체는 미주입 대조군을 포함하여 웨스턴 블롯의 모든 레인에서 동등한 밀도의 ~39 kDa 밴드를 나타냈다. 사전-염색된 단백질 마커를 관심의 단백질의 분자량을 비교하기 위해 사용한다. ImageJ 소프트웨어를 사용하는 블롯의 밀도측정에 의한 평가 (발현 수준의 정량)는 REP-1의 생성이 차세대 AAV8. 고용량 및 저용량 구성물 (V2a 또는 V3a) 중 하나로 주입된 동물에서 증가한 것을 증명하였다. (값에 대해 표 22 참조).
GAPDH | REP-1 | 버전1 동물 1의 GAPDH에 대해 표준화된 GAPDH | 버전1 동물 2의 GAPDH에 대해 표준화된 GAPDH | 각각의 GAPDH에 대해 표준화된 REP1(동물 1에 대해 표준화됨) | 각각의 GAPDH에 대해 표준화된 REP1(동물 2에 대해 표준화됨) | REP-1의 배수 변화 (동물 1에 대해 표준화됨) | REP-1의 배수 변화 (동물 2에 대해 표준화됨) | REP-1 발현의 평균 배수 변화 | |
AAV8.V2a | 12768.589 | 10058.359 | 1.055 | 1.190 | 9533.571 | 8450.521 | 2.335 | 3.742 | 3.038 |
AAV8.V2a | 11885.518 | 13247.510 | 0.982 | 1.108 | 13489.242 | 11956.812 | 3.303 | 5.294 | 4.299 |
AAV8.V3a | 12139.418 | 15542.551 | 1.003 | 1.132 | 15495.152 | 13734.843 | 3.794 | 6.081 | 4.938 |
AAV8.V3a | 11113.640 | 7274.388 | 0.918 | 1.036 | 7921.575 | 7021.653 | 1.940 | 3.109 | 2.524 |
AAV8.V1 | 12102.397 | 4083.761 | 1.000 | 1.128 | 4083.761 | 3619.830 | 1.000 | ||
AAV8.V1 | 10727.518 | 2258.477 | 0.886 | 1.000 | 2547.932 | 2258.477 | 1.000 |
GAPDH | REP-1 | 버전1 동물 1의 GAPDH에 대해 표준화된 GAPDH | 버전1 동물 2의 GAPDH에 대해 표준화된 GAPDH | 각각의 GAPDH에 대해 표준화된 REP1(동물 1에 대해 표준화됨) | 각각의 GAPDH에 대해 표준화된 REP1(동물 2에 대해 표준화됨) | REP-1의 배수 변화 (동물 1에 대해 표준화됨) | REP-1의 배수 변화 (동물 2에 대해 표준화됨) | REP-1 발현의 평균 배수 변화 | |
AAV8.V2a | 11815.489 | 11194.037 | 0.809 | 0.934 | 13844.203 | 11984.286 | 11.123 | 29.133 | 20.128 |
AAV8.V2a | 12889.418 | 7162.924 | 0.882 | 1.019 | 8120.634 | 7029.658 | 6.524 | 17.089 | 11.806 |
AAV8.V3a | 13088.418 | 1516.506 | 0.896 | 1.035 | 1693.128 | 1465.663 | 1.360 | 3.563 | 2.462 |
AAV8.V3a | 9201.075 | 593.192 | 0.630 | 0.727 | 942.084 | 815.519 | 0.757 | 1.982 | 1.370 |
AAV8.V1 | 14612.782 | 1244.678 | 1.000 | 1.155 | 1244.678 | 1077.460 | 1.000 | ||
AAV8.V1 | 12649.610 | 411.364 | 0.866 | 1.000 | 475.206 | 411.364 | 1.000 |
저용량 (5E8 vg/눈)의 바이러스 벡터로 주입된 동물에서 AAV8.V1 대비 AAV8.V2a 및 AAV8.V3a의 발현의 비교
인간 항 REP-1 항체, 5E8의 용량의 차세대 AAV8.V2a,V3a 및 AAV8.버전1로 주입된 동물의 눈 조직의 웨스턴 블롯 분석은 주입된 마우스의 조직에서 ~ 75 내지 80 kDa hREP-1 단백질 밴드를 검출하였다. REP-1의 희미한 (최소) 밴드가 둘 다의 미주입 대조군 마우스의 눈 조직 용해물에서 관찰되었다. 증가된 강도의 밴드가 버전 1로 형질도입된 용해물과 비교하여 차세대 벡터로 형질도입된 조직 용해물에서 관찰되었다. 항-GAPDH 항체는 모든 세포 용해물에서 ~39 kDa의 동등한 강도 단백질 밴드를 검출하였다. 이 데이터는 AAV8을 통한 차세대 V2a CHM 의 전달이 AAV8.V3a or AAV8.V1의 주입 후에 생성된 수준과 비교하여 REP-1 단백질의 왕성한 수준을 초래하였음을 증명한다.
ImageJ 소프트웨어를 사용하는 블롯의 밀도측정에 의한 평가 (발현 수준의 정량)는 버전 1과 비교하여 차세대 AAV8.CHM 구성물 (특히 V2a)로 주입된 동물에서 REP-1의 생성의 증가를 추가로 증명한다. 값에 대해 표 23 참조.
CD1 마우스에서 AAV8.V2b의 발현
이 현재의 연구 및 qPCR 역가 분석에 의한 AAV 벡터 생성에 미치는 람다 스터퍼의 평가를 동시에 수행하였다. 본 발명자들은 연구 프로토콜 PCPR.02에서 기술한 것과 같이 생체내 발현 연구를 위해 모든 동물 주입을 수행하였고 모든 샘플을 수득하였다. 람다 스터퍼 요소에 대한 qPCR 연구를 결론지은 후 (상기 기술함), 본 발명자들은 AAV8.2b 및 AAV8.3b와 같은 스터퍼가 없는 AAV 벡터의 발현을 테스트하기 위해서만 웨스턴 블롯 실험을 수행하기로 결정하였고, 그것들을 추가의 분석 (예컨대 버전 1과의 비교)에서 배제하였다.
인간 항-REP-1 항체는 5E9 (고용량) 벡터 게놈 복사물의 AAV8.2b로 주입된 CD-1 마우스의 눈 조직에서 ~75 내지 80 kDa의 단백질을 검출하였다 (도 12A). 5E8 (저용량)의 AAV8.2b로 주입된 동물은 ~75 내지 80 kDa에서 매우 희미한 단백질 밴드를 보였다 (도 12A). 미주입 대조군 동물로부터의 눈 조직의 용해물은 REP-1 단백질의 존재를 나타내지 않았다. 항-GAPDH 항체는 미처리 대조군을 포함하여 모든 눈 조직 용해물에서 ~39 kDa의 단백질을 검출하였다. 이 데이터는 AAV8.2b에 대한 최소 용량을 수립할 수 있다.
CD1 마우스에서 AAV8.3b의 발현
본 발명자들은 AAV8.3b 주입된 CD1 마우스 (2마리 마우스/그룹)의 눈 조직에 대한 웨스턴 블롯 분석을 항-REP-1 항체로 수행하였고, 저용량으로 주입된 한 눈에서 및 고용량의 AAV8.3b로 주입된 양 눈에서 ~75 내지 80 kDa의 단백질의 존재가 드러났다. 미주입 마우스의 눈 조직에서는 REP-1 발현 이 검출되지 않았다 (도 12 B). 생성된 REP-1의 수준은 AAV8.3b로 주입된 동물에서 용량 의존적이었다. 고용량의 AAV8.3b (5E9 벡터 게놈)의 주입은 자용량 (5E8 벡터 게놈) 주입된 눈과 비교하여 더 높은 양의 REP-1을 유도하였다. 항-GAPDH 항체는 모든 주입 및 미주입 동물의 눈 조직 용해물에서 ~39 kDa의 단백질을 검출하였다.
이 결과들은 다음의 관찰사항을 드러냈다:
1) 차세대 벡터 AAV8.버전2a, 2b, 3a 및 3b는 눈 조직을 효율적으로 형질도입시킬 수 있다. 2) 도입유전자 (코돈 최적화된 CHM)의 발현은 모든 차세대 벡터에 대해 검출 가능하였다. 3) 도입유전자 (코돈 최적화된 CHM)의 발현은 용량 의존적이다. 4) AAV8.버전2a 및 AAV8.버전.2b는 CD-1 마우스의 눈 조직에서 AAV8.버전 1과 비교하여 REP-1 단백질의 증가된 생성을 유도하였다. 5) 동일한 용량으로 주입된 눈 사이에서 형질도입을 유발하는 단백질 생성의 정확한 수준은 변동이 있고 그것은 수술적 전달 과정에서의 가변성을 반영한다. 그러나, 수준의 차이는 저용량 (5E8)과 고용량 (5E9) 사이에서 크다. 6) AAV8.CHM.V2a 및 AAV8.V3a는 마우스에서 망막밑으로의 고용량 (5E9 vg) 벡터의 생체내 투여 후에 AAV8.V1보다 훨씬 더 높은 수준의 REP-1 단백질 생성을 초래한다.
본 명세서에서 인용된 모든 간행물은, 2015년 12월 14일에 출원된 가특허 출원 번호 62/266,789를 포함하여, 그 전문이 본원에 참조로 포함된다. 유사하게, 본원에서 언급되고 첨부된 서열목록에서 나타난 SEQ ID NO들은 참조로 포함된다. 발명이 특정 구체예를 참조하여 기술된 한편으로, 발명의 사상으로부터 벗어나지 않으면서 변형이 이루어질 수 있다는 것이 인지될 것이다. 그러한 변형은 첨부된 청구범위의 범주 내에 속하는 것으로 의도된다.
서열 목록 자유 텍스트
SEQUENCE LISTING
<110> Trustees of the University of Pennsylvania
<120> AAV-REP-1 FOR GENE THERAPY FOR CHOROIDEREMIA AND ACHROMATOPSIA
<130> UPN-16-7660
<150> US 62/266,789
<151> 2015-12-14
<160> 29
<170> PatentIn version 3.5
<210> 1
<211> 1962
<212> DNA
<213> Artificial Sequence
<220>
<223> codon optimized sequence
<220>
<221> CDS
<222> (1)..(1962)
<400> 1
atg gct gat acc ctg ccc tct gaa ttc gac gtg att gtg att gga acc 48
Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val Ile Gly Thr
1 5 10 15
gga ctc cct gaa tcg atc atc gcc gcg gcc tgt tcc cgg tcc ggt cgg 96
Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg Ser Gly Arg
20 25 30
cgc gtg ctg cac gtc gat tcg aga agc tac tac gga ggg aat tgg gcc 144
Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly Asn Trp Ala
35 40 45
tca ttc tcc ttc tcc gga ctg ctc tcc tgg ctg aag gag tat cag gag 192
Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu Tyr Gln Glu
50 55 60
aac tcc gac att gtc tcc gac tca cct gtg tgg cag gac cag atc ctg 240
Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp Gln Ile Leu
65 70 75 80
gaa aac gag gaa gca ata gcc ctg agc cgg aag gac aag acc atc cag 288
Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys Thr Ile Gln
85 90 95
cac gtg gag gtg ttc tgt tat gcc tcc caa gac ctc cat gag gac gtg 336
His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His Glu Asp Val
100 105 110
gaa gag gct gga gcg ttg cag aag aat cat gcc ctc gtg acc tcc gct 384
Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val Thr Ser Ala
115 120 125
aac tcc acc gag gca gcc gac agc gcc ttc ctg ccg acc gag gat gaa 432
Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr Glu Asp Glu
130 135 140
tcc ctg tca act atg tcg tgc gaa atg ctg acc gaa cag act ccg agc 480
Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln Thr Pro Ser
145 150 155 160
tcc gac ccc gaa aac gcc ctg gaa gtg aac gga gcg gaa gtg acc ggc 528
Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu Val Thr Gly
165 170 175
gaa aag gag aac cat tgc gac gac aag act tgt gtc cca tcc act tcc 576
Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro Ser Thr Ser
180 185 190
gcg gag gac atg tcc gag aat gtg cct atc gcc gag gac acc acc gaa 624
Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp Thr Thr Glu
195 200 205
cag ccc aag aag aac aga atc acg tac agc cag atc atc aag gag ggg 672
Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile Lys Glu Gly
210 215 220
cgg agg ttt aac atc gat ctg gtg tcg aag ctg ctg tac agc cgc ggt 720
Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr Ser Arg Gly
225 230 235 240
ctg ctg atc gat ctg ctc att aag tcg aac gtg tcg aga tac gcc gag 768
Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg Tyr Ala Glu
245 250 255
ttc aag aac atc aca agg att ctc gcc ttc cgg gaa gga aga gtg gaa 816
Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly Arg Val Glu
260 265 270
caa gtg ccg tgc tcc cgg gcc gac gtg ttc aac tca aag caa ctt acc 864
Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys Gln Leu Thr
275 280 285
atg gtg gaa aag cgc atg ctg atg aaa ttc ctg acc ttc tgc atg gag 912
Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe Cys Met Glu
290 295 300
tac gaa aag tac cct gat gag tac aag ggt tac gaa gaa att act ttc 960
Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu Ile Thr Phe
305 310 315 320
tac gag tac ctc aag acc cag aag ctg acc ccg aat ctg cag tac att 1008
Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu Gln Tyr Ile
325 330 335
gtg atg cac tca atc gca atg acc tcc gaa acc gcc tcc tcg acc atc 1056
Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser Ser Thr Ile
340 345 350
gac ggg ctc aag gcc acc aag aac ttc ctg cac tgt ttg ggg cgc tac 1104
Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu Gly Arg Tyr
355 360 365
ggc aac act ccg ttc ctc ttc ccg ctg tac ggc cag gga gag ctg cct 1152
Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly Glu Leu Pro
370 375 380
cag tgt ttc tgc cgg atg tgc gcc gtg ttc ggc gga atc tac tgt ctc 1200
Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile Tyr Cys Leu
385 390 395 400
cgc cac tcg gtc cag tgc ctg gtg gtg gac aag gaa tcc agg aag tgc 1248
Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser Arg Lys Cys
405 410 415
aaa gcc att att gac cag ttc gga caa cgg atc att tcc gag cac ttt 1296
Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser Glu His Phe
420 425 430
ctt gtg gag gac tca tac ttc ccg gag aac atg tgc tct cgg gtc cag 1344
Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser Arg Val Gln
435 440 445
tat cga cag att tcc agg gcg gtg ctc att act gac cgg agc gtc ctc 1392
Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg Ser Val Leu
450 455 460
aag acc gat agc gac cag cag atc tcc atc ctg acc gtg ccg gcg gaa 1440
Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val Pro Ala Glu
465 470 475 480
gaa ccc ggc act ttt gcc gtg cgc gtg atc gag ctt tgc tca tcc acc 1488
Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys Ser Ser Thr
485 490 495
atg act tgc atg aaa ggc act tac ctg gtg cac ctg acg tgc acc tca 1536
Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr Cys Thr Ser
500 505 510
tcg aaa acc gct aga gag gac ctg gaa tcc gtc gtc caa aag ctg ttc 1584
Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln Lys Leu Phe
515 520 525
gtg cct tac acc gag atg gaa att gaa aac gaa caa gtg gag aag ccc 1632
Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val Glu Lys Pro
530 535 540
cgc atc ctt tgg gcc ctg tac ttt aac atg cgc gat tcc tcc gat atc 1680
Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser Ser Asp Ile
545 550 555 560
tcg cgg tcc tgc tat aac gac ttg cct tcg aac gtc tac gtc tgc tcc 1728
Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr Val Cys Ser
565 570 575
ggg cca gac tgc ggt ctt ggc aac gac aat gcc gtg aag cag gcg gaa 1776
Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys Gln Ala Glu
580 585 590
aca ctg ttc caa gag atc tgc cct aac gag gat ttt tgc ccg ccc ccc 1824
Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys Pro Pro Pro
595 600 605
cca aac ccc gag gat atc atc ttg gac gga gac agc ctg cag cca gaa 1872
Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu Gln Pro Glu
610 615 620
gca tcc gag tcc agc gcc atc ccg gag gcc aac agc gaa acc ttc aag 1920
Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu Thr Phe Lys
625 630 635 640
gag agc act aac ctg ggc aac ctg gaa gag tcc agc gaa tga 1962
Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu
645 650
<210> 2
<211> 653
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 2
Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val Ile Gly Thr
1 5 10 15
Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg Ser Gly Arg
20 25 30
Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly Asn Trp Ala
35 40 45
Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu Tyr Gln Glu
50 55 60
Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp Gln Ile Leu
65 70 75 80
Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys Thr Ile Gln
85 90 95
His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His Glu Asp Val
100 105 110
Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val Thr Ser Ala
115 120 125
Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr Glu Asp Glu
130 135 140
Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln Thr Pro Ser
145 150 155 160
Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu Val Thr Gly
165 170 175
Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro Ser Thr Ser
180 185 190
Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp Thr Thr Glu
195 200 205
Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile Lys Glu Gly
210 215 220
Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr Ser Arg Gly
225 230 235 240
Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg Tyr Ala Glu
245 250 255
Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly Arg Val Glu
260 265 270
Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys Gln Leu Thr
275 280 285
Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe Cys Met Glu
290 295 300
Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu Ile Thr Phe
305 310 315 320
Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu Gln Tyr Ile
325 330 335
Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser Ser Thr Ile
340 345 350
Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu Gly Arg Tyr
355 360 365
Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly Glu Leu Pro
370 375 380
Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile Tyr Cys Leu
385 390 395 400
Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser Arg Lys Cys
405 410 415
Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser Glu His Phe
420 425 430
Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser Arg Val Gln
435 440 445
Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg Ser Val Leu
450 455 460
Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val Pro Ala Glu
465 470 475 480
Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys Ser Ser Thr
485 490 495
Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr Cys Thr Ser
500 505 510
Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln Lys Leu Phe
515 520 525
Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val Glu Lys Pro
530 535 540
Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser Ser Asp Ile
545 550 555 560
Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr Val Cys Ser
565 570 575
Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys Gln Ala Glu
580 585 590
Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys Pro Pro Pro
595 600 605
Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu Gln Pro Glu
610 615 620
Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu Thr Phe Lys
625 630 635 640
Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu
645 650
<210> 3
<211> 1962
<212> DNA
<213> Homo sapiens
<220>
<221> CDS
<222> (1)..(1962)
<400> 3
atg gcg gat act ctc cct tcg gag ttt gat gtg atc gta ata ggg acg 48
Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val Ile Gly Thr
1 5 10 15
ggt ttg cct gaa tcc atc att gca gct gca tgt tca aga agt ggc cgg 96
Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg Ser Gly Arg
20 25 30
aga gtt ctg cat gtt gat tca aga agc tac tat gga gga aac tgg gcc 144
Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly Asn Trp Ala
35 40 45
agt ttt agc ttt tca gga cta ttg tcc tgg cta aag gaa tac cag gaa 192
Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu Tyr Gln Glu
50 55 60
aac agt gac att gta agt gac agt cca gtg tgg caa gac cag atc ctt 240
Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp Gln Ile Leu
65 70 75 80
gaa aat gaa gaa gcc att gct ctt agc agg aag gac aaa act att caa 288
Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys Thr Ile Gln
85 90 95
cat gtg gaa gta ttt tgt tat gcc agt cag gat ttg cat gaa gat gtc 336
His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His Glu Asp Val
100 105 110
gaa gaa gct ggt gca ctg cag aaa aat cat gct ctt gtg aca tct gca 384
Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val Thr Ser Ala
115 120 125
aac tcc aca gaa gct gca gat tct gcc ttc ctg cct acg gag gat gag 432
Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr Glu Asp Glu
130 135 140
tca tta agc act atg agc tgt gaa atg ctc aca gaa caa act cca agc 480
Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln Thr Pro Ser
145 150 155 160
agc gat cca gag aat gcg cta gaa gta aat ggt gct gaa gtg aca ggg 528
Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu Val Thr Gly
165 170 175
gaa aaa gaa aac cat tgt gat gat aaa act tgt gtg cca tca act tca 576
Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro Ser Thr Ser
180 185 190
gca gaa gac atg agt gaa aat gtg cct ata gca gaa gat acc aca gag 624
Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp Thr Thr Glu
195 200 205
caa cca aag aaa aac aga att act tac tca caa att att aaa gaa ggc 672
Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile Lys Glu Gly
210 215 220
agg aga ttt aat att gat tta gta tca aag ctg ctg tat tct cga gga 720
Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr Ser Arg Gly
225 230 235 240
tta cta att gat ctt cta atc aaa tct aat gtt agt cga tat gca gag 768
Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg Tyr Ala Glu
245 250 255
ttt aaa aat att acc agg att ctt gca ttt cga gaa gga cga gtg gaa 816
Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly Arg Val Glu
260 265 270
cag gtt ccg tgt tcc aga gca gat gtc ttt aat agc aaa caa ctt act 864
Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys Gln Leu Thr
275 280 285
atg gta gaa aag cga atg cta atg aaa ttt ctt aca ttt tgt atg gaa 912
Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe Cys Met Glu
290 295 300
tat gag aaa tat cct gat gaa tat aaa gga tat gaa gag atc aca ttt 960
Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu Ile Thr Phe
305 310 315 320
tat gaa tat tta aag act caa aaa tta acc ccc aac ctc caa tat att 1008
Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu Gln Tyr Ile
325 330 335
gtc atg cat tca att gca atg aca tca gag aca gcc agc agc acc ata 1056
Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser Ser Thr Ile
340 345 350
gat ggt ctc aaa gct acc aaa aac ttt ctt cac tgt ctt ggg cgg tat 1104
Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu Gly Arg Tyr
355 360 365
ggc aac act cca ttt ttg ttt cct tta tat ggc caa gga gaa ctc ccc 1152
Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly Glu Leu Pro
370 375 380
cag tgt ttc tgc agg atg tgt gct gtg ttt ggt gga att tat tgt ctt 1200
Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile Tyr Cys Leu
385 390 395 400
cgc cat tca gta cag tgc ctt gta gtg gac aaa gaa tcc aga aaa tgt 1248
Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser Arg Lys Cys
405 410 415
aaa gca att ata gat cag ttt ggt cag aga ata atc tct gag cat ttc 1296
Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser Glu His Phe
420 425 430
ctc gtg gag gac agt tac ttt cct gag aac atg tgc tca cgt gtg caa 1344
Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser Arg Val Gln
435 440 445
tac agg cag atc tcc agg gca gtg ctg att aca gat aga tct gtc cta 1392
Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg Ser Val Leu
450 455 460
aaa aca gat tca gat caa cag att tcc att ttg aca gtg cca gca gag 1440
Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val Pro Ala Glu
465 470 475 480
gaa cca gga act ttt gct gtt cgg gtc att gag tta tgt tct tca acg 1488
Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys Ser Ser Thr
485 490 495
atg aca tgc atg aaa ggc acc tat ttg gtt cat ttg act tgc aca tct 1536
Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr Cys Thr Ser
500 505 510
tct aaa aca gca aga gaa gat tta gaa tca gtt gtg cag aaa ttg ttt 1584
Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln Lys Leu Phe
515 520 525
gtt cca tat act gaa atg gag ata gaa aat gaa caa gta gaa aag cca 1632
Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val Glu Lys Pro
530 535 540
aga att ctg tgg gct ctt tac ttc aat atg aga gat tcg tca gac atc 1680
Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser Ser Asp Ile
545 550 555 560
agc agg agc tgt tat aat gat tta cca tcc aac gtt tat gtc tgc tct 1728
Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr Val Cys Ser
565 570 575
ggc cca gat tgt ggt tta gga aat gat aat gca gtc aaa cag gct gaa 1776
Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys Gln Ala Glu
580 585 590
aca ctt ttc cag gaa atc tgc ccc aat gaa gat ttc tgt ccc cct cca 1824
Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys Pro Pro Pro
595 600 605
cca aat cct gaa gac att atc ctt gat gga gac agt tta cag cca gag 1872
Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu Gln Pro Glu
610 615 620
gct tca gaa tcc agt gcc ata cca gag gct aac tcg gag act ttc aag 1920
Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu Thr Phe Lys
625 630 635 640
gaa agc aca aac ctt gga aac cta gag gag tcc tct gaa taa 1962
Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu
645 650
<210> 4
<211> 653
<212> PRT
<213> Homo sapiens
<400> 4
Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val Ile Gly Thr
1 5 10 15
Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg Ser Gly Arg
20 25 30
Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly Asn Trp Ala
35 40 45
Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu Tyr Gln Glu
50 55 60
Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp Gln Ile Leu
65 70 75 80
Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys Thr Ile Gln
85 90 95
His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His Glu Asp Val
100 105 110
Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val Thr Ser Ala
115 120 125
Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr Glu Asp Glu
130 135 140
Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln Thr Pro Ser
145 150 155 160
Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu Val Thr Gly
165 170 175
Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro Ser Thr Ser
180 185 190
Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp Thr Thr Glu
195 200 205
Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile Lys Glu Gly
210 215 220
Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr Ser Arg Gly
225 230 235 240
Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg Tyr Ala Glu
245 250 255
Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly Arg Val Glu
260 265 270
Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys Gln Leu Thr
275 280 285
Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe Cys Met Glu
290 295 300
Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu Ile Thr Phe
305 310 315 320
Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu Gln Tyr Ile
325 330 335
Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser Ser Thr Ile
340 345 350
Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu Gly Arg Tyr
355 360 365
Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly Glu Leu Pro
370 375 380
Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile Tyr Cys Leu
385 390 395 400
Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser Arg Lys Cys
405 410 415
Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser Glu His Phe
420 425 430
Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser Arg Val Gln
435 440 445
Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg Ser Val Leu
450 455 460
Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val Pro Ala Glu
465 470 475 480
Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys Ser Ser Thr
485 490 495
Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr Cys Thr Ser
500 505 510
Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln Lys Leu Phe
515 520 525
Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val Glu Lys Pro
530 535 540
Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser Ser Asp Ile
545 550 555 560
Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr Val Cys Ser
565 570 575
Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys Gln Ala Glu
580 585 590
Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys Pro Pro Pro
595 600 605
Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu Gln Pro Glu
610 615 620
Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu Thr Phe Lys
625 630 635 640
Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu
645 650
<210> 5
<211> 1985
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed plasmid
<220>
<221> misc_feature
<222> (1)..(8)
<223> NotI restriction site for subcloning into proviral plasmid
<220>
<221> misc_feature
<222> (4)..(16)
<223> Kozak consensus sequence
<220>
<221> CDS
<222> (13)..(1971)
<223> codon-optimized open reading frame (ORF)
<220>
<221> misc_feature
<222> (1972)..(1977)
<223> BclI restriction site with embedded stop codon/ site to add
optional epitope tag
<220>
<221> misc_feature
<222> (1980)..(1985)
<223> BamHI restriction site for subcloning into proviral plasmid
<400> 5
gcggccgcca cc atg gct gat acc ctg ccc tct gaa ttc gac gtg att gtg 51
Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val
1 5 10
att gga acc gga ctc cct gaa tcg atc atc gcc gcg gcc tgt tcc cgg 99
Ile Gly Thr Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg
15 20 25
tcc ggt cgg cgc gtg ctg cac gtc gat tcg aga agc tac tac gga ggg 147
Ser Gly Arg Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly
30 35 40 45
aat tgg gcc tca ttc tcc ttc tcc gga ctg ctc tcc tgg ctg aag gag 195
Asn Trp Ala Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu
50 55 60
tat cag gag aac tcc gac att gtc tcc gac tca cct gtg tgg cag gac 243
Tyr Gln Glu Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp
65 70 75
cag atc ctg gaa aac gag gaa gca ata gcc ctg agc cgg aag gac aag 291
Gln Ile Leu Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys
80 85 90
acc atc cag cac gtg gag gtg ttc tgt tat gcc tcc caa gac ctc cat 339
Thr Ile Gln His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His
95 100 105
gag gac gtg gaa gag gct gga gcg ttg cag aag aat cat gcc ctc gtg 387
Glu Asp Val Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val
110 115 120 125
acc tcc gct aac tcc acc gag gca gcc gac agc gcc ttc ctg ccg acc 435
Thr Ser Ala Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr
130 135 140
gag gat gaa tcc ctg tca act atg tcg tgc gaa atg ctg acc gaa cag 483
Glu Asp Glu Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln
145 150 155
act ccg agc tcc gac ccc gaa aac gcc ctg gaa gtg aac gga gcg gaa 531
Thr Pro Ser Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu
160 165 170
gtg acc ggc gaa aag gag aac cat tgc gac gac aag act tgt gtc cca 579
Val Thr Gly Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro
175 180 185
tcc act tcc gcg gag gac atg tcc gag aat gtg cct atc gcc gag gac 627
Ser Thr Ser Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp
190 195 200 205
acc acc gaa cag ccc aag aag aac aga atc acg tac agc cag atc atc 675
Thr Thr Glu Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile
210 215 220
aag gag ggg cgg agg ttt aac atc gat ctg gtg tcg aag ctg ctg tac 723
Lys Glu Gly Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr
225 230 235
agc cgc ggt ctg ctg atc gat ctg ctc att aag tcg aac gtg tcg aga 771
Ser Arg Gly Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg
240 245 250
tac gcc gag ttc aag aac atc aca agg att ctc gcc ttc cgg gaa gga 819
Tyr Ala Glu Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly
255 260 265
aga gtg gaa caa gtg ccg tgc tcc cgg gcc gac gtg ttc aac tca aag 867
Arg Val Glu Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys
270 275 280 285
caa ctt acc atg gtg gaa aag cgc atg ctg atg aaa ttc ctg acc ttc 915
Gln Leu Thr Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe
290 295 300
tgc atg gag tac gaa aag tac cct gat gag tac aag ggt tac gaa gaa 963
Cys Met Glu Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu
305 310 315
att act ttc tac gag tac ctc aag acc cag aag ctg acc ccg aat ctg 1011
Ile Thr Phe Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu
320 325 330
cag tac att gtg atg cac tca atc gca atg acc tcc gaa acc gcc tcc 1059
Gln Tyr Ile Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser
335 340 345
tcg acc atc gac ggg ctc aag gcc acc aag aac ttc ctg cac tgt ttg 1107
Ser Thr Ile Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu
350 355 360 365
ggg cgc tac ggc aac act ccg ttc ctc ttc ccg ctg tac ggc cag gga 1155
Gly Arg Tyr Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly
370 375 380
gag ctg cct cag tgt ttc tgc cgg atg tgc gcc gtg ttc ggc gga atc 1203
Glu Leu Pro Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile
385 390 395
tac tgt ctc cgc cac tcg gtc cag tgc ctg gtg gtg gac aag gaa tcc 1251
Tyr Cys Leu Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser
400 405 410
agg aag tgc aaa gcc att att gac cag ttc gga caa cgg atc att tcc 1299
Arg Lys Cys Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser
415 420 425
gag cac ttt ctt gtg gag gac tca tac ttc ccg gag aac atg tgc tct 1347
Glu His Phe Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser
430 435 440 445
cgg gtc cag tat cga cag att tcc agg gcg gtg ctc att act gac cgg 1395
Arg Val Gln Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg
450 455 460
agc gtc ctc aag acc gat agc gac cag cag atc tcc atc ctg acc gtg 1443
Ser Val Leu Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val
465 470 475
ccg gcg gaa gaa ccc ggc act ttt gcc gtg cgc gtg atc gag ctt tgc 1491
Pro Ala Glu Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys
480 485 490
tca tcc acc atg act tgc atg aaa ggc act tac ctg gtg cac ctg acg 1539
Ser Ser Thr Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr
495 500 505
tgc acc tca tcg aaa acc gct aga gag gac ctg gaa tcc gtc gtc caa 1587
Cys Thr Ser Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln
510 515 520 525
aag ctg ttc gtg cct tac acc gag atg gaa att gaa aac gaa caa gtg 1635
Lys Leu Phe Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val
530 535 540
gag aag ccc cgc atc ctt tgg gcc ctg tac ttt aac atg cgc gat tcc 1683
Glu Lys Pro Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser
545 550 555
tcc gat atc tcg cgg tcc tgc tat aac gac ttg cct tcg aac gtc tac 1731
Ser Asp Ile Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr
560 565 570
gtc tgc tcc ggg cca gac tgc ggt ctt ggc aac gac aat gcc gtg aag 1779
Val Cys Ser Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys
575 580 585
cag gcg gaa aca ctg ttc caa gag atc tgc cct aac gag gat ttt tgc 1827
Gln Ala Glu Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys
590 595 600 605
ccg ccc ccc cca aac ccc gag gat atc atc ttg gac gga gac agc ctg 1875
Pro Pro Pro Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu
610 615 620
cag cca gaa gca tcc gag tcc agc gcc atc ccg gag gcc aac agc gaa 1923
Gln Pro Glu Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu
625 630 635
acc ttc aag gag agc act aac ctg ggc aac ctg gaa gag tcc agc gaa 1971
Thr Phe Lys Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu
640 645 650
tgatcatagg atcc 1985
<210> 6
<211> 653
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 6
Met Ala Asp Thr Leu Pro Ser Glu Phe Asp Val Ile Val Ile Gly Thr
1 5 10 15
Gly Leu Pro Glu Ser Ile Ile Ala Ala Ala Cys Ser Arg Ser Gly Arg
20 25 30
Arg Val Leu His Val Asp Ser Arg Ser Tyr Tyr Gly Gly Asn Trp Ala
35 40 45
Ser Phe Ser Phe Ser Gly Leu Leu Ser Trp Leu Lys Glu Tyr Gln Glu
50 55 60
Asn Ser Asp Ile Val Ser Asp Ser Pro Val Trp Gln Asp Gln Ile Leu
65 70 75 80
Glu Asn Glu Glu Ala Ile Ala Leu Ser Arg Lys Asp Lys Thr Ile Gln
85 90 95
His Val Glu Val Phe Cys Tyr Ala Ser Gln Asp Leu His Glu Asp Val
100 105 110
Glu Glu Ala Gly Ala Leu Gln Lys Asn His Ala Leu Val Thr Ser Ala
115 120 125
Asn Ser Thr Glu Ala Ala Asp Ser Ala Phe Leu Pro Thr Glu Asp Glu
130 135 140
Ser Leu Ser Thr Met Ser Cys Glu Met Leu Thr Glu Gln Thr Pro Ser
145 150 155 160
Ser Asp Pro Glu Asn Ala Leu Glu Val Asn Gly Ala Glu Val Thr Gly
165 170 175
Glu Lys Glu Asn His Cys Asp Asp Lys Thr Cys Val Pro Ser Thr Ser
180 185 190
Ala Glu Asp Met Ser Glu Asn Val Pro Ile Ala Glu Asp Thr Thr Glu
195 200 205
Gln Pro Lys Lys Asn Arg Ile Thr Tyr Ser Gln Ile Ile Lys Glu Gly
210 215 220
Arg Arg Phe Asn Ile Asp Leu Val Ser Lys Leu Leu Tyr Ser Arg Gly
225 230 235 240
Leu Leu Ile Asp Leu Leu Ile Lys Ser Asn Val Ser Arg Tyr Ala Glu
245 250 255
Phe Lys Asn Ile Thr Arg Ile Leu Ala Phe Arg Glu Gly Arg Val Glu
260 265 270
Gln Val Pro Cys Ser Arg Ala Asp Val Phe Asn Ser Lys Gln Leu Thr
275 280 285
Met Val Glu Lys Arg Met Leu Met Lys Phe Leu Thr Phe Cys Met Glu
290 295 300
Tyr Glu Lys Tyr Pro Asp Glu Tyr Lys Gly Tyr Glu Glu Ile Thr Phe
305 310 315 320
Tyr Glu Tyr Leu Lys Thr Gln Lys Leu Thr Pro Asn Leu Gln Tyr Ile
325 330 335
Val Met His Ser Ile Ala Met Thr Ser Glu Thr Ala Ser Ser Thr Ile
340 345 350
Asp Gly Leu Lys Ala Thr Lys Asn Phe Leu His Cys Leu Gly Arg Tyr
355 360 365
Gly Asn Thr Pro Phe Leu Phe Pro Leu Tyr Gly Gln Gly Glu Leu Pro
370 375 380
Gln Cys Phe Cys Arg Met Cys Ala Val Phe Gly Gly Ile Tyr Cys Leu
385 390 395 400
Arg His Ser Val Gln Cys Leu Val Val Asp Lys Glu Ser Arg Lys Cys
405 410 415
Lys Ala Ile Ile Asp Gln Phe Gly Gln Arg Ile Ile Ser Glu His Phe
420 425 430
Leu Val Glu Asp Ser Tyr Phe Pro Glu Asn Met Cys Ser Arg Val Gln
435 440 445
Tyr Arg Gln Ile Ser Arg Ala Val Leu Ile Thr Asp Arg Ser Val Leu
450 455 460
Lys Thr Asp Ser Asp Gln Gln Ile Ser Ile Leu Thr Val Pro Ala Glu
465 470 475 480
Glu Pro Gly Thr Phe Ala Val Arg Val Ile Glu Leu Cys Ser Ser Thr
485 490 495
Met Thr Cys Met Lys Gly Thr Tyr Leu Val His Leu Thr Cys Thr Ser
500 505 510
Ser Lys Thr Ala Arg Glu Asp Leu Glu Ser Val Val Gln Lys Leu Phe
515 520 525
Val Pro Tyr Thr Glu Met Glu Ile Glu Asn Glu Gln Val Glu Lys Pro
530 535 540
Arg Ile Leu Trp Ala Leu Tyr Phe Asn Met Arg Asp Ser Ser Asp Ile
545 550 555 560
Ser Arg Ser Cys Tyr Asn Asp Leu Pro Ser Asn Val Tyr Val Cys Ser
565 570 575
Gly Pro Asp Cys Gly Leu Gly Asn Asp Asn Ala Val Lys Gln Ala Glu
580 585 590
Thr Leu Phe Gln Glu Ile Cys Pro Asn Glu Asp Phe Cys Pro Pro Pro
595 600 605
Pro Asn Pro Glu Asp Ile Ile Leu Asp Gly Asp Ser Leu Gln Pro Glu
610 615 620
Ala Ser Glu Ser Ser Ala Ile Pro Glu Ala Asn Ser Glu Thr Phe Lys
625 630 635 640
Glu Ser Thr Asn Leu Gly Asn Leu Glu Glu Ser Ser Glu
645 650
<210> 7
<211> 9187
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed plasmid
<220>
<221> misc_feature
<222> (1)..(145)
<223> 5' ITR
<220>
<221> promoter
<222> (169)..(1786)
<223> CMV.CBA promoter
<220>
<221> misc_feature
<222> (1787)..(1794)
<223> Not I cloning site, cuts at 1789
<220>
<221> misc_feature
<222> (1805)..(1810)
<223> BamHI cloning site, cuts at 1806
<220>
<221> polyA_signal
<222> (1850)..(2052)
<223> BGH PolyA
<220>
<221> misc_feature
<222> (2109)..(2252)
<223> 3' ITR
<220>
<221> misc_feature
<222> (2571)..(6624)
<223> lambda stuffer
<220>
<221> misc_feature
<222> (7314)..(8126)
<223> Kanamycin resistance (complementary)
<220>
<221> misc_feature
<222> (8485)..(9128)
<223> Origin of replication (complementary)
<400> 7
tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc 60
ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 120
ctgcggccta gtaggctcag aggcacacag gagtttctgc aaatctagtg caggcgttac 180
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420
cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaacatggt 480
cgaggtgagc cccacgttct gcttcactct ccccatctcc cccccctccc cacccccaat 540
tttgtattta tttatttttt aattattttg tgcagcgatg ggggcggggg gggggggggg 600
gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc ggagaggtgc 660
ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct tttatggcga ggcggcggcg 720
gcggcggccc tataaaaagc gaagcgcgcg gcgggcgggg agtcgctgcg acgctgcctt 780
cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg 840
ttactcccac aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg 900
gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag 960
ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc 1020
gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt 1080
tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg 1140
gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg 1200
ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag 1260
cacggcccgg cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg 1320
ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag 1380
ggctcggggg aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc 1440
cgcagccatt gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa 1500
atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg 1560
aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc 1620
cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg 1680
gggggacggg gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagacaattg 1740
tactaacctt cttctctttc ctctcctgac aggttggtgt acactagcgg ccgcatagta 1800
ctgcggatcc tgcagatctc gagccgaatt cctgcagccc gggggatcag cctcgactgt 1860
gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 1920
aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 1980
taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 2040
agacaatagc aggcatgctg gggatgcggt gggctctatg gcttctgagg cggaaagaac 2100
cagctggggc tcgagatcca ctagggccgc aggaacccct agtgatggag ttggccactc 2160
cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 2220
gctttgcccg ggcggcctca gtgagcgagc gacctgcagg ggcagcttga aggaaatact 2280
aaggcaaagg tactgcaagt gctcgcaaca ttcgcttatg cggattattg ccgtagtgcc 2340
gcgacgccgg gggcaagatg cagagattgc catggtacag gccgtgcggt tgatattgcc 2400
aaaacagagc tgtgggggag agttgtcgag aaagagtgcg gaagatgcaa aggcgtcggc 2460
tattcaagga tgccagcaag cgcagcatat cgcgctgtga cgatgctaat cccaaacctt 2520
acccaaccca cctggtcacg cactgttaag ccgctgtatg acgctctggt ggtgcaatgc 2580
cacaaagaag agtcaatcgc agacaacatt ttgaatgcgg tcacacgtta gcagcatgat 2640
tgccacggat ggcaacatat taacggcatg atattgactt attgaataaa attgggtaaa 2700
tttgactcaa cgatgggtta attcgctcgt tgtggtagtg agatgaaaag aggcggcgct 2760
tactaccgat tccgcctagt tggtcacttc gacgtatcgt ctggaactcc aaccatcgca 2820
ggcagagagg tctgcaaaat gcaatcccga aacagttcgc aggtaatagt tagagcctgc 2880
ataacggttt cgggattttt tatatctgca caacaggtaa gagcattgag tcgataatcg 2940
tgaagagtcg gcgagcctgg ttagccagtg ctctttccgt tgtgctgaat taagcgaata 3000
ccggaagcag aaccggatca ccaaatgcgt acaggcgtca tcgccgccca gcaacagcac 3060
aacccaaact gagccgtagc cactgtctgt cctgaattca ttagtaatag ttacgctgcg 3120
gccttttaca catgaccttc gtgaaagcgg gtggcaggag gtcgcgctaa caacctcctg 3180
ccgttttgcc cgtgcatatc ggtcacgaac aaatctgatt actaaacaca gtagcctgga 3240
tttgttctat cagtaatcga ccttattcct aattaaatag agcaaatccc cttattgggg 3300
gtaagacatg aagatgccag aaaaacatga cctgttggcc gccattctcg cggcaaagga 3360
acaaggcatc ggggcaatcc ttgcgtttgc aatggcgtac cttcgcggca gatataatgg 3420
cggtgcgttt acaaaaacag taatcgacgc aacgatgtgc gccattatcg cctggttcat 3480
tcgtgacctt ctcgacttcg ccggactaag tagcaatctc gcttatataa cgagcgtgtt 3540
tatcggctac atcggtactg actcgattgg ttcgcttatc aaacgcttcg ctgctaaaaa 3600
agccggagta gaagatggta gaaatcaata atcaacgtaa ggcgttcctc gatatgctgg 3660
cgtggtcgga gggaactgat aacggacgtc agaaaaccag aaatcatggt tatgacgtca 3720
ttgtaggcgg agagctattt actgattact ccgatcaccc tcgcaaactt gtcacgctaa 3780
acccaaaact caaatcaaca ggcgccggac gctaccagct tctttcccgt tggtgggatg 3840
cctaccgcaa gcagcttggc ctgaaagact tctctccgaa aagtcaggac gctgtggcat 3900
tgcagcagat taaggagcgt ggcgctttac ctatgattga tcgtggtgat atccgtcagg 3960
caatcgaccg ttgcagcaat atctgggctt cactgccggg cgctggttat ggtcagttcg 4020
agcataaggc tgacagcctg attgcaaaat tcaaagaagc gggcggaacg gtcagagaga 4080
ttgatgtatg agcagagtca ccgcgattat ctccgctctg gttatctgca tcatcgtctg 4140
cctgtcatgg gctgttaatc attaccgtga taacgccatt acctacaaag cccagcgcga 4200
caaaaatgcc agagaactga agctggcgaa cgcggcaatt actgacatgc agatgcgtca 4260
gcgtgatgtt gctgcgctcg atgcaaaata cacgaaggag ttagctgatg ctaaagctga 4320
aaatgatgct ctgcgtgatg atgttgccgc tggtcgtcgt cggttgcaca tcaaagcagt 4380
ctgtcagtca gtgcgtgaag ccaccaccgc ctccggcgtg gataatgcag cctccccccg 4440
actggcagac accgctgaac gggattattt caccctcaga gagaggctga tcactatgca 4500
aaaacaactg gaaggaaccc agaagtatat taatgagcag tgcagataga gttgcccata 4560
tcgatgggca actcatgcaa ttattgtgag caatacacac gcgcttccag cggagtataa 4620
atgcctaaag taataaaacc gagcaatcca tttacgaatg tttgctgggt ttctgtttta 4680
acaacatttt ctgcgccgcc acaaattttg gctgcatcga cagttttctt ctgcccaatt 4740
ccagaaacga agaaatgatg ggtgatggtt tcctttggtg ctactgctgc cggtttgttt 4800
tgaacagtaa acgtctgttg agcacatcct gtaataagca gggccagcgc agtagcgagt 4860
agcatttttt tcatggtgtt attcccgatg ctttttgaag ttcgcagaat cgtatgtgta 4920
gaaaattaaa caaaccctaa acaatgagtt gaaatttcat attgttaata tttattaatg 4980
tatgtcaggt gcgatgaatc gtcattgtat tcccggatta actatgtcca cagccctgac 5040
ggggaacttc tctgcgggag tgtccgggaa taattaaaac gatgcacaca gggtttagcg 5100
cgtacacgta ttgcattatg ccaacgcccc ggtgctgaca cggaagaaac cggacgttat 5160
gatttagcgt ggaaagattt gtgtagtgtt ctgaatgctc tcagtaaata gtaatgaatt 5220
atcaaaggta tagtaatatc ttttatgttc atggatattt gtaacccatc ggaaaactcc 5280
tgctttagca agattttccc tgtattgctg aaatgtgatt tctcttgatt tcaacctatc 5340
ataggacgtt tctataagat gcgtgtttct tgagaattta acatttacaa cctttttaag 5400
tccttttatt aacacggtgt tatcgttttc taacacgatg tgaatattat ctgtggctag 5460
atagtaaata taatgtgaga cgttgtgacg ttttagttca gaataaaaca attcacagtc 5520
taaatctttt cgcacttgat cgaatatttc tttaaaaatg gcaacctgag ccattggtaa 5580
aaccttccat gtgatacgag ggcgcgtagt ttgcattatc gtttttatcg tttcaatctg 5640
gtctgacctc cttgtgtttt gttgatgatt tatgtcaaat attaggaatg ttttcactta 5700
atagtattgg ttgcgtaaca aagtgcggtc ctgctggcat tctggaggga aatacaaccg 5760
acagatgtat gtaaggccaa cgtgctcaaa tcttcataca gaaagatttg aagtaatatt 5820
ttaaccgcta gatgaagagc aagcgcatgg agcgacaaaa tgaataaaga acaatctgct 5880
gatgatccct ccgtggatct gattcgtgta aaaaatatgc ttaatagcac catttctatg 5940
agttaccctg atgttgtaat tgcatgtata gaacataagg tgtctctgga agcattcaga 6000
gcaattgagg cagcgttggt gaagcacgat aataatatga aggattattc cctggtggtt 6060
gactgatcac cataactgct aatcattcaa actatttagt ctgtgacaga gccaacacgc 6120
agtctgtcac tgtcaggaaa gtggtaaaac tgcaactcaa ttactgcaat gccctcgtaa 6180
ttaagtgaat ttacaatatc gtcctgttcg gagggaagaa cgcgggatgt tcattcttca 6240
tcacttttaa ttgatgtata tgctctcttt tctgacgtta gtctccgacg gcaggcttca 6300
atgacccagg ctgagaaatt cccggaccct ttttgctcaa gagcgatgtt aatttgttca 6360
atcatttggt taggaaagcg gatgttgcgg gttgttgttc tgcgggttct gttcttcgtt 6420
gacatgaggt tgccccgtat tcagtgtcgc tgatttgtat tgtctgaagt tgtttttacg 6480
ttaagttgat gcagatcaat taatacgata cctgcgtcat aattgattat ttgacgtggt 6540
ttgatggcct ccacgcacgt tgtgatatgt agatgataat cattatcact ttacgggtcc 6600
tttccggtga tccgacaggt tacggcctga tgcggtattt tctccttacg catctgtgcg 6660
gtatttcaca ccgcatacgt caaagcaacc atagtacgcg ccctgtagcg gcgcattaag 6720
cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg ccctagcgcc 6780
cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc cccgtcaagc 6840
tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc tcgaccccaa 6900
aaaacttgat ttgggtgatg gttcacgtag tgggccatcg ccctgataga cggtttttcg 6960
ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa ctggaacaac 7020
actcaaccct atctcgggct attcttttga tttagacctg caggcatgca agcttactgg 7080
ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt aatcgccttg 7140
cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc gatcgccctt 7200
cccaacagtt gcgcagcctg aatggcgaat gcgatttatt caacaaagcc gccgtcccgt 7260
caagtcagcg taatgctctg ccagtgttac aaccaattaa ccaattctga ttagaaaaac 7320
tcatcgagca tcaaatgaaa ctgcaattta ttcatatcag gattatcaat accatatttt 7380
tgaaaaagcc gtttctgtaa tgaaggagaa aactcaccga ggcagttcca taggatggca 7440
agatcctggt atcggtctgc gattccgact cgtccaacat caatacaacc tattaatttc 7500
ccctcgtcaa aaataaggtt atcaagtgag aaatcaccat gagtgacgac tgaatccggt 7560
gagaatggca aaagcttatg catttctttc cagacttgtt caacaggcca gccattacgc 7620
tcgtcatcaa aatcactcgc atcaaccaaa ccgttattca ttcgtgattg cgcctgagcg 7680
agacgaaata cgcgatcgct gttaaaagga caattacaaa caggaatcga atgcaaccgg 7740
cgcaggaaca ctgccagcgc atcaacaata ttttcacctg aatcaggata ttcttctaat 7800
acctggaatg ctgttttccc ggggatcgca gtggtgagta accatgcatc atcaggagta 7860
cggataaaat gcttgatggt cggaagaggc ataaattccg tcagccagtt tagtctgacc 7920
atctcatctg taacatcatt ggcaacgcta cctttgccat gtttcagaaa caactctggc 7980
gcatcgggct tcccatacaa tcgatagatt gtcgcacctg attgcccgac attatcgcga 8040
gcccatttat acccatataa atcagcatcc atgttggaat ttaatcgcgg cttcgagcaa 8100
gacgtttccc gttgaatatg gctcataaca ccccttgtat tactgtttat gtaagcagac 8160
agttttattg ttcatgatga tatattttta tcttgtgcaa tgtaacatca gagattttga 8220
gacacaacgt ggctttgttg aataaatcga acttttgctg agttgaagga tcagatcacg 8280
catcttcccg acaacgcaga ccgttccgtg gcaaagcaaa agttcaaaat caccaactgg 8340
tccacctaca acaaagctct catcaaccgt ggctccctca ctttctggct ggatgatggg 8400
gcgattcagg cctggtatga gtcagcaaca ccttcttcac gaggcagacc tctcgacgga 8460
tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 8520
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 8580
ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 8640
ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa gaactctgta 8700
gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 8760
aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 8820
ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 8880
agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 8940
aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 9000
aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 9060
ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 9120
cggttcctgg ccttttgctg gccttttgct cacatgtcct gcaggcagct gcgcgccagc 9180
tgcgcgc 9187
<210> 8
<211> 11148
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed plasmid
<400> 8
tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc 60
ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 120
ctgcggccta gtaggctcag aggcacacag gagtttctgc aaatctagtg caggcgttac 180
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420
cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaacatggt 480
cgaggtgagc cccacgttct gcttcactct ccccatctcc cccccctccc cacccccaat 540
tttgtattta tttatttttt aattattttg tgcagcgatg ggggcggggg gggggggggg 600
gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc ggagaggtgc 660
ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct tttatggcga ggcggcggcg 720
gcggcggccc tataaaaagc gaagcgcgcg gcgggcgggg agtcgctgcg acgctgcctt 780
cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg 840
ttactcccac aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg 900
gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag 960
ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc 1020
gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt 1080
tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg 1140
gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg 1200
ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag 1260
cacggcccgg cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg 1320
ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag 1380
ggctcggggg aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc 1440
cgcagccatt gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa 1500
atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg 1560
aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc 1620
cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg 1680
gggggacggg gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagacaattg 1740
tactaacctt cttctctttc ctctcctgac aggttggtgt acactagcgg ccgccaccat 1800
ggctgatacc ctgccctctg aattcgacgt gattgtgatt ggaaccggac tccctgaatc 1860
gatcatcgcc gcggcctgtt cccggtccgg tcggcgcgtg ctgcacgtcg attcgagaag 1920
ctactacgga gggaattggg cctcattctc cttctccgga ctgctctcct ggctgaagga 1980
gtatcaggag aactccgaca ttgtctccga ctcacctgtg tggcaggacc agatcctgga 2040
aaacgaggaa gcaatagccc tgagccggaa ggacaagacc atccagcacg tggaggtgtt 2100
ctgttatgcc tcccaagacc tccatgagga cgtggaagag gctggagcgt tgcagaagaa 2160
tcatgccctc gtgacctccg ctaactccac cgaggcagcc gacagcgcct tcctgccgac 2220
cgaggatgaa tccctgtcaa ctatgtcgtg cgaaatgctg accgaacaga ctccgagctc 2280
cgaccccgaa aacgccctgg aagtgaacgg agcggaagtg accggcgaaa aggagaacca 2340
ttgcgacgac aagacttgtg tcccatccac ttccgcggag gacatgtccg agaatgtgcc 2400
tatcgccgag gacaccaccg aacagcccaa gaagaacaga atcacgtaca gccagatcat 2460
caaggagggg cggaggttta acatcgatct ggtgtcgaag ctgctgtaca gccgcggtct 2520
gctgatcgat ctgctcatta agtcgaacgt gtcgagatac gccgagttca agaacatcac 2580
aaggattctc gccttccggg aaggaagagt ggaacaagtg ccgtgctccc gggccgacgt 2640
gttcaactca aagcaactta ccatggtgga aaagcgcatg ctgatgaaat tcctgacctt 2700
ctgcatggag tacgaaaagt accctgatga gtacaagggt tacgaagaaa ttactttcta 2760
cgagtacctc aagacccaga agctgacccc gaatctgcag tacattgtga tgcactcaat 2820
cgcaatgacc tccgaaaccg cctcctcgac catcgacggg ctcaaggcca ccaagaactt 2880
cctgcactgt ttggggcgct acggcaacac tccgttcctc ttcccgctgt acggccaggg 2940
agagctgcct cagtgtttct gccggatgtg cgccgtgttc ggcggaatct actgtctccg 3000
ccactcggtc cagtgcctgg tggtggacaa ggaatccagg aagtgcaaag ccattattga 3060
ccagttcgga caacggatca tttccgagca ctttcttgtg gaggactcat acttcccgga 3120
gaacatgtgc tctcgggtcc agtatcgaca gatttccagg gcggtgctca ttactgaccg 3180
gagcgtcctc aagaccgata gcgaccagca gatctccatc ctgaccgtgc cggcggaaga 3240
acccggcact tttgccgtgc gcgtgatcga gctttgctca tccaccatga cttgcatgaa 3300
aggcacttac ctggtgcacc tgacgtgcac ctcatcgaaa accgctagag aggacctgga 3360
atccgtcgtc caaaagctgt tcgtgcctta caccgagatg gaaattgaaa acgaacaagt 3420
ggagaagccc cgcatccttt gggccctgta ctttaacatg cgcgattcct ccgatatctc 3480
gcggtcctgc tataacgact tgccttcgaa cgtctacgtc tgctccgggc cagactgcgg 3540
tcttggcaac gacaatgccg tgaagcaggc ggaaacactg ttccaagaga tctgccctaa 3600
cgaggatttt tgcccgcccc ccccaaaccc cgaggatatc atcttggacg gagacagcct 3660
gcagccagaa gcatccgagt ccagcgccat cccggaggcc aacagcgaaa ccttcaagga 3720
gagcactaac ctgggcaacc tggaagagtc cagcgaatga tcataggatc ctgcagatct 3780
cgagccgaat tcctgcagcc cgggggatca gcctcgactg tgccttctag ttgccagcca 3840
tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc 3900
ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg 3960
gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct 4020
ggggatgcgg tgggctctat ggcttctgag gcggaaagaa ccagctgggg ctcgagatcc 4080
actagggccg caggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc 4140
gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 4200
agtgagcgag cgacctgcag gggcagcttg aaggaaatac taaggcaaag gtactgcaag 4260
tgctcgcaac attcgcttat gcggattatt gccgtagtgc cgcgacgccg ggggcaagat 4320
gcagagattg ccatggtaca ggccgtgcgg ttgatattgc caaaacagag ctgtggggga 4380
gagttgtcga gaaagagtgc ggaagatgca aaggcgtcgg ctattcaagg atgccagcaa 4440
gcgcagcata tcgcgctgtg acgatgctaa tcccaaacct tacccaaccc acctggtcac 4500
gcactgttaa gccgctgtat gacgctctgg tggtgcaatg ccacaaagaa gagtcaatcg 4560
cagacaacat tttgaatgcg gtcacacgtt agcagcatga ttgccacgga tggcaacata 4620
ttaacggcat gatattgact tattgaataa aattgggtaa atttgactca acgatgggtt 4680
aattcgctcg ttgtggtagt gagatgaaaa gaggcggcgc ttactaccga ttccgcctag 4740
ttggtcactt cgacgtatcg tctggaactc caaccatcgc aggcagagag gtctgcaaaa 4800
tgcaatcccg aaacagttcg caggtaatag ttagagcctg cataacggtt tcgggatttt 4860
ttatatctgc acaacaggta agagcattga gtcgataatc gtgaagagtc ggcgagcctg 4920
gttagccagt gctctttccg ttgtgctgaa ttaagcgaat accggaagca gaaccggatc 4980
accaaatgcg tacaggcgtc atcgccgccc agcaacagca caacccaaac tgagccgtag 5040
ccactgtctg tcctgaattc attagtaata gttacgctgc ggccttttac acatgacctt 5100
cgtgaaagcg ggtggcagga ggtcgcgcta acaacctcct gccgttttgc ccgtgcatat 5160
cggtcacgaa caaatctgat tactaaacac agtagcctgg atttgttcta tcagtaatcg 5220
accttattcc taattaaata gagcaaatcc ccttattggg ggtaagacat gaagatgcca 5280
gaaaaacatg acctgttggc cgccattctc gcggcaaagg aacaaggcat cggggcaatc 5340
cttgcgtttg caatggcgta ccttcgcggc agatataatg gcggtgcgtt tacaaaaaca 5400
gtaatcgacg caacgatgtg cgccattatc gcctggttca ttcgtgacct tctcgacttc 5460
gccggactaa gtagcaatct cgcttatata acgagcgtgt ttatcggcta catcggtact 5520
gactcgattg gttcgcttat caaacgcttc gctgctaaaa aagccggagt agaagatggt 5580
agaaatcaat aatcaacgta aggcgttcct cgatatgctg gcgtggtcgg agggaactga 5640
taacggacgt cagaaaacca gaaatcatgg ttatgacgtc attgtaggcg gagagctatt 5700
tactgattac tccgatcacc ctcgcaaact tgtcacgcta aacccaaaac tcaaatcaac 5760
aggcgccgga cgctaccagc ttctttcccg ttggtgggat gcctaccgca agcagcttgg 5820
cctgaaagac ttctctccga aaagtcagga cgctgtggca ttgcagcaga ttaaggagcg 5880
tggcgcttta cctatgattg atcgtggtga tatccgtcag gcaatcgacc gttgcagcaa 5940
tatctgggct tcactgccgg gcgctggtta tggtcagttc gagcataagg ctgacagcct 6000
gattgcaaaa ttcaaagaag cgggcggaac ggtcagagag attgatgtat gagcagagtc 6060
accgcgatta tctccgctct ggttatctgc atcatcgtct gcctgtcatg ggctgttaat 6120
cattaccgtg ataacgccat tacctacaaa gcccagcgcg acaaaaatgc cagagaactg 6180
aagctggcga acgcggcaat tactgacatg cagatgcgtc agcgtgatgt tgctgcgctc 6240
gatgcaaaat acacgaagga gttagctgat gctaaagctg aaaatgatgc tctgcgtgat 6300
gatgttgccg ctggtcgtcg tcggttgcac atcaaagcag tctgtcagtc agtgcgtgaa 6360
gccaccaccg cctccggcgt ggataatgca gcctcccccc gactggcaga caccgctgaa 6420
cgggattatt tcaccctcag agagaggctg atcactatgc aaaaacaact ggaaggaacc 6480
cagaagtata ttaatgagca gtgcagatag agttgcccat atcgatgggc aactcatgca 6540
attattgtga gcaatacaca cgcgcttcca gcggagtata aatgcctaaa gtaataaaac 6600
cgagcaatcc atttacgaat gtttgctggg tttctgtttt aacaacattt tctgcgccgc 6660
cacaaatttt ggctgcatcg acagttttct tctgcccaat tccagaaacg aagaaatgat 6720
gggtgatggt ttcctttggt gctactgctg ccggtttgtt ttgaacagta aacgtctgtt 6780
gagcacatcc tgtaataagc agggccagcg cagtagcgag tagcattttt ttcatggtgt 6840
tattcccgat gctttttgaa gttcgcagaa tcgtatgtgt agaaaattaa acaaacccta 6900
aacaatgagt tgaaatttca tattgttaat atttattaat gtatgtcagg tgcgatgaat 6960
cgtcattgta ttcccggatt aactatgtcc acagccctga cggggaactt ctctgcggga 7020
gtgtccggga ataattaaaa cgatgcacac agggtttagc gcgtacacgt attgcattat 7080
gccaacgccc cggtgctgac acggaagaaa ccggacgtta tgatttagcg tggaaagatt 7140
tgtgtagtgt tctgaatgct ctcagtaaat agtaatgaat tatcaaaggt atagtaatat 7200
cttttatgtt catggatatt tgtaacccat cggaaaactc ctgctttagc aagattttcc 7260
ctgtattgct gaaatgtgat ttctcttgat ttcaacctat cataggacgt ttctataaga 7320
tgcgtgtttc ttgagaattt aacatttaca acctttttaa gtccttttat taacacggtg 7380
ttatcgtttt ctaacacgat gtgaatatta tctgtggcta gatagtaaat ataatgtgag 7440
acgttgtgac gttttagttc agaataaaac aattcacagt ctaaatcttt tcgcacttga 7500
tcgaatattt ctttaaaaat ggcaacctga gccattggta aaaccttcca tgtgatacga 7560
gggcgcgtag tttgcattat cgtttttatc gtttcaatct ggtctgacct ccttgtgttt 7620
tgttgatgat ttatgtcaaa tattaggaat gttttcactt aatagtattg gttgcgtaac 7680
aaagtgcggt cctgctggca ttctggaggg aaatacaacc gacagatgta tgtaaggcca 7740
acgtgctcaa atcttcatac agaaagattt gaagtaatat tttaaccgct agatgaagag 7800
caagcgcatg gagcgacaaa atgaataaag aacaatctgc tgatgatccc tccgtggatc 7860
tgattcgtgt aaaaaatatg cttaatagca ccatttctat gagttaccct gatgttgtaa 7920
ttgcatgtat agaacataag gtgtctctgg aagcattcag agcaattgag gcagcgttgg 7980
tgaagcacga taataatatg aaggattatt ccctggtggt tgactgatca ccataactgc 8040
taatcattca aactatttag tctgtgacag agccaacacg cagtctgtca ctgtcaggaa 8100
agtggtaaaa ctgcaactca attactgcaa tgccctcgta attaagtgaa tttacaatat 8160
cgtcctgttc ggagggaaga acgcgggatg ttcattcttc atcactttta attgatgtat 8220
atgctctctt ttctgacgtt agtctccgac ggcaggcttc aatgacccag gctgagaaat 8280
tcccggaccc tttttgctca agagcgatgt taatttgttc aatcatttgg ttaggaaagc 8340
ggatgttgcg ggttgttgtt ctgcgggttc tgttcttcgt tgacatgagg ttgccccgta 8400
ttcagtgtcg ctgatttgta ttgtctgaag ttgtttttac gttaagttga tgcagatcaa 8460
ttaatacgat acctgcgtca taattgatta tttgacgtgg tttgatggcc tccacgcacg 8520
ttgtgatatg tagatgataa tcattatcac tttacgggtc ctttccggtg atccgacagg 8580
ttacggcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatacg 8640
tcaaagcaac catagtacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 8700
acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 8760
ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 8820
ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga tttgggtgat 8880
ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 8940
acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcgggc 9000
tattcttttg atttagacct gcaggcatgc aagcttactg gccgtcgttt tacaacgtcg 9060
tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc cccctttcgc 9120
cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct 9180
gaatggcgaa tgcgatttat tcaacaaagc cgccgtcccg tcaagtcagc gtaatgctct 9240
gccagtgtta caaccaatta accaattctg attagaaaaa ctcatcgagc atcaaatgaa 9300
actgcaattt attcatatca ggattatcaa taccatattt ttgaaaaagc cgtttctgta 9360
atgaaggaga aaactcaccg aggcagttcc ataggatggc aagatcctgg tatcggtctg 9420
cgattccgac tcgtccaaca tcaatacaac ctattaattt cccctcgtca aaaataaggt 9480
tatcaagtga gaaatcacca tgagtgacga ctgaatccgg tgagaatggc aaaagcttat 9540
gcatttcttt ccagacttgt tcaacaggcc agccattacg ctcgtcatca aaatcactcg 9600
catcaaccaa accgttattc attcgtgatt gcgcctgagc gagacgaaat acgcgatcgc 9660
tgttaaaagg acaattacaa acaggaatcg aatgcaaccg gcgcaggaac actgccagcg 9720
catcaacaat attttcacct gaatcaggat attcttctaa tacctggaat gctgttttcc 9780
cggggatcgc agtggtgagt aaccatgcat catcaggagt acggataaaa tgcttgatgg 9840
tcggaagagg cataaattcc gtcagccagt ttagtctgac catctcatct gtaacatcat 9900
tggcaacgct acctttgcca tgtttcagaa acaactctgg cgcatcgggc ttcccataca 9960
atcgatagat tgtcgcacct gattgcccga cattatcgcg agcccattta tacccatata 10020
aatcagcatc catgttggaa tttaatcgcg gcttcgagca agacgtttcc cgttgaatat 10080
ggctcataac accccttgta ttactgttta tgtaagcaga cagttttatt gttcatgatg 10140
atatattttt atcttgtgca atgtaacatc agagattttg agacacaacg tggctttgtt 10200
gaataaatcg aacttttgct gagttgaagg atcagatcac gcatcttccc gacaacgcag 10260
accgttccgt ggcaaagcaa aagttcaaaa tcaccaactg gtccacctac aacaaagctc 10320
tcatcaaccg tggctccctc actttctggc tggatgatgg ggcgattcag gcctggtatg 10380
agtcagcaac accttcttca cgaggcagac ctctcgacgg atcgttccac tgagcgtcag 10440
accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 10500
gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 10560
caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgtccttc 10620
tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 10680
ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 10740
tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 10800
gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 10860
tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 10920
gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 10980
gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 11040
ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct 11100
ggccttttgc tcacatgtcc tgcaggcagc tgcgcgccag ctgcgcgc 11148
<210> 9
<211> 2085
<212> DNA
<213> Artificial Sequence
<220>
<223> codon optimized sequence
<220>
<221> CDS
<222> (1)..(2085)
<223> codon-optimized ORF
<400> 9
atg gct aag att aac acc cag tac tca cat cca tcc cgc act cac ctc 48
Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu
1 5 10 15
aaa gtc aag acc tcc gat cgg gat ctg aac cgg gct gag aat ggg ctg 96
Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu
20 25 30
tcg cgc gcc cac tcg tcg tcc gag gaa acc agc agc gtg ctc cag ccg 144
Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro
35 40 45
ggc atc gcc atg gaa act agg ggg ctg gcg gac tcc gga cag gga tcc 192
Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser
50 55 60
ttc act gga cag ggt att gcc cgg ctg agc aga ctg atc ttc ctg ctt 240
Phe Thr Gly Gln Gly Ile Ala Arg Leu Ser Arg Leu Ile Phe Leu Leu
65 70 75 80
cgc cgc tgg gcg gcc aga cac gtg cac cat cag gac cag gga cct gat 288
Arg Arg Trp Ala Ala Arg His Val His His Gln Asp Gln Gly Pro Asp
85 90 95
agc ttc ccc gac cgc ttt agg gga gcc gag ctg aaa gaa gtg tca agc 336
Ser Phe Pro Asp Arg Phe Arg Gly Ala Glu Leu Lys Glu Val Ser Ser
100 105 110
cag gag tca aac gcg cag gcc aac gtc ggc agc caa gag cct gca gac 384
Gln Glu Ser Asn Ala Gln Ala Asn Val Gly Ser Gln Glu Pro Ala Asp
115 120 125
cgg gga cgc tcg gca tgg ccg ctc gca aag tgc aac act aac act tcc 432
Arg Gly Arg Ser Ala Trp Pro Leu Ala Lys Cys Asn Thr Asn Thr Ser
130 135 140
aac aac acc gaa gag gaa aag aaa acc aag aag aag gat gca att gtg 480
Asn Asn Thr Glu Glu Glu Lys Lys Thr Lys Lys Lys Asp Ala Ile Val
145 150 155 160
gtg gac cct tcc tcc aac ctg tac tac cgc tgg ttg acc gcc atc gcc 528
Val Asp Pro Ser Ser Asn Leu Tyr Tyr Arg Trp Leu Thr Ala Ile Ala
165 170 175
ctc ccg gtc ttt tac aat tgg tat ctc ctt atc tgc cgg gcc tgc ttc 576
Leu Pro Val Phe Tyr Asn Trp Tyr Leu Leu Ile Cys Arg Ala Cys Phe
180 185 190
gac gaa ctg caa tca gag tac ctg atg ctg tgg ctg gtg ctg gac tat 624
Asp Glu Leu Gln Ser Glu Tyr Leu Met Leu Trp Leu Val Leu Asp Tyr
195 200 205
agc gcc gat gtg ctc tac gtc ctg gat gtg ctc gtg cgc gcc cgg acc 672
Ser Ala Asp Val Leu Tyr Val Leu Asp Val Leu Val Arg Ala Arg Thr
210 215 220
gga ttc ttg gaa caa ggc ctg atg gtg tcc gac acg aat aga ctg tgg 720
Gly Phe Leu Glu Gln Gly Leu Met Val Ser Asp Thr Asn Arg Leu Trp
225 230 235 240
cag cac tat aag acc aca acc cag ttc aag ctt gac gtg ctc agc ctt 768
Gln His Tyr Lys Thr Thr Thr Gln Phe Lys Leu Asp Val Leu Ser Leu
245 250 255
gtg ccg act gac ctg gcc tac ctg aaa gtc gga act aac tac ccg gaa 816
Val Pro Thr Asp Leu Ala Tyr Leu Lys Val Gly Thr Asn Tyr Pro Glu
260 265 270
gtc aga ttc aac cga ctc ctg aag ttc agc agg ctg ttc gag ttc ttt 864
Val Arg Phe Asn Arg Leu Leu Lys Phe Ser Arg Leu Phe Glu Phe Phe
275 280 285
gac cgc acc gag act cgg acc aac tac cct aac atg ttc cgg atc gga 912
Asp Arg Thr Glu Thr Arg Thr Asn Tyr Pro Asn Met Phe Arg Ile Gly
290 295 300
aat ctg gtg ctc tac ata ctg att atc atc cat tgg aac gcc tgt atc 960
Asn Leu Val Leu Tyr Ile Leu Ile Ile Ile His Trp Asn Ala Cys Ile
305 310 315 320
tat ttc gcc att tcg aag ttc atc ggt ttc gga acc gat tcc tgg gtg 1008
Tyr Phe Ala Ile Ser Lys Phe Ile Gly Phe Gly Thr Asp Ser Trp Val
325 330 335
tac ccc aac atc tcg atc ccc gaa cac ggt cgc ctg tcc cgg aag tac 1056
Tyr Pro Asn Ile Ser Ile Pro Glu His Gly Arg Leu Ser Arg Lys Tyr
340 345 350
atc tac tcc ctg tac tgg tcc act ctg act ctg acc acg atc ggg gaa 1104
Ile Tyr Ser Leu Tyr Trp Ser Thr Leu Thr Leu Thr Thr Ile Gly Glu
355 360 365
acc cct cca ccc gtg aag gac gaa gag tac ctg ttc gtg gtg gtg gac 1152
Thr Pro Pro Pro Val Lys Asp Glu Glu Tyr Leu Phe Val Val Val Asp
370 375 380
ttc ctg gtc gga gtg ttg att ttc gcc acc att gtg gga aac gtg ggc 1200
Phe Leu Val Gly Val Leu Ile Phe Ala Thr Ile Val Gly Asn Val Gly
385 390 395 400
tcc atg atc tcc aac atg aac gcg tcg aga gct gag ttc caa gcc aag 1248
Ser Met Ile Ser Asn Met Asn Ala Ser Arg Ala Glu Phe Gln Ala Lys
405 410 415
atc gac tcc att aag cag tac atg cag ttc aga aag gtc acc aag gac 1296
Ile Asp Ser Ile Lys Gln Tyr Met Gln Phe Arg Lys Val Thr Lys Asp
420 425 430
ctg gaa acc agg gtc atc cgc tgg ttc gac tac ctg tgg gcc aac aaa 1344
Leu Glu Thr Arg Val Ile Arg Trp Phe Asp Tyr Leu Trp Ala Asn Lys
435 440 445
aag act gtg gac gaa aag gaa gtg ctg aag tcg ctg ccg gat aag ctg 1392
Lys Thr Val Asp Glu Lys Glu Val Leu Lys Ser Leu Pro Asp Lys Leu
450 455 460
aag gcc gaa atc gcc att aac gtg cac ctt gac acc ctg aag aaa gtc 1440
Lys Ala Glu Ile Ala Ile Asn Val His Leu Asp Thr Leu Lys Lys Val
465 470 475 480
cgg atc ttc caa gac tgt gaa gcc ggc ctc ctg gtg gag ctc gtg ctc 1488
Arg Ile Phe Gln Asp Cys Glu Ala Gly Leu Leu Val Glu Leu Val Leu
485 490 495
aag ctg cgg ccc acc gtg ttc agc ccg gga gat tac att tgc aag aag 1536
Lys Leu Arg Pro Thr Val Phe Ser Pro Gly Asp Tyr Ile Cys Lys Lys
500 505 510
ggc gat atc ggc aaa gag atg tac atc atc aac gag gga aag ctg gcc 1584
Gly Asp Ile Gly Lys Glu Met Tyr Ile Ile Asn Glu Gly Lys Leu Ala
515 520 525
gtg gtc gcg gac gac ggc gtg acc cag ttc gtg gtg ctg tcc gac gga 1632
Val Val Ala Asp Asp Gly Val Thr Gln Phe Val Val Leu Ser Asp Gly
530 535 540
tcc tac ttc ggt gaa atc tca atc ctc aac atc aag ggg tcc aag tcc 1680
Ser Tyr Phe Gly Glu Ile Ser Ile Leu Asn Ile Lys Gly Ser Lys Ser
545 550 555 560
ggc aac cgg aga act gcc aac att cgc tcc atc gga tac agc gac ctg 1728
Gly Asn Arg Arg Thr Ala Asn Ile Arg Ser Ile Gly Tyr Ser Asp Leu
565 570 575
ttt tgc ctg tcc aag gat gac ctg atg gag gct ctg act gag tac cct 1776
Phe Cys Leu Ser Lys Asp Asp Leu Met Glu Ala Leu Thr Glu Tyr Pro
580 585 590
gaa gcg aag aag gct ttg gag gaa aag ggg cgg cag att ctg atg aag 1824
Glu Ala Lys Lys Ala Leu Glu Glu Lys Gly Arg Gln Ile Leu Met Lys
595 600 605
gac aat ttg atc gac gag gag ctc gca cgg gcc ggc gcc gac ccc aag 1872
Asp Asn Leu Ile Asp Glu Glu Leu Ala Arg Ala Gly Ala Asp Pro Lys
610 615 620
gat ctc gaa gag aag gtc gaa cag ctg ggt tct tcg ctt gat acc ctg 1920
Asp Leu Glu Glu Lys Val Glu Gln Leu Gly Ser Ser Leu Asp Thr Leu
625 630 635 640
caa acc cga ttc gcg cgg ctg ctc gcc gag tac aac gcg acc cag atg 1968
Gln Thr Arg Phe Ala Arg Leu Leu Ala Glu Tyr Asn Ala Thr Gln Met
645 650 655
aag atg aag cag aga ctg tca cag ttg gaa tcc caa gtc aag ggc gga 2016
Lys Met Lys Gln Arg Leu Ser Gln Leu Glu Ser Gln Val Lys Gly Gly
660 665 670
ggc gac aag ccg ctg gcg gac ggg gaa gtg ccc ggg gac gcc acc aag 2064
Gly Asp Lys Pro Leu Ala Asp Gly Glu Val Pro Gly Asp Ala Thr Lys
675 680 685
act gag gac aag cag cag tga 2085
Thr Glu Asp Lys Gln Gln
690
<210> 10
<211> 694
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 10
Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu
1 5 10 15
Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu
20 25 30
Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro
35 40 45
Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser
50 55 60
Phe Thr Gly Gln Gly Ile Ala Arg Leu Ser Arg Leu Ile Phe Leu Leu
65 70 75 80
Arg Arg Trp Ala Ala Arg His Val His His Gln Asp Gln Gly Pro Asp
85 90 95
Ser Phe Pro Asp Arg Phe Arg Gly Ala Glu Leu Lys Glu Val Ser Ser
100 105 110
Gln Glu Ser Asn Ala Gln Ala Asn Val Gly Ser Gln Glu Pro Ala Asp
115 120 125
Arg Gly Arg Ser Ala Trp Pro Leu Ala Lys Cys Asn Thr Asn Thr Ser
130 135 140
Asn Asn Thr Glu Glu Glu Lys Lys Thr Lys Lys Lys Asp Ala Ile Val
145 150 155 160
Val Asp Pro Ser Ser Asn Leu Tyr Tyr Arg Trp Leu Thr Ala Ile Ala
165 170 175
Leu Pro Val Phe Tyr Asn Trp Tyr Leu Leu Ile Cys Arg Ala Cys Phe
180 185 190
Asp Glu Leu Gln Ser Glu Tyr Leu Met Leu Trp Leu Val Leu Asp Tyr
195 200 205
Ser Ala Asp Val Leu Tyr Val Leu Asp Val Leu Val Arg Ala Arg Thr
210 215 220
Gly Phe Leu Glu Gln Gly Leu Met Val Ser Asp Thr Asn Arg Leu Trp
225 230 235 240
Gln His Tyr Lys Thr Thr Thr Gln Phe Lys Leu Asp Val Leu Ser Leu
245 250 255
Val Pro Thr Asp Leu Ala Tyr Leu Lys Val Gly Thr Asn Tyr Pro Glu
260 265 270
Val Arg Phe Asn Arg Leu Leu Lys Phe Ser Arg Leu Phe Glu Phe Phe
275 280 285
Asp Arg Thr Glu Thr Arg Thr Asn Tyr Pro Asn Met Phe Arg Ile Gly
290 295 300
Asn Leu Val Leu Tyr Ile Leu Ile Ile Ile His Trp Asn Ala Cys Ile
305 310 315 320
Tyr Phe Ala Ile Ser Lys Phe Ile Gly Phe Gly Thr Asp Ser Trp Val
325 330 335
Tyr Pro Asn Ile Ser Ile Pro Glu His Gly Arg Leu Ser Arg Lys Tyr
340 345 350
Ile Tyr Ser Leu Tyr Trp Ser Thr Leu Thr Leu Thr Thr Ile Gly Glu
355 360 365
Thr Pro Pro Pro Val Lys Asp Glu Glu Tyr Leu Phe Val Val Val Asp
370 375 380
Phe Leu Val Gly Val Leu Ile Phe Ala Thr Ile Val Gly Asn Val Gly
385 390 395 400
Ser Met Ile Ser Asn Met Asn Ala Ser Arg Ala Glu Phe Gln Ala Lys
405 410 415
Ile Asp Ser Ile Lys Gln Tyr Met Gln Phe Arg Lys Val Thr Lys Asp
420 425 430
Leu Glu Thr Arg Val Ile Arg Trp Phe Asp Tyr Leu Trp Ala Asn Lys
435 440 445
Lys Thr Val Asp Glu Lys Glu Val Leu Lys Ser Leu Pro Asp Lys Leu
450 455 460
Lys Ala Glu Ile Ala Ile Asn Val His Leu Asp Thr Leu Lys Lys Val
465 470 475 480
Arg Ile Phe Gln Asp Cys Glu Ala Gly Leu Leu Val Glu Leu Val Leu
485 490 495
Lys Leu Arg Pro Thr Val Phe Ser Pro Gly Asp Tyr Ile Cys Lys Lys
500 505 510
Gly Asp Ile Gly Lys Glu Met Tyr Ile Ile Asn Glu Gly Lys Leu Ala
515 520 525
Val Val Ala Asp Asp Gly Val Thr Gln Phe Val Val Leu Ser Asp Gly
530 535 540
Ser Tyr Phe Gly Glu Ile Ser Ile Leu Asn Ile Lys Gly Ser Lys Ser
545 550 555 560
Gly Asn Arg Arg Thr Ala Asn Ile Arg Ser Ile Gly Tyr Ser Asp Leu
565 570 575
Phe Cys Leu Ser Lys Asp Asp Leu Met Glu Ala Leu Thr Glu Tyr Pro
580 585 590
Glu Ala Lys Lys Ala Leu Glu Glu Lys Gly Arg Gln Ile Leu Met Lys
595 600 605
Asp Asn Leu Ile Asp Glu Glu Leu Ala Arg Ala Gly Ala Asp Pro Lys
610 615 620
Asp Leu Glu Glu Lys Val Glu Gln Leu Gly Ser Ser Leu Asp Thr Leu
625 630 635 640
Gln Thr Arg Phe Ala Arg Leu Leu Ala Glu Tyr Asn Ala Thr Gln Met
645 650 655
Lys Met Lys Gln Arg Leu Ser Gln Leu Glu Ser Gln Val Lys Gly Gly
660 665 670
Gly Asp Lys Pro Leu Ala Asp Gly Glu Val Pro Gly Asp Ala Thr Lys
675 680 685
Thr Glu Asp Lys Gln Gln
690
<210> 11
<211> 2250
<212> DNA
<213> Artificial Sequence
<220>
<223> codon optimized sequence
<220>
<221> CDS
<222> (1)..(2250)
<223> codon-optimized ORF
<400> 11
atg gct aag att aac acc cag tac tca cat cca tcc cgc act cac ctc 48
Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu
1 5 10 15
aaa gtc aag acc tcc gat cgg gat ctg aac cgg gct gag aat ggg ctg 96
Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu
20 25 30
tcg cgc gcc cac tcg tcg tcc gag gaa acc agc agc gtg ctc cag ccg 144
Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro
35 40 45
ggc atc gcc atg gaa act agg ggg ctg gcg gac tcc gga cag gga tcc 192
Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser
50 55 60
ttc act gga cag ggt att gcc cgg ttc ggg cgg att cag aag aag tcc 240
Phe Thr Gly Gln Gly Ile Ala Arg Phe Gly Arg Ile Gln Lys Lys Ser
65 70 75 80
cag ccg gag aag gtc gtg cgg gct gcc agc agg ggc agg cca ctc att 288
Gln Pro Glu Lys Val Val Arg Ala Ala Ser Arg Gly Arg Pro Leu Ile
85 90 95
ggt tgg aca cag tgg tgc gct gag gat ggt gga gat gaa tcg gaa atg 336
Gly Trp Thr Gln Trp Cys Ala Glu Asp Gly Gly Asp Glu Ser Glu Met
100 105 110
gca ctg gcc ggc tct ccc gga tgc agc tcg ggc ccc caa ggg aga ctg 384
Ala Leu Ala Gly Ser Pro Gly Cys Ser Ser Gly Pro Gln Gly Arg Leu
115 120 125
agc aga ctg atc ttc ctg ctt cgc cgc tgg gcg gcc aga cac gtg cac 432
Ser Arg Leu Ile Phe Leu Leu Arg Arg Trp Ala Ala Arg His Val His
130 135 140
cat cag gac cag gga cct gat agc ttc ccc gac cgc ttt agg gga gcc 480
His Gln Asp Gln Gly Pro Asp Ser Phe Pro Asp Arg Phe Arg Gly Ala
145 150 155 160
gag ctg aaa gaa gtg tca agc cag gag tca aac gcg cag gcc aac gtc 528
Glu Leu Lys Glu Val Ser Ser Gln Glu Ser Asn Ala Gln Ala Asn Val
165 170 175
ggc agc caa gag cct gca gac cgg gga cgc tcg gca tgg ccg ctc gca 576
Gly Ser Gln Glu Pro Ala Asp Arg Gly Arg Ser Ala Trp Pro Leu Ala
180 185 190
aag tgc aac act aac act tcc aac aac acc gaa gag gaa aag aaa acc 624
Lys Cys Asn Thr Asn Thr Ser Asn Asn Thr Glu Glu Glu Lys Lys Thr
195 200 205
aag aag aag gat gca att gtg gtg gac cct tcc tcc aac ctg tac tac 672
Lys Lys Lys Asp Ala Ile Val Val Asp Pro Ser Ser Asn Leu Tyr Tyr
210 215 220
cgc tgg ttg acc gcc atc gcc ctc ccg gtc ttt tac aat tgg tat ctc 720
Arg Trp Leu Thr Ala Ile Ala Leu Pro Val Phe Tyr Asn Trp Tyr Leu
225 230 235 240
ctt atc tgc cgg gcc tgc ttc gac gaa ctg caa tca gag tac ctg atg 768
Leu Ile Cys Arg Ala Cys Phe Asp Glu Leu Gln Ser Glu Tyr Leu Met
245 250 255
ctg tgg ctg gtg ctg gac tat agc gcc gat gtg ctc tac gtc ctg gat 816
Leu Trp Leu Val Leu Asp Tyr Ser Ala Asp Val Leu Tyr Val Leu Asp
260 265 270
gtg ctc gtg cgc gcc cgg acc gga ttc ttg gaa caa ggc ctg atg gtg 864
Val Leu Val Arg Ala Arg Thr Gly Phe Leu Glu Gln Gly Leu Met Val
275 280 285
tcc gac acg aat aga ctg tgg cag cac tat aag acc aca acc cag ttc 912
Ser Asp Thr Asn Arg Leu Trp Gln His Tyr Lys Thr Thr Thr Gln Phe
290 295 300
aag ctt gac gtg ctc agc ctt gtg ccg act gac ctg gcc tac ctg aaa 960
Lys Leu Asp Val Leu Ser Leu Val Pro Thr Asp Leu Ala Tyr Leu Lys
305 310 315 320
gtc gga act aac tac ccg gaa gtc aga ttc aac cga ctc ctg aag ttc 1008
Val Gly Thr Asn Tyr Pro Glu Val Arg Phe Asn Arg Leu Leu Lys Phe
325 330 335
agc agg ctg ttc gag ttc ttt gac cgc acc gag act cgg acc aac tac 1056
Ser Arg Leu Phe Glu Phe Phe Asp Arg Thr Glu Thr Arg Thr Asn Tyr
340 345 350
cct aac atg ttc cgg atc gga aat ctg gtg ctc tac ata ctg att atc 1104
Pro Asn Met Phe Arg Ile Gly Asn Leu Val Leu Tyr Ile Leu Ile Ile
355 360 365
atc cat tgg aac gcc tgt atc tat ttc gcc att tcg aag ttc atc ggt 1152
Ile His Trp Asn Ala Cys Ile Tyr Phe Ala Ile Ser Lys Phe Ile Gly
370 375 380
ttc gga acc gat tcc tgg gtg tac ccc aac atc tcg atc ccc gaa cac 1200
Phe Gly Thr Asp Ser Trp Val Tyr Pro Asn Ile Ser Ile Pro Glu His
385 390 395 400
ggt cgc ctg tcc cgg aag tac atc tac tcc ctg tac tgg tcc act ctg 1248
Gly Arg Leu Ser Arg Lys Tyr Ile Tyr Ser Leu Tyr Trp Ser Thr Leu
405 410 415
act ctg acc acg atc ggg gaa acc cct cca ccc gtg aag gac gaa gag 1296
Thr Leu Thr Thr Ile Gly Glu Thr Pro Pro Pro Val Lys Asp Glu Glu
420 425 430
tac ctg ttc gtg gtg gtg gac ttc ctg gtc gga gtg ttg att ttc gcc 1344
Tyr Leu Phe Val Val Val Asp Phe Leu Val Gly Val Leu Ile Phe Ala
435 440 445
acc att gtg gga aac gtg ggc tcc atg atc tcc aac atg aac gcg tcg 1392
Thr Ile Val Gly Asn Val Gly Ser Met Ile Ser Asn Met Asn Ala Ser
450 455 460
aga gct gag ttc caa gcc aag atc gac tcc att aag cag tac atg cag 1440
Arg Ala Glu Phe Gln Ala Lys Ile Asp Ser Ile Lys Gln Tyr Met Gln
465 470 475 480
ttc aga aag gtc acc aag gac ctg gaa acc agg gtc atc cgc tgg ttc 1488
Phe Arg Lys Val Thr Lys Asp Leu Glu Thr Arg Val Ile Arg Trp Phe
485 490 495
gac tac ctg tgg gcc aac aaa aag act gtg gac gaa aag gaa gtg ctg 1536
Asp Tyr Leu Trp Ala Asn Lys Lys Thr Val Asp Glu Lys Glu Val Leu
500 505 510
aag tcg ctg ccg gat aag ctg aag gcc gaa atc gcc att aac gtg cac 1584
Lys Ser Leu Pro Asp Lys Leu Lys Ala Glu Ile Ala Ile Asn Val His
515 520 525
ctt gac acc ctg aag aaa gtc cgg atc ttc caa gac tgt gaa gcc ggc 1632
Leu Asp Thr Leu Lys Lys Val Arg Ile Phe Gln Asp Cys Glu Ala Gly
530 535 540
ctc ctg gtg gag ctc gtg ctc aag ctg cgg ccc acc gtg ttc agc ccg 1680
Leu Leu Val Glu Leu Val Leu Lys Leu Arg Pro Thr Val Phe Ser Pro
545 550 555 560
gga gat tac att tgc aag aag ggc gat atc ggc aaa gag atg tac atc 1728
Gly Asp Tyr Ile Cys Lys Lys Gly Asp Ile Gly Lys Glu Met Tyr Ile
565 570 575
atc aac gag gga aag ctg gcc gtg gtc gcg gac gac ggc gtg acc cag 1776
Ile Asn Glu Gly Lys Leu Ala Val Val Ala Asp Asp Gly Val Thr Gln
580 585 590
ttc gtg gtg ctg tcc gac gga tcc tac ttc ggt gaa atc tca atc ctc 1824
Phe Val Val Leu Ser Asp Gly Ser Tyr Phe Gly Glu Ile Ser Ile Leu
595 600 605
aac atc aag ggg tcc aag tcc ggc aac cgg aga act gcc aac att cgc 1872
Asn Ile Lys Gly Ser Lys Ser Gly Asn Arg Arg Thr Ala Asn Ile Arg
610 615 620
tcc atc gga tac agc gac ctg ttt tgc ctg tcc aag gat gac ctg atg 1920
Ser Ile Gly Tyr Ser Asp Leu Phe Cys Leu Ser Lys Asp Asp Leu Met
625 630 635 640
gag gct ctg act gag tac cct gaa gcg aag aag gct ttg gag gaa aag 1968
Glu Ala Leu Thr Glu Tyr Pro Glu Ala Lys Lys Ala Leu Glu Glu Lys
645 650 655
ggg cgg cag att ctg atg aag gac aat ttg atc gac gag gag ctc gca 2016
Gly Arg Gln Ile Leu Met Lys Asp Asn Leu Ile Asp Glu Glu Leu Ala
660 665 670
cgg gcc ggc gcc gac ccc aag gat ctc gaa gag aag gtc gaa cag ctg 2064
Arg Ala Gly Ala Asp Pro Lys Asp Leu Glu Glu Lys Val Glu Gln Leu
675 680 685
ggt tct tcg ctt gat acc ctg caa acc cga ttc gcg cgg ctg ctc gcc 2112
Gly Ser Ser Leu Asp Thr Leu Gln Thr Arg Phe Ala Arg Leu Leu Ala
690 695 700
gag tac aac gcg acc cag atg aag atg aag cag aga ctg tca cag ttg 2160
Glu Tyr Asn Ala Thr Gln Met Lys Met Lys Gln Arg Leu Ser Gln Leu
705 710 715 720
gaa tcc caa gtc aag ggc gga ggc gac aag ccg ctg gcg gac ggg gaa 2208
Glu Ser Gln Val Lys Gly Gly Gly Asp Lys Pro Leu Ala Asp Gly Glu
725 730 735
gtg ccc ggg gac gcc acc aag act gag gac aag cag cag tga 2250
Val Pro Gly Asp Ala Thr Lys Thr Glu Asp Lys Gln Gln
740 745
<210> 12
<211> 749
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 12
Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu
1 5 10 15
Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu
20 25 30
Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro
35 40 45
Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser
50 55 60
Phe Thr Gly Gln Gly Ile Ala Arg Phe Gly Arg Ile Gln Lys Lys Ser
65 70 75 80
Gln Pro Glu Lys Val Val Arg Ala Ala Ser Arg Gly Arg Pro Leu Ile
85 90 95
Gly Trp Thr Gln Trp Cys Ala Glu Asp Gly Gly Asp Glu Ser Glu Met
100 105 110
Ala Leu Ala Gly Ser Pro Gly Cys Ser Ser Gly Pro Gln Gly Arg Leu
115 120 125
Ser Arg Leu Ile Phe Leu Leu Arg Arg Trp Ala Ala Arg His Val His
130 135 140
His Gln Asp Gln Gly Pro Asp Ser Phe Pro Asp Arg Phe Arg Gly Ala
145 150 155 160
Glu Leu Lys Glu Val Ser Ser Gln Glu Ser Asn Ala Gln Ala Asn Val
165 170 175
Gly Ser Gln Glu Pro Ala Asp Arg Gly Arg Ser Ala Trp Pro Leu Ala
180 185 190
Lys Cys Asn Thr Asn Thr Ser Asn Asn Thr Glu Glu Glu Lys Lys Thr
195 200 205
Lys Lys Lys Asp Ala Ile Val Val Asp Pro Ser Ser Asn Leu Tyr Tyr
210 215 220
Arg Trp Leu Thr Ala Ile Ala Leu Pro Val Phe Tyr Asn Trp Tyr Leu
225 230 235 240
Leu Ile Cys Arg Ala Cys Phe Asp Glu Leu Gln Ser Glu Tyr Leu Met
245 250 255
Leu Trp Leu Val Leu Asp Tyr Ser Ala Asp Val Leu Tyr Val Leu Asp
260 265 270
Val Leu Val Arg Ala Arg Thr Gly Phe Leu Glu Gln Gly Leu Met Val
275 280 285
Ser Asp Thr Asn Arg Leu Trp Gln His Tyr Lys Thr Thr Thr Gln Phe
290 295 300
Lys Leu Asp Val Leu Ser Leu Val Pro Thr Asp Leu Ala Tyr Leu Lys
305 310 315 320
Val Gly Thr Asn Tyr Pro Glu Val Arg Phe Asn Arg Leu Leu Lys Phe
325 330 335
Ser Arg Leu Phe Glu Phe Phe Asp Arg Thr Glu Thr Arg Thr Asn Tyr
340 345 350
Pro Asn Met Phe Arg Ile Gly Asn Leu Val Leu Tyr Ile Leu Ile Ile
355 360 365
Ile His Trp Asn Ala Cys Ile Tyr Phe Ala Ile Ser Lys Phe Ile Gly
370 375 380
Phe Gly Thr Asp Ser Trp Val Tyr Pro Asn Ile Ser Ile Pro Glu His
385 390 395 400
Gly Arg Leu Ser Arg Lys Tyr Ile Tyr Ser Leu Tyr Trp Ser Thr Leu
405 410 415
Thr Leu Thr Thr Ile Gly Glu Thr Pro Pro Pro Val Lys Asp Glu Glu
420 425 430
Tyr Leu Phe Val Val Val Asp Phe Leu Val Gly Val Leu Ile Phe Ala
435 440 445
Thr Ile Val Gly Asn Val Gly Ser Met Ile Ser Asn Met Asn Ala Ser
450 455 460
Arg Ala Glu Phe Gln Ala Lys Ile Asp Ser Ile Lys Gln Tyr Met Gln
465 470 475 480
Phe Arg Lys Val Thr Lys Asp Leu Glu Thr Arg Val Ile Arg Trp Phe
485 490 495
Asp Tyr Leu Trp Ala Asn Lys Lys Thr Val Asp Glu Lys Glu Val Leu
500 505 510
Lys Ser Leu Pro Asp Lys Leu Lys Ala Glu Ile Ala Ile Asn Val His
515 520 525
Leu Asp Thr Leu Lys Lys Val Arg Ile Phe Gln Asp Cys Glu Ala Gly
530 535 540
Leu Leu Val Glu Leu Val Leu Lys Leu Arg Pro Thr Val Phe Ser Pro
545 550 555 560
Gly Asp Tyr Ile Cys Lys Lys Gly Asp Ile Gly Lys Glu Met Tyr Ile
565 570 575
Ile Asn Glu Gly Lys Leu Ala Val Val Ala Asp Asp Gly Val Thr Gln
580 585 590
Phe Val Val Leu Ser Asp Gly Ser Tyr Phe Gly Glu Ile Ser Ile Leu
595 600 605
Asn Ile Lys Gly Ser Lys Ser Gly Asn Arg Arg Thr Ala Asn Ile Arg
610 615 620
Ser Ile Gly Tyr Ser Asp Leu Phe Cys Leu Ser Lys Asp Asp Leu Met
625 630 635 640
Glu Ala Leu Thr Glu Tyr Pro Glu Ala Lys Lys Ala Leu Glu Glu Lys
645 650 655
Gly Arg Gln Ile Leu Met Lys Asp Asn Leu Ile Asp Glu Glu Leu Ala
660 665 670
Arg Ala Gly Ala Asp Pro Lys Asp Leu Glu Glu Lys Val Glu Gln Leu
675 680 685
Gly Ser Ser Leu Asp Thr Leu Gln Thr Arg Phe Ala Arg Leu Leu Ala
690 695 700
Glu Tyr Asn Ala Thr Gln Met Lys Met Lys Gln Arg Leu Ser Gln Leu
705 710 715 720
Glu Ser Gln Val Lys Gly Gly Gly Asp Lys Pro Leu Ala Asp Gly Glu
725 730 735
Val Pro Gly Asp Ala Thr Lys Thr Glu Asp Lys Gln Gln
740 745
<210> 13
<211> 2085
<212> DNA
<213> Homo sapiens
<220>
<221> CDS
<222> (1)..(2085)
<223> native open reading frame (ORF)
<400> 13
atg gcc aag atc aac acc caa tac tcc cac ccc tcc agg acc cac ctc 48
Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu
1 5 10 15
aag gta aag acc tca gac cgg gat ctc aat cgc gct gaa aat ggc ctc 96
Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu
20 25 30
agc aga gcc cac tcg tca agt gag gag aca tcg tca gtg ctg cag ccg 144
Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro
35 40 45
ggg atc gcc atg gag acc aga gga ctg gct gac tcc ggg cag ggc tcc 192
Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser
50 55 60
ttc acc ggc cag ggg atc gcc agg ctg tcg cgc ctc atc ttc ttg ctg 240
Phe Thr Gly Gln Gly Ile Ala Arg Leu Ser Arg Leu Ile Phe Leu Leu
65 70 75 80
cgc agg tgg gct gcc agg cat gtg cac cac cag gac cag gga ccg gac 288
Arg Arg Trp Ala Ala Arg His Val His His Gln Asp Gln Gly Pro Asp
85 90 95
tct ttt cct gat cgt ttc cgt gga gcc gag ctt aag gag gtg tcc agc 336
Ser Phe Pro Asp Arg Phe Arg Gly Ala Glu Leu Lys Glu Val Ser Ser
100 105 110
caa gaa agc aat gcc cag gca aat gtg ggc agc cag gag cca gca gac 384
Gln Glu Ser Asn Ala Gln Ala Asn Val Gly Ser Gln Glu Pro Ala Asp
115 120 125
aga ggg aga agc gcc tgg ccc ctg gcc aaa tgc aac act aac acc agc 432
Arg Gly Arg Ser Ala Trp Pro Leu Ala Lys Cys Asn Thr Asn Thr Ser
130 135 140
aac aac acg gag gag gag aag aag acg aaa aag aag gat gcg atc gtg 480
Asn Asn Thr Glu Glu Glu Lys Lys Thr Lys Lys Lys Asp Ala Ile Val
145 150 155 160
gtg gac ccg tcc agc aac ctg tac tac cgc tgg ctg acc gcc atc gcc 528
Val Asp Pro Ser Ser Asn Leu Tyr Tyr Arg Trp Leu Thr Ala Ile Ala
165 170 175
ctg cct gtc ttc tat aac tgg tat ctg ctt att tgc agg gcc tgt ttc 576
Leu Pro Val Phe Tyr Asn Trp Tyr Leu Leu Ile Cys Arg Ala Cys Phe
180 185 190
gat gag ctg cag tcc gag tac ctg atg ctg tgg ctg gtc ctg gac tac 624
Asp Glu Leu Gln Ser Glu Tyr Leu Met Leu Trp Leu Val Leu Asp Tyr
195 200 205
tcg gca gat gtc ctg tat gtc ttg gat gtg ctt gta cga gct cgg aca 672
Ser Ala Asp Val Leu Tyr Val Leu Asp Val Leu Val Arg Ala Arg Thr
210 215 220
ggt ttt ctt gag caa ggc tta atg gtc agt gat acc aac agg ctg tgg 720
Gly Phe Leu Glu Gln Gly Leu Met Val Ser Asp Thr Asn Arg Leu Trp
225 230 235 240
cag cat tac aag acg acc acg cag ttc aag ctg gat gtg ttg tcc ctg 768
Gln His Tyr Lys Thr Thr Thr Gln Phe Lys Leu Asp Val Leu Ser Leu
245 250 255
gtc ccc acc gac ctg gct tac tta aag gtg ggc aca aac tac cca gaa 816
Val Pro Thr Asp Leu Ala Tyr Leu Lys Val Gly Thr Asn Tyr Pro Glu
260 265 270
gtg agg ttc aac cgc cta ctg aag ttt tcc cgg ctc ttt gaa ttc ttt 864
Val Arg Phe Asn Arg Leu Leu Lys Phe Ser Arg Leu Phe Glu Phe Phe
275 280 285
gac cgc aca gag aca agg acc aac tac ccc aat atg ttc agg att ggg 912
Asp Arg Thr Glu Thr Arg Thr Asn Tyr Pro Asn Met Phe Arg Ile Gly
290 295 300
aac ttg gtc ttg tac att ctc atc atc atc cac tgg aat gcc tgc atc 960
Asn Leu Val Leu Tyr Ile Leu Ile Ile Ile His Trp Asn Ala Cys Ile
305 310 315 320
tac ttt gcc att tcc aag ttc att ggt ttt ggg aca gac tcc tgg gtc 1008
Tyr Phe Ala Ile Ser Lys Phe Ile Gly Phe Gly Thr Asp Ser Trp Val
325 330 335
tac cca aac atc tca atc cca gag cat ggg cgc ctc tcc agg aag tac 1056
Tyr Pro Asn Ile Ser Ile Pro Glu His Gly Arg Leu Ser Arg Lys Tyr
340 345 350
att tac agt ctc tac tgg tcc acc ttg acc ctt acc acc att ggt gag 1104
Ile Tyr Ser Leu Tyr Trp Ser Thr Leu Thr Leu Thr Thr Ile Gly Glu
355 360 365
acc cca ccc ccc gtg aaa gat gag gag tat ctc ttt gtg gtc gta gac 1152
Thr Pro Pro Pro Val Lys Asp Glu Glu Tyr Leu Phe Val Val Val Asp
370 375 380
ttc ttg gtg ggt gtt ctg att ttt gcc acc att gtg ggc aat gtg ggc 1200
Phe Leu Val Gly Val Leu Ile Phe Ala Thr Ile Val Gly Asn Val Gly
385 390 395 400
tcc atg atc tcg aat atg aat gcc tca cgg gca gag ttc cag gcc aag 1248
Ser Met Ile Ser Asn Met Asn Ala Ser Arg Ala Glu Phe Gln Ala Lys
405 410 415
att gat tcc atc aag cag tac atg cag ttc cgc aag gtc acc aag gac 1296
Ile Asp Ser Ile Lys Gln Tyr Met Gln Phe Arg Lys Val Thr Lys Asp
420 425 430
ttg gag acg cgg gtt atc cgg tgg ttt gac tac ctg tgg gcc aac aag 1344
Leu Glu Thr Arg Val Ile Arg Trp Phe Asp Tyr Leu Trp Ala Asn Lys
435 440 445
aag acg gtg gat gag aag gag gtg ctc aag agc ctc cca gac aag ctg 1392
Lys Thr Val Asp Glu Lys Glu Val Leu Lys Ser Leu Pro Asp Lys Leu
450 455 460
aag gct gag atc gcc atc aac gtg cac ctg gac acg ctg aag aag gtt 1440
Lys Ala Glu Ile Ala Ile Asn Val His Leu Asp Thr Leu Lys Lys Val
465 470 475 480
cgc atc ttc cag gac tgt gag gca ggg ctg ctg gtg gag ctg gtg ctg 1488
Arg Ile Phe Gln Asp Cys Glu Ala Gly Leu Leu Val Glu Leu Val Leu
485 490 495
aag ctg cga ccc act gtg ttc agc cct ggg gat tat atc tgc aag aag 1536
Lys Leu Arg Pro Thr Val Phe Ser Pro Gly Asp Tyr Ile Cys Lys Lys
500 505 510
gga gat att ggg aag gag atg tac atc atc aac gag ggc aag ctg gcc 1584
Gly Asp Ile Gly Lys Glu Met Tyr Ile Ile Asn Glu Gly Lys Leu Ala
515 520 525
gtg gtg gct gat gat ggg gtc acc cag ttc gtg gtc ctc agc gat ggc 1632
Val Val Ala Asp Asp Gly Val Thr Gln Phe Val Val Leu Ser Asp Gly
530 535 540
agc tac ttc ggg gag atc agc att ctg aac atc aag ggg agc aag tcg 1680
Ser Tyr Phe Gly Glu Ile Ser Ile Leu Asn Ile Lys Gly Ser Lys Ser
545 550 555 560
ggg aac cgc agg acg gcc aac atc cgc agc att ggc tac tca gac ctg 1728
Gly Asn Arg Arg Thr Ala Asn Ile Arg Ser Ile Gly Tyr Ser Asp Leu
565 570 575
ttc tgc ctc tca aag gac gat ctc atg gag gcc ctc acc gag tac ccc 1776
Phe Cys Leu Ser Lys Asp Asp Leu Met Glu Ala Leu Thr Glu Tyr Pro
580 585 590
gaa gcc aag aag gcc ctg gag gag aaa gga cgg cag atc ctg atg aaa 1824
Glu Ala Lys Lys Ala Leu Glu Glu Lys Gly Arg Gln Ile Leu Met Lys
595 600 605
gac aac ctg atc gat gag gag ctg gcc agg gcg ggc gcg gac ccc aag 1872
Asp Asn Leu Ile Asp Glu Glu Leu Ala Arg Ala Gly Ala Asp Pro Lys
610 615 620
gac ctt gag gag aaa gtg gag cag ctg ggg tcc tcc ctg gac acc ctg 1920
Asp Leu Glu Glu Lys Val Glu Gln Leu Gly Ser Ser Leu Asp Thr Leu
625 630 635 640
cag acc agg ttt gca cgc ctc ctg gct gag tac aac gcc acc cag atg 1968
Gln Thr Arg Phe Ala Arg Leu Leu Ala Glu Tyr Asn Ala Thr Gln Met
645 650 655
aag atg aag cag cgt ctc agc caa ctg gaa agc cag gtg aag ggt ggt 2016
Lys Met Lys Gln Arg Leu Ser Gln Leu Glu Ser Gln Val Lys Gly Gly
660 665 670
ggg gac aag ccc ctg gct gat ggg gaa gtt ccc ggg gat gct aca aaa 2064
Gly Asp Lys Pro Leu Ala Asp Gly Glu Val Pro Gly Asp Ala Thr Lys
675 680 685
aca gag gac aaa caa cag tga 2085
Thr Glu Asp Lys Gln Gln
690
<210> 14
<211> 694
<212> PRT
<213> Homo sapiens
<400> 14
Met Ala Lys Ile Asn Thr Gln Tyr Ser His Pro Ser Arg Thr His Leu
1 5 10 15
Lys Val Lys Thr Ser Asp Arg Asp Leu Asn Arg Ala Glu Asn Gly Leu
20 25 30
Ser Arg Ala His Ser Ser Ser Glu Glu Thr Ser Ser Val Leu Gln Pro
35 40 45
Gly Ile Ala Met Glu Thr Arg Gly Leu Ala Asp Ser Gly Gln Gly Ser
50 55 60
Phe Thr Gly Gln Gly Ile Ala Arg Leu Ser Arg Leu Ile Phe Leu Leu
65 70 75 80
Arg Arg Trp Ala Ala Arg His Val His His Gln Asp Gln Gly Pro Asp
85 90 95
Ser Phe Pro Asp Arg Phe Arg Gly Ala Glu Leu Lys Glu Val Ser Ser
100 105 110
Gln Glu Ser Asn Ala Gln Ala Asn Val Gly Ser Gln Glu Pro Ala Asp
115 120 125
Arg Gly Arg Ser Ala Trp Pro Leu Ala Lys Cys Asn Thr Asn Thr Ser
130 135 140
Asn Asn Thr Glu Glu Glu Lys Lys Thr Lys Lys Lys Asp Ala Ile Val
145 150 155 160
Val Asp Pro Ser Ser Asn Leu Tyr Tyr Arg Trp Leu Thr Ala Ile Ala
165 170 175
Leu Pro Val Phe Tyr Asn Trp Tyr Leu Leu Ile Cys Arg Ala Cys Phe
180 185 190
Asp Glu Leu Gln Ser Glu Tyr Leu Met Leu Trp Leu Val Leu Asp Tyr
195 200 205
Ser Ala Asp Val Leu Tyr Val Leu Asp Val Leu Val Arg Ala Arg Thr
210 215 220
Gly Phe Leu Glu Gln Gly Leu Met Val Ser Asp Thr Asn Arg Leu Trp
225 230 235 240
Gln His Tyr Lys Thr Thr Thr Gln Phe Lys Leu Asp Val Leu Ser Leu
245 250 255
Val Pro Thr Asp Leu Ala Tyr Leu Lys Val Gly Thr Asn Tyr Pro Glu
260 265 270
Val Arg Phe Asn Arg Leu Leu Lys Phe Ser Arg Leu Phe Glu Phe Phe
275 280 285
Asp Arg Thr Glu Thr Arg Thr Asn Tyr Pro Asn Met Phe Arg Ile Gly
290 295 300
Asn Leu Val Leu Tyr Ile Leu Ile Ile Ile His Trp Asn Ala Cys Ile
305 310 315 320
Tyr Phe Ala Ile Ser Lys Phe Ile Gly Phe Gly Thr Asp Ser Trp Val
325 330 335
Tyr Pro Asn Ile Ser Ile Pro Glu His Gly Arg Leu Ser Arg Lys Tyr
340 345 350
Ile Tyr Ser Leu Tyr Trp Ser Thr Leu Thr Leu Thr Thr Ile Gly Glu
355 360 365
Thr Pro Pro Pro Val Lys Asp Glu Glu Tyr Leu Phe Val Val Val Asp
370 375 380
Phe Leu Val Gly Val Leu Ile Phe Ala Thr Ile Val Gly Asn Val Gly
385 390 395 400
Ser Met Ile Ser Asn Met Asn Ala Ser Arg Ala Glu Phe Gln Ala Lys
405 410 415
Ile Asp Ser Ile Lys Gln Tyr Met Gln Phe Arg Lys Val Thr Lys Asp
420 425 430
Leu Glu Thr Arg Val Ile Arg Trp Phe Asp Tyr Leu Trp Ala Asn Lys
435 440 445
Lys Thr Val Asp Glu Lys Glu Val Leu Lys Ser Leu Pro Asp Lys Leu
450 455 460
Lys Ala Glu Ile Ala Ile Asn Val His Leu Asp Thr Leu Lys Lys Val
465 470 475 480
Arg Ile Phe Gln Asp Cys Glu Ala Gly Leu Leu Val Glu Leu Val Leu
485 490 495
Lys Leu Arg Pro Thr Val Phe Ser Pro Gly Asp Tyr Ile Cys Lys Lys
500 505 510
Gly Asp Ile Gly Lys Glu Met Tyr Ile Ile Asn Glu Gly Lys Leu Ala
515 520 525
Val Val Ala Asp Asp Gly Val Thr Gln Phe Val Val Leu Ser Asp Gly
530 535 540
Ser Tyr Phe Gly Glu Ile Ser Ile Leu Asn Ile Lys Gly Ser Lys Ser
545 550 555 560
Gly Asn Arg Arg Thr Ala Asn Ile Arg Ser Ile Gly Tyr Ser Asp Leu
565 570 575
Phe Cys Leu Ser Lys Asp Asp Leu Met Glu Ala Leu Thr Glu Tyr Pro
580 585 590
Glu Ala Lys Lys Ala Leu Glu Glu Lys Gly Arg Gln Ile Leu Met Lys
595 600 605
Asp Asn Leu Ile Asp Glu Glu Leu Ala Arg Ala Gly Ala Asp Pro Lys
610 615 620
Asp Leu Glu Glu Lys Val Glu Gln Leu Gly Ser Ser Leu Asp Thr Leu
625 630 635 640
Gln Thr Arg Phe Ala Arg Leu Leu Ala Glu Tyr Asn Ala Thr Gln Met
645 650 655
Lys Met Lys Gln Arg Leu Ser Gln Leu Glu Ser Gln Val Lys Gly Gly
660 665 670
Gly Asp Lys Pro Leu Ala Asp Gly Glu Val Pro Gly Asp Ala Thr Lys
675 680 685
Thr Glu Asp Lys Gln Gln
690
<210> 15
<211> 2085
<212> DNA
<213> Homo sapiens
<400> 15
atggccaaga tcaacaccca atactcccac ccctccagga cccacctcaa ggtaaagacc 60
tcagaccgag atctcaatcg cgctgaaaat ggcctcagca gagcccactc gtcaagtgag 120
gagacatcgt cagtgctgca gccggggatc gccatggaga ccagaggact ggctgactcc 180
gggcagggct ccttcaccgg ccaggggatc gccaggctgt cgcgcctcat cttcttgctg 240
cgcaggtggg ctgccaggca tgtgcaccac caggaccagg gaccggactc ttttcctgat 300
cgtttccgtg gagccgagct taaggaggtg tccagccaag aaagcaatgc ccaggcaaat 360
gtgggcagcc aggagccagc agacagaggg agaagcgcct ggcccctggc caaatgcaac 420
actaacacca gcaacaacac ggaggaggag aagaagacga aaaagaagga tgcgatcgtg 480
gtggacccgt ccagcaacct gtactaccgc tggctgaccg ccatcgccct gcctgtcttc 540
tataactggt atctgcttat ttgcagggcc tgtttcgatg agctgcagtc cgagtacctg 600
atgctgtggc tggtcctgga ctactcggca gatgtcctgt atgtcttgga tgtgcttgta 660
cgagctcgga caggttttct cgagcaaggc ttaatggtca gtgataccaa caggctgtgg 720
cagcattaca agacgaccac gcagttcaag ctggatgtgt tgtccctggt ccccaccgac 780
ctggcttact taaaggtggg cacaaactac ccagaagtga ggttcaaccg cctactgaag 840
ttttcccggc tctttgaatt ctttgaccgc acagagacaa ggaccaacta ccccaatatg 900
ttcaggattg ggaacttggt cttgtacatt ctcatcatca tccactggaa tgcctgcatc 960
tactttgcca tttccaagtt cattggtttt gggacagact cctgggtcta cccaaacatc 1020
tcaatcccag agcatgggcg cctctccagg aagtacattt acagtctcta ctggtccacc 1080
ttgaccctta ccaccattgg tgagacccca ccccccgtga aagatgagga gtatctcttt 1140
gtggtcgtag acttcttggt gggtgttctg atttttgcca ccattgtggg caatgtgggc 1200
tccatgatct cgaatatgaa tgcctcacgg gcagagttcc aggccaagat tgattccatc 1260
aagcagtaca tgcagttccg caaggtcacc aaggacttgg agacgcgggt tatccggtgg 1320
tttgactacc tgtgggccaa caagaagacg gtggatgaga aggaggtgct caagagcctc 1380
ccagacaagc tgaaggctga gatcgccatc aacgtgcacc tggacacgct gaagaaggtt 1440
cgcatcttcc aggactgtga ggcagggctg ctggtggagc tggtgctgaa gctgcgaccc 1500
actgtgttca gccctgggga ttatatctgc aagaagggag atattgggaa ggagatgtac 1560
atcatcaacg agggcaagct ggccgtggtg gctgatgatg gggtcaccca gttcgtggtc 1620
ctcagcgatg gcagctactt cggggagatc agcattctga acatcaaggg gagcaagtcg 1680
gggaaccgca ggacggccaa catccgcagc attggctact cagacctgtt ctgcctctca 1740
aaggacgatc tcatggaggc cctcaccgag taccccgaag ccaagaaggc cctggaggag 1800
aaaggacggc agatcctgat gaaagacaac ctgatcgatg aggagctggc cagggcgggc 1860
gcggacccca aggaccttga ggagaaagtg gagcagctgg ggtcctccct ggacaccctg 1920
cagaccaggt ttgcacgcct cctggctgag tacaacgcca cccagatgaa gatgaagcag 1980
cgtctcagcc aactggaaag ccaggtgaag ggtggtgggg acaagcccct ggctgatggg 2040
gaagttcccg gggatgctac aaaaacagag gacaaacaac agtga 2085
<210> 16
<211> 2107
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 16
gcggccgcca ccatggctaa gattaacacc cagtactcac atccatcccg cactcacctc 60
aaagtcaaga cctccgatcg ggatctgaac cgggctgaga atgggctgtc gcgcgcccac 120
tcgtcgtccg aggaaaccag cagcgtgctc cagccgggca tcgccatgga aactaggggg 180
ctggcggact ccggacaggg atccttcact ggacagggta ttgcccggct gagcagactg 240
atcttcctgc ttcgccgctg ggcggccaga cacgtgcacc atcaggacca gggacctgat 300
agcttccccg accgctttag gggagccgag ctgaaagaag tgtcaagcca ggagtcaaac 360
gcgcaggcca acgtcggcag ccaagagcct gcagaccggg gacgctcggc atggccgctc 420
gcaaagtgca acactaacac ttccaacaac accgaagagg aaaagaaaac caagaagaag 480
gatgcaattg tggtggaccc ttcctccaac ctgtactacc gctggttgac cgccatcgcc 540
ctcccggtct tttacaattg gtatctcctt atctgccggg cctgcttcga cgaactgcaa 600
tcagagtacc tgatgctgtg gctggtgctg gactatagcg ccgatgtgct ctacgtcctg 660
gatgtgctcg tgcgcgcccg gaccggattc ttggaacaag gcctgatggt gtccgacacg 720
aatagactgt ggcagcacta taagaccaca acccagttca agcttgacgt gctcagcctt 780
gtgccgactg acctggccta cctgaaagtc ggaactaact acccggaagt cagattcaac 840
cgactcctga agttcagcag gctgttcgag ttctttgacc gcaccgagac tcggaccaac 900
taccctaaca tgttccggat cggaaatctg gtgctctaca tactgattat catccattgg 960
aacgcctgta tctatttcgc catttcgaag ttcatcggtt tcggaaccga ttcctgggtg 1020
taccccaaca tctcgatccc cgaacacggt cgcctgtccc ggaagtacat ctactccctg 1080
tactggtcca ctctgactct gaccacgatc ggggaaaccc ctccacccgt gaaggacgaa 1140
gagtacctgt tcgtggtggt ggacttcctg gtcggagtgt tgattttcgc caccattgtg 1200
ggaaacgtgg gctccatgat ctccaacatg aacgcgtcga gagctgagtt ccaagccaag 1260
atcgactcca ttaagcagta catgcagttc agaaaggtca ccaaggacct ggaaaccagg 1320
gtcatccgct ggttcgacta cctgtgggcc aacaaaaaga ctgtggacga aaaggaagtg 1380
ctgaagtcgc tgccggataa gctgaaggcc gaaatcgcca ttaacgtgca ccttgacacc 1440
ctgaagaaag tccggatctt ccaagactgt gaagccggcc tcctggtgga gctcgtgctc 1500
aagctgcggc ccaccgtgtt cagcccggga gattacattt gcaagaaggg cgatatcggc 1560
aaagagatgt acatcatcaa cgagggaaag ctggccgtgg tcgcggacga cggcgtgacc 1620
cagttcgtgg tgctgtccga cggatcctac ttcggtgaaa tctcaatcct caacatcaag 1680
gggtccaagt ccggcaaccg gagaactgcc aacattcgct ccatcggata cagcgacctg 1740
ttttgcctgt ccaaggatga cctgatggag gctctgactg agtaccctga agcgaagaag 1800
gctttggagg aaaaggggcg gcagattctg atgaaggaca atttgatcga cgaggagctc 1860
gcacgggccg gcgccgaccc caaggatctc gaagagaagg tcgaacagct gggttcttcg 1920
cttgataccc tgcaaacccg attcgcgcgg ctgctcgccg agtacaacgc gacccagatg 1980
aagatgaagc agagactgtc acagttggaa tcccaagtca agggcggagg cgacaagccg 2040
ctggcggacg gggaagtgcc cggggacgcc accaagactg aggacaagca gcagtgatca 2100
tagatct 2107
<210> 17
<211> 2272
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 17
gcggccgcca ccatggctaa gattaacacc cagtactcac atccatcccg cactcacctc 60
aaagtcaaga cctccgatcg ggatctgaac cgggctgaga atgggctgtc gcgcgcccac 120
tcgtcgtccg aggaaaccag cagcgtgctc cagccgggca tcgccatgga aactaggggg 180
ctggcggact ccggacaggg atccttcact ggacagggta ttgcccggtt cgggcggatt 240
cagaagaagt cccagccgga gaaggtcgtg cgggctgcca gcaggggcag gccactcatt 300
ggttggacac agtggtgcgc tgaggatggt ggagatgaat cggaaatggc actggccggc 360
tctcccggat gcagctcggg cccccaaggg agactgagca gactgatctt cctgcttcgc 420
cgctgggcgg ccagacacgt gcaccatcag gaccagggac ctgatagctt ccccgaccgc 480
tttaggggag ccgagctgaa agaagtgtca agccaggagt caaacgcgca ggccaacgtc 540
ggcagccaag agcctgcaga ccggggacgc tcggcatggc cgctcgcaaa gtgcaacact 600
aacacttcca acaacaccga agaggaaaag aaaaccaaga agaaggatgc aattgtggtg 660
gacccttcct ccaacctgta ctaccgctgg ttgaccgcca tcgccctccc ggtcttttac 720
aattggtatc tccttatctg ccgggcctgc ttcgacgaac tgcaatcaga gtacctgatg 780
ctgtggctgg tgctggacta tagcgccgat gtgctctacg tcctggatgt gctcgtgcgc 840
gcccggaccg gattcttgga acaaggcctg atggtgtccg acacgaatag actgtggcag 900
cactataaga ccacaaccca gttcaagctt gacgtgctca gccttgtgcc gactgacctg 960
gcctacctga aagtcggaac taactacccg gaagtcagat tcaaccgact cctgaagttc 1020
agcaggctgt tcgagttctt tgaccgcacc gagactcgga ccaactaccc taacatgttc 1080
cggatcggaa atctggtgct ctacatactg attatcatcc attggaacgc ctgtatctat 1140
ttcgccattt cgaagttcat cggtttcgga accgattcct gggtgtaccc caacatctcg 1200
atccccgaac acggtcgcct gtcccggaag tacatctact ccctgtactg gtccactctg 1260
actctgacca cgatcgggga aacccctcca cccgtgaagg acgaagagta cctgttcgtg 1320
gtggtggact tcctggtcgg agtgttgatt ttcgccacca ttgtgggaaa cgtgggctcc 1380
atgatctcca acatgaacgc gtcgagagct gagttccaag ccaagatcga ctccattaag 1440
cagtacatgc agttcagaaa ggtcaccaag gacctggaaa ccagggtcat ccgctggttc 1500
gactacctgt gggccaacaa aaagactgtg gacgaaaagg aagtgctgaa gtcgctgccg 1560
gataagctga aggccgaaat cgccattaac gtgcaccttg acaccctgaa gaaagtccgg 1620
atcttccaag actgtgaagc cggcctcctg gtggagctcg tgctcaagct gcggcccacc 1680
gtgttcagcc cgggagatta catttgcaag aagggcgata tcggcaaaga gatgtacatc 1740
atcaacgagg gaaagctggc cgtggtcgcg gacgacggcg tgacccagtt cgtggtgctg 1800
tccgacggat cctacttcgg tgaaatctca atcctcaaca tcaaggggtc caagtccggc 1860
aaccggagaa ctgccaacat tcgctccatc ggatacagcg acctgttttg cctgtccaag 1920
gatgacctga tggaggctct gactgagtac cctgaagcga agaaggcttt ggaggaaaag 1980
gggcggcaga ttctgatgaa ggacaatttg atcgacgagg agctcgcacg ggccggcgcc 2040
gaccccaagg atctcgaaga gaaggtcgaa cagctgggtt cttcgcttga taccctgcaa 2100
acccgattcg cgcggctgct cgccgagtac aacgcgaccc agatgaagat gaagcagaga 2160
ctgtcacagt tggaatccca agtcaagggc ggaggcgaca agccgctggc ggacggggaa 2220
gtgcccgggg acgccaccaa gactgaggac aagcagcagt gatcatagat ct 2272
<210> 18
<211> 2107
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 18
gcggccgcca ccatggccaa gatcaacacc caatactccc acccctccag gacccacctc 60
aaggtaaaga cctcagaccg ggatctcaat cgcgctgaaa atggcctcag cagagcccac 120
tcgtcaagtg aggagacatc gtcagtgctg cagccgggga tcgccatgga gaccagagga 180
ctggctgact ccgggcaggg ctccttcacc ggccagggga tcgccaggct gtcgcgcctc 240
atcttcttgc tgcgcaggtg ggctgccagg catgtgcacc accaggacca gggaccggac 300
tcttttcctg atcgtttccg tggagccgag cttaaggagg tgtccagcca agaaagcaat 360
gcccaggcaa atgtgggcag ccaggagcca gcagacagag ggagaagcgc ctggcccctg 420
gccaaatgca acactaacac cagcaacaac acggaggagg agaagaagac gaaaaagaag 480
gatgcgatcg tggtggaccc gtccagcaac ctgtactacc gctggctgac cgccatcgcc 540
ctgcctgtct tctataactg gtatctgctt atttgcaggg cctgtttcga tgagctgcag 600
tccgagtacc tgatgctgtg gctggtcctg gactactcgg cagatgtcct gtatgtcttg 660
gatgtgcttg tacgagctcg gacaggtttt cttgagcaag gcttaatggt cagtgatacc 720
aacaggctgt ggcagcatta caagacgacc acgcagttca agctggatgt gttgtccctg 780
gtccccaccg acctggctta cttaaaggtg ggcacaaact acccagaagt gaggttcaac 840
cgcctactga agttttcccg gctctttgaa ttctttgacc gcacagagac aaggaccaac 900
taccccaata tgttcaggat tgggaacttg gtcttgtaca ttctcatcat catccactgg 960
aatgcctgca tctactttgc catttccaag ttcattggtt ttgggacaga ctcctgggtc 1020
tacccaaaca tctcaatccc agagcatggg cgcctctcca ggaagtacat ttacagtctc 1080
tactggtcca ccttgaccct taccaccatt ggtgagaccc caccccccgt gaaagatgag 1140
gagtatctct ttgtggtcgt agacttcttg gtgggtgttc tgatttttgc caccattgtg 1200
ggcaatgtgg gctccatgat ctcgaatatg aatgcctcac gggcagagtt ccaggccaag 1260
attgattcca tcaagcagta catgcagttc cgcaaggtca ccaaggactt ggagacgcgg 1320
gttatccggt ggtttgacta cctgtgggcc aacaagaaga cggtggatga gaaggaggtg 1380
ctcaagagcc tcccagacaa gctgaaggct gagatcgcca tcaacgtgca cctggacacg 1440
ctgaagaagg ttcgcatctt ccaggactgt gaggcagggc tgctggtgga gctggtgctg 1500
aagctgcgac ccactgtgtt cagccctggg gattatatct gcaagaaggg agatattggg 1560
aaggagatgt acatcatcaa cgagggcaag ctggccgtgg tggctgatga tggggtcacc 1620
cagttcgtgg tcctcagcga tggcagctac ttcggggaga tcagcattct gaacatcaag 1680
gggagcaagt cggggaaccg caggacggcc aacatccgca gcattggcta ctcagacctg 1740
ttctgcctct caaaggacga tctcatggag gccctcaccg agtaccccga agccaagaag 1800
gccctggagg agaaaggacg gcagatcctg atgaaagaca acctgatcga tgaggagctg 1860
gccagggcgg gcgcggaccc caaggacctt gaggagaaag tggagcagct ggggtcctcc 1920
ctggacaccc tgcagaccag gtttgcacgc ctcctggctg agtacaacgc cacccagatg 1980
aagatgaagc agcgtctcag ccaactggaa agccaggtga agggtggtgg ggacaagccc 2040
ctggctgatg gggaagttcc cggggatgct acaaaaacag aggacaaaca acagtgatca 2100
tagatct 2107
<210> 19
<211> 2430
<212> DNA
<213> Homo sapiens
<220>
<221> CDS
<222> (1)..(2430)
<400> 19
atg ttt aaa tcg ctg aca aaa gtc aac aag gtg aag cct ata gga gag 48
Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro Ile Gly Glu
1 5 10 15
aac aat gag aat gaa caa agt tct cgt cgg aat gaa gaa ggc tct cac 96
Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu Gly Ser His
20 25 30
cca agt aat cag tct cag caa acc aca gca cag gaa gaa aac aaa ggt 144
Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu Asn Lys Gly
35 40 45
gaa gag aaa tct ctc aaa acc aag tca act cca gtc acg tct gaa gag 192
Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr Ser Glu Glu
50 55 60
cca cac acc aac ata caa gac aaa ctc tcc aag aaa aat tcc tct gga 240
Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn Ser Ser Gly
65 70 75 80
gat ctg acc aca aac cct gac cct caa aat gca gca gaa cca act gga 288
Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu Pro Thr Gly
85 90 95
aca gtg cca gag cag aag gaa atg gac ccc ggg aaa gaa ggt cca aac 336
Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu Gly Pro Asn
100 105 110
agc cca caa aac aaa ccg cct gca gct cct gtt ata aat gag tat gcc 384
Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn Glu Tyr Ala
115 120 125
gat gcc cag cta cac aac ctg gtg aaa aga atg cgt caa aga aca gcc 432
Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln Arg Thr Ala
130 135 140
ctc tac aag aaa aag ttg gta gag gga gat ctc tcc tca ccc gaa gcc 480
Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser Pro Glu Ala
145 150 155 160
agc cca caa act gca aag ccc acg gct gta cca cca gta aaa gaa agc 528
Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val Lys Glu Ser
165 170 175
gat gat aag cca aca gaa cat tac tac agg ctg ttg tgg ttc aaa gtc 576
Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp Phe Lys Val
180 185 190
aaa aag atg cct tta aca gag tac tta aag cga att aaa ctt cca aac 624
Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys Leu Pro Asn
195 200 205
agc ata gat tca tac aca gat cga ctc tat ctc ctg tgg ctc ttg ctt 672
Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp Leu Leu Leu
210 215 220
gtc act ctt gcc tat aac tgg aac tgc tgt ttt ata cca ctg cgc ctc 720
Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro Leu Arg Leu
225 230 235 240
gtc ttc cca tat caa acc gca gac aac ata cac tac tgg ctt att gcg 768
Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp Leu Ile Ala
245 250 255
gac atc ata tgt gat atc atc tac ctt tat gat atg cta ttt atc cag 816
Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu Phe Ile Gln
260 265 270
ccc aga ctc cag ttt gta aga gga gga gac ata ata gtg gat tca aat 864
Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val Asp Ser Asn
275 280 285
gag cta agg aaa cac tac agg act tct aca aaa ttt cag ttg gat gtc 912
Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln Leu Asp Val
290 295 300
gca tca ata ata cca ttt gat att tgc tac ctc ttc ttt ggg ttt aat 960
Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe Gly Phe Asn
305 310 315 320
cca atg ttt aga gca aat agg atg tta aag tac act tca ttt ttt gaa 1008
Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser Phe Phe Glu
325 330 335
ttt aat cat cac cta gag tct ata atg gac aaa gca tat atc tac aga 1056
Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr Ile Tyr Arg
340 345 350
gtt att cga aca act gga tac ttg ctg ttt att ctg cac att aat gcc 1104
Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His Ile Asn Ala
355 360 365
tgt gtt tat tac tgg gct tca aac tat gaa gga att ggc act act aga 1152
Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly Thr Thr Arg
370 375 380
tgg gtg tat gat ggg gaa gga aac gag tat ctg aga tgt tat tat tgg 1200
Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys Tyr Tyr Trp
385 390 395 400
gca gtt cga act tta att acc att ggt ggc ctt cca gaa cca caa act 1248
Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu Pro Gln Thr
405 410 415
tta ttt gaa att gtt ttt caa ctc ttg aat ttt ttt tct gga gtt ttt 1296
Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser Gly Val Phe
420 425 430
gtg ttc tcc agt tta att ggt cag atg aga gat gtg att gga gca gct 1344
Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile Gly Ala Ala
435 440 445
aca gcc aat cag aac tac ttc cgc gcc tgc atg gat gac acc att gcc 1392
Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp Thr Ile Ala
450 455 460
tac atg aac aat tac tcc att cct aaa ctt gtg caa aag cga gtt cgg 1440
Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys Arg Val Arg
465 470 475 480
act tgg tat gaa tat aca tgg gac tct caa aga atg cta gat gag tct 1488
Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu Asp Glu Ser
485 490 495
gat ttg ctt aag acc cta cca act acg gtc cag tta gcc ctc gcc att 1536
Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala Leu Ala Ile
500 505 510
gat gtg aac ttc agc atc atc agc aaa gtc gac ttg ttc aag ggt tgt 1584
Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe Lys Gly Cys
515 520 525
gat aca cag atg att tat gac atg ttg cta aga ttg aaa tcc gtt ctc 1632
Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys Ser Val Leu
530 535 540
tat ttg cct ggt gac ttt gtc tgc aaa aag gga gaa att ggc aag gaa 1680
Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile Gly Lys Glu
545 550 555 560
atg tat atc atc aag cat gga gaa gtc caa gtt ctt gga ggc cct gat 1728
Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly Gly Pro Asp
565 570 575
ggt act aaa gtt ctg gtt act ctg aaa gct ggg tcg gtg ttt gga gaa 1776
Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val Phe Gly Glu
580 585 590
atc agc ctt cta gca gca gga gga gga aac cgt cga act gcc aat gtg 1824
Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr Ala Asn Val
595 600 605
gtg gcc cac ggg ttt gcc aat ctt tta act cta gac aaa aag acc ctc 1872
Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys Lys Thr Leu
610 615 620
caa gaa att cta gtg cat tat cca gat tct gaa agg atc ctc atg aag 1920
Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile Leu Met Lys
625 630 635 640
aaa gcc aga gtg ctt tta aag cag aag gct aag acc gca gaa gca acc 1968
Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala Glu Ala Thr
645 650 655
cct cca aga aaa gat ctt gcc ctc ctc ttc cca ccg aaa gaa gag aca 2016
Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys Glu Glu Thr
660 665 670
ccc aaa ctg ttt aaa act ctc cta gga ggc aca gga aaa gca agt ctt 2064
Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys Ala Ser Leu
675 680 685
gca aga cta ctc aaa ttg aag cga gag caa gca gct cag aag aaa gaa 2112
Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln Lys Lys Glu
690 695 700
aat tct gaa gga gga gag gaa gaa gga aaa gaa aat gaa gat aaa caa 2160
Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu Asp Lys Gln
705 710 715 720
aaa gaa aat gaa gat aaa caa aaa gaa aat gaa gat aaa gga aaa gaa 2208
Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys Gly Lys Glu
725 730 735
aat gaa gat aaa gat aaa gga aga gag cca gaa gag aag cca ctg gac 2256
Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys Pro Leu Asp
740 745 750
aga cct gaa tgt aca gca agt cct att gca gtg gag gaa gaa ccc cac 2304
Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu Glu Pro His
755 760 765
tca gtt aga agg aca gtt tta ccc aga ggg act tct cgt caa tca ctc 2352
Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg Gln Ser Leu
770 775 780
att atc agc atg gct cct tct gct gag ggc gga gaa gag gtt ctt act 2400
Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu Val Leu Thr
785 790 795 800
att gaa gtc aaa gaa aag gct aag caa taa 2430
Ile Glu Val Lys Glu Lys Ala Lys Gln
805
<210> 20
<211> 809
<212> PRT
<213> Homo sapiens
<400> 20
Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro Ile Gly Glu
1 5 10 15
Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu Gly Ser His
20 25 30
Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu Asn Lys Gly
35 40 45
Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr Ser Glu Glu
50 55 60
Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn Ser Ser Gly
65 70 75 80
Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu Pro Thr Gly
85 90 95
Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu Gly Pro Asn
100 105 110
Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn Glu Tyr Ala
115 120 125
Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln Arg Thr Ala
130 135 140
Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser Pro Glu Ala
145 150 155 160
Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val Lys Glu Ser
165 170 175
Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp Phe Lys Val
180 185 190
Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys Leu Pro Asn
195 200 205
Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp Leu Leu Leu
210 215 220
Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro Leu Arg Leu
225 230 235 240
Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp Leu Ile Ala
245 250 255
Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu Phe Ile Gln
260 265 270
Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val Asp Ser Asn
275 280 285
Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln Leu Asp Val
290 295 300
Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe Gly Phe Asn
305 310 315 320
Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser Phe Phe Glu
325 330 335
Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr Ile Tyr Arg
340 345 350
Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His Ile Asn Ala
355 360 365
Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly Thr Thr Arg
370 375 380
Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys Tyr Tyr Trp
385 390 395 400
Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu Pro Gln Thr
405 410 415
Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser Gly Val Phe
420 425 430
Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile Gly Ala Ala
435 440 445
Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp Thr Ile Ala
450 455 460
Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys Arg Val Arg
465 470 475 480
Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu Asp Glu Ser
485 490 495
Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala Leu Ala Ile
500 505 510
Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe Lys Gly Cys
515 520 525
Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys Ser Val Leu
530 535 540
Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile Gly Lys Glu
545 550 555 560
Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly Gly Pro Asp
565 570 575
Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val Phe Gly Glu
580 585 590
Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr Ala Asn Val
595 600 605
Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys Lys Thr Leu
610 615 620
Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile Leu Met Lys
625 630 635 640
Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala Glu Ala Thr
645 650 655
Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys Glu Glu Thr
660 665 670
Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys Ala Ser Leu
675 680 685
Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln Lys Lys Glu
690 695 700
Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu Asp Lys Gln
705 710 715 720
Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys Gly Lys Glu
725 730 735
Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys Pro Leu Asp
740 745 750
Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu Glu Pro His
755 760 765
Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg Gln Ser Leu
770 775 780
Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu Val Leu Thr
785 790 795 800
Ile Glu Val Lys Glu Lys Ala Lys Gln
805
<210> 21
<211> 2430
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<220>
<221> CDS
<222> (1)..(2430)
<400> 21
atg ttt aaa tcg ctg aca aaa gtc aac aag gtg aag cct ata gga gag 48
Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro Ile Gly Glu
1 5 10 15
aac aat gag aat gaa caa agt tct cgt cgg aat gaa gaa ggc tct cac 96
Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu Gly Ser His
20 25 30
cca agt aat cag tct cag caa acc aca gca cag gaa gaa aac aaa ggt 144
Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu Asn Lys Gly
35 40 45
gaa gag aaa tct ctc aaa acc aag tca act cca gtc acg tct gaa gag 192
Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr Ser Glu Glu
50 55 60
cca cac acc aac ata caa gac aaa ctc tcc aag aaa aat tcc tct gga 240
Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn Ser Ser Gly
65 70 75 80
gat ctg acc aca aac cct gac cct caa aat gca gca gaa cca act gga 288
Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu Pro Thr Gly
85 90 95
aca gtg cca gag cag aag gaa atg gac ccc ggg aaa gaa ggt cca aac 336
Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu Gly Pro Asn
100 105 110
agc cca caa aac aaa ccg cca gca gct cct gtt ata aat gag tat gcc 384
Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn Glu Tyr Ala
115 120 125
gat gcc cag cta cac aac ctg gtg aaa aga atg cgt caa aga aca gcc 432
Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln Arg Thr Ala
130 135 140
ctc tac aag aaa aag ttg gta gag gga gat ctc tcc tca ccc gaa gcc 480
Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser Pro Glu Ala
145 150 155 160
agc cca caa act gca aag ccc acg gct gta cca cca gta aaa gaa agc 528
Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val Lys Glu Ser
165 170 175
gat gat aag cca aca gaa cat tac tac agg ctg ttg tgg ttc aaa gtc 576
Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp Phe Lys Val
180 185 190
aaa aag atg cct tta aca gag tac tta aag cga att aaa ctt cca aac 624
Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys Leu Pro Asn
195 200 205
agc ata gat tca tac aca gat cga ctc tat ctc ctg tgg ctc ttg ctt 672
Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp Leu Leu Leu
210 215 220
gtc act ctt gcc tat aac tgg aac tgc tgt ttt ata cca ctg cgc ctc 720
Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro Leu Arg Leu
225 230 235 240
gtc ttc cca tat caa acc gca gac aac ata cac tac tgg ctt att gcg 768
Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp Leu Ile Ala
245 250 255
gac atc atc tgt gat atc atc tac ctt tat gat atg cta ttt atc cag 816
Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu Phe Ile Gln
260 265 270
ccc aga ctc cag ttt gta aga gga gga gac ata ata gtg gat tca aat 864
Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val Asp Ser Asn
275 280 285
gag cta agg aaa cac tac agg act tct aca aaa ttt cag ttg gat gtc 912
Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln Leu Asp Val
290 295 300
gca tca ata ata cca ttt gat att tgc tac ctc ttc ttt ggg ttt aat 960
Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe Gly Phe Asn
305 310 315 320
cca atg ttt aga gca aat agg atg tta aag tac act tca ttt ttt gaa 1008
Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser Phe Phe Glu
325 330 335
ttt aat cat cac cta gag tct ata atg gac aaa gca tat atc tac aga 1056
Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr Ile Tyr Arg
340 345 350
gtt att cga aca act gga tac ttg ctg ttt att ctg cac att aat gcc 1104
Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His Ile Asn Ala
355 360 365
tgt gtt tat tac tgg gct tca aac tat gaa gga att ggc act act aga 1152
Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly Thr Thr Arg
370 375 380
tgg gtg tat gat ggg gaa gga aac gag tat ctg aga tgt tat tat tgg 1200
Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys Tyr Tyr Trp
385 390 395 400
gca gtt cga act tta att acc att ggt ggc ctt cca gaa cca caa act 1248
Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu Pro Gln Thr
405 410 415
tta ttt gaa att gtt ttt caa ctc ttg aat ttt ttt tct gga gtt ttt 1296
Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser Gly Val Phe
420 425 430
gtg ttc tcc agt tta att ggt cag atg aga gat gtg att gga gca gct 1344
Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile Gly Ala Ala
435 440 445
aca gcc aat cag aac tac ttc cgc gcc tgc atg gat gac acc att gcc 1392
Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp Thr Ile Ala
450 455 460
tac atg aac aat tac tcc att cct aaa ctt gtg caa aag cga gtt cgg 1440
Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys Arg Val Arg
465 470 475 480
act tgg tat gaa tat aca tgg gac tct caa aga atg cta gat gag tct 1488
Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu Asp Glu Ser
485 490 495
gat ttg ctt aag acc cta cca act acg gtc cag tta gcc ctc gcc att 1536
Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala Leu Ala Ile
500 505 510
gat gtg aac ttc agc atc atc agc aaa gtt gac ttg ttc aag ggt tgt 1584
Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe Lys Gly Cys
515 520 525
gat aca cag atg att tat gac atg ttg cta aga ttg aaa tcc gtt ctc 1632
Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys Ser Val Leu
530 535 540
tat ttg cct ggt gac ttt gtc tgc aaa aag gga gaa att ggc aag gaa 1680
Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile Gly Lys Glu
545 550 555 560
atg tat atc atc aag cat gga gaa gtc caa gtt ctt gga ggc cct gat 1728
Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly Gly Pro Asp
565 570 575
ggt act aaa gtt ctg gtt act ctg aaa gct ggg tcg gtg ttt gga gaa 1776
Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val Phe Gly Glu
580 585 590
atc agc ctt cta gca gca gga gga gga aac cgt cga act gcc aat gtg 1824
Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr Ala Asn Val
595 600 605
gtg gcc cac ggg ttt gcc aat ctt tta act cta gac aaa aag acc ctc 1872
Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys Lys Thr Leu
610 615 620
caa gaa att cta gtg cat tat cca gat tct gaa aga atc ctc atg aag 1920
Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile Leu Met Lys
625 630 635 640
aaa gcc aga gtg ctt tta aag cag aag gct aag acc gca gaa gca acc 1968
Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala Glu Ala Thr
645 650 655
cct cca aga aaa gat ctt gcc ctc ctc ttc cca ccg aaa gaa gag aca 2016
Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys Glu Glu Thr
660 665 670
ccc aaa ctg ttt aaa act ctc cta gga ggc aca gga aaa gca agt ctt 2064
Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys Ala Ser Leu
675 680 685
gca aga cta ctc aaa ttg aag cga gag caa gca gct cag aag aaa gaa 2112
Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln Lys Lys Glu
690 695 700
aat tct gaa gga gga gag gaa gaa gga aaa gaa aat gaa gat aaa caa 2160
Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu Asp Lys Gln
705 710 715 720
aaa gaa aat gaa gat aaa caa aaa gaa aat gaa gat aaa gga aaa gaa 2208
Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys Gly Lys Glu
725 730 735
aat gaa gat aaa gat aaa gga aga gag cca gaa gag aag cca ctg gac 2256
Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys Pro Leu Asp
740 745 750
aga cct gaa tgt aca gca agt cct att gca gtg gag gaa gaa ccc cac 2304
Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu Glu Pro His
755 760 765
tca gtt aga agg aca gtt tta ccc aga ggg act tct cgt caa tca ctc 2352
Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg Gln Ser Leu
770 775 780
att atc agc atg gct cct tct gct gag ggc gga gaa gag gtt ctt act 2400
Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu Val Leu Thr
785 790 795 800
att gaa gtc aaa gaa aag gct aag caa tga 2430
Ile Glu Val Lys Glu Lys Ala Lys Gln
805
<210> 22
<211> 809
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 22
Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro Ile Gly Glu
1 5 10 15
Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu Gly Ser His
20 25 30
Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu Asn Lys Gly
35 40 45
Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr Ser Glu Glu
50 55 60
Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn Ser Ser Gly
65 70 75 80
Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu Pro Thr Gly
85 90 95
Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu Gly Pro Asn
100 105 110
Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn Glu Tyr Ala
115 120 125
Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln Arg Thr Ala
130 135 140
Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser Pro Glu Ala
145 150 155 160
Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val Lys Glu Ser
165 170 175
Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp Phe Lys Val
180 185 190
Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys Leu Pro Asn
195 200 205
Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp Leu Leu Leu
210 215 220
Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro Leu Arg Leu
225 230 235 240
Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp Leu Ile Ala
245 250 255
Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu Phe Ile Gln
260 265 270
Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val Asp Ser Asn
275 280 285
Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln Leu Asp Val
290 295 300
Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe Gly Phe Asn
305 310 315 320
Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser Phe Phe Glu
325 330 335
Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr Ile Tyr Arg
340 345 350
Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His Ile Asn Ala
355 360 365
Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly Thr Thr Arg
370 375 380
Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys Tyr Tyr Trp
385 390 395 400
Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu Pro Gln Thr
405 410 415
Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser Gly Val Phe
420 425 430
Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile Gly Ala Ala
435 440 445
Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp Thr Ile Ala
450 455 460
Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys Arg Val Arg
465 470 475 480
Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu Asp Glu Ser
485 490 495
Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala Leu Ala Ile
500 505 510
Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe Lys Gly Cys
515 520 525
Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys Ser Val Leu
530 535 540
Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile Gly Lys Glu
545 550 555 560
Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly Gly Pro Asp
565 570 575
Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val Phe Gly Glu
580 585 590
Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr Ala Asn Val
595 600 605
Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys Lys Thr Leu
610 615 620
Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile Leu Met Lys
625 630 635 640
Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala Glu Ala Thr
645 650 655
Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys Glu Glu Thr
660 665 670
Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys Ala Ser Leu
675 680 685
Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln Lys Lys Glu
690 695 700
Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu Asp Lys Gln
705 710 715 720
Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys Gly Lys Glu
725 730 735
Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys Pro Leu Asp
740 745 750
Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu Glu Pro His
755 760 765
Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg Gln Ser Leu
770 775 780
Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu Val Leu Thr
785 790 795 800
Ile Glu Val Lys Glu Lys Ala Lys Gln
805
<210> 23
<211> 2454
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<220>
<221> misc_feature
<222> (1)..(12)
<223> modified end with NotI site and Kozak
<220>
<221> misc_feature
<222> (1)..(8)
<223> NotI site for subcloning
<220>
<221> CDS
<222> (13)..(2448)
<223> ORF with silent mutations (stop codon and restriction sites
BamHI, PstI, SalI, and NdeI)
<220>
<221> misc_feature
<222> (2440)..(2442)
<223> modifed stop codon
<220>
<221> misc_feature
<222> (2440)..(2445)
<223> BclI site to facilitate addition of epitope tag
<220>
<221> misc_feature
<222> (2446)..(2448)
<223> additional stop codon
<220>
<221> misc_feature
<222> (2449)..(2454)
<223> PstI site for subcloning
<400> 23
gcggccgcca cc atg ttt aaa tcg ctg aca aaa gtc aac aag gtg aag cct 51
Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro
1 5 10
ata gga gag aac aat gag aat gaa caa agt tct cgt cgg aat gaa gaa 99
Ile Gly Glu Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu
15 20 25
ggc tct cac cca agt aat cag tct cag caa acc aca gca cag gaa gaa 147
Gly Ser His Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu
30 35 40 45
aac aaa ggt gaa gag aaa tct ctc aaa acc aag tca act cca gtc acg 195
Asn Lys Gly Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr
50 55 60
tct gaa gag cca cac acc aac ata caa gac aaa ctc tcc aag aaa aat 243
Ser Glu Glu Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn
65 70 75
tcc tct gga gat ctg acc aca aac cct gac cct caa aat gca gca gaa 291
Ser Ser Gly Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu
80 85 90
cca act gga aca gtg cca gag cag aag gaa atg gac ccc ggg aaa gaa 339
Pro Thr Gly Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu
95 100 105
ggt cca aac agc cca caa aac aaa ccg cca gca gct cct gtt ata aat 387
Gly Pro Asn Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn
110 115 120 125
gag tat gcc gat gcc cag cta cac aac ctg gtg aaa aga atg cgt caa 435
Glu Tyr Ala Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln
130 135 140
aga aca gcc ctc tac aag aaa aag ttg gta gag gga gat ctc tcc tca 483
Arg Thr Ala Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser
145 150 155
ccc gaa gcc agc cca caa act gca aag ccc acg gct gta cca cca gta 531
Pro Glu Ala Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val
160 165 170
aaa gaa agc gat gat aag cca aca gaa cat tac tac agg ctg ttg tgg 579
Lys Glu Ser Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp
175 180 185
ttc aaa gtc aaa aag atg cct tta aca gag tac tta aag cga att aaa 627
Phe Lys Val Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys
190 195 200 205
ctt cca aac agc ata gat tca tac aca gat cga ctc tat ctc ctg tgg 675
Leu Pro Asn Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp
210 215 220
ctc ttg ctt gtc act ctt gcc tat aac tgg aac tgc tgt ttt ata cca 723
Leu Leu Leu Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro
225 230 235
ctg cgc ctc gtc ttc cca tat caa acc gca gac aac ata cac tac tgg 771
Leu Arg Leu Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp
240 245 250
ctt att gcg gac atc atc tgt gat atc atc tac ctt tat gat atg cta 819
Leu Ile Ala Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu
255 260 265
ttt atc cag ccc aga ctc cag ttt gta aga gga gga gac ata ata gtg 867
Phe Ile Gln Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val
270 275 280 285
gat tca aat gag cta agg aaa cac tac agg act tct aca aaa ttt cag 915
Asp Ser Asn Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln
290 295 300
ttg gat gtc gca tca ata ata cca ttt gat att tgc tac ctc ttc ttt 963
Leu Asp Val Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe
305 310 315
ggg ttt aat cca atg ttt aga gca aat agg atg tta aag tac act tca 1011
Gly Phe Asn Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser
320 325 330
ttt ttt gaa ttt aat cat cac cta gag tct ata atg gac aaa gca tat 1059
Phe Phe Glu Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr
335 340 345
atc tac aga gtt att cga aca act gga tac ttg ctg ttt att ctg cac 1107
Ile Tyr Arg Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His
350 355 360 365
att aat gcc tgt gtt tat tac tgg gct tca aac tat gaa gga att ggc 1155
Ile Asn Ala Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly
370 375 380
act act aga tgg gtg tat gat ggg gaa gga aac gag tat ctg aga tgt 1203
Thr Thr Arg Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys
385 390 395
tat tat tgg gca gtt cga act tta att acc att ggt ggc ctt cca gaa 1251
Tyr Tyr Trp Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu
400 405 410
cca caa act tta ttt gaa att gtt ttt caa ctc ttg aat ttt ttt tct 1299
Pro Gln Thr Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser
415 420 425
gga gtt ttt gtg ttc tcc agt tta att ggt cag atg aga gat gtg att 1347
Gly Val Phe Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile
430 435 440 445
gga gca gct aca gcc aat cag aac tac ttc cgc gcc tgc atg gat gac 1395
Gly Ala Ala Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp
450 455 460
acc att gcc tac atg aac aat tac tcc att cct aaa ctt gtg caa aag 1443
Thr Ile Ala Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys
465 470 475
cga gtt cgg act tgg tat gaa tat aca tgg gac tct caa aga atg cta 1491
Arg Val Arg Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu
480 485 490
gat gag tct gat ttg ctt aag acc cta cca act acg gtc cag tta gcc 1539
Asp Glu Ser Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala
495 500 505
ctc gcc att gat gtg aac ttc agc atc atc agc aaa gtt gac ttg ttc 1587
Leu Ala Ile Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe
510 515 520 525
aag ggt tgt gat aca cag atg att tat gac atg ttg cta aga ttg aaa 1635
Lys Gly Cys Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys
530 535 540
tcc gtt ctc tat ttg cct ggt gac ttt gtc tgc aaa aag gga gaa att 1683
Ser Val Leu Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile
545 550 555
ggc aag gaa atg tat atc atc aag cat gga gaa gtc caa gtt ctt gga 1731
Gly Lys Glu Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly
560 565 570
ggc cct gat ggt act aaa gtt ctg gtt act ctg aaa gct ggg tcg gtg 1779
Gly Pro Asp Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val
575 580 585
ttt gga gaa atc agc ctt cta gca gca gga gga gga aac cgt cga act 1827
Phe Gly Glu Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr
590 595 600 605
gcc aat gtg gtg gcc cac ggg ttt gcc aat ctt tta act cta gac aaa 1875
Ala Asn Val Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys
610 615 620
aag acc ctc caa gaa att cta gtg cat tat cca gat tct gaa aga atc 1923
Lys Thr Leu Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile
625 630 635
ctc atg aag aaa gcc aga gtg ctt tta aag cag aag gct aag acc gca 1971
Leu Met Lys Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala
640 645 650
gaa gca acc cct cca aga aaa gat ctt gcc ctc ctc ttc cca ccg aaa 2019
Glu Ala Thr Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys
655 660 665
gaa gag aca ccc aaa ctg ttt aaa act ctc cta gga ggc aca gga aaa 2067
Glu Glu Thr Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys
670 675 680 685
gca agt ctt gca aga cta ctc aaa ttg aag cga gag caa gca gct cag 2115
Ala Ser Leu Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln
690 695 700
aag aaa gaa aat tct gaa gga gga gag gaa gaa gga aaa gaa aat gaa 2163
Lys Lys Glu Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu
705 710 715
gat aaa caa aaa gaa aat gaa gat aaa caa aaa gaa aat gaa gat aaa 2211
Asp Lys Gln Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys
720 725 730
gga aaa gaa aat gaa gat aaa gat aaa gga aga gag cca gaa gag aag 2259
Gly Lys Glu Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys
735 740 745
cca ctg gac aga cct gaa tgt aca gca agt cct att gca gtg gag gaa 2307
Pro Leu Asp Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu
750 755 760 765
gaa ccc cac tca gtt aga agg aca gtt tta ccc aga ggg act tct cgt 2355
Glu Pro His Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg
770 775 780
caa tca ctc att atc agc atg gct cct tct gct gag ggc gga gaa gag 2403
Gln Ser Leu Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu
785 790 795
gtt ctt act att gaa gtc aaa gaa aag gct aag caa tga tca taa 2448
Val Leu Thr Ile Glu Val Lys Glu Lys Ala Lys Gln Ser
800 805 810
ctgcag 2454
<210> 24
<211> 809
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Construct
<400> 24
Met Phe Lys Ser Leu Thr Lys Val Asn Lys Val Lys Pro Ile Gly Glu
1 5 10 15
Asn Asn Glu Asn Glu Gln Ser Ser Arg Arg Asn Glu Glu Gly Ser His
20 25 30
Pro Ser Asn Gln Ser Gln Gln Thr Thr Ala Gln Glu Glu Asn Lys Gly
35 40 45
Glu Glu Lys Ser Leu Lys Thr Lys Ser Thr Pro Val Thr Ser Glu Glu
50 55 60
Pro His Thr Asn Ile Gln Asp Lys Leu Ser Lys Lys Asn Ser Ser Gly
65 70 75 80
Asp Leu Thr Thr Asn Pro Asp Pro Gln Asn Ala Ala Glu Pro Thr Gly
85 90 95
Thr Val Pro Glu Gln Lys Glu Met Asp Pro Gly Lys Glu Gly Pro Asn
100 105 110
Ser Pro Gln Asn Lys Pro Pro Ala Ala Pro Val Ile Asn Glu Tyr Ala
115 120 125
Asp Ala Gln Leu His Asn Leu Val Lys Arg Met Arg Gln Arg Thr Ala
130 135 140
Leu Tyr Lys Lys Lys Leu Val Glu Gly Asp Leu Ser Ser Pro Glu Ala
145 150 155 160
Ser Pro Gln Thr Ala Lys Pro Thr Ala Val Pro Pro Val Lys Glu Ser
165 170 175
Asp Asp Lys Pro Thr Glu His Tyr Tyr Arg Leu Leu Trp Phe Lys Val
180 185 190
Lys Lys Met Pro Leu Thr Glu Tyr Leu Lys Arg Ile Lys Leu Pro Asn
195 200 205
Ser Ile Asp Ser Tyr Thr Asp Arg Leu Tyr Leu Leu Trp Leu Leu Leu
210 215 220
Val Thr Leu Ala Tyr Asn Trp Asn Cys Cys Phe Ile Pro Leu Arg Leu
225 230 235 240
Val Phe Pro Tyr Gln Thr Ala Asp Asn Ile His Tyr Trp Leu Ile Ala
245 250 255
Asp Ile Ile Cys Asp Ile Ile Tyr Leu Tyr Asp Met Leu Phe Ile Gln
260 265 270
Pro Arg Leu Gln Phe Val Arg Gly Gly Asp Ile Ile Val Asp Ser Asn
275 280 285
Glu Leu Arg Lys His Tyr Arg Thr Ser Thr Lys Phe Gln Leu Asp Val
290 295 300
Ala Ser Ile Ile Pro Phe Asp Ile Cys Tyr Leu Phe Phe Gly Phe Asn
305 310 315 320
Pro Met Phe Arg Ala Asn Arg Met Leu Lys Tyr Thr Ser Phe Phe Glu
325 330 335
Phe Asn His His Leu Glu Ser Ile Met Asp Lys Ala Tyr Ile Tyr Arg
340 345 350
Val Ile Arg Thr Thr Gly Tyr Leu Leu Phe Ile Leu His Ile Asn Ala
355 360 365
Cys Val Tyr Tyr Trp Ala Ser Asn Tyr Glu Gly Ile Gly Thr Thr Arg
370 375 380
Trp Val Tyr Asp Gly Glu Gly Asn Glu Tyr Leu Arg Cys Tyr Tyr Trp
385 390 395 400
Ala Val Arg Thr Leu Ile Thr Ile Gly Gly Leu Pro Glu Pro Gln Thr
405 410 415
Leu Phe Glu Ile Val Phe Gln Leu Leu Asn Phe Phe Ser Gly Val Phe
420 425 430
Val Phe Ser Ser Leu Ile Gly Gln Met Arg Asp Val Ile Gly Ala Ala
435 440 445
Thr Ala Asn Gln Asn Tyr Phe Arg Ala Cys Met Asp Asp Thr Ile Ala
450 455 460
Tyr Met Asn Asn Tyr Ser Ile Pro Lys Leu Val Gln Lys Arg Val Arg
465 470 475 480
Thr Trp Tyr Glu Tyr Thr Trp Asp Ser Gln Arg Met Leu Asp Glu Ser
485 490 495
Asp Leu Leu Lys Thr Leu Pro Thr Thr Val Gln Leu Ala Leu Ala Ile
500 505 510
Asp Val Asn Phe Ser Ile Ile Ser Lys Val Asp Leu Phe Lys Gly Cys
515 520 525
Asp Thr Gln Met Ile Tyr Asp Met Leu Leu Arg Leu Lys Ser Val Leu
530 535 540
Tyr Leu Pro Gly Asp Phe Val Cys Lys Lys Gly Glu Ile Gly Lys Glu
545 550 555 560
Met Tyr Ile Ile Lys His Gly Glu Val Gln Val Leu Gly Gly Pro Asp
565 570 575
Gly Thr Lys Val Leu Val Thr Leu Lys Ala Gly Ser Val Phe Gly Glu
580 585 590
Ile Ser Leu Leu Ala Ala Gly Gly Gly Asn Arg Arg Thr Ala Asn Val
595 600 605
Val Ala His Gly Phe Ala Asn Leu Leu Thr Leu Asp Lys Lys Thr Leu
610 615 620
Gln Glu Ile Leu Val His Tyr Pro Asp Ser Glu Arg Ile Leu Met Lys
625 630 635 640
Lys Ala Arg Val Leu Leu Lys Gln Lys Ala Lys Thr Ala Glu Ala Thr
645 650 655
Pro Pro Arg Lys Asp Leu Ala Leu Leu Phe Pro Pro Lys Glu Glu Thr
660 665 670
Pro Lys Leu Phe Lys Thr Leu Leu Gly Gly Thr Gly Lys Ala Ser Leu
675 680 685
Ala Arg Leu Leu Lys Leu Lys Arg Glu Gln Ala Ala Gln Lys Lys Glu
690 695 700
Asn Ser Glu Gly Gly Glu Glu Glu Gly Lys Glu Asn Glu Asp Lys Gln
705 710 715 720
Lys Glu Asn Glu Asp Lys Gln Lys Glu Asn Glu Asp Lys Gly Lys Glu
725 730 735
Asn Glu Asp Lys Asp Lys Gly Arg Glu Pro Glu Glu Lys Pro Leu Asp
740 745 750
Arg Pro Glu Cys Thr Ala Ser Pro Ile Ala Val Glu Glu Glu Pro His
755 760 765
Ser Val Arg Arg Thr Val Leu Pro Arg Gly Thr Ser Arg Gln Ser Leu
770 775 780
Ile Ile Ser Met Ala Pro Ser Ala Glu Gly Gly Glu Glu Val Leu Thr
785 790 795 800
Ile Glu Val Lys Glu Lys Ala Lys Gln
805
<210> 25
<211> 11714
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<220>
<221> misc_feature
<222> (1)..(130)
<223> 5' ITR
<220>
<221> misc_feature
<222> (241)..(544)
<223> CMV enhancer
<220>
<221> misc_feature
<222> (546)..(823)
<223> chicken beta-actin promoter
<220>
<221> misc_feature
<222> (824)..(1795)
<223> CBA exon 1 and intron
<220>
<221> misc_feature
<222> (1859)..(1864)
<223> kozak
<220>
<221> misc_feature
<222> (1865)..(3826)
<223> human codon optimized CHM (REP-1)
<220>
<221> misc_feature
<222> (3847)..(4054)
<223> bGH poly(A) signal
<220>
<221> misc_feature
<222> (4104)..(4233)
<223> 3' ITR
<400> 25
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gcaagctagc 180
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 240
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 300
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 360
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 420
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 480
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattaa 540
catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 600
cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 660
gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 720
aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 780
gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcggggagtc gctgcgacgc 840
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 900
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 960
cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1020
cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg 1080
gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg 1140
gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg 1200
tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga 1260
gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc tgcacccccc tccccgagtt 1320
gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc 1380
gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc 1440
ggggagggct cgggggaggg gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg 1500
gcgagccgca gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg 1560
tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc 1620
ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg 1680
ccgcgccgcc gtccccttct ccctctccag cctcggggct gtccgcgggg ggacggctgc 1740
cttcgggggg gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga 1800
caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacac tagcggccgc 1860
caccatggct gataccctgc cctctgaatt cgacgtgatt gtgattggaa ccggactccc 1920
tgaatcgatc atcgccgcgg cctgttcccg gtccggtcgg cgcgtgctgc acgtcgattc 1980
gagaagctac tacggaggga attgggcctc attctccttc tccggactgc tctcctggct 2040
gaaggagtat caggagaact ccgacattgt ctccgactca cctgtgtggc aggaccagat 2100
cctggaaaac gaggaagcaa tagccctgag ccggaaggac aagaccatcc agcacgtgga 2160
ggtgttctgt tatgcctccc aagacctcca tgaggacgtg gaagaggctg gagcgttgca 2220
gaagaatcat gccctcgtga cctccgctaa ctccaccgag gcagccgaca gcgccttcct 2280
gccgaccgag gatgaatccc tgtcaactat gtcgtgcgaa atgctgaccg aacagactcc 2340
gagctccgac cccgaaaacg ccctggaagt gaacggagcg gaagtgaccg gcgaaaagga 2400
gaaccattgc gacgacaaga cttgtgtccc atccacttcc gcggaggaca tgtccgagaa 2460
tgtgcctatc gccgaggaca ccaccgaaca gcccaagaag aacagaatca cgtacagcca 2520
gatcatcaag gaggggcgga ggtttaacat cgatctggtg tcgaagctgc tgtacagccg 2580
cggtctgctg atcgatctgc tcattaagtc gaacgtgtcg agatacgccg agttcaagaa 2640
catcacaagg attctcgcct tccgggaagg aagagtggaa caagtgccgt gctcccgggc 2700
cgacgtgttc aactcaaagc aacttaccat ggtggaaaag cgcatgctga tgaaattcct 2760
gaccttctgc atggagtacg aaaagtaccc tgatgagtac aagggttacg aagaaattac 2820
tttctacgag tacctcaaga cccagaagct gaccccgaat ctgcagtaca ttgtgatgca 2880
ctcaatcgca atgacctccg aaaccgcctc ctcgaccatc gacgggctca aggccaccaa 2940
gaacttcctg cactgtttgg ggcgctacgg caacactccg ttcctcttcc cgctgtacgg 3000
ccagggagag ctgcctcagt gtttctgccg gatgtgcgcc gtgttcggcg gaatctactg 3060
tctccgccac tcggtccagt gcctggtggt ggacaaggaa tccaggaagt gcaaagccat 3120
tattgaccag ttcggacaac ggatcatttc cgagcacttt cttgtggagg actcatactt 3180
cccggagaac atgtgctctc gggtccagta tcgacagatt tccagggcgg tgctcattac 3240
tgaccggagc gtcctcaaga ccgatagcga ccagcagatc tccatcctga ccgtgccggc 3300
ggaagaaccc ggcacttttg ccgtgcgcgt gatcgagctt tgctcatcca ccatgacttg 3360
catgaaaggc acttacctgg tgcacctgac gtgcacctca tcgaaaaccg ctagagagga 3420
cctggaatcc gtcgtccaaa agctgttcgt gccttacacc gagatggaaa ttgaaaacga 3480
acaagtggag aagccccgca tcctttgggc cctgtacttt aacatgcgcg attcctccga 3540
tatctcgcgg tcctgctata acgacttgcc ttcgaacgtc tacgtctgct ccgggccaga 3600
ctgcggtctt ggcaacgaca atgccgtgaa gcaggcggaa acactgttcc aagagatctg 3660
ccctaacgag gatttttgcc cgcccccccc aaaccccgag gatatcatct tggacggaga 3720
cagcctgcag ccagaagcat ccgagtccag cgccatcccg gaggccaaca gcgaaacctt 3780
caaggagagc actaacctgg gcaacctgga agagtccagc gaatgatcat aggatctctg 3840
cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 3900
tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 3960
attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 4020
aggattggga agacaatagc aggcatgctg gggactcgag ttctacgtag ataagtagca 4080
tggcgggtta atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct 4140
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 4200
ccgggcggcc tcagtgagcg agcgagcgcg cagccttata aggatatggt gcactctcag 4260
tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga 4320
cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 4380
cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg 4440
cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 4500
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 4560
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 4620
aaggaagagt atgagccata ttcaacggga aacgtcgagg ccgcgattaa attccaacat 4680
ggatgctgat ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac 4740
aatctatcgc ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg 4800
tagcgttgcc aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat 4860
gccacttccg accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac 4920
tgcgatcccc ggaaaaacag cgttccaggt attagaagaa tatcctgatt caggtgaaaa 4980
tattgttgat gcgctggcag tgttcctgcg ccggttgcac tcgattcctg tttgtaattg 5040
tccttttaac agcgatcgcg tatttcgcct cgctcaggcg caatcacgaa tgaataacgg 5100
tttggttgat gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg 5160
gaaagaaatg cataaacttt tgccattctc accggattca gtcgtcactc atggtgattt 5220
ctcacttgat aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg 5280
agtcggaatc gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt 5340
ttctccttca ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa 5400
taaattgcag tttcatttga tgctcgatga gtttttctaa actgtcagac caagtttact 5460
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 5520
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 5580
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 5640
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 5700
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 5760
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 5820
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 5880
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 5940
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 6000
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 6060
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 6120
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 6180
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 6240
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 6300
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 6360
cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 6420
cgattcatta atgcaggcgc ctgttgattt gagttttggg tttagcgtga caagtttgcg 6480
agggtgatcg gagtaatcag taaatagctc tccgcctaca atgacgtcat aaccatgatt 6540
tctggttttc tgacgtccgt tatcagttcc ctccgaccac gccagcatat cgaggaacgc 6600
cttacgttga ttattgattt ctaccatctt ctactccggc ttttttagca gcgaagcgtt 6660
tgataagcga accaatcgag tcagtaccga tgtagccgat aaacacgctc gttatataag 6720
cgagattgct acttagtccg gcgaagtcga gaaggtcacg aatgaaccag gcgataatgg 6780
cgcacatcgt tgcgtcgatt actgtttttg taaacgcacc gccattatat ctgccgcgaa 6840
ggtacgccat tgcaaacgca aggattgccc cgatgccttg ttcctttgcc gcgagaatgg 6900
cggccaacag gtcatgtttt tctggcatct tcatgtctta cccccaataa ggggatttgc 6960
tctatttaat taggaataag gtcgattact gatagaacaa atccaggcta ctgtgtttag 7020
taatcagatt tgttcgtgac cgatatgcac gggcaaaacg gcaggaggtt gttagcgcga 7080
cctcctgcca cccgctttca cgaaggtcat gtgtaaaagg ccgcagcgta actattacta 7140
atgaattcag gacagacagt ggctacggct cagtttgggt tgtgctgttg ctgggcggcg 7200
atgacgcctg tacgcatttg gtgatccggt tctgcttccg gtattcgctt aattcagcac 7260
aacggaaaga gcactggcta accaggctcg ccgactcttc acgattatcg actcaatgct 7320
cttacctgtt gtgcagatat aaaaaatccc gaaaccgtta tgcaggctct aactattacc 7380
tgcgaactgt ttcgggattg cattttgcag acctctctgc ctgcgatggt tggagttcca 7440
gacgatacgt cgaagtgacc aactaggcgg aatcggtagt aagcgccgcc tcttttcatc 7500
tcactaccac aacgagcgaa ttaacccatc gttgagtcaa atttacccaa ttttattcaa 7560
taagtcaata tcatgccgtt aatatgttgc catccgtggc aatcatgctg ctaacgtgtg 7620
accgcattca aaatgttgtc tgcgattgac tcttctttgt ggcattgcac caccagagcg 7680
tcatacagcg gcttaacagt gcgtgaccag gtgggttggg taaggtttgg gattagcatc 7740
gtcacagcgc gatatgctgc gcttgctggc atccttgaat agccgacgcc tttgcatctt 7800
ccgcactctt tctcgacaac tctcccccac agctctgttt tggcaatatc aaccgcacgg 7860
cctgtaccat ggcaatctct gcatcttgcc cccggcgtcg cggcactacg gcaataatcc 7920
gcataagcga atgttgcgag cacttgcagt acctttgcct tagtatttcc ttcaagcttt 7980
gccacaccac ggtatttccc cgataccttg tgtgcaaatt gcatcagata gttgatagcc 8040
ttttgtttgt cgttctggct gagttcgtgc ttaccgcaga atgcagccat accgaatccg 8100
gcttgtgatt gcgccatccc catagcagcc atcacatcag taccggaaag agagtcagaa 8160
gccgtggccc gtggtgagtc gctcatcatc gggctttttg gcgaatgaaa tttagctacg 8220
ctttcgagtc tcatgcgcct tctccctgta cctgaatcaa tgttaggttt ccgcagaaca 8280
ctgcgccggt atcgatatac atttggttgg caaacttgag tggtttcact gctggcgtat 8340
gaccaaagat gaacgtgtcc gcgcctttga tttctttcac gatcccgttt tgtgagttgc 8400
tgattcgttc gcggttccag attacctgct gatgatcaac tggctttcca aactcgtatt 8460
cgtcaaaggg ataatcggcg tggcagataa catatttttt atctttgctc accagttcga 8520
tgattaacgg aagttcatct gctttatggg caagagcttt agccagaatt tctttgtcgt 8580
aatcgagatt aaagaaccag ccaccgccat taagcagcca gtgattaacg tttccacgct 8640
ctgataagcc atcaatcatc atttgctcat ggtttccacg tacagctctg aaccagggga 8700
atgtgattaa ttccaggcat tcaacgttct ctgcaccacg atcaaccaaa tcgcccaccg 8760
agataagcag gtcttttttg ttgtcgaatc caatcgtatc cagtttgttc atcaggttcg 8820
tgtagcatcc gtgcagatcg ccaactaccc aaatatttcg gtatttgctg ccatcaattt 8880
tttcgtaata gcgcatctct ttcactccat ccgcgatgaa ccatgagaac gtcgttgacg 8940
atggcgtgca ttttcccgtc tttatcatca acgtattttc tgaccgtacc gcgactacat 9000
ttcagtctgc gtgctacttc tgtctgattt ccgtatgctt caacgagcat gtctggaatg 9060
gtttttactg agaacgtcat gcggcctcac ttctgctatt tcgcaggtct ttgagtttct 9120
gttggtactc tgccttgatc gccttgcact cttcgatagt ccagcgatgg cggttatggt 9180
ttgattcgat ttcgtctact gcttcctgcc cgatgcggct aatcagttcg acgcgatacg 9240
gaacgagatt tccgcttttg tgctggttgc acaccacgca ttgcttgtga atattgcgtt 9300
cattaaatcg gagttgaggt gccgcagcag ttgtccggta atgtccggca tcccactgag 9360
cagacgtgag cgttccgcac gagatacatg gtaagtcgcg gtctctttct ctgatgaagg 9420
cgtttacggc ttgttgggct tgtttaatcc agtaactgcg gggctttaag gcgagttttc 9480
gaatcttaag tttatctttc tgtttctgct cctctcgtcg tcgtttcttc tctgctgctt 9540
tttccgcttt ttcgcgttct ttacttcgtc gttcgagtgc tatcttggtt ccacactctg 9600
gagagcacca ccactgatta gcgaatgcag ggtgaaacca ttcccggcat tcatcgtttt 9660
tacatcgtct tcgcgctggt ttagccatca tcttcttcct cgtgcatcga gctattcgga 9720
tcgctcatca gttctgcgca gcagtgctca cacacgtgaa cttccagcac atgcagcttc 9780
tgaccgcagt tagcgcacgt taaagctcgc tcgacgcttt cttgttcgta acttcgattt 9840
tggtcaatca ccttgttttc ctcgcacgac gtcttagcca ccggatatcc cacaggtgag 9900
ccgtgtagtt gaaggttttt acgtcagatt cttttgggat tggcttgggt ttatttctgg 9960
tgcgtttcgt tggaaggtat ttgcagtttt cgcagattat gtcggtgata cttcgtcgct 10020
gtctcgccac acgtcctcct tttcctgcgg tagtggtaac acccctgttg gtgttctttc 10080
acaccggaga caccatcgat tccagtaagg ttgatttggt cggaagcggt tatcttcttt 10140
gcattcaccg caccgataac atcgcatcat gcagcttccc tcccgaagtc gaaatcaagc 10200
tgccctccaa atatttcgca tgactcagaa caagagccgg tatcgaatct tttagctcgt 10260
accatgtcct gatacagggc ttgataatca ttttctgaat acattttcgc gataccgtcc 10320
agcgacattc ttcctcggta cataatctcc tttggcgttt cccgatgtcc gtcacgcaca 10380
tgggatcccg tgatgacctc attaaaaaca cgctgcaatc cctcctcatc tttgcaggca 10440
agtccgattt tttgcgttga ttttttaatg cagaatatgc agttaccgag atgttccggt 10500
atttgcaaat cgaatggttg ttgcttccac catgcgagga tatcttcctt ctcaaagtct 10560
gacagttcag caagatatct gattccaggc tttggcttta gccgcttcgg ttcatcagct 10620
ctgatgccaa tccacgtggt gtaattccct cgcccgaaat ggtcatcaca gtatttggtg 10680
aagggaacga gttttaatct gtcagtgcag aacgcgccgc cgacgtatgg agtgccatat 10740
ttctttacca tatcgataaa tggcttcaga acaggcattc gcgtctgaat atcctttggt 10800
tcccataccg tataaccatt tggctgtcca agctccgggt tgatatcaac ctgcaatacg 10860
gtgagcggta tatcccagaa cttcacaact tccctgacaa accgatatgt cattggatgt 10920
tcacaacctg tatccatgaa aacgtaatgc acgtctttac ctgcccgtcg cttttgctcc 10980
attagccaga gcaaatatgc tgacgtcctg ccaccggaga aactaacgac atttatcatg 11040
cagccctgtc tccccatctc gctttccact ccagagccag tctcgcttcg tctgaccact 11100
taacgccacg ctctgtaccg aatgcctgta taagctctaa tagctccgca aattcgccta 11160
cacgcatcct gctggttgac tggcctatta ccacaaagcc attcccggca aggttaggaa 11220
caacatcctg ctgctttaat gctgcggtaa acacacactt ccagctttct gcatccagcc 11280
agcgaccatg ccattcaacc tgacgagaga cgtcacctaa gcaggcccat agcttcctgt 11340
tttggtctaa gctgcggttg cgttcctgaa tggttactac gattggtttg gttgggtctg 11400
gaaggatttg ctgtactgcg tgaatagcgt tttgctgatg tgctggagat cgaatttcaa 11460
aggttagttt tttcatgact tccctctccc ccaaataaaa aggctggcac gacaggtttc 11520
ccgactggaa agcgggcagt gagcgcaacg caattaatgt gagttagctc actcattagg 11580
caccccaggc tttacacttt atgcttccgg ctcgtatgtt gtgtggaatt gtgagcggat 11640
aacaatttca cacaggaaac agctatgacc atgattacgc caagctgtcg actctagagg 11700
atcccctaat aagg 11714
<210> 26
<211> 6647
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<220>
<221> misc_feature
<222> (1)..(130)
<223> 5' ITR
<220>
<221> misc_feature
<222> (241)..(544)
<223> CMV enhancer
<220>
<221> misc_feature
<222> (546)..(823)
<223> chicken beta-actin promoter
<220>
<221> misc_feature
<222> (824)..(1795)
<223> CBA exon 1 and intron
<220>
<221> misc_feature
<222> (1859)..(1864)
<223> Kozak
<220>
<221> misc_feature
<222> (1865)..(3826)
<223> human codon optimized CHM (REM-1)
<220>
<221> misc_feature
<222> (3847)..(4054)
<223> bGH poly(A) signal
<220>
<221> misc_feature
<222> (4104)..(4233)
<223> 3' ITR
<400> 26
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gcaagctagc 180
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 240
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 300
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 360
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 420
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 480
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattaa 540
catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 600
cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 660
gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 720
aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 780
gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcggggagtc gctgcgacgc 840
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 900
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 960
cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1020
cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg 1080
gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg 1140
gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg 1200
tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga 1260
gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc tgcacccccc tccccgagtt 1320
gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc 1380
gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc 1440
ggggagggct cgggggaggg gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg 1500
gcgagccgca gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg 1560
tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc 1620
ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg 1680
ccgcgccgcc gtccccttct ccctctccag cctcggggct gtccgcgggg ggacggctgc 1740
cttcgggggg gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga 1800
caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacac tagcggccgc 1860
caccatggct gataccctgc cctctgaatt cgacgtgatt gtgattggaa ccggactccc 1920
tgaatcgatc atcgccgcgg cctgttcccg gtccggtcgg cgcgtgctgc acgtcgattc 1980
gagaagctac tacggaggga attgggcctc attctccttc tccggactgc tctcctggct 2040
gaaggagtat caggagaact ccgacattgt ctccgactca cctgtgtggc aggaccagat 2100
cctggaaaac gaggaagcaa tagccctgag ccggaaggac aagaccatcc agcacgtgga 2160
ggtgttctgt tatgcctccc aagacctcca tgaggacgtg gaagaggctg gagcgttgca 2220
gaagaatcat gccctcgtga cctccgctaa ctccaccgag gcagccgaca gcgccttcct 2280
gccgaccgag gatgaatccc tgtcaactat gtcgtgcgaa atgctgaccg aacagactcc 2340
gagctccgac cccgaaaacg ccctggaagt gaacggagcg gaagtgaccg gcgaaaagga 2400
gaaccattgc gacgacaaga cttgtgtccc atccacttcc gcggaggaca tgtccgagaa 2460
tgtgcctatc gccgaggaca ccaccgaaca gcccaagaag aacagaatca cgtacagcca 2520
gatcatcaag gaggggcgga ggtttaacat cgatctggtg tcgaagctgc tgtacagccg 2580
cggtctgctg atcgatctgc tcattaagtc gaacgtgtcg agatacgccg agttcaagaa 2640
catcacaagg attctcgcct tccgggaagg aagagtggaa caagtgccgt gctcccgggc 2700
cgacgtgttc aactcaaagc aacttaccat ggtggaaaag cgcatgctga tgaaattcct 2760
gaccttctgc atggagtacg aaaagtaccc tgatgagtac aagggttacg aagaaattac 2820
tttctacgag tacctcaaga cccagaagct gaccccgaat ctgcagtaca ttgtgatgca 2880
ctcaatcgca atgacctccg aaaccgcctc ctcgaccatc gacgggctca aggccaccaa 2940
gaacttcctg cactgtttgg ggcgctacgg caacactccg ttcctcttcc cgctgtacgg 3000
ccagggagag ctgcctcagt gtttctgccg gatgtgcgcc gtgttcggcg gaatctactg 3060
tctccgccac tcggtccagt gcctggtggt ggacaaggaa tccaggaagt gcaaagccat 3120
tattgaccag ttcggacaac ggatcatttc cgagcacttt cttgtggagg actcatactt 3180
cccggagaac atgtgctctc gggtccagta tcgacagatt tccagggcgg tgctcattac 3240
tgaccggagc gtcctcaaga ccgatagcga ccagcagatc tccatcctga ccgtgccggc 3300
ggaagaaccc ggcacttttg ccgtgcgcgt gatcgagctt tgctcatcca ccatgacttg 3360
catgaaaggc acttacctgg tgcacctgac gtgcacctca tcgaaaaccg ctagagagga 3420
cctggaatcc gtcgtccaaa agctgttcgt gccttacacc gagatggaaa ttgaaaacga 3480
acaagtggag aagccccgca tcctttgggc cctgtacttt aacatgcgcg attcctccga 3540
tatctcgcgg tcctgctata acgacttgcc ttcgaacgtc tacgtctgct ccgggccaga 3600
ctgcggtctt ggcaacgaca atgccgtgaa gcaggcggaa acactgttcc aagagatctg 3660
ccctaacgag gatttttgcc cgcccccccc aaaccccgag gatatcatct tggacggaga 3720
cagcctgcag ccagaagcat ccgagtccag cgccatcccg gaggccaaca gcgaaacctt 3780
caaggagagc actaacctgg gcaacctgga agagtccagc gaatgatcat aggatctctg 3840
cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 3900
tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 3960
attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 4020
aggattggga agacaatagc aggcatgctg gggactcgag ttctacgtag ataagtagca 4080
tggcgggtta atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct 4140
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 4200
ccgggcggcc tcagtgagcg agcgagcgcg cagccttata aggatatggt gcactctcag 4260
tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga 4320
cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 4380
cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg 4440
cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 4500
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 4560
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 4620
aaggaagagt atgagccata ttcaacggga aacgtcgagg ccgcgattaa attccaacat 4680
ggatgctgat ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac 4740
aatctatcgc ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg 4800
tagcgttgcc aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat 4860
gccacttccg accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac 4920
tgcgatcccc ggaaaaacag cgttccaggt attagaagaa tatcctgatt caggtgaaaa 4980
tattgttgat gcgctggcag tgttcctgcg ccggttgcac tcgattcctg tttgtaattg 5040
tccttttaac agcgatcgcg tatttcgcct cgctcaggcg caatcacgaa tgaataacgg 5100
tttggttgat gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg 5160
gaaagaaatg cataaacttt tgccattctc accggattca gtcgtcactc atggtgattt 5220
ctcacttgat aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg 5280
agtcggaatc gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt 5340
ttctccttca ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa 5400
taaattgcag tttcatttga tgctcgatga gtttttctaa actgtcagac caagtttact 5460
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 5520
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 5580
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 5640
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 5700
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 5760
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 5820
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 5880
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 5940
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 6000
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 6060
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 6120
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 6180
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 6240
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 6300
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 6360
cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 6420
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 6480
acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 6540
cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 6600
accatgatta cgccaagctg tcgactctag aggatcccct aataagg 6647
<210> 27
<211> 11971
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<220>
<221> misc_feature
<222> (1)..(130)
<223> 5' ITR
<220>
<221> misc_feature
<222> (241)..(544)
<223> CMV Enhancer
<220>
<221> misc_feature
<222> (546)..(823)
<223> chicken beta-actin promoter
<220>
<221> misc_feature
<222> (824)..(1795)
<223> CBA exon 1 and intron
<220>
<221> misc_feature
<222> (1859)..(1864)
<223> kozak
<220>
<221> misc_feature
<222> (1865)..(3826)
<223> human codon optimized CHM (REP-1)
<220>
<221> misc_feature
<222> (3847)..(4054)
<223> bGH poly(A) signal
<220>
<221> misc_feature
<222> (4104)..(4233)
<223> 3' ITR
<400> 27
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gcaagctagc 180
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 240
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 300
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 360
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 420
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 480
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattaa 540
catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 600
cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 660
gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 720
aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 780
gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcggggagtc gctgcgacgc 840
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 900
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 960
cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1020
cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg 1080
gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg 1140
gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg 1200
tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga 1260
gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc tgcacccccc tccccgagtt 1320
gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc 1380
gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc 1440
ggggagggct cgggggaggg gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg 1500
gcgagccgca gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg 1560
tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc 1620
ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg 1680
ccgcgccgcc gtccccttct ccctctccag cctcggggct gtccgcgggg ggacggctgc 1740
cttcgggggg gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga 1800
caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacac tagcggccgc 1860
caccatggct gataccctgc cctctgaatt cgacgtgatt gtgattggaa ccggactccc 1920
tgaatcgatc atcgccgcgg cctgttcccg gtccggtcgg cgcgtgctgc acgtcgattc 1980
gagaagctac tacggaggga attgggcctc attctccttc tccggactgc tctcctggct 2040
gaaggagtat caggagaact ccgacattgt ctccgactca cctgtgtggc aggaccagat 2100
cctggaaaac gaggaagcaa tagccctgag ccggaaggac aagaccatcc agcacgtgga 2160
ggtgttctgt tatgcctccc aagacctcca tgaggacgtg gaagaggctg gagcgttgca 2220
gaagaatcat gccctcgtga cctccgctaa ctccaccgag gcagccgaca gcgccttcct 2280
gccgaccgag gatgaatccc tgtcaactat gtcgtgcgaa atgctgaccg aacagactcc 2340
gagctccgac cccgaaaacg ccctggaagt gaacggagcg gaagtgaccg gcgaaaagga 2400
gaaccattgc gacgacaaga cttgtgtccc atccacttcc gcggaggaca tgtccgagaa 2460
tgtgcctatc gccgaggaca ccaccgaaca gcccaagaag aacagaatca cgtacagcca 2520
gatcatcaag gaggggcgga ggtttaacat cgatctggtg tcgaagctgc tgtacagccg 2580
cggtctgctg atcgatctgc tcattaagtc gaacgtgtcg agatacgccg agttcaagaa 2640
catcacaagg attctcgcct tccgggaagg aagagtggaa caagtgccgt gctcccgggc 2700
cgacgtgttc aactcaaagc aacttaccat ggtggaaaag cgcatgctga tgaaattcct 2760
gaccttctgc atggagtacg aaaagtaccc tgatgagtac aagggttacg aagaaattac 2820
tttctacgag tacctcaaga cccagaagct gaccccgaat ctgcagtaca ttgtgatgca 2880
ctcaatcgca atgacctccg aaaccgcctc ctcgaccatc gacgggctca aggccaccaa 2940
gaacttcctg cactgtttgg ggcgctacgg caacactccg ttcctcttcc cgctgtacgg 3000
ccagggagag ctgcctcagt gtttctgccg gatgtgcgcc gtgttcggcg gaatctactg 3060
tctccgccac tcggtccagt gcctggtggt ggacaaggaa tccaggaagt gcaaagccat 3120
tattgaccag ttcggacaac ggatcatttc cgagcacttt cttgtggagg actcatactt 3180
cccggagaac atgtgctctc gggtccagta tcgacagatt tccagggcgg tgctcattac 3240
tgaccggagc gtcctcaaga ccgatagcga ccagcagatc tccatcctga ccgtgccggc 3300
ggaagaaccc ggcacttttg ccgtgcgcgt gatcgagctt tgctcatcca ccatgacttg 3360
catgaaaggc acttacctgg tgcacctgac gtgcacctca tcgaaaaccg ctagagagga 3420
cctggaatcc gtcgtccaaa agctgttcgt gccttacacc gagatggaaa ttgaaaacga 3480
acaagtggag aagccccgca tcctttgggc cctgtacttt aacatgcgcg attcctccga 3540
tatctcgcgg tcctgctata acgacttgcc ttcgaacgtc tacgtctgct ccgggccaga 3600
ctgcggtctt ggcaacgaca atgccgtgaa gcaggcggaa acactgttcc aagagatctg 3660
ccctaacgag gatttttgcc cgcccccccc aaaccccgag gatatcatct tggacggaga 3720
cagcctgcag ccagaagcat ccgagtccag cgccatcccg gaggccaaca gcgaaacctt 3780
caaggagagc actaacctgg gcaacctgga agagtccagc gaatgatcat aggatctctg 3840
cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 3900
tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 3960
attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 4020
aggattggga agacaatagc aggcatgctg gggactcgag ttctacgtag ataagtagca 4080
tggcgggtta atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct 4140
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 4200
ccgggcggcc tcagtgagcg agcgagcgcg cagccttaat taacctaata aggaaaatga 4260
agggaagttc ctatactttc tagagaatag gaacttctat agggagtcga ataagggcga 4320
cacaaaaggt attctaaatg cataataaat actgataaca tcttatagtt tgtattatat 4380
tttgtattat cgttgacatg tataattttg atatcaaaaa ctgattttcc ctttattatt 4440
ttcgagattt attttcttaa ttctctttaa caaactagaa atattgtata tacaaaaaat 4500
cataaataat agatgaatag tttaattata ggtgttcatc aatcgaaaaa gcaacgtatc 4560
ttatttaaag tgcgttgctt ttttctcatt tataaggtta aataattctc atatatcaag 4620
caaagtgaca ggcgccctta aatattctga caaatgctct ttccctaaac tccccccata 4680
aaaaaacccg ccgaagcggg tttttacgtt atttgcggat taacgattac tcgttatcag 4740
aaccgcccag gatgcctggc agttccctac tctcgccgct gcgctcggtc gttcggctgc 4800
gggacctcag cgctagcgga gtgtatactg gcttactatg ttggcactga tgagggtgtc 4860
agtgaagtgc ttcatgtggc aggagaaaaa aggctgcacc ggtgcgtcag cagaatatgt 4920
gatacaggat atattccgct tcctcgctca ctgactcgct acgctcggtc gttcgactgc 4980
ggcgagcgga aatggcttac gaacggggcg gagatttcct ggaagatgcc aggaagatac 5040
ttaacaggga agtgagaggg ccgcggcaaa gccgtttttc cataggctcc gcccccctga 5100
caagcatcac gaaatctgac gctcaaatca gtggtggcga aacccgacag gactataaag 5160
ataccaggcg tttccccctg gcggctccct cgtgcgctct cctgttcctg cctttcggtt 5220
taccggtgtc attccgctgt tatggccgcg tttgtctcat tccacgcctg acactcagtt 5280
ccgggtaggc agttcgctcc aagctggact gtatgcacga accccccgtt cagtccgacc 5340
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggaaagacat gcaaaagcac 5400
cactggcagc agccactggt aattgattta gaggagttag tcttgaagtc atgcgccggt 5460
taaggctaaa ctgaaaggac aagttttggt gactgcgctc ctccaagcca gttacctcgg 5520
ttcaaagagt tggtagctca gagaaccttc gaaaaaccgc cctgcaaggc ggttttttcg 5580
ttttcagagc aagagattac gcgcagacca aaacgatctc aagaagatca tcttattaag 5640
ctccttttta tttgggggag agggaagtca tgaaaaaact aacctttgaa attcgatctc 5700
cagcacatca gcaaaacgct attcacgcag tacagcaaat ccttccagac ccaaccaaac 5760
caatcgtagt aaccattcag gaacgcaacc gcagcttaga ccaaaacagg aagctatggg 5820
cctgcttagg tgacgtctct cgtcaggttg aatggcatgg tcgctggctg gatgcagaaa 5880
gctggaagtg tgtgtttacc gcagcattaa agcagcagga tgttgttcct aaccttgccg 5940
ggaatggctt tgtggtaata ggccagtcaa ccagcaggat gcgtgtaggc gaatttgcgg 6000
agctattaga gcttatacag gcattcggta cagagcgtgg cgttaagtgg tcagacgaag 6060
cgagactggc tctggagtgg aaagcgagat ggggagacag ggctgcatga taaatgtcgt 6120
tagtttctcc ggtggcagga cgtcagcata tttgctctgg ctaatggagc aaaagcgacg 6180
ggcaggtaaa gacgtgcatt acgttttcat ggatacaggt tgtgaacatc caatgacata 6240
tcggtttgtc agggaagttg tgaagttctg ggatataccg ctcaccgtat tgcaggttga 6300
tatcaacccg gagcttggac agccaaatgg ttatacggta tgggaaccaa aggatattca 6360
gacgcgaatg cctgttctga agccatttat cgatatggta aagaaatatg gcactccata 6420
cgtcggcggc gcgttctgca ctgacagatt aaaactcgtt cccttcacca aatactgtga 6480
tgaccatttc gggcgaggga attacaccac gtggattggc atcagagctg atgaaccgaa 6540
gcggctaaag ccaaagcctg gaatcagata tcttgctgaa ctgtcagact ttgagaagga 6600
agatatcctc gcatggtgga agcaacaacc attcgatttg caaataccgg aacatctcgg 6660
taactgcata ttctgcatta aaaaatcaac gcaaaaaatc ggacttgcct gcaaagatga 6720
ggagggattg cagcgtgttt ttaatgaggt catcacggga tcccatgtgc gtgacggaca 6780
tcgggaaacg ccaaaggaga ttatgtaccg aggaagaatg tcgctggacg gtatcgcgaa 6840
aatgtattca gaaaatgatt atcaagccct gtatcaggac atggtacgag ctaaaagatt 6900
cgataccggc tcttgttctg agtcatgcga aatatttgga gggcagcttg atttcgactt 6960
cgggagggaa gctgcatgat gcgatgttat cggtgcggtg aatgcaaaga agataaccgc 7020
ttccgaccaa atcaacctta ctggaatcga tggtgtctcc ggtgtgaaag aacaccaaca 7080
ggggtgttac cactaccgca ggaaaaggag gacgtgtggc gagacagcga cgaagtatca 7140
ccgacataat ctgcgaaaac tgcaaatacc ttccaacgaa acgcaccaga aataaaccca 7200
agccaatccc aaaagaatct gacgtaaaaa ccttcaacta cacggctcac ctgtgggata 7260
tccggtggct aagacgtcgt gcgaggaaaa caaggtgatt gaccaaaatc gaagttacga 7320
acaagaaagc gtcgagcgag ctttaacgtg cgctaactgc ggtcagaagc tgcatgtgct 7380
ggaagttcac gtgtgtgagc actgctgcgc agaactgatg agcgatccga atagctcgat 7440
gcacgaggaa gaagatgatg gctaaaccag cgcgaagacg atgtaaaaac gatgaatgcc 7500
gggaatggtt tcaccctgca ttcgctaatc agtggtggtg ctctccagag tgtggaacca 7560
agatagcact cgaacgacga agtaaagaac gcgaaaaagc ggaaaaagca gcagagaaga 7620
aacgacgacg agaggagcag aaacagaaag ataaacttaa gattcgaaaa ctcgccttaa 7680
agccccgcag ttactggatt aaacaagccc aacaagccgt aaacgccttc atcagagaaa 7740
gagaccgcga cttaccatgt atctcgtgcg gaacgctcac gtctgctcag tgggatgccg 7800
gacattaccg gacaactgct gcggcacctc aactccgatt taatgaacgc aatattcaca 7860
agcaatgcgt ggtgtgcaac cagcacaaaa gcggaaatct cgttccgtat cgcgtcgaac 7920
tgattagccg catcgggcag gaagcagtag acgaaatcga atcaaaccat aaccgccatc 7980
gctggactat cgaagagtgc aaggcgatca aggcagagta ccaacagaaa ctcaaagacc 8040
tgcgaaatag cagaagtgag gccgcatgac gttctcagta aaaaccattc cagacatgct 8100
cgttgaagca tacggaaatc agacagaagt agcacgcaga ctgaaatgta gtcgcggtac 8160
ggtcagaaaa tacgttgatg ataaagacgg gaaaatgcac gccatcgtca acgacgttct 8220
catggttcat cgcggatgga gtgaaagaga tgcgctatta cgaaaaaatt gatggcagca 8280
aataccgaaa tatttgggta gttggcgatc tgcacggatg ctacacgaac ctgatgaaca 8340
aactggatac gattggattc gacaacaaaa aagacctgct tatctcggtg ggcgatttgg 8400
ttgatcgtgg tgcagagaac gttgaatgcc tggaattaat cacattcccc tggttcagag 8460
ctgtacgtgg aaaccatgag caaatgatga ttgatggctt atcagagcgt ggaaacgtta 8520
atcactggct gcttaatggc ggtggctggt tctttaatct cgattacgac aaagaaattc 8580
tggctaaagc tcttgcccat aaagcagatg aacttccgtt aatcatcgaa ctggtgagca 8640
aagataaaaa atatgttatc tgccacgccg attatccctt tgacgaatac gagtttggaa 8700
agccagttga tcatcagcag gtaatctgga accgcgaacg aatcagcaac tcacaaaacg 8760
ggatcgtgaa agaaatcaaa ggcgcggaca cgttcatctt tggtcatacg ccagcagtga 8820
aaccactcaa gtttgccaac caaatgtata tcgataccgg cgcagtgttc tgcggaaacc 8880
taacattgat tcaggtacag ggagaaggcg catgagactc gaaagcgtag ctaaatttca 8940
ttcgccaaaa agcccgatga tgagcgactc accacgggcc acggcttctg actctctttc 9000
cggtactgat gtgatggctg ctatggggat ggcgcaatca caagccggat tcggtatggc 9060
tgcattctgc ggtaagcacg aactcagcca gaacgacaaa caaaaggcta tcaactatct 9120
gatgcaattt gcacacaagg tatcggggaa ataccgtggt gtggcaaagc ttgaaggaaa 9180
tactaaggca aaggtactgc aagtgctcgc aacattcgct tatgcggatt attgccgtag 9240
tgccgcgacg ccgggggcaa gatgcagaga ttgccatggt acaggccgtg cggttgatat 9300
tgccaaaaca gagctgtggg ggagagttgt cgagaaagag tgcggaagat gcaaaggcgt 9360
cggctattca aggatgccag caagcgcagc atatcgcgct gtgacgatgc taatcccaaa 9420
ccttacccaa cccacctggt cacgcactgt taagccgctg tatgacgctc tggtggtgca 9480
atgccacaaa gaagagtcaa tcgcagacaa cattttgaat gcggtcacac gttagcagca 9540
tgattgccac ggatggcaac atattaacgg catgatattg acttattgaa taaaattggg 9600
taaatttgac tcaacgatgg gttaattcgc tcgttgtggt agtgagatga aaagaggcgg 9660
cgcttactac cgattccgcc tagttggtca cttcgacgta tcgtctggaa ctccaaccat 9720
cgcaggcaga gaggtctgca aaatgcaatc ccgaaacagt tcgcaggtaa tagttagagc 9780
ctgcataacg gtttcgggat tttttatatc tgcacaacag gtaagagcat tgagtcgata 9840
atcgtgaaga gtcggcgagc ctggttagcc agtgctcttt ccgttgtgct gaattaagcg 9900
aataccggaa gcagaaccgg atcaccaaat gcgtacaggc gtcatcgccg cccagcaaca 9960
gcacaaccca aactgagccg tagccactgt ctgtcctgaa ttcattagta atagttacgc 10020
tgcggccttt tacacatgac cttcgtgaaa gcgggtggca ggaggtcgcg ctaacaacct 10080
cctgccgttt tgcccgtgca tatcggtcac gaacaaatct gattactaaa cacagtagcc 10140
tggatttgtt ctatcagtaa tcgaccttat tcctaattaa atagagcaaa tccccttatt 10200
gggggtaaga catgaagatg ccagaaaaac atgacctgtt ggccgccatt ctcgcggcaa 10260
aggaacaagg catcggggca atccttgcgt ttgcaatggc gtaccttcgc ggcagatata 10320
atggcggtgc gtttacaaaa acagtaatcg acgcaacgat gtgcgccatt atcgcctggt 10380
tcattcgtga ccttctcgac ttcgccggac taagtagcaa tctcgcttat ataacgagcg 10440
tgtttatcgg ctacatcggt actgactcga ttggttcgct tatcaaacgc ttcgctgcta 10500
aaaaagccgg agtagaagat ggtagaaatc aataatcaac gtaaggcgtt cctcgatatg 10560
ctggcgtggt cggagggaac tgataacgga cgtcagaaaa ccagaaatca tggttatgac 10620
gtcattgtag gcggagagct atttactgat tactccgatc accctcgcaa acttgtcacg 10680
ctaaacccaa aactcaaatc aacaggcgca gcttttagaa aaactcatcg agcatcaaat 10740
gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa agccgtttct 10800
gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc tggtatcggt 10860
ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg tcaaaaataa 10920
ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat ggcaaaagtt 10980
tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca tcaaaatcac 11040
tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgaggcga aatacgcgat 11100
cgctgttaaa aggacaatta caaacaggaa tcgagtgcaa ccggcgcagg aacactgcca 11160
gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg aacgctgttt 11220
ttccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata aaatgcttga 11280
tggtcggaag tggcataaat tccgtcagcc agtttagtct gaccatctca tctgtaacat 11340
cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg ggcttcccat 11400
acaagcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat ttatacccat 11460
ataaatcagc atccatgttg gaatttaatc gcggcctcga cgtttcccgt tgaatatggc 11520
tcatattctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 11580
gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggtcagtgtt acaaccaatt 11640
aaccaattct gaacattatc gcgagcccat ttatacctga atatggctca taacacccct 11700
tgtttgcctg gcggcagtag cgcggtggtc ccacctgacc ccatgccgaa ctcagaagtg 11760
aaacgccgta gcgccgatgg tagtgtgggg actccccatg cgagagtagg gaactgccag 11820
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgcccgg gctaattagg 11880
gggtgtcgcc cttattcgac tctataggga agttcctatt ctctagaaag tataggaact 11940
tctgaagggg ggtcgatcga cttaattaag g 11971
<210> 28
<211> 6900
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<220>
<221> misc_feature
<222> (1)..(130)
<223> 5' ITR
<220>
<221> misc_feature
<222> (241)..(544)
<223> CMV enhancer
<220>
<221> misc_feature
<222> (546)..(823)
<223> chicken beta actin promoter
<220>
<221> misc_feature
<222> (824)..(1795)
<223> CBA exon 1 and intron
<220>
<221> misc_feature
<222> (1859)..(1864)
<223> kozak
<220>
<221> misc_feature
<222> (1865)..(3826)
<223> human codon optimized CHM (REP-1)
<220>
<221> misc_feature
<222> (3847)..(4054)
<223> bGH poly(A) signal
<220>
<221> misc_feature
<222> (4104)..(4233)
<223> 3' ITR
<400> 28
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gcaagctagc 180
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 240
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 300
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 360
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 420
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 480
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattaa 540
catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 600
cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 660
gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 720
aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 780
gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcggggagtc gctgcgacgc 840
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 900
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 960
cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1020
cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg 1080
gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg 1140
gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg 1200
tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga 1260
gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc tgcacccccc tccccgagtt 1320
gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc 1380
gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc 1440
ggggagggct cgggggaggg gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg 1500
gcgagccgca gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg 1560
tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc 1620
ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg 1680
ccgcgccgcc gtccccttct ccctctccag cctcggggct gtccgcgggg ggacggctgc 1740
cttcgggggg gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga 1800
caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacac tagcggccgc 1860
caccatggct gataccctgc cctctgaatt cgacgtgatt gtgattggaa ccggactccc 1920
tgaatcgatc atcgccgcgg cctgttcccg gtccggtcgg cgcgtgctgc acgtcgattc 1980
gagaagctac tacggaggga attgggcctc attctccttc tccggactgc tctcctggct 2040
gaaggagtat caggagaact ccgacattgt ctccgactca cctgtgtggc aggaccagat 2100
cctggaaaac gaggaagcaa tagccctgag ccggaaggac aagaccatcc agcacgtgga 2160
ggtgttctgt tatgcctccc aagacctcca tgaggacgtg gaagaggctg gagcgttgca 2220
gaagaatcat gccctcgtga cctccgctaa ctccaccgag gcagccgaca gcgccttcct 2280
gccgaccgag gatgaatccc tgtcaactat gtcgtgcgaa atgctgaccg aacagactcc 2340
gagctccgac cccgaaaacg ccctggaagt gaacggagcg gaagtgaccg gcgaaaagga 2400
gaaccattgc gacgacaaga cttgtgtccc atccacttcc gcggaggaca tgtccgagaa 2460
tgtgcctatc gccgaggaca ccaccgaaca gcccaagaag aacagaatca cgtacagcca 2520
gatcatcaag gaggggcgga ggtttaacat cgatctggtg tcgaagctgc tgtacagccg 2580
cggtctgctg atcgatctgc tcattaagtc gaacgtgtcg agatacgccg agttcaagaa 2640
catcacaagg attctcgcct tccgggaagg aagagtggaa caagtgccgt gctcccgggc 2700
cgacgtgttc aactcaaagc aacttaccat ggtggaaaag cgcatgctga tgaaattcct 2760
gaccttctgc atggagtacg aaaagtaccc tgatgagtac aagggttacg aagaaattac 2820
tttctacgag tacctcaaga cccagaagct gaccccgaat ctgcagtaca ttgtgatgca 2880
ctcaatcgca atgacctccg aaaccgcctc ctcgaccatc gacgggctca aggccaccaa 2940
gaacttcctg cactgtttgg ggcgctacgg caacactccg ttcctcttcc cgctgtacgg 3000
ccagggagag ctgcctcagt gtttctgccg gatgtgcgcc gtgttcggcg gaatctactg 3060
tctccgccac tcggtccagt gcctggtggt ggacaaggaa tccaggaagt gcaaagccat 3120
tattgaccag ttcggacaac ggatcatttc cgagcacttt cttgtggagg actcatactt 3180
cccggagaac atgtgctctc gggtccagta tcgacagatt tccagggcgg tgctcattac 3240
tgaccggagc gtcctcaaga ccgatagcga ccagcagatc tccatcctga ccgtgccggc 3300
ggaagaaccc ggcacttttg ccgtgcgcgt gatcgagctt tgctcatcca ccatgacttg 3360
catgaaaggc acttacctgg tgcacctgac gtgcacctca tcgaaaaccg ctagagagga 3420
cctggaatcc gtcgtccaaa agctgttcgt gccttacacc gagatggaaa ttgaaaacga 3480
acaagtggag aagccccgca tcctttgggc cctgtacttt aacatgcgcg attcctccga 3540
tatctcgcgg tcctgctata acgacttgcc ttcgaacgtc tacgtctgct ccgggccaga 3600
ctgcggtctt ggcaacgaca atgccgtgaa gcaggcggaa acactgttcc aagagatctg 3660
ccctaacgag gatttttgcc cgcccccccc aaaccccgag gatatcatct tggacggaga 3720
cagcctgcag ccagaagcat ccgagtccag cgccatcccg gaggccaaca gcgaaacctt 3780
caaggagagc actaacctgg gcaacctgga agagtccagc gaatgatcat aggatctctg 3840
cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 3900
tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 3960
attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 4020
aggattggga agacaatagc aggcatgctg gggactcgag ttctacgtag ataagtagca 4080
tggcgggtta atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct 4140
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 4200
ccgggcggcc tcagtgagcg agcgagcgcg cagccttaat taacctaata aggaaaatga 4260
agggaagttc ctatactttc tagagaatag gaacttctat agggagtcga ataagggcga 4320
cacaaaaggt attctaaatg cataataaat actgataaca tcttatagtt tgtattatat 4380
tttgtattat cgttgacatg tataattttg atatcaaaaa ctgattttcc ctttattatt 4440
ttcgagattt attttcttaa ttctctttaa caaactagaa atattgtata tacaaaaaat 4500
cataaataat agatgaatag tttaattata ggtgttcatc aatcgaaaaa gcaacgtatc 4560
ttatttaaag tgcgttgctt ttttctcatt tataaggtta aataattctc atatatcaag 4620
caaagtgaca ggcgccctta aatattctga caaatgctct ttccctaaac tccccccata 4680
aaaaaacccg ccgaagcggg tttttacgtt atttgcggat taacgattac tcgttatcag 4740
aaccgcccag gatgcctggc agttccctac tctcgccgct gcgctcggtc gttcggctgc 4800
gggacctcag cgctagcgga gtgtatactg gcttactatg ttggcactga tgagggtgtc 4860
agtgaagtgc ttcatgtggc aggagaaaaa aggctgcacc ggtgcgtcag cagaatatgt 4920
gatacaggat atattccgct tcctcgctca ctgactcgct acgctcggtc gttcgactgc 4980
ggcgagcgga aatggcttac gaacggggcg gagatttcct ggaagatgcc aggaagatac 5040
ttaacaggga agtgagaggg ccgcggcaaa gccgtttttc cataggctcc gcccccctga 5100
caagcatcac gaaatctgac gctcaaatca gtggtggcga aacccgacag gactataaag 5160
ataccaggcg tttccccctg gcggctccct cgtgcgctct cctgttcctg cctttcggtt 5220
taccggtgtc attccgctgt tatggccgcg tttgtctcat tccacgcctg acactcagtt 5280
ccgggtaggc agttcgctcc aagctggact gtatgcacga accccccgtt cagtccgacc 5340
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggaaagacat gcaaaagcac 5400
cactggcagc agccactggt aattgattta gaggagttag tcttgaagtc atgcgccggt 5460
taaggctaaa ctgaaaggac aagttttggt gactgcgctc ctccaagcca gttacctcgg 5520
ttcaaagagt tggtagctca gagaaccttc gaaaaaccgc cctgcaaggc ggttttttcg 5580
ttttcagagc aagagattac gcgcagacca aaacgatctc aagaagatca tcttattaag 5640
cttttagaaa aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc 5700
aataccatat ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt 5760
ccataggatg gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca 5820
acctattaat ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac 5880
gactgaatcc ggtgagaatg gcaaaagttt atgcatttct ttccagactt gttcaacagg 5940
ccagccatta cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga 6000
ttgcgcctga gcgaggcgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat 6060
cgagtgcaac cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg 6120
atattcttct aatacctgga acgctgtttt tccggggatc gcagtggtga gtaaccatgc 6180
atcatcagga gtacggataa aatgcttgat ggtcggaagt ggcataaatt ccgtcagcca 6240
gtttagtctg accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag 6300
aaacaactct ggcgcatcgg gcttcccata caagcgatag attgtcgcac ctgattgccc 6360
gacattatcg cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg 6420
cggcctcgac gtttcccgtt gaatatggct catattcttc ctttttcaat attattgaag 6480
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 6540
acaaataggg gtcagtgtta caaccaatta accaattctg aacattatcg cgagcccatt 6600
tatacctgaa tatggctcat aacacccctt gtttgcctgg cggcagtagc gcggtggtcc 6660
cacctgaccc catgccgaac tcagaagtga aacgccgtag cgccgatggt agtgtgggga 6720
ctccccatgc gagagtaggg aactgccagg catcaaataa aacgaaaggc tcagtcgaaa 6780
gactgggcct ttcgcccggg ctaattaggg ggtgtcgccc ttattcgact ctatagggaa 6840
gttcctattc tctagaaagt ataggaactt ctgaaggggg gtcgatcgac ttaattaagg 6900
<210> 29
<211> 12074
<212> DNA
<213> Artificial Sequence
<220>
<223> constructed sequence
<400> 29
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gcaagctagc 180
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 240
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 300
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 360
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 420
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 480
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattaa 540
catggtcgag gtgagcccca cgttctgctt cactctcccc atctcccccc cctccccacc 600
cccaattttg tatttattta ttttttaatt attttgtgca gcgatggggg cggggggggg 660
gggggggcgc gcgccaggcg gggcggggcg gggcgagggg cggggcgggg cgaggcggag 720
aggtgcggcg gcagccaatc agagcggcgc gctccgaaag tttcctttta tggcgaggcg 780
gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg gcggggagtc gctgcgacgc 840
tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg 900
accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg ctgtaattag 960
cgcttggttt aatgacggct tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc 1020
cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg 1080
gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg 1140
gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg 1200
tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga 1260
gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc tgcacccccc tccccgagtt 1320
gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc 1380
gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc 1440
ggggagggct cgggggaggg gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg 1500
gcgagccgca gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg 1560
tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc 1620
ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg 1680
ccgcgccgcc gtccccttct ccctctccag cctcggggct gtccgcgggg ggacggctgc 1740
cttcgggggg gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga 1800
caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacac tagcggccgc 1860
atggcggata ctctcccttc ggagtttgat gtgatcgtaa tagggacggg tttgcctgaa 1920
tccatcattg cagctgcatg ttcaagaagt ggccggagag ttctgcatgt tgattcaaga 1980
agctactatg gaggaaactg ggccagtttt agcttttcag gactattgtc ctggctaaag 2040
gaataccagg aaaacagtga cattgtaagt gacagtccag tgtggcaaga ccagatcctt 2100
gaaaatgaag aagccattgc tcttagcagg aaggacaaaa ctattcaaca tgtggaagta 2160
ttttgttatg ccagtcagga tttgcatgaa gatgtcgaag aagctggtgc actgcagaaa 2220
aatcatgctc ttgtgacatc tgcaaactcc acagaagctg cagattctgc cttcctgcct 2280
acggaggatg agtcattaag cactatgagc tgtgaaatgc tcacagaaca aactccaagc 2340
agcgatccag agaatgcgct agaagtaaat ggtgctgaag tgacagggga aaaagaaaac 2400
cattgtgatg ataaaacttg tgtgccatca acttcagcag aagacatgag tgaaaatgtg 2460
cctatagcag aagataccac agagcaacca aagaaaaaca gaattactta ctcacaaatt 2520
attaaagaag gcaggagatt taatattgat ttagtatcaa agctgctgta ttctcgagga 2580
ttactaattg atcttctaat caaatctaat gttagtcgat atgcagagtt taaaaatatt 2640
accaggattc ttgcatttcg agaaggacga gtggaacagg ttccgtgttc cagagcagat 2700
gtctttaata gcaaacaact tactatggta gaaaagcgaa tgctaatgaa atttcttaca 2760
ttttgtatgg aatatgagaa atatcctgat gaatataaag gatatgaaga gatcacattt 2820
tatgaatatt taaagactca aaaattaacc cccaacctcc aatatattgt catgcattca 2880
attgcaatga catcagagac agccagcagc accatagatg gtctcaaagc taccaaaaac 2940
tttcttcact gtcttgggcg gtatggcaac actccatttt tgtttccttt atatggccaa 3000
ggagaactcc cccagtgttt ctgcaggatg tgtgctgtgt ttggtggaat ttattgtctt 3060
cgccattcag tacagtgcct tgtagtggac aaagaatcca gaaaatgtaa agcaattata 3120
gatcagtttg gtcagagaat aatctctgag catttcctcg tggaggacag ttactttcct 3180
gagaacatgt gctcacgtgt gcaatacagg cagatctcca gggcagtgct gattacagat 3240
agatctgtcc taaaaacaga ttcagatcaa cagatttcca ttttgacagt gccagcagag 3300
gaaccaggaa cttttgctgt tcgggtcatt gagttatgtt cttcaacgat gacatgcatg 3360
aaaggcacct atttggttca tttgacttgc acatcttcta aaacagcaag agaagattta 3420
gaatcagttg tgcagaaatt gtttgttcca tatactgaaa tggagataga aaatgaacaa 3480
gtagaaaagc caagaattct gtgggctctt tacttcaata tgagagattc gtcagacatc 3540
agcaggagct gttataatga tttaccatcc aacgtttatg tctgctctgg cccagattgt 3600
ggtttaggaa atgataatgc agtcaaacag gctgaaacac ttttccagga aatctgcccc 3660
aatgaagatt tctgtccccc tccaccaaat cctgaagaca ttatccttga tggagacagt 3720
ttacagccag aggcttcaga atccagtgcc ataccagagg ctaactcgga gactttcaag 3780
gaaagcacaa accttggaaa cctagaggag tcctctgaat aaggatctgc ctcgactgtg 3840
ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa 3900
ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt 3960
aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa 4020
gacaatagca ggcatgctgg ggactcgagt tctacgtaga taagtagcat ggcgggttaa 4080
tcattaacta caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 4140
cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 4200
cagtgagcga gcgagcgcgc agccttaatt aacctaagga aaatgaagtg aagttcctat 4260
actttctaga gaataggaac ttctatagtg agtcgaataa gggcgacaca aaatttattc 4320
taaatgcata ataaatactg ataacatctt atagtttgta ttatattttg tattatcgtt 4380
gacatgtata attttgatat caaaaactga ttttcccttt attattttcg agatttattt 4440
tcttaattct ctttaacaaa ctagaaatat tgtatataca aaaaatcata aataatagat 4500
gaatagttta attataggtg ttcatcaatc gaaaaagcaa cgtatcttat ttaaagtgcg 4560
ttgctttttt ctcatttata aggttaaata attctcatat atcaagcaaa gtgacaggcg 4620
cccttaaata ttctgacaaa tgctctttcc ctaaactccc cccataaaaa aacccgccga 4680
agcgggtttt tacgttattt gcggattaac gattactcgt tatcagaacc gcccaggggg 4740
cccgagctta acctttttat ttgggggaga gggaagtcat gaaaaaacta acctttgaaa 4800
ttcgatctcc agcacatcag caaaacgcta ttcacgcagt acagcaaatc cttccagacc 4860
caaccaaacc aatcgtagta accattcagg aacgcaaccg cagcttagac caaaacagga 4920
agctatgggc ctgcttaggt gacgtctctc gtcaggttga atggcatggt cgctggctgg 4980
atgcagaaag ctggaagtgt gtgtttaccg cagcattaaa gcagcaggat gttgttccta 5040
accttgccgg gaatggcttt gtggtaatag gccagtcaac cagcaggatg cgtgtaggcg 5100
aatttgcgga gctattagag cttatacagg cattcggtac agagcgtggc gttaagtggt 5160
cagacgaagc gagactggct ctggagtgga aagcgagatg gggagacagg gctgcatgat 5220
aaatgtcgtt agtttctccg gtggcaggac gtcagcatat ttgctctggc taatggagca 5280
aaagcgacgg gcaggtaaag acgtgcatta cgttttcatg gatacaggtt gtgaacatcc 5340
aatgacatat cggtttgtca gggaagttgt gaagttctgg gatataccgc tcaccgtatt 5400
gcaggttgat atcaacccgg agcttggaca gccaaatggt tatacggtat gggaaccaaa 5460
ggatattcag acgcgaatgc ctgttctgaa gccatttatc gatatggtaa agaaatatgg 5520
cactccatac gtcggcggcg cgttctgcac tgacagatta aaactcgttc ccttcaccaa 5580
atactgtgat gaccatttcg ggcgagggaa ttacaccacg tggattggca tcagagctga 5640
tgaaccgaag cggctaaagc caaagcctgg aatcagatat cttgctgaac tgtcagactt 5700
tgagaaggaa gatatcctcg catggtggaa gcaacaacca ttcgatttgc aaataccgga 5760
acatctcggt aactgcatat tctgcattaa aaaatcaacg caaaaaatcg gacttgcctg 5820
caaagatgag gagggattgc agcgtgtttt taatgaggtc atcacgggat cccatgtgcg 5880
tgacggacat cgggaaacgc caaaggagat tatgtaccga ggaagaatgt cgctggacgg 5940
tatcgcgaaa atgtattcag aaaatgatta tcaagccctg tatcaggaca tggtacgagc 6000
taaaagattc gataccggct cttgttctga gtcatgcgaa atatttggag ggcagcttga 6060
tttcgacttc gggagggaag ctgcatgatg cgatgttatc ggtgcggtga atgcaaagaa 6120
gataaccgct tccgaccaaa tcaaccttac tggaatcgat ggtgtctccg gtgtgaaaga 6180
acaccaacag gggtgttacc actaccgcag gaaaaggagg acgtgtggcg agacagcgac 6240
gaagtatcac cgacataatc tgcgaaaact gcaaatacct tccaacgaaa cgcaccagaa 6300
ataaacccaa gccaatccca aaagaatctg acgtaaaaac cttcaactac acggctcacc 6360
tgtgggatat ccggtggcta agacgtcgtg cgaggaaaac aaggtgattg accaaaatcg 6420
aagttacgaa caagaaagcg tcgagcgagc tttaacgtgc gctaactgcg gtcagaagct 6480
gcatgtgctg gaagttcacg tgtgtgagca ctgctgcgca gaactgatga gcgatccgaa 6540
tagctcgatg cacgaggaag aagatgatgg ctaaaccagc gcgaagacga tgtaaaaacg 6600
atgaatgccg ggaatggttt caccctgcat tcgctaatca gtggtggtgc tctccagagt 6660
gtggaaccaa gatagcactc gaacgacgaa gtaaagaacg cgaaaaagcg gaaaaagcag 6720
cagagaagaa acgacgacga gaggagcaga aacagaaaga taaacttaag attcgaaaac 6780
tcgccttaaa gccccgcagt tactggatta aacaagccca acaagccgta aacgccttca 6840
tcagagaaag agaccgcgac ttaccatgta tctcgtgcgg aacgctcacg tctgctcagt 6900
gggatgccgg acattaccgg acaactgctg cggcacctca actccgattt aatgaacgca 6960
atattcacaa gcaatgcgtg gtgtgcaacc agcacaaaag cggaaatctc gttccgtatc 7020
gcgtcgaact gattagccgc atcgggcagg aagcagtaga cgaaatcgaa tcaaaccata 7080
accgccatcg ctggactatc gaagagtgca aggcgatcaa ggcagagtac caacagaaac 7140
tcaaagacct gcgaaatagc agaagtgagg ccgcatgacg ttctcagtaa aaaccattcc 7200
agacatgctc gttgaagcat acggaaatca gacagaagta gcacgcagac tgaaatgtag 7260
tcgcggtacg gtcagaaaat acgttgatga taaagacggg aaaatgcacg ccatcgtcaa 7320
cgacgttctc atggttcatc gcggatggag tgaaagagat gcgctattac gaaaaaattg 7380
atggcagcaa ataccgaaat atttgggtag ttggcgatct gcacggatgc tacacgaacc 7440
tgatgaacaa actggatacg attggattcg acaacaaaaa agacctgctt atctcggtgg 7500
gcgatttggt tgatcgtggt gcagagaacg ttgaatgcct ggaattaatc acattcccct 7560
ggttcagagc tgtacgtgga aaccatgagc aaatgatgat tgatggctta tcagagcgtg 7620
gaaacgttaa tcactggctg cttaatggcg gtggctggtt ctttaatctc gattacgaca 7680
aagaaattct ggctaaagct cttgcccata aagcagatga acttccgtta atcatcgaac 7740
tggtgagcaa agataaaaaa tatgttatct gccacgccga ttatcccttt gacgaatacg 7800
agtttggaaa gccagttgat catcagcagg taatctggaa ccgcgaacga atcagcaact 7860
cacaaaacgg gatcgtgaaa gaaatcaaag gcgcggacac gttcatcttt ggtcatacgc 7920
cagcagtgaa accactcaag tttgccaacc aaatgtatat cgataccggc gcagtgttct 7980
gcggaaacct aacattgatt caggtacagg gagaaggcgc atgagactcg aaagcgtagc 8040
taaatttcat tcgccaaaaa gcccgatgat gagcgactca ccacgggcca cggcttctga 8100
ctctctttcc ggtactgatg tgatggctgc tatggggatg gcgcaatcac aagccggatt 8160
cggtatggct gcattctgcg gtaagcacga actcagccag aacgacaaac aaaaggctat 8220
caactatctg atgcaatttg cacacaaggt atcggggaaa taccgtggtg tggcaaagct 8280
tgaaggaaat actaaggcaa aggtactgca agtgctcgca acattcgctt atgcggatta 8340
ttgccgtagt gccgcgacgc cgggggcaag atgcagagat tgccatggta caggccgtgc 8400
ggttgatatt gccaaaacag agctgtgggg gagagttgtc gagaaagagt gcggaagatg 8460
caaaggcgtc ggctattcaa ggatgccagc aagcgcagca tatcgcgctg tgacgatgct 8520
aatcccaaac cttacccaac ccacctggtc acgcactgtt aagccgctgt atgacgctct 8580
ggtggtgcaa tgccacaaag aagagtcaat cgcagacaac attttgaatg cggtcacacg 8640
ttagcagcat gattgccacg gatggcaaca tattaacggc atgatattga cttattgaat 8700
aaaattgggt aaatttgact caacgatggg ttaattcgct cgttgtggta gtgagatgaa 8760
aagaggcggc gcttactacc gattccgcct agttggtcac ttcgacgtat cgtctggaac 8820
tccaaccatc gcaggcagag aggtctgcaa aatgcaatcc cgaaacagtt cgcaggtaat 8880
agttagagcc tgcataacgg tttcgggatt ttttatatct gcacaacagg taagagcatt 8940
gagtcgataa tcgtgaagag tcggcgagcc tggttagcca gtgctctttc cgttgtgctg 9000
aattaagcga ataccggaag cagaaccgga tcaccaaatg cgtacaggcg tcatcgccgc 9060
ccagcaacag cacaacccaa actgagccgt agccactgtc tgtcctgaat tcattagtaa 9120
tagttacgct gcggcctttt acacatgacc ttcgtgaaag cgggtggcag gaggtcgcgc 9180
taacaacctc ctgccgtttt gcccgtgcat atcggtcacg aacaaatctg attactaaac 9240
acagtagcct ggatttgttc tatcagtaat cgaccttatt cctaattaaa tagagcaaat 9300
ccccttattg ggggtaagac atgaagatgc cagaaaaaca tgacctgttg gccgccattc 9360
tcgcggcaaa ggaacaaggc atcggggcaa tccttgcgtt tgcaatggcg taccttcgcg 9420
gcagatataa tggcggtgcg tttacaaaaa cagtaatcga cgcaacgatg tgcgccatta 9480
tcgcctggtt cattcgtgac cttctcgact tcgccggact aagtagcaat ctcgcttata 9540
taacgagcgt gtttatcggc tacatcggta ctgactcgat tggttcgctt atcaaacgct 9600
tcgctgctaa aaaagccgga gtagaagatg gtagaaatca ataatcaacg taaggcgttc 9660
ctcgatatgc tggcgtggtc ggagggaact gataacggac gtcagaaaac cagaaatcat 9720
ggttatgacg tcattgtagg cggagagcta tttactgatt actccgatca ccctcgcaaa 9780
cttgtcacgc taaacccaaa actcaaatca acaggcgctt aagactggcc gtcgttttac 9840
aacacagaaa gagtttgtag aaacgcaaaa aggccatccg tcaggggcct tctgcttagt 9900
ttgatgcctg gcagttccct actctcgcct tccgcttcct cgctcactga ctcgctgcgc 9960
tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 10020
acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 10080
aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 10140
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 10200
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 10260
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 10320
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 10380
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 10440
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 10500
ggtgctacag agttcttgaa gtggtgggct aactacggct acactagaag aacagtattt 10560
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 10620
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 10680
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 10740
aacgacgcgc gcgtaactca cgttaaggga ttttggtcat gagcttgcgc cgtcccgtca 10800
agtcagcgta atgctctgct tttagaaaaa ctcatcgagc atcaaatgaa actgcaattt 10860
attcatatca ggattatcaa taccatattt ttgaaaaagc cgtttctgta atgaaggaga 10920
aaactcaccg aggcagttcc ataggatggc aagatcctgg tatcggtctg cgattccgac 10980
tcgtccaaca tcaatacaac ctattaattt cccctcgtca aaaataaggt tatcaagtga 11040
gaaatcacca tgagtgacga ctgaatccgg tgagaatggc aaaagtttat gcatttcttt 11100
ccagacttgt tcaacaggcc agccattacg ctcgtcatca aaatcactcg catcaaccaa 11160
accgttattc attcgtgatt gcgcctgagc gaggcgaaat acgcgatcgc tgttaaaagg 11220
acaattacaa acaggaatcg agtgcaaccg gcgcaggaac actgccagcg catcaacaat 11280
attttcacct gaatcaggat attcttctaa tacctggaac gctgtttttc cggggatcgc 11340
agtggtgagt aaccatgcat catcaggagt acggataaaa tgcttgatgg tcggaagtgg 11400
cataaattcc gtcagccagt ttagtctgac catctcatct gtaacatcat tggcaacgct 11460
acctttgcca tgtttcagaa acaactctgg cgcatcgggc ttcccataca agcgatagat 11520
tgtcgcacct gattgcccga cattatcgcg agcccattta tacccatata aatcagcatc 11580
catgttggaa tttaatcgcg gcctcgacgt ttcccgttga atatggctca tattcttcct 11640
ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 11700
atgtatttag aaaaataaac aaataggggt cagtgttaca accaattaac caattctgaa 11760
cattatcgcg agcccattta tacctgaata tggctcataa caccccttgt ttgcctggcg 11820
gcagtagcgc ggtggtccca cctgacccca tgccgaactc agaagtgaaa cgccgtagcg 11880
ccgatggtag tgtggggact ccccatgcga gagtagggaa ctgccaggca tcaaataaaa 11940
cgaaaggctc agtcgaaaga ctgggccttt cgcccgggct aattaggggg tgtcgccctt 12000
attcgactct atagtgaagt tcctattctc tagaaagtat aggaacttct gaagtggggt 12060
cgacttaatt aagg 12074
Claims (59)
- Rab 에스코트 단백질-1 (REP-1)을 암호화하는 코돈 최적화된 cDNA 서열.
- 제 1 항의 cDNA 서열을 포함하는 발현 카세트.
- 제 2 항에 있어서, SEQ ID NO: 1을 포함하는 것을 특징으로 하는 발현 카세트.
- 아데노-관련 바이러스 (AAV) 벡터로서, AAV 캡시드 및 AAV 역 말단 반복부 서열을 포함하는 핵산 서열 및 인간 Rab 에스코트 단백질-1 (REP-1)을 암호화하는 핵산 서열, 및 숙주 세포에서 REP-1의 발현을 지시하는 발현 제어 서열을 포함하는 바이러스 벡터.
- 제 4 항에 있어서, REP-1 서열은 전체 길이 REP-1 단백질을 암호화하는 것을 특징으로 하는 바이러스 벡터.
- 제 4 항 또는 제 5 항에 있어서, REP-1 서열은 SEQ ID NO: 2의 단백질 서열을 암호화하는 것을 특징으로 하는 바이러스 벡터.
- 제 4 항 내지 제 6 항 중 어느 한 항에 있어서, REP-1 서열은 SEQ ID NO: 3의 핵산 서열 또는 그것의 변종을 포함하는 것을 특징으로 하는 바이러스 벡터.
- 제 7 항에 있어서, 변종은 인간에서의 발현을 위해 최적화된, SEQ ID NO: 3의 코돈 최적화된 변종인 것을 특징으로 하는 바이러스 벡터.
- 제 8 항에 있어서, 코돈 최적화된 변종은 SEQ ID NO: 1인 것을 특징으로 하는 바이러스 벡터.
- 고리형 뉴클레오타이드 게이트 채널 알파 3 (CNGA3)을 암호화하는 코돈 최적화된 cDNA 서열.
- 제10 항의 cDNA 서열을 포함하는 발현 카세트.
- 제 11 항에 있어서, SEQ ID NO: 9 또는 11을 포함하는 것을 특징으로 하는 발현 카세트.
- 아데노-관련 바이러스 (AAV) 벡터로서, AAV 캡시드 및 AAV 역 말단 반복부 서열을 포함하는 핵산 서열 및 인간 고리형 뉴클레오타이드 게이트 채널 알파 3 (CNGA3)을 암호화하는 핵산 서열, 및 숙주 세포에서 CNGA3의 발현을 지시하는 발현 제어 서열을 포함하는 바이러스 벡터.
- 제 13 항에 있어서, CNGA3 서열은 전체 길이 단백질을 암호화하는 것을 특징으로 하는 바이러스 벡터.
- 제 13 항 또는 제 14 항에 있어서, CNGA3 서열은 SEQ ID NO: 10의 단백질 서열을 암호화하는 것을 특징으로 하는 바이러스 벡터.
- 제 13 항 내지 제 15항 중 어느 한 항에 있어서, CNGA3 서열은 SEQ ID NO: 13의 핵산 서열, 또는 그것의 변종을 포함하는 것을 특징으로 하는 바이러스 벡터.
- 제 16 항에 있어서, 변종은 인간에서의 발현을 위해 최적화된, SEQ ID NO: 13의 코돈 최적화된 변종인 것을 특징으로 하는 바이러스 벡터.
- 제 17 항에 있어서, 코돈 최적화된 변종은 SEQ ID NO: 9 또는 SEQ ID NO: 11인 것을 특징으로 하는 바이러스 벡터.
- 제 4 항 내지 제 9 항 또는 제 13 항 내지 제 18 항 중 어느 한 항에 있어서, 발현 제어 서열은 프로모터를 포함하는 것을 특징으로 하는 바이러스 벡터.
- 제 19 항에 있어서, 프로모터는 로돕신 프로모터인 것을 특징으로 하는 바이러스 벡터.
- 제 19 항에 있어서, 프로모터는 로돕신 키나아제 프로모터인 것을 특징으로 하는 바이러스 벡터.
- 제 19 항에 있어서, 프로모터는 눈 세포-특이적 프로모터인 것을 특징으로 하는 바이러스 벡터.
- 제 19 항에 있어서, 프로모터는 인간 EF1α 프로모터, 대사자극성 글루타메이트 수용체 6 (mGluR6) 프로모터, 로돕신 프로모터, 추상체 옵신 프로모터, 및 전사 인자 프로모터 (신경 망막 류신 지퍼 (Nrl) 및 광수용체-특이적 핵 수용체 Nr2e3, bZIP)로부터 선택되는 것을 특징으로 하는 바이러스 벡터.
- 제 19 항에 있어서, 프로모터는 유도성 프로모터, 구성성 프로모터 또는 조직 특이적 프로모터인 것을 특징으로 하는 AAV.
- 제 24 항에 있어서, 프로모터는 라파마이신/라파로그 프로모터, 엑디손 프로모터, 에스트로겐-반응성 프로모터, 및 테트라사이클린-반응성 프로모터, 또는 헤테로다이머 억제자 스위치로부터 선택된 유도성 프로모터인 것을 특징으로 하는 AAV.
- 제4 항 내지 제 9 항 또는 제 13 항 내지 제 25 항 중 어느 한 항에 있어서, 인트론, Kozak 서열, 폴리 A, 및 전사 후 조절 요소들 중 하나 이상을 추가로 포함하는 것을 특징으로 하는 바이러스 벡터.
- 제4 항 내지 제 9 항 또는 제 13 항 내지 제 26 항 중 어느 한 항에 있어서, 벡터는 AAV2, AAV5, AAV8, AAV9, AAV8bp, AAV7m8 및 그것들의 변종으로부터 선택된 캡시드를 가지는 rAAV인 것을 특징으로 하는 바이러스 벡터.
- 제4 항 내지 제 9 항 또는 제 13 항 내지 제 27 항 중 어느 한 항에 있어서, ITR 서열은 캡시드 단백질을 공급하는 것과는 상이한 AAV로부터 유래되는 것을 특징으로 하는 바이러스 벡터.
- 제4 항 내지 제 9 항 또는 제 13 항 내지 제 28 항 중 어느 한 항에 있어서, ITR 서열은 AAV2로부터 유래되는 것을 특징으로 하는 바이러스 벡터.
- 아데노-관련 바이러스 (AAV) 벡터로서, AAV8 캡시드 및 재조합 (rAAV) 게놈을 포함하고, 상기 rAAV 게놈은 REP-1을 암호화하는 핵산 서열, 역 말단 반복부 서열 및 숙주 세포에서 REP-1의 발현을 지시하는 발현 제어 서열을 포함하는 아데노-관련 바이러스 (AAV) 벡터.
- 아데노-관련 바이러스 (AAV) 벡터로서, AAV8 캡시드 및 발현 카세트를 포함하고, 상기 발현 카세트는 CNGA3을 암호화하는 핵산 서열, 역 말단 반복부 서열 및 숙주 세포에서 CNGA3의 발현을 지시하는 발현 제어 서열을 포함하는 아데노-관련 바이러스 (AAV) 벡터.
- 제약학적으로 허용되는 담체 및 제4 항 내지 제 9 항 또는 제 13 항 내지 제 31 항 중 어느 한 항에 따르는 적어도 하나의 바이러스 벡터를 포함하는 제약학적 조성물.
- 제 32 항의 조성물을 필요로 하는 대상체에게 투여하는 단계를 포함하는, 범맥락막 위축의 치료 방법.
- 제 32 항의 조성물을 필요로 하는 대상체에게 투여하는 단계를 포함하는, 색맹의 치료 방법.
- 제 33 항 또는 제 34 항에 있어서, 상기 조성물은 망막밑으로 투여되는 것을 특징으로 하는 방법.
- 제 33 항 또는 제 34 항에 있어서, 상기 조성물은 유리체강내로, 정맥내로 또는 맥락막에 투여되는 것을 특징으로 하는 방법.
- 제 33 항 내지 제 36 항 중 어느 한 항에 있어서, 상기 대상체는 포유류인 것을 특징으로 하는 방법.
- 제 37 항에 있어서, 상기 대상체는 인간인 것을 특징으로 하는 방법.
- 제 33 항 내지 제 38 항 중 어느 한 항에 있어서, 상기 조성물은 다른 치료법과 조합되어 투여되는 것을 특징으로 하는 방법.
- 제 33 항 내지 제 39 항 중 어느 한 항에 있어서, 상기 조성물은 약 109 내지 약 1013 벡터 게놈 (VG)의 투여량으로 투여되는 것을 특징으로 하는 방법.
- 제 33 항 내지 제 40 항 중 어느 한 항에 있어서, 상기 조성물은 약 100 μL 내지 약 500 μL의 부피로 투여되는 것을 특징으로 하는 방법.
- 제 33 항 내지 제 41 항 중 어느 한 항에 있어서, 상기 조성물은 1회를 초과하여 투여되는 것을 특징으로 하는 방법.
- AAV 벡터를 제조하기 위한 플라스미드로서, SEQ ID NO: 1 또는 SEQ ID NO: 9 또는 SEQ ID NO: 25, 또는 SEQ ID NO: 26, 또는 SEQ ID NO: 27 또는 SEQ ID NO: 28, 또는 그것들과 적어도 80%의 동일성을 공유하는 서열을 포함하는 플라스미드.
- rAAV 바이러스의 생성 방법으로서, 유전자 발현 카세트 바이러스 게놈의 감염성 AAV 엔벨로프 또는 캡시드 안으로의 포장을 허용하기에 충분한 바이러스 서열의 존재하에 제 43 항의 플라스미드를 지닌 포장 세포를 배양하는 단계를 포함하는 방법.
- 제 44 항의 방법에 따라 제조된 재조합 AAV.
- SEQ ID NO: 25, SEQ ID NO: 26, SEQ ID NO: 27 또는 SEQ ID NO:28의 nt 1 내지 4233을 포함하는 벡터 게놈을 포함하는 바이러스 벡터.
- 5' ITR, CMV 인핸서, 닭 베타-액틴 프로모터, CBA 엑손 1 및 인트론, Kozak 서열, 코돈 최적화된 CHM, bGH 폴리 A 및 3' ITR을 포함하는 벡터 게놈을 포함하는 바이러스 벡터.
- 제4 항 내지 제 9 항, 제 13 항 내지 제 32 항 또는 제 46 항 내지 제 47 항 중 어느 한 항의 바이러스 벡터를 포함하는, 범맥락막 위축의 치료 방법에 사용하기 위한 조성물.
- 제4 항 내지 제 9 항, 제 13 항 내지 제 32 항 또는 제 46 항 내지 제 47 항 중 어느 한 항의 바이러스 벡터를 포함하는, 색맹의 치료 방법에 사용하기 위한 조성물.
- 제 48 항 또는 제 49 항에 있어서, 상기 조성물은 망막밑으로 투여되는 것을 특징으로 하는 조성물.
- 제 48 항 또는 제 49 항에 있어서, 상기 조성물은 유리체강내로, 정맥내로 또는 맥락막에 투여되는 것을 특징으로 하는 조성물.
- 제 48 항 내지 제 51 항 중 어느 한 항에 있어서, 상기 대상체는 포유류인 것을 특징으로 하는 조성물.
- 제 52 항에 있어서, 상기 대상체는 인간인 것을 특징으로 하는 조성물.
- 제 48 항 내지 제 53 항 중 어느 한 항에 있어서, 상기 조성물은 다른 치료법과 조합되어 투여되는 것을 특징으로 하는 조성물.
- 제 48 항 내지 제 54 항 중 어느 한 항에 있어서, 상기 조성물은 약 109 내지 약 1013 벡터 게놈 (VG)의 투여량으로 투여되는 것을 특징으로 하는 조성물.
- 제 48 항 내지 제 55 항 중 어느 한 항에 있어서, 상기 조성물은 약 100 μL 내지 약 500 μL의 부피로 투여되는 것을 특징으로 하는 조성물.
- 제 48 항 내지 제 56 항 중 어느 한 항에 있어서, 상기 조성물은 1회를 초과하여 투여되는 것을 특징으로 하는 조성물.
- 범맥락막 위축의 치료를 위한 의약의 제조에서, 제4 항 내지 제 9 항, 제 13 항 내지 제 32 항 또는 제 46 항 내지 제 47 항 중 어느 한 항의 바이러스 벡터의 사용.
- 색맹의 치료를 위한 의약의 제조에서, 제4 항 내지 제 9 항, 제 13 항 내지 제 32 항 또는 제 46 항 내지 제 47 항 중 어느 한 항의 바이러스 벡터의 사용.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562266789P | 2015-12-14 | 2015-12-14 | |
US62/266,789 | 2015-12-14 | ||
PCT/US2016/066402 WO2017106202A2 (en) | 2015-12-14 | 2016-12-13 | Gene therapy for ocular disorders |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20180099719A true KR20180099719A (ko) | 2018-09-05 |
Family
ID=58455636
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187019811A KR20180099719A (ko) | 2015-12-14 | 2016-12-13 | 눈 장애에 대한 유전자 요법 |
Country Status (13)
Country | Link |
---|---|
US (2) | US11090392B2 (ko) |
EP (2) | EP3389724B1 (ko) |
JP (2) | JP7057281B2 (ko) |
KR (1) | KR20180099719A (ko) |
CN (1) | CN109069668B (ko) |
AU (1) | AU2016370487C1 (ko) |
BR (1) | BR112018011838A2 (ko) |
CA (1) | CA3008264A1 (ko) |
ES (1) | ES2826384T3 (ko) |
HK (1) | HK1258518A1 (ko) |
MX (2) | MX2018007230A (ko) |
RU (1) | RU2762747C2 (ko) |
WO (1) | WO2017106202A2 (ko) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2762747C2 (ru) * | 2015-12-14 | 2021-12-22 | Зе Трастис Оф Зе Юниверсити Оф Пенсильвания | Генная терапия офтальмологических нарушений |
EP3377637B1 (en) * | 2016-04-08 | 2020-03-18 | Krystal Biotech, LLC | Compositions for use in methods for the treatment of wounds, disorders, and diseases of the skin |
WO2018022783A1 (en) * | 2016-07-26 | 2018-02-01 | Cornell University | Gene therapy for the treatment of aldehyde dehydrogenase deficiency |
JP2020527335A (ja) | 2017-06-14 | 2020-09-10 | ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア | 眼疾患のための遺伝子療法 |
CN110889859A (zh) * | 2019-11-11 | 2020-03-17 | 珠海上工医信科技有限公司 | 一种用于眼底图像血管分割的u型网络 |
BR112023015303A2 (pt) | 2021-02-01 | 2023-11-14 | Regenxbio Inc | Método para tratar doença cln2 devido a deficiência de tpp1 em um sujeito |
JP2024508463A (ja) * | 2021-02-26 | 2024-02-27 | ロジックバイオ セラピューティクス, インコーポレイテッド | 組換えaavベクターの製造及び使用 |
EP4314028A1 (en) | 2021-04-02 | 2024-02-07 | Krystal Biotech, Inc. | Viral vectors for cancer therapy |
WO2023014892A1 (en) * | 2021-08-04 | 2023-02-09 | Alpine Biotherapeutics Corporation | Sustainable ocular cell-mediated intraocular delivery of cellular therapeutics for treatment of ocular diseases or disorders |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5139941A (en) | 1985-10-31 | 1992-08-18 | University Of Florida Research Foundation, Inc. | AAV transduction vectors |
US5436146A (en) | 1989-09-07 | 1995-07-25 | The Trustees Of Princeton University | Helper-free stocks of recombinant adeno-associated virus vectors |
US6268213B1 (en) | 1992-06-03 | 2001-07-31 | Richard Jude Samulski | Adeno-associated virus vector and cis-acting regulatory and promoter elements capable of expressing at least one gene and method of using same for gene therapy |
US5869305A (en) | 1992-12-04 | 1999-02-09 | The University Of Pittsburgh | Recombinant viral vector system |
US5478745A (en) | 1992-12-04 | 1995-12-26 | University Of Pittsburgh | Recombinant viral vector system |
US6204059B1 (en) | 1994-06-30 | 2001-03-20 | University Of Pittsburgh | AAV capsid vehicles for molecular transfer |
US6093570A (en) | 1995-06-07 | 2000-07-25 | The University Of North Carolina At Chapel Hill | Helper virus-free AAV production |
US5741683A (en) | 1995-06-07 | 1998-04-21 | The Research Foundation Of State University Of New York | In vitro packaging of adeno-associated virus DNA |
US6548286B1 (en) | 1997-04-14 | 2003-04-15 | Cell Genesys, Inc. | Methods for increasing the efficiency of recombinant AAV product |
EP1080218A1 (en) | 1998-05-27 | 2001-03-07 | University of Florida | Method of preparing recombinant adeno-associated virus compositions by using an iodixanol gradient |
US6491907B1 (en) | 1998-11-10 | 2002-12-10 | The University Of North Carolina At Chapel Hill | Recombinant parvovirus vectors and method of making |
ES2308989T3 (es) | 1999-08-09 | 2008-12-16 | Targeted Genetics Corporation | Aumento de la expresion de una secuencia nucleotidica heterologa a partir de vectores viricos recombinantes que contienen una secuencia que forman pares de bases intracatenarios. |
WO2001091803A2 (en) | 2000-06-01 | 2001-12-06 | University Of North Carolina At Chapel Hill | Methods and compounds for controlled release of recombinant parvovirus vectors |
JP2005500008A (ja) * | 2001-01-19 | 2005-01-06 | インサイト・ゲノミックス・インコーポレイテッド | 受容体および膜結合タンパク質 |
EP1381276A4 (en) | 2001-04-13 | 2005-02-02 | Univ Pennsylvania | METHOD FOR TREATMENT OR DEVELOPMENT SLUDGE DEGRADATION |
ATE520707T1 (de) | 2001-11-13 | 2011-09-15 | Univ Pennsylvania | Verfahren für den nachweis und/oder die identifikation von sequenzen des adeno- assoziierten virus (aav) sowie isolation von dadurch identifizierten, neuen sequenzen |
EP2359869B1 (en) | 2001-12-17 | 2018-12-26 | The Trustees Of The University Of Pennsylvania | Adeno-associated virus (AAV) serotype 8 sequences, vectors containing same and uses therefor |
AU2003274397A1 (en) | 2002-06-05 | 2003-12-22 | University Of Florida | Production of pseudotyped recombinant aav virions |
EP1486567A1 (en) | 2003-06-11 | 2004-12-15 | Deutsches Krebsforschungszentrum Stiftung des öffentlichen Rechts | Improved adeno-associated virus (AAV) vector for gene therapy |
EP2298926A1 (en) | 2003-09-30 | 2011-03-23 | The Trustees of The University of Pennsylvania | Adeno-associated virus (AAV) clades, sequences, vectors containing same, and uses thereof |
EP3409296A1 (en) | 2005-04-07 | 2018-12-05 | The Trustees of the University of Pennsylvania | Method of increasing the function of an aav vector |
US7456683B2 (en) | 2005-06-09 | 2008-11-25 | Panasonic Corporation | Amplitude error compensating device and quadrature skew error compensating device |
WO2007120542A2 (en) | 2006-03-30 | 2007-10-25 | The Board Of Trustees Of The Leland Stanford Junior University | Aav capsid library and aav capsid proteins |
EP2320937A4 (en) | 2008-06-30 | 2013-01-16 | Univ Johns Hopkins | COMPOSITIONS AND METHODS FOR THE TREATMENT OF OCULAR OXIDATION STRESS AND PIGMENT RETINITY |
US20110305772A1 (en) * | 2009-02-26 | 2011-12-15 | The Johns Hopkins University | Compositions and methods for ex vivo hepatic nucleic acid delivery |
RU2444977C2 (ru) * | 2009-08-03 | 2012-03-20 | Федеральное государственное учреждение "МОСКОВСКИЙ НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ ГЛАЗНЫХ БОЛЕЗНЕЙ ИМЕНИ ГЕЛЬМГОЛЬЦА ФЕДЕРАЛЬНОГО АГЕНТСТВА ПО ВЫСОКОТЕХНОЛОГИЧНОЙ МЕДИЦИНСКОЙ ПОМОЩИ" | Способ диагностики ахроматопсии |
WO2011034947A2 (en) * | 2009-09-15 | 2011-03-24 | University Of Washington | Reagents and methods for modulating cone photoreceptor activity |
US9315825B2 (en) | 2010-03-29 | 2016-04-19 | The Trustees Of The University Of Pennsylvania | Pharmacologically induced transgene ablation system |
SG10201908848RA (en) | 2010-03-29 | 2019-10-30 | Univ Pennsylvania | Pharmacologically induced transgene ablation system |
CN108410872A (zh) * | 2011-01-07 | 2018-08-17 | 应用遗传科技公司 | 用于治疗色盲和其它疾病的启动子、表达盒、载体、药盒和方法 |
GB201103062D0 (en) * | 2011-02-22 | 2011-04-06 | Isis Innovation | Method |
US9249425B2 (en) | 2011-05-16 | 2016-02-02 | The Trustees Of The University Of Pennslyvania | Proviral plasmids and production of recombinant adeno-associated virus |
FR2977562B1 (fr) | 2011-07-06 | 2016-12-23 | Gaztransport Et Technigaz | Cuve etanche et thermiquement isolante integree dans une structure porteuse |
US9375491B2 (en) * | 2011-10-28 | 2016-06-28 | University Of Florida Research Foundation, Inc. | Chimeric promoter for cone photoreceptor targeted gene therapy |
WO2013086515A1 (en) * | 2011-12-09 | 2013-06-13 | The Johns Hopkins University | Compositions and methods for the prevention or treatment of diabetic complications |
EP2833892A4 (en) | 2012-04-02 | 2016-07-20 | Moderna Therapeutics Inc | MODIFIED POLYNUCLEOTIDES FOR THE PRODUCTION OF PROTEINS AND PEPTIDES ASSOCIATED WITH ONCOLOGY |
CN105120901A (zh) | 2012-07-11 | 2015-12-02 | 宾夕法尼亚大学托管会 | Rpgr x染色体连锁视网膜退化的aav介导的基因治疗 |
JP6129180B2 (ja) | 2012-08-08 | 2017-05-17 | 日本パーカライジング株式会社 | 金属表面処理液、金属基材の表面処理方法及びそれにより得られた金属基材 |
EP2954051B1 (en) | 2013-02-08 | 2019-03-27 | The Trustees Of The University Of Pennsylvania | Modified aav8 capsid for gene transfer for retinal therapies |
WO2014170480A1 (en) | 2013-04-18 | 2014-10-23 | Fondazione Telethon | Effective delivery of large genes by dual aav vectors |
JP6588008B2 (ja) * | 2013-05-16 | 2019-10-09 | アプライド ジェネティック テクノロジーズ コーポレイション | 1色覚および他の疾患の治療のためのプロモーター、発現カセット、ベクター、キット、ならびに方法 |
GB201322798D0 (en) * | 2013-12-20 | 2014-02-05 | Oxford Biomedica Ltd | Production system |
SG10201810150UA (en) | 2014-03-17 | 2018-12-28 | Adverum Biotechnologies Inc | Compositions and methods for enhanced gene expression in cone cells |
DK3132051T3 (da) * | 2014-04-15 | 2019-06-11 | Applied Genetic Tech Corporation | Kodon-optimeret nukleinsyre, der koder for en retinitis pigmentosa-gtpase-regulator (rpgr) |
US20160206704A1 (en) * | 2015-01-16 | 2016-07-21 | Isis Innovation Limited | Method |
RU2762747C2 (ru) * | 2015-12-14 | 2021-12-22 | Зе Трастис Оф Зе Юниверсити Оф Пенсильвания | Генная терапия офтальмологических нарушений |
-
2016
- 2016-12-13 RU RU2018125468A patent/RU2762747C2/ru active
- 2016-12-13 AU AU2016370487A patent/AU2016370487C1/en active Active
- 2016-12-13 ES ES16852859T patent/ES2826384T3/es active Active
- 2016-12-13 BR BR112018011838-9A patent/BR112018011838A2/pt active Search and Examination
- 2016-12-13 JP JP2018531202A patent/JP7057281B2/ja active Active
- 2016-12-13 WO PCT/US2016/066402 patent/WO2017106202A2/en active Application Filing
- 2016-12-13 MX MX2018007230A patent/MX2018007230A/es unknown
- 2016-12-13 EP EP16852859.4A patent/EP3389724B1/en active Active
- 2016-12-13 US US16/061,530 patent/US11090392B2/en active Active
- 2016-12-13 CA CA3008264A patent/CA3008264A1/en active Pending
- 2016-12-13 KR KR1020187019811A patent/KR20180099719A/ko not_active Application Discontinuation
- 2016-12-13 CN CN201680081801.2A patent/CN109069668B/zh active Active
- 2016-12-13 EP EP20183330.8A patent/EP3795180A1/en active Pending
-
2018
- 2018-06-13 MX MX2022010959A patent/MX2022010959A/es unknown
-
2019
- 2019-01-17 HK HK19100870.4A patent/HK1258518A1/zh unknown
-
2021
- 2021-07-07 US US17/369,525 patent/US20210330816A1/en active Pending
-
2022
- 2022-04-07 JP JP2022063749A patent/JP2022088656A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CA3008264A1 (en) | 2017-06-22 |
JP2022088656A (ja) | 2022-06-14 |
CN109069668A (zh) | 2018-12-21 |
MX2022010959A (es) | 2022-10-07 |
MX2018007230A (es) | 2018-11-09 |
AU2016370487C1 (en) | 2022-03-03 |
EP3389724B1 (en) | 2020-07-01 |
HK1258518A1 (zh) | 2019-11-15 |
WO2017106202A3 (en) | 2017-08-31 |
RU2018125468A3 (ko) | 2020-10-22 |
WO2017106202A2 (en) | 2017-06-22 |
AU2016370487A1 (en) | 2018-07-05 |
CN109069668B (zh) | 2023-04-18 |
US20210330816A1 (en) | 2021-10-28 |
EP3389724A2 (en) | 2018-10-24 |
BR112018011838A2 (pt) | 2018-12-04 |
RU2018125468A (ru) | 2020-01-16 |
JP2019502378A (ja) | 2019-01-31 |
ES2826384T3 (es) | 2021-05-18 |
US11090392B2 (en) | 2021-08-17 |
AU2016370487B2 (en) | 2021-08-05 |
US20200061209A1 (en) | 2020-02-27 |
JP7057281B2 (ja) | 2022-04-19 |
EP3795180A1 (en) | 2021-03-24 |
RU2762747C2 (ru) | 2021-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109069668B (zh) | 用于眼病的基因疗法 | |
AU2018211212B2 (en) | Treatment of amd using AAV sFlt-1 | |
AU2016202122B2 (en) | Nucleic acid molecules encoding novel herpes antigens, vaccine comprising the same, and methods of use thereof | |
KR101470472B1 (ko) | 장기 지속형 약물 제형 | |
KR20210068068A (ko) | 조작된 프로모터를 갖는 프라탁신 발현 구축물 및 그의 사용 방법 | |
KR20220006527A (ko) | 리소좀 장애에 대한 유전자 요법 | |
CN111733174B (zh) | 一种分离的核酸分子及其用途 | |
KR101591887B1 (ko) | 장기 지속형 약물 제형 | |
PT1984512T (pt) | Sistema de expressão génica utilizando excisão-união em insetos | |
US20220193262A1 (en) | High efficiency gene delivery system | |
CN114230677B (zh) | 含有猪瘟E2和圆环病毒的Cap的重组蛋白及其制备方法和应用 | |
KR102545070B1 (ko) | 안구 장애에 대한 유전자 치료 | |
CN111500635B (zh) | 一种包含携带核酸分子的载体的试剂盒 | |
KR20210049131A (ko) | 재조합 인간 II형 미토콘드리아 다이네인-유사 GTPase의 유전자 서열 및 이의 용도 | |
KR20210151785A (ko) | 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도 | |
CN112203697A (zh) | 编码氨基己糖苷酶alpha和beta亚基的双顺反子AAV载体及其用途 | |
CN113106124B (zh) | 表达cyp4v2的aav载体及其用途 | |
KR20230051529A (ko) | 리소좀 장애에 대한 유전자 요법 | |
RU2812852C2 (ru) | Невирусные днк-векторы и варианты их применения для экспрессии терапевтического средства на основе фактора viii (fviii) | |
CN116801912A (zh) | 表达载体组合物 | |
CN117304307A (zh) | 一种治疗新生血管相关眼底疾病的aav药物 | |
KR20240104196A (ko) | 안구 장애에 대한 유전자 치료 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal |