KR20220111294A - 키메라 옵신 gpcr 단백질 - Google Patents
키메라 옵신 gpcr 단백질 Download PDFInfo
- Publication number
- KR20220111294A KR20220111294A KR1020227021853A KR20227021853A KR20220111294A KR 20220111294 A KR20220111294 A KR 20220111294A KR 1020227021853 A KR1020227021853 A KR 1020227021853A KR 20227021853 A KR20227021853 A KR 20227021853A KR 20220111294 A KR20220111294 A KR 20220111294A
- Authority
- KR
- South Korea
- Prior art keywords
- opsin
- seq
- gpcr
- chimeric
- leu
- Prior art date
Links
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 claims abstract description 351
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 claims abstract description 346
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 180
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 177
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 144
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 144
- 210000000234 capsid Anatomy 0.000 claims abstract description 108
- 238000000034 method Methods 0.000 claims abstract description 75
- 239000013598 vector Substances 0.000 claims abstract description 69
- 108091006027 G proteins Proteins 0.000 claims abstract description 37
- 102000030782 GTP binding Human genes 0.000 claims abstract description 37
- 108091000058 GTP-Binding Proteins 0.000 claims abstract description 37
- 108050001704 Opsin Proteins 0.000 claims description 651
- 102000010175 Opsin Human genes 0.000 claims description 646
- 150000001413 amino acids Chemical class 0.000 claims description 134
- 210000004027 cell Anatomy 0.000 claims description 116
- 108090000623 proteins and genes Proteins 0.000 claims description 104
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 99
- 230000026792 palmitoylation Effects 0.000 claims description 96
- 102100025912 Melanopsin Human genes 0.000 claims description 82
- 108010005417 melanopsin Proteins 0.000 claims description 79
- 238000003776 cleavage reaction Methods 0.000 claims description 71
- 230000007017 scission Effects 0.000 claims description 71
- 102000004169 proteins and genes Human genes 0.000 claims description 70
- 230000003834 intracellular effect Effects 0.000 claims description 61
- 108700019146 Transgenes Proteins 0.000 claims description 45
- 210000001743 on-bipolar cell Anatomy 0.000 claims description 38
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 35
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 35
- 229920001184 polypeptide Polymers 0.000 claims description 34
- 210000004899 c-terminal region Anatomy 0.000 claims description 33
- 102100038300 Metabotropic glutamate receptor 6 Human genes 0.000 claims description 29
- NCYCYZXNIZJOKI-IOUUIBBYSA-N 11-cis-retinal Chemical compound O=C/C=C(\C)/C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C NCYCYZXNIZJOKI-IOUUIBBYSA-N 0.000 claims description 26
- 238000001415 gene therapy Methods 0.000 claims description 25
- 102000004330 Rhodopsin Human genes 0.000 claims description 24
- 108090000820 Rhodopsin Proteins 0.000 claims description 24
- 230000004913 activation Effects 0.000 claims description 24
- 239000012634 fragment Substances 0.000 claims description 24
- 238000011282 treatment Methods 0.000 claims description 24
- 230000009261 transgenic effect Effects 0.000 claims description 23
- 101001086405 Bos taurus Rhodopsin Proteins 0.000 claims description 20
- 108091008695 photoreceptors Proteins 0.000 claims description 18
- 241001465754 Metazoa Species 0.000 claims description 16
- 108010003730 Cone Opsins Proteins 0.000 claims description 15
- 101000598987 Homo sapiens Medium-wave-sensitive opsin 1 Proteins 0.000 claims description 15
- 102100037812 Medium-wave-sensitive opsin 1 Human genes 0.000 claims description 15
- 239000003814 drug Substances 0.000 claims description 15
- 230000002207 retinal effect Effects 0.000 claims description 13
- 238000010353 genetic engineering Methods 0.000 claims description 12
- 230000035772 mutation Effects 0.000 claims description 12
- 238000006467 substitution reaction Methods 0.000 claims description 12
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 11
- 201000004569 Blindness Diseases 0.000 claims description 11
- 108090000565 Capsid Proteins Proteins 0.000 claims description 11
- 102100023321 Ceruloplasmin Human genes 0.000 claims description 11
- 208000007014 Retinitis pigmentosa Diseases 0.000 claims description 11
- 238000012217 deletion Methods 0.000 claims description 11
- 230000037430 deletion Effects 0.000 claims description 11
- 239000002245 particle Substances 0.000 claims description 11
- 230000026731 phosphorylation Effects 0.000 claims description 11
- 238000006366 phosphorylation reaction Methods 0.000 claims description 11
- 102000005962 receptors Human genes 0.000 claims description 10
- 108020003175 receptors Proteins 0.000 claims description 10
- 108091006047 fluorescent proteins Proteins 0.000 claims description 9
- 102000034287 fluorescent proteins Human genes 0.000 claims description 9
- 108020001507 fusion proteins Proteins 0.000 claims description 9
- 102000037865 fusion proteins Human genes 0.000 claims description 9
- 102100039126 5-hydroxytryptamine receptor 7 Human genes 0.000 claims description 8
- 101710150237 5-hydroxytryptamine receptor 7 Proteins 0.000 claims description 8
- 241000702421 Dependoparvovirus Species 0.000 claims description 8
- 241000242583 Scyphozoa Species 0.000 claims description 8
- 230000007850 degeneration Effects 0.000 claims description 8
- 238000003780 insertion Methods 0.000 claims description 8
- 230000037431 insertion Effects 0.000 claims description 8
- 230000008172 membrane trafficking Effects 0.000 claims description 8
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 7
- 239000004473 Threonine Substances 0.000 claims description 7
- 230000004438 eyesight Effects 0.000 claims description 7
- 229960003692 gamma aminobutyric acid Drugs 0.000 claims description 7
- 239000002105 nanoparticle Substances 0.000 claims description 7
- 238000010453 CRISPR/Cas method Methods 0.000 claims description 6
- 108010063919 Glucagon Receptors Proteins 0.000 claims description 6
- 102100040890 Glucagon receptor Human genes 0.000 claims description 6
- 108010065028 Metabotropic Glutamate 5 Receptor Proteins 0.000 claims description 6
- 102100038357 Metabotropic glutamate receptor 5 Human genes 0.000 claims description 6
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 claims description 6
- 238000013160 medical therapy Methods 0.000 claims description 6
- 239000002773 nucleotide Substances 0.000 claims description 6
- 125000003729 nucleotide group Chemical group 0.000 claims description 6
- 238000002864 sequence alignment Methods 0.000 claims description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 5
- 101001137074 Homo sapiens Long-wave-sensitive opsin 1 Proteins 0.000 claims description 5
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims description 5
- 102100035576 Long-wave-sensitive opsin 1 Human genes 0.000 claims description 5
- 102000012740 beta Adrenergic Receptors Human genes 0.000 claims description 5
- 108010079452 beta Adrenergic Receptors Proteins 0.000 claims description 5
- 239000013604 expression vector Substances 0.000 claims description 5
- 230000006303 immediate early viral mRNA transcription Effects 0.000 claims description 5
- 230000002503 metabolic effect Effects 0.000 claims description 5
- 210000001116 retinal neuron Anatomy 0.000 claims description 5
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims description 5
- 108020001612 μ-opioid receptors Proteins 0.000 claims description 5
- 102000040125 5-hydroxytryptamine receptor family Human genes 0.000 claims description 4
- 108091032151 5-hydroxytryptamine receptor family Proteins 0.000 claims description 4
- 239000013607 AAV vector Substances 0.000 claims description 4
- 108010027915 Glutamate Receptors Proteins 0.000 claims description 4
- 102000018899 Glutamate Receptors Human genes 0.000 claims description 4
- 101000944277 Homo sapiens Inward rectifier potassium channel 2 Proteins 0.000 claims description 4
- 101001120990 Homo sapiens Short-wave-sensitive opsin 1 Proteins 0.000 claims description 4
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 4
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 4
- 102100025909 Opsin-3 Human genes 0.000 claims description 4
- 102100032646 Opsin-5 Human genes 0.000 claims description 4
- 102100026557 Short-wave-sensitive opsin 1 Human genes 0.000 claims description 4
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 4
- 230000001419 dependent effect Effects 0.000 claims description 4
- 210000004602 germ cell Anatomy 0.000 claims description 4
- 208000002780 macular degeneration Diseases 0.000 claims description 4
- 238000004519 manufacturing process Methods 0.000 claims description 4
- 239000011859 microparticle Substances 0.000 claims description 4
- 239000008194 pharmaceutical composition Substances 0.000 claims description 4
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 4
- 239000004474 valine Substances 0.000 claims description 4
- 210000002472 endoplasmic reticulum Anatomy 0.000 claims description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 claims description 3
- 239000010931 gold Substances 0.000 claims description 3
- 229910052737 gold Inorganic materials 0.000 claims description 3
- 108091008039 hormone receptors Proteins 0.000 claims description 3
- 230000006872 improvement Effects 0.000 claims description 3
- 102000051367 mu Opioid Receptors Human genes 0.000 claims description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 3
- 238000011830 transgenic mouse model Methods 0.000 claims description 3
- 241001655883 Adeno-associated virus - 1 Species 0.000 claims description 2
- 241000202702 Adeno-associated virus - 3 Species 0.000 claims description 2
- 241000580270 Adeno-associated virus - 4 Species 0.000 claims description 2
- 241001634120 Adeno-associated virus - 5 Species 0.000 claims description 2
- 241000972680 Adeno-associated virus - 6 Species 0.000 claims description 2
- 241001164823 Adeno-associated virus - 7 Species 0.000 claims description 2
- 241000649045 Adeno-associated virus 10 Species 0.000 claims description 2
- 241000649046 Adeno-associated virus 11 Species 0.000 claims description 2
- 241000649047 Adeno-associated virus 12 Species 0.000 claims description 2
- 101000720966 Homo sapiens Opsin-3 Proteins 0.000 claims description 2
- 101001086282 Homo sapiens Opsin-5 Proteins 0.000 claims description 2
- 102100033114 Inward rectifier potassium channel 2 Human genes 0.000 claims description 2
- 101710176225 Kallikrein-8 Proteins 0.000 claims description 2
- 108010010914 Metabotropic glutamate receptors Proteins 0.000 claims description 2
- 102000016193 Metabotropic glutamate receptors Human genes 0.000 claims description 2
- 101710130961 Opsin-3 Proteins 0.000 claims description 2
- 101710131039 Opsin-5 Proteins 0.000 claims description 2
- 241000356457 Salticidae Species 0.000 claims description 2
- 102000016967 beta-1 Adrenergic Receptors Human genes 0.000 claims description 2
- 108010014494 beta-1 Adrenergic Receptors Proteins 0.000 claims description 2
- 102000016966 beta-2 Adrenergic Receptors Human genes 0.000 claims description 2
- 108010014499 beta-2 Adrenergic Receptors Proteins 0.000 claims description 2
- 102000016959 beta-3 Adrenergic Receptors Human genes 0.000 claims description 2
- 108010014502 beta-3 Adrenergic Receptors Proteins 0.000 claims description 2
- 210000003292 kidney cell Anatomy 0.000 claims description 2
- 102220032988 rs281865408 Human genes 0.000 claims description 2
- 210000000130 stem cell Anatomy 0.000 claims description 2
- 230000008685 targeting Effects 0.000 claims description 2
- 108010038450 metabotropic glutamate receptor 6 Proteins 0.000 claims 10
- 108091006116 chimeric peptides Proteins 0.000 claims 3
- 230000037361 pathway Effects 0.000 abstract description 5
- 230000006461 physiological response Effects 0.000 abstract description 4
- 239000000969 carrier Substances 0.000 abstract description 2
- 235000001014 amino acid Nutrition 0.000 description 125
- 229940024606 amino acid Drugs 0.000 description 87
- 125000003275 alpha amino acid group Chemical group 0.000 description 75
- 235000018102 proteins Nutrition 0.000 description 61
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 34
- 239000002299 complementary DNA Substances 0.000 description 34
- 230000000875 corresponding effect Effects 0.000 description 34
- 108010050848 glycylleucine Proteins 0.000 description 28
- 230000004044 response Effects 0.000 description 28
- 230000019491 signal transduction Effects 0.000 description 26
- 108010026333 seryl-proline Proteins 0.000 description 25
- 241001529936 Murinae Species 0.000 description 21
- 125000000539 amino acid group Chemical group 0.000 description 21
- 101001032837 Homo sapiens Metabotropic glutamate receptor 6 Proteins 0.000 description 19
- OGPKMBOPMDTEDM-IHRRRGAJSA-N Tyr-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N OGPKMBOPMDTEDM-IHRRRGAJSA-N 0.000 description 19
- 108020004414 DNA Proteins 0.000 description 18
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 18
- 230000002186 photoactivation Effects 0.000 description 17
- 108010070643 prolylglutamic acid Proteins 0.000 description 17
- 210000001525 retina Anatomy 0.000 description 17
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 16
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 16
- 108010025306 histidylleucine Proteins 0.000 description 16
- 108010061238 threonyl-glycine Proteins 0.000 description 16
- OQCPATDFWYYDDX-HGNGGELXSA-N Ala-Gln-His Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OQCPATDFWYYDDX-HGNGGELXSA-N 0.000 description 15
- 101800001415 Bri23 peptide Proteins 0.000 description 15
- 102400000107 C-terminal peptide Human genes 0.000 description 15
- 101800000655 C-terminal peptide Proteins 0.000 description 15
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 15
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 15
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 15
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 15
- 238000010276 construction Methods 0.000 description 15
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 15
- 108010083327 glycyl-prolyl-arginyl-valine Proteins 0.000 description 15
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 15
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 15
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 14
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 14
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 14
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 14
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 14
- 241000699670 Mus sp. Species 0.000 description 14
- 108010029485 Protein Isoforms Proteins 0.000 description 14
- 102000001708 Protein Isoforms Human genes 0.000 description 14
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 14
- 108010087924 alanylproline Proteins 0.000 description 14
- 108010013835 arginine glutamate Proteins 0.000 description 14
- 150000002632 lipids Chemical class 0.000 description 14
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 14
- KBAPKNDWAGVGTH-IGISWZIWSA-N Ile-Ile-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KBAPKNDWAGVGTH-IGISWZIWSA-N 0.000 description 13
- HGUUMQWGYCVPKG-DCAQKATOSA-N Leu-Pro-Cys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HGUUMQWGYCVPKG-DCAQKATOSA-N 0.000 description 13
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 13
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 13
- IPCSVZSSVZVIGE-UHFFFAOYSA-M hexadecanoate Chemical compound CCCCCCCCCCCCCCCC([O-])=O IPCSVZSSVZVIGE-UHFFFAOYSA-M 0.000 description 13
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 13
- 230000032258 transport Effects 0.000 description 13
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 12
- 102000034354 Gi proteins Human genes 0.000 description 12
- 108091006101 Gi proteins Proteins 0.000 description 12
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 12
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 12
- HWROAFGWPQUPTE-OSUNSFLBSA-N Met-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCSC)N HWROAFGWPQUPTE-OSUNSFLBSA-N 0.000 description 12
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 12
- 102100039174 Rod cGMP-specific 3',5'-cyclic phosphodiesterase subunit beta Human genes 0.000 description 12
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 12
- 108010070783 alanyltyrosine Proteins 0.000 description 12
- 108010068380 arginylarginine Proteins 0.000 description 12
- 108010071207 serylmethionine Proteins 0.000 description 12
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 11
- ILJQISGMGXRZQQ-IHRRRGAJSA-N Asp-Arg-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ILJQISGMGXRZQQ-IHRRRGAJSA-N 0.000 description 11
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 11
- ZFHXNNXMNLWKJH-HJPIBITLSA-N Cys-Tyr-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZFHXNNXMNLWKJH-HJPIBITLSA-N 0.000 description 11
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 11
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 11
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 11
- ALHULIGNEXGFRM-QWRGUYRKSA-N Phe-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=CC=C1 ALHULIGNEXGFRM-QWRGUYRKSA-N 0.000 description 11
- BWTKUQPNOMMKMA-FIRPJDEBSA-N Phe-Ile-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BWTKUQPNOMMKMA-FIRPJDEBSA-N 0.000 description 11
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 11
- QTDBZORPVYTRJU-KKXDTOCCSA-N Phe-Tyr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O QTDBZORPVYTRJU-KKXDTOCCSA-N 0.000 description 11
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 11
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 11
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 11
- SUEGAFMNTXXNLR-WFBYXXMGSA-N Trp-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O SUEGAFMNTXXNLR-WFBYXXMGSA-N 0.000 description 11
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 11
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 11
- 108010018625 phenylalanylarginine Proteins 0.000 description 11
- 108010079317 prolyl-tyrosine Proteins 0.000 description 11
- 108010078580 tyrosylleucine Proteins 0.000 description 11
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 10
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 10
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 10
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 10
- ALCAUWPAMLVUDB-FXQIFTODSA-N Glu-Gln-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ALCAUWPAMLVUDB-FXQIFTODSA-N 0.000 description 10
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 10
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 10
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 10
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 10
- ZVZRQKJOQQAFCF-ULQDDVLXSA-N Lys-Tyr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZVZRQKJOQQAFCF-ULQDDVLXSA-N 0.000 description 10
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 10
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 10
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 10
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 9
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 9
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 9
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 9
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 9
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 9
- YYLBXQJGWOQZOU-IHRRRGAJSA-N Cys-Phe-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N YYLBXQJGWOQZOU-IHRRRGAJSA-N 0.000 description 9
- LMPBBFWHCRURJD-LAEOZQHASA-N Gln-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LMPBBFWHCRURJD-LAEOZQHASA-N 0.000 description 9
- RWQCWSGOOOEGPB-FXQIFTODSA-N Gln-Ser-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O RWQCWSGOOOEGPB-FXQIFTODSA-N 0.000 description 9
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 9
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 9
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 9
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 9
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 9
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 9
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 9
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 9
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 9
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 9
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 9
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 9
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 9
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 9
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 9
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 9
- FIZZULTXMVEIAA-IHRRRGAJSA-N Met-Ser-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FIZZULTXMVEIAA-IHRRRGAJSA-N 0.000 description 9
- AXIOGMQCDYVTNY-ACRUOGEOSA-N Phe-Phe-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 AXIOGMQCDYVTNY-ACRUOGEOSA-N 0.000 description 9
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 9
- BUEIYHBJHCDAMI-UFYCRDLUSA-N Pro-Phe-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BUEIYHBJHCDAMI-UFYCRDLUSA-N 0.000 description 9
- CZCCVJUUWBMISW-FXQIFTODSA-N Pro-Ser-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O CZCCVJUUWBMISW-FXQIFTODSA-N 0.000 description 9
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 9
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 9
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 9
- STIAINRLUUKYKM-WFBYXXMGSA-N Ser-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 STIAINRLUUKYKM-WFBYXXMGSA-N 0.000 description 9
- TYIHBQYLIPJSIV-NYVOZVTQSA-N Ser-Trp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)NC(=O)[C@H](CO)N TYIHBQYLIPJSIV-NYVOZVTQSA-N 0.000 description 9
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 9
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 9
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 9
- FBQHKSPOIAFUEI-OWLDWWDNSA-N Thr-Trp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O FBQHKSPOIAFUEI-OWLDWWDNSA-N 0.000 description 9
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 9
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 9
- 238000007792 addition Methods 0.000 description 9
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 9
- 238000013461 design Methods 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 9
- 108010037389 glutamyl-cysteinyl-lysine Proteins 0.000 description 9
- 108010057821 leucylproline Proteins 0.000 description 9
- 230000011664 signaling Effects 0.000 description 9
- 108010080629 tryptophan-leucine Proteins 0.000 description 9
- HJGZVLLLBJLXFC-LSJOCFKGSA-N Ala-His-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O HJGZVLLLBJLXFC-LSJOCFKGSA-N 0.000 description 8
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 8
- OOBVTWHLKYJFJH-FXQIFTODSA-N Arg-Ala-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O OOBVTWHLKYJFJH-FXQIFTODSA-N 0.000 description 8
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 8
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 8
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 8
- LBSKYJOZIIOZIO-DCAQKATOSA-N Cys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N LBSKYJOZIIOZIO-DCAQKATOSA-N 0.000 description 8
- XWTGTTNUCCEFJI-UBHSHLNASA-N Cys-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N XWTGTTNUCCEFJI-UBHSHLNASA-N 0.000 description 8
- 101100122490 Drosophila melanogaster Galphaq gene Proteins 0.000 description 8
- IIMZHVKZBGSEKZ-SZMVWBNQSA-N Gln-Trp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O IIMZHVKZBGSEKZ-SZMVWBNQSA-N 0.000 description 8
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 8
- GQGAFTPXAPKSCF-WHFBIAKZSA-N Gly-Ala-Cys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O GQGAFTPXAPKSCF-WHFBIAKZSA-N 0.000 description 8
- XXGQRGQPGFYECI-WDSKDSINSA-N Gly-Cys-Glu Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(O)=O XXGQRGQPGFYECI-WDSKDSINSA-N 0.000 description 8
- COZMNNJEGNPDED-HOCLYGCPSA-N Gly-Val-Trp Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O COZMNNJEGNPDED-HOCLYGCPSA-N 0.000 description 8
- SNOUHRPNNCAOPI-SZMVWBNQSA-N Leu-Trp-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N SNOUHRPNNCAOPI-SZMVWBNQSA-N 0.000 description 8
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 8
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 8
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 8
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 8
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 8
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 8
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 8
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 8
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 8
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 8
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 8
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 8
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 8
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 8
- BCBFMJYTNKDALA-UFYCRDLUSA-N Val-Phe-Phe Chemical compound N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O BCBFMJYTNKDALA-UFYCRDLUSA-N 0.000 description 8
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 8
- 108010011559 alanylphenylalanine Proteins 0.000 description 8
- 210000000170 cell membrane Anatomy 0.000 description 8
- 108010054813 diprotin B Proteins 0.000 description 8
- 230000004927 fusion Effects 0.000 description 8
- 108010049041 glutamylalanine Proteins 0.000 description 8
- 108010085325 histidylproline Proteins 0.000 description 8
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 8
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 7
- RLHANKIRBONJBK-IHRRRGAJSA-N Asn-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N RLHANKIRBONJBK-IHRRRGAJSA-N 0.000 description 7
- 102100021277 Beta-secretase 2 Human genes 0.000 description 7
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 7
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 7
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 7
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 7
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 7
- VDTYRPWRWRCROL-UFYCRDLUSA-N Phe-Val-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VDTYRPWRWRCROL-UFYCRDLUSA-N 0.000 description 7
- WYKJENSCCRJLRC-ZDLURKLDSA-N Thr-Gly-Cys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)O WYKJENSCCRJLRC-ZDLURKLDSA-N 0.000 description 7
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 7
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 7
- ZLMFVXMJFIWIRE-FHWLQOOXSA-N Val-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](C(C)C)N ZLMFVXMJFIWIRE-FHWLQOOXSA-N 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 108010040030 histidinoalanine Proteins 0.000 description 7
- 230000004393 visual impairment Effects 0.000 description 7
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 6
- LBFXVAXPDOBRKU-LKTVYLICSA-N Ala-His-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LBFXVAXPDOBRKU-LKTVYLICSA-N 0.000 description 6
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 6
- TVUFMYKTYXTRPY-HERUPUMHSA-N Ala-Trp-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O TVUFMYKTYXTRPY-HERUPUMHSA-N 0.000 description 6
- XPBVBZPVNFIHOA-UVBJJODRSA-N Ala-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 XPBVBZPVNFIHOA-UVBJJODRSA-N 0.000 description 6
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 6
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 6
- 101710150190 Beta-secretase 2 Proteins 0.000 description 6
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 6
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 6
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 6
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 6
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 6
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 6
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 6
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 6
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 6
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 6
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 6
- TZLYIHDABYBOCJ-FXQIFTODSA-N Met-Asp-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O TZLYIHDABYBOCJ-FXQIFTODSA-N 0.000 description 6
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 6
- 241000699666 Mus <mouse, genus> Species 0.000 description 6
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 6
- IWZRODDWOSIXPZ-IRXDYDNUSA-N Phe-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 IWZRODDWOSIXPZ-IRXDYDNUSA-N 0.000 description 6
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 6
- KIGGUSRFHJCIEJ-DCAQKATOSA-N Pro-Asp-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O KIGGUSRFHJCIEJ-DCAQKATOSA-N 0.000 description 6
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 6
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 6
- DWUIECHTAMYEFL-XVYDVKMFSA-N Ser-Ala-His Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DWUIECHTAMYEFL-XVYDVKMFSA-N 0.000 description 6
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 6
- UQGAAZXSCGWMFU-UBHSHLNASA-N Ser-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N UQGAAZXSCGWMFU-UBHSHLNASA-N 0.000 description 6
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 6
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 6
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 6
- MHNHRNHJMXAVHZ-AAEUAGOBSA-N Trp-Asn-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N MHNHRNHJMXAVHZ-AAEUAGOBSA-N 0.000 description 6
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 6
- BZWUSZGQOILYEU-STECZYCISA-N Val-Ile-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BZWUSZGQOILYEU-STECZYCISA-N 0.000 description 6
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 6
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 6
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 6
- 108010068265 aspartyltyrosine Proteins 0.000 description 6
- 108010016616 cysteinylglycine Proteins 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 108010089804 glycyl-threonine Proteins 0.000 description 6
- 230000003993 interaction Effects 0.000 description 6
- 108010012058 leucyltyrosine Proteins 0.000 description 6
- 239000012528 membrane Substances 0.000 description 6
- 210000002569 neuron Anatomy 0.000 description 6
- 210000003994 retinal ganglion cell Anatomy 0.000 description 6
- 230000000638 stimulation Effects 0.000 description 6
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 5
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 5
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 5
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 5
- 101710197658 Capsid protein VP1 Proteins 0.000 description 5
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 5
- GMUYXHHJAGQHGB-TUBUOCAGSA-N Ile-Thr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMUYXHHJAGQHGB-TUBUOCAGSA-N 0.000 description 5
- 241000880493 Leptailurus serval Species 0.000 description 5
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 5
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 5
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 5
- 239000002262 Schiff base Substances 0.000 description 5
- 150000004753 Schiff bases Chemical class 0.000 description 5
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 5
- 102000036646 Signalosomes Human genes 0.000 description 5
- 108091007411 Signalosomes Proteins 0.000 description 5
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 5
- WLQRIHCMPFHGKP-PMVMPFDFSA-N Trp-Leu-Phe Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)CC(C)C)C(O)=O)C1=CC=CC=C1 WLQRIHCMPFHGKP-PMVMPFDFSA-N 0.000 description 5
- XGEUYEOEZYFHRL-KKXDTOCCSA-N Tyr-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XGEUYEOEZYFHRL-KKXDTOCCSA-N 0.000 description 5
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 5
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 230000000052 comparative effect Effects 0.000 description 5
- 230000001086 cytosolic effect Effects 0.000 description 5
- 210000001787 dendrite Anatomy 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 230000010189 intracellular transport Effects 0.000 description 5
- 239000003446 ligand Substances 0.000 description 5
- 208000018769 loss of vision Diseases 0.000 description 5
- 231100000864 loss of vision Toxicity 0.000 description 5
- 210000000608 photoreceptor cell Anatomy 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 230000001225 therapeutic effect Effects 0.000 description 5
- NCYCYZXNIZJOKI-HPNHMNAASA-N 11Z-retinal Natural products CC(=C/C=O)C=C/C=C(C)/C=C/C1=C(C)CCCC1(C)C NCYCYZXNIZJOKI-HPNHMNAASA-N 0.000 description 4
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 4
- VHEVVUZDDUCAKU-FXQIFTODSA-N Ala-Met-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O VHEVVUZDDUCAKU-FXQIFTODSA-N 0.000 description 4
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 4
- 241000239290 Araneae Species 0.000 description 4
- HULHGJZIZXCPLD-FXQIFTODSA-N Arg-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HULHGJZIZXCPLD-FXQIFTODSA-N 0.000 description 4
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 4
- PMEHKVHZQKJACS-PEFMBERDSA-N Asp-Gln-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PMEHKVHZQKJACS-PEFMBERDSA-N 0.000 description 4
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 4
- 241000242741 Cubozoa Species 0.000 description 4
- CVLIHKBUPSFRQP-WHFBIAKZSA-N Cys-Gly-Ala Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C)C(O)=O CVLIHKBUPSFRQP-WHFBIAKZSA-N 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 208000003098 Ganglion Cysts Diseases 0.000 description 4
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 4
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 4
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 108020005004 Guide RNA Proteins 0.000 description 4
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 4
- OBTMRGFRLJBSFI-GARJFASQSA-N His-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O OBTMRGFRLJBSFI-GARJFASQSA-N 0.000 description 4
- 101000720986 Homo sapiens Melanopsin Proteins 0.000 description 4
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 4
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 4
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 4
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 4
- HWMQRQIFVGEAPH-XIRDDKMYSA-N Leu-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 HWMQRQIFVGEAPH-XIRDDKMYSA-N 0.000 description 4
- 239000004472 Lysine Substances 0.000 description 4
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 4
- RSOMVHWMIAZNLE-HJWJTTGWSA-N Met-Phe-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSOMVHWMIAZNLE-HJWJTTGWSA-N 0.000 description 4
- 101000720987 Mus musculus Melanopsin Proteins 0.000 description 4
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 4
- KPEIBEPEUAZWNS-ULQDDVLXSA-N Phe-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KPEIBEPEUAZWNS-ULQDDVLXSA-N 0.000 description 4
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 4
- LNOWDSPAYBWJOR-PEDHHIEDSA-N Pro-Ile-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LNOWDSPAYBWJOR-PEDHHIEDSA-N 0.000 description 4
- WCNVGGZRTNHOOS-ULQDDVLXSA-N Pro-Lys-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O WCNVGGZRTNHOOS-ULQDDVLXSA-N 0.000 description 4
- OABLKWMLPUGEQK-JYJNAYRXSA-N Pro-Tyr-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O OABLKWMLPUGEQK-JYJNAYRXSA-N 0.000 description 4
- 101710118046 RNA-directed RNA polymerase Proteins 0.000 description 4
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 4
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 4
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 4
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 4
- QNBVFKZSSRYNFX-CUJWVEQBSA-N Ser-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N)O QNBVFKZSSRYNFX-CUJWVEQBSA-N 0.000 description 4
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 4
- 208000005400 Synovial Cyst Diseases 0.000 description 4
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 4
- NBIIPOKZPUGATB-BWBBJGPYSA-N Thr-Ser-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O NBIIPOKZPUGATB-BWBBJGPYSA-N 0.000 description 4
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 4
- ZOBLBMGJKVJVEV-BZSNNMDCSA-N Tyr-Lys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O ZOBLBMGJKVJVEV-BZSNNMDCSA-N 0.000 description 4
- JFAWZADYPRMRCO-UBHSHLNASA-N Val-Ala-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JFAWZADYPRMRCO-UBHSHLNASA-N 0.000 description 4
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 4
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 4
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 4
- 235000004279 alanine Nutrition 0.000 description 4
- 108010060035 arginylproline Proteins 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 108091036078 conserved sequence Proteins 0.000 description 4
- 229940088598 enzyme Drugs 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 230000004298 light response Effects 0.000 description 4
- 230000004807 localization Effects 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 108010048818 seryl-histidine Proteins 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 3
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 3
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 3
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 3
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 3
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 3
- LTDGPJKGJDIBQD-LAEOZQHASA-N Asn-Val-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LTDGPJKGJDIBQD-LAEOZQHASA-N 0.000 description 3
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 3
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 3
- 108091006146 Channels Proteins 0.000 description 3
- 102000034353 G alpha subunit Human genes 0.000 description 3
- 108091006099 G alpha subunit Proteins 0.000 description 3
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 3
- JXBZEDIQFFCHPZ-PEFMBERDSA-N Gln-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JXBZEDIQFFCHPZ-PEFMBERDSA-N 0.000 description 3
- GURIQZQSTBBHRV-SRVKXCTJSA-N Gln-Lys-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GURIQZQSTBBHRV-SRVKXCTJSA-N 0.000 description 3
- CMFBOXUBWMZZMD-BPUTZDHNSA-N Gln-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N CMFBOXUBWMZZMD-BPUTZDHNSA-N 0.000 description 3
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 3
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 3
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 3
- YOTHMZZSJKKEHZ-SZMVWBNQSA-N Glu-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCC(O)=O)=CNC2=C1 YOTHMZZSJKKEHZ-SZMVWBNQSA-N 0.000 description 3
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 3
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 3
- ONSARSFSJHTMFJ-STQMWFEESA-N Gly-Trp-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ONSARSFSJHTMFJ-STQMWFEESA-N 0.000 description 3
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 3
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 3
- UYNXBNHVWFNVIN-HJWJTTGWSA-N Ile-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 UYNXBNHVWFNVIN-HJWJTTGWSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 3
- WRLPVDVHNWSSCL-MELADBBJSA-N Leu-His-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N WRLPVDVHNWSSCL-MELADBBJSA-N 0.000 description 3
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 3
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 3
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 3
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 3
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 3
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 3
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 3
- WPTDJKDGICUFCP-XUXIUFHCSA-N Met-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCSC)N WPTDJKDGICUFCP-XUXIUFHCSA-N 0.000 description 3
- YIGCDRZMZNDENK-UNQGMJICSA-N Met-Thr-Phe Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YIGCDRZMZNDENK-UNQGMJICSA-N 0.000 description 3
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 3
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 3
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 3
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 3
- DHZOGDVYRQOGAC-BZSNNMDCSA-N Phe-Cys-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N DHZOGDVYRQOGAC-BZSNNMDCSA-N 0.000 description 3
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 3
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 3
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 3
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 3
- FGBLCMLXHRPVOF-IHRRRGAJSA-N Ser-Tyr-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FGBLCMLXHRPVOF-IHRRRGAJSA-N 0.000 description 3
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 3
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 3
- NQVDGKYAUHTCME-QTKMDUPCSA-N Thr-His-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O NQVDGKYAUHTCME-QTKMDUPCSA-N 0.000 description 3
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 3
- UGFSAPWZBROURT-IXOXFDKPSA-N Thr-Phe-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N)O UGFSAPWZBROURT-IXOXFDKPSA-N 0.000 description 3
- LKJCABTUFGTPPY-HJGDQZAQSA-N Thr-Pro-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O LKJCABTUFGTPPY-HJGDQZAQSA-N 0.000 description 3
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 3
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 3
- OHOVFPKXPZODHS-SJWGOKEGSA-N Tyr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OHOVFPKXPZODHS-SJWGOKEGSA-N 0.000 description 3
- BCOBSVIZMQXKFY-KKUMJFAQSA-N Tyr-Ser-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O BCOBSVIZMQXKFY-KKUMJFAQSA-N 0.000 description 3
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 3
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 3
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 235000009582 asparagine Nutrition 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- -1 eg mGluR6 Proteins 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 3
- 238000010304 firing Methods 0.000 description 3
- 238000010362 genome editing Methods 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 238000004020 luminiscence type Methods 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004806 packaging method and process Methods 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 108010077112 prolyl-proline Proteins 0.000 description 3
- 108010090894 prolylleucine Proteins 0.000 description 3
- 210000003569 retinal bipolar cell Anatomy 0.000 description 3
- 108010089087 soymetide-4 Proteins 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 2
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 2
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 2
- SHKGHIFSEAGTNL-DLOVCJGASA-N Ala-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 SHKGHIFSEAGTNL-DLOVCJGASA-N 0.000 description 2
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 2
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 2
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 2
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 2
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 2
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 2
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 2
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 2
- OMCKWYSDUQBYCN-FXQIFTODSA-N Ala-Ser-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O OMCKWYSDUQBYCN-FXQIFTODSA-N 0.000 description 2
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 2
- SFPRJVVDZNLUTG-OWLDWWDNSA-N Ala-Trp-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFPRJVVDZNLUTG-OWLDWWDNSA-N 0.000 description 2
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 2
- JVMKBJNSRZWDBO-FXQIFTODSA-N Arg-Cys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O JVMKBJNSRZWDBO-FXQIFTODSA-N 0.000 description 2
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 2
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 2
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 2
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 2
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 2
- FTMRPIVPSDVGCC-GUBZILKMSA-N Arg-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FTMRPIVPSDVGCC-GUBZILKMSA-N 0.000 description 2
- 102000003916 Arrestin Human genes 0.000 description 2
- 108090000328 Arrestin Proteins 0.000 description 2
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 2
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 2
- IPPFAOCLQSGHJV-WFBYXXMGSA-N Asn-Trp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O IPPFAOCLQSGHJV-WFBYXXMGSA-N 0.000 description 2
- SKQTXVZTCGSRJS-SRVKXCTJSA-N Asn-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O SKQTXVZTCGSRJS-SRVKXCTJSA-N 0.000 description 2
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 2
- RQYMKRMRZWJGHC-BQBZGAKWSA-N Asp-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N RQYMKRMRZWJGHC-BQBZGAKWSA-N 0.000 description 2
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 2
- 108091033409 CRISPR Proteins 0.000 description 2
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 2
- OHCQJHSOBUTRHG-KGGHGJDLSA-N FORSKOLIN Chemical compound O=C([C@@]12O)C[C@](C)(C=C)O[C@]1(C)[C@@H](OC(=O)C)[C@@H](O)[C@@H]1[C@]2(C)[C@@H](O)CCC1(C)C OHCQJHSOBUTRHG-KGGHGJDLSA-N 0.000 description 2
- 102000034355 G beta-gamma complex Human genes 0.000 description 2
- 108091006102 G beta-gamma complex Proteins 0.000 description 2
- 102100033063 G protein-activated inward rectifier potassium channel 1 Human genes 0.000 description 2
- 108010008959 G-Protein-Coupled Receptor Kinases Proteins 0.000 description 2
- 102000006575 G-Protein-Coupled Receptor Kinases Human genes 0.000 description 2
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 2
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 2
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 2
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 2
- OACPJRQRAHMQEQ-NHCYSSNCSA-N Gln-Val-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OACPJRQRAHMQEQ-NHCYSSNCSA-N 0.000 description 2
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 2
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 2
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 2
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 2
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 2
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 2
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 2
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 2
- NTOWAXLMQFKJPT-YUMQZZPRSA-N Gly-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN NTOWAXLMQFKJPT-YUMQZZPRSA-N 0.000 description 2
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 2
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 2
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 2
- DKJWUIYLMLUBDX-XPUUQOCRSA-N Gly-Val-Cys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O DKJWUIYLMLUBDX-XPUUQOCRSA-N 0.000 description 2
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- OMNVOTCFQQLEQU-CIUDSAMLSA-N His-Asn-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMNVOTCFQQLEQU-CIUDSAMLSA-N 0.000 description 2
- GUXQAPACZVVOKX-AVGNSLFASA-N His-Lys-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GUXQAPACZVVOKX-AVGNSLFASA-N 0.000 description 2
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 2
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 2
- YEKYGQZUBCRNGH-DCAQKATOSA-N His-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CO)C(=O)O YEKYGQZUBCRNGH-DCAQKATOSA-N 0.000 description 2
- FHKZHRMERJUXRJ-DCAQKATOSA-N His-Ser-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 FHKZHRMERJUXRJ-DCAQKATOSA-N 0.000 description 2
- 101000944266 Homo sapiens G protein-activated inward rectifier potassium channel 1 Proteins 0.000 description 2
- WUEIUSDAECDLQO-NAKRPEOUSA-N Ile-Ala-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)O)N WUEIUSDAECDLQO-NAKRPEOUSA-N 0.000 description 2
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 2
- DMSVBUWGDLYNLC-IAVJCBSLSA-N Ile-Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DMSVBUWGDLYNLC-IAVJCBSLSA-N 0.000 description 2
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 2
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 2
- WXLYNEHOGRYNFU-URLPEUOOSA-N Ile-Thr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N WXLYNEHOGRYNFU-URLPEUOOSA-N 0.000 description 2
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 2
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- KVRKAGGMEWNURO-CIUDSAMLSA-N Leu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N KVRKAGGMEWNURO-CIUDSAMLSA-N 0.000 description 2
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 2
- RIMMMMYKGIBOSN-DCAQKATOSA-N Leu-Asn-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O RIMMMMYKGIBOSN-DCAQKATOSA-N 0.000 description 2
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 2
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 2
- PPQRKXHCLYCBSP-IHRRRGAJSA-N Leu-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N PPQRKXHCLYCBSP-IHRRRGAJSA-N 0.000 description 2
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 2
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 2
- YESNGRDJQWDYLH-KKUMJFAQSA-N Leu-Phe-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YESNGRDJQWDYLH-KKUMJFAQSA-N 0.000 description 2
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 2
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 2
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 2
- 108010047357 Luminescent Proteins Proteins 0.000 description 2
- 102000006830 Luminescent Proteins Human genes 0.000 description 2
- BRSGXFITDXFMFF-IHRRRGAJSA-N Lys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N BRSGXFITDXFMFF-IHRRRGAJSA-N 0.000 description 2
- HGZHSNBZDOLMLH-DCAQKATOSA-N Lys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N HGZHSNBZDOLMLH-DCAQKATOSA-N 0.000 description 2
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 2
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 2
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 2
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 2
- KXYLFJIQDIMURW-IHPCNDPISA-N Lys-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCCN)=CNC2=C1 KXYLFJIQDIMURW-IHPCNDPISA-N 0.000 description 2
- BIWVMACFGZFIEB-VFAJRCTISA-N Lys-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCCN)N)O BIWVMACFGZFIEB-VFAJRCTISA-N 0.000 description 2
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 2
- CNAGWYQWQDMUGC-IHRRRGAJSA-N Met-Phe-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CNAGWYQWQDMUGC-IHRRRGAJSA-N 0.000 description 2
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 2
- UXJHNUBJSQQIOC-SZMVWBNQSA-N Met-Trp-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O UXJHNUBJSQQIOC-SZMVWBNQSA-N 0.000 description 2
- YHIPILPTUVMWQT-UHFFFAOYSA-N Oplophorus luciferin Chemical compound C1=CC(O)=CC=C1CC(C(N1C=C(N2)C=3C=CC(O)=CC=3)=O)=NC1=C2CC1=CC=CC=C1 YHIPILPTUVMWQT-UHFFFAOYSA-N 0.000 description 2
- 208000002193 Pain Diseases 0.000 description 2
- 101710159027 Parapinopsin Proteins 0.000 description 2
- LZDIENNKWVXJMX-JYJNAYRXSA-N Phe-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CC=CC=C1 LZDIENNKWVXJMX-JYJNAYRXSA-N 0.000 description 2
- VJLLEKDQJSMHRU-STQMWFEESA-N Phe-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O VJLLEKDQJSMHRU-STQMWFEESA-N 0.000 description 2
- FENSZYFJQOFSQR-FIRPJDEBSA-N Phe-Phe-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FENSZYFJQOFSQR-FIRPJDEBSA-N 0.000 description 2
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 2
- CDHURCQGUDNBMA-UBHSHLNASA-N Phe-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDHURCQGUDNBMA-UBHSHLNASA-N 0.000 description 2
- DXWNFNOPBYAFRM-IHRRRGAJSA-N Phe-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N DXWNFNOPBYAFRM-IHRRRGAJSA-N 0.000 description 2
- 206010034972 Photosensitivity reaction Diseases 0.000 description 2
- 102000004257 Potassium Channel Human genes 0.000 description 2
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 2
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 2
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 2
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 2
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 2
- QKWYXRPICJEQAJ-KJEVXHAQSA-N Pro-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@@H]2CCCN2)O QKWYXRPICJEQAJ-KJEVXHAQSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 201000007737 Retinal degeneration Diseases 0.000 description 2
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 2
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 2
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 2
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 2
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 2
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 2
- UGHCUDLCCVVIJR-VGDYDELISA-N Ser-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N UGHCUDLCCVVIJR-VGDYDELISA-N 0.000 description 2
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 2
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 2
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 2
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 2
- UJQVSMNQMQHVRY-KZVJFYERSA-N Thr-Met-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UJQVSMNQMQHVRY-KZVJFYERSA-N 0.000 description 2
- BDYBHQWMHYDRKJ-UNQGMJICSA-N Thr-Phe-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N)O BDYBHQWMHYDRKJ-UNQGMJICSA-N 0.000 description 2
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 2
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 2
- VZBWRZGNEPBRDE-HZUKXOBISA-N Trp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N VZBWRZGNEPBRDE-HZUKXOBISA-N 0.000 description 2
- BIJDDZBDSJLWJY-PJODQICGSA-N Trp-Ala-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O BIJDDZBDSJLWJY-PJODQICGSA-N 0.000 description 2
- FXHOCONKLLUOCF-WDSOQIARSA-N Trp-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N FXHOCONKLLUOCF-WDSOQIARSA-N 0.000 description 2
- NECCMBOBBANRIT-RNXOBYDBSA-N Trp-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NECCMBOBBANRIT-RNXOBYDBSA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 2
- BVDHHLMIZFCAAU-BZSNNMDCSA-N Tyr-Cys-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BVDHHLMIZFCAAU-BZSNNMDCSA-N 0.000 description 2
- AVFGBGGRZOKSFS-KJEVXHAQSA-N Tyr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O AVFGBGGRZOKSFS-KJEVXHAQSA-N 0.000 description 2
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 2
- MDXLPNRXCFOBTL-BZSNNMDCSA-N Tyr-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MDXLPNRXCFOBTL-BZSNNMDCSA-N 0.000 description 2
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 2
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 2
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 2
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 2
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 2
- FRUYSSRPJXNRRB-GUBZILKMSA-N Val-Cys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FRUYSSRPJXNRRB-GUBZILKMSA-N 0.000 description 2
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 2
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 2
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 2
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 2
- MJOUSKQHAIARKI-JYJNAYRXSA-N Val-Phe-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 MJOUSKQHAIARKI-JYJNAYRXSA-N 0.000 description 2
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 2
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000036982 action potential Effects 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 239000007975 buffered saline Substances 0.000 description 2
- 210000004900 c-terminal fragment Anatomy 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 108010069495 cysteinyltyrosine Proteins 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 238000000586 desensitisation Methods 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 238000001476 gene delivery Methods 0.000 description 2
- 229930195712 glutamate Natural products 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-L glutamate group Chemical group N[C@@H](CCC(=O)[O-])C(=O)[O-] WHUUTDBJXJRKMK-VKHMYHEASA-L 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 2
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 210000004326 gyrus cinguli Anatomy 0.000 description 2
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 238000000126 in silico method Methods 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 230000003278 mimic effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000009126 molecular therapy Methods 0.000 description 2
- 238000001668 nucleic acid synthesis Methods 0.000 description 2
- 230000000144 pharmacologic effect Effects 0.000 description 2
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 2
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 2
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 2
- 230000036211 photosensitivity Effects 0.000 description 2
- 230000035790 physiological processes and functions Effects 0.000 description 2
- 108020001213 potassium channel Proteins 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 210000002763 pyramidal cell Anatomy 0.000 description 2
- 239000013608 rAAV vector Substances 0.000 description 2
- 239000013646 rAAV2 vector Substances 0.000 description 2
- 230000011514 reflex Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000004258 retinal degeneration Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000000087 stabilizing effect Effects 0.000 description 2
- 230000004960 subcellular localization Effects 0.000 description 2
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 230000004304 visual acuity Effects 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- DDOQBQRIEWHWBT-VKHMYHEASA-N (2S)-2-amino-4-phosphonobutanoic acid Chemical compound OC(=O)[C@@H](N)CCP(O)(O)=O DDOQBQRIEWHWBT-VKHMYHEASA-N 0.000 description 1
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 1
- PKOHVHWNGUHYRE-ZFWWWQNUSA-N (2s)-1-[2-[[(2s)-2-amino-3-(1h-indol-3-yl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)NCC(=O)N1CCC[C@H]1C(O)=O PKOHVHWNGUHYRE-ZFWWWQNUSA-N 0.000 description 1
- SCPRYBYMKVYVND-UHFFFAOYSA-N 2-[[2-[[1-(2-amino-4-methylpentanoyl)pyrrolidine-2-carbonyl]amino]-4-methylpentanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(O)=O SCPRYBYMKVYVND-UHFFFAOYSA-N 0.000 description 1
- 108091005436 5-HT7 receptors Proteins 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- JYEBJTDTPNKQJG-FXQIFTODSA-N Ala-Asn-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N JYEBJTDTPNKQJG-FXQIFTODSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- ISCYZXFOCXWUJU-KZVJFYERSA-N Ala-Thr-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O ISCYZXFOCXWUJU-KZVJFYERSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 208000019901 Anxiety disease Diseases 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- BQBPFMNVOWDLHO-XIRDDKMYSA-N Arg-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N BQBPFMNVOWDLHO-XIRDDKMYSA-N 0.000 description 1
- CRCCTGPNZUCAHE-DCAQKATOSA-N Arg-His-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 CRCCTGPNZUCAHE-DCAQKATOSA-N 0.000 description 1
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- ZEBDYGZVMMKZNB-SRVKXCTJSA-N Arg-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCN=C(N)N)N ZEBDYGZVMMKZNB-SRVKXCTJSA-N 0.000 description 1
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 1
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 1
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 1
- ISJWBVIYRBAXEB-CIUDSAMLSA-N Arg-Ser-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISJWBVIYRBAXEB-CIUDSAMLSA-N 0.000 description 1
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 1
- ZCSHHTFOZULVLN-SZMVWBNQSA-N Arg-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 ZCSHHTFOZULVLN-SZMVWBNQSA-N 0.000 description 1
- 108050003620 Arrestin-C Proteins 0.000 description 1
- 102100026440 Arrestin-C Human genes 0.000 description 1
- CIBWFJFMOBIFTE-CIUDSAMLSA-N Asn-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N CIBWFJFMOBIFTE-CIUDSAMLSA-N 0.000 description 1
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 1
- SNAKIVFVLVUCKB-UHFFFAOYSA-N Asn-Glu-Ala-Lys Natural products NCCCCC(C(O)=O)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(N)CC(N)=O SNAKIVFVLVUCKB-UHFFFAOYSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- PTSDPWIHOYMRGR-UGYAYLCHSA-N Asn-Ile-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O PTSDPWIHOYMRGR-UGYAYLCHSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- UPAGTDJAORYMEC-VHWLVUOQSA-N Asn-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)N)N UPAGTDJAORYMEC-VHWLVUOQSA-N 0.000 description 1
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 1
- XLDMSQYOYXINSZ-QXEWZRGKSA-N Asn-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLDMSQYOYXINSZ-QXEWZRGKSA-N 0.000 description 1
- OEDJQRXNDRUGEU-SRVKXCTJSA-N Asp-Leu-His Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O OEDJQRXNDRUGEU-SRVKXCTJSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 230000005724 C-terminal phosphorylation Effects 0.000 description 1
- 238000011740 C57BL/6 mouse Methods 0.000 description 1
- 102100033868 Cannabinoid receptor 1 Human genes 0.000 description 1
- 101710187010 Cannabinoid receptor 1 Proteins 0.000 description 1
- 101150044789 Cap gene Proteins 0.000 description 1
- 108091005462 Cation channels Proteins 0.000 description 1
- 238000001353 Chip-sequencing Methods 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- JIVJXVJMOBVCJF-ZLUOBGJFSA-N Cys-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)C(=O)N JIVJXVJMOBVCJF-ZLUOBGJFSA-N 0.000 description 1
- OXFOKRAFNYSREH-BJDJZHNGSA-N Cys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CS)N OXFOKRAFNYSREH-BJDJZHNGSA-N 0.000 description 1
- DYBIDOHFRRUMLW-CIUDSAMLSA-N Cys-Leu-Cys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CS)C(O)=O DYBIDOHFRRUMLW-CIUDSAMLSA-N 0.000 description 1
- SUZLHDUTVMZSEV-UHFFFAOYSA-N Deoxycoleonol Natural products C12C(=O)CC(C)(C=C)OC2(C)C(OC(=O)C)C(O)C2C1(C)C(O)CCC2(C)C SUZLHDUTVMZSEV-UHFFFAOYSA-N 0.000 description 1
- 108091008898 G protein-coupled receptors class A orphans Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- WOACHWLUOFZLGJ-GUBZILKMSA-N Gln-Arg-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O WOACHWLUOFZLGJ-GUBZILKMSA-N 0.000 description 1
- MINZLORERLNSPP-ACZMJKKPSA-N Gln-Asn-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N MINZLORERLNSPP-ACZMJKKPSA-N 0.000 description 1
- JKGHMESJHRTHIC-SIUGBPQLSA-N Gln-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JKGHMESJHRTHIC-SIUGBPQLSA-N 0.000 description 1
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 1
- RONJIBWTGKVKFY-HTUGSXCWSA-N Gln-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O RONJIBWTGKVKFY-HTUGSXCWSA-N 0.000 description 1
- GTBXHETZPUURJE-KKUMJFAQSA-N Gln-Tyr-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GTBXHETZPUURJE-KKUMJFAQSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- SYDJILXOZNEEDK-XIRDDKMYSA-N Glu-Arg-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SYDJILXOZNEEDK-XIRDDKMYSA-N 0.000 description 1
- ISXJHXGYMJKXOI-GUBZILKMSA-N Glu-Cys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O ISXJHXGYMJKXOI-GUBZILKMSA-N 0.000 description 1
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- 102100022758 Glutamate receptor ionotropic, kainate 2 Human genes 0.000 description 1
- 101710112360 Glutamate receptor ionotropic, kainate 2 Proteins 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- HFXJIZNEXNIZIJ-BQBZGAKWSA-N Gly-Glu-Gln Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFXJIZNEXNIZIJ-BQBZGAKWSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- JPAACTMBBBGAAR-HOTGVXAUSA-N Gly-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)CC(C)C)C(O)=O)=CNC2=C1 JPAACTMBBBGAAR-HOTGVXAUSA-N 0.000 description 1
- RVGMVLVBDRQVKB-UWVGGRQHSA-N Gly-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN RVGMVLVBDRQVKB-UWVGGRQHSA-N 0.000 description 1
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 1
- IXHQLZIWBCQBLQ-STQMWFEESA-N Gly-Pro-Phe Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IXHQLZIWBCQBLQ-STQMWFEESA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 1
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- YOSQCYUFZGPIPC-PBCZWWQYSA-N His-Asp-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YOSQCYUFZGPIPC-PBCZWWQYSA-N 0.000 description 1
- OHOXVDFVRDGFND-YUMQZZPRSA-N His-Cys-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CS)C(=O)NCC(O)=O OHOXVDFVRDGFND-YUMQZZPRSA-N 0.000 description 1
- MPXGJGBXCRQQJE-MXAVVETBSA-N His-Ile-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O MPXGJGBXCRQQJE-MXAVVETBSA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 1
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 1
- PGXZHYYGOPKYKM-IHRRRGAJSA-N His-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CCCCN)C(=O)O PGXZHYYGOPKYKM-IHRRRGAJSA-N 0.000 description 1
- UWSMZKRTOZEGDD-CUJWVEQBSA-N His-Thr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O UWSMZKRTOZEGDD-CUJWVEQBSA-N 0.000 description 1
- ZHMZWSFQRUGLEC-JYJNAYRXSA-N His-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZHMZWSFQRUGLEC-JYJNAYRXSA-N 0.000 description 1
- 101001137060 Homo sapiens Oligophrenin-1 Proteins 0.000 description 1
- 101000829506 Homo sapiens Rhodopsin kinase GRK1 Proteins 0.000 description 1
- 101000844510 Homo sapiens Transient receptor potential cation channel subfamily M member 1 Proteins 0.000 description 1
- 241000235789 Hyperoartia Species 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- ZXIGYKICRDFISM-DJFWLOJKSA-N Ile-His-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZXIGYKICRDFISM-DJFWLOJKSA-N 0.000 description 1
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 1
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 1
- WSSGUVAKYCQSCT-XUXIUFHCSA-N Ile-Met-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)O)N WSSGUVAKYCQSCT-XUXIUFHCSA-N 0.000 description 1
- KTTMFLSBTNBAHL-MXAVVETBSA-N Ile-Phe-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N KTTMFLSBTNBAHL-MXAVVETBSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- OAQJOXZPGHTJNA-NGTWOADLSA-N Ile-Trp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N OAQJOXZPGHTJNA-NGTWOADLSA-N 0.000 description 1
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 1
- 102000004310 Ion Channels Human genes 0.000 description 1
- 108090000862 Ion Channels Proteins 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 241000405718 Lethenteron camtschaticum Species 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 1
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 1
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 1
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- NJMXCOOEFLMZSR-AVGNSLFASA-N Leu-Met-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O NJMXCOOEFLMZSR-AVGNSLFASA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- 102300060141 Melanopsin isoform 1 Human genes 0.000 description 1
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 1
- OBVHKUFUDCPZDW-JYJNAYRXSA-N Met-Arg-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OBVHKUFUDCPZDW-JYJNAYRXSA-N 0.000 description 1
- XGIQKEAKUSPCBU-SRVKXCTJSA-N Met-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCSC)N XGIQKEAKUSPCBU-SRVKXCTJSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- 101100259948 Mus musculus Tbata gene Proteins 0.000 description 1
- 108091007491 NSP3 Papain-like protease domains Proteins 0.000 description 1
- 102100035592 Oligophrenin-1 Human genes 0.000 description 1
- 102000003840 Opioid Receptors Human genes 0.000 description 1
- 108090000137 Opioid Receptors Proteins 0.000 description 1
- 235000021314 Palmitic acid Nutrition 0.000 description 1
- 108090000526 Papain Proteins 0.000 description 1
- MDHZEOMXGNBSIL-DLOVCJGASA-N Phe-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MDHZEOMXGNBSIL-DLOVCJGASA-N 0.000 description 1
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 1
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 1
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 1
- KIAWKQJTSGRCSA-AVGNSLFASA-N Phe-Asn-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KIAWKQJTSGRCSA-AVGNSLFASA-N 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- HPECNYCQLSVCHH-BZSNNMDCSA-N Phe-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N HPECNYCQLSVCHH-BZSNNMDCSA-N 0.000 description 1
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 1
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 1
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 1
- MRWOVVNKSXXLRP-IHPCNDPISA-N Phe-Ser-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MRWOVVNKSXXLRP-IHPCNDPISA-N 0.000 description 1
- VGTJSEYTVMAASM-RPTUDFQQSA-N Phe-Thr-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VGTJSEYTVMAASM-RPTUDFQQSA-N 0.000 description 1
- 206010034960 Photophobia Diseases 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- NOXSEHJOXCWRHK-DCAQKATOSA-N Pro-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 NOXSEHJOXCWRHK-DCAQKATOSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- NFLNBHLMLYALOO-DCAQKATOSA-N Pro-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 NFLNBHLMLYALOO-DCAQKATOSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- IALSFJSONJZBKB-HRCADAONSA-N Pro-Tyr-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N3CCC[C@@H]3C(=O)O IALSFJSONJZBKB-HRCADAONSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 102100023742 Rhodopsin kinase GRK1 Human genes 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 1
- GVIGVIOEYBOTCB-XIRDDKMYSA-N Ser-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC(C)C)C(O)=O)=CNC2=C1 GVIGVIOEYBOTCB-XIRDDKMYSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 1
- UYLKOSODXYSWMQ-XGEHTFHBSA-N Ser-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N)O UYLKOSODXYSWMQ-XGEHTFHBSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- OJFFAQFRCVPHNN-JYBASQMISA-N Ser-Thr-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OJFFAQFRCVPHNN-JYBASQMISA-N 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 102000003617 TRPM1 Human genes 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- DGOJNGCGEYOBKN-BWBBJGPYSA-N Thr-Cys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)O DGOJNGCGEYOBKN-BWBBJGPYSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- XNTVWRJTUIOGQO-RHYQMDGZSA-N Thr-Met-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNTVWRJTUIOGQO-RHYQMDGZSA-N 0.000 description 1
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 1
- YGZWVPBHYABGLT-KJEVXHAQSA-N Thr-Pro-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YGZWVPBHYABGLT-KJEVXHAQSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- OFCKFBGRYHOKFP-IHPCNDPISA-N Trp-Asp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N OFCKFBGRYHOKFP-IHPCNDPISA-N 0.000 description 1
- XZLHHHYSWIYXHD-XIRDDKMYSA-N Trp-Gln-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XZLHHHYSWIYXHD-XIRDDKMYSA-N 0.000 description 1
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 1
- MEZCXKYMMQJRDE-PMVMPFDFSA-N Trp-Leu-Tyr Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)CC(C)C)C(O)=O)C1=CC=C(O)C=C1 MEZCXKYMMQJRDE-PMVMPFDFSA-N 0.000 description 1
- ADMHZNPMMVKGJW-BPUTZDHNSA-N Trp-Ser-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N ADMHZNPMMVKGJW-BPUTZDHNSA-N 0.000 description 1
- SDNVRAKIJVKAGS-LKTVYLICSA-N Tyr-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N SDNVRAKIJVKAGS-LKTVYLICSA-N 0.000 description 1
- NSOMQRHZMJMZIE-GVARAGBVSA-N Tyr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NSOMQRHZMJMZIE-GVARAGBVSA-N 0.000 description 1
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 1
- AXWBYOVVDRBOGU-SIUGBPQLSA-N Tyr-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N AXWBYOVVDRBOGU-SIUGBPQLSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- FGVFBDZSGQTYQX-UFYCRDLUSA-N Tyr-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O FGVFBDZSGQTYQX-UFYCRDLUSA-N 0.000 description 1
- YYLHVUCSTXXKBS-IHRRRGAJSA-N Tyr-Pro-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YYLHVUCSTXXKBS-IHRRRGAJSA-N 0.000 description 1
- VYQQQIRHIFALGE-UWJYBYFXSA-N Tyr-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VYQQQIRHIFALGE-UWJYBYFXSA-N 0.000 description 1
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 1
- LYPKCSYAKLTBHJ-ILWGZMRPSA-N Tyr-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CC=C(C=C4)O)N)C(=O)O LYPKCSYAKLTBHJ-ILWGZMRPSA-N 0.000 description 1
- NVJCMGGZHOJNBU-UFYCRDLUSA-N Tyr-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N NVJCMGGZHOJNBU-UFYCRDLUSA-N 0.000 description 1
- 101150024766 VP1 gene Proteins 0.000 description 1
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 1
- PYPZMFDMCCWNST-NAKRPEOUSA-N Val-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N PYPZMFDMCCWNST-NAKRPEOUSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- BMOFUVHDBROBSE-DCAQKATOSA-N Val-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N BMOFUVHDBROBSE-DCAQKATOSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- IRAUYEAFPFPVND-UVBJJODRSA-N Val-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 IRAUYEAFPFPVND-UVBJJODRSA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 1
- ODUHAIXFXFACDY-SRVKXCTJSA-N Val-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C ODUHAIXFXFACDY-SRVKXCTJSA-N 0.000 description 1
- 101710096684 Vertebrate ancient opsin Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241001492404 Woodchuck hepatitis virus Species 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 102000030621 adenylate cyclase Human genes 0.000 description 1
- 108060000200 adenylate cyclase Proteins 0.000 description 1
- 239000003463 adsorbent Substances 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 101150010487 are gene Proteins 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 210000003050 axon Anatomy 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 238000005415 bioluminescence Methods 0.000 description 1
- 230000029918 bioluminescence Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000021164 cell adhesion Effects 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000001886 ciliary effect Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- OHCQJHSOBUTRHG-UHFFFAOYSA-N colforsin Natural products OC12C(=O)CC(C)(C=C)OC1(C)C(OC(=O)C)C(O)C1C2(C)C(O)CCC1(C)C OHCQJHSOBUTRHG-UHFFFAOYSA-N 0.000 description 1
- 230000004456 color vision Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001054 cortical effect Effects 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 108010004073 cysteinylcysteine Proteins 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000003412 degenerative effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001152 differential interference contrast microscopy Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 230000007159 enucleation Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000004424 eye movement Effects 0.000 description 1
- 238000002073 fluorescence micrograph Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000007306 functionalization reaction Methods 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 230000005283 ground state Effects 0.000 description 1
- 230000004886 head movement Effects 0.000 description 1
- 102000034345 heterotrimeric G proteins Human genes 0.000 description 1
- 108091006093 heterotrimeric G proteins Proteins 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000004377 improving vision Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 230000031700 light absorption Effects 0.000 description 1
- 208000013469 light sensitivity Diseases 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 229940127554 medical product Drugs 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 238000001000 micrograph Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 210000004165 myocardium Anatomy 0.000 description 1
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 1
- 208000004296 neuralgia Diseases 0.000 description 1
- 230000004007 neuromodulation Effects 0.000 description 1
- 208000021722 neuropathic pain Diseases 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000003565 oculomotor Effects 0.000 description 1
- 238000001543 one-way ANOVA Methods 0.000 description 1
- 229940005483 opioid analgesics Drugs 0.000 description 1
- 229940055729 papain Drugs 0.000 description 1
- 235000019834 papain Nutrition 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 238000007699 photoisomerization reaction Methods 0.000 description 1
- 230000016732 phototransduction Effects 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000026447 protein localization Effects 0.000 description 1
- 230000029983 protein stabilization Effects 0.000 description 1
- 238000000455 protein structure prediction Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000013647 rAAV8 vector Substances 0.000 description 1
- 239000000018 receptor agonist Substances 0.000 description 1
- 229940044601 receptor agonist Drugs 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000021907 regulation of circadian rhythm Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000004243 retinal function Effects 0.000 description 1
- 210000000844 retinal pigment epithelial cell Anatomy 0.000 description 1
- 210000002508 rod bipolar cell Anatomy 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 230000000862 serotonergic effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000007781 signaling event Effects 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 238000012421 spiking Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 108700004896 tripeptide FEG Proteins 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 230000004382 visual function Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 210000004127 vitreous body Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/28—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/72—Receptors; Cell surface antigens; Cell surface determinants for hormones
- C07K14/723—G protein coupled receptor, e.g. TSHR-thyrotropin-receptor, LH/hCG receptor, FSH receptor
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/177—Receptors; Cell surface antigens; Cell surface determinants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0008—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
- A61K48/0025—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid
- A61K48/0033—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid the non-active part being non-polymeric
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0066—Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/02—Ophthalmic agents
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/52—Cytokines; Lymphokines; Interferons
- C07K14/54—Interleukins [IL]
- C07K14/5403—IL-3
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/52—Cytokines; Lymphokines; Interferons
- C07K14/54—Interleukins [IL]
- C07K14/545—IL-1
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/52—Cytokines; Lymphokines; Interferons
- C07K14/54—Interleukins [IL]
- C07K14/55—IL-2
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/03—Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/60—Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/007—Vector systems having a special element relevant for transcription cell cycle specific enhancer/promoter combination
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Toxicology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Epidemiology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Ophthalmology & Optometry (AREA)
- Cell Biology (AREA)
- Endocrinology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Virology (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicinal Preparation (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
강하게 발현하고 표적 세포의 정확한 세포 이하 구획 내로 표적화되는, 감광성 상류 옵신 부분 및 키메라 CT를 포함하는 표적 GPCR 부분을 포함하는 키메라 옵신 GPCR 단백질이 제공된다. 키메라 옵신 GPCR 단백질은 표적 GPCR 경로에 특이적인 천연 G 단백질을 효율적으로 활성화시켜 천연 표적 GPCR과 비슷한 생리학적 반응을 유도한다. 키메라 옵신 GPCR 단백질을 암호화하는 핵산 분자뿐만 아니라, 캡시드, 벡터, 키메라 옵신 GPCR 단백질을 포함하거나 발현하는 세포 및 운반체가 또한 제공된다. 또한, 키메라 옵신 GPCR 단백질을 유전자 조작하는 방법 및 키메라 옵신 GPCR 단백질의 의학적 적용이 제공된다.
Description
본 발명은 광유전학(optogenetics) 분야에 있으며, 추가의 감광성 키메라 옵신 GPCR 단백질을 도입한다. 특히, 본 발명은 감광성 옵신 및 추가의 GPCR 단백질을 포함하는 키메라 GPCR 단백질 및 이를 암호화하는 핵산 분자, 뿐만 아니라 이러한 핵산 분자를 조작하는 방법에 관한 것이다. 본 발명은 추가로 캡시드, 키메라 옵신 GPCR 또는 이를 암호화하는 핵산 분자를 포함하는 벡터 및 입자, 뿐만 아니라 키메라 옵신 GPCR 단백질의 의도적으로 선택된 신호전달 캐스케이드로의 광 활성화 및 결합(coupling)을 기반으로 하는 치료적 적용, 예를 들어, 의약 및 유전자 치료 방법에 관한 것이다. 본 발명은 특히 옵신-mGluR6 키메라 단백질 및 광수용체 변성으로 인한 시력 상실로 고통 받는 인간 또는 동물 환자의 유전자 치료 처치를 위한 이의 용도에 관한 것이다.
대략 3000명 중 1명은 광수용체 변성과 실명을 초래하는 유전적 돌연변이로 고통 받는다. 광수용체 손실에도 불구하고, 하류 망막 뉴런은 대체로 손상되지 않은 상태로 남아 있다. 최근 연구에 따르면 광수용체 손실 후 광 활성화 단백질을 살아 있는 망막 조직에 직접 도입하자 광 감도와 기능적 시력이 회복될 수 있었다(Lagali P.S. et al., 2008; van Wyk M et al., 2015; Cehajic-Kapetanovic J. et al. 2015).
WO 2012/174674는 mGluR6의 세포내 도메인을 포함하는 키메라 감광성 G 단백질 결합 수용체(G-protein coupled receptor, GPCR) 단백질을 개시한다. 이러한 키메라 GPCR 단백질 중 하나는 감광성 GPCR 멜라놉신 및 mGluR6의 IL2, IL3 및 CT를 포함하며, Opto-mGluR6이라고도 한다(van Wyk M et al., 2015). 유리하게는, Opto-mGluR6 단백질은 내인성 mGluR6 수용체의 광 활성화 버전이므로, 오로지 표적화된 ON 두극세포(bipolar cell)에 상재하는 천연 mGluR6 단백질인 G알파(o) G 단백질을 활성화시킴으로써, mGluR6 특이적 세포내 신호전달 캐스케이드에 광 활성화를 결합시킬 수 있다.
GPCR은 제약 산업의 주요 표적이다(Sriram P. et al, 2018). 선행 기술은 Opto-GPCR에 대한 Optogenetic 사용자 가이드(Kleinlogel S., 2016)에서 검토된 바와 같이, 또는 예를 들어, 오피오이드 신호전달 및 행동의 시공간적 제어(Siuda et al. 2015)를 위한 옵토(opto) MOR이라는 키메라 로돕신 MOPR 오피오이드 수용체 단백질과 함께 적용된 바와 같이, 표적-GPCR 특이적 G 단백질 신호전달 캐스케이드의 광학 활성화를 가능하게 하는 다른 접근법을 포함한다.
따라서, 기능적 활성 키메라 옵신 GPCR 단백질은 다음과 같은 이중 기능을 제공한다: 첫째, 이들은 광 활성화할 수 있다. 즉, 이들은 감광성 옵신 부분으로 인해 감광성이다. 둘째, 이들은 표적 GPCR 단백질의 GPCR 신호전달 경로에 광 활성화를 결합시킨다.
GPCR 단백질(G 단백질 결합 수용체 단백질, 줄여서 GPCR)은 인간 게놈에서 가장 큰 슈퍼패밀리의 수용체를 나타내며, 서열 상동성과 기능적 유사성을 기반으로 한 계통발생학적 분류의 GRAFS 체계에 따라 5개의 패밀리(또는 클래스)로 나뉜다(Schiφth, H.B. and Fredriksson R, 2005).
클래스 A는 가장 크고 가장 잘 이해된 GPCR 단백질 패밀리이다. 이는 또한 이의 "프로토타입"의 명칭을 따서 로돕신 패밀리로 명명되었다.
모든 패밀리의 GPCR은 고도로 보존된 3차 구조 및 유사한 활성화 모드를 공유한다: 모든 GPCR은 다양한 길이의 3개의 세포외 및 3개의 세포내 루프(EL 및 IL)에 의해 연결된 7개의 막관통 도메인(TM1 내지 TM7) 및 세포외 N 말단 도메인(NT) 및 세포내 C 말단 도메인(CT)을 포함한다.
또한, 대부분의 클래스 A GPCR 및 다른 GPCR 클래스 및 특히 클래스 C GPCR의 다수의 또는 심지어 대부분의 GPCR 단백질은 또한 7개의 막관통 나선(TM1 내지 TM7)에 추가하여 TM7의 하류에 8개의 나선(H8)을 포함한다(Bruno et al, 2012). H8은 막관통 나선이 아니라 GPCR의 CT의 근위 영역에 있는 CT의 서브도메인이다. 오히려, H8은 세포막의 세포질 표면에 평행하고 인접하게 놓여 있으며, 따라서 때때로 양쪽성 나선으로 지칭된다.
GPCR 수용체 단백질은 3개의 기능적 서브유닛, 즉 G-알파, G-베타 및 G-감마 서브유닛으로 구성된 이종삼량체 G 단백질과 생리학적으로 상호작용한다. G 단백질은 알파 서브유닛의 구조적 유사성과 이들이 유도하는 조절 반응의 유형에 기반하여 네 개의 서브패밀리, 즉, Gs, Gi/o, Gq/11 및 G12/13으로 분류되었다. 각 GPCR은 G 단백질의 한 서브패밀리에 우선적으로 결합하여, 우선적으로 하나의 신호전달 캐스케이드를 자극한다. GPCR 수용체와 G 단백질 사이의 구조적 상호작용은 예를 들어, Moreira I(2014)가 요약한 바와 같이 많은 연구의 주제였다. G 단백질의 네 가지 주요 클래스는 자체적으로 하위 클래스로 나뉜다. 예를 들어, 활성화된 단계의 mGluR6은 G알파(i/o)의 하위 클래스인 G알파(o)에 결합한다.
예시적인 모 옵신(parent optin)의 생리학적 세포 환경에 존재하는 예시적인 내인성 G 단백질은 멜라놉신의 경우 G(알파)q, 원추형 옵신의 경우 G(알파)t 및 해파리 옵신의 경우 G(알파)s이다.
놀랍게도, 유사한 3차원 구조에도 불구하고, 임의의 GPCR 패밀리의 구성원은 기능, 신호전달 및 3D 형태 안정성에 중요한 3개의 주요 GPCR 클래스 A, B 및 C의 구조적 정렬에 의해 확인된 몇 개의 보존된 아미노산과 짧은 모티프(Schwartz et al. 2006, Nygaard et al. 2013)를 제외하고는 다른 패밀리의 구성원과 실질적으로 서열 유사성을 나타내지 않는다(Kleinlogel, 2016).
지난 10년 동안, 도메인은 기능적 활성 키메라 GPCR 단백질의 몇 가지 예를 제공하는 두 개의 GPCR 사이, 특히 광 활성화 옵신-GPCR과 리간드 활성화 비옵신 GPCR 단백질 사이에서 교환되었다. 이러한 키메라 GPCR은 리간드 또는 특히 빛에 의해 활성화되는데, 이는 제1 GPCR 단백질의 특징이며, 이는 제2 GPCR 단백질의 특징인 G알파 단백질에 결합하여 이 신호 활성화를 제2 GPCR 단백질에 결합시킨다(Kleinlogel, 2016; Morri et al., 2018; Siuda et al., 2015). 이러한 도메인 교환은 서열 유사성이 없음에도 불구하고 GPCR 단백질의 서열 정렬 및 후술되는 보존된 모티프를 랜드마크로 사용하는 도메인 식별에 의해 가능하게 된다.
위에서 언급한 고도로 보존된 아미노산과 짧은 모티프 중 일부는 세포내 도메인과 막관통 도메인 사이의 접합부에 위치하며, 특히,
-
TM3과 IL2 사이의 접합부 (c)의 고도로 보존된 E(D)RY(서열번호 80) 모티프,
-
IL3과 TM6 사이의 접합부 (f)의 글루타메이트 잔기(E),
(이들은 GPCR의 비활성 상태를 안정화시키는 TM3과 TM6 사이에서 함께 "이온 잠금"을 형성함);
-
TM7과 CT의 근위 말단 사이, 특히 TM7과 나선 8(H8)의 근위 말단 사이의 접합부 (g)의 NPxxY 모티프(서열번호 81)가 그러하다.
TM3과 IL2의 접합부의 E(D)RY 부위와 IL3과 TM6의 접합부의 글루타메이트 잔기에 의해 형성된 TM3과 TM6 사이의 이온 잠금 및 TM7의 말단의 NPxxY 모티프는 신호에 반응하여, 예를 들어, 광 활성화 또는 리간드 결합에 의한 레티날의 광이성질화 시 재배열하여 GPCR 단백질의 활성화된 형태를 형성하는 중요한 구조적 제약을 제공한다(Fritze et al. 2003).
NR(K)Q(예를 들어, HPK 또는 HEP) 서열(서열번호 82)은 대부분의 GPCR, 특히 클래스 A 및 클래스 C GPCR의 CT의 근위 영역에서 H8의 근위 말단의 더 고도로 보존된 모티프이다. 종종 H8을 포함하는 CT의 NR(K)Q 모티프 및 근위 영역은 활성화(즉, 리간드 결합에 의해 또는 옵신의 경우 광 흡수에 의해 유발됨) 시, GPCR 단백질의 형태적 전환과 관련이 있는 것으로 보인다. 또한, CT의 NR(K)Q 모티프와 근위 영역은 GPCR 활성을 제어하기 위한 어레스틴 결합에 중요한 것으로 간주된다(예를 들어, Sato T, 2019).
키메라 옵신 GPCR 단백질은 7개의 막관통 도메인을 포함하고 특히 TM3의 원위 말단의 E(D)RY 모티프 및 TM7의 원위 말단의 NPxxY 모티프와 같은 고도로 보존된 모티프를 포함하는 GPCR 수용체 단백질의 고도로 보존된 3차 구조를 나타낸다.
추가로 부분적으로 보존된 구조적 요소와 모티프는 다음을 포함한다:
- 원위 방향으로 H8의 뒤를 직접 잇고, 소 로돕신의 C322 및 C323에 상응하는 하나 또는 두 개의 팔미토일화 부위(Ovchinnikov Yu A, 1988). 팔미트산에 연결된 아미노산 잔기의 공유 변형은 H8의 원위 말단이 막에 고정되게 한다. 대부분의 옵신에서 H8의 원위 말단의 시스테인 잔기는 팔미토일화되어 있다. H8의 원위 말단의 아미노산 잔기의 팔미토일화는 주로 GPCR 막 국소화, 지질 뗏목 모집 및 단백질 안정화에 관여하는 것으로 간주된다. 일부 예외적인 옵신, 예를 들어, 원추형 옵신 OPN1MW 및 OPN1LW는 H8의 원위 말단에 팔미토일화된 아미노산을 포함하지 않는다.
- 일반적으로 원위 방향으로 팔미토일화 부위를 지나서 위치하는 C 말단의 인산화 부위. 인산화 부위는 일반적으로 인산화된 세린 또는 트레오닌 또는 때때로 티로신 잔기를 나타낸다. 인산화 부위는 GPCR 수용체의 턴오버(turn-over)를 위한 탈감작 및 내재화에 관여한다. 이들은 또한 특히 G 단백질 신호전달의 동역학에 영향을 미치는 G 단백질 결합 수용체 키나제(GRK) 및 어레스틴과 같은 활성 조절자의 결합 선호도를 결정한다. 예를 들어, 멜라놉신은 다중 인산화 부위가 있는 특히 긴 C 말단을 가지고 있으며, 특히 일부 원위 인산화 부위는 일시계를 바꾸는 이 옵신의 시간적 통합 생리적 기능을 위해 신호 중단을 느리게 만드는 것으로 나타났다(Mure L. et al, 2016 참조).
옵신은 추가로 보존된 모티프를 포함한다. 특히, 발색단을 공유 결합시키기 위해 발색단 포켓에 두 개의 보존된 모티프가 존재한다. 모든 동물 옵신의 발색단은 11-시스-레티날이다. 발색단 포켓에는 고도로 보존된 두 개의 모티프가 있다:
-
Schiff 염기를 통해 발색단 11-시스-레티날에 공유 연결된 TM7의 보존된 리신(K),
-
11-시스-레티날의 Schiff 염기 결합을 안정화시키는 TM3의 음성 반대이온(E).
즉, 발색단 포켓은 발색단과 공유 결합하는 TM7의 리신 잔기인 Schiff 염기를 포함하고, TM3의 음성 반대이온을 추가로 포함한다.
생리적 기능의 회복 및 조절 또는 GPCR 수용체 활성의 조절과 같은 의료 요법에서의 사용에 특히 유리한 특성을 나타내도록 유전적으로 조작된 추가의 감광성 키메라 GPCR 단백질이 여전히 필요하다. 특히 유리한 특성은 예를 들어, 형태적 안정성, 생리학적으로 적합한 동역학 특성, 상당한 규모의 반응 및 표적 GPCR의 생리학적 국소화를 위한 효율적인 세포내 트래피킹(trafficking)을 포함한다.
또한, 추가 의료 적용을 위해 추가 표적 GPCR을 포함하는 감광성 옵신 GPCR 키메라에 대한 필요성이 여전히 존재한다. 추가 의료 적용에서 광 활성화 가능한 GPCR 수용체 단백질에 대한 원하는 치료 표적의 비제한적 예는 예를 들어, 통증, 심부전, 불안 또는 색각의 치료를 포함한다.
또한, 유전 공학에 의해 얻을 수 있는 기능적 활성 키메라 감광성 옵신 GPCR 단백질의 설계에 대한 추가 지침이 여전히 필요하다. 감광성 옵신 GPCR 단백질을 생성하는 간단하고 효율적인 유전 공학 방법은 유전자 요법에 의한 변성된 광수용체의 생리학적 회복뿐만 아니라, 추가 적용에 적합할 수 있는 다른 표적 GPCR 단백질의 활성 조작을 위해 여전히 요망된다.
따라서, 본 발명의 일반적인 목적은 위에서 언급된 바와 같은 이러한 요구를 충족시키고 옵신과 표적 GPCR 단백질이라고 하는 추가 GPCR 단백질 사이에 키메라 GPCR 단백질을 제공하는 것이다.
본 발명의 특정 목적은 예를 들어, 천연 광수용체에 의해 제공되는 감광성 신호전달 활성이 부족하거나 불충분하여, 부분 또는 완전 시력 상실 환자를 위한 유전자 요법에서의 사용에 대해 하나 이상의 특히 유리한 특성을 나타내는 추가 키메라 옵신 mGluR6 단백질을 제공하는 것이다.
본 발명의 특정 목적은 표적 세포에서의 효율적인 발현, 예컨대, 예를 들어, ON 두극세포에서 옵신-mGluR6 키메라의 효율적인 발현; 표적 세포에서 효율적이고 특이적인 세포내 분류, 예컨대, 예를 들어, ON 두극세포에서 mGluR6 시그널로솜(signalosome)으로 옵신-mGluR6 키메라의 수지상 트래피킹; 표적 세포의 천연 GPCR G 단백질 신호전달 경로로의 효율적인 결합, 예컨대, 예를 들어, 두극세포에서 Gαo에 결합; 형태적 안정성, 생리학적 동역학 및 낮은 탈감작으로 생리적 산출물을 생성하는 능력을 나타냄을 포함하는 하나 이상의 특정 바람직한 특성이 있는 키메라 옵신 GPCR 단백질을 조작하는 것이다.
본 발명의 추가 목적은 표적-GPCR 특이적 G 단백질 신호전달 캐스케이드의 광 활성화를 가능하게 하기 위해 임의의 표적 GPCR에 적용 가능한 키메라 옵신-GPCR 설계의 간단한 원리를 제공하는 것이다. 이 목적은 특히 세포의 생리학적 조작이나 유전자 치료 또는 기타 의학적 및 약리학적 적용에 사용하기 위해 키메라 옵신 GPCR 단백질을 설계하고 유전적으로 조작하기 위한 간단한 방법의 필요성을 해결한다.
본 발명의 추가 목적은 현재 약제로는 달성되지 않는 비할 데 없는 특이성을 갖는 치료적 GPCR 신호전달 경로를 재확립하거나 개선할 수 있도록 하는 특히 광유전학적 치료제에 사용하기 위한 키메라 옵신 GPCR에 의해 선택된 세포 반응을 조절하는 것이다.
본 발명의 이러한 목적의 비제한적인 예는 추가 키메라 옵신 GPCR, 예컨대, 예를 들어, 의약으로 사용하기 위한 키메라 옵신 오피오이드 수용체 GPCR, 키메라 옵신 하이드록시트립타민 수용체(HT) GPCR, 키메라 GABA(B) 수용체 및 키메라 옵신 베타 아드레날린 수용체 GPCR 단백질을 제공하는 것을 포함한다.
따라서, 본 발명의 목적은 설계된 키메라 옵신 GPCR 단백질을 암호화하는 유전적으로 조작된 핵산 분자, 키메라 옵신 GPCR 단백질을 암호화하는 융합 유전자를 포함하는 핵산 분자를 유전적으로 조작하고 발현시키는 방법, 뿐만 아니라 각각 키메라 옵신 GPCR 단백질 또는 이를 암호화하는 핵산 분자를 기반으로 하는 의학 제품, 특히, 유전자 치료제 및 방법을 제공하는 것을 추가로 포함한다.
설명이 진행됨에 따라 보다 쉽게 명백해질 본 발명의 이러한 목적 및 또 다른 목적을 구현하기 위해, 키메라 옵신 GPCR 단백질 및 이와 관련된 본 발명의 양태를 후술되는 특징에 의해 나타낸다.
본 발명의 제1 양태에서 키메라 옵신 GPCR 단백질이 제공된다:
키메라 옵신 GPCR 단백질은 다양한 길이의 세포외 및 세포내 루프(EL 및 IL)에 의해 연결된 7개의 막관통 도메인(TM1 내지 TM7)을 포함한다.
키메라 옵신 GPCR 단백질은 상류 옵신의 감광성 옵신 부분 및 표적 GPCR 단백질로 지칭되는 제2 GPCR 단백질의 표적 GPCR 부분으로 지칭되는 제2 GPCR 부분을 포함한다.
표적 GPCR 부분은 표적 GPCR(표적 GPCR CT, 또는 더 짧은 표적 CT)의 C 말단 도메인을 포함한다.
상류 옵신 부분은 발색단에 공유 결합하는 발색단 포켓을 포함한다.
상류 옵신 부분은 절단된 C 말단 도메인을 추가로 포함한다. 상류 옵신의 이러한 절단된 CT는 상류 옵신 CT의 근위 영역(O-CT-근위 영역)의 원위 말단 또는 그 하류에 위치하는 절단 부위를 갖는다.
이 O-CT-근위 영역은 NR(K)Q 모티프 및 원위 방향으로 그 다음의 7~13개의 아미노산을 포함하며,
상기 키메라 옵신 GPCR 단백질은 키메라 C 말단 도메인(키메라 CT)을 포함한다.
표적-GPCR-CT는 절단된 옵신 CT의 하류에 위치한다.
아래에서 더 자세히 설명하는 바와 같이, 대부분의 옵신의 CT의 근위 영역은 NR(K)Q 모티프로 시작하여 이의 하류에서 대략 7 내지 13개 아미노산의 아미노산 위치에서 끝나는 나선 8(H8)로 지칭되는 서브도메인을 포함한다. 최근에, G 단백질 결합 및 활성 조절에서 H8의 잠재적으로 중요한 역할은 구조적 데이터에 의해 표시되었다(Ahn et al., 2010, Sato, 2019, Tsai, et al., 2018). 다른 한편으로, G 단백질 결합 특이성은 본 발명자들이 발견한 바와 같이 CT의 더 원위 영역에 의해 조절된다. H8은 종종 하나 이상의 팔미토일화 부위에 의해 원위 말단에서 세포질막으로 고정된다. O-CT-근위 영역의 원위 말단은 NR(K)Q 모티프의 원위 말단 하류에 있는 대략 10개의 임의의 아미노산 위치, 즉 7 내지 13개 또는 8 내지 12개 또는 9 내지 11개의 아미노산 사이에 위치할 수 있다. 문헌에서, H8은 때때로 TM7과 CT 도메인 사이에 위치하는 추가 GPCR 도메인으로 간주되고 때로는 CT의 서브도메인으로 간주된다. 이 문서에서 H8은 CT의 서브도메인으로 지칭된다.
따라서, 일부 실시형태에서, O-CT 근위 영역의 원위 말단은 다음을 포함하는 군으로부터 선택되는 위치에 위치한다:
-
나선 8(H8)의 원위 말단
-
팔미토일화 부위 또는
-
소 로돕신의 팔미토일화 부위에 상응하는 위치.
제2 GPCR 단백질은 표적 GPCR로 지칭되는데, 이는 광 활성화 키메라 옵신 GPCR이 활성화를 더 이상 천연 옵신 신호전달 경로에 결합시키지 않고, 대신 유전자 조작에 의해 키메라 옵신의 설계 및 구축에 사용되는 의도적으로 선택된 표적 GPCR의 신호전달 경로에 결합시키기 때문이다.
본 발명자들은 표적 GPCR의 CT(표적-CT)와 함께 상류 옵신 CT의 근위 영역(O-CT-근위 영역)을 포함하는 C 말단 도메인이 키메라 옵신 GPCR 단백질을 표적 GPCR의 신호전달 캐스케이드로 효율적으로 결합시키기에 충분하다는 점을 예기치 않게 발견하였다. 이는 특히 표적 GPCR 단백질의 상응하는 특성을 모방하는 키메라 옵신 GPCR의 세포 이하(subcellular) 트래피킹, 반응 동역학, G 단백질 결합 특이성 및 세포내 결합 파트너와의 상호작용과 관련이 있다.
이는 O-CT-근위 영역의 원위 말단에 있는 팔미토일화 부위에서 절단되고 표적 CT와 함께 스플라이싱된 상류 옵신을 포함하는 키메라 옵신 GPCR에서 처음 관찰되었다.
절단된 상류 CT 및 표적 CT를 포함하는 키메라 옵신 GPCR 단백질, 즉 키메라 CT를 포함하는 키메라 옵신 GPCR 단백질이 표적 GPCR 단백질의 임의의 세포내 루프가 없는 경우에도 천연 표적 GPCR 단백질의 생리학적 반응에 상응하거나 이를 능가하는 반응으로 표적 GPCR의 신호전달 경로에 결합시킨다는 것은 대단히 놀라운 점이다. O-CT-근위 영역이 내장된 절단된 옵신 CT는 표적 CT에 의한 G 단백질 활성화 효율을 유의하게 증가시킨다.
본 발명의 옵신 GPCR 단백질은 광 활성화된 G 단백질 활성화를 증진시키기 위해 O-CT-근위 영역을 포함하도록 설계된다. 반면, 이들은 상류 옵신의 전체 CT를 포함하지 않도록 설계된다. 대신, O-CT-근위 영역에 대해 원위에 위치하고 세포 이하 트래피킹, 동역학 조절 및 - 본 발명에 제시된 바와 같이 - G 단백질 특이성에 관여하는 상류 옵신 CT 영역은 키메라 옵신 GPCR에서 제외된다. 즉, 키메라 옵신 GPCR의 표적 GPCR 부분만이 이러한 생리학적 활성을 유도하는 C 말단 영역을 포함한다. 이를 통해 상류 옵신 CT에서 파생된 분자 정보와 표적 GPCR CT의 간섭을 피할 수 있어 표적 GPCR에 관한 G 단백질 특이성, 세포 이하 국소화 특이성 및 동역학 조절이 증진된다. 따라서, 키메라 옵신 GPCR 단백질은 광 활성화 시 표적 GPCR의 반응을 모방하고 광 활성화는 표적 GPCR의 신호전달 캐스케이드에 효율적으로 결합된다.
표적 GPCR 단백질의 세포내 루프는 선택적으로 본 발명의 키메라 옵신 GPCR에 추가될 수 있지만, 이들이 필요한 것은 아니다. 따라서, 본 발명은 - 원하는 경우 - 표적 CT의 근위 말단과 함께 스플라이싱된 상류 옵신 CT의 절단 부위에서 단 하나의 단일 유전자 융합 부위를 사용하여 광 활성화 가능한 키메라 옵신 GPCR 단백질의 유전자 조작을 가능하게 한다.
따라서, 본 발명은 표적 세포의 정확한 세포 이하 구획에서 강력하게 발현시키고 표적 GPCR의 생리학적 반응을 모방하는 반응을 이끌어내는 표적 세포의 천연 G 단백질 경로를 효율적으로 활성화하는, 최소한의 유전자 조작만을 필요로 하는 추가 옵신 GPCR 키메라를 제공한다.
놀랍게도, 본원에 기술된 키메라 옵신 GPCR 단백질은 모든 세포내 루프가 없는 경우에도 예를 들어, opto-mGluR6(van Wyk et al. 2015)과 같은 선행 기술에서 이용 가능한 키메라 감광성 GPCR과 비교하여 표적 GPCR에 특이적인 생리학적 반응을 모방한다.
일부 실시형태에서, 표적 GPCR 단백질은 대사성 글루타메이트 수용체 6(mGluR6)이다. mGluR6은 건강한 생리학적 시각 신호전달 캐스케이드에서 글루타메이트에 의해 활성화되고 G알파(o) 단백질에 결합하여 시각 신호 캐스케이드에 활성화를 결합시키는 망막 ON 두극세포의 내인성 GPCR 단백질이다. ON 두극세포는 시각적 신호 캐스케이드에서 생리학적 광수용기 세포의 바로 하류에 있는 망막 뉴런이다.
본 발명의 제1 양태는 추가로 O-CT-근위 영역 및 표적 GPCR CT 또는 이의 기능적 변이체를 포함하는 키메라 C 말단 펩티드에 관한 것이다. 키메라 C 말단 펩티드의 일부 실시형태에서, 표적 GPCR CT의 이러한 기능적 변이체는 H8의 원위 말단 또는 팔미토일화 부위에 근위 말단을 갖는 표적 GPCR의 원위 C 말단 단편이다. 키메라 C 말단 펩티드의 일부 실시형태에서, C 말단 단편은 표적 GPCR CT의 H8을 추가로 포함한다.
본 발명의 제2 양태는 본 발명의 제1 양태에 따른 키메라 옵신 GPCR 단백질 및 키메라 C 말단 펩티드를 암호화하는 핵산 분자에 관한 것이다.
본 발명의 제3 양태는 제1 양태에 따른 키메라 옵신 GPCR을 암호화하는 제2 양태에 따른 핵산 분자를 표적 세포로 전달하기 위한 의학적 용도를 위한 AAV 캡시드에 관한 것이다. 제3 양태는 추가로 캡시드를 암호화하는 핵산 분자에 관한 것이다.
독립적인 발명은 표적 세포 및 캡시드를 암호화하는 핵산 분자로의 이식유전자의 패키징 및 수송을 위한 합리적으로 설계된 신규한 아데노 관련 바이러스(AAV) 캡시드에 관한 것이다. 독립적인 발명은 특히 키메라 옵신 GPCR을 암호화하는 핵산 분자를 표적 세포로 전달하는 것에 관한 것이다.
본 발명의 제4 양태는 본 발명의 제1 양태에 따른 키메라 옵신 GPCR 단백질 또는 키메라 C 말단 펩티드를 암호화하는 본 발명의 제2 양태에 따른 핵산 분자를 포함하는 벡터에 관한 것이다.
본 발명의 제5 양태는 제2 양태에 따른 핵산 분자를 포함하거나 발현하는 입자, 특히 나노 입자, 소포, 세포(특히 생식 세포는 제외) 및 동물, 또는 제3 양태에 따른 벡터 또는 본 발명의 제1 양태에 따른 키메라 옵신 GPCR을 포함하는 벡터에 관한 것이다.
본 발명의 제6 양태는 본 발명의 제1 양태의 키메라 옵신 GPCR 단백질을 암호화하는 제2 양태의 핵산 분자를 유전적으로 조작하는 방법에 관한 것이다.
본 발명의 제7 양태는 의학적 용도를 위한 본 발명에 따른 키메라 옵신 GPCR 단백질과 관련된 제품에 관한 것이다. 특히, 제7 양태는 제1 양태에 따른 키메라 옵신 GPCR 단백질, 또는 제2 양태에 따른 상기 옵신 GPCR 단백질을 암호화하는 핵산 분자, 또는 제3 양태에 따른 캡시드 또는 상기 캡시드를 암호화하는 핵산 분자, 또는 제4 양태에 따른 벡터, 또는 의료 요법에 사용하기 위한 입자, 소포 또는 세포에 관한 것이다. 제7 양태는 또한 본 발명에 따른 키메라 GPCR 단백질에 기반한 의약 및 위에서 언급된 제품을 사용하는 치료 방법에 관한 것이다.
본 발명의 위에서 언급된 양태의 일부 실시형태는 특히 2개의 옵신을 포함하는 키메라 옵신 mGluR6 단백질 또는 키메라 옵신 GPCR, 및 특히 광수용체 변성으로 인한 시력의 부분 또는 완전 상실로 고통 받는 환자의 유전자 요법을 위한 이의 용도에 관한 것이다.
다음의 상세한 설명을 고려할 때 본 발명은 더 잘 이해될 것이고 위에 기재된 것 이외의 목적이 명백해질 것이다. 이러한 설명은 첨부된 도면을 참조한다:
도 1: 옵신의 일반적인 구조.
도 2: 예시적인 키메라 옵신 GPCR의 도식.
도 3: 키메라 옵신 mGluR6의 예시적인 실시형태.
도 4: 키메라 옵신 GPCR의 예시적인 실시형태는 세포막을 표적으로 한다.
도 5: 키메라 C 말단을 갖는 키메라 옵신 mGluR6의 예시적인 실시형태는 모 옵신과 비교하여 옵신-mGluR6에 의해 매개되는 광 활성화 전류를 증가시켰다.
도 6: HEK-GIRK 세포를 사용한 키메라 옵신 GPCR의 시험관 내 기능적 스크리닝의 예.
도 7: 키메라 옵신 GPCR의 예시적인 실시형태의 G 단백질 재표적화 및 경로 선택성을 조사하는 플레이트 판독기 실험.
도 8: 키메라 옵신-mGluR6 변이체의 예시적인 실시형태의 ON-두극세포 수상돌기 및 mGluR6 시그널로솜으로의 올바른 생체 내 트래피킹.
도 9: 키메라 옵신-mGluR6 GPCR의 예시적인 실시형태는 단리된 ON-두극세포를 직접적으로 감광성으로 만든다.
도 10: 키메라 옵신 mGluR6 변이체의 예시적인 실시형태를 이용한 AAV 유전자 요법에 의해 치료된 시각장애 마우스의 생체 내 시력 측정.
도 11: 키메라 옵신-mGluR6의 예시적인 실시형태로 처리된 시각장애 rd1 망막의 망막 신경절 세포로부터 기록된 생체 외 광 반응.
도 12: 키메라 옵신-mGluR6의 예시적인 실시형태를 발현하는 AAV의 예시적인 실시형태를 사용한 유리체내 유전자 요법 후의 2개의 시각장애 rd1 망막으로부터의 망막을 통한 수직 동결절편의 현미경 사진.
도 13: HEK293-GIRK 세포에서 발현된 예시적인 JSR1(S186F)palm-beta2AR 키메라의 전체 세포 패치-클램프 방법으로 측정된 광 유도 전류.
도 1: 옵신의 일반적인 구조.
도 2: 예시적인 키메라 옵신 GPCR의 도식.
도 3: 키메라 옵신 mGluR6의 예시적인 실시형태.
도 4: 키메라 옵신 GPCR의 예시적인 실시형태는 세포막을 표적으로 한다.
도 5: 키메라 C 말단을 갖는 키메라 옵신 mGluR6의 예시적인 실시형태는 모 옵신과 비교하여 옵신-mGluR6에 의해 매개되는 광 활성화 전류를 증가시켰다.
도 6: HEK-GIRK 세포를 사용한 키메라 옵신 GPCR의 시험관 내 기능적 스크리닝의 예.
도 7: 키메라 옵신 GPCR의 예시적인 실시형태의 G 단백질 재표적화 및 경로 선택성을 조사하는 플레이트 판독기 실험.
도 8: 키메라 옵신-mGluR6 변이체의 예시적인 실시형태의 ON-두극세포 수상돌기 및 mGluR6 시그널로솜으로의 올바른 생체 내 트래피킹.
도 9: 키메라 옵신-mGluR6 GPCR의 예시적인 실시형태는 단리된 ON-두극세포를 직접적으로 감광성으로 만든다.
도 10: 키메라 옵신 mGluR6 변이체의 예시적인 실시형태를 이용한 AAV 유전자 요법에 의해 치료된 시각장애 마우스의 생체 내 시력 측정.
도 11: 키메라 옵신-mGluR6의 예시적인 실시형태로 처리된 시각장애 rd1 망막의 망막 신경절 세포로부터 기록된 생체 외 광 반응.
도 12: 키메라 옵신-mGluR6의 예시적인 실시형태를 발현하는 AAV의 예시적인 실시형태를 사용한 유리체내 유전자 요법 후의 2개의 시각장애 rd1 망막으로부터의 망막을 통한 수직 동결절편의 현미경 사진.
도 13: HEK293-GIRK 세포에서 발현된 예시적인 JSR1(S186F)palm-beta2AR 키메라의 전체 세포 패치-클램프 방법으로 측정된 광 유도 전류.
달리 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 분야의 당업자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 그 외에는, 본원에서 사용되는 특정 용어는 아래 설명에 기재된 의미를 갖는다.
본 명세서 및 청구범위에서 사용되는 단수 형태는 문맥에서 달리 명시하지 않는 한, 복수 형태를 포함한다.
달리 표시되지 않는 한, 일련의 요소 앞에 오는 "적어도"라는 용어는 계열의 모든 요소를 지칭하는 것으로 이해되어야 한다.
이 문서에서, "포함한다" 또는 "포함하는"이라는 용어는 명시된 요소 또는 단계 또는 요소 또는 단계의 집합을 포함하는 것으로 정의된다. 이 문서에서, "포함한다" 또는 "포함하는"이라는 용어는 일반적으로 임의의 다른 요소 또는 단계 또는 요소 또는 단계의 집합을 배제하지 않는다. 또한, 이 문서에서 "포함한다" 또는 "포함하는"이라는 용어는 또한 요소 또는 단계 또는 요소 또는 단계의 집합에 대한 정확한 서술과 관련이 있다. "포함한다" 또는 "포함하는"이라는 용어의 의미의 이 후자의 경우에만, 청구범위에 명시되지 않은 임의의 요소, 단계 또는 성분을 일반적으로 배제하는 용어 "구성되는"과 사실상 일치한다.
본 발명의 제1 양태는 키메라 옵신 GPCR 단백질에 관한 것이다. 제2 GPCR 단백질의 감광성 상류 옵신 부분 및 제2 GPCR 부분(표적-GPCR 부분)을 포함하는 "키메라 옵신 GPCR 단백질"이라는 어구는 전술한 바와 같이 GPCR 단백질 중 특징적인 보존된 구조인 3차 구조를 포함하는 감광성 유전자 조작 GPCR 단백질을 지칭한다. 키메라 옵신 GPCR 단백질 - 대안적으로 (키메라) 옵신 GPCR 수용체 또는 (키메라) 옵신 GPCR 또는 키메라 GPCR로 지칭됨 - 및 이를 암호화하는 키메라 핵산 분자 또는 키메라 (융합) 유전자는 특히 예를 들어, 모 유전자 절삭 및 선택된 모 유전자 부분의 결찰 또는 예를 들어, 키메라 옵신 GPCR 단백질 또는 이의 단편을 암호화하는 핵산 분자의 합성을 포함하는 당업계에 공지된 유전자 조작 기술에 의해 수득 가능하다. 상류 옵신 부분은 빛에 노출되면 키메라 GPCR 수용체에 광 감도와 활성화를 부여한다. 제2 GPCR 부분은 위에서 설명된 바와 같이 표적 GPCR의 생리학적 신호 경로에 특이적인 G 단백질에 대해 키메라 옵신 GPCR 단백질의 광 활성화를 결합시키기 때문에 표적 GPCR 부분으로 지칭된다. 예시적인 표적 GPCR은 예를 들어, β-아드레날린성 수용체, GABA(B) 수용체, MOR, 뮤 오피오이드 수용체, 5-HT7과 같은 세로토닌 수용체, OPN1과 같은 제2 옵신 및 mGluR6 또는 mGluR5와 같은 대사성 글루타메이트 수용체(mGluR)를 포함한다.
이 문서에서, 키메라 옵신 GPCR이 유래되는 옵신 및 표적 GPCR은 모 GPCR이라 지칭된다. 따라서, 예를 들어, 키메라 멜라놉신 mGluR6 단백질은 모 GPCR 멜라놉신 및 모 mGluR6의 부분을 사용하여 설계되고 조작된다. 문맥에서 알 수 있듯이, 모 GPCR이라는 용어는 모 GPRC 단백질 또는 모 GPCR 유전자 또는 둘 다를 지칭한다.
이 문서에서, GPCR 단백질이라는 용어는 G 단백질 결합 수용체 단백질을 지칭한다.
이 문서에서, "옵신"이라는 용어는 클래스 A GPCR 단백질의 감광성 구성원을 지칭하며, 특히 생리학적, 천연 옵신을 지칭한다. 일부 실시형태에서, 용어 "옵신"은 또한 기능적 활성, 즉, 아래에 추가로 기술되는 보존된 GPCR 3D 구조 및 보존된 모티프를 일반적으로 포함하는 천연 옵신의 변이체인 감광성 옵신을 포함할 수 있다. 이러한 유전적 옵신 변이체는 예를 들어, 돌연변이된 옵신 유전자 또는 유전적으로 조작된 유전자, 예를 들어 기능적인 감광성 옵신을 암호화하는 키메라 옵신 유전자로부터 유래된 핵산 분자에 의해 암호화된다.
유사하게, 용어 표적 GPCR은 일반적으로 생리학적, 자연 발생 표적 GPCR을 지칭하고, 일부 실시형태에서는 일반적으로 위에서 언급된 보존된 GPCR 3D 구조 및 보존된 모티프를 나타내고 기능적, 즉 표적 GPCR의 신호전달 경로에 활성화를 효율적으로 결합시킬 수 있는, mGluR6의 변이체와 같은 천연 표적 GPCR의 변이체를 지칭한다. 표적 GPCR의 이러한 변이체는 예를 들어, 돌연변이된 표적 GPCR 유전자 또는 유전적으로 조작된 유전자, 예를 들어 기능적 활성 표적 GPCR 단백질을 암호화하는 키메라 표적 GPCR 유전자로부터 유래된 핵산 분자에 의해 암호화된다.
따라서, 이 문서에서, 일부 실시형태에서 용어 도메인 또는 서브도메인은 GPCR 단백질의 생리학적 천연 도메인 외에 도메인 또는 서브도메인의 유전적 변이체, 예컨대, 예를 들어, 천연 GPCR 도메인 또는 서브도메인을 기능적으로 모방하는, 돌연변이된 또는 유전자 조작된, 예를 들어, 키메라 또는 합성 도메인 또는 서브도메인을 포함할 수 있다.
상류 옵신 부분의 각 도메인은 상류 옵신(상류 옵신 유전자) 또는 이의 유전적 변이체를 암호화하는 유전자로부터 유래된 유전자 단편에 의해 암호화된다. 표적 GPCR 부분의 각 도메인은 표적 GPCR 유전자 또는 이의 유전적 변이체로부터 유래된 유전자 단편에 의해 암호화된다. 함께 상류 옵신 유전자 단편에 의해 암호화되는 키메라 옵신 GPCR의 모든 도메인은 상류 옵신 부분으로 지칭되고 유사하게 함께 표적 GPCR 유전자 단편에 의해 암호화되는 모든 도메인 또는 서브도메인은 표적 GPCR 부분으로 지칭된다. 일부 실시형태에서, 상류 옵신 부분 및 또는 표적 GPCR 부분은 하나 이상, 특히 2 또는 3개의 모 유전자로부터 유래될 수 있다.
표적 GPCR은 임의의 GPCR 클래스, 특히 클래스 A, B 또는 C, 더욱 특별하게는 클래스 A 또는 C로부터 선택될 수 있다. 클래스 A의 예시적인 표적 GPCR은 예를 들어, 원추형 옵신, 세로토닌 수용체(예를 들어, 5-HT7), 뮤 오피오이드 또는 β-아드레날린성 수용체를 포함한다. 클래스 B의 예시적인 표적 GPCR은 예를 들어 글루카곤 수용체(GCGR) 및 기타 호르몬 수용체를 포함한다. 클래스 C의 예시적인 표적 GPCR은 예를 들어, 대사성 글루타메이트 수용체(mGluR, 예를 들어 mGluR6, mGluR5) 또는 GABAB 수용체)를 포함한다.
GPCR 단백질의 막관통 도메인과 세포내 도메인 사이 및 이에 따라 이를 암호화하는 유전자 단편 사이에는 도 1에 제시된 바와 같이 TM1과 IL1 사이의 접합부 (a), IL1과 TM2 사이의 접합부 (b), TM3과 IL2 사이의 접합부 (c) 등등 TM7과 CT 사이의 접합부 (g)까지로 지칭되는 전이부를 형성하는 6개의 접합부가 있다.
유사하게, GPCR 단백질의 막관통 도메인과 세포외 도메인 사이 및 이들을 암호화하는 유전자 단편의 사이에는 또한 도 2에 제시된 바와 같이 NT와 TM1 사이의 접합부 (A'), TM2와 EL1 사이의 접합부 (B'), EL1과 TM3 사이의 접합부 (C') 등등 EL3과 TM7 사이의 접합부 (G')까지로 지칭되는 전이부를 형성하는 6개의 접합부가 있다.
이 문서에서, 당업계에서 일반적으로 사용되는 "보존된 모티프"라는 용어는 정확히 동일한, 예를 들어, 특정 보존된 모티프를 지칭할 때 일반적으로 인용되는 3~5개의 아미노산으로 구성된 모티프로 제한되지 않는다. 오히려, 이러한 보존된 각 모티프는 예를 들어, 아래 표 1에 포함된 것과 같은 몇몇 대안을 나타내는 특히 빈번한 프로토타입 서열의 이름을 따서 명명된다.
또한, 기능적 변이체는 보존된 모티프에서 유래될 수 있다. 예를 들어, E(D)RY 모티프(ERY 및 DRY)의 기능적 변이체에는 DRIY(서열번호 83), NRIY(서열번호 84) 또는 NRY가 포함되며, 이들 모두는 감광성 옵신-mGluR6 키메라 GPCR을 생성한다(WO 2012/174674 참조). 보존된 모티프의 예시적인 기능적 변이체도 아래 표 2에 제시되어 있다.
분명히, 몇몇 보존된 모티프는 TM 도메인과 세포내 도메인 사이의 접합부 또는 그 주변에서, 즉, 막관통 나선(TM1 내지 TM7)과 세포내 루프(IL1 내지 IL3) 및 C 말단(CT) 사이의 접합부 또는 그 주변에서 발생한다. 그러나 모든 접합부가 고도로 보존된 모티프를 반드시 포함하는 것은 아니다.
이 문서에서, NPxxY 모티프라는 용어는 특히 모 상류 옵신 또는 모 표적 GPCR 또는 키메라 옵신 GPCR의, GPCR 단백질의 TM7의 원위 말단에 있는, 즉 TM7/CT 접합부 주변에 있는 보존된 모티프를 지칭하며, 다음의 기준 중 하나 이상을 충족함으로써 정의된다:
A)
이는 아미노산에 대한 한 문자 부호에 따른 서열 NPxxY의 5개의 연속적인 아미노산의 서열임(여기서 x는 임의의 아미노산 잔기에 상응함);
B)
이는 아래 표 I에 열거된 특정 GPCR의 NPxxY 모티프에 상응하는 서열임;
C)
이는 소 로돕신의 아미노산 서열과 모 GPCR, 특히 모 상류 옵신의 아미노산 서열의 정렬에서 소 로돕신의 N(302)PxxY(136)의 서열에 상응하는 5개 아미노산의 서열임.
NPxxY 모티프는 비록 상당한 서열 변이를 나타내지만(예를 들어, 문헌[Sato, 2019]의 표 2 참조) 모든 클래스 A GPCR과 대부분의 기타 GPCR에서 존재하고 식별 가능하다.
이 문서에서, NR(K)Q 모티프라는 용어는 GPCR 단백질, 특히 모 상류 옵신 또는 모 표적 GPCR 또는 키메라 옵신 GPCR 및 H8의 근위 말단 주변의 옵신 CT의 NPxxY 모티프에서 몇몇 아미노산 하류에 있는 CT의 근위 영역에 있는 보존된 모티프를 지칭하며, 다음의 기준 중 하나 또는 둘 다를 충족함으로써 정의된다:
A)
이는 특정 GPCR, 특히 표 1 또는 문헌[Davies et al. 2010]에 열거된 모 상류 옵신에 대한 NR(K)Q 모티프에 상응하는 서열임;
B)
이는 소 로돕신의 아미노산 서열과 모 GPCR, 특히 모 상류 옵신의 아미노산 서열의 정렬에서 소 로돕신의 N(310)KQ(312)의 서열에 상응하는 3 또는 4개의 연속적인 아미노산의 서열임.
NR(K)Q 모티프는 모든 클래스 A GPCR과 대부분의 기타 GPCR에서 존재하고 식별 가능하다. 특히, NR(K)Q 모티프는 상당한 서열 변이를 나타내지만, 소 로돕신과의 서열 정렬에 의해 식별 가능한 3 또는 4개의 연속적인 아미노산의 서열에 상응한다. NR(K)Q 모티프에는 HPK 또는 HPE 또는 HKQ 또는 HPR 또는 IRK 또는 DYK 등과 같은 서열이 포함된다(Davies W. et al., 2010).
이 문서에서, 용어 "팔미토일화 부위" 및 "팔미토일화 부위에 상응하는 아미노산 위치"(후자는 줄여서 팔미토일화 부위라고도 함)는 다음의 기준 A, B, C 및 D 중 하나 이상을 충족함으로써 정의된다. 특히, 팔미토일화 부위라는 용어는 하나의 기준, 예를 들어, A를 충족하거나, 또는 두 가지 기준 B 및 C 또는 B 및 D 또는 C 및 D 또는 세 가지 기준 B, C 및 D를 충족한다. 기준 A에서 D는 다음과 같다:
A)
이는 모 GPCR, 특히 모 옵신의 CT에 있는 팔미토일화 아미노산 잔기임;
B)
이는 모 GPCR, 특히 모 옵신의 CT에 있는 팔미토일화 가능한 아미노산 잔기로서, 아미노산 시스테인(C), 세린(S), 트레오닌(T), 티로신(Y) 또는 트립토판(W)으로부터 선택된 옵신의 NR(K)Q 모티프의 원위 말단의 하류에서 적어도 7개 아미노산, 특히 적어도 8 또는 9 또는 10 또는 11 또는 12 또는 13개 아미노산에 위치함;
C)
이는 모 GPCR, 특히 모 옵신의 CT에 있는 아미노산 잔기로서, NR(K)Q 모티프의 원위 말단의 하류에서 7 내지 13개 아미노산 잔기 사이, 특히 8 내지 12개 사이, 또는 9 내지 11개 사이 또는 10개 아미노산 잔기에 위치함;
D)
이는 소 로돕신과 모 GPCR, 특히 모 옵신의 아미노산 서열의 정렬에서 소 로돕신의 C322 또는 C323에 상응하는 아미노산 잔기임.
특히, 이 마지막 기준 D는 실제로 팔미토일화되지 않았지만 아미노산 서열 정렬에서 로돕신의 팔미토일화된 C322 및 C323에 상응하는 H8의 말단에 위치한 아미노산 잔기를 지칭한다. 예를 들어, 인간 원추형 옵신 hOPN1MW 및 hOPN1LW에서, 이러한 아미노산 위치는 아미노산 잔기 G338 및 K339에 상응한다.
H8의 원위 말단의 팔미토일화된 아미노산 잔기는 - 존재하는 경우 - H8의 막 결합을 유리하게 증진시킨다. 따라서, H8의 원위 말단에 하나 이상의 팔미토일화 부위를 갖는 상류 옵신을 포함하는 키메라 옵신 GPCR에서, 적어도 하나의 팔미토일화 부위는 가장 바람직하게는 절단된 상류 옵신 CT에 유지된다. 따라서, 이 문서에서 위의 기준 A 또는 B를 충족시키는 팔미토일화 부위의 절단 부위에 대한 언급은 달리 표시되지 않는 한 팔미토일화 부위에 말단으로 인접하게 위치한다.
이 문서에서, 단백질 및 핵산 분자의 맥락에서, 용어 하류 및 원위는 단백질의 C 말단 방향 또는 영역 및 핵산 분자의 3' 방향 또는 영역을 나타내는 반면, 용어 상류 및 근위는 단백질의 N 말단 방향 또는 영역 및 핵산 분자의 5' 방향 또는 영역을 나타낸다. ~의 하류 및 ~의 원위라는 용어와 이에 따른 ~의 상류 및 ~의 근위라는 용어도 상호 교환적으로 사용된다.
이 문서에서, 도메인, 서브도메인, 영역, 모티프 또는 부위의 상류(또는 근위)라는 용어는 근위쪽으로 인접한 위치를 포함하는 상기 도메인, 서브도메인, 영역, 모티프 또는 부위의 근위 말단의 상류(또는 근위)의 위치를 지칭한다.
이 문서에서, 도메인, 서브도메인, 영역, 모티프 또는 부위의 하류(또는 원위)라는 용어는 원위쪽으로 인접한 위치를 포함하는 상기 도메인, 서브도메인, 영역, 모티프 또는 부위의 원위 말단의 하류(또는 원위)의 위치를 지칭한다.
이 문서에서, 특정 도메인, 서브도메인, 영역, 모티프 또는 부위"에 있는"라는 어구는 상기 도메인, 서브도메인, 영역, 모티프 또는 부위 내의 위치를 지칭한다. 이 문서에서, 특정 모티프 또는 부위"에 있는 또는 이의 원위의"라는 어구는 상기 도메인, 서브도메인, 영역, 모티프 또는 부위 내의 위치 또는 이의 원위 위치를 지칭한다. "~에 있는 또는 이의 하류의", "~에 있는 또는 이의 근위의" 및 "~에 있는 또는 이의 상류의"라는 어구에 준용할 수 있다.
이 문서에서, 두 개의 특정 모티프 또는 부위 사이라는 어구, 예컨대, 예를 들어, NR(K)Q 모티프와 팔미토일화 부위 사이는 문맥에서 명시적으로 언급되거나 명백하지 않는 한, 원래 또는 기능적으로 동등한 버전으로 유지되거나 재구성되는 한 이러한 모티프 또는 부위 내의 아미노산 위치를 포함한다. 실제로, 2개의 보존된 모티프 또는 부위 사이 또는 보존된 모티프와 또 다른 아미노산 위치 사이의 스플라이싱 부위를 포함하는 일부 바람직한 실시형태에서, 바람직한 스플라이싱 부위는 보존된 모티프 내에 위치할 수 있으며, 스플라이싱 조작 완료 후에 보존된 모티프 또는 부위 또는 이의 기능적 등가물이 유지되거나 재구성된다.
이 문서에서, 도메인, 서브도메인, 영역, 모티프 또는 부위의 근위 말단에 있는 또는 상류 말단에 있는 이라는 어구는 근위(또는 상류) 말단에 있는 상기 도메인, 서브도메인, 영역, 모티프 또는 부위 내에 여전히 완전히 또는 부분적으로 존재하거나 또는 상기 도메인, 서브도메인, 영역, 모티프 또는 부위의 근위(또는 상류 말단)에 근위쪽으로 인접한 근위(또는 상류) 말단에서의 위치를 포함한다.
이 문서에서, 도메인, 서브도메인, 영역, 모티프 또는 부위의 원위 말단에 있는 또는 하류 말단에 있는 이라는 어구는 유사하게 원위(또는 하류 말단)에 있는 상기 도메인, 서브도메인, 영역, 모티프 또는 부위 내에 여전히 완전히 또는 부분적으로 존재하거나 또는 상기 도메인, 서브도메인, 영역, 모티프 또는 부위에 원위쪽으로 인접한 원위(또는 하류) 말단에서의 위치를 포함한다.
이 문서에서, 신호전달 경로의 맥락에서 상류 및 하류는 각각 이전 및 이후 단계에 관련된 경로 또는 세포 또는 구성요소의 이전 및 이후 단계를 지칭한다.
이 문서에서, (유전자) 스플라이싱 부위 및 (유전자) 융합 부위, 절단 부위 또는 절삭 및 결찰 부위와 같은 대안적 또는 유사한 용어는 상이한 기원의 유전자 단편, 특히 상이한 모 GPCR로부터 유래된 유전자 단편이 연결되는 부위를 지칭한다.
다르게 언급되지 않는 한, 유전자 조작의 종료 시 보존된 모티프 또는 부위에 위치한 유전자 스플라이싱 부위(융합 부위, 절삭 및 결찰 부위, 절단 부위)는 전술한 바와 같이 동일하거나 기능적으로 동등한 모티프 또는 설계를 유지하거나 재구성한다. 스플라이싱 부위가 특정 모티프, 부위 또는 아미노산 위치의 상류/근위 또는 하류/원위에 위치하는 것으로 정의되더라도, 상기 유전자 스플라이싱 부위는 완료된 유전자 조작(예를 들어, 절삭, 결찰, 절단 융합, 스플라이싱)의 결과로서 보존된 모티프 또는 아미노산이 복원되거나 예를 들어, 일부 실시형태에서, 보존적 아미노산 치환을 포함하는 전술한 바와 같은 이의 기능적 유도체에 의해 대체되는 경우 이러한 특정 모티프, 부위 또는 아미노산에 또는 그 내부에 위치할 수 있다.
이 문서에서, 당업계에서 일반적인 바와 같이 일반적으로 G알파(i/o)의 경우 G(i/o) 또는 G알파(o)의 경우 Ga(o) 또는 G알파(q)의 경우 Ga(q)의 패턴을 따르는 G 단백질 및 이들의 상응하는 G알파 서브유닛의 축약형이 사용될 수 있다.
이 문서에서, 변이체라는 용어는 참조 폴리펩티드와 상이하지만 본질적 특성을 유지하는 폴리펩티드 또는 이를 암호화하는 유전자를 지칭한다. 폴리펩티드의 전형적 변이체는 참조로 사용된 또 다른 폴리펩티드와 그 일차 아미노산 서열이 상이하다. 일반적으로, 차이는 참조 폴리펩티드 및 변이체의 서열이 전반적으로 밀접하게 유사하고, 여러 영역에서, 동일하도록 제한된다. 변이체 및 참조 폴리펩티드는 하나 이상의 변형(예를 들어, 치환, 부가, 및/또는 결실)에 의해 아미노산 서열이 상이할 수 있다. 폴리펩티드 변이체는 자연 발생, 예컨대 대립유전자 변이체일 수 있거나, 자연 발생하는 것으로 알려져 있지 않은 변이체일 수 있다. 즉, 변이체는 인위적으로 구축될 수 있다.
이 문서에서 아미노산 서열의 맥락에서 "서열 동일성 백분율", "~와 동일한 백분율", "유사성 백분율"이라는 어구는 아미노산 서열의 총 길이의 아미노산 잔기의 수와 비교하여 2개 이상의 정렬된 아미노산 서열의 동일한 아미노산 서열의 일치 수를 나타낸다. 따라서, 당업계에 공지된 서열 비교 알고리즘을 사용하여 측정 시 서열을 최대 상응성을 위해 비교하고 정렬하는 경우, 또는 특히 짧은 서열 모티프의 경우, 수동으로 정렬하고 시각적으로 검사하는 경우, 정렬을 사용하여, 2개 이상의 서열에 대해, 동일한 아미노산 잔기의 백분율(예를 들어, 아미노산 서열의 전장에 걸쳐 90%, 또는 95% 또는 100%의 동일성)을 결정할 수 있다. 따라서, 서열 동일성을 결정하기 위해 비교되는 서열은 아미노산의 치환(들), 부가(들) 또는 결실(들)에 의해 상이할 수 있다. 단백질 서열을 정렬하기 위한 적합한 프로그램은 당업계에 공지되어 있다.
비교를 위한 서열의 정렬은, 예를 들어, 문헌[Smith and Waterman, Adv. Appl. Math. 2:482 (1981)]의 국소 상동성 알고리즘, 문헌[Needleman 25 and Wunsch, J. Mol. Biol. 48:443 (1970)]의 전체 정렬 알고리즘, 문헌[Pearson and Lipman, Proc. Nat. Acad. Sci. 85:2444 (1988)]의 유사도 방법 검색 또는, CLUSTAL, 예를 들어, CLUSTALW, Clustal Omega, GAP, BESTFIT, BLAST, FASTA 및 TFASTA를 포함하지만, 이에 제한되지 않는 이러한 알고리즘의 컴퓨터 구현에 의해 수행될 수 있다. BLAST 분석을 수행하기 위한 소프트웨어는 예를 들어, 미국 국립 생명공학 정보 센터(National Center for Biotechnology - Information)를 통해 공개적으로 이용 가능하다(NCBI BLAST 알고리즘(Altschul SF, et al (1997), Nucleic Acids Res. 25:3389-3402, http://blast.ncbi.nlm.nih.gov/). 핵산 서열 비교를 위한 한 가지 예는 기본 설정을 사용하는 BLASTN 알고리즘이다: 예상 역치: 10; 워드 크기: 28; 쿼리 범위에서의 최대 일치: 0; 일치/불일치 점수: 1.-2; 갭 코스트: 선형. 달리 언급되지 않는 한, 본원에 제공된 서열 동일성 값은 각각 단백질 및 핵산 비교에 대해 위에서 확인된 35개의 기본 매개변수를 사용하여 BLAST 프로그램 제품군(문헌[Altschul et al., J. Mol. Biol. 215:403-410 (1990)])을 사용하여 얻은 값을 지칭한다.
이 문서에서 용어 보존적 아미노산 치환은 상응하는 참조와 예를 들어, 유사한 크기, 형상, 전하, 화학적 특성(예를 들어 공유 또는 수소 결합을 형성하는 능력 포함) 등 물리적, 생물학적, 화학적 또는 기능적으로 유사한 변형을 지칭한다.
예를 들어, 보존적 아미노산 치환은 아미노산 잔기가 동일한 측쇄 패밀리의 다른 아미노산 잔기로 대체되는 것을 포함하며, 예를 들어 세린이 트레오닌으로 치환될 수 있다. 아미노산 잔기는 일반적으로 다음과 같은 공통적이고 유사한 측쇄 특성에 따라 패밀리로 나뉜다:
1.
비극성 측쇄(예를 들어, 글리신, 알라닌, 발린, 류신, 이소류신, 메티오닌),
2.
하전되지 않은 극성 측쇄(예를 들어, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 프롤린, 시스테인, 트립토판),
3.
염기성 측쇄(예를 들어, 리신, 아르기닌, 히스티딘, 프롤린),
4.
산성 측쇄(예를 들어, 아스파르트산, 글루탐산),
5.
베타-분지 측쇄(예를 들어, 트레오닌, 발린, 이소류신), 및
6.
방향족 측쇄(예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘).
보존적 치환은 또한 비천연 아미노산의 사용을 포함할 수 있다.
이 문서에서 용어 "유사한 단백질 서열"은 정렬될 때 비교될 서열의 상응하는 위치에서 유사한 아미노산 잔기 및 가장 흔히 동일한 아미노산 잔기를 공유하는 것들이다. 유사한 아미노산 잔기는 측쇄의 화학적 특성에 따라 패밀리로 그룹화된다. 상기 패밀리는 "보존적 아미노산 치환"에 대해 전술되어 있다. 서열 간의 "유사성 백분율"은 비교될 서열의 상응하는 서열 위치에서 동일하거나 유사한 잔기를 함유하는 위치의 수를 비교되는 총 위치 수로 나누고 100%를 곱한 것이다. 예를 들어, 10개의 서열 위치 중 6개의 위치에 동일한 아미노산 잔기가 있고 10개의 위치 중 2개의 위치에 유사한 잔기가 포함되어 있으면, 서열은 80% 유사성을 갖는다. 두 서열 간의 유사성은 예를 들어 EMBOSS Needle을 사용하여 결정할 수 있다.
이 문서에서, 옵신 CT의 근위 영역은 O-CT-근위 영역이라고 하며, NR(K)Q 모티프와 종종 나선 8(H8)을 포함하는 원위 방향으로 다음의 대략 10개의 아미노산, 특히 7 내지 13개, 더욱 특별하게는 8 내지 12개 또는 가장 특별하게는 9 내지 11개의 아미노산을 포함하는 것으로 정의된다. 옵신 CT의 근위 영역은 선택적으로 H8의 원위 말단에 있는 팔미토일화 부위 (C)를 포함한다.
이 문서에서, 절단된 옵신 CT라는 용어는 절단된 옵신 CT에서 원위 방향으로 모 상류 옵신 CT의 아미노산이 제외되는 절단 부위에서 절단된 상류 옵신의 절단된 CT를 지칭한다. 절단된 CT의 절단 부위는 O-CT-근위 영역의 원위 말단 또는 이의 원위, 특히 위에 정의된 바와 같은 O-CT-근위 영역에 대한 원위 연장부의 원위 말단의 아미노산 위치에 위치한다.
키메라 옵신 GPCR 단백질의 바람직한 실시형태에서, 절단된 옵신 CT의 절단 부위는 상류 옵신 CT의 근위 영역(O-CT-근위 영역)의 원위 말단에 위치한다.
그러나 키메라 옵신 GPCR의 일부 실시형태는 O-CT-근위 영역에 대한 원위 연장부의 원위 말단에 있는 상류 옵신 CT의 절단 부위를 포함한다. O-CT-근위 영역에 대한 원위 연장부는 O-CT-근위 영역의 원위 말단의 하류 또는 특히 팔미토일화 부위의 하류에서 최대 5개 또는 최대 10개 또는 최대 16개 또는 최대 22개 또는 최대 28, 29, 30, 31, 32, 33, 34 또는 35개 아미노산에 있는 원위 말단을 포함한다.
일부 실시형태에서, 옵신 CT의 절단 부위는 NR(K)Q 모티프의 하류에서 최대 41개 또는 최대 43개 또는 최대 45개 또는 최대 47개 아미노산의 위치에서 선택된다.
O-CT-근위 영역에 대한 원위 연장부를 포함하는 일부 바람직한 실시형태에서, 상류 옵신은 멜라놉신의 군으로부터 선택된다.
O-CT-근위 영역에 대한 원위 연장부를 포함하는 일부 실시형태에서, 상류 옵신은 긴 CT 도메인을 포함한다. 예를 들어, 이는 적어도 50, 65, 80, 100, 150 또는 200개의 아미노산을 갖는 CT를 포함한다.
O-CT-근위 영역에 대한 원위 연장부를 갖는 이러한 실시형태 및 다른 실시형태 중 일부에서, 원위 연장부의 원위 말단은 상류 옵신에 특이적인 세포내 트래피킹 및 동역학 특성에 영향을 미치는 상류 옵신 CT의 서브도메인이 제외되도록 선택된다.
멜라놉신의 비정상적으로 긴 C 말단 세포질 영역(뮤린 OPN4의 AA364~521)은 다른 GPCR과 제한된 상동성을 나타낸다. 따라서, 이는 멜라놉신의 특징적인 반응 특성에 기여할 수 있으며, 이는 일시계를 바꾸는 환경적 광 검출기인 시간 경과에 따른 입력을 합산한다. 다양한 종의 멜라놉신 사이에 고도로 보존되어 있는 마우스 Opn4의 AA381~397은 광활성화된 멜라놉신의 반응을 형성하는 데 중요한 역할을 한다고 제안되었다(Mure et al. 2016). 따라서, 상류 옵신으로서 멜라놉신을 갖는 키메라 옵신 GPCR의 일부 실시형태는 마우스 멜라놉신의 397번 아미노산 위치에 있는 또는 이의 원위의 절단된 멜라놉신을 포함하여 이의 반응 동역학을 가속화한다. 아미노산 위치 397은 마우스 멜라놉신에서 아미노산 위치 364에 위치한 팜(palm) 부위의 하류의 33개 아미노산에 상응한다.
따라서, 옵신이 멜라놉신인 키메라 옵신 GPCR 단백질의 일부 실시형태에서, 절단된 옵신 CT는 팔미토일화 부위의 하류의 최대 약 33개 아미노산에 상응하는 NR(K)Q 모티프의 원위 말단의 하류의 최대 약 44개 아미노산을 포함한다.
키메라 옵신 GPCR의 일부 실시형태에서 상류 옵신 부분은 절단 부위까지 전체 상류 옵신을 포함하거나, 또는 상류 옵신 부분은 E(DRY) 모티프에서 절단 부위까지의 상류 옵신의 연속 영역을 포함하거나, 또는 상류 옵신 부분은 TM3, TM4, TM5, TM6 및 TM7 및 선택적으로 절단 부위까지 절단된 상류 옵신 CT를 포함한다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분은 막관통 도메인 TM3 및 TM7을 포함하고, 특히 막관통 도메인 TM3 내지 TM7, TM2 내지 TM7을 포함하거나 TM1 내지 TM7을 포함한다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분은 EL1, EL2, EL3 및 NT로부터 선택된 세포외 도메인 중 하나 이상을 추가로 포함한다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분은 2개 이상의 모 옵신, 특히 2개의 모 옵신으로부터 유래된다.
일부 실시형태에서, 상류 옵신 부분은 비인간 옵신인 모 옵신으로부터 유래된 막관통 도메인을 포함하고 인간 옵신인 모 옵신으로부터 유래된 1개 이상, 특히 2개 또는 3개, 또는 모든 세포외 도메인을 추가로 포함한다. 유리하게는, 이들 실시형태에서 인간 면역계는 인간 옵신으로부터 유래된 세포외 도메인을 외래 에피토프로 인식하지 않는다. 따라서, 옵신 GPCR 단백질의 일부 바람직한 실시형태에서, 모든 세포외 도메인은 인간 옵신으로부터 유래된다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, TM7 및 절단된 옵신 CT는 동일한 모 옵신으로부터 유래된다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분은 모든 세포외 도메인, 모든 막관통 도메인 및 모든 세포내 루프를 포함한다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분은 CT의 절단 부위까지 전체 모 상류 옵신을 포함한다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분은 단일안정성(mono-stable) 또는 이안정성(bi-stable) 옵신 또는 삼안정성(tri-stable) 옵신, 특히 이안정성 옵신으로부터 유래된다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분은 다음을 포함하는 옵신의 군으로부터 선택된 모 옵신으로부터 유래된다:
-
멜라놉신(OPN4)
-
로돕신(RHO)
-
원추형 옵신(OPN1SW, OPN1LW 및 OPN1MW)
-
해파리 옵신(cubop, JellyOP)
-
깡충거미(jumping spider) 로돕신(JSR1)
-
파라피놉신(PPO)
-
뉴롭신(OPN5)
-
엔세팔롭신(OPN3)
키메라 옵신-GPCR 단백질의 일부 실시형태에서, 결실 또는 부가, 특히 최대 5개 또는 최대 10개 또는 최대 15개 또는 최대 20개 또는 최대 30개 아미노산의 결실 또는 부가가 생리학적 모 옵신과 비교하여 키메라 옵신 GPCR의 상류 옵신 부분에 존재한다. 이러한 실시형태 및 다른 실시형태 중 일부에서 아미노산의 치환, 특히 보존적 아미노산의 치환 및/또는 특히 최대 5개 또는 최대 10개 또는 최대 15개 또는 20개의 치환된 아미노산이 생리학적 모 옵신과 비교하여 키메라 옵신 GPCR의 상류 옵신 부분에 존재한다.
키메라 옵신-GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분의 아미노산 서열은 생리학적인 하나 이상의 모 옵신의 상응하는 부분과 적어도 80%, 85%, 90%, 92%, 93%, 94%, 95%, 95%, 96%, 97%, 98%, 99%, 특히 완전히 동일하거나 유사하다.
이 문서에서, 표적 GPCR CT 또는 줄여서 표적 CT라는 용어는 표적 GPCR의 본질적으로 완전한 CT 또는 이의 기능적 활성 변이체를 지칭한다. 표적 CT의 기능적 활성 변이체는 키메라 옵신 GPCR 또는 모 표적 GPCR의 활성화를 유사한 효율로 모 GPCR의 특정 신호전달 경로에 결합시킬 수 있다.
이전 청구항 중 하나에 따른 키메라 옵신 GPCR로서, 표적 GPCR을 포함하고, 특히 하나 이상의 아미노산의 결실, 특히 NPxxY 모티프와 팔미토일화 부위까지 또는 팔미토일화 부위에 근위쪽으로 인접한 아미노산 위치까지의 임의의 아미노산 위치 사이의 N 말단 결실을 포함하는 키메라 옵신 GPCR.
일부 실시형태에서 표적 GPCR CT는 본질적으로 완전하다. 특히 본질적으로 완전한 표적 GPRC는 NPxxY와 NR(K)Q 부위에 있거나 그 사이에 있는 근위 말단을 포함한다. 일부 실시형태에서 표적 GPCR CT는 NR(K)Q 부위의 하류에서 1개의 아미노산 또는 최대 2개 또는 최대 3개 또는 최대 4개 또는 최대 5개 아미노산의 근위 말단을 갖는다. 일부 실시형태에서 표적 CT는 NR(K)Q 부위의 원위에 있는 약 7 내지 13 또는 8 내지 12 또는 9 내지 11개 또는 대략 10개 아미노산에 있거나 또는 특히 팔미토일화 부위에 있거나 위에서 정의된 바와 같은 팔미토일화 부위에 상응하는 아미노산 위치에 있는 표적 CT의 근위 영역의 원위 말단과 NR(K)Q 부위 사이에 있는 근위 말단을 갖는다.
모 표적 GPCR의 CT의 기능적 변이가 있는 일부 실시형태에서, 표적 GPCR의 TM7의 원위 말단에 있는 NPxxY 모티프와 표적 GPCR CT의 H8의 근위 말단에 있는 NR(K)Q 모티프 사이에 위치한 하나 이상의 아미노산은 결실되거나 치환된다.
모 표적 GPCR의 기능적 변이체를 갖는 일부 추가 실시형태에서 표적 GPCR의 근위 영역은 H8의 원위 말단에 있는 팔미토일화 부위까지 결실된다. 따라서, 이들 실시형태 또는 H8을 포함하지 않는 표적 CT를 갖는 일부 추가 실시형태에서, 표적 GPCR의 NR(K)Q 모티프 및 후속 7 내지 13개 또는 8 내지 12개 또는 9 내지 11개 아미노산이 결실된다. 특정 실시형태에서, 위에서 정의된 바와 같은 팔미토일화 부위 또는 팔미토일화 부위에 상응하는 부위의 근위의 아미노산이 결실된다.
이들 실시형태 중 일부에서 이러한 기능적 표적 GPCR CT 및 절단된 옵신 CT는 팔미토일화 부위에서 함께 스플라이싱된다.
치환 및/또는 결실을 포함하는 CT의 기능적 변이체의 일부 실시형태에서 보존된 NR(K)Q 모티프는 온전하게 유지된다.
모 표적 GPCR의 CT의 기능적 변이체를 갖는 일부 실시형태에서, 키메라 옵신 GPCR 단백질의 표적 GPCR 부분의 표적 GPCR CT의 아미노산 서열은 생리학적 모 표적 GPCR CT와 적어도 85%, 적어도 90%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 동일하거나 유사하다.
키메라 옵신 GPCR의 일부 실시형태에서, 표적 GPCR 부분은 비옵신 GPCR로부터 유래된다. 키메라 옵신 GPCR의 일부 다른 실시형태에서, 표적 GPCR 부분은 옵신으로부터 유래된다.
따라서, 일부 실시형태는 2개의 옵신, 즉 상류 옵신 및 표적 옵신으로 지칭되는 하류 옵신을 포함한다.
상류 옵신 부분은 광 활성화 가능하며 표적 GPCR CT에 광 활성화를 결합시킨다. 표적 옵신은 생리학적으로 표적 옵신과 관련된 G알파 단백질에 결합하여 표적 옵신의 신호전달 캐스케이드로 광 활성화를 결합시킨다.
절단된 상류 옵신 CT에는 O-CT-근위 영역이 내장된다. 상류 옵신 및 표적 옵신을 포함하는 일부 실시형태는 2개의 O-CT-근위 영역을 포함하는데, 하나는 상류 옵신에서 유래하고 다른 하나는 표적 GPCR에서 유래한다. 이들 실시형태는 또한 2개의 옵신 CT H8 서브도메인인 상류 옵신 H8 및 표적 GPCR H8을 포함할 수 있다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 표적 CT 부분은 다음을 포함하는 GPCR 단백질의 군으로부터 선택된 모 표적 GPCR로부터 유래된다:
특히 다음을 포함하는 군으로부터 선택된 클래스 A GPCR:
-
원추형 옵신, 특히 OPN1SW, OPN1MW 또는 OPN1LW,
-
세로토닌 수용체, 특히 5-HT7,
-
뮤 오피오이드 수용체,
-
β-아드레날린 수용체, 특히 베타1-아드레날린 수용체, 베타2-아드레날린 수용체 및 베타3-아드레날린 수용체;
특히 다음을 포함하는 군으로부터 선택된 클래스 B GPCR:
-
호르몬 수용체, 특히 글루카곤 수용체(GCGR)
특히 다음을 포함하는 군으로부터 선택된 클래스 C GPCR:
-
GABAB 수용체, 특히 GABAB1 및 GABAB2
-
대사성 글루타메이트 수용체, 특히 mGluR6 및 mGluR5 수용체.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 표적 GPCR은 클래스 A GPCR 또는 클래스 B GPCR, 또는 클래스 C GPCR을 제외한 또 다른 클래스의 GPCR이다. 이들 실시형태 중 일부에서, 표적 GPCR 부분은 IL1, IL2 및 IL3으로부터 선택된 하나 이상의 세포내 루프를 포함한다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서 표적 GPCR은 클래스 C GPCR, 특히 mGluR6이다. 이들 실시형태 중 일부에서, 표적 클래스 C GPCR 부분, 특히 mGluR6 부분은 IL1, IL2 및 IL3으로부터 선택된 하나 이상의 세포내 루프를 포함하되, 다음의 기준 중 하나가 충족된다:
A: 키메라 GPCR에서 상류 옵신 부분에 포함된 자연 크기의 IL3 및 고유 위치에 상응하는 위치에서 클래스 C GPCR의 자연 크기의 IL2의 병존은 키메라 GPCR에서 이들 두 IL 사이의 입체 장애를 피하기 위해 배제된다;
B: 상류 옵신 부분은 세포내 루프 IL1 내지 IL3 모두를 포함한다;
C: 상류 옵신 부분은 IL1을 포함하고 표적 GPCR 부분은 상응하는 위치에서 상류 옵신 IL2 및 IL3을 대체하는 IL2 및 IL3을 포함한다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 키메라 옵신 GPCR의 CT는 다음의 요소의 군으로부터 선택된 서열 요소를 추가로 포함한다:
-
골지 방출 신호(golgi export signal)
-
막 트래피킹 서열
-
형광 단백질을 암호화하는 서열 요소
하나 이상의 선택된 요소는 키메라 옵신 GPCR의 CT의 C 말단 끝에 임의의 순서로 독립적으로 배열된다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 키메라 옵신 GPCR의 CT는 방출 신호, 특히 소포체 또는 골지 방출 신호, 특히 아미노산 서열 KSRITSEGEYIPLDQIDINV(서열번호 85)를 갖는 칼륨 채널 Kir2.1로부터의 골지 방출 신호 또는 아미노산 서열 FCYENEV(서열번호 86)를 갖는 Kir2.1로부터의 ER 방출 신호를 선택된 서열 요소로서 포함한다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 키메라 옵신 GPCR의 CT는 특히 옵신으로부터의 막 트래피킹 서열, 더욱 특별하게는 줄여서 1D4 에피토프 태그 또는 1D4 태그라고도 하는 아미노산 서열 ETSQVAPA(서열번호 53)를 선택된 서열 요소로서 포함한다(문헌[Gross et al. 2009]; 문헌[Lodowski et al. 2013] 참조).
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 키메라 옵신 GPCR의 CT는 특히 mKate2, TurboFP635 또는 mScarlet으로부터 선택된 형광 단백질을 암호화하는 서열 요소를 포함한다. 이들 실시형태 중 일부에서 형광 단백질은 키메라 옵신 GPCR의 CT에 직접 융합되고, 이들 실시형태 중 다른 일부에서 형광 단백질은 IRES 또는 T2A 서열을 통해 연결된다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 표적 GPCR 부분은 IL1을 추가로 포함하고 표적 GPCR의 IL1은 상류 옵신의 IL1을 대체한다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신의 IL3은 표적 GPCR의 IL3으로 대체된다. 일부 다른 실시형태에서, 상류 옵신 IL3 내의 가변 영역은 표적 GPCR의 IL3으로 대체된다. 이에 의해 옵신 IL3이 형성된 가변 영역을 대체하는 위치에서 표적 GPCR의 전체 IL3을 포함하는 키메라 IL3이 얻어진다. 상류 옵신 IL3의 가변 영역에 근위 및 원위쪽으로 인접한 상류 옵신 IL3의 부분은 키메라 IL3에 유지된다.
특히 표적 GPCR로서 mGluR6을 갖는 키메라 옵신 GPCR 단백질의 일부 실시형태에서, 표적 CT의 근위 말단은 NR(K)Q 모티프에 또는 이의 상류에 또는 팔미토일화 부위에 위치한다.
mGluR C 말단 및 결합 파트너와의 이들의 상호작용은 잘 특성화되어 있다(예를 들어, 문헌[Enz R, 2012] 참조). mGluR6에서 아미노산 HPE는 NR(K)Q 모티프를 구성한다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 표적 GPCR은 mGluR6이고 mGluR6의 IL3은 옵신 IL3의 가변 영역을 부분적으로 대체하여 키메라 옵신-mGluR6 IL3을 형성한다. 따라서, 이들 실시형태는 키메라 CT 이외에도 키메라 IL3을 포함한다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 표적 GPCR은 mGluR6이고 상류 옵신 부분은 IL1, IL2 및 IL3으로부터 선택된 세포내 루프 중 하나 이상을 추가로 포함하되, 상류 옵신 부분에 포함된 자연 크기의 IL3 및 옵신-mGluR6 키메라 단백질의 mGluR6 부분에 포함된 자연 크기의 IL2의 병존은 배제된다.
키메라 옵신 GPCR 단백질의 일부 실시형태에서, 상류 옵신 부분은 멜라놉신으로부터 유래되고 NT, EL1 내지 EL3, TM1 내지 TM7, IL1 및 절단된 옵신 CT를 포함하고, 표적 GPCR 부분은 mGluR6 또는 hOPN1mw로부터 유래되고 IL2, IL3 및 CT를 포함한다.
옵신-GPCR 단백질의 일부 실시형태는 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10 및 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30 및 서열번호 32 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42 및 서열번호 44를 포함하는 군으로부터 선택된 아미노산 서열을 포함하거나 이로 구성된다. 이들 서열 중 일부는 골지 방출 신호 및/또는 1D4 태그로부터 선택된 C 말단 추가 서열을 포함한다. 골지 방출 신호와 1D4 태그는 선택적이다. 따라서, 골지 방출 신호 및/또는 1D4 태그를 포함하는 상기 언급된 서열번호 중 임의의 것에 따른 서열은 선택적인 C 말단에 부가된 서열 중 하나 또는 둘 모두가 부재하는 변이체를 포함하도록 정의된다.
키메라 옵신-GPCR 단백질의 일부 특히 바람직한 실시형태는 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 및 서열번호 28을 포함하는 군으로부터 선택된 아미노산 서열을 포함하거나 이로 구성된다.
옵신-GPCR 단백질의 일부 실시형태는 다음으로부터 선택된 하나 이상의 변이를 포함하는 상기 언급된 서열번호를 갖는 서열 중 임의의 하나의 변이체인 아미노산 서열을 포함한다:
-
보존적 아미노산 치환,
-
1 내지 최대 3개 또는 최대 5개, 최대 8개 또는 최대 15개 아미노산 범위의 결실,
-
1 내지 최대 3개 또는 최대 5개, 최대 8개 또는 최대 15개 아미노산 범위의 삽입,
여기서 키메라 옵신-GPCR 단백질은 표적 GPCR에 특이적인 G알파 단백질의 광 활성화 의존적 결합을 나타낸다. 이들 실시형태 중 일부에서 표적 GPCR은 mGluR6이고 광 활성화 시 키메라 옵신 mGluR6은 G알파(o)와 결합한다.
상기 언급된 서열번호를 갖는 서열 중 어느 하나의 변이체인 아미노산 서열을 포함하는 옵신-GPCR 단백질의 일부 실시형태에서, 상기 서열은 적어도 85%, 적어도 90%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 동일성을 갖는다.
키메라 옵신 GPCR의 일부 바람직한 실시형태에서, 표적 GPCR 부분은 NPxxy와 NR(K)Q 부위 사이에 근위 말단을 갖는 본질적으로 완전한 CT를 포함하거나 이로 구성된다. 특히 바람직한 실시형태에서, 표적 GPCR 부분은 mGluR6 또는 제2 옵신(표적 옵신), 특히 원추형 옵신 또는 로돕신으로부터 유래된다.
이들 실시형태 및 다른 바람직한 실시형태 중 일부에서, 상류 옵신 CT의 절단 부위는 팔미토일화 부위 또는 상기 정의된 바와 같은 팔미토일화 부위에 상응하는 아미노산 위치에 위치한다. 일부 바람직한 실시형태에서 상류 옵신 CT의 절단 부위는 팔미토일화 부위의 원위에, 예를 들어 팔미토일화 부위의 최대 5개 또는 최대 10개 또는 최대 33개 아미노산의 원위에 위치된다.
키메라 옵신 GPCR의 이들 실시형태 및 다른 바람직한 실시형태 중 일부에서, 상류 옵신 부분은 CT의 절단 부위까지 전체 모 상류 옵신을 포함한다.
이들 실시형태 및 다른 바람직한 실시형태 중 일부에서, 특히 비인간 기원의 상류 옵신을 포함하는 경우, 선택적으로 하나 이상 또는 모든 세포외 도메인이 인간 옵신의 세포외 도메인과 교환된다. 선택적으로, 이들 실시형태 및 다른 바람직한 실시형태 중 일부에서 추가로 또는 대안적으로 IL1, IL2 및 IL3으로부터 선택된 세포내 루프 중 하나 이상이 표적 GPCR로부터 유래된 IL, 특히 IL1 또는 IL3 또는 전술한 바와 같은 IL3의 부분과 교환된다.
키메라 옵신 GPCR의 이들 실시형태 및 다른 바람직한 실시형태 중 일부에서, 상류 옵신은 멜라놉신, 원추형 옵신, 특히 중파 원추형 옵신, 상자 해파리 옵신 또는 파라피놉신, 또는 깡충거미 로돕신(JSR1 또는 hJSR(S186F))을 포함하는 군으로부터 선택된다.
상류 옵신으로서 멜라놉신 및 표적 옵신으로서 mGluR6을 포함하는 이들 실시형태 및 다른 바람직한 실시형태 중 일부는 줄여서 mela-mGluR6으로 지칭된다. mela(palm)-mGluR6으로 명명되는 특히 바람직한 mela-mGluR6 실시형태에서, 멜라놉신은 H8의 원위 말단에서 이의 팔미토일화 부위에서 절단되고 mGluR6의 본질적으로 완전한 CT에 융합된다. mela(palm)-mGluR6 키메라의 일부 가장 바람직한 실시형태는 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 및 서열번호 28 또는 이의 변이체를 포함하는 군으로부터 선택된 아미노산 서열을 포함하거나 이로 구성된다.
전술한 바와 같이, 본 발명의 키메라 옵신 GPCR 단백질은 GPCR 단백질의 공통적인 3D 구조를 나타낸다. 키메라 옵신 GPCR은 E(D)RY 모티프, NPxxY 모티프, NR(K)Q 모티프가 있는 이온 잠금과 같은 모든 GPCR 단백질의 특징인 보존된 모티프를 추가로 포함한다. 본 발명에 따른 키메라 GPCR 단백질은 상류 옵신 부분 및 표적 GPCR 부분을 포함한다.
표적 GPCR이 비옵신 GPCR인 실시형태에서 상류 옵신 부분은 줄여서 옵신 부분이라고도 한다. 상류 옵신 부분은 발색단 포켓을 포함하고 선택적으로 원위 연장부를 갖는 O-CT-근위 영역을 포함하는 절단된 옵신 CT를 포함한다.
O-CT-근위 영역은 NR(K)Q 모티프 및 선택적으로 원위 말단에 하나 이상의 팔미토일화 부위가 있는, 많은 실시형태에서 H8을 형성하는 원위 방향의 다음의 대략 10개의 아미노산을 포함한다. 일부 실시형태에서 O-CT-근위 영역은 NPxxY 부위까지의 근위 연장부 및/또는 NR(K)Q 모티프의 하류에서 대략 최대 44개 아미노산에 상응하는 팔미토일화 부위의 하류에서 대략 최대 33개의 아미노산의 원위 연장부를 포함한다.
표적 GPCR 부분은 본질적으로 표적 GPCR의 전체 CT 또는 이의 기능적 변이체, 특히 기능적 단편을 포함한다. 일부 실시형태에서 표적 GPCR은 추가 옵신이다.
일부 실시형태에서, 키메라 옵신 GPCR 단백질은 2개의 나선 H8을 포함한다: 하나는 절단된 옵신 CT에 있고 다른 하나는 표적 GPCR CT에 있다.
모 상류 옵신의 O-CT-근위 영역은 키메라 옵신 GPCR에서 상류 옵신 부분의 형태 안정성 및 광 활성화 기능을 유리하게 증진시키는 것으로 밝혀졌다.
표적 GPCR 또는 이의 기능적 변이체, 특히 기능적 단편은 세포막으로의 트래피킹을 포함하는 정확한 세포 이하 단백질 트래피킹을 유리하게 매개한다. 나아가, 키메라 옵신 GPCR 단백질의 세포막으로의 정확한 트래피킹은 광 활성화에 대한 반응뿐만 아니라 모 옵신의 G알파 단백질에서 표적 GPCR의 G알파 단백질로의 G 단백질 결합 선택성의 이동도 증진시키는 것으로 여겨진다.
따라서, O-CT-근위 영역 및 표적 CT를 포함하는 키메라 CT가 놀라운 기술적 효과를 가져온다: 이는 단독으로 상류 옵신을 변형시켜 표적 GPCR의 G알파 단백질에 대한 결합에 의해 치료 표적 세포의 내인성 시그널로솜으로 키메라 옵신 GPCR의 광 활성화를 결합시키기에 충분하다.
일부 실시형태에서, 키메라 GPCR 단백질은 상류 옵신 부분 및 mGluR6 부분을 포함한다. 옵신 부분은 발색단 포켓 및 NR(K)Q 모티프 및 H8을 포함하는 절단된 옵신-CT, 및 선택적으로 하나 이상의 팔미토일화 부위 및/또는 선택적으로 팔미토일화 부위의 하류에서 최대 약 33개 아미노산 또는 NR(K)Q 모티프의 하류에서 최대 약 44개 아미노산을 포함한다. mGluR6 부분은 본질적으로 전체 mGluR6-CT 또는 이의 기능적 변이체, 특히 기능적 단편을 포함한다. 이들 실시형태에 따른 옵신-mGluR6 키메라 GPCR 단백질은 mGluR6-CT의 상류에 절단된 옵신-CT를 갖는 키메라 CT를 갖는다. 일부 실시형태에서, 이는 2개의 나선 H8을 포함한다: 하나는 절단된 옵신 CT에 있고 다른 하나는 표적 GPCR CT에 있다.
키메라 CT는 예시적인 키메라 옵신-mGluR6 단백질을 ON 두극세포의 시그널로솜으로 표적화하기에 충분하며, 여기서 광 활성화 시, 모 멜라놉신의 생리학적 세포 환경에서 내인성인 시그널로솜의 상이한 G 단백질 대신 G알파(o) 단백질에 결합한다.
옵신 mGluR6 키메라의 일부 실시형태에서, 옵신은 멜라놉신이다.
유리하게는, 절단된 멜라놉신 CT 및 천연 표적 GPCR CT를 포함하는 키메라 CT를 포함하는 키메라 멜라놉신 GPCR의 예시적인 실시형태는 모 멜라놉신보다 훨씬 더 빠른 광 반응을 나타낸다. 이것은 멜라놉신의 반응 동역학이 시각에 필요한 반응 동역학보다 빛의 변화에 대한 더 느린 반응 동역학을 요구하는 과정인 24시간 주기 리듬의 조절에서 생리학적 역할에 적응한다는 점을 고려하면 참으로 바람직하다.
생리학적 모 옵신이 건강한 광수용기 세포에서 신호전달 캐스케이드에 광 활성화를 결합시키므로 키메라 옵신 GluR6 단백질은 유사한 효율로 mGluR6 신호전달 캐스케이드에 광 활성화를 결합시키는 것으로 관찰되었다.
따라서, 옵신-GluR6 키메라 GPCR을 암호화하는 핵산 분자를 사용하여 생리학적으로 빛에 둔감한 뉴런, 특히 ON 두극세포를 유전적으로 변형시키면 시각 신호전달 경로에서 광수용기 세포를 우회하고 ON-두극세포를 신경 망막을 활성화시킬 수 있는 "대체 광수용체"로 전환시킴으로써 광수용기 세포가 변성된 망막의 시력을 회복시킬 수 있다.
선행 기술, 예를 들어, 위에서 언급한 키메라 옵신 mGluR6 단백질은 이전에 이 치료 개념을 입증했다. 본 발명의 현저한 놀라운 점은 생리학적 옵신에 O-CT-근위 영역, 특히 절단된 옵신-CT에 내장된 O-CT-근위 영역 및 표적 GPCR의 본질적으로 전체 CT를 포함하는 유전자 조작 키메라 CT를 간단히 장착하는 것으로 충분하다는 점이다. 또한, 이 유전자 설계는 테스트한 모든 옵신 GPCR 키메라에 적용할 수 있다.
대조적으로, 선행 기술은 CT 외에도 세포내 루프, 특히 IL3 및 IL2가 G 단백질 선택성에 특히 중요하거나 심지어 필요한 것으로 나타났음을 교시한다(WO2012/174674, Kleinlogel, 2016; Tsai et al, 2018).
따라서, 놀랍게도, 본 발명의 키메라 옵신-mGluR6 단백질에 의한 mGluR6 시그널로솜의 특이적 G 알파(o) 결합은 mGluR6의 세포내 루프의 완전한 부재 하에 달성된다.
실제로, 키메라 CT만을 포함하고 mGluR6의 추가 세포내 도메인을 포함하지 않는 예시적인 키메라 옵신 mGluR6 GPCR 단백질은 유리한 특성, 예컨대, 예를 들어, 광 활성화에 대한 반응의 빠른 동역학 및 반응의 진폭, 또는 예컨대, 모 표적 GPCR을 포함하는 세포의 생리학적 구획에 상응하는 세포 이하 구획으로의 정확한 세포내 트래피킹에서 세포내 루프의 추가 교체를 포함하는 선행 기술의 키메라 옵신 GPCR을 모방하거나 능가한다. 예를 들어, 본 발명의 키메라 옵신 mGluR6 GPCR은 ON 두극세포의 수상돌기를 보다 효율적으로 표적화하고 선행 기술에서 이용 가능한 키메라 옵토-mGluR6에 비해 광 유도 망막 반응을 증진시킨다(van Wyk et al, 2015).
본 발명에 따른 키메라 CT 또는 표적 옵신 CT를 사용한 키메라 옵신 GPCR 단백질의 특별한 이점은 오로지 단일한 필수 스플라이싱 부위의 선택을 기반으로 하는 최소의 인실리코 모델링 및 유전자 조작을 필요로 하는 설계의 큰 단순성이다. 그런데도, 키메라 옵신 GPCR 단백질, 예컨대, 예를 들어 키메라 옵신 mGluR6 또는 키메라 옵신 5-하이드록시트립타민 수용체 7(5-HT7)의 광 활성화에 대한 기능적 반응은 심지어 크기와 속도 면에서 모 표적 GPCR의 생리학적 반응에 상응한다.
본 발명의 제1 양태는 추가로 모 옵신 CT 및 모 표적 GPCR CT로부터 유래된 키메라 C 말단 도메인(키메라 CT), 특히 전술한 키메라 옵신 GPCR 단백질의 키메라 C 말단 도메인(키메라 CT)을 포함하는 펩티드에 관한 것이다. 키메라 C 말단 펩티드는 CT의 근위 영역(O-CT-근위 영역)을 포함하는 상류 옵신의 절단된 C 말단 도메인(절단된 옵신-CT)을 포함한다. O-CT-근위 영역은 특히 나선 8(H8) 및 소 로돕신의 C322 또는 C323에 각각 상응하는 팔미토일화 부위를 포함한다. 일부 실시형태에서 O-CT-근위 영역은 옵신의 팔미토일화 부위의 하류에서 예를 들어, 최대 약 33, 34 또는 35개 아미노산의 원위 연장부를 포함한다. 펩티드는 표적 GPCR의 C 말단 도메인(표적 GPCR CT) 또는 이의 기능적 변이체, 특히 기능적 단편을 추가로 포함한다. 표적 GPCR CT는 절단된 옵신 CT의 하류에 위치한다.
본 발명의 제2 양태는 키메라 옵신 GPCR 단백질을 암호화하고 절단된 옵신 CT 및 표적 GPCR CT 또는 이의 기능적 변이체를 포함하는 키메라 C 말단 펩티드를 암호화하는 핵산 분자에 관한 것이다. 상기 핵산 분자는 키메라 옵신 GPCR 단백질을 암호화하는 핵산 서열을 포함하거나 이로 구성된다.
키메라 옵신 GPCR 단백질 및 키메라 C 말단 펩티드 및 이들을 암호화하는 핵산 서열은 유전자 스플라이싱 생성물이라고도 하는 유전자 융합 생성물이며, 이는 전술한 바와 같이 모 상류 옵신을 암호화하는 모 유전자의 단편 및 모 표적 GPCR을 암호화하는 모 유전자의 단편을 포함한다.
이 문서에서, 키메라 옵신 GPCR 또는 키메라 C 말단 펩티드를 암호화하는 핵산 서열은 키메라 옵신 GPCR 유전자 또는 키메라 옵신 GPCR 이식유전자로도 지칭된다.
이 문서에서, 용어 이식유전자는 유기체 또는 세포의 게놈으로 전달된 유전자 또는 핵산 분자에 관한 것이다. 특히, 용어 이식유전자는 본 발명의 키메라 옵신 GPRC 또는 키메라 C 말단 펩티드를 암호화하는 유전자 또는 핵산 분자를 지칭한다.
이 문서에서, 키메라 옵신 GPCR 단백질 및 상기 옵신 키메라 GPCR 단백질을 암호화하는 핵산 분자라는 용어는 자연적으로는 그와 같이 존재하지 않는 단백질 및 핵산 분자를 지칭한다. 오히려 이들은 예를 들어, 유전자 클로닝, 유전자 발현, 재조합 핵산 기술, 화학적 합성, 예컨대, 재조합 핵산 분자의 고체상 화학 합성과 같은 분자 기술로 얻을 수 있는 인공 분자이다. 이들은 또한 당업계에 공지된 다른 방식으로 처리, 제조 및 조작될 수 있다. 분자, 유전 및 생화학적 방법과 화학적 방법에 사용되는 표준 기술은 예를 들어, 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual, 2d ed. (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.] 및 [Ausubel et al., Short Protocols in Molecular Biology (1999) 4th Ed, John Wiley & Sons, Inc.]을 참조한다.
따라서, 본 발명의 제2 양태는 본 발명의 제1 양태에 따른 키메라 옵신 GPCR 또는 펩티드를 암호화하는 핵산 서열을 포함하거나 이로 구성된 핵산 분자에 관한 것이다.
핵산 분자의 일부 실시형태에서, 이는 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10 및 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30 및 서열번호 32 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42 및 서열번호 44를 포함하는 아미노산 서열로부터 선택되는 서열과 적어도 90% 동일한, 예컨대, 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10 및 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30 및 서열번호 32 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42 및 서열번호 44로부터 선택된 아미노산 서열과 적어도 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%,99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 아미노산 서열로 구성된 키메라 옵신 GPCR을 암호화하는 핵산 서열을 포함한다.
서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10 및 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30 및 서열번호 32 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42 및 서열번호 44로부터 선택된 아미노산 서열로 구성된 키메라 옵신 GPCR을 암호화하는 이러한 핵산 서열의 예는 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9 및 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29 및 서열번호 31 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43으로부터 선택된 핵산 서열과 동일한 핵산 서열을 포함하나, 이에 한정되지 않는다.
일부 실시형태에서 키메라 옵신 GPCR을 암호화하는 핵산 분자는 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9 및 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29 및 서열번호 31 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43을 포함하는 군으로부터 선택된 핵산 서열과 적어도 70% 동일한, 예컨대, 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9 및 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29 및 서열번호 31 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43을 포함하는 군으로부터 선택된 핵산 서열과 적어도 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9% 또는 100% 동일한 핵산 서열을 포함하거나 이로 구성된다.
제38항에 따른 핵산 분자의 일부 특히 바람직한 실시형태에서, 바람직한 mela(palm mGluR6 키메라 옵신 GPCR을 암호화하며, 여기서 상기 핵산 분자는 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27을 포함하는 군으로부터 선택된 핵산 서열을 포함하거나 이로 구성된다.
본 발명의 제3 양태는 본 발명의 제2 양태에 따른 핵산 분자를 표적 세포로 전달하기 위한 의학적 용도를 위한 아데노 관련 바이러스 캡시드(AAV 캡시드) 폴리펩티드에 관한 것이다. 따라서, 제3 양태는 제1 양태에 따른 키메라 옵신 GPCR 단백질을 암호화하는 이식유전자의 표적 세포 내로의 전달을 위한 AAV 캡시드를 제공한다. 제3 양태는 또한 상기 의학적 용도를 위한 AAV 캡시드 폴리펩티드를 암호화하는 서열을 포함하는 핵산 분자에 관한 것이다.
양태 A에서 본원에 기재된 주요 발명과 독립적인 제2 발명은 신규한 AAV 캡시드 폴리펩티드 그 자체에 관한 것이고 양태 B에서는 상기 신규한 AAV 캡시드를 암호화하는 서열을 포함하는 핵산 분자에 관한 것이다.
독립적인 제2 발명의 양태 C는 표적 세포에 이식유전자를 전달하기 위한 의학적 용도를 위한 신규한 AAV 캡시드 폴리펩티드 - 및 이를 암호화하는 핵산 분자 -에 관한 것이다. 독립적인 제2 발명의 양태 C는 또한 제1의 주요 발명의 각각 제2 및 제1 양태에 따른 키메라 옵신 GPCR을 암호화하는 핵산 분자를 표적 세포에 전달하기 위한 의학적 용도를 위한 신규한 AAV 캡시드 폴리펩티드 - 및 이를 암호화하는 핵산 분자 - 를 포함한다.
독립적인 제2 발명의 양태 D는 독립적인 제2 발명의 양태 A에 따른 신규한 캡시드를 암호화하는 양태 B에 따른 핵산 분자를 포함하는 재조합 AAV 벡터에 관한 것이다.
아래의 설명 및 청구범위에서 AAV 캡시드 또는 캡시드라는 용어는 문맥상 다르게 명백하지 않는 한, 주요 발명에 따른 의학적 용도를 위한 캡시드 및 독립적인 제2 발명에 따른 캡시드 그 자체를 모두 지칭한다.
따라서, 본 발명의 제3 양태에서, 아데노 관련 바이러스(AAV) 캡시드 폴리펩티드 및 AAV 캡시드 폴리펩티드를 암호화하는 핵산 분자는 본 발명의 제1 양태에 따른 키메라 옵신 GPCR 단백질을 암호화하는 본 발명의 제2 양태에 따른 핵산 분자를 표적 세포에 전달하기 위한 의료 요법에 사용하기 위해 제공된다.
일부 실시형태에서 캡시드는 AAV2, AAV2(7m8)(Dalkara D et al, 2013) 또는 AAV8(BP2)(Cronin et al, 2014)의 캡시드 단백질 또는 이의 유래된 변이체이다.
야생형 AAV에서, 게놈은 함께 상호작용하여 정20면체 대칭의 캡시드를 형성하는 캡시드 단백질 VP1, VP2 및 VP3, 및 세포질로부터 세포 핵 내로의 새로 생성된 VP 단백질의 수송 및 안정화를 위해 요구되는 어셈블리-활성화 단백질(AAP)을 암호화하는 Cap 유전자를 포함한다. 3개의 VP 모두가 하나의 mRNA로부터 번역되고 상이하게 스플라이싱된다. 가장 큰 90 kDa의 VP1은 스플라이싱되지 않은 전사체이며, 72 kDa의 VP2는 비-통상적 ACG 시작 코돈으로부터 번역되는 반면, 가장 작은 60 kDa의 VP3은 AUG 코돈으로부터 번역된다. 3개의 VP 모두는 중첩되는 C 말단을 갖는다.
본 문서의 맥락에서 AAV 캡시드의 아미노산 위치에 대한 언급은 GenBank 등록번호 J01901.1(아데노 관련 바이러스 2, 완전한 게놈)에서 이용할 수 있는 AAV2의 참조 서열에 따른 AAV2의 캡시드 단백질 VP1의 아미노산 서열에 관한 것이다.
일부 실시형태에서, AAV 캡시드는 펩티드 삽입물을 포함한다. 일부 실시형태에서, 펩티드는 특히 피크 또는 스파이크성 돌출부에 삽입된다.
펩티드는 AAV2 캡시드의 위치 587에 삽입된다. 스파이크성 돌출부(피크)는 캡시드의 가장 노출된 영역을 나타낸다. 최고 피크는 AAV2 캡시드 상에서 아미노산 위치 453에 위치하고, 두 번째 최고 피크는 위치 587에 위치한다. 이들 피크는 캡시드 어셈블리를 손상시키지 않는 펩티드 삽입을 수용하며 비-허용성 세포를 표적화할 기회를 제공한다. 마찬가지로, 돌출부는 AAV 숙주 상호작용, 수용체 결합 및 면역원성의 중추적 부위를 나타낸다.
야생형 캡시드 AAV2 서열(서열번호 59)은 굵은 활자체와 밑줄로 표시된 N587과 R588 사이의 위에서 언급한 펩티드의 삽입 지점과 함께 아래에 제시되어 있다.
일부 실시형태에서, AAV 캡시드 단백질은 AAV2 캡시드 단백질이고 아미노산 587과 588 사이에 아미노산 삽입물을 포함하고, 여기서 펩티드 삽입물은 다음을 포함하는 펩티드의 군으로부터 선택된다:
-
SASEAST (서열번호 60)
-
TPPSITA (서열번호 61)
-
PRTPHTA (서열번호 62)
-
NHAPNHC (서열번호 63)
N587과 R588 사이의 펩티드 삽입물은 선행 기술에 기재되어 있다(David A., 2018; EP 출원 번호 19206603.3, 미공개). 이들 실시형태에서, AAV 캡시드 폴리펩티드는 줄여서 7량체 펩티드 삽입물로도 불리는 7개의 아미노산으로 구성된 펩티드 삽입물을 포함한다.
일부 추가 실시형태에서 AAV 캡시드 폴리펩티드는 7 내지 13량체인 펩티드 삽입물을 포함한다. 특히, 이들 실시형태는 전술한 7량체 펩티드 삽입물과 같은 7량체를 포함하고, 0~6개 아미노산의 1개 또는 2개의 플랭킹(flanking) 링커를 추가로 포함하며, 여기서 6은 N 및 C 말단에 부가된 플랭킹 아미노산의 총 수의 최대 수이다.
일부 예시적인 실시형태는 링커 서열을 포함하지 않는 펩티드 삽입물로 구성되고, 다른 실시형태는 한쪽 또는 양쪽에 링커를 포함한다. 일부 실시형태에서 링커는 알라닌(A), 아스파라긴(N), 리신(L), 아르기닌(R), 트레오닌(T) 또는 글리신(G) 또는 이의 혼합물을 포함하는 아미노산의 군으로부터 선택되지만 이에 한정되지 않는다.
일부 바람직한 실시형태에서 1개 또는 2개의 플랭킹 링커는 다음으로부터 선택된 아미노산을 포함하거나 바람직하게는 이로 구성된다:
i.
아미노산 G 및 A 또는
ii.
아미노산 A, N, L, T, R, G, A, N, L 및 R, 특히 A, L, N, R.
일부 바람직한 실시형태에서, 플랭킹 링커 중 하나 또는 둘 모두는 N 및 R로부터 선택된 적어도 하나의 아미노산을 포함한다. 일부 특히 바람직한 실시형태에서, 링커는 양쪽에 2 또는 3개의 아미노산을 포함한다. 이들 실시형태 및 기타 실시형태 중 일부에서 링커는 아미노산 A, L, N, R로부터 선택된 하나 이상의 아미노산으로 구성된다. 예시적인 바람직한 실시형태에서 링커 및 펩티드 삽입물은 NLA-펩티드-AR의 배열이다.
일부 바람직한 실시형태에서 캡시드는 AAV2 캡시드 단백질 또는 다음으로부터 선택되는, N587과 R588 사이에 펩티드 삽입물을 포함하는 이의 돌연변이 변이체이다:
-
AAASASEASTAA (서열번호 64),
-
AAATPPSITAAA (서열번호 65),
-
AAAPRTPHTAAA (서열번호 66),
-
NLANHAPNHCAR (서열번호 67),
-
NLAPRTPHTAAR (서열번호 68).
이 문서에서 삽입물을 포함하는 AAV2 캡시드의 실시형태는 괄호 안에 변형이 뒤따르는 야생형 AAV 혈청형을 열거하는 축약식 명명법으로도 지칭된다. 전술한 바와 같은 펩티드 삽입물을 포함하는 예시적인 캡시드에 대한 이러한 축약식 명명법은 예를 들어 괄호 안에 열거된 펩티드 삽입물 내의 7개 아미노산을 포함하고 선택적으로 1개 또는 2개의 플랭킹 링커를 추가로 포함하는 AAV2 캡시드를 지칭하는 AAV2(NHAPNHC) 또는 예를 들어, 열거된 7개 아미노산 PRTPHTA를 갖는 펩티드 삽입물을 포함하고 선택적으로 1개 또는 2개의 플랭킹 링커를 포함하는 AAV2(PRTPHTA) 캡시드이다.
플랭킹 링커를 포함하는 펩티드 삽입물의 위에서 언급된 예시적인 실시형태는 AAV2 캡시드의 약간 확장된 서열 맥락에서 플랭킹 링커와 함께 아래에 열거되어 있다. 링커의 예시적인 실시형태는 밑줄이 그어져 있다. 처음 3개의 링커는 알라닌을 포함하고 -AAA-...-AA-의 형태이고 마지막 2개의 링커는 대안적인 아미노산, 즉 알라닌(A) 외에 아르기닌(R), 아스파라긴(N) 및 리신(L)을 포함하고 아래에 제시된 바와 같이 -NLA-...-AR-의 형태이다.
서열번호 69:
580 - VSTNLQRGN-AAA- SASEAST-AA-RQAATADVNTQGVLPG
서열번호 70:
580 - VSTNLQRGN-AAA- TPPSITA-AA-RQAATADVNTQGVLPG
서열번호 71:
580 - VSTNLQRGN-AAA- PRTPHTA-AA-RQAATADVNTQGVLPG
서열번호 72:
580 - VSTNLQRGN-NLA-NHAPNHC-AR- RQAATADVNTQGVLPG
서열번호 73:
580 - VSTNLQRGN-NLA-PRTPHTA-AR- RQAATADVNTQGVLPG
서열번호 67, NLANHAPNHCAR 또는 서열번호 68, NLAPRTPHTAAR에 따른 펩티드 삽입물을 포함하는 캡시드는 그 자체로 신규하고 독립적인 발명을 구성한다. 따라서, 이들 신규한 캡시드는 본원에 기재된 키메라 옵신 GPCR 단백질을 암호화하는 이식유전자를 패키징하기 위한 rAAV2 벡터의 맥락으로 한정되지 않는다. 특히, 이들 신규한 캡시드는 본 발명의 제1 및 제2 양태에 따른 키메라 옵신 GPCR 또는 이를 암호화하는 핵산 분자와 함께 의학적 용도로 한정되지 않는다.
따라서, 독립적인 발명에서, AAV 혈청형 2 캡시드의 587 내지 592 사이, 바람직하게는 N587 내지 R588 사이의 위치 또는 또 다른 혈청형의 AAV에서 이에 상동성인 위치에 펩티드 삽입물을 포함하는 아데노 관련 바이러스(AAV) 캡시드 폴리펩티드가 제공되며, 여기서 펩티드 삽입물은 다음을 포함하는 서열의 군으로부터 선택된다:
-
NLANHAPNHCAR (서열번호 67),
-
NLAPRTPHTAAR (서열번호 68)
일부 실시형태에서, 캡시드 단백질은 AAV2 캡시드이고 적어도 하나의 돌연변이를 포함하며, 여기서 이러한 적어도 하나의 돌연변이는 다음으로부터 선택된다:
a.
아미노산 위치 252, 272, 444, 500, 700, 704 및/또는 730에서 티로신(Y)에서 페닐알라닌(F)으로의 돌연변이; 및/또는
b.
아미노산 위치 491에서 트레오닌(T)에서 발린(V)으로의 돌연변이.
신규한 캡시드의 특히 바람직한 실시형태는 아래에 제시된 바와 같이 서열번호 74에 따른 NLAPRTPHTAAR 삽입을 갖는 AAV2 캡시드 단백질의 아미노산 서열을 포함한다:
VP1과 중첩되는 VP3(회색 서열), 티로신에서 페닐알라닌(Y-F)으로의 돌연변이는 진회색으로 강조 표시되고 밑줄이 그어져 있으며, 아미노산 넘버링은 전체 VP1 서열을 나타낸다. 모티프가 삽입된 G453의 최고 피크와 N587의 두 번째 최고 피크는 밑줄이 그어져 있고, 흰색 언더레이로 표시되어 있다. 삽입은 이탤릭체 및 상자로 표시되어 있다.
제3 양태 및 독립적인 발명은 또한 전술한 바와 같은 AAV 캡시드를 암호화하는 핵산 분자에 관한 것이다.
일부 실시형태에서, 핵산 분자는 AAV2, AAV2(7m8) 또는 AAV8(BP2) 또는 AAV2(NHAPNHC) 또는 AAV2(PRTPHTA)로부터 선택된 캡시드 폴리펩티드를 암호화하는 핵산 서열을 포함하거나 이로 구성된다.
일부 실시형태에서, 제49항에 있어서, 핵산 분자는 다음으로부터 선택되는, AAV2 게놈의 N587 내지 R588 사이의 펩티드 삽입물이 있는 아미노산 서열을 포함하는 캡시드 폴리펩티드를 암호화하는 핵산 서열을 포함하거나 이로 구성되는 것인 핵산 분자:
-
AAASASEASTAA (서열번호 64),
-
AAATPPSITAAA (서열번호 65),
-
AAAPRTPHTAAA (서열번호 66),
-
NLANHAPNHCAR (서열번호 67),
-
NLAPRTPHTAAR (서열번호 68).
일부 실시형태에서, 핵산 분자는 특히 키메라 옵신 GPCR을 암호화하는 이식유전자를 포함한다. 일부 바람직한 이들 실시형태에서, 이식유전자는 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9 및 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29 및 서열번호 31 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43을 포함하는 군으로부터 선택된 핵산 서열을 포함하거나 이로 구성된다.
일부 특히 바람직한 실시형태에서, 핵산 분자는 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27을 포함하는 군으로부터 선택된 핵산 서열을 포함하거나 이로 구성된 mela(palm)-mGluR6 키메라 GPCR을 암호화하는 이식유전자를 포함한다.
캡시드 및 이식유전자를 암호화하는 핵산 분자의 일부 실시형태에서, 이식유전자는 세포 특이적 프로모터에 작동 가능하게 연결된다. 이들 실시형태 중 일부에서 세포 특이적 프로모터는 특히 ON 두극세포 특이적 프로모터, 더욱 특별하게는 200En-mGluR500P 프로모터, 서열번호 75에 따른 770En_454P(hGRM6) 프로모터 또는 서열번호 76에 따른 444En_454P(hGRM6) 프로모터 또는 망막 ON-두극세포 또는 이의 요소의 내인성 mGluR6 프로모터를 포함하는 군으로부터 선택된 프로모터이다.
Mela(palm)-mGluR6 또는 Mela(palm+33)-mGluR6이라는 용어는 각각 팔미토일화 부위에서 절단되었거나 또는 팔미토일화 부위의 하류의 33개 아미노산에서 절단된, 절단 멜라놉신 CT를 포함하는 멜라놉신 mGluR6 키메라 옵신 GPCR의 바람직한 실시형태를 지칭한다.
따라서, 캡시드를 암호화하는 핵산 분자의 일부 특히 바람직한 실시형태에서, 캡시드는 AAV2(7m8) 또는 AAV8(BP2) 또는 AAV2(NHAPHC) 또는 AAV2(PRPTPHTA) 캡시드로부터 선택된다. 추가로, 상기 핵산 분자는 Mela(palm)-mGluR6 또는 Mela(palm+33)-mGluR6과 같은 키메라 옵신 GPCR의 바람직한 실시형태를 암호화하는 이식유전자를 추가로 포함하고, 나아가 이식유전자는 770En-445P(hGRM6) 프로모터 또는 444En_454P(hGRM6) 프로모터의 제어 하에 있다.
신규한 rAAV 캡시드에 관한 독립적인 본 발명의 일부 실시형태에서, 전술한 바와 같은 신규한 펩티드 삽입물을 갖는 신규한 rAVV 캡시드를 포함하는 벡터가 제공된다.
본 발명의 제5 양태에 따른 캡시드의 실시형태가 특정 서열번호에 따른 특정 서열을 지칭할 때마다, 전술한 바와 같은 특정 서열의 변이체가 이들 실시형태에 포함되는 것으로 이해된다.
본 발명의 제4 양태는 본 발명의 제1 양태에 따른 키메라 옵신 GPCR 단백질 또는 키메라 C 말단 펩티드를 암호화하는 본 발명의 제2 양태에 따른 핵산 분자를 포함하는 벡터에 관한 것이다. 따라서, 제4 양태는 표적 세포로의 유전자 전달 및 특히 키메라 옵신 GPCR을 그 안에서 발현시키기 위한 벡터에 관한 것이다. 다시 말해서, 본 발명의 제4 양태에 따른 벡터는 본 발명의 제1 양태에 따른 키메라 옵신 GPRC 또는 키메라 C 말단 펩티드를 암호화하는 이식유전자를 포함한다.
따라서, 각각 본 발명의 제1 및 제2 양태에 기재된 바와 같은 핵산 분자에 의해 암호화되는 키메라 옵신 GPCR 단백질 또는 키메라 C 말단 펩티드를 암호화하는 핵산을 포함하는 벡터, 특히 핵산 발현 벡터가 제공된다. 핵산 발현 벡터는 키메라 옵신 GPCR을 암호화하는 핵산 분자에 의해 암호화되는 이식유전자에 작동 가능하게 연결된 프로모터를 포함한다.
일부 실시형태에서, 이식유전자는 최적화된 KOZAK 서열이 선행된다. KOZAK 서열은 컨센서스 (gcc)gccAccAUGG(서열번호 77) 또는 (gcc)gccGccAUGG(서열번호 78)를 가지며, 번역 개시를 증진시킨다.
일부 실시형태에서, 핵산 발현 벡터는 또한 WPRE(우드척(Woodchuck) 간염 바이러스 전사후 조절 요소) 조절 서열을 포함한다(문헌[Hulliger et al. 2010]의 서열번호 20 참조). WPRE는 전사될 때 발현을 향상시키는 3차 구조를 생성하는 DNA 서열이다.
일부 실시형태에서, 핵산 발현 벡터는 또한 이식유전자의 하류에 삽입되는 폴리A 꼬리를 포함한다. 폴리A 꼬리는 이식유전자의 번역을 촉진한다.
일부 실시형태에서, 벡터는 아데노 관련 바이러스(AAV)로부터 유래된다. 상기 벡터는 전술한 본 발명의 제1 양태에 따른 키메라 옵신 GPCR 단백질 또는 키메라 C 말단 펩티드를 암호화하는 핵산 분자를 포함하므로 재조합(rAAV) 벡터이다.
일부 실시형태에서, rAAV 벡터는 단일 가닥 벡터(ssAAV) 또는 자가-상보적 벡터(scAAV)이다.
일부 실시형태에서, 벡터는 특히 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 또는 AAV12를 포함하는 AAV 혈청형의 군으로부터 선택된 재조합 AAV 벡터이다. 일부 바람직한 실시형태에서, 벡터는 rAAV2 또는 rAAV8 벡터이다.
이들 실시형태 및 기타 실시형태 중 일부에서 벡터는 다음을 포함하는 서열의 군으로부터 선택된 핵산 서열을 추가로 포함한다:
-
AAV 캡시드 단백질을 암호화하는 서열 및/또는
-
프로모터, 특히 세포 특이적 프로모터, 더욱 특별하게는 두극세포 특이적 프로모터.
프로모터, 특히 세포 특이적 프로모터를 포함하는 일부 실시형태에서, 벡터는 인핸서 서열 및 선택적으로 스페이서를 추가로 포함한다. 5'-말단에서 3'-말단까지, 벡터는 먼저 인핸서, 그 다음 선택적 스페이서, 그 다음 프로모터를 포함한다. 이식유전자는 프로모터에 의해 구동되는 이식유전자의 발현을 위해 프로모터의 3'-방향에 위치한다. 즉, 이식유전자는 프로모터에 작동 가능하게 연결된다.
일부 실시형태에서, 특히 mGluR6 표적 GPCR CT를 포함하는 키메라 옵신 GPCR을 암호화하는 핵산 분자를 발현하는 벡터의 경우, 벡터는 ON-두극세포 특이적 프로모터를 포함한다. 이들 실시형태 중 일부에서 ON-두극세포 특이적 프로모터는 GRM6-sv40 프로모터(Kim et al., 2008) 또는 4xGRM6-sv40 프로모터(Cronin et al., 2014) 또는 200En-mGluR500P 프로모터(Lu et al., 2016) 또는 770En_454P(hGRM6) 또는 444En_454P(hGRM6) 프로모터(문헌[Hulliger et al., 2020] 및 EP19200082.6(미공개) 참조)를 포함하는 군으로부터 선택된다.
770En_454P(hGRM6) 프로모터는 서열번호 75를 포함하거나 이로 구성된다. 770En_454P(hGRM6) 프로모터는 뮤린과 인간 게놈(-13873 내지 -13467 rel. TLSS GRM6) 사이에 300 bp의 보존된 서열을 함유하고, 또한 3' ChIP-seq 피크 및 Dnase 과민성 클러스터(-13990 내지 -13816 rel. TLSS GRM6)를 함유하는 인핸서 770En(hGRM6)(-14236 내지 -13467 rel. TLSS GRM6)을 포함한다.
444En_454P(hGRM6) 프로모터는 서열번호 76을 포함하거나 이로 구성된다. 444En_454P(hGRM6) 프로모터는 인핸서 444En(hGRM6)(-14033 내지 -13590 rel. TLSS GRM6)을 포함하며, 3' 및 5' ChiP-seq 피크만 포함하는 770En(hGRM6)의 3' 및 5' 절단된 버전이다.
세포 특이적 프로모터를 포함하는 벡터의 일부 실시형태에서, 세포 특이적 프로모터는 망막 ON-두극세포 또는 이의 요소의 내인성 mGluR6 프로모터이다.
전술한 바와 같은 ON-두극세포 특이적 프로모터를 포함하는 벡터의 일부 바람직한 실시형태는 키메라 멜라놉신-mGluR6을 암호화하는 핵산 분자를 발현한다. 이들 실시형태 중 일부에서, 키메라 멜라놉신 mGluR6 단백질은 줄여서 Mela(palm)-mGluR6이라고도 하는, 팔미토일화 부위에서 절단된 옵신 CT, 또는 줄여서 Mela(palm+33)-mGluR6이라고도 하는 팔미토일화 부위의 하류에서 절단된 33개 아미노산을 포함한다. 추가의 바람직한 실시형태에서 벡터는 키메라 OPN1mw-mGluR6 또는 2개의 옵신을 포함하는 키메라 옵신 GPCR을 포함한다.
벡터의 일부 특히 바람직한 실시형태는 특히, 200En-mGluR500P, 770En_454P(hGRM6) 또는 444En_454P(hGRM6) 프로모터 또는 망막 ON-두극세포 또는 이의 요소의 내인성 mGluR6 프로모터로부터 선택된 ON-두극세포 특이적 프로모터의 제어 하에, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27 중 하나에 따른 Mela(palm)-mGluR6, 특히 서열번호 15에 따른 Mela(palm)-mGluR6 또는 특히 서열번호 29 또는 서열번호 31로부터 선택된 서열에 따른, 세포내 루프를 추가로 포함하는 Mela-mGluR6을 발현한다.
벡터의 일부 실시형태는 본 발명의 제3 양태에 따른 AAV 캡시드를 암호화하는 핵산 서열을 포함한다. 일부 바람직한 실시형태에서, 벡터는 전술한 바와 같이 N587 내지 R588 사이에 펩티드 삽입물을 갖는 AAV 캡시드를 암호화한다.
일부 바람직한 실시형태에서, 벡터는 키메라 옵신 GPCR을 암호화하는 이식유전자에 작동 가능하게 연결된 770En-445P(hGRM6) 프로모터를 포함하고, AAV2(7m8) 또는 AAV8(BP2) 또는 AAV2(NHAPNHC) 또는 AAV2 (PRPHTA)를 발현하는 핵산 분자를 추가로 포함한다. 이들 실시형태 및 기타 실시형태 중 일부에서 키메라 옵신 GPCR은 바람직하게는 다음으로부터 선택된다:
-
상류 옵신으로서 멜라놉신 또는 hOPN1mw를 포함하고 표적 옵신으로서 mGluR6을 포함하는 키메라 옵신 GPCR 또는 2개의 옵신을 포함하는 키메라 옵신 GPCR,
-
Mela(palm)-mGluR6 또는 Mela(palm+33)-mGluR6으로부터 선택된 키메라 옵신 GPCR
-
서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27 서열번호 29 또는 서열번호 31을 포함하는 군으로부터 선택된 핵산 서열에 따른 키메라 옵신 GPCR.
벡터의 특히 바람직한 실시형태는 서열번호 79에 따른 서열을 포함하거나 이로 구성된다. 벡터의 이 실시형태에서, 이는 770En-445P(hGRM6) 프로모터의 제어 하에 서열번호 19에 따른 예시적인 hmela(palm) - mGluR6 이식유전자를 포함하고 AAV8(BP2) 캡시드를 암호화하는 핵산 서열을 추가로 포함한다.
본 발명의 제4 양태에 따른 벡터의 실시형태가 특정 서열번호에 따른 특정 서열을 지칭할 때마다, 전술한 바와 같은 특정 서열의 변이체가 이들 실시형태에 포함되는 것으로 이해된다.
본 발명의 제5 양태는 제2 양태에 따른 핵산 분자를 포함하거나 발현하는 운반체, 예컨대, 입자, 특히 나노 입자, 소포, 세포주 - 특히 생식 세포주는 제외- 및 동물, 또는 제3 양태에 따른 벡터 또는 제1 양태에 따른 키메라 옵신 GPCR을 포함하는 벡터에 관한 것이다.
본 발명의 제5 양태의 일부 실시형태에서, 트랜스제닉 동물, 특히 트랜스제닉 마우스 또는 트랜스제닉 세포주가 제공된다. 트랜스제닉 동물 또는 트랜스제닉 세포주는 본 발명의 제2 양태의 핵산 분자 또는 제4 양태의 벡터를 포함하고/하거나 본 발명의 제1 양태에 따른 키메라 옵신 GPCR 단백질을 발현한다.
트랜스제닉 세포의 일부 실시형태는 트랜스제닉 생식 세포주를 선택적으로 배제하는 줄기 세포주 또는 기관형 세포주와 같은 키메라 옵신 GPCR 단백질을 발현하기 위한 적합한 세포주로부터 유래된다. 특히, 적합한 세포주는 다음을 포함하는 세포주의 군으로부터 선택된다:
- HEK293-GIRK 세포,
- 내부 망막 뉴런, 특히 ON 두극세포,
- 신장 세포 및
- Gs, Gq 또는 G12/13으로부터 선택된 G 단백질을 발현하는 세포.
트랜스제닉 동물 또는 트랜스제닉 세포의 일부 실시형태는 CRISPR/cas 변형된 게놈을 포함한다. CRISPR/Cas 게놈 편집은 당업자에게 알려져 있다(예를 들어, 문헌[Vandemoortele et al. (2017)], 예를 들어, 문헌[Long et al. (2018)], 예를 들어, 문헌[Hsu et al (2014), Cell 157(6):1262-1278] 및 그 안의 참고문헌 참조).
제5 양태의 일부 실시형태에서, 본 발명은 표적 세포로 본 발명의 이전 양태 중 하나에 따른 키메라 옵신 GPCR 또는 이를 암호화하는 핵산 분자 또는 벡터를 전달하기 위한 운반체, 특히 입자 또는 나노입자 또는 소포를 제공한다.
일부 실시형태에서, 운반체는 본 발명의 제1 양태에 따른 키메라 옵신 GPCR을 암호화하는 이식유전자를 포함하는 제2 양태에 따른 핵산 분자 또는 제4 양태에 따른 벡터를 포함하거나, 또는 본 발명의 제1 양태에 따른 키메라 옵신 GPCR 단백질을 포함한다. 일부 실시형태에서, 운반체는 유전자 총과 함께 사용하기에 특히 적합한 나노- 또는 마이크로-입자이다. 이들 실시형태 및 다른 실시형태 중 일부에서 운반체는 금 입자이다.
이 문서에서, 키메라 옵신 GPCR 단백질 또는 핵산 분자 또는 벡터의 전달을 위한 운반체는 더 짧게 "전달용 운반체"로도 지칭된다. 전달용 운반체는 인간 또는 비인간 동물의 표적 세포 또는 표적 유기체의 수용자 게놈으로의 전달에 적합한 키메라 옵신 GPCR을 암호화하는 이식유전자를 포함하는 키메라 옵신-GPCR 단백질 또는 핵산 분자 또는 벡터를 부착하거나 패키징할 수 있는 임의의 적합한 화학적 또는 물리적 구조를 지칭한다.
전달용 운반체의 예시적인 실시형태는 소포 및 입자, 특히 마이크로- 또는 나노-입자이다. 예시적인 소포는 예를 들어 생물학적 또는 합성 기원의 막 소포를 포함한다. 예시적인 입자는 특히 유전자 총과 함께 사용하기에 적합한 마이크로- 및 나노-입자이며, 예를 들어, 특히 흡착 또는 공유 결합 리간드로서 키메라 옵신 GPCR 단백질 또는 이를 암호화하는 키메라 핵산으로 코팅된 금 입자를 포함한다(O'Brian and Lummis, 2011). 운반체의 일부 실시형태에서, 이는 이식유전자 및 CRISPR/cas 카세트, 즉, 예를 들어, Cas9와 같은 Cas 효소 및 하나 이상의 가이드 RNA(들)(gRNA), 특히 단일 가이드 RNA(들)(sgRNA)를 암호화하는 플라스미드, 또는 하나 이상의 gRNA, 특히 sgRNA의 개별 형질감염과 조합되는 Cas 효소, 특히 Cas9를 암호화하는 플라스미드를 포함한다.
본 발명의 이들 실시형태 및 기타 실시형태 중 일부에서, 운반체는 본 발명의 제2 양태에 따른 핵산 서열 또는 이식유전자 및 CRISPR/cas 카세트를 포함하는 본 발명의 제4 양태에 따른 벡터를 포함한다.
일부 바람직한 실시형태에서, 전술한 트랜스제닉 동물 또는 트랜스제닉 세포 또는 전달용 운반체는 키메라 멜라놉신-mGluR6(Mela-mGluR6), 특히 Mela(palm)-mGluR6 또는 Mela(palm+33)-mGluR6 또는 키메라 OPN1mw-mGluR6 또는 두 개의 옵신을 포함하는 키메라 옵신 GPCR을 암호화하는 이식유전자를 포함한다.
일부 추가의 바람직한 실시형태에서, 전술한 트랜스제닉 동물 또는 트랜스제닉 세포 또는 전달용 운반체, 이식유전자는 다음을 포함하는 군으로부터 선택된 키메라 Mela-mGluR6을 암호화한다:
-
Mela(palm)-mGluR6, 특히 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27을 포함하는 군으로부터 선택된 서열 중 하나에 따른 Mela(palm)-mGluR6 또는
-
Mela(palm+33)-mGluR6, 특히 서열번호 15에 따른 Mela(palm+33)-mGluR6 또는
-
세포내 루프를 추가로 포함하는 Mela-mGluR6, 특히 서열번호 29 또는 서열번호 31로부터 선택된 서열에 따른 세포내 루프를 추가로 포함하는 Mela-mGluR6.
본 발명의 제5 양태에 따른 운반체, 세포 또는 동물의 실시형태가 특정 서열번호에 따른 특정 서열을 지칭할 때마다, 전술한 바와 같은 특정 서열의 변이체가 이들 실시형태에 포함되는 것으로 이해된다.
본 발명의 제6 양태는 본 발명의 제1 양태의 키메라 옵신 GPCR 단백질을 암호화하는 제2 양태의 핵산 분자를 유전적으로 조작하는 방법에 관한 것이다.
또한, 본 발명의 제6 양태는 특히 본 발명의 제1 양태에 따른 상류 옵신 CT의 근위 영역 및 표적 GPCR CT를 포함하는 키메라 C 말단 펩티드를 암호화하는 핵산 분자를 조작하는 방법에 관한 것이다.
모든 GPCR 단백질 및 특히 또한 GPCR의 편재적으로 보존된 모티프에 공통적인 보존된 3D 구조, 예컨대, 접합부 TM3/IL2 주변의 E(D)RY, TM6과 IL3의 접합부 주변의 E, TM7의 원위 말단 주변의 NPxxY 및 나선 8의 근위 말단 주변의 NR(K)Q 또는 부분적으로 보존된 요소, 예컨대, H8의 원위 말단에 있는 팔미토일화 부위 및 GPCR 사이의 추가의 보존된 요소는 프로토타입 GPCR 소 로돕신과의 서열 정렬에 의해 쉽게 확인된다.
예시적인 적합한 스플라이싱 부위는 또한 막관통 도메인/세포내 도메인 접합부 GPCR의 선택적인 구조적 정렬에 의해 및 특히 보존된 서열 모티프에 대한 막관통 및 세포내 도메인 사이의 접합부 주변의 서열을 스캐닝함으로써 쉽게 확인된다.
이들 사이의 키메라 접합부에서 하나 이상의 선택된 모 GPCR(모 옵신/모 표적 GPCR)의 보존된 모티프 또는 이의 기능적 변이체의 보존 또는 재구성은 높은 확률로 기능적 활성 키메라 GPCR을 초래한다.
따라서, 본 발명의 제6 양태에서, 옵신의 광 민감성, 정확한 세포내 트래피킹, 표적 GPCR의 효율적인 G 단백질 결합 및 G 단백질 특이성과 같은 원하는 기능을 갖는 키메라 GPCR을 유전적으로 조작하고 설계하는 효율적이고 간단한 방법이 제공된다. 방법은 상류 옵신과 표적 CT 사이에 단일 필수 융합 부위만 요구한다. 상류 옵신의 원하는 절단 부위는 a) H8 또는 하나 이상의 팔미토일화 부위의 위치 - 또는 전술한 바와 같이 소 로돕신의 팔미토일화 부위 중 하나에 상응하는 "추정" 팔미토일화 부위(들)에 대한 지식 또는 NR(K)Q 부위의 하류에서 7 내지 13개, 특히 8 내지 12개, 더욱 특별하게는 9 내지 11개 또는 약 10개의 아미노산을 계산함으로써 및 b) 표적 GPCR의 C 말단의 위치에 대한 지식을 기반으로 쉽게 확인된다.
상이한 클래스의 GPCR 사이의 최소한의 서열 상동성에도 불구하고 보존된 3D 구조는 GPCR 단백질의 기능적 도메인에서 아미노산 서열 변이의 대단한 허용범위를 보여준다. 나아가, 기능적 키메라 옵신 GPCR을 조작하는 것은 예를 들어, 보존적 아미노산 치환에 의해 얻은 보존된 서열 또는 이의 기능적 유사체를 보존하면서 보존된 구조적 요소 또는 모티프 또는 그 주변에서 스플라이싱함으로써 단순화된다. 일부 실시형태에서 스플라이싱 부위는 모 GPCR의 보존된 모티프 내의 상응하는 위치에 의도적으로 위치되고 동일하거나 기능적으로 동등한 버전으로 재구성된다. 이 원리는 특히 NR(K)Q 모티프에서의 스플라이싱 또는 O-CT-근위 영역의 근위 및 원위 말단 주변에 위치한 팔미토일화 부위에서의 스플라이싱에 각각 적용된다.
본 발명의 제2 양태에 따른 핵산 분자를 조작하는 방법의 일부 실시형태는 상류 옵신 CT에서 절단 부위 및/또는 표적 GPCR CT에서 절삭 부위를 선택하기 전에, 다음 단계를 포함함으로써 모 GPCR 중 하나 또는 둘 다의 보존된 모티프 및 이들을 암호화하는 유전자를 확인한다:
-
서열 정렬 도구를 사용하여 상류 옵신(또는 이의 단편)의 아미노산 서열을 표적 GPCR(또는 이의 단편)의 아미노산 서열과 정렬하는 단계,
-
특히 E(D)RY, IL3과 TM6의 접합부 주변의 E, TM7/CT 접합부 주변의 NPxxY, NR(K)Q 및 CT의 팔미토일화된 C 및 - 표적 GPCR이 옵신인 경우 TM7의 발색단의 결합을 위한 K를 포함하는 보존된 모티프의 군으로부터 선택된 보존된 모티프를 구성하는 아미노산 위치를 결정하는 단계.
이들 실시형태 중 일부에서, 옵신의 아미노산 서열은 보존된 모티프를 구성하는 아미노산 위치의 확인을 위해 선택적으로 소 로돕신의 아미노산 서열과 정렬된다. 적합한 정렬 도구에는 예를 들어, 전술한 바와 같은 Clustal Omega(EMBL-EBI) 및 기타 정렬 도구가 포함된다.
키메라 옵신 GPCR 또는 펩티드를 암호화하는 핵산 분자를 조작하는 방법의 이들 실시형태 및 기타 실시형태 중 일부에서, 상류 옵신 CT의 절단 부위 및/또는 표적 GPCR CT의 절삭 부위를 선택하기 전에, 1차 아미노산 서열을 2차/3차 단백질 구조의 예측을 위한 프로그램에 입력하는 단계를 포함하는, 모 옵신 및 모 표적 GPCR 중 하나 또는 둘 모두에서 보존된 3D GPCR 도메인 또는 서브도메인, 특히 서브도메인 나선 8의 확인을 포함한다. 예를 들어 YASPIN(Lin et al., 2005)과 같은 적합한 프로그램 또는 예를 들어, 다음의 목록 https://molbiol-tools.ca/Protein_tertiary_structure.htm 또는 문헌[Kuhlmann et al., 2019] 또는 슈뢰딩거 소프트웨어 패키지(https://www.schrodinger.com/prime)로부터 선택된 또 다른 프로그램을 당업계에서 이용할 수 있다. 특히 재조합 핵산 기술, 인실리카(in silica)에서의 재조합 클로닝 설계 및 화학적 핵산 합성을 포함하는 전술한 바와 같은 당업계에서 이용 가능한 방법은 당업자에게 공지되어 있다.
따라서, 본 발명의 제6 양태에서, 특히 전술한 바와 같이, O-CT-근위 영역을 포함하는 절단된 옵신 CT를 포함하는 키메라 C 말단 도메인(키메라 CT)을 포함하고 본질적으로 완전한 표적 GPCR CT 또는 이의 기능적 유도체를 추가로 포함하는 키메라 옵신 GPCR 단백질 또는 펩티드를 암호화하는 핵산 분자를 유전자 조작하는 방법이 제공된다. 키메라 CT는 모 상류 옵신 CT 및 모 표적 GPCR CT로부터 유래된다. 유전자 조작 방법은 다음의 단계를 포함한다:
A-1
O-CT-근위 영역의 원위 말단의 아미노산 위치 또는 O-CT-근위 영역 근위 영역에 대한 원위 연장부 내의 아미노산 위치에서 모 상류 옵신의 CT의 절단 부위 (x)를 선택하는 단계,
A-2
선택된 절단 부위에서 절단된 절단 CT를 갖는 상류 옵신 부분 또는 펩티드를 암호화하는 핵산 분자를 수득하는 단계;
B-1
표적 GPCR CT의 근위 영역 내, 특히 NR(K)Q 모티프 또는 이의 상류에서 또는 NPxxY와 NR(K)Q 모티프 사이에서 절삭 부위 (y)를 선택하는 단계,
B-2
표적 GPCR CT 또는 이의 기능적 변이체, 특히 기능적 단편을 암호화하는 핵산 분자를 수득하는 단계; 및
C-1
단계 A-2에서 수득된 절단된 옵신-CT를 암호화하는 핵산 분자를 단계 B-2에서 수득된 표적 CT 또는 이의 기능적 변이체를 암호화하는 핵산 분자와 융합시키는 단계.
단계 A-1에서 키메라 옵신 GPCR 또는 펩티드를 암호화하는 핵산 분자를 유전자 조작하는 방법의 일부 실시형태에서 절단 부위 (x)는 다음의 기준 중 하나를 충족한다:
-
절단 부위 (x)는 NR(K)Q 모티프의 하류에서 또는 적어도 7 또는 8 또는 9 또는 10 또는 11 또는 12 또는 13개 아미노산에 위치한 뉴클레오티드에 위치하고,
-
절단 부위 (x)는 팔미토일화 부위 또는 팔미토일화 부위에 상응하는 아미노산의 하류 및 특히 이의 원위쪽으로 인접하여 위치한다.
-
절단 부위는 NR(K)Q 모티프의 하류에서 최대 45개 또는 47개 또는 49개 뉴클레오티드에 위치한다.
키메라 옵신 GPCR의 일부 실시형태에서, 특히 멜라놉신과 같은 비정상적으로 많은 수의 아미노산을 갖는 광범위한 C 말단을 포함하는 상류 옵신을 갖는 실시형태에서, 절단 부위 (x)는 O-CT-근위 영역의 원위 말단의 하류의 아미노산 위치, 특히 위의 설명에 따른 O-CT-근위 영역에 대한 원위 연장부의 원위 말단에 위치한다. O-CT-근위 영역에 대한 원위 연장부의 원위 말단은 특히 각각 O-CT-근위 영역의 원위 말단의 하류에서 최대 30 또는 31 또는 32 또는 33 또는 34 또는 35개의 아미노산 또는 NR(K)Q 모티프의 하류에서 최대 45 또는 47 또는 49개의 뉴클레오티드까지 위치한다.
멜라놉신과 같은 광범위 CT를 갖는 상류 옵신을 포함하는 일부 실시형태에서, 절단 부위 (x)는 광활성화의 반응 종결에 기여하는 보존된 인산화 부위 클러스터의 하류에 위치한다. 이러한 보존된 인산화 부위는 특히 문헌[Mure et al. 2016]에 기재된 바와 같이 마우스 멜라놉신의 위치 381 및 397에 상응하는 아미노산 위치 사이에 위치한다. 다시 말해서, 이러한 실시형태에서, O-CT-근위 영역에 대한 원위 연장부의 원위 말단은 바람직하게는 보존된 인산화 부위의 클러스터의 원위 말단의 하류 또는 특히 이의 원위쪽으로 인접하여 선택된다.
키메라 옵신 GPCR 또는 펩티드를 암호화하는 핵산 분자를 유전자 조작하는 방법의 일부 실시형태에서, 단계 A-1에서 선택된 상류 옵신의 절단 부위 x 및 단계 B-1에서 선택된 표적 GPCR의 절삭 부위 y는 둘 다 각각의 팔미토일화 부위 또는 팔미토일화 부위에 상응하는 아미노산 위치에 위치하거나, 또는 둘 다 NR(K)Q 부위의 하류에서 7 내지 13개, 특히 8 내지 12개, 더욱 특별하게는 9 내지 11개, 또는 10개의 아미노산에 위치한다.
키메라 옵신 GPCR 또는 펩티드를 암호화하는 핵산 분자를 유전자 조작하는 방법의 일부 실시형태는 하나 이상의 세포내 루프를 교환하거나 부분적으로 교환하는 하나 이상의 추가 단계, 예를 들어, 상응하는 위치에서 상류 옵신의 하나 이상의 세포내 루프 또는 부분 세포내 루프를 표적 GPCR의 세포내 루프 또는 부분 세포내 루프로 대체하는 하나 이상의 추가 단계를 포함한다.
여기서 특히 하나 이상의 스플라이싱 부위는 다음에 위치하는 스플라이싱 부위의 군으로부터 선택된다:
-
IL1 교환을 위한 접합부 a 및 접합부 b,
-
IL2 교환을 위한 접합부 c 및 접합부 d,
-
IL3 교환을 위한 접합부 e 및 접합부 f,
-
표적 GPCR의 IL3과의 교환에서 상류 옵신 IL3의 고도로 가변적인 영역을 제거하는 IL3 내의 2개의 스플라이싱 부위.
본 발명의 제7 양태는 키메라 옵신 GPCR과 관련된 전술한 제품을 사용하는 의학적 적용에 관한 것이다. 의학적 적용은 특히 이를 필요로 하는 인간 또는 비인간 개체의 치료를 위한 의약 및 방법을 포함한다. 본 발명의 이전에 설명된 모든 양태 및 실시형태에 따른 제품은 제7 양태, 즉 의학적 적용에 적용 가능하다.
의료용, 특히 유전자 치료용으로 적용 가능한 본 발명의 전술한 양태에 따른 제품은 다음을 포함하는 제품의 군으로부터 선택된다:
-
본 발명의 제1 양태에 따른 키메라 옵신-GPCR 단백질
-
본 발명의 제2 양태에 따른 상기 옵신 GPCR 단백질을 암호화하는 핵산 분자
-
본 발명의 제3 양태에 따른 캡시드 또는 상기 캡시드를 암호화하는 핵산 분자
-
본 발명의 제4 양태에 따른 벡터
-
본 발명의 제6 양태에 따른 운반체 또는 세포.
일부 실시형태에서, 본 발명의 제7 양태는 시력의 부분 또는 완전 상실로 고통 받는 환자의 의학적 처치, 특히 유전자 요법 형태의 의학적 처치에 관한 것이다. 이들 실시형태 중 일부에서 제품은 옵신 및 mGluR6을 포함하거나 2개의 옵신을 포함하는 키메라 옵신 GPCR을 포함하거나 이를 암호화한다.
이 문서에서, 2개의 옵신을 포함하는 실시형태, 즉 상류 옵신 및 표적 옵신을 포함하는 실시형태는 줄여서 키메라 옵신-옵신 (GPCR)로도 지칭된다. 상류 옵신 및 mGluR6을 포함하는 실시형태는 줄여서 옵신-mGluR6으로도 지칭된다.
의학적 처치를 위한 키메라 옵신-mGluR6의 일부 바람직한 실시형태는 표적 GPCR로서 mGluR6에 융합된 상류로서 멜라놉신 또는 임의의 기타 옵신 - 예를 들어, 상자 해파리 옵신, 파라피놉신 또는 깡충거미 로돕신 또는 이의 인간화 변이체 또는 원추형 옵신 - 을 포함한다. 의학적 처치를 위한 키메라 옵신 GPCR의 일부 다른 바람직한 실시형태는 2개의 옵신을 포함하고 특히 원추형 옵신 또는 로돕신으로부터 유래된 표적 GPCR에 융합된 임의의 옵신을 포함한다.
의학적 처치를 위한 키메라 옵신-mGluR6의 이들 바람직한 실시형태 중 일부에서 및 추가의 실시형태에서, 상류 옵신은 O-CT-근위 영역의 원위 말단, 특히 예를 들어, 본원에 기재된 바와 같은 예시적인 Mela(palm)-mGluR6에서와 같이, 전술한 바와 같인 팔미토일화 부위에서 절단된다; 이들 바람직한 실시형태 및 추가의 실시형태 중 다른 것에서 상류 옵신은 O-CT-근위 영역에 대한 원위 연장부의 원위 말단, 특히 예를 들어, 본원에 기재된 예시적인 Mela(palm +33AA)-mGluR6에서와 같이, 전술한 바와 같은 팔미토일화 부위의 하류에서 약 33개 아미노산에서 절단된다.
본 발명의 제7 양태에 따른 의학적 용도, 특히 유전자 요법의 일부 바람직한 실시형태에서, 본 발명의 제7 양태에 따른 시력 개선, 시력의 부분 또는 완전 상실을 치료하기 위하여, 이식유전자는 ON-두극세포 특이적 프로모터, 특히 770En_454P(hGRM6) 또는 444En_454P(hGRM6) 프로모터에 작동 가능하게 연결된다.
시력의 부분 또는 완전 상실을 치료하기 위한 본 발명의 제7 양태에 따른 의학적 용도의 일부 바람직한 실시형태에서, 유전자 요법을 위한 벡터, 특히 rAAV 벡터가 적용된다. 이들 실시형태 및 기타 실시형태 중 일부에서 AAV 캡시드, 특히 AAV2(7m8), AAV2(BP2) 또는 전술한 바와 같은 펩티드 삽입물을 갖는 AAV2가 적용된다.
본 발명의 제7 양태의 일부 실시형태에서, 키메라 옵신 GPCR은 시력의 부분 또는 완전 상실로 고통 받는 환자의 의학적 처치에 사용하기 위한 것이고, 처치를 위한 의학적 적응증은 특히 색소성 망막염(RP), 연령 관련 황반 변성 및 임의의 기타 형태의 광수용체 변성을 포함하는 군으로부터 선택된다.
본 발명의 제7 양태는 또한 본 발명에 따른 제품을 포함하는 제약 조성물에 관한 것이다. 특히 제약 조성물은 눈으로의 투여에 적합한 제약 제형으로 제공된다.
예시적인 실시형태에서, 전술한 바와 같은 AAV 벡터는 눈으로의 망막 하 또는 유리체 내 주사를 위해 완충 식염수 용액에 용해된다. 일부 예시적인 실시형태에서, AAV는 유전자 치료 제형으로서 0.04%의 Tween-20이 있는 완충 식염수(PBS)에 용해된다.
또한, 본 발명의 제7 양태는 본 발명에 따른 제품의 군으로부터 선택된 제품의 투여를 포함하는, 이를 필요로 하는 인간 개체 또는 비인간 개체, 특히 동물을 치료하는 방법에 관한 것이다. 방법의 일부 실시형태에서, 키메라 옵신 GPCR은 유리체 내 투여에 의해, 특히 유리체 내 주사에 의해, 또는 망막 하 투여에 의해 투여된다.
이 문서에서, 유리체 내 투여라는 용어는 약제가 눈의 유리체 내로 전달되는, 예를 들어 핵산 분자, 벡터 또는 전달용 운반체와 같은 약제의 투여 경로에 관한 것이다. 유리체 내 투여는 유리체액 젤이라는 젤리 같은 액체로 채워진, 유리체강이라고 하는 눈 뒤쪽의 공간에 약제를 직접 주입하는 절차이다.
이 문서에서, 용어 망막 하 투여는 약제, 특히 본 명세서의 맥락에서의 바이러스를 망막 색소 상피 세포와 광수용체 사이의 공간으로 투여하는 경로에 관한 것이다.
본 발명의 제7 양태는 또한 시력을 개선하기 위한 의료 요법, 또는 부분 또는 완전 실명의 치료, 또는 색소성 망막염(RP)의 치료, 또는 황반 변성의 치료 또는 다른 형태의 광수용체 변성의 치료를 위한 약제의 제조에서 본 발명에 따른 제품의 용도에 관한 것이다.
본 발명의 제7 양태는 또한 전술한 바와 같은 의학적 적용에 관한 것으로, 이는 다음을 포함하는 제품의 군으로부터 선택된 제품을 포함하고,
-
본 발명의 제1 양태에 따른 키메라 옵신-GPCR 단백질
-
본 발명의 제2 양태에 따른 상기 옵신 GPCR 단백질을 암호화하는 핵산 분자
-
본 발명의 제3 양태에 따른 캡시드 또는 상기 캡시드를 암호화하는 핵산 분자
-
본 발명의 제4 양태에 따른 벡터
-
본 발명의 제6 양태에 따른 운반체 또는 세포,
여기서 제품은 키메라 옵신 GPCR 단백질을 포함하거나 상기 키메라 옵신 GPCR 단백질을 암호화하는 핵산 분자 서열을 포함하는 핵산 분자를 포함하고,
키메라 옵신 GPCR 단백질은 다음을 포함하는 군으로부터 선택된다:
-
Mela(palm)-mGluR6, 특히 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 및 서열번호 28을 포함하는 군으로부터 선택된 서열에 따른 Mela(palm)-mGluR6 또는
-
Mela(palm+33)-mGluR6, 특히 서열번호 16에 따른 Mela(palm+33)-mGluR6 또는
-
세포내 루프를 추가로 포함하는 Mela-mGluR6, 특히 서열번호 30 또는 서열번호 32로부터 선택된 서열에 따른 세포내 루프를 추가로 포함하는 Mela-mGluR6.
본 발명의 제7 양태에 따른 의학적 적용의 실시형태가 특정 서열번호에 따른 특정 서열을 지칭할 때마다, 전술한 바와 같은 특정 서열의 변이체가 이들 실시형태에 포함되는 것으로 이해된다.
아래에 본 발명의 일부 실시형태에 관한 비제한적인, 추가의 예시적인 세부사항이 예를 들어, 실시예, 표, 서열 목록, 종속항, 도면 범례 및 도면에 제시되어 있다. 이러한 예시적인 실시형태는 예시적이며 본 발명의 범위를 제한하려는 것이 아니다.
단일 분리 가능한 특징에 대한 대안이 "실시형태"로서 기재되는 곳마다, 이러한 대안은 자유롭게 조합될 수 있고 여전히 본원에 기재된 본 발명의 범위 내에 있음을 이해해야 한다.
절단된 CT를 갖는 상류 옵신으로서 멜라놉신을 갖는 키메라 옵신 GPCR 단백질의 일부 예시적인 실시형태와 관련하여, 예시적인 절단 부위는 아래에 제시된 인간 및 뮤린 멜라놉신 아미노산 서열에서 확인된다. 이 절단 부위는 팔미토일화 부위(팔미토일화 시스테인)의 하류에 있는 33개 아미노산에 위치한다. 이 예시적인 절단 부위는 "palm+33AA" 부위로 지칭되고 이는 O-CT-근위 영역에 대한 원위 연장부의 원위 말단을 형성한다.
아래에 제시된 인간 및 뮤린 멜라놉신 유전자(OPN4)의 서열 섹션에서, C 말단 멜라놉신 단편의 아미노산 서열은 O-CT-근위 영역의 근위 말단, 즉 NR(K)Q 모티프(hOPN4 및 mOPN4에서 HPK임)에서 시작한다. palm + 33AA 절단 부위는 아미노산 위치 397에서 아래쪽 화살표로 표시된다. 다음의 아미노산 잔기는 테두리가 표시되어 있다:
-
보존된 HPK, 즉 NR(K)Q 모티프
-
팔미토일화 시스테인
-
절단 부위의 상류의 보존된 인산화된 세린 및 트레오닌 잔기.
hOPN4 - 서열번호 57
-*
mOPN4 - 서열번호 58
키메라 옵신 GPCR, 특히 키메라 멜라놉신 GPCR의 다른 예시적인 실시형태에서, 절단된 CT의 절단 부위는 "palm+33AA" 부위의 상류에서 임의의 아미노산 위치 또는 추가의 하류, 예를 들어, 팔미토일화 부위의 하류에서 최대 예를 들어, 34 또는 35개 아미노산에 위치할 수 있다.
키메라 옵신-GPCR에서 기능적 유도체로서 유리하게 보존되거나 재구성되는 모 옵신 및 모 표적 GPCR의 예시적인 관련 보존된 부위가 아래의 표 I에 제공된다.
기능적 키메라 옵신 GPRC 단백질을 생성하는 예시적인 테스트한 스플라이싱 부위는 아래의 표 II에 제시되어 있다.
일부 실시형태에서 스플라이싱 부위는 두 모 GPCR에서 보존된 모티프 또는 부위에 배치된다.
일부 실시형태에서 보존된 모티프 또는 부위는 적합한 스플라이싱 부위의 확인을 위한 기준점 역할을 한다. 이러한 스플라이싱 부위는 전술한 예시적인 palm+33 부위와 같은 두 모 GPCR에서의 특정 보존된 모티프 또는 부위에 대해 동일한 거리에 위치할 것이다.
일반적으로, 모 옵신의 서열은 (예를 들어, 절삭 및 후속 결찰에 의해 또는 인실리코 설계된 키메라 옵신 GPCR의 핵산 합성에 의해) 2개의 모 GPCR의 도메인 또는 서브도메인을 연결하기 위한 적합한 스플라이싱 부위의 확인을 위해 보존된 부위를 기반으로 정렬된다.
일부 실시형태에서, 모 옵신에 알려진 팔미토일화 부위가 결여되어 있는 경우, 소 로돕신의 팔미토일화 부위 또는 팔미토일화 부위에 상응하는 부위 모두가 스플라이싱에 적합한 부위 또는 기준점으로서 확인되도록 정렬되었다.
참고:
NA = 본 발명에 따른 비옵신 GPCR의 경우 해당 없음
$ 팔미토일화되지 않음, 소 로돕신의 C322/C323에 상응하는 아미노산
[표 2]
스플라이싱 부위의 약어 관련 비고:
Palm = 팔미토일화 부위 또는 팔미토일화 부위에 상응하는 아미노산 위치
Palm + 33 = Palm의 하류에서 33개 아미노산의 아미노산 위치
Jct. = 막관통 도메인과 세포내 도메인 사이의 전이부의 접합부
가변 영역 = 표적 GPCR의 IL로 대체된 옵신의 IL의 고도로 가변적인 영역을 절제하는 2개의 스플라이스 부위
2개의 옵신을 갖는 실시형태에 대한 예시적인 스플라이스 부위 x-3
실시예
도 5 내지 12는 현미경적 시각화 외에 키메라 옵신 GPCR 단백질의 기능을 증명하기 위해 적용된 세 가지의 상이한 실험 접근법의 결과를 보여준다:
시험관 내:
1. HEK-GIRK 패치-클램프 Gβγ 활성 분석: 기능적 옵신을 GIRK(Kir3.1/3.2) 칼륨 채널을 안정적으로 발현하는 HEK293 세포주에서 발현시켰다. 빛 자극은 내인성 세포내 Gi/o-단백질을 활성화하는 옵신을 활성화한다. 활성화된 Gβγ 단백질은 차례로 GIRK 이온 채널을 열어 빛 자극에 대해 시간 고정되고 기록될 수 있는 전기적 반응을 유발한다. 방법에 대한 자세한 설명은 문헌[van Wyk et al., PLoS Biol 2015]를 참조한다.
2. Gα-특이성 생물발광 플레이트 판독기 분석: 각 옵신을 HEK293 세포주에서 리포터 발현 플라스미드와 공동 발현시켰다. GIRK 분석과 유사하게, 활성화된 옵신은 차례로 cAMP(Gs 및 Gi) 또는 Ca2+(Gq)를 생성하는 효소를 억제하거나 활성화하는 G 단백질을 활성화한다. 이들 생성물(cAMP 및 Ca2+)의 축적은 각각 cAMP 또는 Ca2+에 의해 활성화된 생물발광 단백질의 발광으로 측정할 수 있다. Gs 및 Gi 활성의 변화를 시각화하기 위해 pcDNA5/FRT/TO Glo22F를 리포터 플라스미드로 사용하고 Gq 신호전달의 변화를 위해 pcDNA5/FRT/TO mtAeq를 리포터 플라스미드로 사용했다. 각각 루시퍼라제 또는 코엘렌테라진을 기질로 첨가하고 발광 변화로 표시되는 cAMP(Gs 및 Gi) 또는 Ca2+(Gq) 수준의 변화를 Infinite F200Pro Tecan 플레이트 판독기(Mδnnedorf, 스위스)로 측정하였다. 광 유도 형광 변화를 옵신 형질감염 수준으로 정규화하기 위해, 형광의 절대 변화를 측정된 플레이트의 각 웰의 전체 mCitrine 리포터 형광으로 나누었다.
생체 외:
이러한 옵신 단백질이 AAV 유전자 요법에 의해 살아 있는 망막에 도입된, 광수용기 세포가 없는 망막(rd1 색소성 망막염 마우스, C3H/HeOuJ 마우스 계통)의 마우스 망막 뉴런으로부터의 광 반응을 기록하였다(문헌[van Wyk et al. (2015)] 및 아래 도 11의 범례 참조).
생체 내:
이러한 옵신 단백질이 AAV 유전자 요법에 의해 살아 있는 망막에 도입된, 광수용체 변성이 있는 마우스 모델에서 행동 안구운동 반사를 기록했다(아래 도 10의 범례 참조).
도면의 상세한 설명
다음의 상세한 설명을 고려할 때 본 발명은 더 잘 이해될 것이고 위에 기재된 것 이외의 목적이 명백해질 것이다. 이러한 설명은 첨부된 도면을 참조한다.
도 1: 옵신의 일반적인 구조.
도 1은 7개의 막관통 도메인 TM1 내지 TM7, 세포외 도메인, N 말단 NT 및 세포외 루프 EL1, EL2 및 EL3, 뿐만 아니라 세포내 도메인 C 말단 CT 및 세포내 루프 IL1, IL2 및 IL3을 갖는 모 옵신의 일반적인 구조의 개략도를 보여준다. 막과 세포질 사이의 경계에 있는 TM 도메인과 세포내 도메인 사이의 접합부는 접합부 (a) 내지 (g)로 표시되어 있다. 옵신-GCPR 키메라 단백질에 대한 선택적 스플라이싱 부위는 예를 들어 세포내 루프의 교환을 위한 이들 접합부에 위치할 수 있다. 또한, CT의 보존된 서브도메인인, CT의 근위 영역에 있는 나선 8(H8)이 표시되어 있고, 옵신에 존재하는 여러 보존된 서열 모티프, 특히 다음의 서열 모티프가 표시되어 있다:
-
IL3과 TM6 사이의 접합부 (f)의 글루타메이트 잔기(E)에 연결된 TM3의 세포질 경계에 있는 E(D)RY 부위 사이의 이온 잠금,
-
Schiff 염기를 통해 발색단 11-시스-레티날에 결합된 TM7의 리신 잔기(K) 및 Schiff 염기를 안정화시키는 TM3의 음성 반대이온, 일반적으로 글루타메이트를 갖는 발색단 결합 포켓,
-
TM7의 C 말단 끝의 NPxxY 모티프,
-
H8의 원위 말단에 있는 하나 이상의 팔미토일화 부위(들)(C),
-
CT의 세포질 영역의 C 말단 인산화 부위(P),
또한, 도 1은 CT에서의 3개의 예시적인 절단 부위 (x-1), (x-2) 및 (x-3)을 예로서 나타낸다.
도시된 절단 부위 (x-1)은 H8의 원위 말단에 위치하고 소 로돕신의 팔미토일화 부위(C322 또는 C323)에 상응하는 팔미토일화 시스테인 잔기에 원위쪽으로 인접해 있다. 도시된 절단 부위 (x-2)는 팔미토일화 부위의 하류, 멜라놉신의 경우 팔미토일화 부위의 하류에서 33개 아미노산 또는 NR(K)Q 모티프의 하류에서 최대 40, 41, 42, 43, 44 또는 45개 아미노산에 위치한다. 도시된 절단 부위 (x-3)은 NR(K)Q 모티프 내에 또는 이에 대해 직접 원위에 있다. 도시되지 않은 다른 절단 부위는 특히 (x-1)과 (x-2) 사이 또는 (x-3)과 (x-1) 사이의 아미노산 위치에 위치한다.
도 2: 예시적인 키메라 옵신 GPCR의 도식.
도 2는 예시적인 모 상류 옵신의 절단된 C 말단이 팔미토일화 부위에 원위쪽으로 인접하여 절삭되고 예시적인 표적 GPCR의 CT와 융합되는, 단일 스플라이싱 부위 (x-1)만을 갖는, 최소한의 유전자 조작만을 요구하는 키메라 옵신 GPCR의 예시적인 실시형태를 보여준다; (x-2) 및 (x-3)과 같은 대안적인 예시적인 스플라이스 부위가 도 1에 표시되고 설명되어 있다.
도 2에 도시된 예시적인 실시형태는 C 말단의 가장 원위 말단에 선택적으로 부가될 수 있는 추가 서열을 추가로 포함한다. 이러한 선택적 추가 서열은 마커 단백질(예를 들어, 형광 단백질) 또는 트래피킹 서열(예를 들어, 골지 및 ER 방출 신호 또는 막 트래피킹 서열)을 암호화할 수 있다. 본원에 제시되지 않은 추가의 예시적인 실시형태에서, 비인간 옵신이 사용되는 경우 잠재적 인간 요법에서 단백질의 항원성을 감소시키기 위하여 인간 옵신 도메인과의 세포외 도메인 교환을 위해 TM 도메인(TM1 내지 TM7) 및 세포외 도메인(NT, EL1 내지 EL3) 사이의 접합부 (A’)~(G’) 주변에 선택적인 추가 스플라이싱 부위가 도입될 수 있다.
도 3: 키메라 옵신 mGluR6의 예시적인 실시형태.
(a): 도 3은 키메라 C 말단을 갖는 멜라놉신-mGluR6 키메라 GPCR의 예시적인 실시형태를 도시하며, 이는 팔미토일화 부위(C)까지 절단된 멜라놉신 C 말단을 포함하고, 이어서 먼저 전체 크기의 mGluR6 CT, 다음으로 mKate2 형광 마커, 마지막으로 추가의 골지 방출 신호 및 표적 CT의 맨 원위 말단에 위치한 로돕신 막 트래피킹 서열이 원위 방향으로 팔미토일화 부위에 원위쪽으로 인접하여 이어진다. 또한, 멜라놉신의 IL1은 접합부 a와 b에 위치한 절삭 스플라이싱 부위에서 mGluR6의 것으로 완전히 대체된 반면, mGluR6의 전체 IL3은 멜라놉신의 더 긴 IL3의 고도로 가변적인 영역 내에 위치한 스플라이싱 부위에 도입되었다.
이 예시적인 실시형태에서, 가변 영역이 기능적 차이, 즉, 여기서는 잠재적으로 G 단백질 특이성을 결정한다는 근거 하에 mGluR6의 짧은 IL3이 멜라놉신의 더 긴 IL3의 최소 보존된 영역으로 도입된다. 실제로 키메라 옵신 mGluR6 IL3을 사용한 이 실시형태는 도 6b에서 입증된 바와 같이 옵신 IL3에 도입된 mela(palm)mGluR6과 비교하여 기능성을 증진시킨다.
(b)-상단: TM5와 TM6 사이의 IL3의 초가변 영역을 나타내는 다른 종으로부터의 멜라놉신 유전자(OPN4)의 정렬(출처: DOI: 10.1371/journal.pone.0025111).
(b)-하단: mGluR6의 IL3 삽입 위치. 아래를 가리키는 화살표는 본원에서 사용된 마우스 멜라놉신(M. OPN4)의 절삭 부위를 나타내고, 위를 가리키는 화살표는 a에 표시된 접합부 e 및 f를 나타낸다.
도 4: 키메라 옵신 GPCR의 예시적인 실시형태는 세포막을 표적으로 한다.
원형질막으로의 적절한 세포내 트래피킹을 확인하기 위해, 형광 리포터 단백질(mKate2)을 사용하여 단백질 국소화를 연구하는 옵신-mGluR6-mKate2 융합 단백질을 생성하였다. 융합 단백질은 HEK293 세포에서 발현되었다. 미분 간섭 대조 현미경 이미지(A,C)와 형광 이미지(B,D)를 비교하여 옵신-mGluR6 단백질이 세포막에 위치하는 것을 확인하였다. 이는 두 개의 상이한 키메라 옵신 GPCR 단백질, 즉 (A,B)의 멜라놉신-mGluR6-mKate2 키메라 GPCR과 (C,D)의 해파리 옵신-mGluR6-mKate2 키메라 GPCR로 표시된다. 두 키메라 GPCR 모두에서 절단 부위는 멜라놉신 CT의 팔미토일화 부위에 원위쪽으로 인접하여 위치한다.
도 5: 모 옵신과 비교하여 옵신-mGluR6에 의해 매개되는 증가된 광 활성화 전류를 나타내는 키메라 C 말단을 갖는 키메라 옵신 mGluR6의 예시적인 실시형태.
다양한 예시적인 키메라 옵신-mGluR6 구축물(추가 트래피킹 서열이 결여됨)을 GIRK1/2 채널(Gi/o 패밀리의 활성화된 G 단백질에 의해 직접 개방되는 칼륨 채널)을 안정적으로 발현하는 HEK293 세포주로 일시적으로 형질감염시켰다. 세포가 전압-클램프 모드(-75 mV 유지 전위)에서 패치-클램핑되면 5초 동안 제시된 470 nm의 빛 자극(1 x 1014개 광자 cm-2 sec-1)이 히스토그램의 변이체에 대해 도시된 내향 GIRK 전류를 활성화한다. 상이한 구축물에 의해 활성화된 GIRK 전류의 상대적 크기(pF 단위의 패치된 세포의 크기로 정규화됨)가 표시되어 있다. 별표는 Student t-검정에 의해 결정된 유의 수준을 나타낸다(* p≤0.05, ** p≤0.01).
(A) 중파 원추형 옵신(OPN1MW) 유도 GIRK 전류는 키메라 OPN1MW(palm)-mGluR6CT에 의해 유도된 전류보다 유의하게 작다.
(B) 멜라놉신 변이체에 의한 비교 광 활성화 GIRK 전류, 1 = 변형되지 않은 멜라놉신, 2 = CT mGluR6이 부가된 팔미토일화 부위에서 절삭된 멜라놉신, 3 = 또한, 멜라놉신의 전체 IL1이 mGluR6의 것으로 대체되었다, 4 = 또한, 전체 mGluR6 IL3이 멜라놉신의 긴 IL3의 가변 위치에 배치되었다. mGluR6 C 말단의 C 말단 부가는 광 유도 GIRK 전류를 유의하게 증가시킨다.
도 6: HEK-GIRK 세포를 사용한 키메라 옵신 GPCR의 시험관 내 기능적 스크리닝의 예.
옵신-표적 GPCR 키메라가 있는 형질감염된 HEK-GIRK 세포를 문헌[Van Wyk et al. (2015)]에 기술된 바와 같이 Gi/o G 단백질 신호전달을 활성화하는 능력에 대해 평가하였다. 표적 GPCR CT에 더하여 mKate 형광 단백질 및 추가 골지 및 막 트래피킹 서열을 운반하는 다양한 옵신-GPCR 변이체로 형질감염된 HEK-GIRK 세포에서 기록된 패치-클램프 흔적의 예시적인 광 반응이 제시되어 있다(빛 자극은 검은색 수평선으로 표시됨; 470 nm; 1 x 1014 개 광자/sec/cm2). (A) 프로토타입 Opto-mGluR6(WO 2012/174674 A1 및 van Wyk et al. (2015)), (B) Mela(palm+33AA)-mGluR6, (C) Mela(palm)+IL1-mGluR6, (D) Mela(palm)+IL3-mGluR6, (E) Mela(palm)-mGluR6, (F) JellyOP(palm)-mGluR6, (G) OPN1MW(palm)-mGluR6, (H) Mela(palm)-OPN1MW(IL1, IL2, IL3, CT).
도 7: 키메라 옵신 GPCR의 예시적인 실시형태의 G 단백질 재표적화 및 경로 선택성을 조사하는 플레이트 판독기 실험.
옵신-GPCR 키메라 리포터 발현 플라스미드로 HEK293 세포를 공동 형질감염시키고 생물발광 플레이트 판독기 분석에서 이들의 Gα 특이성을 평가하였다. GIRK 분석과 유사하게, 활성화된 옵신은 차례로 cAMP(Gs)를 생성하고, cAMP(Gi/o)를 감소시키거나 세포내 Ca2+(Gq)를 증가시키는 효소를 억제 또는 활성화하는 G 단백질을 활성화한다. 이들 생성물(cAMP 및 Ca2+)의 축적은 각각 cAMP 또는 Ca2+에 의해 활성화된 생물발광 단백질의 발광으로 측정할 수 있다. 빛 적용(480 nm, 10초)은 검은색 화살표로 표시되어 있다. 광 유도 형광 변화를 옵신 형질감염 수준으로 정규화하기 위해, 형광의 절대 변화를 측정된 플레이트의 각 웰의 전체 mCitrine 리포터 형광으로 나누었다. 검은색 화살표는 빛 자극을 나타낸다. (A,B) Mela(palm)-mGluR6(검은색 흔적) 및 변형되지 않은 멜라놉신(회색 흔적)의 Gi/o(A) 및 Gq(B) 결합에 대한 선호도. (A)에서, 세포 내 cAMP를 먼저 포스콜린(forskolin)(아데닐레이트 시클라제를 자극함)을 첨가하여 증진시켜 광 활성화 키메라 단백질에 의한 cAMP 감소를 측정할 수 있음을 주목한다. 그래프는 팔미토일화 부위에서 mGluR6의 C 말단에 의한 멜라놉신의 C 말단 교환이 G 단백질 선호도를 Gq(멜라놉신)에서 Gi/o(mGluR6)로 이동시킴을 보여준다. 멜라놉신의 팔미토일화 부위에 mGluR6의 C 말단을 삽입하면 G-알파 서브유닛 선호도가 Gq에서 Gi/o로 이동한다. (C) JellyOP(palm)-mGluR6(검은색 흔적)과 비교한, 변형되지 않은 JellyOP(회색 흔적)의 Gi/o 대 Gs 결합 선호도. PTX는 Gi/o의 억제제로서, JellyOP가 Gs에만 결합함을 나타내는 반면(PTX 무첨가(●) 및 PTX 첨가 후(■) 신호의 변화 없음), JellyOP(palm)-mGluR6은 Gi/o에 명백히 결합하여, PTX 첨가 전(●)과 PTX 첨가 후(■) 명확하게 증가한 차등 휘도값()만큼 가시적이다. 해파리 옵신의 팔미토일화 부위에 mGluR6의 C 말단을 삽입하면 G-알파 서브유닛 선호도가 Gs에서 Gi/o로 이동한다. (D) JellyOP(palm)-5HT7은 광 활성화 cAMP 증가에 의해 표시되는 Gs를 효율적으로 활성화한다. 대조군: 광 활성화 키메라 단백질 없이 HEK293 세포를 발현하는 mCitrine 단독. (E) 전방 대상 피질의 피라미드 세포에서 발현되는 JellyOP(palm)-5HT7은 HCN 채널의 활성을 감소시켜 막 전위를 탈분극시킨다. 이 효과는 약리학적 5-HT7 자극의 효과와 동일하다(Santello et al. (2015)). 뮤린 전방 대상 피질의 예리한 박편에서 피라미드 세포의 체세포 패치-클램프 기록(상단에 제시)의 데이터(하단). JellyOP(palm)-5HT7은 정위 주사에 의한 AAVdj 유전자 요법에 의해 도입되었다.
도 8: 키메라 옵신-mGluR6 변이체의 예시적인 실시형태의 ON-두극세포 수상돌기 및 mGluR6 시그널로솜으로의 올바른 생체 내 트래피킹.
마우스를 ssAAV2(7m8)를 사용한 유전자 요법(Dalkara et al. (2013)) 및 770En_454P(hGRM6) 프로모터의 제어 하의 멜라놉신-mGluR6 유전자 설정(EP19200082.6, 본 출원에 첨부됨)을 이용하여 치료하였다. (A) 천연 mGluR6도 상재하는 ON-두극세포의 수상돌기에서 키메라 옵신 mGluR6 단백질의 정확한 세포 이하 국소화를 나타내는 스케치. (B) 항멜라놉신 항체(흰색)로 시각화된 Mela(palm+33AA)-mGluR6-IRES-TurboFP635는 ON-두극세포의 수상돌기에서 명확하게 발현된다. 신경절 세포층(GCL)에서 기원하는 축색 돌기는 자연적으로 멜라놉신을 발현하는 ipRGC(본질적 감광성 망막 신경절 세포)에서 유래한다. 항-RFP 항체로 시각화된 (C) Mela(palm)-mGluR6-mKate2 및 (D) JellyOP(palm)-mGluR6-mKate2는 단백질의 수지상 국소화를 다시 명확하게 나타낸다. 옵신(palm) 버전은 표적 세포에서 키메라 단백질을 올바르게 국소화하기에 충분하다.
도 9: 키메라 옵신-mGluR6 GPCR의 예시적인 실시형태는 단리된 ON-두극세포를 직접적으로 감광성으로 만든다.
마우스를 Mela(palm+33AA)-mGluR6 및 JellyOP(palm)-mGluR6으로 유전자 치료하고, 안구 적출 후 망막을 파파인으로 소화시켰다. 단리된 세포를 유리 커버 슬립에 플레이팅하고, 천공 패치 기술을 사용하여 패치-클램핑하였다. (A) 두극세포는 DIC 광학 하에 쉽게 식별되었다. (B) 형질감염된 두극세포는 형광 리포터 유전자의 공동 발현에 의해 식별되었으며, 여기서 TurboFP635는 형광 현미경으로 시각화되었다. (C, D) 수직 파선으로 표시된, 2초의 청색광(470 nm; 1 x 10^14개 광자/cm^2/sec)에 반응하여 변환된 ON-두극세포로부터의 예시적인 패치-클램프 기록. (C) Mela(palm+33AA)-mGluR6을 발현하는 ON-두극세포로부터의 회색과 검은색의 겹쳐진 두 개의 예시 흔적. 빛에 반응하여, 세포는 분명히 과분극화되어 TRPM1 비선택적 양이온 채널을 음성으로 게이팅하는 mGluR6 캐스케이드의 직접 활성화를 나타낸다. (D) JellyOP(palm)-mGluR6을 발현하는 ON-두극세포(검은색 흔적) 및 망막 박편에서 기록된 광수용체에 의해 직접 활성화된 간상 두극세포(회색 흔적)로부터의 비교 패치-클램프 흔적. JellyOP(palm)-mGluR6 발현 두극세포는 670 ms의 반응 오프셋(Tau(off))으로 매우 빠른 동역학을 보여주었다. 이는 광수용체 활성화 하의 두극세포의 반응 오프셋(이 예에서 Tau(off)=570 ms)과 거의 동일하다. 또한, JellyOP(palm)-mGluR6의 반응 온셋(Tau(on)=90 ms)은 광수용체에 의해 활성화된 두극세포의 반응 온셋(70 ms)과 거의 동일하다. 내인성의 신속한 동역학은 mGluR6 시그널로솜에서 JellyOP(palm)-mGluR6의 정확한 국소화와 두극세포 내에서의 적절한 신호 전달에 대한 명확한 표시이다. 동역학 매개변수(Tau 값)의 적합도는 적색선과 녹색선으로 표시되어 있다.
도 10: 키메라 옵신 mGluR6 변이체의 예시적인 실시형태를 이용한 AAV 유전자 요법에 의해 치료된 시각장애 마우스의 생체 내 시력 측정.
히스토그램은 x축에 표시된 상이한 키메라 옵신-mGluR6 구축물을 이용한 AAV 유전자 요법으로 치료한 시각장애 색소성 망막염 rd1(망막 변성 C3H/HeOuJ 계통) 마우스의 평균 시력(± s.e.m.)을 나타내고, 여기서 (palm)은 멜라놉신, 해파리 옵신 및 중파 원추형 옵신의 CT의 팔미톨화 부위에 원위쪽으로 인접하여 위치한 절단 부위를 나타내고, Mela(palm+33AA)는 멜라놉신 CT의 팔미톨화 부위의 하류에서 아미노산 위치 33에 원위쪽으로 인접하여 위치한 절단 부위를 나타내고, + IL1 또는 + IL3은 mGluR6의 CT에 추가하여 mGluR6의 이러한 서브유닛의 존재를 나타내고, 마지막으로 JellyOP 및 OPN1MW는 각각 해파리 옵신 및 인간 중파 원추형 옵신을 나타낸다. C57BL/6은 주사되지 않은, 시력이 있는 야생형 마우스를 지칭하며, 양성 대조군으로 사용된다. 이 테스트에서, 마우스는 공간 주파수 변화의 흑백 막대를 나타내는 가상 현실(Striatatech, 눈운동 검사통)로 둘러싸인 높은 플랫폼에 제약 없이 배치된다(자세한 내용은 문헌[Prusky et al. (2004)] 참조). 마우스가 여전히 인식하는 가장 높은 공간 시력(cyc/deg)을 정량화하기 위하여 마우스의 추적 머리 움직임(시운동 반사)을 적외선 카메라로 자동으로 모니터링하고 분석한다. Mela(palm)-mGluR6 주사된 마우스는 시각장애 한배 새끼(rd1)보다 유의하게 더 낫게 수행한다. 모든 멜라놉신-mGluR6 변이체 처리된 마우스와 JellyOP(palm)-mGluR6 및 OPN1MW(palm)-mGluR6 주사된 마우스도 동등하게 잘 수행하였다. 유의 수준은 일원 분산분석 테스트에 의해 결정되었으며 그래프에서 유의 수준은 다음과 같이 표시된다: * p≤0.05, *** p≤0.001 및 n.s. 유의하게 다르지 않음. 요약하면, 모든 구축물은 시각장애 rd1 마우스에서 공간 시력을 유의하게 회복시키는 데 있어서 동등하게 잘 수행하였다. 유전자 요법은 770En_454P(hGRM6) 프로모터의 제어 하에 키메라 옵신 mGluR6 단백질 유전자를 설정하는 ssAAV2(7m8)(Dalkara et al(2013)) 벡터를 사용하여 수행되었다.
도 11: 신규한 옵신-mGluR6 구축물로 처리된 시각장애 rd1 망막의 망막 신경절 세포로부터 기록된 생체 외 광 반응.
세포 부착 패치-클램프 기록은 전조직 표본 망막에서 생체 외에서 수행되었다. (A) 세포 유형 식별을 위한 패치-클램프 기록 후 세포내 표지된 망막 신경절 세포.
(B) Mela(palm+33AA)-mGluR6 키메라로 처리된 rd1 망막의 망막 신경절 세포의 스파이크 반응을 보여주는 예시적인 래스터 플롯. 반응은 mGluR6 수용체 효능제인 L-AP4(25 μM)에 의해 차단되지 않아, 광수용체에서 ON-두극세포로의 입력을 차단한다. 이는 빛 반응이 Mela(palm+33AA)-mGluR6에 의해 유발됨을 확인시켜준다. 빛은 점선 사이의 2초 동안 적용되었다. 막대의 각 수평선(번호 1~8)은 하나의 기록을 나타낸다. 각 수직선은 신경절 세포의 기록된 활동 전위에 해당한다. 명백히, 이 세포는 빛이 매우 안정적으로 적용될 때 활동 전위 발화를 증가시킨다. (C) 다른 시각장애 뮤린 rd1 망막의 Mela(palm)-mGluR6 발현에 의해 회복된 일시적인 OFF, ON 및 ON-OFF 신경절 세포의 예시적인 스파이크-시간-히스토그램. 빛에 대한 신경절 세포 반응의 자연적 다양성- 즉, OFF-세포라고 하는 빛 오프셋에서 스파이크 주파수의 증가(왼쪽), ON-세포라고 하는 빛 온셋에서 스파이크 주파수의 증가(중간) 또는 ON-OFF 세포라고 하는 빛 온셋 및 오프셋에서 발화의 증가(오른쪽) -의 회복은 내인성 내부 망막 기능의 회복을 확인시켜준다. (D) 상이한 키메라 옵신 mGluR6 단백질 변이체로 형질도입된 마우스의 rd1 망막 평면 표본 고정에서의 다중 전극 어레이(MEA) 기록. 반복된 빛 자극(흔적 위의 수평 막대로 표시되는 빛 자극의 지속시간)의 선택된 전극(번호 1~5)으로부터의 예시적인 래스터 플롯(B와 유사)이 제시되어 있다. rd1은 빛 자극 시 기저 발화율의 변화가 없는, 처리되지 않은 한배 새끼이다. 반대로, 키메라 옵신 mGluR6 단백질의 모든 망막은 현저한 빛 잠금 반응을 나타낸다.
도 12: AAV2 캡시드를 암호화하는 바이러스 VP1 유전자의 N587 내지 R588 사이에 펩티드 삽입물 (a) NLAPRTPHTAAR 및 (b) NLANHAPNHCAR을 포함하는 AAV2를 이용한 유리체 내 유전자 요법 후 ON-두극세포를 발현하는 hMela(palm)-mGluR6-IRES2-TurboFP635를 보여주는 2마리의 치료된 변성 마우스(rd1 망막 변성 마우스 계통 C3H/HeOuJ)의 망막을 통한 수직 동결절편의 현미경 사진. hMela(palm)-mGluR6-IRES2-TurboFP635의 발현은 두 경우 모두 770En_454P(hGRM6) ON-두극세포 특이적 프로모터에 의해 유도된다.
도 13: 예시적인 JSR1(S186F)palm-beta2AR 키메라 옵신 GPCR을 HEK293-GIRK 세포에서 발현시켰고, 광 유도 전류를 전체 세포 패치-클램프 방법으로 측정하였다. 385 nm의 빛은 GIRK 전류를 유도한 반면, 550 nm의 빛은 이안정성 JSR1(S186F) 돌연변이체의 이색성 특성으로 인해 활성을 종료시켰다. 예시적인 hJSR(S186F)palm-GABAB2 키메라 옵신 GPCR로 수행한, 동일한 빛을 사용한 유사한 패치 클램프 실험은 유사한 GIRK 전류를 유도했다(데이터 미제시).
아래 표 3의 개요에 제시된 바와 같은 키메라 옵신 GPCR의 예시적인 실시형태의 선택을 위한 cDNA 및 아미노산 서열.
[표 3]
모 GPCR 및 C 말단 스플라이싱 부위 및 서열번호의 표시가 있는 예시적인 실시형태의 개요
1) 홀수: 핵산 서열; 짝수: 아미노산 서열.
2) 기원: m = 뮤린; h = 인간; jf = 해파리; js = 깡충거미; h-js = 인간화 깡충거미
3) 명칭은 4)에서와 같이 보존된 모티프 또는 부위를 지칭함으로써 모 GPCR 및 상류 옵신의 CT의 절단 부위를 나타내고, 표적 GPCR과 관련하여, CT 단독이 아닌 경우 도메인이 열거된다.
4) 보존된 모티프 또는 부위이거나 이에 대한 것임; palm = 팔미토일화 부위; palm+33AA = 팔미토일화 부위의 원위의 33개 아미노산
아래에 열거된 아미노산 서열에서 테두리 표시된 아미노산은 보존된 모티프를 나타내고, 회색 강조표시는 팔미토일화된 Cy를 나타낸다.
실시형태 (A): Mela(palm+33AA)-mGluR6 (뮤린 서열 기반)
구축: 멜라놉신은 AA397 이후에 절단되었고, mGluR6 C 말단은 NR(K)Q/HPE 모티프에서 시작하여 부가되었다.
cDNA -- 서열번호 1
펩티드 서열 -- 서열번호 2
범례:
밑줄 = GRM6
밑줄 및 굵은 활자체 = 선택적 골지 방출 신호
굵은 활자체 = 선택적 1D4 에피토프
실시형태 (B): Mela(palm)-mGluR6 (뮤린 서열 기반)
구축: 멜라놉신은 멜라놉신의 팔미토일화 Cys(AA364) 이후에 절단되었고, mGluR6 C 말단은 프로토타입 Opto-mGluR6(van Wyk M et al., 2015)에 비해 더 나은 서열 정렬의 결과로 2개의 추가 근위 아미노산을 포함하여 부가되었다.
cDNA -- 서열번호 3
펩티드 서열 -- 서열번호 4
범례:
밑줄 = GRM6
밑줄 및 굵은 활자체 = 선택적 골지 방출 신호
굵은 활자체 = 선택적 1D4 에피토프
실시형태 (C): Mela(palm+33AA)+IL1-mGluR6 (뮤린 서열 기반)
구축: 실시형태 A와 동일하나, 멜라놉신 IL1과 mGluR6의 IL1의 추가적인 완전한 교환을 수반함. 프로토타입 Opto-mGluR6(van Wyk M et al., 2015)에서와 동일한 절삭 부위.
cDNA -- 서열번호 5
펩티드 서열 -- 서열번호 6
범례:
밑줄 = GRM6
밑줄 및 굵은 활자체 = 선택적 골지 방출 신호
굵은 활자체 = 선택적 1D4 에피토프
실시형태 (D): Mela(palm)+IL1-mGluR6 (뮤린 서열 기반)
구축: 멜라놉신은 멜라놉신의 팔미토일화 Cys(AA364) 이후에 절단되었고, mGluR6 C 말단은 프로토타입 Opto-mGluR6(van Wyk M et al., 2015)과 비교하여 2개의 추가 근위 AA를 포함하여 부가되었다.
cDNA -- 서열번호 7
펩티드 서열 -- 서열번호 8
범례:
밑줄 = GRM6
밑줄 및 굵은 활자체 = 선택적 골지 방출 신호
굵은 활자체 = 선택적 1D4 에피토프
실시형태 (E): Mela(palm+33AA)+IL3-mGluR6 (뮤린 서열 기반)
구축: (1)과 동일하나, mGluR6의 짧은 IL3을 멜라놉신의 긴 IL3의 가변 부분에 추가로 삽입함.
cDNA -- 서열번호 9
펩티드 서열 -- 서열번호 10
범례:
밑줄 = GRM6
밑줄 및 굵은 활자체 = 선택적 골지 방출 신호
굵은 활자체 = 선택적 1D4 에피토프
실시형태 (F): Mela(palm)-OPN1MW(IL1, IL2, IL3, CT) (뮤린 서열 기반)
구축:
mela의 모든 세포내 도메인이 교환되었고 CT 스플라이스 부위 X-1이 있는 OPN1MW의 상응하는 세포내 도메인에 의한 키메라(도 3 옵션 1)
cDNA -- 서열번호 11
펩티드 서열 -- 서열번호 12
범례:
밑줄 = OPN1MW
밑줄 및 굵은 활자체 = 선택적 골지 방출 신호
굵은 활자체 = 선택적 1D4 에피토프
실시형태 (G): OPN1MW(palm)-mGluR6 (뮤린 서열 기반)
구축: HPE 모티프를 포함하는 mGluR6 C 말단이 추정 팔미토일화 부위에, 즉 소 로돕신의 팔미토일화 부위 C322 바로 앞의 잔기(F, 회색으로 강조 표시) 뒤에 부가되었다.
cDNA -- 서열번호 13
펩티드 서열 -- 서열번호 14
범례:
밑줄 = mGluR6
밑줄 및 굵은 활자체 = 선택적 골지 방출 신호
굵은 활자체 = 선택적 1D4 에피토프
실시형태 (H): Mela(palm+33AA)-mGluR6 (인간 서열 기반)
구축: 뮤린 구축물을 이용하여 위와 같이 구축.
cDNA -- 서열번호 15
펩티드 서열 -- 서열번호 16
범례:
밑줄 = GRM6
밑줄 및 굵은 활자체 = 선택적 골지 방출 신호
굵은 활자체 = 선택적 1D4 에피토프
실시형태 (I): Mela(palm)-mGluR6 (인간 서열 기반)
구축: 뮤린 구축물을 이용하여 위와 같이 구축.
대립 유전자 변이체: "L 변이체"
cDNA -- 서열번호 17
펩티드 서열 -- 서열번호 18
대립 유전자 변이체: P-변이체
cDNA 서열번호 19(인간 멜라놉신 이소형 1 포함)
펩티드 서열 -- 서열번호 20
인간 멜라놉신의 이소형 1을 포함하는 멜라놉신-mGluR6("p 변이체")의 AA 서열
범례:
밑줄 = GRM6
밑줄 및 굵은 활자체 = 선택적 골지 방출 신호
굵은 활자체 = 선택적 1D4 에피토프
테두리 표시됨 = 대립 유전자 변이체 및 보존된 모티프
설명: HEK293 세포에서의 비교 실험에서 L 및 P 변이체는 동등하게 수행하였다. P-변이체는 가장 일반적인 mGluR6 대립 유전자 변이체이며, 대부분의 실험에서 사용되었다.
실시형태 (J): Mela(palm+33A)+IL1-mGluR6 (인간 서열 기반)
구축: 뮤린 구축물을 이용하여 위와 같이 구축.
cDNA -- 서열번호 29
펩티드 서열 -- 서열번호 30
범례:
밑줄 = GRM6
밑줄 및 굵은 활자체 = 선택적 골지 방출 신호
굵은 활자체 = 선택적 1D4 에피토프
실시형태 (K): Mela(palm+33A)+IL3-mGluR6 (인간 서열 기반)
구축: mGluR6(GRM6) IL3 및 mGluR6(GRM6) CT를 포함하는 인간 멜라놉신 키메라
cDNA -- 서열번호 31
펩티드 서열 -- 서열번호 32
범례:
밑줄 = GRM6
밑줄 및 굵은 활자체 = 선택적 골지 방출 신호
굵은 활자체 = 선택적 1D4 에피토프
실시형태 (L): JellyOP(palm)-mGluR6
구축: JellyOP의 팔미토일화 부위(회색 Cys) 뒤에 뮤린 GRM6의 C 말단이 부가된 상자 해파리 옵신 키메라
cDNA -- 서열번호 33
펩티드 서열 -- 서열번호 34
범례:
밑줄 = GRM6
밑줄 및 굵은 활자체 = 선택적 골지 방출 신호
굵은 활자체 = 선택적 1D4 에피토프
실시형태 (M): JellyOP(palm)-5HT7
구축: JellyOP의 팔미토일화 부위(회색 Cys) 뒤에 뮤린 5-하이드록시트립타민 수용체 7(이소형 1)의 C-말단이 부가된 상자 해파리 옵신 키메라. 팔미토일화 부위 뒤에서 시작하는 5-HT7 수용체의 C 말단 서열이 여기에 부가되었다.
cDNA -- 서열번호 35
펩티드 서열 -- 서열번호 36
범례:
밑줄 = 5HT7
밑줄 및 굵은 활자체 = 선택적 골지 방출 신호
굵은 활자체 = 선택적 1D4 에피토프
실시형태 (N):PPO(palm)-mGluR6 (뮤린 mGluR6)
구축: 칠성장어(Lethenteron camtschaticum) 파라피놉신(PPO)
HPE 부위의 상류에서 2개의 아미노산에서 mGluR6의 CT와 융합된 PPO의 팔미토일화 부위의 스플라이싱 부위 x.
DNA 서열 -- 서열번호 37
펩티드 서열 -- 서열번호 38
범례:
밑줄 = GRM6
밑줄 및 굵은 활자체 = 선택적 골지 방출 신호
굵은 활자체 = 선택적 1D4 에피토프
실시형태 (O): JSR1(palm)-mGluR6 (뮤린 mGluR6)
깡충거미 로돕신, 초승달 깡충거미(Hasarious adansoni)의 Kumpopsin 1
구축: HPE 부위의 상류에서 2개의 아미노산에서 mGluR6의 CT와 융합된 JSR1의 팔미토일화 부위의 스플라이싱 부위 x.
cDNA 서열 -- 서열번호 39
펩티드 서열 -- 서열번호 40
범례:
밑줄 = GRM6
밑줄 및 굵은 활자체 = 선택적 골지 방출 신호
굵은 활자체 = 선택적 1D4 에피토프
참고문헌
■
Ablonczy Z., Kono M., Knapp D. Crouch R., “Palmytolation of cone opsins” Vision Research 46 (2006) 4493-4501. doi: 10.1016/j.visres.2006.08.003
■
Ahn KH, Nishiyama A, Mierke DF, Kendall DA, “Hydrophobic residues in helix 8 of cannabinoid receptor 1 are critical for structural and functional properties.” Biochemistry (2010) 49: 502-11
■
Bailes, H. and R. Lucas, “Human melanopsin forms a pigment maximally sensitive to blue light (λmax 479 nm) supporting activation of G(q/11) and G(i/o) signalling cascades. Proc Biol Sci, 2013. 280: p. 20122987. doi: 10.1098/rspb.2012.2987
■
Bruno A, Costantino G, De Fabritiis G, Pastor M, Selent J, “Membrane-Sensitive Conformational States of Helix 8 in Metabotropic Glu2 Receptor, a Class C GPCR”. PLoS ONE, vol. 7, Issue 8, August 2012. (https://doi.org/10.1371/journal.pone.0042023)
■
Cronin T., Vandenberghe L., Hantz P., Juttner J., Reimann A., Kacsσ ., Huckfeldt R., Busskamp V., Kohler H., Lagali P., Botond R.& Bennett J. “Efficient transduction and optogenetic stimulation of retinal bipolar cells by a synthetic adeno-assoc iated virus capsid and promoter” EMBO Mol Med, 2014, 6(9): p. 1175-1190;
■
Cehajic-Kapetanovic J., Eleftheriou C., Allen A.E., Milosavljevic N., Pienaar A., Bedford R., Davis K.E., Bishop P.N., Lucas R.J., “Restoration of Vision with Ectopic Expression of Human Rod Opsin”. Curr Biol. 2015 Aug 17;25(16):2111-22. doi: 10.1016/j.cub.2015.07.029. Epub 2015 Jul 30.
■
Dalkara D, Byrne LC, Klimczak RR, Visel M, Yin L, Merigan WH, Flannery JG, Schaffer DV, “In vivo-directed evolution of a new adeno-associated virus for therapeutic outer retinal gene delivery from the vitreous” Sci Transl Med. 2013 Jun 12;5(189):189ra76. doi: 10.1126/scitranslmed.3005708
■
David A., “Evolution of recombinant adeno-associated viral vectors for application in ocular gene therapy” Dissertation Universitδt Bern, 2018.
■
Davies W, Hankinsa M, Foster R;, “Vertebrate ancient opsin and melanopsin: divergent irradiance detectors”. 2010, Photochem. Photobiol. Sci., 2010, 9, 1444-1457.
■
Fritze O, Slawomir F, Kuksa V, Palczewski K, Hofmann K, Ernst O,, “Role of the conserved NPxxY(x)5,6F motif in the rhodopsin ground state and during activation”. PNAS, March 4, 2003, vol.100, No.5. (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC151333/)
■
Gross A. K. et al., Defective Membrane Trafficking of Autosomal Dominant Retinitis Pigmentosa Mutant Ter349Glu Rhodopsin IS Rescued by C-Terminal Addition of 1D4 Epitope, iovs, April 2009, Vol. 50, Issue 13
■
https://molbiol-tools.ca/Protein_tertiary_structure.htm, accessed on 27 November 2020, 10:40am
■
https://www.schrodinger.com/prime, accessed on 27 November 2020, 10:45am
■
Hulliger Carlos Elmar et al., Empowering Retianl Gene Therapy with a Specific Promoter of Human Rod and Cone ON-Bipolar Cells, Molecular Therapy: Methods & Clinical Development, Vol. 17, June 2020. pp. 505-519
■
Hulliger Carlos Elmar et al., Empowering Retianl Gene Therapy with a Specific Promoter of Human Rod and Cone ON-Bipolar Cells, Molecular Therapy: Methods & Clinical Development, Vol. 17, June 2020. pp. 505-519 - Supplemental Information
■
Hsu P., Lander E.S., Zhang F., “Development and Applications of CRISPR-Cas9 for Genome Engineering”, Cell 157(6):1262-1278 (2014)
■
Kim D, Matsuda T and Cepko C. “A Core Paired-Type and POU Homeodomain-Containing Transcription Factor Program Drives Retinal Bipolar Cell Gene Expression”, J Neurosci 2008, 28: p. 7748-7764;
■
Kleinlogel S, “Optogenetic user’s guide to Opto-GPCRs”. Frontiers in Bioscience, Landmark, 21, 794-805, January 1, 2016.
■
Kuhlman, B., Bradley, P., “Advances in protein structure prediction and design”. Nat Rev Mol Cell Biol 20, 681-697 (2019)
■
Lagali P.S., Balya D., Awatramani G.B., Mnch T.A., Kim D.S., Busskamp V., Cepko C.L., Roska B, “Light-activated channels targeted to ON bipolar cells restore visual function in retinal degeneration”. Nat Neurosci. 2008 Jun;11(6):667-75. doi: 10.1038/nn.2117. Epub 2008 Apr 27.
■
Lin K., Simossis V.A., Taylor W.R., Heringa J., “A simple and fast secondary structure prediction method using hidden neural networks”, Bioinformatics 21(2):152-159 (2005)
■
Lodowski et al., Signals Governing the Trafficking and Mistrafficking of a Ciliary GPCR, Rhodopsin, The Journal of Neuroscience, August 21, 2013, - 33(34):13621-13638.13621
■
Long C., Li H., Tiburcy M., Rodriguez-Caycedo C., Kyrychenko V., Zhou H., Zhang Y., Min Y., Shelton J.M., Mammen P.A., Liaw N.Y., Zimmermann W.H., Bassel-Duby R., Schneider J.W. and Olson E.N., “Correction of diverse muscular dystrophy mutations in human engineered heart muscle by single-site genome editing”, Science Advances 4(1) (2018) eaap9004, DOI: 10.1126/sciadv.aap9004
■
Lu Q, Ganjawala T, Ivanova E, Cheng J, Troilo D and Pan Z, “AAV-mediated transduction and targeting of retinal bipolar cells with improved mGluR6 promoters in rodents and primates”, Gene Ther, 2016, 23: p. 680-9.
■
Moreira I S, “Structural features of the G-protein/GPCR interactions”. Biochimica et Bioohysica Acta Vol. 1840_1, p. 16-33, January 2014 (https://doi.org/10.1016/j.bbagen.2013.08.027)
■
Morri M, Sanchez-Romero I, Tichy AM, Kainrath S, Gerrard EJ, Hirschfeld PP, Schwarz J, Janovjak H “Optical functionalization of human Class A orphan G-protein-coupled receptors.” Nat Commun 9: 1950 (2018),
doi:10.1038/s41467-018-04342-1 (2018).
■
Mure L, Hatori M, Zhu Q, Demas J, Kim I, Nayak S, Panda S, “Melanopsin-Encoded Response Properties of Intrinsically Photosensitive Retinal Ganglion Cells”. 2016, Neuron 90, 1016-1027, June 1, 2016; https://doi.org/10.1016/j.neuron.2016.04.016)
■
Nygaard R et al. “The Dynamic Process of β-Adrenergic Receptor activation”. Cell 152, 532-542, Jan 31, 2013. (https://doi.org/10.1016/j.bbagen.2013.08.027)
■
O'Brien, J.A., Lummis, S.C., “Nano-biolistics: a method of biolistic transfection of cells and tissues using a gene gun with novel nanometer-sized projectiles”, BMC Biotechnol 11, 66 (2011). https://doi.org/10.1186/1472-6750-11-66
■
Ovchinnikov Yu A, Abdulaev NG, Bogachuk AS, “Two adjacent cysteine residues in the C-terminal cytoplasmic fragment of bovine rhodopsinhttps”, //doi.org/10.1016/j.bbagen.2013.08.027 are palmitilated. Federation of European Biochemical Societies Letters 1988; 230:1-5. [PubMed: 3350146]
■
Prusky G.T., Alam N.M., Beekman, S., Douglas R.M., “Rapid Quantification of Adult and Developing Mouse Spatial Vision Using a Virtual Optomotor System”, 45:4611-4616, Dec. 2004
■
Santello M., Nevian T., “Dysfunction of Cortical Dendritic Integration in Neuropathic Pain Reversed by Serotoninergic Neuromodulation”, Neuron 86(1):233-246, March 26, 2015
■
Sato T., “Conserved 2nd Residue of Helix 8 of GPCR May Confer the Subclass-Characteristic and Distinct Roles through a Rapid Initial Interaction with Specific G Proteins”, Int. J. Mol. Sci. 2019, 20, 1752; doi:10.3390/ijms20071752.
■
Schiφth, H.B, Fredriksson R, “The GRAFS classification system of G-protein coupled receptors in comparative perspective”. General and Comparative Endocrinology 142, Feb. 15, 2005, 94-101. Doi: 10.1016/j.ygcen.2004.12.018.
■
Schwartz T, Frimurer T, Holst B, Rosenkilde M and Elling C, “Molecular mechanism of 7TM receptor activation - a global toggle switch model”. Annu Rev Pharmacol Toxicol 46, 481-519 (2006- DOI: 10.1146/annurev.pharmtox.46.120604.141218.
■
Siuda E, Copits B, Schmidt M, Baird M, Al-Hasani R, Planer W, Funderburk S, McCall J, Gereau IV R, Bruchas M, “Spatiotemporal control of opioid signaling and behavior”. Neuron. 2015 May 20; 86(4): 923-935. doi:10.1016/j.neuron.2015.03.066
■
Somasundaram P, Wyrick GR, Fernandez DC, Ghahari A, Pinhal CM, Richardson MS, Rupp AC, Cui L, Wu Z, Brown RL, Badea TC, Hattar S, and Robinson PR., “C-terminal phosphorylation regulates the kinetics of a subset of melanopsin-mediated behaviors in mice”. Proc Natl Acad Sci U S A. 2017 Mar 7; 114(10): 2741-2746.
■
Sriram K and Insel P A, “G Protein-Coupled Receptors as Targets for Approved Drugs: How Many Targets and How Many Drugs?”. Mol Pharmacol 93:251-258, April 2018. https://doi.org/10.1124/mol.117.111062
■
Tsai C-J, Pamula F, Nehmι R, Mhle J, Weinert T, Flock T, Nogly P, Edwards P, Carpenter B, Gruhl T, Ma P, Deupi X, Standfuss J,Tate C and Schertler G, “Crystal structure of rhodopsin in complex with a mini-Go sheds light on the principles of G protein selectivity”, Sci. Adv. 2018; 4 : eaat 7052 19 September 2018
■
Tsai CJ, Marino J, Adaixo R, Pamula F, Muehle J, Maeda S, Flock T, Taylor NM, Mohammed I, Matile H, Dawson RJ, Deupi X, Stahlberg H, Schertler G, “Cryo-EM structure of the rhodopsin-Gαi-βγ complex reveals binding of the rhodopsin C-terminal tail to the Gβ subunit”. Elife 2019 Jun 28;8: e46041. Doi: 10.7554/eLife.46041
■
Vandemoortele, G., De Sutter, D. and Eyckerman, S., “Robust Generation of Knock-in Cell Lines Using CRISPR-Cas9 and rAAV-assisted Repair Template Delivery”. Bio-protocol 7(7): e2211 (2017). DOI: 10.21769/BioProtoc.2211.
■
van Wyk M., Pielecka-Fortuna J., Lφwel S., Kleinlogel S., “Restoring the ON Switch in Blind Retinas: Chimeric opsin mGluR6 proteins, a Next-Generation, Cell-Tailored Optogenetic Tool”. PLoS Biol. 2015 May 7;13(5):e1002143. doi: 10.1371/journal.pbio.1002143. eCollection 2015 May.
■
Zhu X, Brown B, Li A, Mears AJ, Swaroop A, Craft CM, “GRK1-dependent phosphorylation of S and M opsins and their binding to cone arrestin during cone phototransduction in the mouse retina.” J Neurosci. 2003 Jul 9, 23(14):6152-60.
현재 본 발명의 바람직한 실시형태가 위에 도시되고 설명되었지만, 본 발명이 이에 한정되지 않으나, 다르게는 다음의 청구범위의 범위 내에서 다양하게 구현되고 실시될 수 있음이 명백히 이해되어야 한다.
SEQUENCE LISTING
<110> University of Bern
<120> Chimeric Opsin GPCR Proteins
<130> P180999CH00
<160> 86
<170> BiSSAP 1.3.6
<210> 1
<211> 1377
<212> DNA
<213> Artificial Sequence
<220>
<223> Mela(palm+33AA)-mGluR6 cDNA
<400> 1
atggactctc cttcaggacc aagagtcttg tcaagcttaa ctcaggatcc cagcttcaca 60
accagtcctg ccctgcaagg catttggaac ggcactcaga acgtctccgt aagagcccag 120
cttctctctg ttagccccac gacatctgca catcaggctg ctgcctgggt ccccttcccc 180
acagtcgatg tcccagacca tgctcactat accctaggca cggtgatcct gctggtggga 240
ctcacaggga tgctgggcaa tctgacggtc atctacacct tctgcaggaa cagaggcctg 300
cggacaccag caaacatgtt catcatcaac ctcgcagtca gcgacttcct catgtcagtc 360
actcaggccc cggtcttctt tgccagcagc ctctacaaga agtggctctt tggggagaca 420
ggttgcgagt tctatgcctt ctgcggggct gtctttggca tcacttccat gatcaccctg 480
acagccatag ccatggaccg ctatctggtg atcacacgtc cactggccac catcggcagg 540
ggatccaaaa gacgaacggc actcgtcctg ctaggcgtct ggctttatgc cctggcctgg 600
agtctgccac ctttctttgg ttggagtgcc tacgtgcccg aggggctgct gacatcctgc 660
tcctgggact acatgacctt cacaccccag gtgcgtgcct acaccatgct gctcttctgc 720
tttgtcttct tcctccccct gctcatcatc atcttctgct acatcttcat cttcagggcc 780
atccgagaga caggccgggc ctgtgagggc tgcggtgagt cccctctgcg gcagaggcgg 840
cagtggcagc ggctgcagag tgagtggaag atggccaagg tcgcactgat tgtcattctt 900
ctcttcgtgc tgtcctgggc tccctactcc actgtggctc tggtggcctt tgctggatac 960
tcgcacatcc tgacgcccta catgagctcg gtgccagccg tcatcgccaa ggcttctgcc 1020
atccacaatc ccattatcta cgccatcact caccccaagt acagggtggc cattgcccag 1080
cacctgcctt gccttggggt gcttctcggt gtatcaggcc agcgcagcca cccctccctc 1140
agctaccgct ctacccaccg ctccacattg agcagccagt cctcagacct ccatccagag 1200
cagaacgtgc agaagcggaa gcgcagcctc aagaagacct ccacgatggc ggccccgccc 1260
aagagcgaga actcagagga cgccaagaag agcaggatca ccagcgaggg cgagtacatc 1320
cccctggacc agatcgacat caacgtgaca gagaccagcc aagtggcgcc tgcctaa 1377
<210> 2
<211> 458
<212> PRT
<213> Artificial Sequence
<220>
<223> Mela(palm+33AA)-mGluR6 protein
<220>
<221> LIPID
<222> 364
<223> PALMITATE
<400> 2
Met Asp Ser Pro Ser Gly Pro Arg Val Leu Ser Ser Leu Thr Gln Asp
1 5 10 15
Pro Ser Phe Thr Thr Ser Pro Ala Leu Gln Gly Ile Trp Asn Gly Thr
20 25 30
Gln Asn Val Ser Val Arg Ala Gln Leu Leu Ser Val Ser Pro Thr Thr
35 40 45
Ser Ala His Gln Ala Ala Ala Trp Val Pro Phe Pro Thr Val Asp Val
50 55 60
Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val Gly
65 70 75 80
Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys Arg
85 90 95
Asn Arg Gly Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu Ala
100 105 110
Val Ser Asp Phe Leu Met Ser Val Thr Gln Ala Pro Val Phe Phe Ala
115 120 125
Ser Ser Leu Tyr Lys Lys Trp Leu Phe Gly Glu Thr Gly Cys Glu Phe
130 135 140
Tyr Ala Phe Cys Gly Ala Val Phe Gly Ile Thr Ser Met Ile Thr Leu
145 150 155 160
Thr Ala Ile Ala Met Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu Ala
165 170 175
Thr Ile Gly Arg Gly Ser Lys Arg Arg Thr Ala Leu Val Leu Leu Gly
180 185 190
Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly Trp
195 200 205
Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp Tyr
210 215 220
Met Thr Phe Thr Pro Gln Val Arg Ala Tyr Thr Met Leu Leu Phe Cys
225 230 235 240
Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Phe Cys Tyr Ile Phe
245 250 255
Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Cys Glu Gly Cys Gly
260 265 270
Glu Ser Pro Leu Arg Gln Arg Arg Gln Trp Gln Arg Leu Gln Ser Glu
275 280 285
Trp Lys Met Ala Lys Val Ala Leu Ile Val Ile Leu Leu Phe Val Leu
290 295 300
Ser Trp Ala Pro Tyr Ser Thr Val Ala Leu Val Ala Phe Ala Gly Tyr
305 310 315 320
Ser His Ile Leu Thr Pro Tyr Met Ser Ser Val Pro Ala Val Ile Ala
325 330 335
Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile Thr His Pro
340 345 350
Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu Gly Val Leu
355 360 365
Leu Gly Val Ser Gly Gln Arg Ser His Pro Ser Leu Ser Tyr Arg Ser
370 375 380
Thr His Arg Ser Thr Leu Ser Ser Gln Ser Ser Asp Leu His Pro Glu
385 390 395 400
Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Lys Thr Ser Thr Met
405 410 415
Ala Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp Ala Lys Lys Ser Arg
420 425 430
Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile Asp Ile Asn
435 440 445
Val Thr Glu Thr Ser Gln Val Ala Pro Ala
450 455
<210> 3
<211> 1284
<212> DNA
<213> Artificial Sequence
<220>
<223> Mela(palm)-mGluR6 cDNA
<400> 3
atggactctc cttcaggacc aagagtcttg tcaagcttaa ctcaggatcc cagcttcaca 60
accagtcctg ccctgcaagg catttggaac ggcactcaga acgtctccgt aagagcccag 120
cttctctctg ttagccccac gacatctgca catcaggctg ctgcctgggt ccccttcccc 180
acagtcgatg tcccagacca tgctcactat accctaggca cggtgatcct gctggtggga 240
ctcacaggga tgctgggcaa tctgacggtc atctacacct tctgcaggaa cagaggcctg 300
cggacaccag caaacatgtt catcatcaac ctcgcagtca gcgacttcct catgtcagtc 360
actcaggccc cggtcttctt tgccagcagc ctctacaaga agtggctctt tggggagaca 420
ggttgcgagt tctatgcctt ctgcggggct gtctttggca tcacttccat gatcaccctg 480
acagccatag ccatggaccg ctatctggtg atcacacgtc cactggccac catcggcagg 540
ggatccaaaa gacgaacggc actcgtcctg ctaggcgtct ggctttatgc cctggcctgg 600
agtctgccac ctttctttgg ttggagtgcc tacgtgcccg aggggctgct gacatcctgc 660
tcctgggact acatgacctt cacaccccag gtgcgtgcct acaccatgct gctcttctgc 720
tttgtcttct tcctccccct gctcatcatc atcttctgct acatcttcat cttcagggcc 780
atccgagaga caggccgggc ctgtgagggc tgcggtgagt cccctctgcg gcagaggcgg 840
cagtggcagc ggctgcagag tgagtggaag atggccaagg tcgcactgat tgtcattctt 900
ctcttcgtgc tgtcctgggc tccctactcc actgtggctc tggtggcctt tgctggatac 960
tcgcacatcc tgacgcccta catgagctcg gtgccagccg tcatcgccaa ggcttctgcc 1020
atccacaatc ccattatcta cgccatcact caccccaagt acagggtggc cattgcccag 1080
cacctgcctt gcctgttcca tccagagcag aacgtgcaga agcggaagcg cagcctcaag 1140
aagacctcca cgatggcggc cccgcccaag agcgagaact cagaggacgc caagaagagc 1200
aggatcacca gcgagggcga gtacatcccc ctggaccaga tcgacatcaa cgtgacagag 1260
accagccaag tggcgcctgc ctaa 1284
<210> 4
<211> 427
<212> PRT
<213> Artificial Sequence
<220>
<223> Mela(palm)-mGluR6 protein
<220>
<221> LIPID
<222> 364
<223> PALMITATE
<400> 4
Met Asp Ser Pro Ser Gly Pro Arg Val Leu Ser Ser Leu Thr Gln Asp
1 5 10 15
Pro Ser Phe Thr Thr Ser Pro Ala Leu Gln Gly Ile Trp Asn Gly Thr
20 25 30
Gln Asn Val Ser Val Arg Ala Gln Leu Leu Ser Val Ser Pro Thr Thr
35 40 45
Ser Ala His Gln Ala Ala Ala Trp Val Pro Phe Pro Thr Val Asp Val
50 55 60
Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val Gly
65 70 75 80
Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys Arg
85 90 95
Asn Arg Gly Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu Ala
100 105 110
Val Ser Asp Phe Leu Met Ser Val Thr Gln Ala Pro Val Phe Phe Ala
115 120 125
Ser Ser Leu Tyr Lys Lys Trp Leu Phe Gly Glu Thr Gly Cys Glu Phe
130 135 140
Tyr Ala Phe Cys Gly Ala Val Phe Gly Ile Thr Ser Met Ile Thr Leu
145 150 155 160
Thr Ala Ile Ala Met Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu Ala
165 170 175
Thr Ile Gly Arg Gly Ser Lys Arg Arg Thr Ala Leu Val Leu Leu Gly
180 185 190
Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly Trp
195 200 205
Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp Tyr
210 215 220
Met Thr Phe Thr Pro Gln Val Arg Ala Tyr Thr Met Leu Leu Phe Cys
225 230 235 240
Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Phe Cys Tyr Ile Phe
245 250 255
Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Cys Glu Gly Cys Gly
260 265 270
Glu Ser Pro Leu Arg Gln Arg Arg Gln Trp Gln Arg Leu Gln Ser Glu
275 280 285
Trp Lys Met Ala Lys Val Ala Leu Ile Val Ile Leu Leu Phe Val Leu
290 295 300
Ser Trp Ala Pro Tyr Ser Thr Val Ala Leu Val Ala Phe Ala Gly Tyr
305 310 315 320
Ser His Ile Leu Thr Pro Tyr Met Ser Ser Val Pro Ala Val Ile Ala
325 330 335
Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile Thr His Pro
340 345 350
Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu Phe His Pro
355 360 365
Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Lys Thr Ser Thr
370 375 380
Met Ala Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp Ala Lys Lys Ser
385 390 395 400
Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile Asp Ile
405 410 415
Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala
420 425
<210> 5
<211> 1389
<212> DNA
<213> Artificial Sequence
<220>
<223> Mela(palm+33AA) -mGluR6(IL1, CT) cDNA
<400> 5
atggactctc cttcaggacc aagagtcttg tcaagcttaa ctcaggatcc cagcttcaca 60
accagtcctg ccctgcaagg catttggaac ggcactcaga acgtctccgt aagagcccag 120
cttctctctg ttagccccac gacatctgca catcaggctg ctgcctgggt ccccttcccc 180
acagtcgatg tcccagacca tgctcactat accctaggca cggtgatcct gctggtggga 240
ctcacaggga tgctgggcaa tctgacggtc atctacacct tcatgcgaca caacgacact 300
cccatagtcc gcgcctctgg ccgtgagctt ttcatcatca acctcgcagt cagcgacttc 360
ctcatgtcag tcactcaggc cccggtcttc tttgccagca gcctctacaa gaagtggctc 420
tttggggaga caggttgcga gttctatgcc ttctgcgggg ctgtctttgg catcacttcc 480
atgatcaccc tgacagccat agccatggac cgctatctgg tgatcacacg tccactggcc 540
accatcggca ggggatccaa aagacgaacg gcactcgtcc tgctaggcgt ctggctttat 600
gccctggcct ggagtctgcc acctttcttt ggttggagtg cctacgtgcc cgaggggctg 660
ctgacatcct gctcctggga ctacatgacc ttcacacccc aggtgcgtgc ctacaccatg 720
ctgctcttct gctttgtctt cttcctcccc ctgctcatca tcatcttctg ctacatcttc 780
atcttcaggg ccatccgaga gacaggccgg gcctgtgagg gctgcggtga gtcccctctg 840
cggcagaggc ggcagtggca gcggctgcag agtgagtgga agatggccaa ggtcgcactg 900
attgtcattc ttctcttcgt gctgtcctgg gctccctact ccactgtggc tctggtggcc 960
tttgctggat actcgcacat cctgacgccc tacatgagct cggtgccagc cgtcatcgcc 1020
aaggcttctg ccatccacaa tcccattatc tacgccatca ctcaccccaa gtacagggtg 1080
gccattgccc agcacctgcc ttgccttggg gtgcttctcg gtgtatcagg ccagcgcagc 1140
cacccctccc tcagctaccg ctctacccac cgctccacat tgagcagcca gtcctcagac 1200
ctccatccag agcagaacgt gcagaagcgg aagcgcagcc tcaagaagac ctccacgatg 1260
gcggccccgc ccaagagcga gaactcagag gacgccaaga agagcaggat caccagcgag 1320
ggcgagtaca tccccctgga ccagatcgac atcaacgtga cagagaccag ccaagtggcg 1380
cctgcctaa 1389
<210> 6
<211> 462
<212> PRT
<213> Artificial Sequence
<220>
<223> Mela(palm+33AA) -mGluR6(IL1, CT) protein
<220>
<221> LIPID
<222> 368
<223> PALMITATE
<400> 6
Met Asp Ser Pro Ser Gly Pro Arg Val Leu Ser Ser Leu Thr Gln Asp
1 5 10 15
Pro Ser Phe Thr Thr Ser Pro Ala Leu Gln Gly Ile Trp Asn Gly Thr
20 25 30
Gln Asn Val Ser Val Arg Ala Gln Leu Leu Ser Val Ser Pro Thr Thr
35 40 45
Ser Ala His Gln Ala Ala Ala Trp Val Pro Phe Pro Thr Val Asp Val
50 55 60
Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val Gly
65 70 75 80
Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Met Arg
85 90 95
His Asn Asp Thr Pro Ile Val Arg Ala Ser Gly Arg Glu Leu Phe Ile
100 105 110
Ile Asn Leu Ala Val Ser Asp Phe Leu Met Ser Val Thr Gln Ala Pro
115 120 125
Val Phe Phe Ala Ser Ser Leu Tyr Lys Lys Trp Leu Phe Gly Glu Thr
130 135 140
Gly Cys Glu Phe Tyr Ala Phe Cys Gly Ala Val Phe Gly Ile Thr Ser
145 150 155 160
Met Ile Thr Leu Thr Ala Ile Ala Met Asp Arg Tyr Leu Val Ile Thr
165 170 175
Arg Pro Leu Ala Thr Ile Gly Arg Gly Ser Lys Arg Arg Thr Ala Leu
180 185 190
Val Leu Leu Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro
195 200 205
Phe Phe Gly Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys
210 215 220
Ser Trp Asp Tyr Met Thr Phe Thr Pro Gln Val Arg Ala Tyr Thr Met
225 230 235 240
Leu Leu Phe Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Phe
245 250 255
Cys Tyr Ile Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Cys
260 265 270
Glu Gly Cys Gly Glu Ser Pro Leu Arg Gln Arg Arg Gln Trp Gln Arg
275 280 285
Leu Gln Ser Glu Trp Lys Met Ala Lys Val Ala Leu Ile Val Ile Leu
290 295 300
Leu Phe Val Leu Ser Trp Ala Pro Tyr Ser Thr Val Ala Leu Val Ala
305 310 315 320
Phe Ala Gly Tyr Ser His Ile Leu Thr Pro Tyr Met Ser Ser Val Pro
325 330 335
Ala Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala
340 345 350
Ile Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys
355 360 365
Leu Gly Val Leu Leu Gly Val Ser Gly Gln Arg Ser His Pro Ser Leu
370 375 380
Ser Tyr Arg Ser Thr His Arg Ser Thr Leu Ser Ser Gln Ser Ser Asp
385 390 395 400
Leu His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Lys
405 410 415
Thr Ser Thr Met Ala Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp Ala
420 425 430
Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln
435 440 445
Ile Asp Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala
450 455 460
<210> 7
<211> 1284
<212> DNA
<213> Artificial Sequence
<220>
<223> Mela(palm)-mGluR6(IL1, CT) cDNA
<400> 7
atggactctc cttcaggacc aagagtcttg tcaagcttaa ctcaggatcc cagcttcaca 60
accagtcctg ccctgcaagg catttggaac ggcactcaga acgtctccgt aagagcccag 120
cttctctctg ttagccccac gacatctgca catcaggctg ctgcctgggt ccccttcccc 180
acagtcgatg tcccagacca tgctcactat accctaggca cggtgatcct gctggtggga 240
ctcacaggga tgctgggcaa tctgacggtc atctacacct tctgcaggaa cagaggcctg 300
cggacaccag caaacatgtt catcatcaac ctcgcagtca gcgacttcct catgtcagtc 360
actcaggccc cggtcttctt tgccagcagc ctctacaaga agtggctctt tggggagaca 420
ggttgcgagt tctatgcctt ctgcggggct gtctttggca tcacttccat gatcaccctg 480
acagccatag ccatggaccg ctatctggtg atcacacgtc cactggccac catcggcagg 540
ggatccaaaa gacgaacggc actcgtcctg ctaggcgtct ggctttatgc cctggcctgg 600
agtctgccac ctttctttgg ttggagtgcc tacgtgcccg aggggctgct gacatcctgc 660
tcctgggact acatgacctt cacaccccag gtgcgtgcct acaccatgct gctcttctgc 720
tttgtcttct tcctccccct gctcatcatc atcttctgct acatcttcat cttcagggcc 780
atccgagaga caggccgggc ctgtgagggc tgcggtgagt cccctctgcg gcagaggcgg 840
cagtggcagc ggctgcagag tgagtggaag atggccaagg tcgcactgat tgtcattctt 900
ctcttcgtgc tgtcctgggc tccctactcc actgtggctc tggtggcctt tgctggatac 960
tcgcacatcc tgacgcccta catgagctcg gtgccagccg tcatcgccaa ggcttctgcc 1020
atccacaatc ccattatcta cgccatcact caccccaagt acagggtggc cattgcccag 1080
cacctgcctt gcctgttcca tccagagcag aacgtgcaga agcggaagcg cagcctcaag 1140
aagacctcca cgatggcggc cccgcccaag agcgagaact cagaggacgc caagaagagc 1200
aggatcacca gcgagggcga gtacatcccc ctggaccaga tcgacatcaa cgtgacagag 1260
accagccaag tggcgcctgc ctaa 1284
<210> 8
<211> 431
<212> PRT
<213> Artificial Sequence
<220>
<223> Mela(palm)-mGluR6(IL1, CT) protein
<220>
<221> LIPID
<222> 368
<223> PALMITATE
<400> 8
Met Asp Ser Pro Ser Gly Pro Arg Val Leu Ser Ser Leu Thr Gln Asp
1 5 10 15
Pro Ser Phe Thr Thr Ser Pro Ala Leu Gln Gly Ile Trp Asn Gly Thr
20 25 30
Gln Asn Val Ser Val Arg Ala Gln Leu Leu Ser Val Ser Pro Thr Thr
35 40 45
Ser Ala His Gln Ala Ala Ala Trp Val Pro Phe Pro Thr Val Asp Val
50 55 60
Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val Gly
65 70 75 80
Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Met Arg
85 90 95
His Asn Asp Thr Pro Ile Val Arg Ala Ser Gly Arg Glu Leu Phe Ile
100 105 110
Ile Asn Leu Ala Val Ser Asp Phe Leu Met Ser Val Thr Gln Ala Pro
115 120 125
Val Phe Phe Ala Ser Ser Leu Tyr Lys Lys Trp Leu Phe Gly Glu Thr
130 135 140
Gly Cys Glu Phe Tyr Ala Phe Cys Gly Ala Val Phe Gly Ile Thr Ser
145 150 155 160
Met Ile Thr Leu Thr Ala Ile Ala Met Asp Arg Tyr Leu Val Ile Thr
165 170 175
Arg Pro Leu Ala Thr Ile Gly Arg Gly Ser Lys Arg Arg Thr Ala Leu
180 185 190
Val Leu Leu Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro
195 200 205
Phe Phe Gly Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys
210 215 220
Ser Trp Asp Tyr Met Thr Phe Thr Pro Gln Val Arg Ala Tyr Thr Met
225 230 235 240
Leu Leu Phe Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Phe
245 250 255
Cys Tyr Ile Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Cys
260 265 270
Glu Gly Cys Gly Glu Ser Pro Leu Arg Gln Arg Arg Gln Trp Gln Arg
275 280 285
Leu Gln Ser Glu Trp Lys Met Ala Lys Val Ala Leu Ile Val Ile Leu
290 295 300
Leu Phe Val Leu Ser Trp Ala Pro Tyr Ser Thr Val Ala Leu Val Ala
305 310 315 320
Phe Ala Gly Tyr Ser His Ile Leu Thr Pro Tyr Met Ser Ser Val Pro
325 330 335
Ala Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala
340 345 350
Ile Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys
355 360 365
Leu Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys
370 375 380
Lys Thr Ser Thr Met Ala Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp
385 390 395 400
Ala Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp
405 410 415
Gln Ile Asp Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala
420 425 430
<210> 9
<211> 1380
<212> DNA
<213> Artificial Sequence
<220>
<223> Mela(palm+33AA)-mGluR6(IL3, CT) cDNA
<400> 9
atggactctc cttcaggacc aagagtcttg tcaagcttaa ctcaggatcc cagcttcaca 60
accagtcctg ccctgcaagg catttggaac ggcactcaga acgtctccgt aagagcccag 120
cttctctctg ttagccccac gacatctgca catcaggctg ctgcctgggt ccccttcccc 180
acagtcgatg tcccagacca tgctcactat accctaggca cggtgatcct gctggtggga 240
ctcacaggga tgctgggcaa tctgacggtc atctacacct tctgcaggaa cagaggcctg 300
cggacaccag caaacatgtt catcatcaac ctcgcagtca gcgacttcct catgtcagtc 360
actcaggccc cggtcttctt tgccagcagc ctctacaaga agtggctctt tggggagaca 420
ggttgcgagt tctatgcctt ctgcggggct gtctttggca tcacttccat gatcaccctg 480
acagccatag ccatggaccg ctatctggtg atcacacgtc cactggccac catcggcagg 540
ggatccaaaa gacgaacggc actcgtcctg ctaggcgtct ggctttatgc cctggcctgg 600
agtctgccac ctttctttgg ttggagtgcc tacgtgcccg aggggctgct gacatcctgc 660
tcctgggact acatgacctt cacaccccag gtgcgtgcct acaccatgct gctcttctgc 720
tttgtcttct tcctccccct gctcatcatc atcttctgct acatcttcat cttcagggcc 780
atccgagaga caggccgggg tgtgccagag accttcaatg aagcccctct gcggcagagg 840
cggcagtggc agcggctgca gagtgagtgg aagatggcca aggtcgcact gattgtcatt 900
cttctcttcg tgctgtcctg ggctccctac tccactgtgg ctctggtggc ctttgctgga 960
tactcgcaca tcctgacgcc ctacatgagc tcggtgccag ccgtcatcgc caaggcttct 1020
gccatccaca atcccattat ctacgccatc actcacccca agtacagggt ggccattgcc 1080
cagcacctgc cttgccttgg ggtgcttctc ggtgtatcag gccagcgcag ccacccctcc 1140
ctcagctacc gctctaccca ccgctccaca ttgagcagcc agtcctcaga cctccatcca 1200
gagcagaacg tgcagaagcg gaagcgcagc ctcaagaaga cctccacgat ggcggccccg 1260
cccaagagcg agaactcaga ggacgccaag aagagcagga tcaccagcga gggcgagtac 1320
atccccctgg accagatcga catcaacgtg acagagacca gccaagtggc gcctgcctaa 1380
<210> 10
<211> 459
<212> PRT
<213> Artificial Sequence
<220>
<223> Mela(palm+33AA)-mGluR6(IL3, CT) protein
<220>
<221> LIPID
<222> 365
<223> PALMITATE
<400> 10
Met Asp Ser Pro Ser Gly Pro Arg Val Leu Ser Ser Leu Thr Gln Asp
1 5 10 15
Pro Ser Phe Thr Thr Ser Pro Ala Leu Gln Gly Ile Trp Asn Gly Thr
20 25 30
Gln Asn Val Ser Val Arg Ala Gln Leu Leu Ser Val Ser Pro Thr Thr
35 40 45
Ser Ala His Gln Ala Ala Ala Trp Val Pro Phe Pro Thr Val Asp Val
50 55 60
Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val Gly
65 70 75 80
Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys Arg
85 90 95
Asn Arg Gly Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu Ala
100 105 110
Val Ser Asp Phe Leu Met Ser Val Thr Gln Ala Pro Val Phe Phe Ala
115 120 125
Ser Ser Leu Tyr Lys Lys Trp Leu Phe Gly Glu Thr Gly Cys Glu Phe
130 135 140
Tyr Ala Phe Cys Gly Ala Val Phe Gly Ile Thr Ser Met Ile Thr Leu
145 150 155 160
Thr Ala Ile Ala Met Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu Ala
165 170 175
Thr Ile Gly Arg Gly Ser Lys Arg Arg Thr Ala Leu Val Leu Leu Gly
180 185 190
Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly Trp
195 200 205
Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp Tyr
210 215 220
Met Thr Phe Thr Pro Gln Val Arg Ala Tyr Thr Met Leu Leu Phe Cys
225 230 235 240
Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Phe Cys Tyr Ile Phe
245 250 255
Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Gly Val Pro Glu Thr Phe
260 265 270
Asn Glu Ala Pro Leu Arg Gln Arg Arg Gln Trp Gln Arg Leu Gln Ser
275 280 285
Glu Trp Lys Met Ala Lys Val Ala Leu Ile Val Ile Leu Leu Phe Val
290 295 300
Leu Ser Trp Ala Pro Tyr Ser Thr Val Ala Leu Val Ala Phe Ala Gly
305 310 315 320
Tyr Ser His Ile Leu Thr Pro Tyr Met Ser Ser Val Pro Ala Val Ile
325 330 335
Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile Thr His
340 345 350
Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu Gly Val
355 360 365
Leu Leu Gly Val Ser Gly Gln Arg Ser His Pro Ser Leu Ser Tyr Arg
370 375 380
Ser Thr His Arg Ser Thr Leu Ser Ser Gln Ser Ser Asp Leu His Pro
385 390 395 400
Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Lys Thr Ser Thr
405 410 415
Met Ala Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp Ala Lys Lys Ser
420 425 430
Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile Asp Ile
435 440 445
Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala
450 455
<210> 11
<211> 1164
<212> DNA
<213> Artificial Sequence
<220>
<223> Mela(palm)-OPN1MW(IL1, IL2, IL3, CT) cDNA
<400> 11
atggactctc cttcaggacc aagagtcttg tcaagcttaa ctcaggatcc cagcttcaca 60
accagtcctg ccctgcaagg catttggaac ggcactcaga acgtctccgt aagagcccag 120
cttctctctg ttagccccac gacatctgca catcaggctg ctgcctgggt ccccttcccc 180
acagtcgatg tcccagacca tgctcactat accctaggca cggtgatcct gctggtggga 240
ctcacaggga tgctgggcaa tctgacggtc atctacgcca ccatgagatt caagaagctg 300
cgccatccag caaacatgtt catcatcaac ctcgcagtca gcgacttcct catgtcagtc 360
actcaggccc cggtcttctt tgccagcagc ctctacaaga agtggctctt tggggagaca 420
ggttgcgagt tctatgcctt ctgcggggct gtctttggca tcacttccat gatcaccctg 480
acagccatag ccatggaccg ctatctggtg atctgcaagc cctttggcaa tgtgagattt 540
gatgctaagc tgacggcact cgtcctgcta ggcgtctggc tttatgccct ggcctggagt 600
ctgccacctt tctttggttg gagtgcctac gtgcccgagg ggctgctgac atcctgctcc 660
tgggactaca tgaccttcac accccaggtg cgtgcctaca ccatgctgct cttctgcttt 720
gtcttcttcc tccccctgct catcatcatc ttctgctaca tccaagtgtg gctggccatc 780
cgagcagtgg caaagcaaca gaaagaatct gagtccactc agaaggccga gaaggaggtg 840
acaaaggtcg cactgattgt cattcttctc ttcgtgctgt cctgggctcc ctactccact 900
gtggctctgg tggcctttgc tggatactcg cacatcctga cgccctacat gagctcggtg 960
ccagccgtca tcgccaaggc ttctgccatc cacaatccca ttatctacgc catcactcac 1020
cccaagtaca gggtggccat tgcccagcac ctgccttgca actgcatctt acatctcttt 1080
ggaaagaagg ttgatgatag ctctgaactt tccagcacct ccaagacaga agtctcatct 1140
gtctcttcag tgtcacctgc ataa 1164
<210> 12
<211> 387
<212> PRT
<213> Artificial Sequence
<220>
<223> Mela(palm)-OPN1MW(IL1, IL2, IL3, CT) protein
<220>
<221> LIPID
<222> 353
<223> PALMITATE
<400> 12
Met Asp Ser Pro Ser Gly Pro Arg Val Leu Ser Ser Leu Thr Gln Asp
1 5 10 15
Pro Ser Phe Thr Thr Ser Pro Ala Leu Gln Gly Ile Trp Asn Gly Thr
20 25 30
Gln Asn Val Ser Val Arg Ala Gln Leu Leu Ser Val Ser Pro Thr Thr
35 40 45
Ser Ala His Gln Ala Ala Ala Trp Val Pro Phe Pro Thr Val Asp Val
50 55 60
Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val Gly
65 70 75 80
Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Ala Thr Met Arg
85 90 95
Phe Lys Lys Leu Arg His Pro Ala Asn Met Phe Ile Ile Asn Leu Ala
100 105 110
Val Ser Asp Phe Leu Met Ser Val Thr Gln Ala Pro Val Phe Phe Ala
115 120 125
Ser Ser Leu Tyr Lys Lys Trp Leu Phe Gly Glu Thr Gly Cys Glu Phe
130 135 140
Tyr Ala Phe Cys Gly Ala Val Phe Gly Ile Thr Ser Met Ile Thr Leu
145 150 155 160
Thr Ala Ile Ala Met Asp Arg Tyr Leu Val Ile Cys Lys Pro Phe Gly
165 170 175
Asn Val Arg Phe Asp Ala Lys Leu Thr Ala Leu Val Leu Leu Gly Val
180 185 190
Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly Trp Ser
195 200 205
Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp Tyr Met
210 215 220
Thr Phe Thr Pro Gln Val Arg Ala Tyr Thr Met Leu Leu Phe Cys Phe
225 230 235 240
Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Phe Cys Tyr Ile Gln Val
245 250 255
Trp Leu Ala Ile Arg Ala Val Ala Lys Gln Gln Lys Glu Ser Glu Ser
260 265 270
Thr Gln Lys Ala Glu Lys Glu Val Thr Lys Val Ala Leu Ile Val Ile
275 280 285
Leu Leu Phe Val Leu Ser Trp Ala Pro Tyr Ser Thr Val Ala Leu Val
290 295 300
Ala Phe Ala Gly Tyr Ser His Ile Leu Thr Pro Tyr Met Ser Ser Val
305 310 315 320
Pro Ala Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr
325 330 335
Ala Ile Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro
340 345 350
Cys Asn Cys Ile Leu His Leu Phe Gly Lys Lys Val Asp Asp Ser Ser
355 360 365
Glu Leu Ser Ser Thr Ser Lys Thr Glu Val Ser Ser Val Ser Ser Val
370 375 380
Ser Pro Ala
385
<210> 13
<211> 1092
<212> DNA
<213> Artificial Sequence
<220>
<223> OPN1MW(palm)-mGluR6 cDNA
<400> 13
atggcccaaa ggcttacagg tgaacagaca ctggaccact atgaggatag cacccatgca 60
agcatcttca cctataccaa cagcaacagc accaaaggtc cctttgaagg ccccaattat 120
cacattgctc ccaggtgggt gtaccacctc accagcacct ggatgattct tgtggtcgtt 180
gcatctgtct tcactaatgg acttgtgctg gcagccacca tgagattcaa gaagctgcgc 240
catccactga actggattct ggtgaacttg gcagttgctg acctagcaga gaccattatt 300
gccagcacta tcagtgttgt gaaccaaatc tatggctact tcgttctggg acaccctctg 360
tgtgtcattg aaggctacat tgtctcattg tgtggaatca caggcctctg gtccctggcc 420
atcatttcct gggagagatg gctggtggtc tgcaagccct ttggcaatgt gagatttgat 480
gctaagctgg ccactgtggg aatcgtcttc tcctgggtct gggctgctat atggacggcc 540
ccaccaatct ttggttggag caggtactgg ccttatggcc tgaagacatc ctgtggccca 600
gacgtgttca gcggtacctc gtaccccggg gttcagtctt atatgatggt cctcatggtc 660
acgtgctgca tcttcccact cagcatcatc gtgctctgct acctccaagt gtggctggcc 720
atccgagcag tggcaaagca acagaaagaa tctgagtcca ctcagaaggc cgagaaggag 780
gtgacacgca tggtggtggt gatggtcttc gcatactgcc tctgctgggg accctatact 840
ttctttgcat gctttgctac tgcccaccct ggctatgcct tccaccctct tgtggcctcc 900
ctaccatcct actttgccaa aagtgccact atctacaacc ccattatcta tgtctttatg 960
aaccggcagt ttcgaaactg catcttacat ctctttcatc cagagcagaa cgtgcagaag 1020
cggaagcgca gcctcaagaa gacctccacg atggcggccc cgcccaagag cgagaactca 1080
gaggacgcca ag 1092
<210> 14
<211> 393
<212> PRT
<213> Artificial Sequence
<220>
<223> OPN1MW(palm)-mGluR6 protein
<400> 14
Met Ala Gln Arg Leu Thr Gly Glu Gln Thr Leu Asp His Tyr Glu Asp
1 5 10 15
Ser Thr His Ala Ser Ile Phe Thr Tyr Thr Asn Ser Asn Ser Thr Lys
20 25 30
Gly Pro Phe Glu Gly Pro Asn Tyr His Ile Ala Pro Arg Trp Val Tyr
35 40 45
His Leu Thr Ser Thr Trp Met Ile Leu Val Val Val Ala Ser Val Phe
50 55 60
Thr Asn Gly Leu Val Leu Ala Ala Thr Met Arg Phe Lys Lys Leu Arg
65 70 75 80
His Pro Leu Asn Trp Ile Leu Val Asn Leu Ala Val Ala Asp Leu Ala
85 90 95
Glu Thr Ile Ile Ala Ser Thr Ile Ser Val Val Asn Gln Ile Tyr Gly
100 105 110
Tyr Phe Val Leu Gly His Pro Leu Cys Val Ile Glu Gly Tyr Ile Val
115 120 125
Ser Leu Cys Gly Ile Thr Gly Leu Trp Ser Leu Ala Ile Ile Ser Trp
130 135 140
Glu Arg Trp Leu Val Val Cys Lys Pro Phe Gly Asn Val Arg Phe Asp
145 150 155 160
Ala Lys Leu Ala Thr Val Gly Ile Val Phe Ser Trp Val Trp Ala Ala
165 170 175
Ile Trp Thr Ala Pro Pro Ile Phe Gly Trp Ser Arg Tyr Trp Pro Tyr
180 185 190
Gly Leu Lys Thr Ser Cys Gly Pro Asp Val Phe Ser Gly Thr Ser Tyr
195 200 205
Pro Gly Val Gln Ser Tyr Met Met Val Leu Met Val Thr Cys Cys Ile
210 215 220
Phe Pro Leu Ser Ile Ile Val Leu Cys Tyr Leu Gln Val Trp Leu Ala
225 230 235 240
Ile Arg Ala Val Ala Lys Gln Gln Lys Glu Ser Glu Ser Thr Gln Lys
245 250 255
Ala Glu Lys Glu Val Thr Arg Met Val Val Val Met Val Phe Ala Tyr
260 265 270
Cys Leu Cys Trp Gly Pro Tyr Thr Phe Phe Ala Cys Phe Ala Thr Ala
275 280 285
His Pro Gly Tyr Ala Phe His Pro Leu Val Ala Ser Leu Pro Ser Tyr
290 295 300
Phe Ala Lys Ser Ala Thr Ile Tyr Asn Pro Ile Ile Tyr Val Phe Met
305 310 315 320
Asn Arg Gln Phe Arg Asn Cys Ile Leu His Leu Phe His Pro Glu Gln
325 330 335
Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Lys Thr Ser Thr Met Ala
340 345 350
Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp Ala Lys Lys Ser Arg Ile
355 360 365
Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile Asp Ile Asn Val
370 375 380
Thr Glu Thr Ser Gln Val Ala Pro Ala
385 390
<210> 15
<211> 1386
<212> DNA
<213> Artificial Sequence
<220>
<223> Mela(palm+33AA)-mGluR6 cDNA
<400> 15
atgaaccctc cttcggggcc aagagtcctg cccagcccaa cccaagagcc cagctgcatg 60
gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120
cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180
cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240
ggactcacgg ggatgctggg caacctgacg gtcatctata ccttctgcag gagcagaagc 300
ctccggacac ctgccaacat gttcattatc aacctcgcgg tcagcgactt cctcatgtcc 360
ttcacccagg cccctgtctt cttcaccagt agcctctata agcagtggct ctttggggag 420
acaggctgcg agttctatgc cttctgtgga gctctctttg gcatttcctc catgatcacc 480
ctgacggcca tcgccctgga ccgctacctg gtaatcacac gcccgctggc cacctttggt 540
gtggcgtcca agaggcgtgc ggcatttgtc ctgctgggcg tttggctcta tgccctggcc 600
tggagtctgc cacccttctt cggctggagc gcctacgtgc ccgaggggtt gctgacatcc 660
tgctcctggg actacatgag cttcacgccg gccgtgcgtg cctacaccat gcttctctgc 720
tgcttcgtgt tcttcctccc tctgcttatc atcatctact gctacatctt catcttcagg 780
gccatccggg agacaggacg ggctctccag accttcgggg cctgcaaggg caatggcgag 840
tccctgtggc agcggcagcg gctgcagagc gagtgcaaga tggccaagat catgctgctg 900
gtcatcctcc tcttcgtgct ctcctgggct ccctattccg ctgtggccct ggtggccttt 960
gctgggtacg cacacgtcct gacaccctac atgagctcgg tgccagccgt catcgccaag 1020
gcctctgcaa tccacaaccc catcatttac gccatcaccc accccaagta cagggtggcc 1080
attgcccagc acctgccctg cctgggggtg ctgctgggtg tatcacgccg gcacagtcgc 1140
ccctacccca gctaccgctc cacccaccgc tccacgctga ccagccacac ctccaacctc 1200
catccagagc agaatgtgca gaagcgaaag cggagcctca aggccacctc cacggtggca 1260
gccccaccca agggcgagga tgcagaggcc cacaagaaga gcaggatcac cagcgagggc 1320
gagtacatcc ccctggacca gatcgacatc aacgtgacag agaccagcca agtggcgcct 1380
gcctaa 1386
<210> 16
<211> 461
<212> PRT
<213> Artificial Sequence
<220>
<223> Mela(palm+33AA)-mGluR6 protein
<220>
<221> LIPID
<222> 367
<223> PALMITATE
<400> 16
Met Asn Pro Pro Ser Gly Pro Arg Val Leu Pro Ser Pro Thr Gln Glu
1 5 10 15
Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser
20 25 30
Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr
35 40 45
Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp
50 55 60
Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val
65 70 75 80
Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys
85 90 95
Arg Ser Arg Ser Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu
100 105 110
Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro Val Phe Phe
115 120 125
Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr Gly Cys Glu
130 135 140
Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser Met Ile Thr
145 150 155 160
Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu
165 170 175
Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe Val Leu Leu
180 185 190
Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly
195 200 205
Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp
210 215 220
Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met Leu Leu Cys
225 230 235 240
Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr Cys Tyr Ile
245 250 255
Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Leu Gln Thr Phe
260 265 270
Gly Ala Cys Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg Gln Arg Leu
275 280 285
Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val Ile Leu Leu
290 295 300
Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu Val Ala Phe
305 310 315 320
Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser Val Pro Ala
325 330 335
Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile
340 345 350
Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu
355 360 365
Gly Val Leu Leu Gly Val Ser Arg Arg His Ser Arg Pro Tyr Pro Ser
370 375 380
Tyr Arg Ser Thr His Arg Ser Thr Leu Thr Ser His Thr Ser Asn Leu
385 390 395 400
His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Ala Thr
405 410 415
Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu Ala His Lys
420 425 430
Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile
435 440 445
Asp Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala
450 455 460
<210> 17
<211> 1293
<212> DNA
<213> Artificial Sequence
<220>
<223> Mela(palm)-mGluR6 L isoform of h melanopsin comprising a Golgi
export signal and a 1D4 tag cDNA
<400> 17
atgaaccctc cttcggggcc aagagtcctg cccagcccaa cccaagagcc cagctgcatg 60
gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120
cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180
cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240
ggactcacgg ggatgctggg caacctgacg gtcatctata ccttctgcag gagcagaagc 300
ctccggacac ctgccaacat gttcattatc aacctcgcgg tcagcgactt cctcatgtcc 360
ttcacccagg cccctgtctt cttcaccagt agcctctata agcagtggct ctttggggag 420
acaggctgcg agttctatgc cttctgtgga gctctctttg gcatttcctc catgatcacc 480
ctgacggcca tcgccctgga ccgctacctg gtaatcacac gcccgctggc cacctttggt 540
gtggcgtcca agaggcgtgc ggcatttgtc ctgctgggcg tttggctcta tgccctggcc 600
tggagtctgc cacccttctt cggctggagc gcctacgtgc ccgaggggtt gctgacatcc 660
tgctcctggg actacatgag cttcacgccg gccgtgcgtg cctacaccat gcttctctgc 720
tgcttcgtgt tcttcctccc tctgcttatc atcatctact gctacatctt catcttcagg 780
gccatccggg agacaggacg ggctctccag accttcgggg cctgcaaggg caatggcgag 840
tccctgtggc agcggcagcg gctgcagagc gagtgcaaga tggccaagat catgctgctg 900
gtcatcctcc tcttcgtgct ctcctgggct ccctattccg ctgtggccct ggtggccttt 960
gctgggtacg cacacgtcct gacaccctac atgagctcgg tgccagccgt catcgccaag 1020
gcctctgcaa tccacaaccc catcatttac gccatcaccc accccaagta cagggtggcc 1080
attgcccagc acctgccctg cctgttccat ccagagcaga atgtgcagaa gcgaaagcgg 1140
agcctcaagg ccacctccac ggtggcagcc ccacccaagg gcgaggatgc agaggcccac 1200
aagaagagca ggatcaccag cgagggcgag tacatccccc tggaccagat cgacatcaac 1260
gtgacagaga ccagccaagt ggcgcctgcc taa 1293
<210> 18
<211> 430
<212> PRT
<213> Artificial Sequence
<220>
<223> Mela(palm)-mGluR6 L isoform of h melanopsin comprising a Golgi
export signal and a 1D4 tag protein
<220>
<221> LIPID
<222> 367
<223> PALMITATE
<400> 18
Met Asn Pro Pro Ser Gly Pro Arg Val Leu Pro Ser Pro Thr Gln Glu
1 5 10 15
Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser
20 25 30
Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr
35 40 45
Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp
50 55 60
Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val
65 70 75 80
Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys
85 90 95
Arg Ser Arg Ser Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu
100 105 110
Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro Val Phe Phe
115 120 125
Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr Gly Cys Glu
130 135 140
Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser Met Ile Thr
145 150 155 160
Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu
165 170 175
Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe Val Leu Leu
180 185 190
Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly
195 200 205
Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp
210 215 220
Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met Leu Leu Cys
225 230 235 240
Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr Cys Tyr Ile
245 250 255
Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Leu Gln Thr Phe
260 265 270
Gly Ala Cys Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg Gln Arg Leu
275 280 285
Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val Ile Leu Leu
290 295 300
Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu Val Ala Phe
305 310 315 320
Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser Val Pro Ala
325 330 335
Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile
340 345 350
Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu
355 360 365
Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Ala
370 375 380
Thr Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu Ala His
385 390 395 400
Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln
405 410 415
Ile Asp Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala
420 425 430
<210> 19
<211> 1293
<212> DNA
<213> Artificial Sequence
<220>
<223> Mela(palm)-mGluR6 P isoform of h melanopsin comprising a Golgi
export signal and a 1D4 tag cDNA
<400> 19
atgaaccctc cttcggggcc aagagtcccg cccagcccaa cccaagagcc cagctgcatg 60
gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120
cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180
cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240
ggactcacgg ggatgctggg caacctgacg gtcatctata ccttctgcag gagcagaagc 300
ctccggacac ctgccaacat gttcattatc aacctcgcgg tcagcgactt cctcatgtcc 360
ttcacccagg cccctgtctt cttcaccagt agcctctata agcagtggct ctttggggag 420
acaggctgcg agttctatgc cttctgtgga gctctctttg gcatttcctc catgatcacc 480
ctgacggcca tcgccctgga ccgctacctg gtaatcacac gcccgctggc cacctttggt 540
gtggcgtcca agaggcgtgc ggcatttgtc ctgctgggcg tttggctcta tgccctggcc 600
tggagtctgc cacccttctt cggctggagc gcctacgtgc ccgaggggtt gctgacatcc 660
tgctcctggg actacatgag cttcacgccg gccgtgcgtg cctacaccat gcttctctgc 720
tgcttcgtgt tcttcctccc tctgcttatc atcatctact gctacatctt catcttcagg 780
gccatccggg agacaggacg ggctctccag accttcgggg cctgcaaggg caatggcgag 840
tccctgtggc agcggcagcg gctgcagagc gagtgcaaga tggccaagat catgctgctg 900
gtcatcctcc tcttcgtgct ctcctgggct ccctattccg ctgtggccct ggtggccttt 960
gctgggtacg cacacgtcct gacaccctac atgagctcgg tgccagccgt catcgccaag 1020
gcctctgcaa tccacaaccc catcatttac gccatcaccc accccaagta cagggtggcc 1080
attgcccagc acctgccctg cctgttccat ccagagcaga atgtgcagaa gcgaaagcgg 1140
agcctcaagg ccacctccac ggtggcagcc ccacccaagg gcgaggatgc agaggcccac 1200
aagaagagca ggatcaccag cgagggcgag tacatccccc tggaccagat cgacatcaac 1260
gtgacagaga ccagccaagt ggcgcctgcc taa 1293
<210> 20
<211> 430
<212> PRT
<213> Artificial Sequence
<220>
<223> Mela(palm)-mGluR6 P isoform of h melanopsin comprising a Golgi
export signal and a 1D4 tag cDNAprotein
<220>
<221> LIPID
<222> 367
<223> PALMITATE
<400> 20
Met Asn Pro Pro Ser Gly Pro Arg Val Pro Pro Ser Pro Thr Gln Glu
1 5 10 15
Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser
20 25 30
Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr
35 40 45
Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp
50 55 60
Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val
65 70 75 80
Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys
85 90 95
Arg Ser Arg Ser Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu
100 105 110
Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro Val Phe Phe
115 120 125
Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr Gly Cys Glu
130 135 140
Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser Met Ile Thr
145 150 155 160
Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu
165 170 175
Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe Val Leu Leu
180 185 190
Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly
195 200 205
Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp
210 215 220
Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met Leu Leu Cys
225 230 235 240
Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr Cys Tyr Ile
245 250 255
Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Leu Gln Thr Phe
260 265 270
Gly Ala Cys Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg Gln Arg Leu
275 280 285
Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val Ile Leu Leu
290 295 300
Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu Val Ala Phe
305 310 315 320
Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser Val Pro Ala
325 330 335
Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile
340 345 350
Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu
355 360 365
Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Ala
370 375 380
Thr Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu Ala His
385 390 395 400
Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln
405 410 415
Ile Asp Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala
420 425 430
<210> 21
<211> 1266
<212> DNA
<213> Artificial Sequence
<220>
<223> Mela(palm)-mGluR6 L isoform of h melanopsin comprising a Golgi
export signal cDNA
<400> 21
atgaaccctc cttcggggcc aagagtcctg cccagcccaa cccaagagcc cagctgcatg 60
gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120
cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180
cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240
ggactcacgg ggatgctggg caacctgacg gtcatctata ccttctgcag gagcagaagc 300
ctccggacac ctgccaacat gttcattatc aacctcgcgg tcagcgactt cctcatgtcc 360
ttcacccagg cccctgtctt cttcaccagt agcctctata agcagtggct ctttggggag 420
acaggctgcg agttctatgc cttctgtgga gctctctttg gcatttcctc catgatcacc 480
ctgacggcca tcgccctgga ccgctacctg gtaatcacac gcccgctggc cacctttggt 540
gtggcgtcca agaggcgtgc ggcatttgtc ctgctgggcg tttggctcta tgccctggcc 600
tggagtctgc cacccttctt cggctggagc gcctacgtgc ccgaggggtt gctgacatcc 660
tgctcctggg actacatgag cttcacgccg gccgtgcgtg cctacaccat gcttctctgc 720
tgcttcgtgt tcttcctccc tctgcttatc atcatctact gctacatctt catcttcagg 780
gccatccggg agacaggacg ggctctccag accttcgggg cctgcaaggg caatggcgag 840
tccctgtggc agcggcagcg gctgcagagc gagtgcaaga tggccaagat catgctgctg 900
gtcatcctcc tcttcgtgct ctcctgggct ccctattccg ctgtggccct ggtggccttt 960
gctgggtacg cacacgtcct gacaccctac atgagctcgg tgccagccgt catcgccaag 1020
gcctctgcaa tccacaaccc catcatttac gccatcaccc accccaagta cagggtggcc 1080
attgcccagc acctgccctg cctgttccat ccagagcaga atgtgcagaa gcgaaagcgg 1140
agcctcaagg ccacctccac ggtggcagcc ccacccaagg gcgaggatgc agaggcccac 1200
aagaagagca ggatcaccag cgagggcgag tacatccccc tggaccagat cgacatcaac 1260
gtgtaa 1266
<210> 22
<211> 421
<212> PRT
<213> Artificial Sequence
<220>
<223> Mela(palm)-mGluR6 L isoform of h melanopsin comprising a Golgi
export signal protein
<400> 22
Met Asn Pro Pro Ser Gly Pro Arg Val Leu Pro Ser Pro Thr Gln Glu
1 5 10 15
Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser
20 25 30
Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr
35 40 45
Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp
50 55 60
Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val
65 70 75 80
Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys
85 90 95
Arg Ser Arg Ser Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu
100 105 110
Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro Val Phe Phe
115 120 125
Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr Gly Cys Glu
130 135 140
Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser Met Ile Thr
145 150 155 160
Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu
165 170 175
Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe Val Leu Leu
180 185 190
Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly
195 200 205
Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp
210 215 220
Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met Leu Leu Cys
225 230 235 240
Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr Cys Tyr Ile
245 250 255
Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Leu Gln Thr Phe
260 265 270
Gly Ala Cys Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg Gln Arg Leu
275 280 285
Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val Ile Leu Leu
290 295 300
Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu Val Ala Phe
305 310 315 320
Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser Val Pro Ala
325 330 335
Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile
340 345 350
Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu
355 360 365
Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Ala
370 375 380
Thr Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu Ala His
385 390 395 400
Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln
405 410 415
Ile Asp Ile Asn Val
420
<210> 23
<211> 1266
<212> DNA
<213> Artificial Sequence
<220>
<223> Mela(palm)-mGlur6 P isoform of h melanopsin comprising a Golgi
export signal cDNA
<400> 23
atgaaccctc cttcggggcc aagagtcccg cccagcccaa cccaagagcc cagctgcatg 60
gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120
cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180
cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240
ggactcacgg ggatgctggg caacctgacg gtcatctata ccttctgcag gagcagaagc 300
ctccggacac ctgccaacat gttcattatc aacctcgcgg tcagcgactt cctcatgtcc 360
ttcacccagg cccctgtctt cttcaccagt agcctctata agcagtggct ctttggggag 420
acaggctgcg agttctatgc cttctgtgga gctctctttg gcatttcctc catgatcacc 480
ctgacggcca tcgccctgga ccgctacctg gtaatcacac gcccgctggc cacctttggt 540
gtggcgtcca agaggcgtgc ggcatttgtc ctgctgggcg tttggctcta tgccctggcc 600
tggagtctgc cacccttctt cggctggagc gcctacgtgc ccgaggggtt gctgacatcc 660
tgctcctggg actacatgag cttcacgccg gccgtgcgtg cctacaccat gcttctctgc 720
tgcttcgtgt tcttcctccc tctgcttatc atcatctact gctacatctt catcttcagg 780
gccatccggg agacaggacg ggctctccag accttcgggg cctgcaaggg caatggcgag 840
tccctgtggc agcggcagcg gctgcagagc gagtgcaaga tggccaagat catgctgctg 900
gtcatcctcc tcttcgtgct ctcctgggct ccctattccg ctgtggccct ggtggccttt 960
gctgggtacg cacacgtcct gacaccctac atgagctcgg tgccagccgt catcgccaag 1020
gcctctgcaa tccacaaccc catcatttac gccatcaccc accccaagta cagggtggcc 1080
attgcccagc acctgccctg cctgttccat ccagagcaga atgtgcagaa gcgaaagcgg 1140
agcctcaagg ccacctccac ggtggcagcc ccacccaagg gcgaggatgc agaggcccac 1200
aagaagagca ggatcaccag cgagggcgag tacatccccc tggaccagat cgacatcaac 1260
gtgtaa 1266
<210> 24
<211> 421
<212> PRT
<213> Artificial Sequence
<220>
<223> Mela(palm)-mGlur6 P isoform of h melanopsin comprising a Golgi
export signal protein
<400> 24
Met Asn Pro Pro Ser Gly Pro Arg Val Pro Pro Ser Pro Thr Gln Glu
1 5 10 15
Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser
20 25 30
Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr
35 40 45
Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp
50 55 60
Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val
65 70 75 80
Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys
85 90 95
Arg Ser Arg Ser Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu
100 105 110
Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro Val Phe Phe
115 120 125
Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr Gly Cys Glu
130 135 140
Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser Met Ile Thr
145 150 155 160
Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu
165 170 175
Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe Val Leu Leu
180 185 190
Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly
195 200 205
Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp
210 215 220
Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met Leu Leu Cys
225 230 235 240
Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr Cys Tyr Ile
245 250 255
Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Leu Gln Thr Phe
260 265 270
Gly Ala Cys Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg Gln Arg Leu
275 280 285
Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val Ile Leu Leu
290 295 300
Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu Val Ala Phe
305 310 315 320
Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser Val Pro Ala
325 330 335
Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile
340 345 350
Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu
355 360 365
Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Ala
370 375 380
Thr Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu Ala His
385 390 395 400
Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln
405 410 415
Ile Asp Ile Asn Val
420
<210> 25
<211> 1206
<212> DNA
<213> Artificial Sequence
<220>
<223> Mela(palm)-mGluR6 L isoform of h melanopsin without optional
C-terminally added sequences cDNA
<400> 25
atgaaccctc cttcggggcc aagagtcctg cccagcccaa cccaagagcc cagctgcatg 60
gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120
cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180
cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240
ggactcacgg ggatgctggg caacctgacg gtcatctata ccttctgcag gagcagaagc 300
ctccggacac ctgccaacat gttcattatc aacctcgcgg tcagcgactt cctcatgtcc 360
ttcacccagg cccctgtctt cttcaccagt agcctctata agcagtggct ctttggggag 420
acaggctgcg agttctatgc cttctgtgga gctctctttg gcatttcctc catgatcacc 480
ctgacggcca tcgccctgga ccgctacctg gtaatcacac gcccgctggc cacctttggt 540
gtggcgtcca agaggcgtgc ggcatttgtc ctgctgggcg tttggctcta tgccctggcc 600
tggagtctgc cacccttctt cggctggagc gcctacgtgc ccgaggggtt gctgacatcc 660
tgctcctggg actacatgag cttcacgccg gccgtgcgtg cctacaccat gcttctctgc 720
tgcttcgtgt tcttcctccc tctgcttatc atcatctact gctacatctt catcttcagg 780
gccatccggg agacaggacg ggctctccag accttcgggg cctgcaaggg caatggcgag 840
tccctgtggc agcggcagcg gctgcagagc gagtgcaaga tggccaagat catgctgctg 900
gtcatcctcc tcttcgtgct ctcctgggct ccctattccg ctgtggccct ggtggccttt 960
gctgggtacg cacacgtcct gacaccctac atgagctcgg tgccagccgt catcgccaag 1020
gcctctgcaa tccacaaccc catcatttac gccatcaccc accccaagta cagggtggcc 1080
attgcccagc acctgccctg cctgttccat ccagagcaga atgtgcagaa gcgaaagcgg 1140
agcctcaagg ccacctccac ggtggcagcc ccacccaagg gcgaggatgc agaggcccac 1200
aagtaa 1206
<210> 26
<211> 401
<212> PRT
<213> Artificial Sequence
<220>
<223> Mela(palm)-mGluR6 L isoform of h melanopsin without optional
C-terminally added sequences protein
<400> 26
Met Asn Pro Pro Ser Gly Pro Arg Val Leu Pro Ser Pro Thr Gln Glu
1 5 10 15
Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser
20 25 30
Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr
35 40 45
Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp
50 55 60
Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val
65 70 75 80
Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys
85 90 95
Arg Ser Arg Ser Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu
100 105 110
Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro Val Phe Phe
115 120 125
Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr Gly Cys Glu
130 135 140
Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser Met Ile Thr
145 150 155 160
Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu
165 170 175
Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe Val Leu Leu
180 185 190
Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly
195 200 205
Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp
210 215 220
Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met Leu Leu Cys
225 230 235 240
Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr Cys Tyr Ile
245 250 255
Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Leu Gln Thr Phe
260 265 270
Gly Ala Cys Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg Gln Arg Leu
275 280 285
Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val Ile Leu Leu
290 295 300
Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu Val Ala Phe
305 310 315 320
Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser Val Pro Ala
325 330 335
Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile
340 345 350
Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu
355 360 365
Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Ala
370 375 380
Thr Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu Ala His
385 390 395 400
Lys
<210> 27
<211> 1206
<212> DNA
<213> Artificial Sequence
<220>
<223> Mela(palm)-mGluR6 P isoform of h melanopsin without optional
C-terminally added sequences cDNA
<400> 27
atgaaccctc cttcggggcc aagagtcccg cccagcccaa cccaagagcc cagctgcatg 60
gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120
cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180
cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240
ggactcacgg ggatgctggg caacctgacg gtcatctata ccttctgcag gagcagaagc 300
ctccggacac ctgccaacat gttcattatc aacctcgcgg tcagcgactt cctcatgtcc 360
ttcacccagg cccctgtctt cttcaccagt agcctctata agcagtggct ctttggggag 420
acaggctgcg agttctatgc cttctgtgga gctctctttg gcatttcctc catgatcacc 480
ctgacggcca tcgccctgga ccgctacctg gtaatcacac gcccgctggc cacctttggt 540
gtggcgtcca agaggcgtgc ggcatttgtc ctgctgggcg tttggctcta tgccctggcc 600
tggagtctgc cacccttctt cggctggagc gcctacgtgc ccgaggggtt gctgacatcc 660
tgctcctggg actacatgag cttcacgccg gccgtgcgtg cctacaccat gcttctctgc 720
tgcttcgtgt tcttcctccc tctgcttatc atcatctact gctacatctt catcttcagg 780
gccatccggg agacaggacg ggctctccag accttcgggg cctgcaaggg caatggcgag 840
tccctgtggc agcggcagcg gctgcagagc gagtgcaaga tggccaagat catgctgctg 900
gtcatcctcc tcttcgtgct ctcctgggct ccctattccg ctgtggccct ggtggccttt 960
gctgggtacg cacacgtcct gacaccctac atgagctcgg tgccagccgt catcgccaag 1020
gcctctgcaa tccacaaccc catcatttac gccatcaccc accccaagta cagggtggcc 1080
attgcccagc acctgccctg cctgttccat ccagagcaga atgtgcagaa gcgaaagcgg 1140
agcctcaagg ccacctccac ggtggcagcc ccacccaagg gcgaggatgc agaggcccac 1200
aagtaa 1206
<210> 28
<211> 401
<212> PRT
<213> Artificial Sequence
<220>
<223> Mela(palm)-mGluR6 P isoform of h melanopsin without optional
C-terminally added sequences protein
<400> 28
Met Asn Pro Pro Ser Gly Pro Arg Val Pro Pro Ser Pro Thr Gln Glu
1 5 10 15
Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser
20 25 30
Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr
35 40 45
Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp
50 55 60
Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val
65 70 75 80
Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys
85 90 95
Arg Ser Arg Ser Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu
100 105 110
Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro Val Phe Phe
115 120 125
Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr Gly Cys Glu
130 135 140
Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser Met Ile Thr
145 150 155 160
Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu
165 170 175
Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe Val Leu Leu
180 185 190
Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly
195 200 205
Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp
210 215 220
Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met Leu Leu Cys
225 230 235 240
Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr Cys Tyr Ile
245 250 255
Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Leu Gln Thr Phe
260 265 270
Gly Ala Cys Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg Gln Arg Leu
275 280 285
Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val Ile Leu Leu
290 295 300
Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu Val Ala Phe
305 310 315 320
Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser Val Pro Ala
325 330 335
Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala Ile
340 345 350
Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu
355 360 365
Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Ala
370 375 380
Thr Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu Ala His
385 390 395 400
Lys
<210> 29
<211> 1395
<212> DNA
<213> Artificial Sequence
<220>
<223> Mela(palm+33A)+mGluR6 (IL1, CT) cDNA
<400> 29
atgaaccctc cttcggggcc aagagtcctg cccagcccaa cccaagagcc cagctgcatg 60
gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120
cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180
cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240
ggactcacgg ggatgctggg caacctgacg gtcatctata ccttccggta caacaacacg 300
cccatcgtcc gggcctcggg ccgagagctc ttcattatca acctcgcggt cagcgacttc 360
ctcatgtcct tcacccaggc ccctgtcttc ttcaccagta gcctctataa gcagtggctc 420
tttggggaga caggctgcga gttctatgcc ttctgtggag ctctctttgg catttcctcc 480
atgatcaccc tgacggccat cgccctggac cgctacctgg taatcacacg cccgctggcc 540
acctttggtg tggcgtccaa gaggcgtgcg gcatttgtcc tgctgggcgt ttggctctat 600
gccctggcct ggagtctgcc acccttcttc ggctggagcg cctacgtgcc cgaggggttg 660
ctgacatcct gctcctggga ctacatgagc ttcacgccgg ccgtgcgtgc ctacaccatg 720
cttctctgct gcttcgtgtt cttcctccct ctgcttatca tcatctactg ctacatcttc 780
atcttcaggg ccatccggga gacaggacgg gctctccaga ccttcggggc ctgcaagggc 840
aatggcgagt ccctgtggca gcggcagcgg ctgcagagcg agtgcaagat ggccaagatc 900
atgctgctgg tcatcctcct cttcgtgctc tcctgggctc cctattccgc tgtggccctg 960
gtggcctttg ctgggtacgc acacgtcctg acaccctaca tgagctcggt gccagccgtc 1020
atcgccaagg cctctgcaat ccacaacccc atcatttacg ccatcaccca ccccaagtac 1080
agggtggcca ttgcccagca cctgccctgc ctgggggtgc tgctgggtgt atcacgccgg 1140
cacagtcgcc cctaccccag ctaccgctcc acccaccgct ccacgctgac cagccacacc 1200
tccaacctcc atccagagca gaatgtgcag aagcgaaagc ggagcctcaa ggccacctcc 1260
acggtggcag ccccacccaa gggcgaggat gcagaggccc acaagaagag caggatcacc 1320
agcgagggcg agtacatccc cctggaccag atcgacatca acgtgacaga gaccagccaa 1380
gtggcgcctg cctaa 1395
<210> 30
<211> 464
<212> PRT
<213> Artificial Sequence
<220>
<223> Mela(palm+33A)+mGluR6 (IL1, CT) protein
<220>
<221> LIPID
<222> 370
<223> PALMITATE
<400> 30
Met Asn Pro Pro Ser Gly Pro Arg Val Leu Pro Ser Pro Thr Gln Glu
1 5 10 15
Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser
20 25 30
Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr
35 40 45
Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp
50 55 60
Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val
65 70 75 80
Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Arg
85 90 95
Tyr Asn Asn Thr Pro Ile Val Arg Ala Ser Gly Arg Glu Leu Phe Ile
100 105 110
Ile Asn Leu Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro
115 120 125
Val Phe Phe Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr
130 135 140
Gly Cys Glu Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser
145 150 155 160
Met Ile Thr Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr
165 170 175
Arg Pro Leu Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe
180 185 190
Val Leu Leu Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro
195 200 205
Phe Phe Gly Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys
210 215 220
Ser Trp Asp Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met
225 230 235 240
Leu Leu Cys Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr
245 250 255
Cys Tyr Ile Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Ala Leu
260 265 270
Gln Thr Phe Gly Ala Cys Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg
275 280 285
Gln Arg Leu Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val
290 295 300
Ile Leu Leu Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu
305 310 315 320
Val Ala Phe Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser
325 330 335
Val Pro Ala Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile
340 345 350
Tyr Ala Ile Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu
355 360 365
Pro Cys Leu Gly Val Leu Leu Gly Val Ser Arg Arg His Ser Arg Pro
370 375 380
Tyr Pro Ser Tyr Arg Ser Thr His Arg Ser Thr Leu Thr Ser His Thr
385 390 395 400
Ser Asn Leu His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu
405 410 415
Lys Ala Thr Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu
420 425 430
Ala His Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu
435 440 445
Asp Gln Ile Asp Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala
450 455 460
<210> 31
<211> 1389
<212> DNA
<213> Artificial Sequence
<220>
<223> Mela(palm+33A)+mGluR6 (IL3, CT) cDNA
<400> 31
atgaaccctc cttcggggcc aagagtcctg cccagcccaa cccaagagcc cagctgcatg 60
gccaccccag caccacccag ctggtgggac agctcccaga gcagcatctc cagcctgggc 120
cggcttccat ccatcagtcc cacagcacct gggacttggg ctgctgcctg ggtccccctc 180
cccacggttg atgttccaga ccatgcccac tataccctgg gcacagtgat cttgctggtg 240
ggactcacgg ggatgctggg caacctgacg gtcatctata ccttctgcag gagcagaagc 300
ctccggacac ctgccaacat gttcattatc aacctcgcgg tcagcgactt cctcatgtcc 360
ttcacccagg cccctgtctt cttcaccagt agcctctata agcagtggct ctttggggag 420
acaggctgcg agttctatgc cttctgtgga gctctctttg gcatttcctc catgatcacc 480
ctgacggcca tcgccctgga ccgctacctg gtaatcacac gcccgctggc cacctttggt 540
gtggcgtcca agaggcgtgc ggcatttgtc ctgctgggcg tttggctcta tgccctggcc 600
tggagtctgc cacccttctt cggctggagc gcctacgtgc ccgaggggtt gctgacatcc 660
tgctcctggg actacatgag cttcacgccg gccgtgcgtg cctacaccat gcttctctgc 720
tgcttcgtgt tcttcctccc tctgcttatc atcatctact gctacatctt catcttcagg 780
gccatccggg agacaggacg gggcgtgccc gagaccttca acgaggccaa gggcaatggc 840
gagtccctgt ggcagcggca gcggctgcag agcgagtgca agatggccaa gatcatgctg 900
ctggtcatcc tcctcttcgt gctctcctgg gctccctatt ccgctgtggc cctggtggcc 960
tttgctgggt acgcacacgt cctgacaccc tacatgagct cggtgccagc cgtcatcgcc 1020
aaggcctctg caatccacaa ccccatcatt tacgccatca cccaccccaa gtacagggtg 1080
gccattgccc agcacctgcc ctgcctgggg gtgctgctgg gtgtatcacg ccggcacagt 1140
cgcccctacc ccagctaccg ctccacccac cgctccacgc tgaccagcca cacctccaac 1200
ctccatccag agcagaatgt gcagaagcga aagcggagcc tcaaggccac ctccacggtg 1260
gcagccccac ccaagggcga ggatgcagag gcccacaaga agagcaggat caccagcgag 1320
ggcgagtaca tccccctgga ccagatcgac atcaacgtga cagagaccag ccaagtggcg 1380
cctgcctaa 1389
<210> 32
<211> 462
<212> PRT
<213> Artificial Sequence
<220>
<223> Mela(palm+33A)+mGluR6 (IL3, CT) protein
<220>
<221> LIPID
<222> 368
<223> PALMITATE
<400> 32
Met Asn Pro Pro Ser Gly Pro Arg Val Leu Pro Ser Pro Thr Gln Glu
1 5 10 15
Pro Ser Cys Met Ala Thr Pro Ala Pro Pro Ser Trp Trp Asp Ser Ser
20 25 30
Gln Ser Ser Ile Ser Ser Leu Gly Arg Leu Pro Ser Ile Ser Pro Thr
35 40 45
Ala Pro Gly Thr Trp Ala Ala Ala Trp Val Pro Leu Pro Thr Val Asp
50 55 60
Val Pro Asp His Ala His Tyr Thr Leu Gly Thr Val Ile Leu Leu Val
65 70 75 80
Gly Leu Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Cys
85 90 95
Arg Ser Arg Ser Leu Arg Thr Pro Ala Asn Met Phe Ile Ile Asn Leu
100 105 110
Ala Val Ser Asp Phe Leu Met Ser Phe Thr Gln Ala Pro Val Phe Phe
115 120 125
Thr Ser Ser Leu Tyr Lys Gln Trp Leu Phe Gly Glu Thr Gly Cys Glu
130 135 140
Phe Tyr Ala Phe Cys Gly Ala Leu Phe Gly Ile Ser Ser Met Ile Thr
145 150 155 160
Leu Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Thr Arg Pro Leu
165 170 175
Ala Thr Phe Gly Val Ala Ser Lys Arg Arg Ala Ala Phe Val Leu Leu
180 185 190
Gly Val Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe Phe Gly
195 200 205
Trp Ser Ala Tyr Val Pro Glu Gly Leu Leu Thr Ser Cys Ser Trp Asp
210 215 220
Tyr Met Ser Phe Thr Pro Ala Val Arg Ala Tyr Thr Met Leu Leu Cys
225 230 235 240
Cys Phe Val Phe Phe Leu Pro Leu Leu Ile Ile Ile Tyr Cys Tyr Ile
245 250 255
Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Gly Val Pro Glu Thr
260 265 270
Phe Asn Glu Ala Lys Gly Asn Gly Glu Ser Leu Trp Gln Arg Gln Arg
275 280 285
Leu Gln Ser Glu Cys Lys Met Ala Lys Ile Met Leu Leu Val Ile Leu
290 295 300
Leu Phe Val Leu Ser Trp Ala Pro Tyr Ser Ala Val Ala Leu Val Ala
305 310 315 320
Phe Ala Gly Tyr Ala His Val Leu Thr Pro Tyr Met Ser Ser Val Pro
325 330 335
Ala Val Ile Ala Lys Ala Ser Ala Ile His Asn Pro Ile Ile Tyr Ala
340 345 350
Ile Thr His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys
355 360 365
Leu Gly Val Leu Leu Gly Val Ser Arg Arg His Ser Arg Pro Tyr Pro
370 375 380
Ser Tyr Arg Ser Thr His Arg Ser Thr Leu Thr Ser His Thr Ser Asn
385 390 395 400
Leu His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Ala
405 410 415
Thr Ser Thr Val Ala Ala Pro Pro Lys Gly Glu Asp Ala Glu Ala His
420 425 430
Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln
435 440 445
Ile Asp Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala
450 455 460
<210> 33
<211> 1095
<212> DNA
<213> Artificial Sequence
<220>
<223> JellyOP(palm)-mGluR6 cDNA
<400> 33
atgggagcga atataacaga aatattgtca ggctttttag cttgtgtagt atttctctct 60
ataagcttga atatgatagt tctaattaca ttttaccgct tacgacataa attggctttt 120
aaagatgctc tcatggctag tatggcgttc agtgatgttg tacaagctat cgtaggatat 180
cctttagagg tattcactgt agtagacgga aaatggacat tcggaatgga attatgtcaa 240
gttgcaggat ttttcattac tgcccttggt caagtttcca tcgctcatct cactgctctc 300
gccttagatc gatacttcac agtgtgcaga cctttcgtgg caactgcgat tcacggatca 360
atgagaaatg caggtatggt catatttgtt tgctggttct acgcgtcctt ctgggcagtc 420
ctacccttag ttggatggtc aaattatgac gtggagggtg acggtatgcg atgctccatc 480
aactgggcag acgacagtcc taaaagctac tcatacaggg tttgtttatt cgtattcatc 540
tacctgattc ctgttctttt gatggtggct acttacgtgt tggttcaagg agagatgaag 600
aatatgcgag gtcgtgcagc acagttgttt ggttcagaat ccgaggctgc actaaagaat 660
atcaaggccg aaaagcgaca cacaaggctg gttttcgtca tgatcctttc tttcatcgta 720
gcttggaccc catatacctt cgtcgccatg tgggtttcct ttttcacgaa acaacttggg 780
ccaatacctt tatacgttga tactttggca gctatgcttg caaagtcgtc ggctatgttc 840
aaccccatca tttactgctt cctccacaag caattcagaa gagctgtatt acgtggtgtt 900
tgtctgttcc atccagagca gaacgtgcag aagcggaagc gcagcctcaa gaagacctcc 960
acgatggcgg ccccgcccaa gagcgagaac tcagaggacg ccaagacaga gaccagccaa 1020
gtggcgcctg ccaagagcag gatcaccagc gagggcgagt acatccccct ggaccagatc 1080
gacatcaacg tgtaa 1095
<210> 34
<211> 364
<212> PRT
<213> Artificial Sequence
<220>
<223> JellyOP(palm)-mGluR6 protein
<220>
<221> LIPID
<222> 301
<223> PALMITATE
<400> 34
Met Gly Ala Asn Ile Thr Glu Ile Leu Ser Gly Phe Leu Ala Cys Val
1 5 10 15
Val Phe Leu Ser Ile Ser Leu Asn Met Ile Val Leu Ile Thr Phe Tyr
20 25 30
Arg Leu Arg His Lys Leu Ala Phe Lys Asp Ala Leu Met Ala Ser Met
35 40 45
Ala Phe Ser Asp Val Val Gln Ala Ile Val Gly Tyr Pro Leu Glu Val
50 55 60
Phe Thr Val Val Asp Gly Lys Trp Thr Phe Gly Met Glu Leu Cys Gln
65 70 75 80
Val Ala Gly Phe Phe Ile Thr Ala Leu Gly Gln Val Ser Ile Ala His
85 90 95
Leu Thr Ala Leu Ala Leu Asp Arg Tyr Phe Thr Val Cys Arg Pro Phe
100 105 110
Val Ala Thr Ala Ile His Gly Ser Met Arg Asn Ala Gly Met Val Ile
115 120 125
Phe Val Cys Trp Phe Tyr Ala Ser Phe Trp Ala Val Leu Pro Leu Val
130 135 140
Gly Trp Ser Asn Tyr Asp Val Glu Gly Asp Gly Met Arg Cys Ser Ile
145 150 155 160
Asn Trp Ala Asp Asp Ser Pro Lys Ser Tyr Ser Tyr Arg Val Cys Leu
165 170 175
Phe Val Phe Ile Tyr Leu Ile Pro Val Leu Leu Met Val Ala Thr Tyr
180 185 190
Val Leu Val Gln Gly Glu Met Lys Asn Met Arg Gly Arg Ala Ala Gln
195 200 205
Leu Phe Gly Ser Glu Ser Glu Ala Ala Leu Lys Asn Ile Lys Ala Glu
210 215 220
Lys Arg His Thr Arg Leu Val Phe Val Met Ile Leu Ser Phe Ile Val
225 230 235 240
Ala Trp Thr Pro Tyr Thr Phe Val Ala Met Trp Val Ser Phe Phe Thr
245 250 255
Lys Gln Leu Gly Pro Ile Pro Leu Tyr Val Asp Thr Leu Ala Ala Met
260 265 270
Leu Ala Lys Ser Ser Ala Met Phe Asn Pro Ile Ile Tyr Cys Phe Leu
275 280 285
His Lys Gln Phe Arg Arg Ala Val Leu Arg Gly Val Cys Leu Phe His
290 295 300
Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Lys Thr Ser
305 310 315 320
Thr Met Ala Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp Ala Lys Lys
325 330 335
Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile Asp
340 345 350
Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala
355 360
<210> 35
<211> 1128
<212> DNA
<213> Artificial Sequence
<220>
<223> JellyOP(palm)-5HT7 cDNA
<400> 35
atgggagcga atataacaga aatattgtca ggctttttag cttgtgtagt atttctctct 60
ataagcttga atatgatagt tctaattaca ttttaccgct tacgacataa attggctttt 120
aaagatgctc tcatggctag tatggcgttc agtgatgttg tacaagctat cgtaggatat 180
cctttagagg tattcactgt agtagacgga aaatggacat tcggaatgga attatgtcaa 240
gttgcaggat ttttcattac tgcccttggt caagtttcca tcgctcatct cactgctctc 300
gccttagatc gatacttcac agtgtgcaga cctttcgtgg caactgcgat tcacggatca 360
atgagaaatg caggtatggt catatttgtt tgctggttct acgcgtcctt ctgggcagtc 420
ctacccttag ttggatggtc aaattatgac gtggagggtg acggtatgcg atgctccatc 480
aactgggcag acgacagtcc taaaagctac tcatacaggg tttgtttatt cgtattcatc 540
tacctgattc ctgttctttt gatggtggct acttacgtgt tggttcaagg agagatgaag 600
aatatgcgag gtcgtgcagc acagttgttt ggttcagaat ccgaggctgc actaaagaat 660
atcaaggccg aaaagcgaca cacaaggctg gttttcgtca tgatcctttc tttcatcgta 720
gcttggaccc catatacctt cgtcgccatg tgggtttcct ttttcacgaa acaacttggg 780
ccaatacctt tatacgttga tactttggca gctatgcttg caaagtcgtc ggctatgttc 840
aaccccatca tttactgctt cctccacaag caattcagaa gagctgtatt acgtggtgtt 900
tgtcagtacc ggaatatcaa ccggaagctc tctgctgcag gcatgcacga agccctgaaa 960
cttgctgaga ggcctgagag aagcgagttt gtgctacaaa actgtgacca ctgtgggaaa 1020
aaaggtcatg atacatgaaa gagcaggatc accagcgagg gcgagtacat ccccctggac 1080
cagatcgaca tcaacgtgac agagaccagc caagtggcgc ctgcctaa 1128
<210> 36
<211> 374
<212> PRT
<213> Artificial Sequence
<220>
<223> JellyOP(palm)-5HT7 protein
<220>
<221> LIPID
<222> 301
<223> PALMITATE
<400> 36
Met Gly Ala Asn Ile Thr Glu Ile Leu Ser Gly Phe Leu Ala Cys Val
1 5 10 15
Val Phe Leu Ser Ile Ser Leu Asn Met Ile Val Leu Ile Thr Phe Tyr
20 25 30
Arg Leu Arg His Lys Leu Ala Phe Lys Asp Ala Leu Met Ala Ser Met
35 40 45
Ala Phe Ser Asp Val Val Gln Ala Ile Val Gly Tyr Pro Leu Glu Val
50 55 60
Phe Thr Val Val Asp Gly Lys Trp Thr Phe Gly Met Glu Leu Cys Gln
65 70 75 80
Val Ala Gly Phe Phe Ile Thr Ala Leu Gly Gln Val Ser Ile Ala His
85 90 95
Leu Thr Ala Leu Ala Leu Asp Arg Tyr Phe Thr Val Cys Arg Pro Phe
100 105 110
Val Ala Thr Ala Ile His Gly Ser Met Arg Asn Ala Gly Met Val Ile
115 120 125
Phe Val Cys Trp Phe Tyr Ala Ser Phe Trp Ala Val Leu Pro Leu Val
130 135 140
Gly Trp Ser Asn Tyr Asp Val Glu Gly Asp Gly Met Arg Cys Ser Ile
145 150 155 160
Asn Trp Ala Asp Asp Ser Pro Lys Ser Tyr Ser Tyr Arg Val Cys Leu
165 170 175
Phe Val Phe Ile Tyr Leu Ile Pro Val Leu Leu Met Val Ala Thr Tyr
180 185 190
Val Leu Val Gln Gly Glu Met Lys Asn Met Arg Gly Arg Ala Ala Gln
195 200 205
Leu Phe Gly Ser Glu Ser Glu Ala Ala Leu Lys Asn Ile Lys Ala Glu
210 215 220
Lys Arg His Thr Arg Leu Val Phe Val Met Ile Leu Ser Phe Ile Val
225 230 235 240
Ala Trp Thr Pro Tyr Thr Phe Val Ala Met Trp Val Ser Phe Phe Thr
245 250 255
Lys Gln Leu Gly Pro Ile Pro Leu Tyr Val Asp Thr Leu Ala Ala Met
260 265 270
Leu Ala Lys Ser Ser Ala Met Phe Asn Pro Ile Ile Tyr Cys Phe Leu
275 280 285
His Lys Gln Phe Arg Arg Ala Val Leu Arg Gly Val Cys Gln Tyr Arg
290 295 300
Asn Ile Asn Arg Lys Leu Ser Ala Ala Gly Met His Glu Ala Leu Lys
305 310 315 320
Leu Ala Glu Arg Pro Glu Arg Ser Glu Phe Val Leu Gln Asn Cys Asp
325 330 335
His Cys Gly Lys Lys Gly His Asp Thr Lys Ser Arg Ile Thr Ser Glu
340 345 350
Gly Glu Tyr Ile Pro Leu Asp Gln Ile Asp Ile Asn Val Thr Glu Thr
355 360 365
Ser Gln Val Ala Pro Ala
370
<210> 37
<211> 1118
<212> DNA
<213> Artificial Sequence
<220>
<223> PPO(palm)-mGluR6 cDNA
<400> 37
ccatggagaa cttgacctcg ctcgacctcc tgcccaacgg cgaggtcccg ttgatgcccc 60
gctacggctt caccatcctc gccgtgatca tggccgtgtt caccatcgcc tcgctcgtgc 120
tcaacagcac cgtcgtcatc gtcaccctgc gccaccgcca gctacgccac ccgctcaact 180
tctcgctcgt caacctcgcc gtggcggacc tgggcgtcac ggtgttcggc gccagcctcg 240
tcgtggagac caacgccgtc gggtacttca acctcggccg cgtcggctgc gtcatcgaag 300
ggttcgccgt cgctttcttc ggcatcgccg ctctgtgcac gatcgccgtg atcgccgtcg 360
atcgcttcgt ggtggtgtgc aagccgctgg gcacgctgat gttcacgcgg cgccacgcgc 420
tgctgggcat cgcctgggcc tggctctggt cgttcgtgtg gaacacgccg ccgctcttcg 480
gctggggcag ctacgagctg gagggcgtgc ggacgtcgtg cgcgcccgac tggtacagcc 540
gcgaccccgc caacgtgtcg tacattacga gctacttcgc cttctgcttc gccatcccct 600
tcctcgtcat cgtggtggcg tacggccgcc tcatgtggac cctccaccag gtggccaagc 660
tggggatggg cgagagcggc agcaccgcca aggcggaggc gcaggtgtcg cgcatggtgg 720
tggtcatggt ggtggccttc ctcgtctgct ggctgcccta cgcgctcttc gccatgatcg 780
tggtgaccaa gcccgacgtg tacatcgacc cggtcatcgc cacactgccc atgtacctga 840
ccaagacgag cacggtctac aaccccatca tctacatctt catgaaccgc cagttccggg 900
actgcgccgt gcccttcctg ctctgcctgt tccatccaga gcagaacgtg cagaagcgga 960
agcgcagcct caagaagacc tccacgatgg cggccccgcc caagagcgag aactcagagg 1020
acgccaagac agagaccagc caagtggcgc ctgccaagag caggatcacc agcgagggcg 1080
agtacatccc cctggaccag atcgacatca acgtgtaa 1118
<210> 38
<211> 371
<212> PRT
<213> Artificial Sequence
<220>
<223> PPO(palm)-mGluR6 protein
<220>
<221> LIPID
<222> 308
<223> PALMITATE
<400> 38
Met Glu Asn Leu Thr Ser Leu Asp Leu Leu Pro Asn Gly Glu Val Pro
1 5 10 15
Leu Met Pro Arg Tyr Gly Phe Thr Ile Leu Ala Val Ile Met Ala Val
20 25 30
Phe Thr Ile Ala Ser Leu Val Leu Asn Ser Thr Val Val Ile Val Thr
35 40 45
Leu Arg His Arg Gln Leu Arg His Pro Leu Asn Phe Ser Leu Val Asn
50 55 60
Leu Ala Val Ala Asp Leu Gly Val Thr Val Phe Gly Ala Ser Leu Val
65 70 75 80
Val Glu Thr Asn Ala Val Gly Tyr Phe Asn Leu Gly Arg Val Gly Cys
85 90 95
Val Ile Glu Gly Phe Ala Val Ala Phe Phe Gly Ile Ala Ala Leu Cys
100 105 110
Thr Ile Ala Val Ile Ala Val Asp Arg Phe Val Val Val Cys Lys Pro
115 120 125
Leu Gly Thr Leu Met Phe Thr Arg Arg His Ala Leu Leu Gly Ile Ala
130 135 140
Trp Ala Trp Leu Trp Ser Phe Val Trp Asn Thr Pro Pro Leu Phe Gly
145 150 155 160
Trp Gly Ser Tyr Glu Leu Glu Gly Val Arg Thr Ser Cys Ala Pro Asp
165 170 175
Trp Tyr Ser Arg Asp Pro Ala Asn Val Ser Tyr Ile Thr Ser Tyr Phe
180 185 190
Ala Phe Cys Phe Ala Ile Pro Phe Leu Val Ile Val Val Ala Tyr Gly
195 200 205
Arg Leu Met Trp Thr Leu His Gln Val Ala Lys Leu Gly Met Gly Glu
210 215 220
Ser Gly Ser Thr Ala Lys Ala Glu Ala Gln Val Ser Arg Met Val Val
225 230 235 240
Val Met Val Val Ala Phe Leu Val Cys Trp Leu Pro Tyr Ala Leu Phe
245 250 255
Ala Met Ile Val Val Thr Lys Pro Asp Val Tyr Ile Asp Pro Val Ile
260 265 270
Ala Thr Leu Pro Met Tyr Leu Thr Lys Thr Ser Thr Val Tyr Asn Pro
275 280 285
Ile Ile Tyr Ile Phe Met Asn Arg Gln Phe Arg Asp Cys Ala Val Pro
290 295 300
Phe Leu Leu Cys Leu Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys
305 310 315 320
Arg Ser Leu Lys Lys Thr Ser Thr Met Ala Ala Pro Pro Lys Ser Glu
325 330 335
Asn Ser Glu Asp Ala Lys Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr
340 345 350
Ile Pro Leu Asp Gln Ile Asp Ile Asn Val Thr Glu Thr Ser Gln Val
355 360 365
Ala Pro Ala
370
<210> 39
<211> 1238
<212> DNA
<213> Artificial Sequence
<220>
<223> JSR1(palm)-mGluR6 cDNA
<400> 39
atgttaccac atgcagcaaa aatggcggcc agggtggctg gcgatcacga tggaagaaac 60
atttcaattg ttgatcttct gccagaagac atgctaccga tgattcacga acattggtat 120
aagttccccc cgatggaaac ttccatgcat tatatcctcg gaatgcttat tatagttata 180
ggaatcatca gtgtatcagg taatggagtt gtcatgtact taatgatgac agtgaagaac 240
ctccgaactc ccggtaattt tctggtattg aatcttgccc tatctgattt tggtatgctg 300
ttttttatga tgccgacgat gtccataaat tgcttcgccg aaacgtgggt tataggacct 360
ttcatgtgtg agctctatgg aatgatcggc tcattatttg gaagtgcatc tatctggagt 420
ctggtaatga taacactcga ccgatacaat gtcatcgtga aaggaatggc tggaaaacct 480
ctaacgaaag ttggagcact gttaagaatg cttttcgtct ggatttggtc attaggctgg 540
accattgcac cgatgtacgg atggagcagg tatgttcctg aaggctcgat gacatcatgc 600
actattgact acatagatac agctattaat ccaatgtctt accttatcgc ctacgctatt 660
tttgtatact tcgtaccact ctttatcatt atttactgct acgctttcat cgtaatgcaa 720
gtagcagccc acgagaaatc cctacgagaa caagctaaaa agatgaacat caaatccctc 780
agatcaaatg aagataacaa gaaagcaagt gcagaattca gactggctaa ggtggctttt 840
atgaccatct gctgctggtt catggcgtgg actccttatc taaccctgtc cttccttgga 900
atcttctccg acaggacctg gctaacacct atgacatccg tttggggagc catatttgca 960
aaagctagtg cctgctacaa tcctattgtt tatggaataa gtcatcctaa gtatcgtgcc 1020
gctttacatg ataagttccc atgcctctgt tccatccaga gcagaacgtg cagaagcgga 1080
agcgcagcct caagaagacc tccacgatgg cggccccgcc caagagcgag aactcagagg 1140
acgccaagac agagaccagc caagtggcgc ctgccaagag caggatcacc agcgagggcg 1200
agtacatccc cctggaccag atcgacatca acgtgtaa 1238
<210> 40
<211> 411
<212> PRT
<213> Artificial Sequence
<220>
<223> JSR1(palm)-mGluR6 protein
<220>
<221> LIPID
<222> 348
<223> PALMITATE
<400> 40
Met Leu Pro His Ala Ala Lys Met Ala Ala Arg Val Ala Gly Asp His
1 5 10 15
Asp Gly Arg Asn Ile Ser Ile Val Asp Leu Leu Pro Glu Asp Met Leu
20 25 30
Pro Met Ile His Glu His Trp Tyr Lys Phe Pro Pro Met Glu Thr Ser
35 40 45
Met His Tyr Ile Leu Gly Met Leu Ile Ile Val Ile Gly Ile Ile Ser
50 55 60
Val Ser Gly Asn Gly Val Val Met Tyr Leu Met Met Thr Val Lys Asn
65 70 75 80
Leu Arg Thr Pro Gly Asn Phe Leu Val Leu Asn Leu Ala Leu Ser Asp
85 90 95
Phe Gly Met Leu Phe Phe Met Met Pro Thr Met Ser Ile Asn Cys Phe
100 105 110
Ala Glu Thr Trp Val Ile Gly Pro Phe Met Cys Glu Leu Tyr Gly Met
115 120 125
Ile Gly Ser Leu Phe Gly Ser Ala Ser Ile Trp Ser Leu Val Met Ile
130 135 140
Thr Leu Asp Arg Tyr Asn Val Ile Val Lys Gly Met Ala Gly Lys Pro
145 150 155 160
Leu Thr Lys Val Gly Ala Leu Leu Arg Met Leu Phe Val Trp Ile Trp
165 170 175
Ser Leu Gly Trp Thr Ile Ala Pro Met Tyr Gly Trp Ser Arg Tyr Val
180 185 190
Pro Glu Gly Ser Met Thr Ser Cys Thr Ile Asp Tyr Ile Asp Thr Ala
195 200 205
Ile Asn Pro Met Ser Tyr Leu Ile Ala Tyr Ala Ile Phe Val Tyr Phe
210 215 220
Val Pro Leu Phe Ile Ile Ile Tyr Cys Tyr Ala Phe Ile Val Met Gln
225 230 235 240
Val Ala Ala His Glu Lys Ser Leu Arg Glu Gln Ala Lys Lys Met Asn
245 250 255
Ile Lys Ser Leu Arg Ser Asn Glu Asp Asn Lys Lys Ala Ser Ala Glu
260 265 270
Phe Arg Leu Ala Lys Val Ala Phe Met Thr Ile Cys Cys Trp Phe Met
275 280 285
Ala Trp Thr Pro Tyr Leu Thr Leu Ser Phe Leu Gly Ile Phe Ser Asp
290 295 300
Arg Thr Trp Leu Thr Pro Met Thr Ser Val Trp Gly Ala Ile Phe Ala
305 310 315 320
Lys Ala Ser Ala Cys Tyr Asn Pro Ile Val Tyr Gly Ile Ser His Pro
325 330 335
Lys Tyr Arg Ala Ala Leu His Asp Lys Phe Pro Cys Leu Phe His Pro
340 345 350
Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Lys Thr Ser Thr
355 360 365
Met Ala Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp Ala Lys Lys Ser
370 375 380
Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile Asp Ile
385 390 395 400
Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala
405 410
<210> 41
<211> 1722
<212> DNA
<213> Artificial Sequence
<220>
<223> hJSR(S186F)palm-GABAB2-TS-1D4 cDNA
<400> 41
atgctgcctc acgccgctaa aatggccgca agagtggccg gagatcacga cggcagaaac 60
atctctatcg tggacctgct gcctgaagat atgcttccaa tgattcacga gcactggtac 120
aagtttcccc ccatggaaac cagcatgcac tacatcctgg gcatgctgat catcgtgatc 180
ggaatcattt ctgtgtccgg caatggcgtg gtgatgtacc tgatgatgac cgttaagaac 240
ctgcggacac ctggaaattt cctggtgctg aacctggctc tgagcgactt cggcatgctg 300
ttcttcatga tgcccaccat gagcatcaac tgtttcgccg agacatgggt catcggtcct 360
ttcatgtgcg agctgtacgg catgatcggc tctctgtttg gcagcgccag catctggtct 420
cttgtgatga tcaccctgga ccggtataat gtcatcgtta agggaatggc cggaaagcct 480
ctgaccaagg tgggcgctct gctgagaatg ctcttcgtgt ggatctggtc cctgggctgg 540
accattgccc ctatgtacgg ctggagcaga tatgtgccag agggctctat gaccttctgc 600
accatcgatt acatcgacac cgccattaac cccatgagct acctgatcgc ctacgccatc 660
ttcgtgtact tcgtgcccct gttcatcatc atctactgct acgcctttat cgtgatgcag 720
gtggctgccc atgagaagag cctgcgggaa caggccaaga aaatgaacat caagagcctg 780
cgctccaacg aggacaacaa gaaggcctct gccgagttca gactggccaa agtggccttc 840
atgaccatct gctgttggtt catggcttgg accccttacc tgacactgag cttcctgggc 900
atcttcagcg acagaacatg gctgacccct atgacaagcg tgtggggcgc catctttgcc 960
aaggccagcg cctgttacaa ccctatcgtg tacggcatca gccaccccaa gtacagagcc 1020
gccctgcacg ataagtttcc ttgcactctg aggacaaacc ctgacgcagc cactcagaac 1080
aggcgattcc agttcacaca gaaccagaag aaagaagatt cgaagacctc cacctcagtc 1140
accagcgtga accaggcgag cacgtcacgc ctggagggac tgcagtcaga aaaccaccgc 1200
ctacgaatga agatcacaga gctggacaaa gacttggaag aagtcaccat gcagctacaa 1260
gacacaccag agaagaccac atacatcaaa cagaatcact accaagagct caacgacatc 1320
ctcagcttgg gcaacttcac agagagcaca gatggaggaa aggccattct aaaaaatcac 1380
ctcgatcaaa accctcagct ccagtggaac acgaccgagc cctcaagaac atgcaaagac 1440
cccatagagg acatcaactc cccagagcac atccagcgcc ggctgtccct ccagctcccc 1500
atcctccacc acgcctacct cccgtccatt ggaggcgtgg acgccagctg cgtcagcccc 1560
tgtgtcagcc ctacagccag ccctcgccac agacacgtac caccctcctt ccgagtcatg 1620
gtctcgggcc tgaagagcag gatcaccagc gagggcgagt acatccccct ggaccagatc 1680
gacatcaacg tgacagagac cagccaagtg gcgcctgcct aa 1722
<210> 42
<211> 573
<212> PRT
<213> Artificial Sequence
<220>
<223> hJSR(S186F)palm-GABAB2-TS-1D4 protein
<400> 42
Met Leu Pro His Ala Ala Lys Met Ala Ala Arg Val Ala Gly Asp His
1 5 10 15
Asp Gly Arg Asn Ile Ser Ile Val Asp Leu Leu Pro Glu Asp Met Leu
20 25 30
Pro Met Ile His Glu His Trp Tyr Lys Phe Pro Pro Met Glu Thr Ser
35 40 45
Met His Tyr Ile Leu Gly Met Leu Ile Ile Val Ile Gly Ile Ile Ser
50 55 60
Val Ser Gly Asn Gly Val Val Met Tyr Leu Met Met Thr Val Lys Asn
65 70 75 80
Leu Arg Thr Pro Gly Asn Phe Leu Val Leu Asn Leu Ala Leu Ser Asp
85 90 95
Phe Gly Met Leu Phe Phe Met Met Pro Thr Met Ser Ile Asn Cys Phe
100 105 110
Ala Glu Thr Trp Val Ile Gly Pro Phe Met Cys Glu Leu Tyr Gly Met
115 120 125
Ile Gly Ser Leu Phe Gly Ser Ala Ser Ile Trp Ser Leu Val Met Ile
130 135 140
Thr Leu Asp Arg Tyr Asn Val Ile Val Lys Gly Met Ala Gly Lys Pro
145 150 155 160
Leu Thr Lys Val Gly Ala Leu Leu Arg Met Leu Phe Val Trp Ile Trp
165 170 175
Ser Leu Gly Trp Thr Ile Ala Pro Met Tyr Gly Trp Ser Arg Tyr Val
180 185 190
Pro Glu Gly Ser Met Thr Phe Cys Thr Ile Asp Tyr Ile Asp Thr Ala
195 200 205
Ile Asn Pro Met Ser Tyr Leu Ile Ala Tyr Ala Ile Phe Val Tyr Phe
210 215 220
Val Pro Leu Phe Ile Ile Ile Tyr Cys Tyr Ala Phe Ile Val Met Gln
225 230 235 240
Val Ala Ala His Glu Lys Ser Leu Arg Glu Gln Ala Lys Lys Met Asn
245 250 255
Ile Lys Ser Leu Arg Ser Asn Glu Asp Asn Lys Lys Ala Ser Ala Glu
260 265 270
Phe Arg Leu Ala Lys Val Ala Phe Met Thr Ile Cys Cys Trp Phe Met
275 280 285
Ala Trp Thr Pro Tyr Leu Thr Leu Ser Phe Leu Gly Ile Phe Ser Asp
290 295 300
Arg Thr Trp Leu Thr Pro Met Thr Ser Val Trp Gly Ala Ile Phe Ala
305 310 315 320
Lys Ala Ser Ala Cys Tyr Asn Pro Ile Val Tyr Gly Ile Ser His Pro
325 330 335
Lys Tyr Arg Ala Ala Leu His Asp Lys Phe Pro Cys Thr Leu Arg Thr
340 345 350
Asn Pro Asp Ala Ala Thr Gln Asn Arg Arg Phe Gln Phe Thr Gln Asn
355 360 365
Gln Lys Lys Glu Asp Ser Lys Thr Ser Thr Ser Val Thr Ser Val Asn
370 375 380
Gln Ala Ser Thr Ser Arg Leu Glu Gly Leu Gln Ser Glu Asn His Arg
385 390 395 400
Leu Arg Met Lys Ile Thr Glu Leu Asp Lys Asp Leu Glu Glu Val Thr
405 410 415
Met Gln Leu Gln Asp Thr Pro Glu Lys Thr Thr Tyr Ile Lys Gln Asn
420 425 430
His Tyr Gln Glu Leu Asn Asp Ile Leu Ser Leu Gly Asn Phe Thr Glu
435 440 445
Ser Thr Asp Gly Gly Lys Ala Ile Leu Lys Asn His Leu Asp Gln Asn
450 455 460
Pro Gln Leu Gln Trp Asn Thr Thr Glu Pro Ser Arg Thr Cys Lys Asp
465 470 475 480
Pro Ile Glu Asp Ile Asn Ser Pro Glu His Ile Gln Arg Arg Leu Ser
485 490 495
Leu Gln Leu Pro Ile Leu His His Ala Tyr Leu Pro Ser Ile Gly Gly
500 505 510
Val Asp Ala Ser Cys Val Ser Pro Cys Val Ser Pro Thr Ala Ser Pro
515 520 525
Arg His Arg His Val Pro Pro Ser Phe Arg Val Met Val Ser Gly Leu
530 535 540
Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile
545 550 555 560
Asp Ile Asn Val Thr Glu Thr Ser Gln Val Ala Pro Ala
565 570
<210> 43
<211> 1374
<212> DNA
<213> Artificial Sequence
<220>
<223> JSR(S186F)palm-beta2AR cDNA
<400> 43
atgctgcctc acgccgctaa aatggccgca agagtggccg gagatcacga cggcagaaac 60
atctctatcg tggacctgct gcctgaagat atgcttccaa tgattcacga gcactggtac 120
aagtttcccc ccatggaaac cagcatgcac tacatcctgg gcatgctgat catcgtgatc 180
ggaatcattt ctgtgtccgg caatggcgtg gtgatgtacc tgatgatgac cgttaagaac 240
ctgcggacac ctggaaattt cctggtgctg aacctggctc tgagcgactt cggcatgctg 300
ttcttcatga tgcccaccat gagcatcaac tgtttcgccg agacatgggt catcggtcct 360
ttcatgtgcg agctgtacgg catgatcggc tctctgtttg gcagcgccag catctggtct 420
cttgtgatga tcaccctgga ccggtataat gtcatcgtta agggaatggc cggaaagcct 480
ctgaccaagg tgggcgctct gctgagaatg ctcttcgtgt ggatctggtc cctgggctgg 540
accattgccc ctatgtacgg ctggagcaga tatgtgccag agggctctat gaccttctgc 600
accatcgatt acatcgacac cgccattaac cccatgagct acctgatcgc ctacgccatc 660
ttcgtgtact tcgtgcccct gttcatcatc atctactgct acgcctttat cgtgatgcag 720
gtggctgccc atgagaagag cctgcgggaa caggccaaga aaatgaacat caagagcctg 780
cgctccaacg aggacaacaa gaaggcctct gccgagttca gactggccaa agtggccttc 840
atgaccatct gctgttggtt catggcttgg accccttacc tgacactgag cttcctgggc 900
atcttcagcg acagaacatg gctgacccct atgacaagcg tgtggggcgc catctttgcc 960
aaggccagcg cctgttacaa ccctatcgtg tacggcatca gccaccccaa gtacagagcc 1020
gccctgcacg ataagtttcc ttgcattgcc ttccaggagc ttctgtgcct gcgcaggtct 1080
tctttgaagg cctatgggaa tggctactcc agcaacggca acacagggga gcagagtgga 1140
tatcacgtgg aacaggagaa agaaaataaa ctgctgtgtg aagacctccc aggcacggaa 1200
gactttgtgg gccatcaagg tactgtgcct agcgataaca ttgattcaca agggaggaat 1260
tgtagtacaa atgactcact gctgaagagc aggatcacca gcgagggcga gtacatcccc 1320
ctggaccaga tcgacatcaa cgtgacagag accagccaag tggcgcctgc ctaa 1374
<210> 44
<211> 457
<212> PRT
<213> Artificial Sequence
<220>
<223> JSR(S186F)palm-beta2AR protein
<400> 44
Met Leu Pro His Ala Ala Lys Met Ala Ala Arg Val Ala Gly Asp His
1 5 10 15
Asp Gly Arg Asn Ile Ser Ile Val Asp Leu Leu Pro Glu Asp Met Leu
20 25 30
Pro Met Ile His Glu His Trp Tyr Lys Phe Pro Pro Met Glu Thr Ser
35 40 45
Met His Tyr Ile Leu Gly Met Leu Ile Ile Val Ile Gly Ile Ile Ser
50 55 60
Val Ser Gly Asn Gly Val Val Met Tyr Leu Met Met Thr Val Lys Asn
65 70 75 80
Leu Arg Thr Pro Gly Asn Phe Leu Val Leu Asn Leu Ala Leu Ser Asp
85 90 95
Phe Gly Met Leu Phe Phe Met Met Pro Thr Met Ser Ile Asn Cys Phe
100 105 110
Ala Glu Thr Trp Val Ile Gly Pro Phe Met Cys Glu Leu Tyr Gly Met
115 120 125
Ile Gly Ser Leu Phe Gly Ser Ala Ser Ile Trp Ser Leu Val Met Ile
130 135 140
Thr Leu Asp Arg Tyr Asn Val Ile Val Lys Gly Met Ala Gly Lys Pro
145 150 155 160
Leu Thr Lys Val Gly Ala Leu Leu Arg Met Leu Phe Val Trp Ile Trp
165 170 175
Ser Leu Gly Trp Thr Ile Ala Pro Met Tyr Gly Trp Ser Arg Tyr Val
180 185 190
Pro Glu Gly Ser Met Thr Phe Cys Thr Ile Asp Tyr Ile Asp Thr Ala
195 200 205
Ile Asn Pro Met Ser Tyr Leu Ile Ala Tyr Ala Ile Phe Val Tyr Phe
210 215 220
Val Pro Leu Phe Ile Ile Ile Tyr Cys Tyr Ala Phe Ile Val Met Gln
225 230 235 240
Val Ala Ala His Glu Lys Ser Leu Arg Glu Gln Ala Lys Lys Met Asn
245 250 255
Ile Lys Ser Leu Arg Ser Asn Glu Asp Asn Lys Lys Ala Ser Ala Glu
260 265 270
Phe Arg Leu Ala Lys Val Ala Phe Met Thr Ile Cys Cys Trp Phe Met
275 280 285
Ala Trp Thr Pro Tyr Leu Thr Leu Ser Phe Leu Gly Ile Phe Ser Asp
290 295 300
Arg Thr Trp Leu Thr Pro Met Thr Ser Val Trp Gly Ala Ile Phe Ala
305 310 315 320
Lys Ala Ser Ala Cys Tyr Asn Pro Ile Val Tyr Gly Ile Ser His Pro
325 330 335
Lys Tyr Arg Ala Ala Leu His Asp Lys Phe Pro Cys Ile Ala Phe Gln
340 345 350
Glu Leu Leu Cys Leu Arg Arg Ser Ser Leu Lys Ala Tyr Gly Asn Gly
355 360 365
Tyr Ser Ser Asn Gly Asn Thr Gly Glu Gln Ser Gly Tyr His Val Glu
370 375 380
Gln Glu Lys Glu Asn Lys Leu Leu Cys Glu Asp Leu Pro Gly Thr Glu
385 390 395 400
Asp Phe Val Gly His Gln Gly Thr Val Pro Ser Asp Asn Ile Asp Ser
405 410 415
Gln Gly Arg Asn Cys Ser Thr Asn Asp Ser Leu Leu Lys Ser Arg Ile
420 425 430
Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile Asp Ile Asn Val
435 440 445
Thr Glu Thr Ser Gln Val Ala Pro Ala
450 455
<210> 45
<211> 56
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino Acid Sequence at Splicing Site palm Mela hOPN4 trunc CT
mGlur6 CT
<400> 45
Asn Pro Ile Ile Tyr Ala Ile Thr His Pro Lys Tyr Arg Val Ala Ile
1 5 10 15
Ala Gln His Leu Pro Cys Leu Phe His Pro Glu Gln Asn Val Gln Lys
20 25 30
Arg Lys Arg Ser Leu Lys Lys Thr Ser Thr Met Ala Ala Pro Pro Lys
35 40 45
Ser Glu Asn Ser Glu Asp Ala Lys
50 55
<210> 46
<211> 79
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino Acid Sequence at Splicing Site palm+33 Mela hOPN4 trunc CT
mGlur6 CT
<400> 46
His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu Gly
1 5 10 15
Val Leu Leu Gly Val Ser Gly Gln Arg Ser His Pro Ser Leu Ser Tyr
20 25 30
Arg Ser Thr His Arg Ser Thr Leu Ser Ser Gln Ser Ser Asp Leu His
35 40 45
Pro Glu Gln Asn Val Gln Lys Arg Lys Arg Ser Leu Lys Lys Thr Ser
50 55 60
Thr Met Ala Ala Pro Pro Lys Ser Glu Asn Ser Glu Asp Ala Lys
65 70 75
<210> 47
<211> 40
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino Acid Sequence at Splicing Site Jct a Jct b Mela hOPN4 TM1
TM2 mGlur6 IL1
<400> 47
Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Thr Phe Met Arg His Asn
1 5 10 15
Asp Thr Pro Ile Val Arg Ala Ser Gly Arg Glu Leu Phe Ile Ile Asn
20 25 30
Leu Ala Val Ser Asp Phe Leu Met
35 40
<210> 48
<211> 47
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino Acid Sequence at Splicing Site variable region Mela hOPN4
proxim IL3 region distal IL3 region mGlur6 IL3
<400> 48
Ile Phe Ile Phe Arg Ala Ile Arg Glu Thr Gly Arg Gly Val Pro Glu
1 5 10 15
Thr Phe Asn Glu Ala Pro Leu Arg Gln Arg Arg Gln Trp Gln Arg Leu
20 25 30
Gln Ser Glu Trp Lys Met Ala Lys Val Ala Leu Ile Val Ile Leu
35 40 45
<210> 49
<211> 66
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino Acid Sequence at Splicing Site palm Jellyopsin Cubop trunc
CT m5HT7 CT
<400> 49
Phe Asn Pro Ile Ile Tyr Cys Phe Leu His Lys Gln Phe Arg Arg Ala
1 5 10 15
Val Leu Arg Gly Val Cys Gln Tyr Arg Asn Ile Asn Arg Lys Leu Ser
20 25 30
Ala Ala Gly Met His Glu Ala Leu Lys Leu Ala Glu Arg Pro Glu Arg
35 40 45
Ser Glu Phe Val Leu Gln Asn Cys Asp His Cys Gly Lys Lys Gly His
50 55 60
Asp Thr
65
<210> 50
<211> 56
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino Acid Sequence at Splicing Site palm JellyOP cubop trunc CT
mGlur6 CT
<400> 50
Phe Asn Pro Ile Ile Tyr Cys Phe Leu His Lys Gln Phe Arg Arg Ala
1 5 10 15
Val Leu Arg Gly Val Cys Leu Phe His Pro Glu Gln Asn Val Gln Lys
20 25 30
Arg Lys Arg Ser Leu Lys Lys Thr Ser Thr Met Ala Ala Pro Pro Lys
35 40 45
Ser Glu Asn Ser Glu Asp Ala Lys
50 55
<210> 51
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino Acid Sequence at Splicing Site palm Cone opsin hOPN1MW
trunc CT mGlur6 CT
<400> 51
Tyr Asn Pro Ile Ile Tyr Val Phe Met Asn Arg Gln Phe Arg Asn Cys
1 5 10 15
Ile Leu His Leu Phe His Pro Glu Gln Asn Val Gln Lys Arg Lys Arg
20 25 30
Ser Leu Lys Lys Thr Ser Thr Met Ala Ala Pro Pro Lys Ser Glu Asn
35 40 45
Ser Glu Asp Ala Lys
50
<210> 52
<211> 49
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino Acid Sequence at Splicing Site palm Mela hOPN4 trunc CT
Cone opsin OPN1MW CT
<400> 52
Asn Pro Ile Ile Tyr Ala Ile Thr His Pro Lys Tyr Arg Val Ala Ile
1 5 10 15
Ala Gln His Leu Pro Cys Gly Lys Lys Val Asp Asp Ser Ser Glu Leu
20 25 30
Ser Ser Thr Ser Lys Thr Glu Val Ser Ser Val Ser Ser Val Ser Pro
35 40 45
Ala
<210> 53
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> 1D4 tag
<400> 53
Glu Thr Ser Gln Val Ala Pro Ala
1 5
<210> 54
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino Acid Sequence at Splicing Site Jct a Jct b Mela hOPN4 TM1
TM2 Cone opsin OPN1MW IL1
<400> 54
Thr Gly Met Leu Gly Asn Leu Thr Val Ile Tyr Ala Thr Met Lys Phe
1 5 10 15
Lys Lys Leu Arg His Pro Ala Asn Met Phe Ile Ile Asn Leu Ala Val
20 25 30
Ser Asp Phe Leu
35
<210> 55
<211> 44
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino Acid Sequence at Splicing Site Jct c Jct d Mela hOPN4 TM3
TM4 Cone opsin OPN1MW IL2
<400> 55
Thr Ala Ile Ala Leu Asp Arg Tyr Leu Val Ile Cys Lys Pro Phe Gly
1 5 10 15
Asn Val Arg Phe Asp Ala Lys Leu Thr Ala Leu Val Leu Leu Gly Val
20 25 30
Trp Leu Tyr Ala Leu Ala Trp Ser Leu Pro Pro Phe
35 40
<210> 56
<211> 47
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino Acid Sequence at Splicing Site Jct e Jct f Mela hOPN4 TM5
TM6 Cone opsin OPN1MW IL3
<400> 56
Leu Ile Ile Ile Phe Cys Tyr Ile Gln Val Trp Leu Ala Ile Arg Ala
1 5 10 15
Val Ala Lys Gln Gln Lys Glu Ser Glu Ser Thr Gln Lys Ala Glu Lys
20 25 30
Glu Val Thr Lys Val Ala Leu Ile Val Ile Leu Leu Phe Val Leu
35 40 45
<210> 57
<211> 125
<212> PRT
<213> Artificial Sequence
<220>
<223> Sequence section human melanopsin gene (OPN4) C-terminal
melanopsin fragment
<400> 57
His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu Gly
1 5 10 15
Val Leu Leu Gly Val Ser Arg Arg His Ser Arg Pro Tyr Pro Ser Tyr
20 25 30
Arg Ser Thr His Arg Ser Thr Leu Thr Ser His Thr Ser Asn Leu Ser
35 40 45
Trp Ile Ser Ile Arg Arg Arg Gln Glu Ser Leu Gly Ser Glu Ser Glu
50 55 60
Val Gly Trp Thr His Met Glu Ala Ala Ala Val Trp Gly Ala Ala Gln
65 70 75 80
Gln Ala Asn Gly Arg Ser Leu Tyr Gly Gln Gly Leu Glu Asp Leu Glu
85 90 95
Ala Lys Ala Pro Pro Arg Pro Gln Gly His Glu Ala Glu Thr Pro Gly
100 105 110
Lys Thr Lys Gly Leu Ile Pro Ser Gln Asp Pro Arg Met
115 120 125
<210> 58
<211> 116
<212> PRT
<213> Artificial Sequence
<220>
<223> Sequence section murine melanopsin gene (OPN4) C-terminal
melanopsin fragment
<400> 58
His Pro Lys Tyr Arg Val Ala Ile Ala Gln His Leu Pro Cys Leu Gly
1 5 10 15
Val Leu Leu Gly Val Ser Gly Gln Arg Ser His Pro Ser Leu Ser Tyr
20 25 30
Arg Ser Thr His Arg Ser Thr Leu Ser Ser Gln Ser Ser Asp Leu Ser
35 40 45
Trp Ile Ser Gly Arg Lys Arg Gln Glu Ser Leu Gly Ser Glu Ser Glu
50 55 60
Val Gly Trp Thr Asp Thr Glu Thr Thr Ala Ala Trp Gly Ala Ala Gln
65 70 75 80
Gln Ala Ser Gly Gln Ser Phe Cys Ser Gln Asn Leu Glu Asp Gly Glu
85 90 95
Leu Lys Ala Ser Ser Ser Pro Gln Thr Lys Gly His Leu Pro Ser Leu
100 105 110
Asp Leu Gly Met
115
<210> 59
<211> 735
<212> PRT
<213> Artificial Sequence
<220>
<223> wild type capsid AAV2 sequence
<400> 59
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Phe Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 60
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide insert SASEAST
<400> 60
Ser Ala Ser Glu Ala Ser Thr
1 5
<210> 61
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide insert TPPSITA
<400> 61
Thr Pro Pro Ser Ile Thr Ala
1 5
<210> 62
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide insert PRTPHTA
<400> 62
Pro Arg Thr Pro His Thr Ala
1 5
<210> 63
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide insert NHAPNHC
<400> 63
Asn His Ala Pro Asn His Cys
1 5
<210> 64
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide insert AAASASEASTAA
<400> 64
Ala Ala Ala Ser Ala Ser Glu Ala Ser Thr Ala Ala
1 5 10
<210> 65
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide insert AAATPPSITAAA
<400> 65
Ala Ala Ala Thr Pro Pro Ser Ile Thr Ala Ala Ala
1 5 10
<210> 66
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide insert AAAPRTPHTAAA
<400> 66
Ala Ala Ala Pro Arg Thr Pro His Thr Ala Ala Ala
1 5 10
<210> 67
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide insert NLANHAPNHCAR
<400> 67
Asn Leu Ala Asn His Ala Pro Asn His Cys Ala Arg
1 5 10
<210> 68
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide insert NLAPRTPHTAAR
<400> 68
Asn Leu Ala Pro Arg Thr Pro His Thr Ala Ala Arg
1 5 10
<210> 69
<211> 37
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide insert SASEAST with linker
<400> 69
Val Ser Thr Asn Leu Gln Arg Gly Asn Ala Ala Ala Ser Ala Ser Glu
1 5 10 15
Ala Ser Thr Ala Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
20 25 30
Gly Val Leu Pro Gly
35
<210> 70
<211> 37
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide insert TPPSITA with linker
<400> 70
Val Ser Thr Asn Leu Gln Arg Gly Asn Ala Ala Ala Thr Pro Pro Ser
1 5 10 15
Ile Thr Ala Ala Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
20 25 30
Gly Val Leu Pro Gly
35
<210> 71
<211> 37
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide insert PRTPHTA with linker
<400> 71
Val Ser Thr Asn Leu Gln Arg Gly Asn Ala Ala Ala Pro Arg Thr Pro
1 5 10 15
His Thr Ala Ala Ala Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
20 25 30
Gly Val Leu Pro Gly
35
<210> 72
<211> 37
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide insert NHAPNHC with linker
<400> 72
Val Ser Thr Asn Leu Gln Arg Gly Asn Asn Leu Ala Asn His Ala Pro
1 5 10 15
Asn His Cys Ala Arg Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
20 25 30
Gly Val Leu Pro Gly
35
<210> 73
<211> 37
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide insert PRTPHTA-AR with linker
<400> 73
Val Ser Thr Asn Leu Gln Arg Gly Asn Asn Leu Ala Pro Arg Thr Pro
1 5 10 15
His Thr Ala Ala Arg Arg Gln Ala Ala Thr Ala Asp Val Asn Thr Gln
20 25 30
Gly Val Leu Pro Gly
35
<210> 74
<211> 747
<212> PRT
<213> Artificial Sequence
<220>
<223> AAV capsid with NLAPRTPHTAAR insertion
<400> 74
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Phe Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Phe
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Phe Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Phe Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Asn Leu Ala Pro Arg
580 585 590
Thr Pro His Thr Ala Ala Arg Arg Gln Ala Ala Thr Ala Asp Val Asn
595 600 605
Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr
610 615 620
Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe
625 630 635 640
His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro
645 650 655
Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn Pro Ser Thr Thr
660 665 670
Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly
675 680 685
Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys
690 695 700
Arg Trp Asn Pro Glu Ile Gln Phe Thr Ser Asn Tyr Asn Lys Ser Val
705 710 715 720
Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr Ser Glu Pro Arg
725 730 735
Pro Ile Gly Thr Arg Phe Leu Thr Arg Asn Leu
740 745
<210> 75
<211> 1354
<212> DNA
<213> Artificial Sequence
<220>
<223> ON-Bipolar cell specific promoter 770En_566P(hGRM6)
<400> 75
gggtctccaa cttgccaact gtagatcttg gaacctttca tccttcataa ctgcataagc 60
caattccttc taataaatct gtataatata tctgtctata taataaatat gtacttacat 120
aactctgtat gttacatcta tctattctat ctatctatct atctatctat ctatctatct 180
atctatcatc tatctatcta tttatctatt ctctgtgtct ttggagaacc ctgacatagt 240
aagcaatcat atcacctgca aatgatgaaa gctgtgtatt ttccaaatca gtcgttttat 300
gtcttttttt cttgcactga ctagtgcccc ctagagggaa tgataattgg aattattgtc 360
ttgctctgat tttaaaggaa gtagatactt caaataattc atcatggagt gcaatatttt 420
ctgtaggctt ttagtagata acttcatcag tttaaagaag atccttagat tatgaaacat 480
ttacaattat gaatgaatat tagatgttat caaatgcttt ttctgcatcc atttagataa 540
tcatgttttt cctttaatct gttaatgcgg tgaattacat taatagattt cctaagtcat 600
taatctgcta aagtgcattt ctgggacaaa ccagacttgg ttatgacatt gtatgtattt 660
cagtttgcaa atattggact aggatttttg tatctatatt ccttagtttg acctgtaaat 720
tttatttctt gtactaagta ttagcctcac gaaaggcatt gtcaaatgtt caattgatat 780
aatgctagcc aagaagagga cagaggcaga aagccaggga cagagactga gaaacagaga 840
cctagaggca gaagaagact gagatagaga tggacagaga ttgtgtcaga cacagcccca 900
gagacagcca gacagtctga gtcagacgca aaccaaagac aagaaaacag gaaaacagac 960
ccagagattg ggagagggag gggaaggaga tgcggggaga gccagcaccg ccacccccca 1020
cactcaggag gggtctccac cctcggagcg gtctctcatc cctccctaga atccttaaat 1080
cctctctcgc tcagggcctc ggccgcatct gtcacagact tgtcctgaac cgacagcggc 1140
tggcgcaggt gactggcttg gggcgggagc ctgggtgtgc gctggggatg gaccccgagg 1200
aagaggggcc aagctgtcgg gaagcggcag ggctggaggg gtggaggcag tggtcgggcg 1260
ggaccccggg cgacagggtt cggcgcttgt aagagcgaga cggaggcccg ggcaggccgg 1320
ctgagctaac tccccagagc cgaagtggaa ggcg 1354
<210> 76
<211> 917
<212> DNA
<213> Artificial Sequence
<220>
<223> ON-Bipolar cell specific promoter 444En_454P(hGRM6)
<400> 76
atctattctc tgtgtctttg gagaaccctg acatagtaag caatcatatc acctgcaaat 60
gatgaaagct gtgtattttc caaatcagtc gttttatgtc tttttttctt gcactgacta 120
gtgcccccta gagggaatga taattggaat tattgtcttg ctctgatttt aaaggaagta 180
gatacttcaa ataattcatc atggagtgca atattttctg taggctttta gtagataact 240
tcatcagttt aaagaagatc cttagattat gaaacattta caattatgaa tgaatattag 300
atgttatcaa atgctttttc tgcatccatt tagataatca tgtttttcct ttaatctgtt 360
aatgcggtga attacattaa tagatttcct aagtcattaa tctgctaaag tgcatttctg 420
ggacaaacca gacttggtta tgaccaattg atataatgct agcggagggg tctccaccct 480
cggagcggtc tctcatccct ccctagaatc cttaaatcct ctctcgctca gggcctcggc 540
cgcatctgtc acagacttgt cctgaaccga cagcggctgg cgcaggtgac tggcttgggg 600
cgggagcctg ggtgtgcgct ggggatggac cccgaggaag aggggccaag ctgtcgggaa 660
gcggcagggc tggaggggtg gaggcagtgg tcgggcggga ccccgggcga cagggttcgg 720
cgcttgtaag agcgagacgg aggcccgggc aggccggctg agctaactcc ccagagccga 780
agtggaaggc gcgccccgag cgccttctcc ccaggacccc ggtgtccctc cccgcgcccc 840
gagcccgcgc tctccttccc ccgccctcag agcgctcccc gcccctctgt ctccccgcag 900
cccgctagac gagccga 917
<210> 77
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> KOZAK consensus sequence 1
<400> 77
gccgccacca ugg 13
<210> 78
<211> 13
<212> RNA
<213> Artificial Sequence
<220>
<223> KOZAK consensus sequence 2
<400> 78
gccgccgcca ugg 13
<210> 79
<211> 6020
<212> DNA
<213> Artificial Sequence
<220>
<223> rAAV vector OPN4-mGluR6-TS-1D4
<400> 79
ccttaattag gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatctacgt 180
agccatgctc taggaagatc ggaattcgcc cttaagtcta gagggtctcc aacttgccaa 240
ctgtagatct tggaaccttt catccttcat aactgcataa gccaattcct tctaataaat 300
ctgtataata tatctgtcta tataataaat atgtacttac ataactctgt atgttacatc 360
tatctattct atctatctat ctatctatct atctatctat ctatctatca tctatctatc 420
tatttatcta ttctctgtgt ctttggagaa ccctgacata gtaagcaatc atatcacctg 480
caaatgatga aagctgtgta ttttccaaat cagtcgtttt atgtcttttt ttcttgcact 540
gactagtgcc ccctagaggg aatgataatt ggaattattg tcttgctctg attttaaagg 600
aagtagatac ttcaaataat tcatcatgga gtgcaatatt ttctgtaggc ttttagtaga 660
taacttcatc agtttaaaga agatccttag attatgaaac atttacaatt atgaatgaat 720
attagatgtt atcaaatgct ttttctgcat ccatttagat aatcatgttt ttcctttaat 780
ctgttaatgc ggtgaattac attaatagat ttcctaagtc attaatctgc taaagtgcat 840
ttctgggaca aaccagactt ggttatgaca ttgtatgtat ttcagtttgc aaatattgga 900
ctaggatttt tgtatctata ttccttagtt tgacctgtaa attttatttc ttgtactaag 960
tattagcctc acgaaaggca ttgtcaaatg ttcaattgat ataatgctag cggaggggtc 1020
tccaccctcg gagcggtctc tcatccctcc ctagaatcct taaatcctct ctcgctcagg 1080
gcctcggccg catctgtcac agacttgtcc tgaaccgaca gcggctggcg caggtgactg 1140
gcttggggcg ggagcctggg tgtgcgctgg ggatggaccc cgaggaagag gggccaagct 1200
gtcgggaagc ggcagggctg gaggggtgga ggcagtggtc gggcgggacc ccgggcgaca 1260
gggttcggcg cttgtaagag cgagacggag gcccgggcag gccggctgag ctaactcccc 1320
agagccgaag tggaaggcgc gccccgagcg ccttctcccc aggaccccgg tgtccctccc 1380
cgcgccccga gcccgcgctc tccttccccc gccctcagag cgctccccgc ccctctgtct 1440
ccccgcagcc cgctagacga gccgagcggc cgcgccacca tgaaccctcc ttcggggcca 1500
agagtcccgc ccagcccaac ccaagagccc agctgcatgg ccaccccagc accacccagc 1560
tggtgggaca gctcccagag cagcatctcc agcctgggcc ggcttccatc catcagtccc 1620
acagcacctg ggacttgggc tgctgcctgg gtccccctcc ccacggttga tgttccagac 1680
catgcccact ataccctggg cacagtgatc ttgctggtgg gactcacggg gatgctgggc 1740
aacctgacgg tcatctatac cttctgcagg agcagaagcc tccggacacc tgccaacatg 1800
ttcattatca acctcgcggt cagcgacttc ctcatgtcct tcacccaggc ccctgtcttc 1860
ttcaccagta gcctctataa gcagtggctc tttggggaga caggctgcga gttctatgcc 1920
ttctgtggag ctctctttgg catttcctcc atgatcaccc tgacggccat cgccctggac 1980
cgctacctgg taatcacacg cccgctggcc acctttggtg tggcgtccaa gaggcgtgcg 2040
gcatttgtcc tgctgggcgt ttggctctat gccctggcct ggagtctgcc acccttcttc 2100
ggctggagcg cctacgtgcc cgaggggttg ctgacatcct gctcctggga ctacatgagc 2160
ttcacgccgg ccgtgcgtgc ctacaccatg cttctctgct gcttcgtgtt cttcctccct 2220
ctgcttatca tcatctactg ctacatcttc atcttcaggg ccatccggga gacaggacgg 2280
gctctccaga ccttcggggc ctgcaagggc aatggcgagt ccctgtggca gcggcagcgg 2340
ctgcagagcg agtgcaagat ggccaagatc atgctgctgg tcatcctcct cttcgtgctc 2400
tcctgggctc cctattccgc tgtggccctg gtggcctttg ctgggtacgc acacgtcctg 2460
acaccctaca tgagctcggt gccagccgtc atcgccaagg cctctgcaat ccacaacccc 2520
atcatttacg ccatcaccca ccccaagtac agggtggcca ttgcccagca cctgccctgc 2580
ctgttccatc cagagcagaa tgtgcagaag cgaaagcgga gcctcaaggc cacctccacg 2640
gtggcagccc cacccaaggg cgaggatgca gaggcccaca agaagagcag gatcaccagc 2700
gagggcgagt acatccccct ggaccagatc gacatcaacg tgacagagac cagccaagtg 2760
gcgcctgcct aaggatctgc ctcgactgtg ccttctagtt gccagccatc tgttgtttgc 2820
ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa 2880
aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg 2940
gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggactcgagt 3000
taagggcgaa ttcccgataa ggatcttcct agagcatggc tacgtagata agtagcatgg 3060
cgggttaatc attaactaca aggaacccct agtgatggag ttggccactc cctctctgcg 3120
cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg 3180
ggcggcctca gtgagcgagc gagcgcgcag ccttaattaa cctaattcac tggccgtcgt 3240
tttacaacgt cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc ttgcagcaca 3300
tccccctttc gccagctggc gtaatagcga agaggcccgc accgatcgcc cttcccaaca 3360
gttgcgcagc ctgaatggcg aatgggacgc gccctgtagc ggcgcattaa gcgcggcggg 3420
tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt 3480
cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg 3540
ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga 3600
ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac 3660
gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc 3720
tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct attggttaaa 3780
aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa cgcttacaat 3840
ttaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt tttctaaata 3900
cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca ataatattga 3960
aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca 4020
ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat 4080
cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa gatccttgag 4140
agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct gctatgtggc 4200
gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat acactattct 4260
cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga tggcatgaca 4320
gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt 4380
ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat gggggatcat 4440
gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt 4500
gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta 4560
cttactctag cttcccggca acaattaata gactggatgg aggcggataa agttgcagga 4620
ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt 4680
gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc 4740
gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct 4800
gagataggtg cctcactgat taagcattgg taactgtcag accaagttta ctcatatata 4860
ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt 4920
gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc 4980
gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg 5040
caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact 5100
ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt tcttctagtg 5160
tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg 5220
ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac 5280
tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca 5340
cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga 5400
gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc 5460
ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct 5520
gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg 5580
agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct 5640
tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc 5700
tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc 5760
gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat 5820
taatgcagct ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg caacgcaatt 5880
aatgtgagtt agctcactca ttaggcaccc caggctttac actttatgct tccggctcgt 5940
atgttgtgtg gaattgtgag cggataacaa tttcacacag gaaacagcta tgaccatgat 6000
tacgccagat ttaattaagg 6020
<210> 80
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> E(D)RY motif
<220>
<221> UNSURE
<222> 2
<400> 80
Glu Xaa Arg Tyr
1
<210> 81
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> NPxxY motif
<220>
<221> UNSURE
<222> 3
<220>
<221> UNSURE
<222> 4
<400> 81
Asn Pro Xaa Xaa Tyr
1 5
<210> 82
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> NR(K)Q motif
<220>
<221> UNSURE
<222> 3
<400> 82
Asn Arg Xaa Gln
1
<210> 83
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> DRIY variant of E(D)RY motif
<400> 83
Asp Arg Ile Tyr
1
<210> 84
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> NRIY variant of E(D)RY motif
<400> 84
Asn Arg Ile Tyr
1
<210> 85
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> Golgi export signal from the potassium channel Kir2.1
<400> 85
Lys Ser Arg Ile Thr Ser Glu Gly Glu Tyr Ile Pro Leu Asp Gln Ile
1 5 10 15
Asp Ile Asn Val
20
<210> 86
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> ER export signal from Kir2.1
<400> 86
Phe Cys Tyr Glu Asn Glu Val
1 5
Claims (85)
- 세포외 및 세포내 루프(EL 및 IL)에 의해 연결된 7개의 막관통 도메인(TM1 내지 TM7)을 포함하는 키메라 옵신 GPCR 단백질로서,
상기 키메라 옵신 GPCR 단백질은 상류 옵신의 감광성 옵신 부분을 포함하고,
상기 상류 옵신 부분은 발색단에 공유 결합하는 발색단 포켓을 포함하고,
상기 키메라 옵신 GPCR 단백질은 제2 GPCR 단백질(표적 GPCR 단백질)의 제2 GPCR 부분(표적 GPCR 부분)을 포함하고,
상기 표적 GPCR 부분은 C 말단 도메인(표적-GPCR-CT)을 포함하고;
여기서,
상기 상류 옵신 부분은 상류 옵신 CT의 근위 영역(O-CT-근위 영역)의 원위 말단 또는 그 하류에 위치하는 절단 부위를 갖는 절단된 C 말단 도메인(절단된 옵신 CT)을 추가로 포함하고,
상기 O-CT-근위 영역은 NR(K)Q 모티프 및 원위 방향으로 그 다음의 7~13개의 아미노산을 포함하며,
상기 키메라 옵신 GPCR 단백질은 키메라 C 말단 도메인(키메라 CT)을 포함하고;
상기 표적-GPCR-CT는 상기 절단된 옵신 CT의 하류에 위치하는 것;을 특징으로 하는 키메라 옵신 GPCR 단백질. - 제1항에 있어서, O-CT 근위 영역의 원위 말단은 다음을 포함하는 군으로부터 선택되는 위치에 위치하는 것인 키메라 옵신 GPCR:
- 나선 8(H8)의 원위 말단
- 팔미토일화 부위 또는
- 소 로돕신의 팔미토일화 부위에 상응하는 위치. - 제1항 또는 제2항에 있어서,
O-CT-근위 영역에 대한 원위 연장부의 원위 말단에 있는 상류 옵신 CT의 절단 부위를 포함하고,
O-CT-근위 영역의 원위 연장부는 O-CT-근위 영역의 원위 말단의 하류 또는 특히 팔미토일화 부위의 하류에서 최대 5개 또는 최대 10개 또는 최대 16개 또는 최대 22개 또는 최대 28, 29, 30, 31, 32, 33, 34 또는 35개 아미노산을 포함하는 것인 키메라 옵신 GPCR. - 제3항에 있어서, 상류 옵신은 멜라놉신의 군으로부터 선택되는 것인 키메라 옵신 GPCR.
- 제3항에 있어서, 상류 옵신은 적어도 50, 65, 80, 100, 150 또는 200개 아미노산 길이의 CT를 포함하는 옵신의 군으로부터 선택되는 것인 키메라 옵신 GPCR.
- 제1항 내지 제5항 중 한 항에 있어서,
상류 옵신 부분은 절단 부위까지 전체 상류 옵신을 포함하거나, 또는
상류 옵신 부분은 E(DRY) 모티프에서 절단 부위까지 상류 옵신의 연속 영역을 포함하거나, 또는
상류 옵신 부분은 TM3, TM4, TM5, TM6 및 TM7 및 선택적으로 절단된 옵신 CT를 절단 부위까지 포함하는 것인 키메라 옵신 GPCR. - 제1항 내지 제6항 중 어느 한 항에 있어서,
상류 옵신 부분은 막관통 도메인 TM3 및 TM7을 포함하고, 특히 막관통 도메인 TM3 내지 TM7, TM2 내지 TM7 또는 TM1 내지 TM7을 포함하는 것인 키메라 옵신 GPCR. - 제1항 내지 제7항 중 한 항에 있어서, 상류 옵신 부분은 EL1, EL2, EL3 및 NT로부터 선택된 세포외 도메인 중 하나 이상을 포함하는 것인 키메라 옵신 GPCR.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 상류 옵신 부분은 2개 이상의 모 옵신, 특히 2개의 모 옵신으로부터 유래되는 것인 키메라 옵신 GPCR.
- 제1항 내지 제9항 중 한 항에 있어서,
상류 옵신 부분은 비인간 옵신인 모 옵신으로부터 유래된 막관통 도메인을 포함하고
상류 옵신 부분은 인간 옵신인 모 옵신으로부터 유래된 1개 또는 2개 또는 3개, 또는 모든 세포외 도메인을 추가로 포함하는 것인 키메라 옵신 GPCR. - 제1항 내지 제10항 중 어느 한 항에 있어서, TM7 및 절단된 옵신 CT는 동일한 모 옵신으로부터 유래되는 것인 키메라 옵신 GPCR.
- 제1항 내지 제11항 중 한 항에 있어서, 상류 옵신 부분은 모든 세포외 도메인, 모든 막관통 도메인 및 모든 세포내 루프를 포함하는 것인 키메라 옵신 GPCR.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상류 옵신 부분은 상류 옵신 CT의 절단 부위까지 전체 모 상류 옵신을 포함하는 것인 키메라 옵신 GPCR.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 상류 옵신 부분은 단일안정성 또는 이안정성 옵신 또는 삼안정성 옵신, 특히 이안정성 옵신으로부터 유래되는 것인 키메라 옵신 GPCR.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 상류 옵신 부분은 다음을 포함하는 옵신의 군으로부터 선택된 모 옵신으로부터 유래되는 것인 키메라 옵신 GPCR:
- 멜라놉신(OPN4)
- 로돕신(RHO)
- 원추형 옵신(OPN1SW, OPN1LW 및 OPN1MW)
- 해파리 옵신(cubop, JellyOP)
- 깡충거미(jumping spider) 로돕신(JSR1)
- 파라피놉신(PPO)
- 뉴롭신(OPN5)
- 엔세팔롭신(OPN3) - 제1항 내지 제15항 중 한 항에 있어서, 모 표적 GPCR의 CT의 기능적 변이체인 표적 CT를 포함하고, 특히 하나 이상의 아미노산의 결실, 특히 NPxxY 모티프와 팔미토일화 부위까지 또는 팔미토일화 부위에 근위쪽으로 인접한 아미노산 위치까지의 임의의 아미노산 위치 사이의 N 말단 결실을 포함하는 키메라 옵신 GPCR.
- 제1항에 있어서,
표적 GPCR 부분은 비옵신 GPCR로부터 유래되거나 또는 표적 옵신이라는 제2 옵신으로부터 유래되는 것인 키메라 옵신 GPCR. - 제1항 내지 제17항 중 어느 한 항에 있어서, 표적 CT 부분은 다음을 포함하는 GPCR 단백질의 군으로부터 선택된 모 표적 GPCR로부터 유래되는 것인 키메라 옵신 GPCR:
특히 다음을 포함하는 군으로부터 선택된 클래스 A GPCR:
- 원추형 옵신, 특히 OPN1SW, OPN1MW 또는 OPN1LW,
- 세로토닌 수용체, 특히 5-HT7,
- 뮤 오피오이드 수용체,
- β-아드레날린 수용체, 특히 베타1-아드레날린 수용체, 베타2-아드레날린 수용체 및 베타3-아드레날린 수용체;
특히 다음을 포함하는 군으로부터 선택된 클래스 B GPCR:
- 호르몬 수용체, 특히 글루카곤 수용체(GCGR)
특히 다음을 포함하는 군으로부터 선택된 클래스 C GPCR:
- GABAB 수용체, 특히 GABAB1 및 GABAB2
- 대사성 글루타메이트 수용체, 특히 mGluR6 및 mGluR5 수용체 - 제1항 내지 제18항 중 한 항에 있어서, 표적 GPCR은 클래스 A GPCR 또는 클래스 B GPCR, 또는 클래스 C GPCR을 제외한 또 다른 클래스 GPCR의 GPCR이고, 선택적으로 표적 GPCR 부분은 IL1, IL2 및 IL3으로부터 선택된 하나 이상의 세포내 루프를 포함하는 것인 키메라 옵신 GPCR 단백질.
- 제1항 내지 제19항 중 한 항에 있어서, 표적 GPCR 단백질은 클래스 C GPCR, 특히 mGluR6이고, 클래스 C 표적 GPCR 부분은 IL1, IL2 및 IL3으로부터 선택된 하나 이상의 세포내 루프를 포함하되, 다음의 기준 중 하나가 충족되는 것인 키메라 옵신 GPCR:
A: 키메라 GPCR에서 상류 옵신 부분에 포함된 자연 크기의 IL3 및 고유 위치에 상응하는 위치에서 클래스 C GPCR의 자연 크기의 IL2의 병존은 배제된다;
B: 상류 옵신 부분은 세포내 루프 IL1 내지 IL3 모두를 포함한다;
C: 상류 옵신 부분은 IL1을 포함하고 표적 GPCR 부분은 상응하는 위치에서 상류 옵신 IL2 및 IL3을 대체하는 IL2 및 IL3을 포함한다. - 제1항 내지 제20항 중 어느 한 항에 있어서, 키메라 옵신 GPCR의 CT는 다음의 요소의 군으로부터 선택된 하나 이상의 서열 요소를 추가로 포함하고:
- 골지 방출 신호
- 막 트래피킹 서열
- 형광 단백질을 암호화하는 서열 요소,
하나 이상의 선택된 요소는 키메라 옵신 GPCR CT의 C 말단 끝에 임의의 순서로 독립적으로 배열되는 것인 키메라 옵신 GPCR. - 제1항 내지 제21항 중 어느 한 항에 있어서, 키메라 옵신 GPCR의 CT는 선택된 방출 신호로서 특히 소포체 방출 신호, 더욱 특별하게는 서열번호 86에 따른 아미노산 서열을 포함하거나 이로 구성된 Kir2.1로부터의 소포체 방출 신호, 또는 특히 골지 방출 신호, 더욱 특별하게는 서열번호 85에 따른 아미노산 서열을 포함하거나 이로 구성된 칼륨 채널 Kir2.1로부터의 골지 방출 신호를 포함하는 것인 키메라 옵신 GPCR.
- 제1항 내지 제22항 중 어느 한 항에 있어서,
키메라 옵신 GPCR의 CT는 특히 옵신으로부터의, 더욱 특별하게는 로돕신으로부터의, 가장 특별하게는 서열번호 87에 따른 아미노산 서열을 포함하거나 이로 구성된, 막 트래피킹 서열을 선택된 서열 요소로서 포함하는 것인 키메라 옵신 GPCR. - 제1항 내지 제23항 중 어느 한 항에 있어서,
키메라 옵신 GPCR의 CT는 형광 단백질, 특히 mKate2, TurboFP635 또는 mScarlet을 암호화하는 선택된 서열 요소를 포함하고,
형광 단백질은 키메라 옵신 GPCR의 CT에 직접 융합되거나 IRES 또는 T2A 서열을 통해 연결되는 것인 키메라 옵신 GPCR. - 제1항 내지 제24항 중 어느 한 항에 있어서,
표적 GPCR 부분은 IL1을 추가로 포함하고 표적 GPCR의 IL1은 상류 옵신의 IL1을 대체하는 것인 키메라 옵신 GPCR. - 제1항 내지 제25항 중 어느 한 항에 있어서,
상류 옵신의 IL3은 표적 GPCR의 IL3으로 대체되거나;
또는 상류 옵신의 IL3은 키메라 IL3으로 대체되고, 표적 GPCR의 IL3은 옵신 IL3 내의 가변 영역을 대체하는 것인 키메라 옵신 GPCR. - 제1항 내지 제26항 중 한 항에 있어서, 특히 표적 GPCR은 mGluR이고, 표적 CT는 NR(K)Q 모티프 또는 이의 상류의 근위 말단을 포함하는 것인 키메라 옵신 GPCR.
- 제1항 내지 제27항 중 한 항에 있어서, 표적 GPCR은 mGluR6이고 mGluR6의 IL3은 옵신 IL3의 가변 영역을 부분적으로 대체하여 키메라 IL3을 형성하는 것인 키메라 옵신 GPCR.
- 제1항 내지 제28항 중 한 항에 있어서,
표적 GPCR은 mGluR6이고 상류 옵신 부분은 IL1, IL2 및 IL3으로부터 선택된 세포내 루프 중 하나 이상을 추가로 포함하되, 상류 옵신 부분에 포함된 자연 크기의 IL3 및 상류 옵신-mGluR6 키메라 단백질의 mGluR6 부분에 포함된 자연 크기의 IL2의 병존은 배제되는 것인 키메라 옵신 GPCR. - 제1항 내지 제29항 중 어느 한 항에 있어서, 상류 옵신 부분은 멜라놉신으로부터 유래되고 NT, EL1 내지 EL3, TM1 내지 TM7, IL1 및 절단된 옵신 CT를 포함하고, 표적 GPCR 부분은 mGluR6으로부터 유래되고 IL2, IL3 및 CT를 포함하거나, 또는 표적 GPCR 부분은 hOPN1mw로부터 유래되고 IL2, IL3 및 CT를 포함하는 것인 키메라 옵신 GPCR.
- 제1항에 있어서, 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10 및 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30 및 서열번호 32 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42 및 서열번호 44를 포함하는 군으로부터 선택된 아미노산 서열을 포함하는 키메라 옵신 GPCR.
- 제31항에 있어서, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 및 서열번호 28을 포함하는 군으로부터 선택된 아미노산 서열을 포함하거나 이로 구성되는 키메라 옵신 GPCR.
- 제35항에 있어서, 아미노산 서열은 다음으로부터 선택되는 하나 이상의 변이를 포함하는 상기 서열 중 임의의 하나의 변이체이고:
- 보존적 아미노산 치환,
- 1 내지 최대 3개, 5개, 8개 또는 15개 아미노산 범위의 결실,
- 1 내지 최대 3개, 5개, 8개 또는 15개 아미노산 범위의 삽입,
여기서 키메라 옵신-GPCR 단백질은 표적 GPCR에 특이적인 G알파 단백질의 광 활성화 의존적 결합을 나타내는 것인 키메라 옵신 GPCR. - 제35항 또는 제36항에 있어서, 아미노산 서열은 적어도 85%, 적어도 90%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 동일성을 갖는 이들 서열 중 임의의 하나의 변이체인 키메라 옵신 GPCR.
- 모 옵신 CT 및 모 표적 GPCR CT로부터 유래된 키메라 C 말단 도메인(키메라 CT), 특히 제1항 내지 제34항 중 어느 한 항에 따른 키메라 옵신 GPCR 단백질의 키메라 C 말단 도메인(키메라 CT)을 포함하는 펩티드로서,
상기 펩티드는 (CT의 근위 영역을 포함하고, 특히 나선 8(H8) 및 소 로돕신의 C322 또는 C323에 각각 상응하는 팔미토일화 부위를 포함하고, 선택적으로 옵신의 팔미토일화 부위의 하류에서 최대 33, 34 또는 35개 아미노산을 추가로 포함하는) 옵신의 절단된 C 말단 도메인(절단된 옵신-CT)을 포함하고,
상기 펩티드는 표적 GPCR의 C 말단 도메인(표적 GPCR CT) 또는 이의 기능적 변이체, 특히 기능적 단편을 추가로 포함하고, 표적 GPCR CT는 절단된 옵신 CT의 하류에 위치하는 것인 펩티드. - 제1항 내지 제34항 중 한 항에 따른 키메라 옵신 GPCR 단백질 또는 제35항에 따른 펩티드를 암호화하는 핵산 분자.
- 제36항에 있어서, 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10 및 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30 및 서열번호 32 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42 및 서열번호 44를 포함하는 군으로부터 선택된 아미노산 서열과 적어도 90% 또는 적어도 95% 또는 적어도 98% 동일한 아미노산 서열로 구성된 키메라 옵신 GPCR을 암호화하는 핵산 서열을 포함하는 핵산 분자.
- 제36항에 있어서, 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9 및 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29 및 서열번호 31 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43을 포함하는 군으로부터 선택된 핵산 서열과 적어도 70% 또는 80% 또는 90% 동일한 핵산 서열을 포함하는 핵산 분자.
- 제36항에 있어서, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27을 포함하는 군으로부터 선택된 핵산 서열을 포함하거나 이로 구성되는 핵산 분자.
- 제35항 내지 제39항 중 한 항에 따른 핵산 분자를 표적 세포에 전달하기 위한 의료 요법에 사용하기 위한 AAV 캡시드 폴리펩티드.
- 제40항에 있어서, 캡시드 단백질은 AAV2, AAV2(7m8) 또는 AAV8(BP2)의 캡시드 단백질인, 상기 사용을 위한 AAV 캡시드 폴리펩티드.
- 제41항에 있어서,
캡시드 폴리펩티드는 AAV2 캡시드 폴리펩티드이고 야생형 AAV2의 아미노산 587과 588 사이에 아미노산 삽입물을 포함하고,
펩티드 삽입물은
- SASEAST (서열번호 60)
- TPPSITA (서열번호 61)
- PRTPHTA (서열번호 62)
- NHAPNHC (서열번호 63)
를 포함하는 펩티드 서열의 군으로부터 선택된 서열을 포함하거나 이로 구성되는 것인, 상기 사용을 위한 AAV 캡시드 폴리펩티드. - 제41항 또는 제42항에 있어서,
AAV2 캡시드는 7 내지 13개 아미노산의 폴리펩티드를 포함하고,
특히 펩티드 삽입물은 제42항에 따른 펩티드 삽입물을 포함하고, 1 또는 2개의 플랭킹 링커를 추가로 포함하고,
링커는 양쪽에 최대 1, 2, 3, 4 또는 5개의 아미노산을 포함하되, 링커의 아미노산의 총 수는 6개 아미노산을 초과하지 않으며,
특히 링커는 양쪽에 2 또는 3개의 아미노산을 포함하고,
링커는
i. 아미노산 G 및 A 또는
ii. 아미노산 A, N, L, T, R, G, A, N, L 및 R, 특히 A, L, N, R로부터 선택되는 아미노산을 포함하거나 이로 구성되고, 더욱 특별하게는 아미노산 중 적어도 하나는 N 및 R로부터 선택되는 것인, 상기 사용을 위한 AAV 캡시드 폴리펩티드. - 제43항에 있어서, 다음으로부터 선택되는, 야생형 AAV2의 N587과 R588 사이에 펩티드 삽입물을 포함하는, 상기 사용을 위한 AAV 캡시드 폴리펩티드:
- AAASASEASTAA (서열번호 64),
- AAATPPSITAAA (서열번호 65),
- AAAPRTPHTAAA (서열번호 66),
- NLANHAPNHCAR (서열번호 67),
- NLAPRTPHTAAR (서열번호 68). - 야생형 AAV 혈청형 2(AAV2)의 587 내지 592 사이, 특히 AAV 혈청형 2의 N587 내지 R588 사이의 위치 또는 또 다른 혈청형의 AAV에서 이에 상동성인 위치에 펩티드 삽입물을 포함하는 아데노 관련 바이러스(AAV) 캡시드 폴리펩티드로서, 펩티드 삽입물은
- NLANHAPNHCAR (서열번호 67)
- NLAPRTPHTAAR (서열번호 68)
을 포함하는 서열의 군으로부터 선택되는 것인 AAV 캡시드 폴리펩티드. - 제40항 내지 제45항 중 한 항에 있어서,
캡시드는
a. 아미노산 위치 252, 272, 444, 500, 700, 704 및/또는 730에서 티로신(Y)에서 페닐알라닌(F)으로의 돌연변이; 및/또는
b. 아미노산 위치 491에서 트레오닌(T)에서 발린(V)으로의 돌연변이
로부터 선택되는 돌연변이 중 하나 이상을 포함하는 것인, 제40항 내지 제44항에 따른 사용을 위한 AAV 캡시드 폴리펩티드 또는 제45항에 따른 AAV 캡시드. - 제42항에 따른 사용을 위한 AAV 캡시드 폴리펩티드 또는 제45항에 따른 또는 제45항 및 제46항에 따른 AAV 캡시드로서,
특히 서열번호 74에 따른 아미노산 서열을 포함하거나 이로 구성된, AAV 캡시드 폴리펩티드 또는 AAV 캡시드. - 제40항 내지 제47항 중 한 항에 따른 AAV 캡시드를 암호화하는 핵산 분자.
- 제48항에 있어서, AAV2, AAV2(7m8) 또는 AAV8(BP2) 또는 AAV2(NHAPNHC) 또는 AAV2(PRTPHTA)로부터 선택된 캡시드 폴리펩티드를 암호화하는 핵산 서열을 포함하거나 이로 구성되는 핵산 분자.
- 제48항 또는 제49항에 있어서, 다음으로부터 선택되는, AAV2 게놈의 N587 내지 R588 사이의 펩티드 삽입물이 있는 아미노산 서열을 포함하는 캡시드 폴리펩티드를 암호화하는 핵산 서열을 포함하거나 이로 구성되는 핵산 분자:
- AAASASEASTAA (서열번호 64),
- AAATPPSITAAA (서열번호 65),
- AAAPRTPHTAAA (서열번호 66),
- NLANHAPNHCAR (서열번호 67),
- NLAPRTPHTAAR (서열번호 68). - 제48항 내지 제50항 중 한 항에 있어서, 핵산 분자는 이식유전자를 포함하고,
특히, 이식유전자는 키메라 옵신 GPCR을 암호화하고, 특히 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9 및 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29 및 서열번호 31 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43을 포함하는 군으로부터 선택된 핵산 서열을 포함하거나 이로 구성되는 것인, 핵산 분자. - 제48항 내지 제51항 중 한 항에 있어서, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27을 포함하는 군으로부터 선택된 핵산 서열을 포함하거나 이로 구성된 mela(palm)-mGluR6 키메라 GPCR을 암호화하는 이식유전자를 포함하는 핵산 분자.
- 제51항 또는 제52항에 있어서, 세포 특이적 프로모터를 포함하고,
세포 특이적 프로모터는 이식유전자에 작동 가능하게 연결되고,
세포 특이적 프로모터는 특히 ON 두극세포 특이적 프로모터, 더욱 특별하게는 200En-mGluR500P 프로모터, 서열번호 75에 따른 770En_454P(hGRM6) 프로모터 또는 서열번호 76에 따른 444En_454P(hGRM6) 프로모터 또는 망막 ON-두극세포 또는 이의 요소의 내인성 mGluR6 프로모터를 포함하는 군으로부터 선택된 ON 두극세포 특이적 프로모터인 핵산 분자. - 제45항에 따른 또는 제45항 및 제46항에 따른 또는 제45항 및 제47항에 따른 AAV 캡시드를 암호화하는 서열을 포함하는 재조합 AAV 벡터(rAAV).
- 제36항 내지 제39항 중 한 항에 따른 핵산 분자를 포함하는 벡터로서, 특히 프로모터에 작동 가능하게 연결된 제36항 내지 제39항 중 한 항에 따른 키메라 옵신 GPCR 단백질을 암호화하는 이식유전자를 포함하는 핵 발현 벡터.
- 제54항 또는 제55항에 있어서, 재조합 아데노 관련 바이러스(rAAV)인 벡터.
- 제54항 내지 제56항 중 한 항에 있어서, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및 AAV12, 특히 AAV2 또는 AAV8을 포함하는 AAV 혈청형의 군으로부터 선택된 벡터.
- 제54항 내지 제57항 중 한 항에 있어서,
- AAV 캡시드 단백질을 암호화하는 서열 및/또는
- 프로모터, 특히 세포 특이적 프로모터, 더욱 특별하게는 두극세포 특이적 프로모터
를 포함하는 서열의 군으로부터 선택된 핵산 서열을 추가로 포함하는 벡터. - 제54항 내지 제58항 중 한 항에 있어서, 특히,
- GRM6-sv40 프로모터,
- 4xGRM6-sv40 프로모터,
- 200En-mGluR500P 프로모터,
- 770En_454P(hGRM6) 프로모터 서열번호 75,
- 444En_454P(hGRM6) 프로모터 서열번호 76 및
- 망막 ON-두극세포 또는 이의 요소의 내인성 mGluR6 프로모터를 포함하는 프로모터의 군으로부터 선택된, ON-두극세포 특이적 프로모터에 의해 유도된 제35항 내지 제39항 중 한 항에 따른 키메라 옵신 GPCR을 암호화하는 핵산 분자를 포함하는 벡터. - 제54항 내지 제59항 중 한 항에 있어서, 키메라 멜라놉신-mGluR6(Mela-mGluR6), 특히 Mela(palm)-mGluR6 또는 Mela(palm+33)-mGluR6 또는 키메라 OPN1mw-mGluR6 또는 두 개의 옵신을 포함하는 키메라 옵신 GPCR을 암호화하는 이식유전자를 포함하는 벡터.
- 제54항 내지 제60항에 있어서, 이식유전자를 포함하고, 이식유전자는
- Mela(palm)-mGluR6, 특히 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27을 포함하는 군으로부터 선택된 서열 중 하나에 따른 Mela(palm)-mGluR6 또는
- Mela(palm+33)-mGluR6, 특히 서열번호 15에 따른 Mela(palm+33)-mGluR6 또는
- 세포내 루프를 추가로 포함하는 Mela-mGluR6, 특히 서열번호 29 또는 서열번호 31로부터 선택된 서열에 따른 세포내 루프를 추가로 포함하는 Mela-mGluR6
을 포함하는 군으로부터 선택된 키메라 Mela-mGluR6을 암호화하는 것인 벡터. - 제54항 내지 제61항 중 한 항에 있어서,
벡터는 제40항 내지 제47항 중 한 항에 따른, 특히 제43항 내지 제47항 중 한 항에 따른 AAV 캡시드를 암호화하는 핵산 서열을 추가로 포함하는 벡터. - 제54항 내지 제62항의 조합에 있어서,
키메라 옵신 GPCR을 암호화하는 이식유전자에 작동 가능하게 연결된 770En-445P(hGRM6) 프로모터를 포함하고,
AAV2(7m8), AAV8(BP2), AAV2(NHAPNHC) 및 AAV2(PRTPHTA)를 포함하는 군으로부터 선택된 캡시드를 암호화하는 핵산 서열을 추가로 포함하고,
특히 이식유전자는
- 상류 옵신으로서 멜라놉신 또는 hOPN1mw를 포함하고 표적 옵신으로서 mGluR6을 포함하는 키메라 옵신 GPCR 또는 2개의 옵신을 포함하는 키메라 옵신 GPCR,
- Mela(palm)-mGluR6 또는 Mela(palm+33)-mGluR6으로부터 선택된 키메라 옵신 GPCR
- 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27 서열번호 29 또는 서열번호 31을 포함하는 군으로부터 선택된 핵산 서열에 의해 암호화된 키메라 옵신 GPCR
을 포함하는 군으로부터 선택된 키메라 옵신 GPCR을 암호화하는 것인 벡터. - 제54항 또는 제55항에 있어서, 서열번호 79에 따른 서열이 있는 핵산 분자를 포함하거나 이로 구성된 벡터.
- 트랜스제닉 동물, 특히 트랜스제닉 마우스, 또는 트랜스제닉 세포로서, 제36항 내지 제39항 중 한 항에 따른 핵산 분자를 포함하거나 제54항 내지 제64항 중 한 항에 따른 벡터를 포함하고/하거나, 제1항 내지 제35항 중 한 항에 따른 옵신-GPCR 단백질을 포함하는 트랜스제닉 동물, 특히 트랜스제닉 마우스, 또는 트랜스제닉 세포.
- 제60항에 있어서, 줄기 세포주 - 특히, 생식 세포주는 제외 -로부터 유래되거나, 또는 세포는 기관형 세포주, 특히
- HEK293-GIRK 세포
- 내부 망막 뉴런, 특히 ON 두극세포,
- 신장 세포 및
- Gs, Gq 또는 G12/13으로부터 선택된 G 단백질을 발현하는 세포
를 포함하는 세포주의 군으로부터 선택된 기관형 세포주로부터 선택되는 트랜스제닉 세포. - 제65항 또는 제66항에 있어서, CRISPR/cas 변형된 게놈을 포함하는 트랜스제닉 동물 또는 트랜스제닉 세포.
- 운반체로서,
제1항 내지 제35항 중 한 항에 따른 키메라 옵신 GPCR 단백질 또는
제36항 내지 제39항 중 한 항에 따른 핵산 분자 또는 제54항 내지 제64항 중 한 항에 따른 벡터
를 포함하고,
핵산 분자 또는 벡터는 키메라 옵신 GPCR을 암호화하는 이식유전자를 포함하고,
운반체는 표적 세포 또는 인간 또는 비인간 동물로의 상기 키메라 옵신 GPCR의 전달에 적합하고,
선택적으로 소포, 입자, 마이크로입자, 나노 입자 및 금 입자를 포함하는 군으로부터 선택되는 운반체. - 제68항에 있어서, 이식유전자 및 CRISPR/cas 카세트를 포함하는 운반체.
- 제65항 내지 제69항 중 한 항에 있어서, 키메라 멜라놉신-mGluR6(Mela-mGluR6), 특히 Mela(palm)-mGluR6 또는 Mela(palm+33)-mGluR6 또는 키메라 OPN1mw-mGluR6 또는 두 개의 옵신을 포함하는 키메라 옵신 GPCR을 암호화하는 이식유전자를 포함하는, 제65항 내지 제67항 중 한 항에 따른 트랜스제닉 동물 또는 트랜스제닉 세포 또는 제68항 또는 제69항에 따른 전달용 운반체.
- 제65항 내지 제69항 중 한 항에 있어서,
이식유전자는
- Mela(palm)-mGluR6, 특히 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27을 포함하는 군으로부터 선택된 서열 중 하나에 따른 Mela(palm)-mGluR6 또는
- Mela(palm+33)-mGluR6, 특히 서열번호 15에 따른 Mela(palm+33)-mGluR6 또는
- 세포내 루프를 추가로 포함하는 Mela-mGluR6, 특히 서열번호 29 또는 서열번호 31로부터 선택된 서열에 따른 세포내 루프를 추가로 포함하는 Mela-mGluR6
을 포함하는 군으로부터 선택된 키메라 Mela-mGluR6을 암호화하는 것인, 제65항 내지 제67항 중 한 항에 따른 트랜스제닉 동물 또는 트랜스제닉 세포 또는 제68항 또는 제69항에 따른 전달용 운반체. - 키메라 옵신 GPCR 단백질 또는 키메라 펩티드, 특히 제1항 내지 제35항 중 한 항에 따른 키메라 옵신 GPCR 단백질 또는 키메라 펩티드를 암호화하는 핵산 분자를 유전자 조작하는 방법으로서,
상기 키메라 옵신 GPCR 단백질 또는 상기 키메라 펩티드는 절단된 상류 옵신 CT를 포함하는 키메라 C 말단 도메인(키메라 CT)을 포함하고,
상기 키메라 CT는 모 상류 옵신 CT 및 모 표적 GPCR CT로부터 유래되고,
단계:
A-1 O-CT-근위 영역의 원위 말단의 아미노산 위치 또는 O-CT-근위 영역에 대한 원위 연장부 내의 아미노산 위치에서 모 상류 옵신의 CT의 절단 부위 (x)를 선택하는 단계,
A-2 선택된 절단 부위에서 절단된 절단 CT를 갖는 상류 옵신 부분 또는 펩티드를 암호화하는 핵산 분자를 수득하는 단계;
B-1 모 표적 GPCR CT의 근위 영역 내, 특히 NR(K)Q 모티프 또는 이의 상류에서 또는 NPxxY와 NR(K)Q 모티프 사이에서 절삭 부위 (y)를 선택하는 단계,
B-2 표적 GPCR CT 또는 이의 기능적 변이체, 특히 이의 기능적 단편을 암호화하는 핵산 분자를 수득하는 단계; 및
C-1 단계 A-2에서 수득된 절단된 옵신-CT를 암호화하는 핵산 분자를 단계 B-2에서 수득된 표적 CT 또는 이의 기능적 변이체를 암호화하는 핵산 분자와 융합시키는 단계;
를 포함하는 방법. - 제72항에 있어서, 단계 A-1에서 절단 부위 (x)는 다음을 포함하는 기준의 군으로부터 선택된 기준 중 하나 이상을 충족하는 것인 방법:
- 절단 부위 (x)는 NR(K)Q 모티프의 하류에서 또는 적어도 7 또는 8 또는 9 또는 10 또는 11 또는 12 또는 13개 아미노산에 위치한 뉴클레오티드에 위치한다,
- 절단 부위 (x)는 팔미토일화 부위 또는 팔미토일화 부위에 상응하는 아미노산의 하류 및 특히 이의 원위쪽으로 인접하여 위치한다,
- 절단 부위는 NR(K)Q 모티프의 하류에서 최대 45개 또는 47개 또는 49개 뉴클레오티드에 위치한다. - 제72항에 있어서, 특히 상류 옵신은 멜라놉신이고, 단계 A-1에서 절단 부위 (x)는 다음을 포함하는 기준의 군으로부터 선택된 기준 중 하나 이상을 충족하는 것인 방법:
- 절단 부위 (x)는 O-CT-근위 영역의 하류에서 최대 30개 또는 31개 또는 32개 또는 33개 또는 34개 또는 35개 아미노산, 특히 O-CT-근위 영역에 대한 원위 연장부의 원위 말단에 위치한다,
- 절단 부위 (x)는 NR(K)Q 모티프의 하류에서 최대 45개 또는 47개 또는 49개 뉴클레오티드에 위치한다,
- 절단 부위는 인산화 부위의 보존된 클러스터의 하류의 아미노산 위치, 특히 상기 보존된 인산화 부위의 클러스터의 원위 말단에 원위쪽으로 인접하여 위치한다. - 제72항에 있어서, 단계 A-1에서 선택된 상류 옵신의 절단 부위 x 및 단계 B-1에서 선택된 표적 GPCR의 절삭 부위 y는 둘 다 각각의 팔미토일화 부위 또는 팔미토일화 부위에 상응하는 아미노산 위치에 위치하거나, 또는둘 다 NR(K)Q 부위의 하류에서 7 내지 13개, 특히 8 내지 12개, 더욱 특별하게는 9 내지 11개, 또는 약 10개의 아미노산에 위치하는 것인 유전자 조작 방법.
- 제72항 내지 제75항 중 한 항에 있어서, 하나 이상의 세포내 루프를 교체하거나 부분적으로 교체하는 하나 이상의 추가 단계, 특히 상응하는 위치에서 상류 옵신의 하나 이상의 세포내 루프 또는 부분 세포내 루프를 표적 GPCR의 세포내 루프로 교환하는 하나 이상의 추가 단계를 포함하고,
특히 하나 이상의 스플라이싱 부위는
- IL1 교환을 위한 접합부 a 및 접합부 b
- IL2 교환을 위한 접합부 c 및 접합부 d
- IL3 교환을 위한 접합부 e 및 접합부 f
- 표적 GPCR의 IL3과의 교환에서 상류 옵신 IL3의 고도로 가변적인 영역을 제거하는 IL3 내의 2개의 스플라이싱 부위
를 포함하는 군으로부터 선택되는 것인 유전자 조작 방법. - 제72항 내지 제76항 중 한 항에 있어서, 단계 A 및 또는 단계 B 전에 모 GPCR을 암호화하는 핵산 서열 중 하나 또는 둘 모두의 보존된 모티프의 확인을 추가로 포함하고, 이는
- 선택적으로 서열 정렬 도구를 사용하여 옵신 또는 이의 단편의 아미노산 서열을 표적 GPCR 또는 이의 단편의 아미노산 서열과 정렬하는 단계,
- 특히,
- E(D)RY/NRI,
- IL3과 TM6의 접합부 주변의 E,
- NPxxY,
- NR(K)Q,
- 팔미토일화된 C 및
- 표적 GPCR이 또한 옵신인 경우 TM7의 발색단의 결합을 위한 K
를 포함하는 보존된 모티프의 군으로부터 선택된 보존된 모티프를 구성하는 아미노산 위치를 결정하는 단계를 포함하고,
선택적으로 옵신의 아미노산 서열은 보존된 모티프를 구성하는 아미노산 위치의 확인을 위해 소 로돕신의 아미노산 서열과 정렬되는 것인 유전자 조작 방법. - 제72항 내지 제77항 중 한 항에 있어서, 단계 A 및/또는 단계 B 전에 1차 아미노산 서열을 2차/3차 단백질 구조의 예측을 위한 프로그램에 입력하는 단계를 포함하는, 모 옵신 및 모 표적 GPCR 중 하나 또는 둘 모두에서 보존된 3D GPCR 도메인 또는 서브도메인, 특히 서브도메인 나선 8의 확인을 추가로 포함하는 유전자 조작 방법.
- 의학적 사용, 특히 유전자 요법을 위한, 제1항 내지 제35항 중 한 항에 따른 키메라 옵신 - GPCR 단백질
또는 제36항 내지 제39항 중 한 항에 따른 상기 옵신 GPCR 단백질을 암호화하는 핵산 분자
또는 제40항 내지 제47항 중 한 항에 따른 캡시드
또는 제48항 내지 제53항에 따른 상기 캡시드를 암호화하는 핵산 분자 또는
또는 제54항 내지 제64항 중 한 항에 따른 벡터
또는 제65항 내지 제71항 중 한 항에 따른 운반체 또는 세포. - 제79항에 따른 사용을 위한, 키메라 옵신 GPCR 단백질,
또는 상기 옵신 GPCR을 암호화하는 핵산 분자,
또는 캡시드 또는 상기 캡시드를 암호화하는 핵산 분자,
또는 벡터 또는 운반체 또는 세포로서,
사용의 목적은 시력 개선, 부분 또는 완전 실명의 치료, 색소성 망막염(RP)의 치료, 황반 변성의 치료 및 다른 형태의 광수용체 변성의 치료를 포함하는 군으로부터 선택되는 것인 키메라 옵신 GPCR 단백질, 또는 상기 옵신 GPCR을 암호화하는 핵산 분자, 또는 캡시드 또는 상기 캡시드를 암호화하는 핵산 분자, 또는 벡터 또는 운반체 또는 세포. - 제79항 또는 제80항에 따른 사용을 위한, 키메라 옵신 GPCR 단백질,
또는 상기 옵신 GPCR을 암호화하는 핵산 분자,
또는 캡시드 또는 상기 캡시드를 암호화하는 핵산 분자,
또는 벡터 또는 운반체 또는 세포로서,
키메라 옵신 GPCR은 키메라 옵신 mGluR6 GPCR 또는 상류 옵신 및 표적 옵신을 포함하는 키메라 GPCR로부터 선택되고, 특히 표적 옵신은 원추형 옵신 또는 로돕신인, 키메라 옵신 GPCR 단백질, 또는 상기 옵신 GPCR을 암호화하는 핵산 분자, 또는 캡시드 또는 상기 캡시드를 암호화하는 핵산 분자, 또는 벡터 또는 운반체 또는 세포. - 제품을 포함하는 제약 조성물로서, 제품은
제1항 내지 제35항 중 한 항에 따른 키메라 옵신 - GPCR 단백질
또는 제36항 내지 제39항 중 한 항에 따른 상기 옵신 GPCR 단백질을 암호화하는 핵산 분자
또는 제40항 내지 제47항 중 한 항에 따른 캡시드
또는 제48항 내지 제53항에 따른 상기 캡시드를 암호화하는 핵산 분자 또는
또는 제54항 내지 제64항 중 한 항에 따른 벡터
또는 제65항 내지 제71항 중 한 항에 따른 운반체 또는 세포
를 포함하고,
선택적으로 키메라 옵신 GPCR은 키메라 옵신 mGluR6 GPCR 또는 상류 옵신 및 표적 옵신을 포함하는 키메라 GPCR로부터 선택되고,
선택적으로 표적 옵신은 원추형 옵신 또는 로돕신인 제약 조성물. - 치료를 필요로 하는 인간 또는 비인간 동물을 치료하는 방법으로서,
제1항 내지 제35항 중 한 항에 따른 키메라 옵신 - GPCR 단백질
또는 제36항 내지 제39항 중 한 항에 따른 상기 옵신 GPCR 단백질을 암호화하는 핵산 분자
또는 제40항 내지 제47항 중 한 항에 따른 캡시드
또는 제48항 내지 제53항에 따른 상기 캡시드를 암호화하는 핵산 분자 또는
또는 제54항 내지 제64항 중 한 항에 따른 벡터
또는 제65항 내지 제71항 중 한 항에 따른 운반체 또는 세포
의 투여를 포함하고,
선택적으로 키메라 옵신 GPCR은 키메라 옵신 mGluR6 GPCR 또는 상류 옵신 및 표적 옵신을 포함하는 키메라 GPCR로부터 선택되고,
선택적으로 표적 옵신은 원추형 옵신 또는 로돕신인 방법. - 시력 개선, 또는 부분 또는 완전 실명의 치료, 또는 색소성 망막염(RP)의 치료, 또는 황반 변성의 치료 또는 다른 형태의 광수용체 변성의 치료를 위한 의료 요법용 약제의 제조에 있어서,
제1항 내지 제35항 중 한 항에 따른 키메라 옵신 - GPCR 단백질
또는 제36항 내지 제39항 중 한 항에 따른 상기 옵신 GPCR 단백질을 암호화하는 핵산 분자
또는 제40항 내지 제47항 중 한 항에 따른 캡시드
또는 제48항 내지 제53항에 따른 상기 캡시드를 암호화하는 핵산 분자 또는
또는 제54항 내지 제64항 중 한 항에 따른 벡터
또는 제65항 내지 제71항 중 한 항에 따른 운반체 또는 세포의 용도로서,
선택적으로 키메라 옵신 GPCR은 키메라 옵신 mGluR6 GPCR 또는 상류 옵신 및 표적 옵신을 포함하는 키메라 GPCR로부터 선택되고,
선택적으로 표적 옵신은 원추형 옵신 또는 로돕신인 용도. - 제79항 내지 제84항 중 한 항에 따른 의학적 적용으로서,
제1항 내지 제35항 중 한 항에 따른 키메라 옵신 - GPCR 단백질
또는 제36항 내지 제39항 중 한 항에 따른 상기 옵신 GPCR 단백질을 암호화하는 핵산 분자
또는 제40항 내지 제47항 중 한 항에 따른 캡시드
또는 제48항 내지 제53항에 따른 상기 캡시드를 암호화하는 핵산 분자
또는 제54항 내지 제64항 중 한 항에 따른 벡터
또는 제65항 내지 제71항 중 한 항에 따른 운반체 또는 세포
를 포함하는 제품의 군으로부터 선택된 제품을 포함하고,
제품은 키메라 옵신 GPCR 단백질을 포함하거나 상기 키메라 옵신 GPCR 단백질을 암호화하는 핵산 서열을 포함하는 핵산 분자를 포함하고,
키메라 옵신 GPCR은
- Mela(palm)-mGluR6, 특히 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 및 서열번호 28을 포함하는 군으로부터 선택된 서열에 따른 Mela(palm)-mGluR6 또는
- Mela(palm+33)-mGluR6, 특히 서열번호 16에 따른 Mela(palm+33)-mGluR6 또는
- 세포내 루프를 추가로 포함하는 Mela-mGluR6, 특히 서열번호 30 또는 서열번호 32로부터 선택된 서열에 따른 세포내 루프를 추가로 포함하는 Mela-mGluR6
을 포함하는 군으로부터 선택되는 것인 의학적 적용.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CH15092019 | 2019-11-29 | ||
CH01509/19 | 2019-11-29 | ||
PCT/EP2020/083960 WO2021105509A1 (en) | 2019-11-29 | 2020-11-30 | Chimeric opsin gpcr proteins |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220111294A true KR20220111294A (ko) | 2022-08-09 |
Family
ID=73726778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227021853A KR20220111294A (ko) | 2019-11-29 | 2020-11-30 | 키메라 옵신 gpcr 단백질 |
Country Status (17)
Country | Link |
---|---|
US (1) | US20240174743A1 (ko) |
EP (1) | EP4065153A1 (ko) |
JP (1) | JP2023504136A (ko) |
KR (1) | KR20220111294A (ko) |
CN (1) | CN115038458A (ko) |
AU (2) | AU2020392702B2 (ko) |
BR (1) | BR112022010095A2 (ko) |
CA (1) | CA3162568A1 (ko) |
CL (1) | CL2022001376A1 (ko) |
CO (1) | CO2022008784A2 (ko) |
CR (1) | CR20220283A (ko) |
EC (1) | ECSP22050231A (ko) |
IL (1) | IL293076A (ko) |
JO (1) | JOP20220128A1 (ko) |
MX (1) | MX2022006496A (ko) |
PE (1) | PE20230093A1 (ko) |
WO (1) | WO2021105509A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023116720A1 (en) * | 2021-12-20 | 2023-06-29 | National Institute Of Biological Sciences, Beijing | ULTRA LIGHT-SENSITIVE NEUROPSIN-BASED OPTOGENETIC TOOL FOR ACTIVATING G q-COUPLED SIGNALING AND/OR ACTIVATING CELLS |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PT3029063T (pt) * | 2011-06-24 | 2020-01-22 | Arctos Medical AG | Proteína gpcr quimérica sensível à luz |
-
2020
- 2020-11-30 KR KR1020227021853A patent/KR20220111294A/ko active Search and Examination
- 2020-11-30 BR BR112022010095A patent/BR112022010095A2/pt unknown
- 2020-11-30 IL IL293076A patent/IL293076A/en unknown
- 2020-11-30 WO PCT/EP2020/083960 patent/WO2021105509A1/en active Application Filing
- 2020-11-30 PE PE2022000865A patent/PE20230093A1/es unknown
- 2020-11-30 CR CR20220283A patent/CR20220283A/es unknown
- 2020-11-30 MX MX2022006496A patent/MX2022006496A/es unknown
- 2020-11-30 AU AU2020392702A patent/AU2020392702B2/en active Active
- 2020-11-30 JO JOP/2022/0128A patent/JOP20220128A1/ar unknown
- 2020-11-30 CA CA3162568A patent/CA3162568A1/en active Pending
- 2020-11-30 CN CN202080081599.XA patent/CN115038458A/zh active Pending
- 2020-11-30 JP JP2022532030A patent/JP2023504136A/ja active Pending
- 2020-11-30 EP EP20820068.3A patent/EP4065153A1/en active Pending
- 2020-11-30 US US17/756,547 patent/US20240174743A1/en active Pending
-
2022
- 2022-05-25 CL CL2022001376A patent/CL2022001376A1/es unknown
- 2022-06-24 CO CONC2022/0008784A patent/CO2022008784A2/es unknown
- 2022-06-24 EC ECSENADI202250231A patent/ECSP22050231A/es unknown
-
2023
- 2023-10-06 AU AU2023241362A patent/AU2023241362A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
ECSP22050231A (es) | 2022-08-31 |
IL293076A (en) | 2022-07-01 |
AU2020392702B2 (en) | 2023-07-06 |
PE20230093A1 (es) | 2023-01-16 |
JP2023504136A (ja) | 2023-02-01 |
MX2022006496A (es) | 2022-09-07 |
WO2021105509A1 (en) | 2021-06-03 |
CR20220283A (es) | 2022-09-30 |
BR112022010095A2 (pt) | 2022-09-06 |
US20240174743A1 (en) | 2024-05-30 |
AU2020392702A1 (en) | 2022-07-21 |
AU2023241362A1 (en) | 2023-10-26 |
CA3162568A1 (en) | 2021-06-03 |
CL2022001376A1 (es) | 2023-03-24 |
JOP20220128A1 (ar) | 2023-01-30 |
CN115038458A (zh) | 2022-09-09 |
EP4065153A1 (en) | 2022-10-05 |
CO2022008784A2 (es) | 2022-09-20 |
AU2020392702A9 (en) | 2022-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111518175B (zh) | Sars-cov-2抗原多肽及其重组腺相关病毒和在制备疫苗中的应用 | |
US20200138975A1 (en) | Aav vector for treatment of friedreich's ataxia | |
CN108753824B (zh) | 用于治疗视网膜营养不良的病毒载体 | |
CN111621524A (zh) | Rna转录载体及其用途 | |
AU2023241362A1 (en) | Chimeric opsin GPCR proteins | |
TW202221125A (zh) | 用於治療與葡萄糖神經醯胺酶β缺陷相關之神經病症的組合物及方法 | |
CN108137664B (zh) | 用于治疗伴侣动物的aav-epo | |
CN112980819A (zh) | 视网膜色素变性动物模型的构建方法及其应用 | |
KR102070763B1 (ko) | 도파민 신경세포 특이적 발현 제어 시스템 | |
KR102510154B1 (ko) | 비만유래 2형 당뇨 예방 및 치료를 위한 내장지방 대식세포 표적 비바이러스성 유전자/전달체 복합체 | |
CN111440774A (zh) | 稳定表达敲入egfp的ifngr2基因黑色素瘤b-16细胞系的构建方法 | |
CN115074369B (zh) | 表达全长abca4基因的腺相关病毒载体及应用 | |
KR102570821B1 (ko) | 재조합 바이러스 벡터 및 이를 이용한 약학 조성물 | |
KR102163667B1 (ko) | 염증성 질환 예방 또는 치료용 유전자/전달체 복합체 | |
KR101973007B1 (ko) | 외래 단백질 발현 증가를 위한 재조합 전이 벡터 | |
CN112831524B (zh) | 人工改造的重组腺病毒载体、由其包装的病毒及其应用 | |
TW202302858A (zh) | 治療糖尿病之胰島素基因療法 | |
CN114839382A (zh) | 一种在酵母中建立基于红色荧光蛋白的双分子荧光互补系统的方法 | |
CN114716565A (zh) | 一种新型嵌合抗原受体 | |
CN112759651A (zh) | 一种包含嵌合抗原受体修饰的t细胞及其应用 | |
CN110423776A (zh) | 表达重组凝血因子fix的载体及其构建方法和应用 | |
CN109295099A (zh) | Stub1重组过表达载体及其构建方法和用途 | |
KR20130059526A (ko) | 인간 뼈 형성촉진효과를 위해 인간 bmp2/7-ptd 발현벡터를 통해 형질전환된 세포주 및 이 형질전환된 세포주를 이용한 3차원 세포 배양방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |