KR20230051578A - Shank3 유전자 치료 접근법 - Google Patents
Shank3 유전자 치료 접근법 Download PDFInfo
- Publication number
- KR20230051578A KR20230051578A KR1020237009262A KR20237009262A KR20230051578A KR 20230051578 A KR20230051578 A KR 20230051578A KR 1020237009262 A KR1020237009262 A KR 1020237009262A KR 20237009262 A KR20237009262 A KR 20237009262A KR 20230051578 A KR20230051578 A KR 20230051578A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- pro
- gly
- ser
- ala
- Prior art date
Links
- 102100030681 SH3 and multiple ankyrin repeat domains protein 3 Human genes 0.000 title claims abstract description 205
- 101710101741 SH3 and multiple ankyrin repeat domains protein 3 Proteins 0.000 title claims abstract description 205
- 238000001415 gene therapy Methods 0.000 title abstract description 16
- 238000013459 approach Methods 0.000 title description 4
- 239000013607 AAV vector Substances 0.000 claims abstract description 103
- 238000000034 method Methods 0.000 claims abstract description 100
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 83
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 83
- 239000002157 polynucleotide Substances 0.000 claims abstract description 83
- 241000702421 Dependoparvovirus Species 0.000 claims description 243
- 201000006347 Intellectual Disability Diseases 0.000 claims description 195
- 108090000623 proteins and genes Proteins 0.000 claims description 111
- 102000004169 proteins and genes Human genes 0.000 claims description 100
- 241000282414 Homo sapiens Species 0.000 claims description 83
- 208000029560 autism spectrum disease Diseases 0.000 claims description 75
- 239000000203 mixture Substances 0.000 claims description 68
- 230000014509 gene expression Effects 0.000 claims description 49
- 239000013598 vector Substances 0.000 claims description 45
- 101150096160 Shank3 gene Proteins 0.000 claims description 37
- 208000029726 Neurodevelopmental disease Diseases 0.000 claims description 30
- 230000035772 mutation Effects 0.000 claims description 30
- 208000033180 Monosomy 22q13.3 Diseases 0.000 claims description 27
- 201000006880 Phelan-McDermid syndrome Diseases 0.000 claims description 26
- 230000006735 deficit Effects 0.000 claims description 26
- 230000002829 reductive effect Effects 0.000 claims description 26
- 102000008102 Ankyrins Human genes 0.000 claims description 24
- 108010049777 Ankyrins Proteins 0.000 claims description 24
- 102000000470 PDZ domains Human genes 0.000 claims description 24
- 108050008994 PDZ domains Proteins 0.000 claims description 24
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 22
- 102000010029 Homer Scaffolding Proteins Human genes 0.000 claims description 21
- 108010077223 Homer Scaffolding Proteins Proteins 0.000 claims description 21
- 102000000395 SH3 domains Human genes 0.000 claims description 18
- 108050008861 SH3 domains Proteins 0.000 claims description 18
- 102000010958 Cortactin Human genes 0.000 claims description 17
- 108010037663 Cortactin Proteins 0.000 claims description 17
- 210000004556 brain Anatomy 0.000 claims description 16
- 239000002245 particle Substances 0.000 claims description 16
- 230000007958 sleep Effects 0.000 claims description 14
- 208000019116 sleep disease Diseases 0.000 claims description 14
- 238000012217 deletion Methods 0.000 claims description 11
- 230000037430 deletion Effects 0.000 claims description 11
- 208000035475 disorder Diseases 0.000 claims description 11
- 210000001577 neostriatum Anatomy 0.000 claims description 11
- 239000013603 viral vector Substances 0.000 claims description 11
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 claims description 8
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 8
- 208000030979 Language Development disease Diseases 0.000 claims description 7
- 241001655883 Adeno-associated virus - 1 Species 0.000 claims description 6
- 108090000565 Capsid Proteins Proteins 0.000 claims description 6
- 102100023321 Ceruloplasmin Human genes 0.000 claims description 6
- 150000001413 amino acids Chemical group 0.000 claims description 6
- 208000024891 symptom Diseases 0.000 claims description 6
- 210000001103 thalamus Anatomy 0.000 claims description 6
- 206010012559 Developmental delay Diseases 0.000 claims description 5
- 206010021118 Hypotonia Diseases 0.000 claims description 5
- 208000007379 Muscle Hypotonia Diseases 0.000 claims description 5
- 239000003937 drug carrier Substances 0.000 claims description 5
- 241000649045 Adeno-associated virus 10 Species 0.000 claims description 4
- 206010003805 Autism Diseases 0.000 claims description 4
- 208000020706 Autistic disease Diseases 0.000 claims description 4
- 208000020685 sleep-wake disease Diseases 0.000 claims description 4
- 210000000234 capsid Anatomy 0.000 claims description 3
- 229920001184 polypeptide Polymers 0.000 claims description 2
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 2
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims 1
- 229910052698 phosphorus Inorganic materials 0.000 claims 1
- 239000011574 phosphorus Substances 0.000 claims 1
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 287
- 241000699670 Mus sp. Species 0.000 description 107
- 238000011282 treatment Methods 0.000 description 50
- 108010050848 glycylleucine Proteins 0.000 description 39
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 34
- 210000001519 tissue Anatomy 0.000 description 32
- 108010026333 seryl-proline Proteins 0.000 description 30
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 27
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 27
- 108010092804 postsynaptic density proteins Proteins 0.000 description 26
- 108020004414 DNA Proteins 0.000 description 23
- 230000000694 effects Effects 0.000 description 23
- 230000000946 synaptic effect Effects 0.000 description 23
- 241000880493 Leptailurus serval Species 0.000 description 22
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 22
- 230000006870 function Effects 0.000 description 21
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 20
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 20
- 238000012384 transportation and delivery Methods 0.000 description 20
- 108700019146 Transgenes Proteins 0.000 description 19
- 108010047495 alanylglycine Proteins 0.000 description 19
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 17
- 230000007547 defect Effects 0.000 description 17
- 108010025306 histidylleucine Proteins 0.000 description 17
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 16
- 108010062796 arginyllysine Proteins 0.000 description 16
- 210000004027 cell Anatomy 0.000 description 16
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 16
- 210000000225 synapse Anatomy 0.000 description 16
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 15
- 108010079364 N-glycylalanine Proteins 0.000 description 15
- 108010005233 alanylglutamic acid Proteins 0.000 description 15
- 230000006399 behavior Effects 0.000 description 15
- 230000003370 grooming effect Effects 0.000 description 15
- 108010073969 valyllysine Proteins 0.000 description 15
- 238000010276 construction Methods 0.000 description 14
- 108010003700 lysyl aspartic acid Proteins 0.000 description 14
- 108010017391 lysylvaline Proteins 0.000 description 14
- 108010077112 prolyl-proline Proteins 0.000 description 14
- 108010047857 aspartylglycine Proteins 0.000 description 13
- 230000003542 behavioural effect Effects 0.000 description 13
- 238000011161 development Methods 0.000 description 13
- 230000018109 developmental process Effects 0.000 description 13
- 108010077515 glycylproline Proteins 0.000 description 13
- 210000002569 neuron Anatomy 0.000 description 13
- 150000007523 nucleic acids Chemical group 0.000 description 13
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 13
- 210000003538 post-synaptic density Anatomy 0.000 description 13
- 108010053725 prolylvaline Proteins 0.000 description 13
- 241001465754 Metazoa Species 0.000 description 12
- 108010087924 alanylproline Proteins 0.000 description 12
- 108010068265 aspartyltyrosine Proteins 0.000 description 12
- 210000003169 central nervous system Anatomy 0.000 description 12
- 238000002347 injection Methods 0.000 description 12
- 239000007924 injection Substances 0.000 description 12
- 108010034529 leucyl-lysine Proteins 0.000 description 12
- 108010031719 prolyl-serine Proteins 0.000 description 12
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 11
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 11
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 11
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 11
- 201000010099 disease Diseases 0.000 description 11
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 11
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 11
- 108010037850 glycylvaline Proteins 0.000 description 11
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 11
- 108010012581 phenylalanylglutamate Proteins 0.000 description 11
- 230000001105 regulatory effect Effects 0.000 description 11
- 230000003997 social interaction Effects 0.000 description 11
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 10
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 10
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 10
- 206010010904 Convulsion Diseases 0.000 description 10
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 10
- 241000699666 Mus <mouse, genus> Species 0.000 description 10
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 10
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 10
- 108010044940 alanylglutamine Proteins 0.000 description 10
- 230000001747 exhibiting effect Effects 0.000 description 10
- 230000004973 motor coordination Effects 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- MJJIHRWNWSQTOI-VEVYYDQMSA-N Asp-Thr-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MJJIHRWNWSQTOI-VEVYYDQMSA-N 0.000 description 9
- 108700019745 Disks Large Homolog 4 Proteins 0.000 description 9
- 102100022264 Disks large homolog 4 Human genes 0.000 description 9
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 9
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 9
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 108010093581 aspartyl-proline Proteins 0.000 description 9
- 238000009472 formulation Methods 0.000 description 9
- 238000001990 intravenous administration Methods 0.000 description 9
- 238000007914 intraventricular administration Methods 0.000 description 9
- 230000013016 learning Effects 0.000 description 9
- 230000001242 postsynaptic effect Effects 0.000 description 9
- 208000022925 sleep disturbance Diseases 0.000 description 9
- 230000003612 virological effect Effects 0.000 description 9
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 8
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 8
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 8
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 8
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 8
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 8
- 108010065920 Insulin Lispro Proteins 0.000 description 8
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 8
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 8
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 8
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 8
- 102100032735 SH3 and multiple ankyrin repeat domains protein 1 Human genes 0.000 description 8
- 101710101742 SH3 and multiple ankyrin repeat domains protein 1 Proteins 0.000 description 8
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 8
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 8
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 8
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 8
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 8
- 230000005856 abnormality Effects 0.000 description 8
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 8
- 230000002950 deficient Effects 0.000 description 8
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 8
- 238000010253 intravenous injection Methods 0.000 description 8
- 108010057821 leucylproline Proteins 0.000 description 8
- 108010051242 phenylalanylserine Proteins 0.000 description 8
- 108010029020 prolylglycine Proteins 0.000 description 8
- 230000003252 repetitive effect Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 108010071207 serylmethionine Proteins 0.000 description 8
- 230000003976 synaptic dysfunction Effects 0.000 description 8
- 108010061238 threonyl-glycine Proteins 0.000 description 8
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 7
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 7
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 7
- SYIFFFHSXBNPMC-UWJYBYFXSA-N Ala-Ser-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N SYIFFFHSXBNPMC-UWJYBYFXSA-N 0.000 description 7
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 7
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 7
- 238000010152 Bonferroni least significant difference Methods 0.000 description 7
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 7
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 7
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 7
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 7
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 7
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 7
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 7
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 7
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 7
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 7
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 7
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 7
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 7
- 241000700605 Viruses Species 0.000 description 7
- 108010008355 arginyl-glutamine Proteins 0.000 description 7
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 7
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 7
- 230000001815 facial effect Effects 0.000 description 7
- 230000005021 gait Effects 0.000 description 7
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 7
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 7
- 238000010172 mouse model Methods 0.000 description 7
- 102000039446 nucleic acids Human genes 0.000 description 7
- 108020004707 nucleic acids Proteins 0.000 description 7
- 108010015796 prolylisoleucine Proteins 0.000 description 7
- 108010090894 prolylleucine Proteins 0.000 description 7
- 238000011002 quantification Methods 0.000 description 7
- 108010051110 tyrosyl-lysine Proteins 0.000 description 7
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 6
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 6
- FKJQNJCQTKUBCD-XPUUQOCRSA-N Gly-Ala-His Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O FKJQNJCQTKUBCD-XPUUQOCRSA-N 0.000 description 6
- MVORZMQFXBLMHM-QWRGUYRKSA-N Gly-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 MVORZMQFXBLMHM-QWRGUYRKSA-N 0.000 description 6
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 6
- CSTDQOOBZBAJKE-BWAGICSOSA-N His-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N)O CSTDQOOBZBAJKE-BWAGICSOSA-N 0.000 description 6
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 6
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 6
- KQFZKDITNUEVFJ-JYJNAYRXSA-N Leu-Phe-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=CC=C1 KQFZKDITNUEVFJ-JYJNAYRXSA-N 0.000 description 6
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 6
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 6
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 6
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 6
- 102100030680 SH3 and multiple ankyrin repeat domains protein 2 Human genes 0.000 description 6
- 101710067890 SHANK2 Proteins 0.000 description 6
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 6
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 6
- WDGDKHLSDIOXQC-ACRUOGEOSA-N Tyr-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WDGDKHLSDIOXQC-ACRUOGEOSA-N 0.000 description 6
- KLOZTPOXVVRVAQ-DZKIICNBSA-N Tyr-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KLOZTPOXVVRVAQ-DZKIICNBSA-N 0.000 description 6
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 6
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 6
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 6
- 230000007529 anxiety like behavior Effects 0.000 description 6
- 108010060035 arginylproline Proteins 0.000 description 6
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 6
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 6
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 6
- 238000007913 intrathecal administration Methods 0.000 description 6
- 239000002502 liposome Substances 0.000 description 6
- 108010038320 lysylphenylalanine Proteins 0.000 description 6
- 239000013612 plasmid Substances 0.000 description 6
- 108010004914 prolylarginine Proteins 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 230000001225 therapeutic effect Effects 0.000 description 6
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 5
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 5
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 5
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 5
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 5
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 5
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 5
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 5
- CRNKLABLTICXDV-GUBZILKMSA-N Asp-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N CRNKLABLTICXDV-GUBZILKMSA-N 0.000 description 5
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 5
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 5
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 5
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 5
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 5
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 5
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 5
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 5
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 5
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 5
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 5
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 5
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 5
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 5
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 5
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 5
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 5
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 5
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 5
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 5
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 5
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 5
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 5
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 5
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 5
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 5
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 5
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 5
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 5
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 5
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 5
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 5
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 5
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 5
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 5
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 5
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 5
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 5
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 5
- 108010029485 Protein Isoforms Proteins 0.000 description 5
- 102000001708 Protein Isoforms Human genes 0.000 description 5
- 101710184528 Scaffolding protein Proteins 0.000 description 5
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 5
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 5
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 5
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 5
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 5
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 5
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 5
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 5
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 5
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 5
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 5
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 5
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 5
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 5
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 5
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 5
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 5
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 5
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 5
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 5
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 5
- 108010038633 aspartylglutamate Proteins 0.000 description 5
- 230000006736 behavioral deficit Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 5
- 238000007917 intracranial administration Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- -1 microdeletions Proteins 0.000 description 5
- 238000001543 one-way ANOVA Methods 0.000 description 5
- 238000012346 open field test Methods 0.000 description 5
- 108010084572 phenylalanyl-valine Proteins 0.000 description 5
- 238000010825 rotarod performance test Methods 0.000 description 5
- 230000003956 synaptic plasticity Effects 0.000 description 5
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 5
- XWTNPSHCJMZAHQ-QMMMGPOBSA-N 2-[[2-[[2-[[(2s)-2-amino-4-methylpentanoyl]amino]acetyl]amino]acetyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(=O)NCC(O)=O XWTNPSHCJMZAHQ-QMMMGPOBSA-N 0.000 description 4
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 4
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 4
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 4
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 4
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 4
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 4
- WJRXVTCKASUIFF-FXQIFTODSA-N Ala-Cys-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WJRXVTCKASUIFF-FXQIFTODSA-N 0.000 description 4
- DUMYKLNEYCJLQK-UHFFFAOYSA-N Ala-Gln-Gln-His Chemical compound CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(=O)NC(C(O)=O)CC1=CN=CN1 DUMYKLNEYCJLQK-UHFFFAOYSA-N 0.000 description 4
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 4
- KMGOBAQSCKTBGD-DLOVCJGASA-N Ala-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CN=CN1 KMGOBAQSCKTBGD-DLOVCJGASA-N 0.000 description 4
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 4
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 4
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 4
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 4
- CLOMBHBBUKAUBP-LSJOCFKGSA-N Ala-Val-His Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N CLOMBHBBUKAUBP-LSJOCFKGSA-N 0.000 description 4
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 4
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 4
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 4
- UAOSDDXCTBIPCA-QXEWZRGKSA-N Arg-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UAOSDDXCTBIPCA-QXEWZRGKSA-N 0.000 description 4
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 4
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 4
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 4
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 4
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 4
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 4
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 4
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 4
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 4
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 4
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 4
- YSYTWUMRHSFODC-QWRGUYRKSA-N Asn-Tyr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O YSYTWUMRHSFODC-QWRGUYRKSA-N 0.000 description 4
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 4
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 4
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 4
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 4
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 4
- NZWDWXSWUQCNMG-GARJFASQSA-N Asp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)C(=O)O NZWDWXSWUQCNMG-GARJFASQSA-N 0.000 description 4
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 4
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 4
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 4
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 4
- AMRLSQGGERHDHJ-FXQIFTODSA-N Cys-Ala-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMRLSQGGERHDHJ-FXQIFTODSA-N 0.000 description 4
- YFXFOZPXVFPBDH-VZFHVOOUSA-N Cys-Ala-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)CS)C(O)=O YFXFOZPXVFPBDH-VZFHVOOUSA-N 0.000 description 4
- ISWAQPWFWKGCAL-ACZMJKKPSA-N Cys-Cys-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISWAQPWFWKGCAL-ACZMJKKPSA-N 0.000 description 4
- ABLJDBFJPUWQQB-DCAQKATOSA-N Cys-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N ABLJDBFJPUWQQB-DCAQKATOSA-N 0.000 description 4
- DQUWSUWXPWGTQT-DCAQKATOSA-N Cys-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CS DQUWSUWXPWGTQT-DCAQKATOSA-N 0.000 description 4
- 102100031246 Disks large-associated protein 3 Human genes 0.000 description 4
- 108050003186 Disks large-associated protein 3 Proteins 0.000 description 4
- DLOHWQXXGMEZDW-CIUDSAMLSA-N Gln-Arg-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DLOHWQXXGMEZDW-CIUDSAMLSA-N 0.000 description 4
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 4
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 4
- LTXLIIZACMCQTO-GUBZILKMSA-N Gln-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LTXLIIZACMCQTO-GUBZILKMSA-N 0.000 description 4
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 4
- JNVGVECJCOZHCN-DRZSPHRISA-N Gln-Phe-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O JNVGVECJCOZHCN-DRZSPHRISA-N 0.000 description 4
- OUBUHIODTNUUTC-WDCWCFNPSA-N Gln-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OUBUHIODTNUUTC-WDCWCFNPSA-N 0.000 description 4
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 4
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 4
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 4
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 4
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 4
- RTOOAKXIJADOLL-GUBZILKMSA-N Glu-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N RTOOAKXIJADOLL-GUBZILKMSA-N 0.000 description 4
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 4
- BRKUZSLQMPNVFN-SRVKXCTJSA-N Glu-His-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BRKUZSLQMPNVFN-SRVKXCTJSA-N 0.000 description 4
- BKRQSECBKKCCKW-HVTMNAMFSA-N Glu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BKRQSECBKKCCKW-HVTMNAMFSA-N 0.000 description 4
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 4
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 4
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 4
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 4
- 102100022630 Glutamate receptor ionotropic, NMDA 2B Human genes 0.000 description 4
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 4
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 4
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 4
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 4
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 4
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 4
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 4
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 4
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 4
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 4
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 4
- PYFHPYDQHCEVIT-KBPBESRZSA-N Gly-Trp-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O PYFHPYDQHCEVIT-KBPBESRZSA-N 0.000 description 4
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 4
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 4
- ZIMTWPHIKZEHSE-UWVGGRQHSA-N His-Arg-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O ZIMTWPHIKZEHSE-UWVGGRQHSA-N 0.000 description 4
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 4
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 4
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 4
- UWSMZKRTOZEGDD-CUJWVEQBSA-N His-Thr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O UWSMZKRTOZEGDD-CUJWVEQBSA-N 0.000 description 4
- 101000821100 Homo sapiens Synapsin-1 Proteins 0.000 description 4
- LOXMWQOKYBGCHF-JBDRJPRFSA-N Ile-Cys-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O LOXMWQOKYBGCHF-JBDRJPRFSA-N 0.000 description 4
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 4
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 4
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 4
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 4
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 4
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 4
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 4
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 4
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 4
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 4
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 4
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 4
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 4
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 4
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 4
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 4
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 4
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 4
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 4
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 4
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 4
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 4
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 4
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 4
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 4
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 4
- IIPHCNKHEZYSNE-DCAQKATOSA-N Met-Arg-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O IIPHCNKHEZYSNE-DCAQKATOSA-N 0.000 description 4
- FJVJLMZUIGMFFU-BQBZGAKWSA-N Met-Asp-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FJVJLMZUIGMFFU-BQBZGAKWSA-N 0.000 description 4
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 4
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 4
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 4
- MPGJIHFJCXTVEX-KKUMJFAQSA-N Phe-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O MPGJIHFJCXTVEX-KKUMJFAQSA-N 0.000 description 4
- IWRZUGHCHFZYQZ-UFYCRDLUSA-N Phe-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 IWRZUGHCHFZYQZ-UFYCRDLUSA-N 0.000 description 4
- XEXSSIBQYNKFBX-KBPBESRZSA-N Phe-Gly-His Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 XEXSSIBQYNKFBX-KBPBESRZSA-N 0.000 description 4
- KZRQONDKKJCAOL-DKIMLUQUSA-N Phe-Leu-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZRQONDKKJCAOL-DKIMLUQUSA-N 0.000 description 4
- OAOLATANIHTNCZ-IHRRRGAJSA-N Phe-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N OAOLATANIHTNCZ-IHRRRGAJSA-N 0.000 description 4
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 4
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 4
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 4
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 4
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 4
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 4
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 4
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 4
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 4
- 108010038912 Retinoid X Receptors Proteins 0.000 description 4
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 4
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 4
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 4
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 4
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 4
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 4
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 4
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 4
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 4
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 4
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 4
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 4
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 4
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 4
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 4
- FKIGTIXHSRNKJU-IXOXFDKPSA-N Thr-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CN=CN1 FKIGTIXHSRNKJU-IXOXFDKPSA-N 0.000 description 4
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 4
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 4
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 4
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 4
- BRBCKMMXKONBAA-KWBADKCTSA-N Trp-Ala-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 BRBCKMMXKONBAA-KWBADKCTSA-N 0.000 description 4
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 4
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 4
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 4
- JHORGUYURUBVOM-KKUMJFAQSA-N Tyr-His-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O JHORGUYURUBVOM-KKUMJFAQSA-N 0.000 description 4
- VKYDVKAKGDNZED-STECZYCISA-N Tyr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N VKYDVKAKGDNZED-STECZYCISA-N 0.000 description 4
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 4
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 4
- IWZYXFRGWKEKBJ-GVXVVHGQSA-N Val-Gln-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IWZYXFRGWKEKBJ-GVXVVHGQSA-N 0.000 description 4
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 4
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 4
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 4
- BMOFUVHDBROBSE-DCAQKATOSA-N Val-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N BMOFUVHDBROBSE-DCAQKATOSA-N 0.000 description 4
- 108010045514 alpha-lactorphin Proteins 0.000 description 4
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 4
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 4
- 108010036533 arginylvaline Proteins 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000003501 co-culture Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000002964 excitative effect Effects 0.000 description 4
- 230000001605 fetal effect Effects 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 108010028295 histidylhistidine Proteins 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 4
- 108010000761 leucylarginine Proteins 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 4
- 230000001537 neural effect Effects 0.000 description 4
- 239000008194 pharmaceutical composition Substances 0.000 description 4
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 4
- 108010073101 phenylalanylleucine Proteins 0.000 description 4
- 108010079317 prolyl-tyrosine Proteins 0.000 description 4
- 108010070643 prolylglutamic acid Proteins 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 230000004617 sleep duration Effects 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 230000002269 spontaneous effect Effects 0.000 description 4
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 4
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 4
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 4
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 3
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 3
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 3
- SKHCUBQVZJHOFM-NAKRPEOUSA-N Ala-Arg-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SKHCUBQVZJHOFM-NAKRPEOUSA-N 0.000 description 3
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 3
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 3
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 3
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 3
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 3
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 3
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 3
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 3
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 3
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 3
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 3
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 3
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 3
- YFHATWYGAAXQCF-JYJNAYRXSA-N Arg-Pro-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YFHATWYGAAXQCF-JYJNAYRXSA-N 0.000 description 3
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 3
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 3
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 3
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 3
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 3
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 3
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 3
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 3
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 3
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 3
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 3
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 3
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 3
- 241000282693 Cercopithecidae Species 0.000 description 3
- NAPULYCVEVVFRB-HEIBUPTGSA-N Cys-Thr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CS NAPULYCVEVVFRB-HEIBUPTGSA-N 0.000 description 3
- VIOQRFNAZDMVLO-NRPADANISA-N Cys-Val-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIOQRFNAZDMVLO-NRPADANISA-N 0.000 description 3
- 108010010803 Gelatin Proteins 0.000 description 3
- GFLNKSQHOBOMNM-AVGNSLFASA-N Gln-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GFLNKSQHOBOMNM-AVGNSLFASA-N 0.000 description 3
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 3
- QDXMSSWCEVYOLZ-SZMVWBNQSA-N Gln-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QDXMSSWCEVYOLZ-SZMVWBNQSA-N 0.000 description 3
- XZLLTYBONVKGLO-SDDRHHMPSA-N Gln-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XZLLTYBONVKGLO-SDDRHHMPSA-N 0.000 description 3
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 3
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 3
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 3
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 3
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 3
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 3
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 3
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 3
- ITVBKCZZLJUUHI-HTUGSXCWSA-N Glu-Phe-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ITVBKCZZLJUUHI-HTUGSXCWSA-N 0.000 description 3
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 3
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 3
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 3
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 3
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 3
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 3
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 3
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 3
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 3
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 3
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 3
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 3
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 3
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 3
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 3
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 3
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 3
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 3
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 3
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 3
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 3
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 3
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 3
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 3
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 3
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 3
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 3
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 3
- UCDWNBFOZCZSNV-AVGNSLFASA-N His-Arg-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O UCDWNBFOZCZSNV-AVGNSLFASA-N 0.000 description 3
- AKEDPWJFQULLPE-IUCAKERBSA-N His-Glu-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O AKEDPWJFQULLPE-IUCAKERBSA-N 0.000 description 3
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 3
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 3
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 3
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 3
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 3
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 3
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 3
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 3
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 3
- KUEVMUXNILMJTK-JYJNAYRXSA-N Leu-Gln-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KUEVMUXNILMJTK-JYJNAYRXSA-N 0.000 description 3
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 3
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 3
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 3
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 3
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 3
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 3
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 3
- PFZWARWVRNTPBR-IHPCNDPISA-N Lys-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N PFZWARWVRNTPBR-IHPCNDPISA-N 0.000 description 3
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 3
- DYJOORGDQIGZAS-DCAQKATOSA-N Lys-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N DYJOORGDQIGZAS-DCAQKATOSA-N 0.000 description 3
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 3
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 3
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 3
- 102000034570 NR1 subfamily Human genes 0.000 description 3
- 108020001305 NR1 subfamily Proteins 0.000 description 3
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 3
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 3
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 3
- YTGGLKWSVIRECD-JBACZVJFSA-N Phe-Trp-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 YTGGLKWSVIRECD-JBACZVJFSA-N 0.000 description 3
- APZNYJFGVAGFCF-JYJNAYRXSA-N Phe-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccccc1)C(C)C)C(O)=O APZNYJFGVAGFCF-JYJNAYRXSA-N 0.000 description 3
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 3
- CQZNGNCAIXMAIQ-UBHSHLNASA-N Pro-Ala-Phe Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O CQZNGNCAIXMAIQ-UBHSHLNASA-N 0.000 description 3
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 3
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 3
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 3
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 3
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 3
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 3
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 3
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 3
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 3
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 3
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 3
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 3
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 3
- 241000283984 Rodentia Species 0.000 description 3
- 101150068315 Scn2a gene Proteins 0.000 description 3
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 3
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 3
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 3
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 3
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 3
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 3
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 3
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 3
- WGDYNRCOQRERLZ-KKUMJFAQSA-N Ser-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N WGDYNRCOQRERLZ-KKUMJFAQSA-N 0.000 description 3
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 3
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 3
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 3
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 3
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 3
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 3
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 3
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 3
- HOJPPPKZWFRTHJ-PJODQICGSA-N Trp-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HOJPPPKZWFRTHJ-PJODQICGSA-N 0.000 description 3
- VMBBTANKMSRJSS-JSGCOSHPSA-N Trp-Glu-Gly Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VMBBTANKMSRJSS-JSGCOSHPSA-N 0.000 description 3
- MNMYOSZWCKYEDI-JRQIVUDYSA-N Tyr-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MNMYOSZWCKYEDI-JRQIVUDYSA-N 0.000 description 3
- QUILOGWWLXMSAT-IHRRRGAJSA-N Tyr-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QUILOGWWLXMSAT-IHRRRGAJSA-N 0.000 description 3
- VXFXIBCCVLJCJT-JYJNAYRXSA-N Tyr-Pro-Pro Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N1CCC[C@H]1C(O)=O VXFXIBCCVLJCJT-JYJNAYRXSA-N 0.000 description 3
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 3
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 3
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 3
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 3
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 3
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 3
- GMOLURHJBLOBFW-ONGXEEELSA-N Val-Gly-His Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMOLURHJBLOBFW-ONGXEEELSA-N 0.000 description 3
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 3
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 3
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 3
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 3
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 3
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 3
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 3
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 230000001668 ameliorated effect Effects 0.000 description 3
- 108010068380 arginylarginine Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 210000004958 brain cell Anatomy 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 230000001054 cortical effect Effects 0.000 description 3
- 210000001787 dendrite Anatomy 0.000 description 3
- 210000003520 dendritic spine Anatomy 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 3
- 230000004064 dysfunction Effects 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 230000001037 epileptic effect Effects 0.000 description 3
- 229920000159 gelatin Polymers 0.000 description 3
- 239000008273 gelatin Substances 0.000 description 3
- 235000019322 gelatine Nutrition 0.000 description 3
- 235000011852 gelatine desserts Nutrition 0.000 description 3
- 238000001476 gene delivery Methods 0.000 description 3
- 230000000848 glutamatergic effect Effects 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 108010091871 leucylmethionine Proteins 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 108010012988 lysyl-glutamyl-aspartyl-glycine Proteins 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 239000002088 nanocapsule Substances 0.000 description 3
- 239000002105 nanoparticle Substances 0.000 description 3
- 238000004806 packaging method and process Methods 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 108010018625 phenylalanylarginine Proteins 0.000 description 3
- 239000003755 preservative agent Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 3
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 3
- 108020001580 protein domains Proteins 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 108010048818 seryl-histidine Proteins 0.000 description 3
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 3
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 206010040882 skin lesion Diseases 0.000 description 3
- 231100000444 skin lesion Toxicity 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 230000000638 stimulation Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000003977 synaptic function Effects 0.000 description 3
- 238000011269 treatment regimen Methods 0.000 description 3
- 108700004896 tripeptide FEG Proteins 0.000 description 3
- 108010038745 tryptophylglycine Proteins 0.000 description 3
- 108010020532 tyrosyl-proline Proteins 0.000 description 3
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 2
- 241000649046 Adeno-associated virus 11 Species 0.000 description 2
- SDMAQFGBPOJFOM-GUBZILKMSA-N Ala-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SDMAQFGBPOJFOM-GUBZILKMSA-N 0.000 description 2
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 2
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 2
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 2
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 2
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 2
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 2
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 2
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 2
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 2
- BHTBAVZSZCQZPT-GUBZILKMSA-N Ala-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N BHTBAVZSZCQZPT-GUBZILKMSA-N 0.000 description 2
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 2
- IDLBLNBDLCTPGC-HERUPUMHSA-N Ala-Trp-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CS)C(=O)O)N IDLBLNBDLCTPGC-HERUPUMHSA-N 0.000 description 2
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 2
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 2
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 2
- QEKBCDODJBBWHV-GUBZILKMSA-N Arg-Arg-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O QEKBCDODJBBWHV-GUBZILKMSA-N 0.000 description 2
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 2
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 2
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 2
- YFBGNGASPGRWEM-DCAQKATOSA-N Arg-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFBGNGASPGRWEM-DCAQKATOSA-N 0.000 description 2
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 2
- JTZUZBADHGISJD-SRVKXCTJSA-N Arg-His-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JTZUZBADHGISJD-SRVKXCTJSA-N 0.000 description 2
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 2
- XKDYWGLNSCNRGW-WDSOQIARSA-N Arg-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCN=C(N)N)CCCCN)C(O)=O)=CNC2=C1 XKDYWGLNSCNRGW-WDSOQIARSA-N 0.000 description 2
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 2
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 2
- 108010051330 Arg-Pro-Gly-Pro Proteins 0.000 description 2
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 2
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 2
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 2
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 2
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 2
- WQLJRNRLHWJIRW-KKUMJFAQSA-N Asn-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N)O WQLJRNRLHWJIRW-KKUMJFAQSA-N 0.000 description 2
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 2
- AEZCCDMZZJOGII-DCAQKATOSA-N Asn-Met-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O AEZCCDMZZJOGII-DCAQKATOSA-N 0.000 description 2
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 2
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 2
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 2
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 2
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 2
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 2
- LNENWJXDHCFVOF-DCAQKATOSA-N Asp-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N LNENWJXDHCFVOF-DCAQKATOSA-N 0.000 description 2
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 2
- SJLDOGLMVPHPLZ-IHRRRGAJSA-N Asp-Met-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SJLDOGLMVPHPLZ-IHRRRGAJSA-N 0.000 description 2
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 2
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 2
- QTIZKMMLNUMHHU-DCAQKATOSA-N Asp-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QTIZKMMLNUMHHU-DCAQKATOSA-N 0.000 description 2
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 2
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 2
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 2
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 2
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 2
- 208000036864 Attention deficit/hyperactivity disease Diseases 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 102000004219 Brain-derived neurotrophic factor Human genes 0.000 description 2
- 108090000715 Brain-derived neurotrophic factor Proteins 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- NUMFTVCBONFQIQ-DRZSPHRISA-N Gln-Ala-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NUMFTVCBONFQIQ-DRZSPHRISA-N 0.000 description 2
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 2
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 2
- BLOXULLYFRGYKZ-GUBZILKMSA-N Gln-Glu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BLOXULLYFRGYKZ-GUBZILKMSA-N 0.000 description 2
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 2
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 2
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 2
- GURIQZQSTBBHRV-SRVKXCTJSA-N Gln-Lys-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GURIQZQSTBBHRV-SRVKXCTJSA-N 0.000 description 2
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 2
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 2
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 2
- RCCDHXSRMWCOOY-GUBZILKMSA-N Glu-Arg-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCCDHXSRMWCOOY-GUBZILKMSA-N 0.000 description 2
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 2
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 2
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 2
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 2
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 2
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 2
- WIKMTDVSCUJIPJ-CIUDSAMLSA-N Glu-Ser-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WIKMTDVSCUJIPJ-CIUDSAMLSA-N 0.000 description 2
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 2
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 2
- 102000018899 Glutamate Receptors Human genes 0.000 description 2
- 108010027915 Glutamate Receptors Proteins 0.000 description 2
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 2
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 2
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 2
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 2
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 2
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 2
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 2
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 2
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 2
- JPWIMMUNWUKOAD-STQMWFEESA-N Gly-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN JPWIMMUNWUKOAD-STQMWFEESA-N 0.000 description 2
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 2
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 2
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 2
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 2
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 2
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 2
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 2
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 2
- UMRIXLHPZZIOML-OALUTQOASA-N Gly-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)CN UMRIXLHPZZIOML-OALUTQOASA-N 0.000 description 2
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 2
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 2
- PDSUIXMZYNURGI-AVGNSLFASA-N His-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 PDSUIXMZYNURGI-AVGNSLFASA-N 0.000 description 2
- UZZXGLOJRZKYEL-DJFWLOJKSA-N His-Asn-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UZZXGLOJRZKYEL-DJFWLOJKSA-N 0.000 description 2
- OSZUPUINVNPCOE-SDDRHHMPSA-N His-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O OSZUPUINVNPCOE-SDDRHHMPSA-N 0.000 description 2
- PQKCQZHAGILVIM-NKIYYHGXSA-N His-Glu-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O PQKCQZHAGILVIM-NKIYYHGXSA-N 0.000 description 2
- GUXQAPACZVVOKX-AVGNSLFASA-N His-Lys-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GUXQAPACZVVOKX-AVGNSLFASA-N 0.000 description 2
- IGBBXBFSLKRHJB-BZSNNMDCSA-N His-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 IGBBXBFSLKRHJB-BZSNNMDCSA-N 0.000 description 2
- YYOCMTFVGKDNQP-IHRRRGAJSA-N His-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N YYOCMTFVGKDNQP-IHRRRGAJSA-N 0.000 description 2
- WYSJPCTWSBJFCO-AVGNSLFASA-N His-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CN=CN1)N WYSJPCTWSBJFCO-AVGNSLFASA-N 0.000 description 2
- 108090000144 Human Proteins Proteins 0.000 description 2
- 102000003839 Human Proteins Human genes 0.000 description 2
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 2
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 2
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 2
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 2
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 2
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 2
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 2
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 2
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 2
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 2
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 2
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 2
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 2
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 2
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 2
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 2
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 2
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 2
- HOMFINRJHIIZNJ-HOCLYGCPSA-N Leu-Trp-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O HOMFINRJHIIZNJ-HOCLYGCPSA-N 0.000 description 2
- WBRJVRXEGQIDRK-XIRDDKMYSA-N Leu-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 WBRJVRXEGQIDRK-XIRDDKMYSA-N 0.000 description 2
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 2
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 2
- XOEDPXDZJHBQIX-ULQDDVLXSA-N Leu-Val-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XOEDPXDZJHBQIX-ULQDDVLXSA-N 0.000 description 2
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 2
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 2
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 2
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 2
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 2
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 2
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 2
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 2
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 2
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 2
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 2
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 2
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 2
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 2
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 2
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 2
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 2
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 2
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 2
- QFSYGUMEANRNJE-DCAQKATOSA-N Lys-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N QFSYGUMEANRNJE-DCAQKATOSA-N 0.000 description 2
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 2
- 241000282553 Macaca Species 0.000 description 2
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 2
- QXEVZBXTDTVPCP-GMOBBJLQSA-N Met-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCSC)N QXEVZBXTDTVPCP-GMOBBJLQSA-N 0.000 description 2
- GODBLDDYHFTUAH-CIUDSAMLSA-N Met-Asp-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O GODBLDDYHFTUAH-CIUDSAMLSA-N 0.000 description 2
- MVBZBRKNZVJEKK-DTWKUNHWSA-N Met-Gly-Pro Chemical compound CSCC[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N MVBZBRKNZVJEKK-DTWKUNHWSA-N 0.000 description 2
- WXXNVZMWHOLNRJ-AVGNSLFASA-N Met-Pro-Lys Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O WXXNVZMWHOLNRJ-AVGNSLFASA-N 0.000 description 2
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 2
- 108090000143 Mouse Proteins Proteins 0.000 description 2
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 2
- 208000021384 Obsessive-Compulsive disease Diseases 0.000 description 2
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 2
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 2
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 2
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 2
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 2
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 2
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 2
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 2
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 2
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 2
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 2
- OYEUSRAZOGIDBY-JYJNAYRXSA-N Pro-Arg-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OYEUSRAZOGIDBY-JYJNAYRXSA-N 0.000 description 2
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 2
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 2
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 2
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 2
- AJCRQOHDLCBHFA-SRVKXCTJSA-N Pro-His-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AJCRQOHDLCBHFA-SRVKXCTJSA-N 0.000 description 2
- IBGCFJDLCYTKPW-NAKRPEOUSA-N Pro-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 IBGCFJDLCYTKPW-NAKRPEOUSA-N 0.000 description 2
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 2
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 2
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 2
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 2
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 2
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 2
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 2
- ZTHYODDOHIVTJV-UHFFFAOYSA-N Propyl gallate Chemical compound CCCOC(=O)C1=CC(O)=C(O)C(O)=C1 ZTHYODDOHIVTJV-UHFFFAOYSA-N 0.000 description 2
- 108010079005 RDV peptide Proteins 0.000 description 2
- 108010064582 SAP90-PSD95 Associated Proteins Proteins 0.000 description 2
- 102000015266 SAP90-PSD95 Associated Proteins Human genes 0.000 description 2
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 2
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 2
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 2
- HEQPKICPPDOSIN-SRVKXCTJSA-N Ser-Asp-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HEQPKICPPDOSIN-SRVKXCTJSA-N 0.000 description 2
- UICKAKRRRBTILH-GUBZILKMSA-N Ser-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N UICKAKRRRBTILH-GUBZILKMSA-N 0.000 description 2
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 2
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 2
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 2
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 2
- RJHJPZQOMKCSTP-CIUDSAMLSA-N Ser-His-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O RJHJPZQOMKCSTP-CIUDSAMLSA-N 0.000 description 2
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 2
- BEAFYHFQTOTVFS-VGDYDELISA-N Ser-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N BEAFYHFQTOTVFS-VGDYDELISA-N 0.000 description 2
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 2
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 2
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 2
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 2
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 2
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 2
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 2
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 2
- STIAINRLUUKYKM-WFBYXXMGSA-N Ser-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CO)=CNC2=C1 STIAINRLUUKYKM-WFBYXXMGSA-N 0.000 description 2
- RAHZWNYVWXNFOC-UHFFFAOYSA-N Sulphur dioxide Chemical compound O=S=O RAHZWNYVWXNFOC-UHFFFAOYSA-N 0.000 description 2
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 2
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 2
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 2
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 2
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 2
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 2
- ZBKDBZUTTXINIX-RWRJDSDZSA-N Thr-Ile-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZBKDBZUTTXINIX-RWRJDSDZSA-N 0.000 description 2
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 2
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 2
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 2
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 2
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 2
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 2
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 2
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 2
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 2
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 2
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 2
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 2
- MYNYCUXMIIWUNW-IEGACIPQSA-N Thr-Trp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MYNYCUXMIIWUNW-IEGACIPQSA-N 0.000 description 2
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 2
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 2
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 2
- BEWOXKJJMBKRQL-AAEUAGOBSA-N Trp-Gly-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N BEWOXKJJMBKRQL-AAEUAGOBSA-N 0.000 description 2
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 2
- IKUMWSDCGQVGHC-UMPQAUOISA-N Trp-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O IKUMWSDCGQVGHC-UMPQAUOISA-N 0.000 description 2
- WSMVEHPVOYXPAQ-XIRDDKMYSA-N Trp-Ser-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N WSMVEHPVOYXPAQ-XIRDDKMYSA-N 0.000 description 2
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 2
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 2
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 2
- RGYCVIZZTUBSSG-JYJNAYRXSA-N Tyr-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O RGYCVIZZTUBSSG-JYJNAYRXSA-N 0.000 description 2
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 2
- IVXJODPZRWHCCR-JYJNAYRXSA-N Val-Arg-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IVXJODPZRWHCCR-JYJNAYRXSA-N 0.000 description 2
- QGFPYRPIUXBYGR-YDHLFZDLSA-N Val-Asn-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N QGFPYRPIUXBYGR-YDHLFZDLSA-N 0.000 description 2
- FRUYSSRPJXNRRB-GUBZILKMSA-N Val-Cys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FRUYSSRPJXNRRB-GUBZILKMSA-N 0.000 description 2
- LMSBRIVOCYOKMU-NRPADANISA-N Val-Gln-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N LMSBRIVOCYOKMU-NRPADANISA-N 0.000 description 2
- PGBJAZDAEWPDAA-NHCYSSNCSA-N Val-Gln-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N PGBJAZDAEWPDAA-NHCYSSNCSA-N 0.000 description 2
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 2
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 2
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 2
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 2
- OJPRSVJGNCAKQX-SRVKXCTJSA-N Val-Met-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OJPRSVJGNCAKQX-SRVKXCTJSA-N 0.000 description 2
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 2
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 2
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 2
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 2
- GTACFKZDQFTVAI-STECZYCISA-N Val-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 GTACFKZDQFTVAI-STECZYCISA-N 0.000 description 2
- 238000002679 ablation Methods 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 230000036982 action potential Effects 0.000 description 2
- 239000004480 active ingredient Substances 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 108010087049 alanyl-alanyl-prolyl-valine Proteins 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 2
- 108010066988 asparaginyl-alanyl-glycyl-alanine Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 208000015802 attention deficit-hyperactivity disease Diseases 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 210000001638 cerebellum Anatomy 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- OSASVXMJTNOKOY-UHFFFAOYSA-N chlorobutanol Chemical compound CC(C)(O)C(Cl)(Cl)Cl OSASVXMJTNOKOY-UHFFFAOYSA-N 0.000 description 2
- 231100000867 compulsive behavior Toxicity 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- CBOQJANXLMLOSS-UHFFFAOYSA-N ethyl vanillin Chemical compound CCOC1=CC(C=O)=CC=C1O CBOQJANXLMLOSS-UHFFFAOYSA-N 0.000 description 2
- 230000021824 exploration behavior Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 235000011187 glycerol Nutrition 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 2
- 108010043293 glycyl-prolyl-glycyl-glycine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 230000021061 grooming behavior Effects 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 210000004295 hippocampal neuron Anatomy 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 230000003188 neurobehavioral effect Effects 0.000 description 2
- 230000001123 neurodevelopmental effect Effects 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 2
- 108010024607 phenylalanylalanine Proteins 0.000 description 2
- 108010025488 pinealon Proteins 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 230000001124 posttranscriptional effect Effects 0.000 description 2
- 230000003518 presynaptic effect Effects 0.000 description 2
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 230000000384 rearing effect Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000011273 social behavior Effects 0.000 description 2
- 239000003381 stabilizer Substances 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 208000011580 syndromic disease Diseases 0.000 description 2
- 108700029760 synthetic LTSP Proteins 0.000 description 2
- 238000012385 systemic delivery Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 238000007492 two-way ANOVA Methods 0.000 description 2
- 108010078580 tyrosylleucine Proteins 0.000 description 2
- 238000002604 ultrasonography Methods 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- NBDYVTYCSKWBQI-ATIWLJMLSA-N (2s)-1-[(2s)-1-[(2s)-1-[(2s)-1-[(2s)-2-amino-3-hydroxypropanoyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylic acid Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(=O)N2[C@@H](CCC2)C(=O)N2[C@@H](CCC2)C(O)=O)CCC1 NBDYVTYCSKWBQI-ATIWLJMLSA-N 0.000 description 1
- CEHZCZCQHUNAJF-AVGNSLFASA-N (2s)-1-[2-[[(2s)-1-[(2s)-2-amino-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N1[C@H](C(O)=O)CCC1 CEHZCZCQHUNAJF-AVGNSLFASA-N 0.000 description 1
- NTUPOKHATNSWCY-PMPSAXMXSA-N (2s)-2-[[(2s)-1-[(2r)-2-amino-3-phenylpropanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound C([C@@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=CC=C1 NTUPOKHATNSWCY-PMPSAXMXSA-N 0.000 description 1
- PIDRBUDUWHBYSR-UHFFFAOYSA-N 1-[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O PIDRBUDUWHBYSR-UHFFFAOYSA-N 0.000 description 1
- CHHHXKFHOYLYRE-UHFFFAOYSA-M 2,4-Hexadienoic acid, potassium salt (1:1), (2E,4E)- Chemical compound [K+].CC=CC=CC([O-])=O CHHHXKFHOYLYRE-UHFFFAOYSA-M 0.000 description 1
- WXNZTHHGJRFXKQ-UHFFFAOYSA-N 4-chlorophenol Chemical compound OC1=CC=C(Cl)C=C1 WXNZTHHGJRFXKQ-UHFFFAOYSA-N 0.000 description 1
- 108010044087 AS-I toxin Proteins 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000649047 Adeno-associated virus 12 Species 0.000 description 1
- 241000958487 Adeno-associated virus 3B Species 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- WQVYAWIMAWTGMW-ZLUOBGJFSA-N Ala-Asp-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WQVYAWIMAWTGMW-ZLUOBGJFSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 1
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 1
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 1
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 1
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 1
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- AETQNIIFKCMVHP-UVBJJODRSA-N Ala-Trp-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AETQNIIFKCMVHP-UVBJJODRSA-N 0.000 description 1
- WZGZDOXCDLLTHE-SYWGBEHUSA-N Ala-Trp-Ile Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 WZGZDOXCDLLTHE-SYWGBEHUSA-N 0.000 description 1
- TVUFMYKTYXTRPY-HERUPUMHSA-N Ala-Trp-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O TVUFMYKTYXTRPY-HERUPUMHSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 102000010565 Apoptosis Regulatory Proteins Human genes 0.000 description 1
- 108010063104 Apoptosis Regulatory Proteins Proteins 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- QIWYWCYNUMJBTC-CIUDSAMLSA-N Arg-Cys-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O QIWYWCYNUMJBTC-CIUDSAMLSA-N 0.000 description 1
- RYRQZJVFDVWURI-SRVKXCTJSA-N Arg-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N RYRQZJVFDVWURI-SRVKXCTJSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- OBFTYSPXDRROQO-SRVKXCTJSA-N Arg-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCN=C(N)N OBFTYSPXDRROQO-SRVKXCTJSA-N 0.000 description 1
- MTANSHNQTWPZKP-KKUMJFAQSA-N Arg-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O MTANSHNQTWPZKP-KKUMJFAQSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 1
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 1
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 1
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- QEHMMRSQJMOYNO-DCAQKATOSA-N Arg-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QEHMMRSQJMOYNO-DCAQKATOSA-N 0.000 description 1
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 1
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 1
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 1
- OISWSORSLQOGFV-AVGNSLFASA-N Arg-Met-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N OISWSORSLQOGFV-AVGNSLFASA-N 0.000 description 1
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 1
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 1
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 1
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 1
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 1
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 1
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 1
- JQHASVQBAKRJKD-GUBZILKMSA-N Arg-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JQHASVQBAKRJKD-GUBZILKMSA-N 0.000 description 1
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 1
- GWNMUVANAWDZTI-YUMQZZPRSA-N Asn-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GWNMUVANAWDZTI-YUMQZZPRSA-N 0.000 description 1
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 1
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- DOURAOODTFJRIC-CIUDSAMLSA-N Asn-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N DOURAOODTFJRIC-CIUDSAMLSA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- HBUJSDCLZCXXCW-YDHLFZDLSA-N Asn-Val-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HBUJSDCLZCXXCW-YDHLFZDLSA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 1
- DBWYWXNMZZYIRY-LPEHRKFASA-N Asp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O DBWYWXNMZZYIRY-LPEHRKFASA-N 0.000 description 1
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 1
- VBVKSAFJPVXMFJ-CIUDSAMLSA-N Asp-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N VBVKSAFJPVXMFJ-CIUDSAMLSA-N 0.000 description 1
- PJERDVUTUDZPGX-ZKWXMUAHSA-N Asp-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC(O)=O PJERDVUTUDZPGX-ZKWXMUAHSA-N 0.000 description 1
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- SWTQDYFZVOJVLL-KKUMJFAQSA-N Asp-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N)O SWTQDYFZVOJVLL-KKUMJFAQSA-N 0.000 description 1
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 1
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 1
- SARSTIZOZFBDOM-FXQIFTODSA-N Asp-Met-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O SARSTIZOZFBDOM-FXQIFTODSA-N 0.000 description 1
- APXVSPGLYXFFSD-AJNGGQMLSA-N Asp-Phe-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)N)CC1=CC=CC=C1 APXVSPGLYXFFSD-AJNGGQMLSA-N 0.000 description 1
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 1
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 1
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 101100495845 Caenorhabditis elegans cht-1 gene Proteins 0.000 description 1
- 101100495842 Caenorhabditis elegans cht-3 gene Proteins 0.000 description 1
- 101100441244 Caenorhabditis elegans csp-1 gene Proteins 0.000 description 1
- 101100441252 Caenorhabditis elegans csp-2 gene Proteins 0.000 description 1
- 101100222092 Caenorhabditis elegans csp-3 gene Proteins 0.000 description 1
- 102100033093 Calcium/calmodulin-dependent protein kinase type II subunit alpha Human genes 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 208000033810 Choroidal dystrophy Diseases 0.000 description 1
- 208000027691 Conduct disease Diseases 0.000 description 1
- 206010010947 Coordination abnormal Diseases 0.000 description 1
- XGIAHEUULGOZHH-GUBZILKMSA-N Cys-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N XGIAHEUULGOZHH-GUBZILKMSA-N 0.000 description 1
- CHRCKSPMGYDLIA-SRVKXCTJSA-N Cys-Phe-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O CHRCKSPMGYDLIA-SRVKXCTJSA-N 0.000 description 1
- KDXKERNSBIXSRK-RXMQYKEDSA-N D-lysine Chemical compound NCCCC[C@@H](N)C(O)=O KDXKERNSBIXSRK-RXMQYKEDSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 208000012239 Developmental disease Diseases 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 102100024117 Disks large homolog 2 Human genes 0.000 description 1
- 102100035426 DnaJ homolog subfamily B member 7 Human genes 0.000 description 1
- 201000010374 Down Syndrome Diseases 0.000 description 1
- 101100285903 Drosophila melanogaster Hsc70-2 gene Proteins 0.000 description 1
- 101100178718 Drosophila melanogaster Hsc70-4 gene Proteins 0.000 description 1
- 101100178723 Drosophila melanogaster Hsc70-5 gene Proteins 0.000 description 1
- 206010049669 Dyscalculia Diseases 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 208000001914 Fragile X syndrome Diseases 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 102000034615 Glial cell line-derived neurotrophic factor Human genes 0.000 description 1
- 108091010837 Glial cell line-derived neurotrophic factor Proteins 0.000 description 1
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 1
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 1
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 1
- XOKGKOQWADCLFQ-GARJFASQSA-N Gln-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XOKGKOQWADCLFQ-GARJFASQSA-N 0.000 description 1
- MQANCSUBSBJNLU-KKUMJFAQSA-N Gln-Arg-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQANCSUBSBJNLU-KKUMJFAQSA-N 0.000 description 1
- JFSNBQJNDMXMQF-XHNCKOQMSA-N Gln-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JFSNBQJNDMXMQF-XHNCKOQMSA-N 0.000 description 1
- OFPWCBGRYAOLMU-AVGNSLFASA-N Gln-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OFPWCBGRYAOLMU-AVGNSLFASA-N 0.000 description 1
- LPJVZYMINRLCQA-AVGNSLFASA-N Gln-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N LPJVZYMINRLCQA-AVGNSLFASA-N 0.000 description 1
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 1
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 1
- LUGUNEGJNDEBLU-DCAQKATOSA-N Gln-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LUGUNEGJNDEBLU-DCAQKATOSA-N 0.000 description 1
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 1
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 1
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- ZKONLKQGTNVAPR-DCAQKATOSA-N Glu-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N ZKONLKQGTNVAPR-DCAQKATOSA-N 0.000 description 1
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 1
- UCZXXMREFIETQW-AVGNSLFASA-N Glu-Tyr-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O UCZXXMREFIETQW-AVGNSLFASA-N 0.000 description 1
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 1
- 102100029458 Glutamate receptor ionotropic, NMDA 2A Human genes 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 1
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 1
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 1
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 1
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 1
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 1
- KTSZUNRRYXPZTK-BQBZGAKWSA-N Gly-Gln-Glu Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KTSZUNRRYXPZTK-BQBZGAKWSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- UPADCCSMVOQAGF-LBPRGKRZSA-N Gly-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)CN)C(O)=O)=CNC2=C1 UPADCCSMVOQAGF-LBPRGKRZSA-N 0.000 description 1
- AYBKPDHHVADEDA-YUMQZZPRSA-N Gly-His-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O AYBKPDHHVADEDA-YUMQZZPRSA-N 0.000 description 1
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- FCKPEGOCSVZPNC-WHOFXGATSA-N Gly-Ile-Phe Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FCKPEGOCSVZPNC-WHOFXGATSA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- OJNZVYSGVYLQIN-BQBZGAKWSA-N Gly-Met-Asp Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O OJNZVYSGVYLQIN-BQBZGAKWSA-N 0.000 description 1
- NZOAFWHVAFJERA-OALUTQOASA-N Gly-Phe-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NZOAFWHVAFJERA-OALUTQOASA-N 0.000 description 1
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 1
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 1
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 1
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 1
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 1
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 1
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 208000016621 Hearing disease Diseases 0.000 description 1
- AWASVTXPTOLPPP-MBLNEYKQSA-N His-Ala-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWASVTXPTOLPPP-MBLNEYKQSA-N 0.000 description 1
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 1
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 1
- YOSQCYUFZGPIPC-PBCZWWQYSA-N His-Asp-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YOSQCYUFZGPIPC-PBCZWWQYSA-N 0.000 description 1
- VHHYJBSXXMPQGZ-AVGNSLFASA-N His-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N VHHYJBSXXMPQGZ-AVGNSLFASA-N 0.000 description 1
- HQKADFMLECZIQJ-HVTMNAMFSA-N His-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N HQKADFMLECZIQJ-HVTMNAMFSA-N 0.000 description 1
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 1
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 1
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- 101000944249 Homo sapiens Calcium/calmodulin-dependent protein kinase type II subunit alpha Proteins 0.000 description 1
- 101001053980 Homo sapiens Disks large homolog 2 Proteins 0.000 description 1
- 101000804114 Homo sapiens DnaJ homolog subfamily B member 7 Proteins 0.000 description 1
- 101000979001 Homo sapiens Methionine aminopeptidase 2 Proteins 0.000 description 1
- 101000969087 Homo sapiens Microtubule-associated protein 2 Proteins 0.000 description 1
- 101150090950 Hsc70-1 gene Proteins 0.000 description 1
- 206010020880 Hypertrophy Diseases 0.000 description 1
- 208000001953 Hypotension Diseases 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 1
- LVQDUPQUJZWKSU-PYJNHQTQSA-N Ile-Arg-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LVQDUPQUJZWKSU-PYJNHQTQSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 1
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 1
- UASTVUQJMLZWGG-PEXQALLHSA-N Ile-His-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N UASTVUQJMLZWGG-PEXQALLHSA-N 0.000 description 1
- KOPIAUWNLKKELG-SIGLWIIPSA-N Ile-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N KOPIAUWNLKKELG-SIGLWIIPSA-N 0.000 description 1
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 1
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- MASWXTFJVNRZPT-NAKRPEOUSA-N Ile-Met-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)O)N MASWXTFJVNRZPT-NAKRPEOUSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 1
- PRTZQMBYUZFSFA-XEGUGMAKSA-N Ile-Tyr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)NCC(=O)O)N PRTZQMBYUZFSFA-XEGUGMAKSA-N 0.000 description 1
- ZSESFIFAYQEKRD-CYDGBPFRSA-N Ile-Val-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N ZSESFIFAYQEKRD-CYDGBPFRSA-N 0.000 description 1
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 1
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 208000020358 Learning disease Diseases 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 1
- QLQHWWCSCLZUMA-KKUMJFAQSA-N Leu-Asp-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 1
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 1
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- QPXBPQUGXHURGP-UWVGGRQHSA-N Leu-Gly-Met Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N QPXBPQUGXHURGP-UWVGGRQHSA-N 0.000 description 1
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 1
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 1
- BTSXLXFPMZXVPR-DLOVCJGASA-N Lys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BTSXLXFPMZXVPR-DLOVCJGASA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 1
- SVSQSPICRKBMSZ-SRVKXCTJSA-N Lys-Pro-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O SVSQSPICRKBMSZ-SRVKXCTJSA-N 0.000 description 1
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 1
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 1
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- 208000036626 Mental retardation Diseases 0.000 description 1
- YLLWCSDBVGZLOW-CIUDSAMLSA-N Met-Gln-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O YLLWCSDBVGZLOW-CIUDSAMLSA-N 0.000 description 1
- WPTDJKDGICUFCP-XUXIUFHCSA-N Met-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCSC)N WPTDJKDGICUFCP-XUXIUFHCSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- MSSJHBAKDDIRMJ-SRVKXCTJSA-N Met-Lys-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MSSJHBAKDDIRMJ-SRVKXCTJSA-N 0.000 description 1
- BQHLZUMZOXUWNU-DCAQKATOSA-N Met-Pro-Glu Chemical compound CSCC[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BQHLZUMZOXUWNU-DCAQKATOSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- 102000016193 Metabotropic glutamate receptors Human genes 0.000 description 1
- 108010010914 Metabotropic glutamate receptors Proteins 0.000 description 1
- 102100023174 Methionine aminopeptidase 2 Human genes 0.000 description 1
- 102000002151 Microfilament Proteins Human genes 0.000 description 1
- 208000016285 Movement disease Diseases 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 101710203761 Neurexin-1 Proteins 0.000 description 1
- 102100021582 Neurexin-1-beta Human genes 0.000 description 1
- 102000008822 Neuroligin 4 Human genes 0.000 description 1
- 108050000725 Neuroligin 4 Proteins 0.000 description 1
- 102000004108 Neurotransmitter Receptors Human genes 0.000 description 1
- 108090000590 Neurotransmitter Receptors Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 108090000526 Papain Proteins 0.000 description 1
- 241000701945 Parvoviridae Species 0.000 description 1
- 235000019483 Peanut oil Nutrition 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- QMMRHASQEVCJGR-UBHSHLNASA-N Phe-Ala-Pro Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 QMMRHASQEVCJGR-UBHSHLNASA-N 0.000 description 1
- MQWISMJKHOUEMW-ULQDDVLXSA-N Phe-Arg-His Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 MQWISMJKHOUEMW-ULQDDVLXSA-N 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- IILUKIJNFMUBNF-IHRRRGAJSA-N Phe-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O IILUKIJNFMUBNF-IHRRRGAJSA-N 0.000 description 1
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 1
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 1
- RGZYXNFHYRFNNS-MXAVVETBSA-N Phe-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGZYXNFHYRFNNS-MXAVVETBSA-N 0.000 description 1
- HTXVATDVCRFORF-MGHWNKPDSA-N Phe-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N HTXVATDVCRFORF-MGHWNKPDSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- ZUQACJLOHYRVPJ-DKIMLUQUSA-N Phe-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZUQACJLOHYRVPJ-DKIMLUQUSA-N 0.000 description 1
- BNRFQGLWLQESBG-YESZJQIVSA-N Phe-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BNRFQGLWLQESBG-YESZJQIVSA-N 0.000 description 1
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 1
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 1
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 1
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 1
- ZSKJPKFTPQCPIH-RCWTZXSCSA-N Pro-Arg-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSKJPKFTPQCPIH-RCWTZXSCSA-N 0.000 description 1
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- KIGGUSRFHJCIEJ-DCAQKATOSA-N Pro-Asp-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O KIGGUSRFHJCIEJ-DCAQKATOSA-N 0.000 description 1
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 1
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- SSWJYJHXQOYTSP-SRVKXCTJSA-N Pro-His-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O SSWJYJHXQOYTSP-SRVKXCTJSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 1
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 1
- GFHOSBYCLACKEK-GUBZILKMSA-N Pro-Pro-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GFHOSBYCLACKEK-GUBZILKMSA-N 0.000 description 1
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- SNSYSBUTTJBPDG-OKZBNKHCSA-N Pro-Trp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N4CCC[C@@H]4C(=O)O SNSYSBUTTJBPDG-OKZBNKHCSA-N 0.000 description 1
- DLZBBDSPTJBOOD-BPNCWPANSA-N Pro-Tyr-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O DLZBBDSPTJBOOD-BPNCWPANSA-N 0.000 description 1
- IALSFJSONJZBKB-HRCADAONSA-N Pro-Tyr-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N3CCC[C@@H]3C(=O)O IALSFJSONJZBKB-HRCADAONSA-N 0.000 description 1
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 208000006289 Rett Syndrome Diseases 0.000 description 1
- 208000035388 Ring chromosome 22 syndrome Diseases 0.000 description 1
- 101100150366 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sks2 gene Proteins 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- CAOYHZOWXFFAIR-CIUDSAMLSA-N Ser-His-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CAOYHZOWXFFAIR-CIUDSAMLSA-N 0.000 description 1
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 1
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- ZGFRMNZZTOVBOU-CIUDSAMLSA-N Ser-Met-Gln Chemical compound N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)O ZGFRMNZZTOVBOU-CIUDSAMLSA-N 0.000 description 1
- JUTGONBTALQWMK-NAKRPEOUSA-N Ser-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N JUTGONBTALQWMK-NAKRPEOUSA-N 0.000 description 1
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 1
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 1
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 1
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 1
- XGQKSRGHEZNWIS-IHRRRGAJSA-N Ser-Pro-Tyr Chemical compound N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O XGQKSRGHEZNWIS-IHRRRGAJSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 1
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 1
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 1
- NQVDGKYAUHTCME-QTKMDUPCSA-N Thr-His-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O NQVDGKYAUHTCME-QTKMDUPCSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 1
- HSQXHRIRJSFDOH-URLPEUOOSA-N Thr-Phe-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HSQXHRIRJSFDOH-URLPEUOOSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 1
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 1
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 208000000323 Tourette Syndrome Diseases 0.000 description 1
- 208000016620 Tourette disease Diseases 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 208000030886 Traumatic Brain injury Diseases 0.000 description 1
- RRXPAFGTFQIEMD-IVJVFBROSA-N Trp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N RRXPAFGTFQIEMD-IVJVFBROSA-N 0.000 description 1
- SAKLWFSRZTZQAJ-GQGQLFGLSA-N Trp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SAKLWFSRZTZQAJ-GQGQLFGLSA-N 0.000 description 1
- CSOBBJWWODOYGW-ILWGZMRPSA-N Trp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N)C(=O)O CSOBBJWWODOYGW-ILWGZMRPSA-N 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- LHTGRUZSZOIAKM-SOUVJXGZSA-N Tyr-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O LHTGRUZSZOIAKM-SOUVJXGZSA-N 0.000 description 1
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 1
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 1
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 1
- HFJJDMOFTCQGEI-STECZYCISA-N Tyr-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HFJJDMOFTCQGEI-STECZYCISA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 1
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 1
- QKXAEWMHAAVVGS-KKUMJFAQSA-N Tyr-Pro-Glu Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O QKXAEWMHAAVVGS-KKUMJFAQSA-N 0.000 description 1
- VYQQQIRHIFALGE-UWJYBYFXSA-N Tyr-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VYQQQIRHIFALGE-UWJYBYFXSA-N 0.000 description 1
- JHDZONWZTCKTJR-KJEVXHAQSA-N Tyr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JHDZONWZTCKTJR-KJEVXHAQSA-N 0.000 description 1
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 1
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 1
- VJOWWOGRNXRQMF-UVBJJODRSA-N Val-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 VJOWWOGRNXRQMF-UVBJJODRSA-N 0.000 description 1
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 1
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 1
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 1
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 1
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 1
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- NSUUANXHLKKHQB-BZSNNMDCSA-N Val-Pro-Trp Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CNC2=CC=CC=C12 NSUUANXHLKKHQB-BZSNNMDCSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- 241001492404 Woodchuck hepatitis virus Species 0.000 description 1
- 208000028311 absence seizure Diseases 0.000 description 1
- 239000003070 absorption delaying agent Substances 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 108091000387 actin binding proteins Proteins 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 235000010419 agar Nutrition 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- 238000000540 analysis of variance Methods 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 239000003429 antifungal agent Substances 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 230000006400 anxiety behaviour Effects 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 210000004227 basal ganglia Anatomy 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- 238000009227 behaviour therapy Methods 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 230000008499 blood brain barrier function Effects 0.000 description 1
- 210000001218 blood-brain barrier Anatomy 0.000 description 1
- 230000005821 brain abnormality Effects 0.000 description 1
- 230000004641 brain development Effects 0.000 description 1
- 230000003925 brain function Effects 0.000 description 1
- 210000000133 brain stem Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000008366 buffered solution Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 210000000782 cerebellar granule cell Anatomy 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 206010008129 cerebral palsy Diseases 0.000 description 1
- 229960004926 chlorobutanol Drugs 0.000 description 1
- 208000003571 choroideremia Diseases 0.000 description 1
- 230000008045 co-localization Effects 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000011970 concomitant therapy Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 210000003618 cortical neuron Anatomy 0.000 description 1
- 210000005257 cortical tissue Anatomy 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 108010009297 diglycyl-histidine Proteins 0.000 description 1
- UGMCXQCYOVCMTB-UHFFFAOYSA-K dihydroxy(stearato)aluminium Chemical compound CCCCCCCCCCCCCCCCCC(=O)O[Al](O)O UGMCXQCYOVCMTB-UHFFFAOYSA-K 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- 239000002612 dispersion medium Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 206010013932 dyslexia Diseases 0.000 description 1
- 238000002001 electrophysiology Methods 0.000 description 1
- 230000007831 electrophysiology Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- BEFDCLMNVWHSGT-UHFFFAOYSA-N ethenylcyclopentane Chemical compound C=CC1CCCC1 BEFDCLMNVWHSGT-UHFFFAOYSA-N 0.000 description 1
- 229940073505 ethyl vanillin Drugs 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 210000001222 gaba-ergic neuron Anatomy 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 102000054766 genetic haplotypes Human genes 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000002873 global sequence alignment Methods 0.000 description 1
- 230000009206 glutamatergic signaling Effects 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 229960005150 glycerol Drugs 0.000 description 1
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 1
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 1
- 210000004884 grey matter Anatomy 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 108091008634 hepatocyte nuclear factors 4 Proteins 0.000 description 1
- 210000001320 hippocampus Anatomy 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 230000001990 hyperexcitatory effect Effects 0.000 description 1
- 230000035874 hyperreactivity Effects 0.000 description 1
- 230000036543 hypotension Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 230000005022 impaired gait Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 230000002601 intratumoral effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 208000028756 lack of coordination Diseases 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 201000003723 learning disability Diseases 0.000 description 1
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000006742 locomotor activity Effects 0.000 description 1
- 208000018883 loss of balance Diseases 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000037023 motor activity Effects 0.000 description 1
- 230000009427 motor defect Effects 0.000 description 1
- 230000007659 motor function Effects 0.000 description 1
- 108091005763 multidomain proteins Proteins 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 239000002077 nanosphere Substances 0.000 description 1
- 230000007472 neurodevelopment Effects 0.000 description 1
- 102000004871 neuroligin 3 Human genes 0.000 description 1
- 108090001073 neuroligin 3 Proteins 0.000 description 1
- 230000003955 neuronal function Effects 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000004789 organ system Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 229940055729 papain Drugs 0.000 description 1
- 235000019834 papain Nutrition 0.000 description 1
- 229940090668 parachlorophenol Drugs 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000007310 pathophysiology Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000000312 peanut oil Substances 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000008177 pharmaceutical agent Substances 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 239000003186 pharmaceutical solution Substances 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 238000011422 pharmacological therapy Methods 0.000 description 1
- 229960003742 phenol Drugs 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 229920000771 poly (alkylcyanoacrylate) Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 230000003234 polygenic effect Effects 0.000 description 1
- 235000010241 potassium sorbate Nutrition 0.000 description 1
- 239000004302 potassium sorbate Substances 0.000 description 1
- 229940069338 potassium sorbate Drugs 0.000 description 1
- 230000003334 potential effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 239000000473 propyl gallate Substances 0.000 description 1
- 229940075579 propyl gallate Drugs 0.000 description 1
- 235000010388 propyl gallate Nutrition 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 208000013406 repetitive behavior Diseases 0.000 description 1
- 230000003989 repetitive behavior Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 208000014046 ring chromosome 22 Diseases 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000008159 sesame oil Substances 0.000 description 1
- 235000011803 sesame oil Nutrition 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 235000010199 sorbic acid Nutrition 0.000 description 1
- 229940075582 sorbic acid Drugs 0.000 description 1
- 239000004334 sorbic acid Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 229940044609 sulfur dioxide Drugs 0.000 description 1
- 235000010269 sulphur dioxide Nutrition 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000008184 synaptic development Effects 0.000 description 1
- 230000005062 synaptic transmission Effects 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- RTKIYNMVFMVABJ-UHFFFAOYSA-L thimerosal Chemical compound [Na+].CC[Hg]SC1=CC=CC=C1C([O-])=O RTKIYNMVFMVABJ-UHFFFAOYSA-L 0.000 description 1
- 229940033663 thimerosal Drugs 0.000 description 1
- 230000005100 tissue tropism Effects 0.000 description 1
- 239000012929 tonicity agent Substances 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009529 traumatic brain injury Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 239000011882 ultra-fine particle Substances 0.000 description 1
- 239000002691 unilamellar liposome Substances 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 208000029257 vision disease Diseases 0.000 description 1
- 230000002747 voluntary effect Effects 0.000 description 1
- 210000004885 white matter Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
- A01K67/0276—Knock-out vertebrates
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0058—Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0066—Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/0075—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the delivery route, e.g. oral, subcutaneous
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/18—Antipsychotics, i.e. neuroleptics; Drugs for mania or schizophrenia
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/075—Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/0306—Animal model for genetic diseases
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/035—Animal model for multifactorial diseases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16041—Use of virus, viral particle or viral elements as a vector
- C12N2740/16043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/008—Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Environmental Sciences (AREA)
- Virology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Animal Husbandry (AREA)
- Neurology (AREA)
- Psychiatry (AREA)
- Neurosurgery (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
본 개시내용의 양태는 Shank3 단백질을 코딩하는 비자연 발생 폴리뉴클레오타이드, 폴리뉴클레오타이드를 포함하는 AAV 벡터, 및 유전자 치료 방법에 관한 것이다.
Description
관련 출원에 대한 상호 참조
본 출원은 35 U.S.C.§ 119(e) 하에 2020년 8월 17일에 제출된 "SHANK3 GENE THERAPY APPROACHES"라는 제목의 미국 가출원 제63/066,570호의 이익을 주장하며, 이의 전체 개시내용은 그 전체가 참조로 본원에 포함되어 있다.
EFS-WEB을 통해 텍스트 파일로 제출된 서열 목록에 대한 참조
본 출원은 EFS-Web을 통해 ASCII 형식으로 제출된 서열 목록을 포함하며, 이는 그 전체가 참조로 본원에 포함되어 있다. 2021년 8월 16일에 생성된 상기 ASCII 사본의 이름은 B119570108WO00-SEQ-SXT이고, 크기는 151,434 바이트이다.
본 발명의 분야
본 개시내용은 Shank3 단백질을 코딩하는 폴리뉴클레오타이드를 신경발달 장애를 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 대상체에게 전달하기 위한 유전자 치료 접근법에 관한 것이다.
Shank3와 관련된 결실 및/또는 돌연변이는 모든 자폐 스펙트럼 장애(ASD) 환자의 약 0.5-1%를 차지하고 지적 장애(ID)가 있는 ASD 환자의 약 2%를 차지한다. 그러나, ASD 및/또는 ID에 대한 효과적인 치료법은 없다. ASD 및 ID와 관련된 수많은 병리를 교정할 수 있는 약리학적 치료법을 개발하는 데 몇 가지 문제가 발생하였다.
본 개시내용의 양태는 Shank3 돌연변이를 갖는 대상체에 대한 효과적인 유전자 치료 접근법의 개발에 관한 것이다.
본 개시내용의 양태는 Shank3 단백질을 코딩하는 비자연 발생 폴리뉴클레오타이드에 관한 것으로서, Shank3 단백질은 SH3 도메인, PDZ 도메인, 호머(Homer) 결합 도메인, 코르탁틴(Cortactin) 결합 도메인, 및 SAM 도메인을 포함한다. 일부 구현예에서, SH3 도메인은 서열번호: 6의 잔기 474-525에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 473-524에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, PDZ 도메인은 서열번호: 6의 잔기 573-662에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 572-661에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 호머 결합 도메인은 서열번호: 5 또는 6의 잔기 1294-1323에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 코르탁틴 결합 도메인은 서열번호: 5 또는 6의 잔기 1400-1426에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, SAM 도메인은 서열번호: 6의 잔기 1664-1729에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 1663-1728에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 폴리뉴클레오타이드는 4.7 kb 미만이다.
일부 구현예에서, 폴리뉴클레오타이드는 프롤린-풍부 영역을 추가로 포함한다. 일부 구현예에서, SH3 도메인은 서열번호: 6의 잔기 474-525 또는 서열번호: 5의 잔기 473-524를 포함하고/거나, PDZ 도메인은 서열번호: 6의 잔기 573-662 또는 서열번호: 5의 잔기 572-661을 포함하고/거나, 호머 결합 도메인은 서열번호: 5 또는 6의 잔기 1294-1323을 포함하고/거나, 코르탁틴 결합 도메인은 서열번호: 5 또는 6의 잔기 1400-1426을 포함하고/하거나 SAM 도메인은 서열번호: 6의 잔기 1664-1729 또는 서열번호: 5의 잔기 1663-1728을 포함한다.
일부 구현예에서, 폴리뉴클레오타이드는 서열번호: 1 또는 2에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 폴리뉴클레오타이드는 서열번호: 1 또는 2를 포함한다.
일부 구현예에서, 폴리뉴클레오타이드에 의해 코딩된 Shank3 단백질은 안키린 반복 도메인을 추가로 포함한다. 일부 구현예에서, 안키린 반복 도메인은 서열번호: 6의 잔기 148-345에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 147-313에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 폴리뉴클레오타이드는 서열번호: 6의 잔기 148-345 또는 서열번호: 5의 잔기 147-313을 포함한다.
일부 구현예에서, 폴리뉴클레오타이드는 서열번호: 3 또는 4에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 폴리뉴클레오타이드는 서열번호: 3 또는 4를 포함한다.
일부 구현예에서, 폴리뉴클레오타이드는 약 4.6 kb, 4.5 kb, 4.4 kb, 4.3 kb, 4.2 kb, 4.1 kb, 4.0 kb, 3.9 kb, 3.8 kb, 3.7 kb, 3.6 kb, 3.5 kb, 3.4 kb, 3.3 kb, 3.2 kb, 3.1 kb, 3.0 kb, 2.9 kb, 2.8 kb, 2.7 kb, 2.6 kb, 2.5 kb, 2.4 kb, 2.3 kb, 2.2 kb, 또는 2.1 kb 미만이다.
일부 구현예에서, Shank3 단백질은 서열번호: 5 또는 6의 전장에 걸쳐 서열번호: 5 또는 6에 대해 65% 미만 동일하다.
일부 구현예에서, Shank3 단백질은 서열번호: 17-20 중 어느 하나에 대해 적어도 90% 동일한 아미노산 서열을 포함한다. 일부 구현예에서, Shank3 단백질은 서열번호: 17-20 중 어느 하나를 포함하는 아미노산 서열을 포함한다.
본 개시내용의 추가 양태는 본원에 기재된 폴리펩타이드에 의해 코딩된 Shank3 단백질에 관한 것이다.
본 개시내용의 추가 양태는 본원에 기재된 폴리뉴클레오타이드를 포함하는 벡터에 관한 것이다. 일부 구현예에서, 벡터는 바이러스 벡터이다. 일부 구현예에서, 벡터는 AAV 벡터이다. 일부 구현예에서, 벡터는 본원에 기재된 폴리뉴클레오타이드에 작동가능하게 연결된 프로모터를 포함한다. 일부 구현예에서, 폴리뉴클레오타이드는 AAV 역위 말단 반복(ITR)에 의해 측접된다. 일부 구현예에서, AAV 벡터는 서열번호: 7 또는 21에 대해 적어도 90% 동일하고 Shank3 활성을 갖는 단백질을 코딩하는 서열을 포함한다. 일부 구현예에서, AAV 벡터는 서열번호: 7 또는 21의 서열을 포함하고 Shank3 활성을 갖는 단백질을 코딩한다. 일부 구현예에서, AAV 벡터는 서열번호: 2 또는 4에 대해 적어도 90% 동일하고 Shank3 활성을 갖는 단백질을 코딩하는 서열을 포함한다. 일부 구현예에서, AAV 벡터는 Shank3 활성을 갖는 단백질을 코딩하는 서열번호: 2 또는 4의 서열을 포함한다. 일부 구현예에서, AAV 벡터는 서열번호: 1 또는 3에 대해 적어도 90% 동일하고 Shank3 활성을 갖는 단백질을 코딩하는 서열을 포함한다. 일부 구현예에서, AAV 벡터는 Shank3 활성을 갖는 단백질을 코딩하는 서열번호: 1 또는 3의 서열을 포함한다.
본 개시내용의 추가 양태는 AAV 벡터 및 캡시드 단백질을 포함하는 AAV 입자에 관한 것으로서, 캡시드는 AAV1, 2, 5, 6, 8, 9, rh10, 및 PHP.eB로부터 선택되는 혈청형이다. 일부 구현예에서, 혈청형은 AAV9이다. 일부 구현예에서, 혈청형은 AAV10이다. 일부 구현예에서, 혈청형은 PHP.eB이다.
일부 구현예에서, AAV 벡터는 프로모터를 추가로 포함한다. 일부 구현예에서, 프로모터는 인간 프로모터이다. 일부 구현예에서, 프로모터는 hSyn1이다.
본 개시내용의 추가 양태는 본원에 기재된 AAV 벡터 또는 입자를 이를 필요로 하는 대상체에게 투여하는 단계를 포함하는 방법에 관한 것이다. 일부 구현예에서, 대상체는 인간 대상체이다. 일부 구현예에서, 인간 대상체는 성인이다. 일부 구현예에서, 인간 대상체는 성인이 아니다. 일부 구현예에서, 인간 대상체는 25세 이하이다. 일부 구현예에서, 인간 대상체는 10세 이하이다. 일부 구현예에서, 대상체는 신경발달 장애를 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있다. 일부 구현예에서, 대상체는 자폐 스펙트럼 장애(ASD)를 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있다. 일부 구현예에서, 대상체는 ASD의 하나 이상의 증상을 나타낸다. 일부 구현예에서, 대상체는 펠란-맥더미드 증후군(Phelan-McDermid syndrome)을 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있다. 일부 구현예에서, 대상체는 발달 지연, 지적 장애(ID), 수면 장애, 저긴장, 언어능력 부족 또는 언어 지연 중 하나 이상을 나타낸다.
본 개시내용의 추가 양태는 신경발달 장애를 갖는 대상체를 치료하는 방법에 관한 것이다. 일부 구현예에서, 본 개시내용은 자폐 스펙트럼 장애(ASD)를 갖는 대상체를 치료하는 방법에 관한 것이다. 일부 구현예에서, 본 개시내용은 펠란-맥더미드 증후군을 갖는 대상체를 치료하는 방법에 관한 것이다. 일부 구현예에서, 치료 방법은 Shank3 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 AAV 벡터를 포함하는 조성물의 유효량을 대상체에게 투여하는 단계를 포함한다. 일부 구현예에서, 조성물은 약제학적으로 허용가능한 담체 내에 있다.
일부 구현예에서, AAV 벡터는 대상체의 뇌로 전달된다. 일부 구현예에서, AAV 벡터는 대상체의 피질, 선조체 및/또는 시상으로 전달된다.
일부 구현예에서, 대상체는 대조군 대상체에 비해 Shank3 유전자의 감소된 발현을 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있다. 일부 구현예에서, 대조군 대상체는 신경발달 장애, 자폐 스펙트럼 장애(ASD) 및/또는 펠란-맥더미드 증후군을 갖지 않거나, 갖는 것으로 의심되지 않거나, 또는 가질 위험이 없는 대상체이다. 일부 구현예에서, Shank3 유전자의 감소된 발현은 Shank3 유전자의 적어도 하나의 카피의 파괴에 의해 유발된다. 일부 구현예에서, Shank3 유전자의 파괴는 Shank3 유전자의 적어도 하나의 카피 내에 결실을 포함한다. 일부 구현예에서, Shank3 유전자의 파괴는 Shank3 유전자의 적어도 하나의 카피 내에 하나 이상의 돌연변이를 포함한다.
본 개시내용의 추가 양태는 서열번호: 17-20 중 어느 하나에 대해 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 서열을 포함하는 MiniShank3 단백질에 관한 것이다. 일부 구현예에서, MiniShank3 단백질은 서열번호: 17-20 중 어느 하나의 서열을 포함한다.
도 1a-1b는 Shank3B-/- 마우스에서의 피부 병변 및 증가된 그루밍(grooming)을 보여준다.
도 2a-2c는 Shank3B 돌연변이체 마우스가 사회적 상호작용 결손을 나타냄을 보여준다. 도 2a에서 "스트레인저(동물)(Stranger) 1"은 시험 동물과의 사회적 접촉 행동에 대해 시험된 파트너를 나타낸다. 도 2a에서 "스트레인저 2"는 이전에 빈 와이어 케이지 내로 도입된 초보(novice) 사회적 파트너를 나타낸다. S1: 스트레인저 1; S2: 스트레인저 2; E: 빈 케이지.
도 3a-3c는 Shank3B-/- 마우스가 선조체 PSD에서 변경된 분자 조성을 나타냄을 보여준다.
도 4a-4e는 Shank3B 돌연변이체 마우스에서의 피질-선조체 시냅스 결함을 보여준다. PPR: 쌍 펄스 비율(paired-pulse ratio).
도 5a-5c는 miniShank3-v1의 디자인을 보여준다. 도 5a는 전장 Shank3의 단백질 도메인 다이어그램을 보여준다. 도 5b는 본 개시내용에 제공된 miniShank3-v1의 개략도를 보여준다. 도 5c는 인간 시냅신-1 프로모터(hSyn-1)를 갖는 GFP-태깅된 miniShank3-v1의 개략도를 보여준다. ANK, 안키린 반복; SH3, src 상동성 3 도메인; PDZ, PDZ 도메인; Pro, 프롤린 풍부 영역; HBD, 호머 결합 도메인; CBD, 코르탁틴 결합 도메인; SAM, 멸균 알파 모티프.
도 6a-6c는 miniShank3-v2의 디자인을 보여준다. 도 6a는 전장 Shank3의 단백질 도메인 다이어그램을 보여준다. 도 6b는 본 개시내용에 제공된 miniShank3-v2의 개략도를 보여준다. 도 6c는 인간 시냅신-1 프로모터(hSyn-1)를 갖는 GFP-태깅된 miniShank3-v2의 개략도를 보여준다. ANK, 안키린 반복; SH3, src 상동성 3 도메인; PDZ, PDZ 도메인; Pro, 프롤린 풍부 영역; HBD, 호머 결합 도메인; CBD, 코르탁틴 결합 도메인; SAM, 멸균 알파 모티프.
도 7a-7h는 GFP-miniShank3-v1이 시냅스에 국소화되었음을 보여준다. hSyn1-GFP-miniShank3-v1은 피질-선조체 공동 배양에서 선조체 중간 가시 뉴런(MSN) 내로 형질감염되었다. 도 7a는 GFP-miniShank3-v1이 MSN에서 발현되었음을 보여주고, 도 7b-7c는 시냅스를 표시하기 위해 PSD95로 염색된 동일한 배양물(도 7b) 및 수상돌기를 나타내기 위해 MAP2로 염색된 동일한 배양물(도 7c)을 보여준다. 도 7d는 도 7a-7c의 병합된 이미지를 보여준다. 도 7e-7h는 수상돌기(도 7g) 및 병합된 이미지에서 수상돌기 가시(도 7h) 상의 PSD95를 이용한(도 7f) GFP-miniShank3-v1의 정확한 국소화(도 7e)를 보여주기 위한 도 7a-7d로부터의 고배율 이미지를 보여준다.
도 8은 출생 후 0일 안면 정맥 주사 후 GFP-miniShank3-v1의 효율적인 발현이 있었음을 보여준다. P0 마우스에게 마우스당 6.42E+11개의 바이러스 게놈(vg)을 주사하였다. AAV 주사 2개월 후 마우스 뇌를 수집하고 뇌를 절단하여 GFP 발현을 관찰하였다.
도 9a-9f는 P0에서 AAV-miniShank3-v1의 단일 정맥내 주사가 Shank3 결핍 마우스에서 PSD 단백질 결손을 구제하였음을 보여준다. 도 9a는 AAV-매개 miniShank3-v1 유전자 요법 실험의 타임라인 및 실험 그룹을 보여준다. 도 9b는 AAV-GFP가 주사된 야생형 마우스(WT), AAV-GFP가 주사된 InsG3680+/+ 마우스(돌연변이체), AAV-GFP-miniShank3-v1가 주사된 InsG3680+/+ 마우스(miniShank3), GFP-miniShank3-v1을 코딩하는 cDNA 플라스미드를 발현하는 HEK293 세포로부터의 용해물(HEK293-a), 및 GFP-p2A miniShank3-v1을 코딩하는 cDNA 플라스미드를 발현하는 HEK293 세포(HEK 293-b)로부터 제조된 선조체 시냅토솜 원형질막(SPM) 분획에서의 miniShank3 발현을 나타내는 웨스턴 블롯을 제공하며, 이는 항 Shank3 항체를 사용하여 검출되었다. 도 9c 및 9e는 AAV 주사된 마우스인 AAV-GFP가 주사된 WT(WT), AAV-GFP가 주사된 InsG3680+/+ 마우스(돌연변이체), 및 AAV-GFP-miniShank3-v1이 주사된 InsG3680+/+ 마우스(miniShank3)로부터의 선조체(도 9c) 및 피질(도 9e) SPM 분획에서 특정 항체에 의해 검출된 단백질에 대한 대표적인 블롯을 보여준다. 도 9d 및 9f는 선조체(도 9d) 및 피질(도 9f) SPM으로부터 튜불린 단백질 발현에 대해 정규화된 단백질의 상대적 수준의 정량화를 보여준다(n = 유전자형당 단백질당 4개 샘플, 각 n은 2마리의 마우스로부터 풀링된 조직임). 돌연변이체에서의 PSD 단백질 수준은 Minishank3 그룹에서의 WT 수준으로 회복되었다. *p<0.05, **p<0.01, ***p<0.001, 본페로니 사후 검정을 이용한 일원 ANOVA(도 9d 및 9f).
도 10a-10b는 P0에 AAV-miniShank3-v1의 단일 정맥내 주사가 Shank3 결핍 마우스에서 선조체 시냅스 결함을 구제하였음을 보여준다. 도 10a는 돌연변이체 마우스에서 감소된 선조체 팝 스파이크 진폭(pop spike amplitude)이 miniShank3-v1 주사된 동물에서 구제되었음을 보여준다. 도 10b는 지시된 치료를 받은 마우스로부터의 대표적인 피질-선조체 팝 스파이크 흔적을 보여준다.
도 11a-11e는 P0에서 miniShank3-v1의 전신 전달이 Shank3 결핍 마우스에서 행동 결손을 구제하였음을 보여준다. 도 11a는 사회적 상호작용 시험에서 돌연변이체 마우스가 대조군과 비교하여 새로운 객체(O)보다 스트레인저 마우스(S)에 대해 선호도를 나타내지 않았음을 보여준다. 이 행동은 miniShank3 처리에 의해 구제되었다. 도 11b는 miniShank3 처리가 돌연변이체 마우스에서의 더 낮은 운동 활동(개방 필드 시험에서 감소된 이동 거리)을 야생형 수준까지 구제하였음을 보여준다. 도 11c는 Shank3 돌연변이체 마우스에서의 감소된 탐구적 행동(양육 시간)이 WT 수준 miniShank3 처리 그룹까지 회복되었음을 보여준다. 도 11d는 Shank3 돌연변이체 마우스에서의 불안 유사 행동(고위 제로 미로(elevated zero maze) 시험에서 감소된 개방 팔 시간)이 또한 miniShank3 처리 그룹에서 구제되었음을 보여준다. 도 11e는 Shank3 돌연변이체 그룹과 비교하여 miniShank3 처리 그룹에서 운동 기능(로타로드 시험)의 개선 경향이 관찰되었음을 보여준다. *p<0.05, **p<0.01, ***p<0.001, ****p<0.0001, 본페로니 사후 검정을 이용한 일원 ANOVA(도 11a-11d), 본페로니 사후 검정을 이용한 이원 ANOVA(도 11e). 데이터는 평균 ± SEM으로 표시된다(a: n=16 WT + GFP, n=12 돌연변이체 + GFP 및 n=14 돌연변이체 + miniShank3; b-e: n= 26 WT + GFP, n=29 돌연변이체 + GFP 및 n=19 돌연변이체 + miniShank3).
도 12a-12f는 출생후 28일(P28)에 miniShank3 처리가 Shank3 돌연변이체 마우스에서 사회적 장애 및 운동 결손을 선택적으로 구제하였음을 보여준다. 도 12a는 II상 사회적 선호도 분석에서 객체(O) 대 스트레인저 마우스(S)와의 긴밀한 사회적 상호작용에 소모한 시간을 보여준다. 도 12b는 개방 필드 시험에서 이동한 총 거리를 보여준다. 도 12c는 로타로드 시험에서 낙하 지연시간을 통해 평가된 운동 학습의 평가를 보여준다. 도 12d는 로타로드 시험에서 낙하 지연시간을 통해 평가된 운동 협응(motor coordination)의 평가를 보여준다. 도 12e는 불안 유사 행동을 평가하기 위해 고위 제로 미로의 개방 팔에서 소모한 시간의 정량화를 보여준다. 도 12f는 2시간 비디오 촬영에서 그루밍 시간의 평가를 보여준다. *p<0.05, **p<0.01, ***p<0.001, ****p<0.0001, 본페로니 사후 검정을 이용한 일원 ANOVA(도 12a, 12b, 12e 및 12f), 본페로니 사후 검정을 이용한 이원 ANOVA(도 12c 및 12d). 모든 데이터는 평균 ± SEM으로 표시된다(도 12a: n=21 WT, n=23 Mut, 및 n=18 MiniShank3; 도 12b: n= 14 WT, n=20 Mut, 및 n=13 MiniShank3; 도 12c: n=17 WT, n=14 Mut 및 n=10 MiniShank3; 도 12d: n=17 WT, n=14 Mut 및 n=10 MiniShan3k; 도 12e: n=14 WT, n=20 Mut 및 n=14 MiniShank3; 도 12f: n=15 WT, n=18 Mut 및 n=17 MiniShank3). WT는 야생형을 나타내고, mut는 Shanks3 돌연변이체를 나타내며, MiniShank3은 Shank 3 돌연변이체 + miniShank3 처리를 나타낸다.
도 13a-13i는 생후 일(P7)에 miniShank3 처리가 Shank3 돌연변이체 마우스에서 모든 행동 결손뿐만 아니라 수면 방해를 완전히 구제하였음을 보여준다. 도 13a는 II상 사회적 선호도 분석에서 객체(O) 대 스트레인저 마우스(S)와의 긴밀한 사회적 상호작용에 소모한 시간을 보여준다. 도 13b는 2시간 비디오 촬영에서 그루밍 시간의 평가를 보여준다. 도 13c는 불안 유사 행동을 평가하기 위해 고위 제로 미로의 개방 팔에서 소모한 시간의 정량화를 보여준다. 도 13d 및 13e는 개방 필드 시헙에서 이동한 총 거리를 보여준다. 도 13f는 로타로드 시험에서 낙하 지연시간를 통해 평가된 운동 학습 및 협응의 평가를 보여준다. 도 13g는 Shank3 돌연변이체 마우스에서 수면 행동을 평가하기 위한 NREM 수면 지속 시간의 정량화를 보여준다. 도 13h는 Shank3 돌연변이체 마우스에서 수면 행동을 평가하기 위한 NREM 수면 유지 길이의 정량화를 보여준다. 도 13i는 Shank3 돌연변이체 마우스에서 수면 행동을 평가하기 위한 델타 파워의 정량화를 나타낸다. *p<0.05, **p<0.01, ***p<0.001, ****p<0.0001, 본페로니 사후 검정을 이용한 일원 ANOVA(도 13a, 13b, 13c, 13d, 13g, 13h 및 13i), 본페로니 사후 검정을 이용한 이원 ANOVA(도 13e 및 13f). 데이터는 평균 ± SEM으로 표시된다(도 13a: n=16 WT, n=9 Mut 및 n=14 MiniShank3; 도 13b: n=18 WT, n=12 Mut 및 n=14 MiniShank3; 도 13c: n=10 WT, n=10 Mut 및 n=10 MiniShank3; 도 13d: n=18 WT, n=14 Mut 및 n=18 MiniShank3; 도 13e: n=18 WT, n=14 Mut 및 n=18 MiniShank3; 도 13f: n=17 WT, n=15 Mut 및 n=17 MiniShank3; 도 13g-13i: n=9 WT, n=8 Mut 및 n=8 MiniShank3). WT는 야생형을 나타내고, mut는 Shanks3 돌연변이체를 나타내며, MiniShank3은 Shank3 돌연변이체 + miniShank3 처리를 나타낸다.
도 14a-14b는 생후 일(P7)에 miniShank3 처리가 Shank3 돌연변이체에서 발작 활동을 유발하지 않았음을 보여준다. 도 14a는 야생형 동물, 대조군 바이러스가 주사된 돌연변이체, miniShank3이 주사된 돌연변이체, 또는 Scn2a 돌연변이체의 대표적인 EEG 트레이스를 보여준다. 도 14b는 패널 a에 나타낸 4개의 실험 그룹에서 관찰된 스파이크파 방전(SWD)의 정량화를 보여준다(데이터는 평균 ± SEM으로 표시됨). ***p<0.001, 본페로니 사후 검정을 이용한 일원 ANOVA.
도 15는 hSyn1 프로모터를 갖는 인간 miniShank3 유전자의 플라스미드 구성을 보여주는 개략도를 예시한다.
도 2a-2c는 Shank3B 돌연변이체 마우스가 사회적 상호작용 결손을 나타냄을 보여준다. 도 2a에서 "스트레인저(동물)(Stranger) 1"은 시험 동물과의 사회적 접촉 행동에 대해 시험된 파트너를 나타낸다. 도 2a에서 "스트레인저 2"는 이전에 빈 와이어 케이지 내로 도입된 초보(novice) 사회적 파트너를 나타낸다. S1: 스트레인저 1; S2: 스트레인저 2; E: 빈 케이지.
도 3a-3c는 Shank3B-/- 마우스가 선조체 PSD에서 변경된 분자 조성을 나타냄을 보여준다.
도 4a-4e는 Shank3B 돌연변이체 마우스에서의 피질-선조체 시냅스 결함을 보여준다. PPR: 쌍 펄스 비율(paired-pulse ratio).
도 5a-5c는 miniShank3-v1의 디자인을 보여준다. 도 5a는 전장 Shank3의 단백질 도메인 다이어그램을 보여준다. 도 5b는 본 개시내용에 제공된 miniShank3-v1의 개략도를 보여준다. 도 5c는 인간 시냅신-1 프로모터(hSyn-1)를 갖는 GFP-태깅된 miniShank3-v1의 개략도를 보여준다. ANK, 안키린 반복; SH3, src 상동성 3 도메인; PDZ, PDZ 도메인; Pro, 프롤린 풍부 영역; HBD, 호머 결합 도메인; CBD, 코르탁틴 결합 도메인; SAM, 멸균 알파 모티프.
도 6a-6c는 miniShank3-v2의 디자인을 보여준다. 도 6a는 전장 Shank3의 단백질 도메인 다이어그램을 보여준다. 도 6b는 본 개시내용에 제공된 miniShank3-v2의 개략도를 보여준다. 도 6c는 인간 시냅신-1 프로모터(hSyn-1)를 갖는 GFP-태깅된 miniShank3-v2의 개략도를 보여준다. ANK, 안키린 반복; SH3, src 상동성 3 도메인; PDZ, PDZ 도메인; Pro, 프롤린 풍부 영역; HBD, 호머 결합 도메인; CBD, 코르탁틴 결합 도메인; SAM, 멸균 알파 모티프.
도 7a-7h는 GFP-miniShank3-v1이 시냅스에 국소화되었음을 보여준다. hSyn1-GFP-miniShank3-v1은 피질-선조체 공동 배양에서 선조체 중간 가시 뉴런(MSN) 내로 형질감염되었다. 도 7a는 GFP-miniShank3-v1이 MSN에서 발현되었음을 보여주고, 도 7b-7c는 시냅스를 표시하기 위해 PSD95로 염색된 동일한 배양물(도 7b) 및 수상돌기를 나타내기 위해 MAP2로 염색된 동일한 배양물(도 7c)을 보여준다. 도 7d는 도 7a-7c의 병합된 이미지를 보여준다. 도 7e-7h는 수상돌기(도 7g) 및 병합된 이미지에서 수상돌기 가시(도 7h) 상의 PSD95를 이용한(도 7f) GFP-miniShank3-v1의 정확한 국소화(도 7e)를 보여주기 위한 도 7a-7d로부터의 고배율 이미지를 보여준다.
도 8은 출생 후 0일 안면 정맥 주사 후 GFP-miniShank3-v1의 효율적인 발현이 있었음을 보여준다. P0 마우스에게 마우스당 6.42E+11개의 바이러스 게놈(vg)을 주사하였다. AAV 주사 2개월 후 마우스 뇌를 수집하고 뇌를 절단하여 GFP 발현을 관찰하였다.
도 9a-9f는 P0에서 AAV-miniShank3-v1의 단일 정맥내 주사가 Shank3 결핍 마우스에서 PSD 단백질 결손을 구제하였음을 보여준다. 도 9a는 AAV-매개 miniShank3-v1 유전자 요법 실험의 타임라인 및 실험 그룹을 보여준다. 도 9b는 AAV-GFP가 주사된 야생형 마우스(WT), AAV-GFP가 주사된 InsG3680+/+ 마우스(돌연변이체), AAV-GFP-miniShank3-v1가 주사된 InsG3680+/+ 마우스(miniShank3), GFP-miniShank3-v1을 코딩하는 cDNA 플라스미드를 발현하는 HEK293 세포로부터의 용해물(HEK293-a), 및 GFP-p2A miniShank3-v1을 코딩하는 cDNA 플라스미드를 발현하는 HEK293 세포(HEK 293-b)로부터 제조된 선조체 시냅토솜 원형질막(SPM) 분획에서의 miniShank3 발현을 나타내는 웨스턴 블롯을 제공하며, 이는 항 Shank3 항체를 사용하여 검출되었다. 도 9c 및 9e는 AAV 주사된 마우스인 AAV-GFP가 주사된 WT(WT), AAV-GFP가 주사된 InsG3680+/+ 마우스(돌연변이체), 및 AAV-GFP-miniShank3-v1이 주사된 InsG3680+/+ 마우스(miniShank3)로부터의 선조체(도 9c) 및 피질(도 9e) SPM 분획에서 특정 항체에 의해 검출된 단백질에 대한 대표적인 블롯을 보여준다. 도 9d 및 9f는 선조체(도 9d) 및 피질(도 9f) SPM으로부터 튜불린 단백질 발현에 대해 정규화된 단백질의 상대적 수준의 정량화를 보여준다(n = 유전자형당 단백질당 4개 샘플, 각 n은 2마리의 마우스로부터 풀링된 조직임). 돌연변이체에서의 PSD 단백질 수준은 Minishank3 그룹에서의 WT 수준으로 회복되었다. *p<0.05, **p<0.01, ***p<0.001, 본페로니 사후 검정을 이용한 일원 ANOVA(도 9d 및 9f).
도 10a-10b는 P0에 AAV-miniShank3-v1의 단일 정맥내 주사가 Shank3 결핍 마우스에서 선조체 시냅스 결함을 구제하였음을 보여준다. 도 10a는 돌연변이체 마우스에서 감소된 선조체 팝 스파이크 진폭(pop spike amplitude)이 miniShank3-v1 주사된 동물에서 구제되었음을 보여준다. 도 10b는 지시된 치료를 받은 마우스로부터의 대표적인 피질-선조체 팝 스파이크 흔적을 보여준다.
도 11a-11e는 P0에서 miniShank3-v1의 전신 전달이 Shank3 결핍 마우스에서 행동 결손을 구제하였음을 보여준다. 도 11a는 사회적 상호작용 시험에서 돌연변이체 마우스가 대조군과 비교하여 새로운 객체(O)보다 스트레인저 마우스(S)에 대해 선호도를 나타내지 않았음을 보여준다. 이 행동은 miniShank3 처리에 의해 구제되었다. 도 11b는 miniShank3 처리가 돌연변이체 마우스에서의 더 낮은 운동 활동(개방 필드 시험에서 감소된 이동 거리)을 야생형 수준까지 구제하였음을 보여준다. 도 11c는 Shank3 돌연변이체 마우스에서의 감소된 탐구적 행동(양육 시간)이 WT 수준 miniShank3 처리 그룹까지 회복되었음을 보여준다. 도 11d는 Shank3 돌연변이체 마우스에서의 불안 유사 행동(고위 제로 미로(elevated zero maze) 시험에서 감소된 개방 팔 시간)이 또한 miniShank3 처리 그룹에서 구제되었음을 보여준다. 도 11e는 Shank3 돌연변이체 그룹과 비교하여 miniShank3 처리 그룹에서 운동 기능(로타로드 시험)의 개선 경향이 관찰되었음을 보여준다. *p<0.05, **p<0.01, ***p<0.001, ****p<0.0001, 본페로니 사후 검정을 이용한 일원 ANOVA(도 11a-11d), 본페로니 사후 검정을 이용한 이원 ANOVA(도 11e). 데이터는 평균 ± SEM으로 표시된다(a: n=16 WT + GFP, n=12 돌연변이체 + GFP 및 n=14 돌연변이체 + miniShank3; b-e: n= 26 WT + GFP, n=29 돌연변이체 + GFP 및 n=19 돌연변이체 + miniShank3).
도 12a-12f는 출생후 28일(P28)에 miniShank3 처리가 Shank3 돌연변이체 마우스에서 사회적 장애 및 운동 결손을 선택적으로 구제하였음을 보여준다. 도 12a는 II상 사회적 선호도 분석에서 객체(O) 대 스트레인저 마우스(S)와의 긴밀한 사회적 상호작용에 소모한 시간을 보여준다. 도 12b는 개방 필드 시험에서 이동한 총 거리를 보여준다. 도 12c는 로타로드 시험에서 낙하 지연시간을 통해 평가된 운동 학습의 평가를 보여준다. 도 12d는 로타로드 시험에서 낙하 지연시간을 통해 평가된 운동 협응(motor coordination)의 평가를 보여준다. 도 12e는 불안 유사 행동을 평가하기 위해 고위 제로 미로의 개방 팔에서 소모한 시간의 정량화를 보여준다. 도 12f는 2시간 비디오 촬영에서 그루밍 시간의 평가를 보여준다. *p<0.05, **p<0.01, ***p<0.001, ****p<0.0001, 본페로니 사후 검정을 이용한 일원 ANOVA(도 12a, 12b, 12e 및 12f), 본페로니 사후 검정을 이용한 이원 ANOVA(도 12c 및 12d). 모든 데이터는 평균 ± SEM으로 표시된다(도 12a: n=21 WT, n=23 Mut, 및 n=18 MiniShank3; 도 12b: n= 14 WT, n=20 Mut, 및 n=13 MiniShank3; 도 12c: n=17 WT, n=14 Mut 및 n=10 MiniShank3; 도 12d: n=17 WT, n=14 Mut 및 n=10 MiniShan3k; 도 12e: n=14 WT, n=20 Mut 및 n=14 MiniShank3; 도 12f: n=15 WT, n=18 Mut 및 n=17 MiniShank3). WT는 야생형을 나타내고, mut는 Shanks3 돌연변이체를 나타내며, MiniShank3은 Shank 3 돌연변이체 + miniShank3 처리를 나타낸다.
도 13a-13i는 생후 일(P7)에 miniShank3 처리가 Shank3 돌연변이체 마우스에서 모든 행동 결손뿐만 아니라 수면 방해를 완전히 구제하였음을 보여준다. 도 13a는 II상 사회적 선호도 분석에서 객체(O) 대 스트레인저 마우스(S)와의 긴밀한 사회적 상호작용에 소모한 시간을 보여준다. 도 13b는 2시간 비디오 촬영에서 그루밍 시간의 평가를 보여준다. 도 13c는 불안 유사 행동을 평가하기 위해 고위 제로 미로의 개방 팔에서 소모한 시간의 정량화를 보여준다. 도 13d 및 13e는 개방 필드 시헙에서 이동한 총 거리를 보여준다. 도 13f는 로타로드 시험에서 낙하 지연시간를 통해 평가된 운동 학습 및 협응의 평가를 보여준다. 도 13g는 Shank3 돌연변이체 마우스에서 수면 행동을 평가하기 위한 NREM 수면 지속 시간의 정량화를 보여준다. 도 13h는 Shank3 돌연변이체 마우스에서 수면 행동을 평가하기 위한 NREM 수면 유지 길이의 정량화를 보여준다. 도 13i는 Shank3 돌연변이체 마우스에서 수면 행동을 평가하기 위한 델타 파워의 정량화를 나타낸다. *p<0.05, **p<0.01, ***p<0.001, ****p<0.0001, 본페로니 사후 검정을 이용한 일원 ANOVA(도 13a, 13b, 13c, 13d, 13g, 13h 및 13i), 본페로니 사후 검정을 이용한 이원 ANOVA(도 13e 및 13f). 데이터는 평균 ± SEM으로 표시된다(도 13a: n=16 WT, n=9 Mut 및 n=14 MiniShank3; 도 13b: n=18 WT, n=12 Mut 및 n=14 MiniShank3; 도 13c: n=10 WT, n=10 Mut 및 n=10 MiniShank3; 도 13d: n=18 WT, n=14 Mut 및 n=18 MiniShank3; 도 13e: n=18 WT, n=14 Mut 및 n=18 MiniShank3; 도 13f: n=17 WT, n=15 Mut 및 n=17 MiniShank3; 도 13g-13i: n=9 WT, n=8 Mut 및 n=8 MiniShank3). WT는 야생형을 나타내고, mut는 Shanks3 돌연변이체를 나타내며, MiniShank3은 Shank3 돌연변이체 + miniShank3 처리를 나타낸다.
도 14a-14b는 생후 일(P7)에 miniShank3 처리가 Shank3 돌연변이체에서 발작 활동을 유발하지 않았음을 보여준다. 도 14a는 야생형 동물, 대조군 바이러스가 주사된 돌연변이체, miniShank3이 주사된 돌연변이체, 또는 Scn2a 돌연변이체의 대표적인 EEG 트레이스를 보여준다. 도 14b는 패널 a에 나타낸 4개의 실험 그룹에서 관찰된 스파이크파 방전(SWD)의 정량화를 보여준다(데이터는 평균 ± SEM으로 표시됨). ***p<0.001, 본페로니 사후 검정을 이용한 일원 ANOVA.
도 15는 hSyn1 프로모터를 갖는 인간 miniShank3 유전자의 플라스미드 구성을 보여주는 개략도를 예시한다.
본 개시내용의 양태는 신경발달 장애를 치료하기 위한 유전자 치료 접근법에 관한 것이다. 실시예는 유전자 전달 벡터에서 발현되고 대상체에게 투여될 수 있는 Shank3 단백질을 코딩하는 비자연 발생 폴리뉴클레오타이드를 입증한다. 본원에 개시된 유전자 요법 전략은 AAV 시스템을 사용하여 Shank3 유전자의 기능적 카피를 뇌 세포로 전달하여 세포 기능을 회복시킨다.
SHANK3은 흥분성 글루타메이트성 시냅스(excitatory glutamatergic synapse)에서 시냅스 스캐폴딩 단백질을 코딩하고, 신호전달 분자의 모집을 조정하고, 적절한 시냅스 발달 및 기능에 중요한 거대분자 시냅스후 단백질 복합체의 조립을 조율한다. SHANK3의 결실은 펠란-맥더미드 증후군의 핵심적인 신경발달 및 신경행동 결손의 주요 원인이다. 인간 유전 연구들은 SHANK3 돌연변이가 자폐 스펙트럼 장애(ASD)의 약 1%를 차지한다는 것을 확인하였다. 펠란-맥더미드 증후군 환자 및 SHANK3 돌연변이를 가진 다른 개체들은 종종 발달 지연, 수면 장애, 저긴장, 언어능력 부족 또는 심각한 언어 지연, 및 ASD의 특징적인 특색을 포함하는 다양한 동반이환 특성을 나타낸다. 현재 ASD에 대한 효과적인 치료법은 없다.
ASD와 Shank3의 관련성은 시냅스 기능장애와 ASD의 병리생리학 사이에 즉각적인 연결을 제공하였다. 동물 모델은 ASD의 인간 유전학을 임상 표현(clinical presentation)의 근본이 되는 뇌 병리학에 연결하고, 궁극적으로 효과적인 치료법을 발견하고 평가하는 데 도움을 준다. 파리, 어류 및 설치류에서의 이전 연구들은 SHANK3 손실로 인한 시냅스 기능장애 및 행동 이상을 밝혀내었다. 예를 들어, 마우스 모델에서 Shank3의 파괴는 시냅스 결함, 사회적 상호작용 장애, 운동 곤란, 반복적인 그루밍 및 불안 수준 증가를 초래하였다. Shank3 결핍은 설치류, 원숭이 및 인간 환자에서 심각한 수면 장애를 유발하므로, 수면 효율은 ASD에 대한 독특한 바이오마커를 제공한다. 또한, 시냅스 결함 및 행동 이상은 Shank3가 회복될 때 가역적이기 때문에, Shank3 결핍 마우스 모델은 예측 타당성을 제시한다. 따라서, 유전자 대체는 이 단일유전자 질환에 대한 치료 전략으로 매우 적합하다.
새로운 재조합 아데노 관련 바이러스(rAAV)는 이들의 광범위한 조직 친화성(tissue tropism), 낮은 면역원성, 매우 효율적이고 지속적인 유전자 전달, 및 임상적으로 입증된 안전성 추적 기록으로 인해 유망한 유전자 전달 플랫폼에 해당한다. 그러나, Shank3은 AAV 벡터의 패키징 용량을 초과하는 약 5.7 kb의 코딩 서열을 갖는 큰 단백질이라는 것이 당업계에 공지되어 있다. 본 출원의 발명자들은 Shank3 단백질의 특정 영역이 단백질의 기능에 중요하지 않다는 것을 발견하였고, 따라서 유의하게 더 작은 코딩 서열(약 2.1 kb 내지 약 3.1 kb)을 갖는 이종 Shank3 발현 작제물을 설계하였는데, 이들이 특정 비필수 영역이 제거된 Shank3 단백질의 한 가지 형태를 코딩하기 때문이다. 본원에 기재된 생성된 소형화된 Shank3 단백질은 AAV와 같은 벡터에 의해 전달될 수 있다. 본 출원의 발명자들은 놀랍게도 소형화된 Shank3 단백질이 마우스 모델에서 Shank3 단백질을 코딩하는 유전자의 결실 또는 돌연변이에 의해 유발된 결함 기능을 회복시킬 수 있고, 따라서 Shank3 돌연변이 또는 결실과 관련된 질환에 의해 유발된 이상을 잠재적으로 구제할 수 있음을 발견하였다. 이것은 Shank3 단백질의 부분적인 단편을 복구하거나 개선하는 데 초점을 맞추지만 Shank 단백질의 기능을 회복시킬 수 없는 당업계에 알려진 방법과 대조된다. 따라서, 본 개시내용은 소형화된 Shank3 단백질("MiniShank3")을 사용하여 Shank3의 활성을 회복시킴으로써 신경발달 장애를 치료하기 위한 방법 및 조성물에 관한 것이다.
Shank 단백질
Shank 계열의 단백질(예컨대, Shank1, Shank 2 및 Shank3)은 흥분성 뉴런의 시냅스에서 스캐폴딩 단백질을 묶고 조직화하는 마스터 스캐폴딩 단백질이다. 이 계열의 구성원은 적어도 5개의 주요 도메인 영역인 N-말단 안키린 반복, SH3 도메인, PDZ 도메인, 프롤린-풍부 영역 및 C-말단 SAM 도메인을 공유한다. 이러한 기능적 도메인을 통해, Shank 단백질은 많은 시냅스후 밀도(postsynaptic density, PSD) 단백질과 상호작용한다. 임의의 이론에 얽매이지 않으면서, Shank 단백질은 SAPAP에 결합할 수 있으며, 이는 결국 PSD95에 결합하여 PSD95/SAPAP/Shank 시냅스후 복합체를 형성한다. 함께, 이들 다중도메인 단백질은 주요 스캐폴드를 형성하여, 글루타메이트성 시냅스에서 거대분자 시냅스후 신호전달 복합체의 조립을 조율하는 것으로 제안된다. 이 복합체는 신경전달자 수용체 및 신호전달 분자의 시냅스 국소화를 표적화, 고정 및 동적으로 조절하는 데 중요한 역할을 하는 것으로 나타났다. 또 다른 예에서, Shank 계열의 단백질은 호머(Homer)에 대한 결합을 통해 mGluR 경로에 연결된다.
액틴 결합 단백질에 대한 그의 연결로 인해, Shank는 또한 가시(spine) 발달에도 중요한 역할을 한다. Shank3의 형질감염이 배양된 무가시 소뇌 과립 세포에서 기능적 수상돌기 가시 시냅스를 유도하기에 충분한 것으로 밝혀졌으며, 이는 가시 유도에서의 역할을 나타낸다. Shank3은 가장 긴 Shank3 동형인 Shank3α, Shank3β 및 Shank3γ를 포함하는 3개의 주요 동형을 갖는다. Shank3의 siRNA 넉다운은 DIV18 배양된 해마 뉴런에서 수상돌기 가시의 수를 감소시키고 길이를 증가시킨 것으로 보고되었고, 이는 가시 성숙에서의 역할을 함축한다. 이 제안된 기능은 Shank1의 과발현이 배양된 해마 뉴런에 이미 존재하는 수상돌기 가시를 확대하였다는 발견에 의해 뒷받침되었다. 또한, Shank1 돌연변이체 마우스는 더 작은 수상돌기 가시 및 더 약한 시냅스 전달을 갖는 것으로 보고되었다.
일부 구현예에서, 본 개시내용은 파괴된 Shank 단백질 활성을 갖는 대상체에서 시냅스 활성을 회복시킬 수 있는 Shank 단백질에 관한 것이다. 일부 구현예에서, 파괴된 Shank 단백질 활성은 신경발달 장애, 자폐 스펙트럼 장애(ASD), 및/또는 펠란-맥더미드 증후군을 가진 대상체에 존재한다. 일부 구현예에서, 본 개시내용과 관련된 Shank 단백질은 Shank1 단백질이다. 일부 구현예에서, 본 개시내용은 이를 필요로 하는 대상체에서 Shank1 또는 Shank1의 변이체를 코딩하는 폴리뉴클레오타이드의 발현에 관한 것이다. 일부 구현예에서, 본 개시내용에서의 Shank 단백질은 Shank2 단백질이다. 일부 구현예에서, 본 개시내용은 이를 필요로 하는 대상체에서 Shank2 또는 Shank2의 변이체를 코딩하는 폴리뉴클레오타이드의 발현에 관한 것이다. 일부 구현예에서, 본 개시내용에서의 Shank 단백질은 Shank3 단백질이다. 일부 구현예에서, 본 개시내용은 이를 필요로 하는 대상체에서 Shank3 또는 Shank3의 변이체를 코딩하는 폴리뉴클레오타이드의 발현에 관한 것이다. 본 개시내용과 관련된 Shank 단백질은 흥분성 뉴런의 시냅스에서 스캐폴딩 단백질로서 기능하는 임의의 Shank 단백질, 예컨대 그의 변이체 또는 단편을 포함할 수 있는 것으로 이해되어야 한다.
또한 유전자 요법에 사용하기 위한 Shank 단백질(Shank1, Shank 2 및 Shank3)을 코딩하는 폴리뉴클레오타이드가 본원에 개시되어 있다.
GenBank 등록번호 BAE16756.1에 상응하는 Shank3 전장 마우스 단백질 서열은 서열번호: 5에 의해 제공된다:
일부 구현예에서, 서열번호: 5에 상응하는 Shank3 전장 마우스 단백질 서열은 서열번호: 15에 의해 제공되는 GenBank 등록번호 NM_021423에 상응하는 핵산 서열에 의해 코딩된다:
GenBank 등록번호 Q9BYB0.3에 상응하는 Shank3 전장 인간 단백질 서열은 서열번호: 6에 의해 제공된다:
일부 구현예에서, 서열번호: 6에 상응하는 Shank3 전장 인간 단백질 서열은 서열번호: 16에 의해 제공되는 GenBank 등록번호 NM_001372044에 상응하는 핵산 서열에 의해 코딩된다:
전장 Shank3 단백질은 다수의 도메인을 포함하며, 약 5.2 kb 크기인 유전자에 의해 코딩된다. 그 크기 때문에, AAV 벡터를 통해 전장 Shank3을 관심있는 조직이나 세포에 전달하는 것은 어렵다. 본 출원의 발명자들은 흥분성 뉴런에서 Shank3 활성을 회복시키는 데 효과적인 MiniShank3을 생산하기 위해 특정 도메인이 전장 Shank3 단백질로부터 제거되거나 절단될 수 있음을 발견하였다(도 5b 및 6b). 본원에 기재된 폴리뉴클레오타이드에 의해 코딩되는 Shank 단백질(예컨대, Shank3 단백질)은 천연 전장 Shank3 단백질의 단축된 변이체를 형성하기 위해 소형화될 수 있다. 본원에 개시된 바와 같이, 소형화된 Shank3 단백질, 또는 소형화된 Shank3 단백질을 코딩하는 DNA 작제물은 "miniShank3" 또는 "MiniShank3"으로 상호교환적으로 지칭된다.
일부 구현예에서, 본원에 개시된 Shank3 단백질은 소형화된 Shank3 DNA 작제물로서 발현된다. 일부 구현예에서, 본원에 개시된 변이체 Shank3 DNA 작제물 및 Shank3 단백질(MiniShank3)은 전장 Shank3 유전자 및 단백질보다 더 적은 도메인을 포함한다. 일부 구현예에서, 본원에 개시된 Shank3 단백질은 비자연 발생 폴리뉴클레오타이드에 의해 코딩된다.
본원에 기재된 폴리뉴클레오타이드에 의해 코딩되는 Shank3 단백질은 하나 이상의 단백질 도메인을 포함할 수 있다. 예를 들어, Shank3 단백질은 SH3 도메인, PDZ 도메인, 호머 결합 도메인, 코르탁틴 도메인, SAM 도메인 및/또는 안키린 반복 도메인 중 하나 이상을 포함할 수 있다.
일부 구현예에서, SH3 도메인은 그 사이의 모든 값을 포함하여 서열번호: 6의 잔기 474-525 또는 서열번호: 5의 잔기 473-524에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일하다. 일부 구현예에서, SH3 도메인은 서열번호: 6의 잔기 474-525에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, SH3 도메인은 서열번호: 5의 잔기 473-524에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, SH3 도메인은 서열번호: 6의 잔기 474-525를 포함한다. 일부 구현예에서, SH3 도메인은 서열번호: 5의 잔기 473-524를 포함한다. 일부 구현예에서, SH3 도메인은 MiniShank3의 제작에 적합한 서열번호: 6의 잔기 474-525에 대해 임의의 퍼센트 동일성을 포함할 수 있다. 일부 구현예에서, SH3 도메인은 MiniShank3의 제작에 적합한 서열번호: 5의 잔기 473-524에 대해 임의의 퍼센트 동일성을 포함할 수 있다.
일부 구현예에서, PDZ 도메인은 그 사이의 모든 값을 포함하여 서열번호: 6의 573-662 또는 서열번호: 5의 잔기 572-661에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일하다. 일부 구현예에서, PDZ 도메인은 서열번호: 6의 잔기 573-662에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, PDZ 도메인은 서열번호: 5의 잔기 572-661에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, PDZ 도메인은 서열번호: 6의 잔기 573-662를 포함한다. 일부 구현예에서, PDZ 도메인은 서열번호: 5의 잔기 572-661을 포함한다. 일부 구현예에서, PDZ 도메인은 MiniShank3의 제작에 적합한 서열번호: 6의 잔기 573-662에 대해 임의의 퍼센트 동일성을 포함할 수 있다. 일부 구현예에서, PDZ 도메인은 MiniShank3의 제작에 적합한 서열번호: 5의 잔기 572-661에 대해 임의의 퍼센트 동일성을 포함할 수 있다.
일부 구현예에서, 호머 결합 도메인은 그 사이의 모든 값을 포함하여 서열번호: 5 또는 6의 잔기 1294-1323에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일하다. 일부 구현예에서, 호머 도메인은 서열번호: 5의 잔기 1294-1323에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 호머 도메인은 서열번호: 6의 잔기 1294-1323에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 호머 도메인은 서열번호: 5 또는 6의 잔기 1294-1323을 포함한다. 일부 구현예에서, 호머 도메인은 MiniShank3의 제작에 적합한 서열번호: 5 또는 6의 잔기 1294-1323에 대해 임의의 퍼센트 동일성을 포함할 수 있다.
일부 구현예에서, 코르탁틴 결합 도메인은 그 사이의 모든 값을 포함하여 서열번호: 5 또는 6의 잔기 1400-1426에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일하다. 일부 구현예에서, 코르탁틴 결합 도메인은 서열번호: 5의 잔기 1400-1426에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 코르탁틴 결합 도메인은 서열번호: 6의 잔기 1400-1426에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 코르탁틴 결합 도메인은 서열번호: 5 또는 6의 잔기 1400-1426을 포함한다. 일부 구현예에서, 코르탁틴 결합 도메인은 MiniShank3의 제작에 적합한 서열번호: 5 또는 6의 잔기 1400-1426에 대해 임의의 퍼센트 동일성을 포함할 수 있다.
일부 구현예에서, SAM 도메인은 그 사이의 모든 값을 포함하여 서열번호: 6의 잔기 1664-1729 또는 서열번호: 5의 잔기 1663-1728에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일하다. 일부 구현예에서, SAM 결합 도메인은 서열번호: 6의 잔기 1664-1729에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, SAM 결합 도메인은 서열번호: 5의 잔기 1663-1728에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, SAM 도메인은 서열번호: 6의 잔기 1664-1729를 포함한다. 일부 구현예에서, SAM 도메인은 서열번호: 5의 잔기 1663-1728을 포함한다. 일부 구현예에서, SAM 결합 도메인은 MiniShank3의 제작에 적합한 서열번호: 6의 잔기 1664-1729에 대해 임의의 퍼센트 동일성을 포함할 수 있다. 일부 구현예에서, SAM 결합 도메인은 MiniShank3의 제작에 적합한 서열번호: 5의 잔기 1663-1728에 대해 임의의 퍼센트 동일성을 포함할 수 있다.
일부 구현예에서, 안키린 반복 도메인은 그 사이의 모든 값을 포함하여 서열번호: 6의 잔기 148-345 또는 서열번호: 5의 잔기 147-313에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일하다. 일부 구현예에서, 안키린 반복 도메인은 서열번호: 6의 잔기 148-345에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 안키린 반복 도메인은 서열번호: 5의 잔기 147-313에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 안키린 반복 도메인은 MiniShank3의 제작에 적합한 서열번호: 6의 잔기 148-345에 대해 임의의 퍼센트 동일성을 포함할 수 있다. 일부 구현예에서, 안키린 반복 도메인은 MiniShank3의 제작에 적합한 서열번호: 5의 잔기 147-313에 대해 임의의 퍼센트 동일성을 포함할 수 있다.
일부 구현예에서, MiniShank3 단백질은 서열번호: 5의 전장에 걸쳐 서열번호: 5에 대해 65% 미만 동일하다. 일부 구현예에서, MiniShank3 단백질은 서열번호: 6의 전장에 걸쳐 서열번호: 6에 대해 65% 미만 동일하다. 본원에서 사용된 바와 같이, "65% 미만"은 MiniShank3의 제작에 적합한 65% 미만의 임의의 퍼센트 동일성을 포함한다. 일부 구현예에서, MiniShank3 단백질은 서열번호: 5의 전장에 걸쳐 서열번호: 5에 대해 64%, 63%, 62%, 61%, 60%, 59%, 58%, 57%, 56%, 55%, 54%, 53%, 52%, 51%, 50%, 49%, 48%, 47%, 46%, 45%, 44%, 43%, 42%, 41%, 40%, 39%, 38%, 37%, 36%, 35%, 34%, 33%, 32%, 31%, 30%, 29%, 28%, 27%, 26%, 25%, 24%, 23%, 22%, 21%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11% 또는 10% 미만 동일하다.
일부 구현예에서, MiniShank3 단백질은 그 사이의 모든 값을 포함하여 표 1에 제공된 서열번호: 17-20 중 어느 하나에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일하거나 100% 동일한 아미노산 서열을 포함한다.
일부 구현예에서, MiniShank3 단백질은 서열번호: 17-20 중 어느 하나를 포함한다. 일부 구현예에서, 서열번호: 17은 서열번호: 1에 의해 코딩된다. 일부 구현예에서, 서열번호: 18은 서열번호: 2에 의해 코딩된다. 일부 구현예에서, 서열번호: 19는 서열번호: 3에 의해 코딩된다. 일부 구현예에서, 서열번호: 20은 서열번호: 4에 의해 코딩된다.
일부 구현예에서, MiniShank3 단백질은 안키린 반복 도메인을 포함한다. MiniShank3 단백질이 안키린 반복 도메인을 포함하는 특정 구현예에서, MiniShank3 단백질은 서열번호: 19 및/또는 20을 포함한다.
다른 구현예에서, MiniShank3 단백질은 안키린 반복 도메인을 포함하지 않는다. MiniShank3 단백질이 안키린 반복 도메인을 포함하지 않는 특정 구현예에서, MiniShank3 단백질은 서열번호: 17 및/또는 18을 포함한다.
일부 구현예에서, 본 개시내용과 관련된 MiniShank3 단백질을 코딩하는 폴리뉴클레오타이드의 서열은 그 사이의 모든 값을 포함하여 서열번호: 1-4 중 어느 하나에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일하며 Shank3 활성을 갖는 하나 이상의 단백질을 코딩한다. 일부 구현예에서, 본 개시내용과 관련된 MiniShank3 단백질을 코딩하는 폴리뉴클레오타이드의 서열은 서열번호: 1-4 중 어느 하나에 대해 적어도 90% 동일성을 포함하며 Shank3 활성을 갖는 하나 이상의 단백질을 코딩한다. 일부 구현예에서, 본 개시내용과 관련된 MiniShank3 단백질을 코딩하는 폴리뉴클레오타이드의 서열은 서열번호: 1-4 중 어느 하나를 포함한다. 일부 구현예에서, 서열번호: 1-4 중 어느 하나는 부분적인 Shank3 활성을 갖는 하나 이상의 단백질을 코딩한다. 일부 구현예에서, 서열번호: 1-4 중 어느 하나는 완전한 Shank3 활성을 갖는 하나 이상의 단백질을 코딩한다.
일부 구현예에서, MiniShank3은 표 1에 제공된 서열번호: 1-4 중 어느 하나에 의해 코딩된다. 서열번호: 1 및 서열번호: 3은 마우스 MiniShank3 핵산 서열에 상응하는 한편, 서열번호: 2 및 서열번호: 4는 인간 MiniShank3 핵산 서열에 상응한다. 서열번호: 1 및 서열번호: 2는 안키린 반복 도메인 또는 N-말단 도메인을 포함하지 않는 MiniShank3 단백질을 코딩한다. 서열번호: 3 및 서열번호: 4는 안키린 반복 도메인 및 N-말단 도메인을 포함하는 MiniShank3 단백질을 코딩한다.
MiniShank3 단백질을 코딩하는 본원에 기재된 폴리뉴클레오타이드는 적어도 부분적인 Shank3 활성을 갖는 단백질을 코딩한다.
본원에 개시된 바와 같이, 서열의 "동일성"은 당업자에게 공지된 수학적 모델, 알고리즘, 또는 컴퓨터 프로그램에 의해 다뤄지는 갭 정렬을 갖는 2개 이상의 서열 사이의 동일한 매치의 퍼센트의 측정 또는 계산을 지칭한다. 2개의 서열(예컨대, 핵산 또는 아미노산 서열)의 퍼센트 동일성은, 예를 들어 BLAST®(Basic Local Alignment Search Tool), 예컨대 NBLAST® 및 XBLAST® 프로그램(버전 2.0)을 사용하여 결정될 수 있다. Clustal Omega와 같은 정렬 기술이 다중 서열 정렬에 사용될 수 있다. 다른 알고리즘 또는 정렬 방법은, 비제한적으로 스미스-워터만(Smith-Waterman) 알고리즘, 니들만-분쉬(Needleman-Wunsch) 알고리즘, 또는 FOGSAA(Fast Optimal Global Sequence Alignment Algorithm)를 포함할 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 Shank 단백질(Shank 1, Shank2, Shank3)을 코딩하는 폴리뉴클레오타이드는 약 4.6 kb, 약 4.5 kb, 약 4.4 kb, 약 4.3 kb, 약 4.2 kb, 약 4.1 kb, 약 4.0 kb, 약 3.9 kb, 약 3.8 kb, 약 3.7 kb, 약 3.6 kb, 약 3.5 kb, 약 3.4 kb, 약 3.3 kb, 약 3.2 kb, 약 3.1 kb, 약 3.0 kb, 약 2.9 kb, 약 2.8 kb, 약 2.7 kb, 약 2.6 kb, 약 2.5 kb, 약 2.4 kb, 약 2.3 kb, 약 2.2 kb 또는 약 2.1 kb 크기 미만이다. 일부 구현예에서, 본원에 개시된 바와 같은 Shank 단백질(Shank 1, Shank2, Shank3)을 코딩하는 폴리뉴클레오타이드는 본 개시내용에 개시된 방법 및 벡터에 적합한 임의의 크기일 수 있다.
질환 및 장애
본 개시내용은 신경발달 장애, 예컨대 자폐 스펙트럼 장애(ASD) 또는 펠란-맥더미드 증후군을 치료하기에 적합한 조성물 및 방법을 제공한다.
본원에 사용된 바와 같이, "신경발달 장애"는 뇌 및/또는 중추신경계의 성장 및/또는 발달을 손상시키는 임의의 장애를 지칭한다. 일부 구현예에서, 신경발달 장애는 하나 이상의 뇌 기능, 예컨대 감정, 학습 능력, 자기 통제, 및 기억에 영향을 미친다. 본 개시내용의 양태가 임의의 신경발달 장애의 치료에 적용될 수 있는 것으로 이해되어야 한다.
일부 구현예에서, 신경발달 장애는 자폐 스펙트럼 장애(ASD)이다. ASD의 진단은 주로 의사소통 결함, 사회적 상호작용 장애, 및 반복적이거나 제한된 관심 및 행동과 같은 기준을 기초로 한다. ASD는 일란성 쌍생아의 경우 90%로 높은 일치율을 갖는 고도로 유전되는 장애이다. 그러나, ASD는 임상적으로 이질적이어서, 구별되는 증상 중증도의 다양한 별개의 장애를 커버한다. ASD는 병인학적으로 이질적이어서, 아마도 다유전자성, 단일유전자성 및 환경적 요인을 포괄하는 것으로 여겨진다.
시냅스 연결 및 기능의 변경이 ASD의 근간이 되는 핵심 메커니즘으로 제안되었다. 최근의 유전 연구들은 ASD에 대한 상당히 많은 후보 유전자를 확인하였고, 이들 중 다수는 Shank3, Neuroligin-3, Neuroligin-4 및 Neurexin-1을 포함하는 시냅스 단백질을 코딩한다. 이러한 결과는 시냅스 기능장애가 ASD의 하위 집합에 대한 일반적인 메커니즘의 근간이 될 수 있음을 시사한다. 다양한 Shank3 돌연변이가 지적 장애(ID)와 함께 ASD의 단일유전자 원인으로 확인되었다. ASD 환자에서, 확인된 모든 Shank3 결실 및/또는 돌연변이는 Shank3 유전자의 2개의 정상적인 카피 중 하나에서 기능의 상실(LoF)을 초래한다(즉, 일배체 부족). 최근 유전자 스크린은 또한 펠란-맥더미드 증후군(PMS)으로 진단되지 않은 ASD 환자에서 미세결실(microdeletion), 넌센스 돌연변이 및 반복 중단점을 포함하여 Shank3 유전자에서 다수의 돌연변이를 확인하였다. 이들은 Shank3 유전자 파괴 및/또는 돌연변이가 자폐 스펙트럼 장애(ASD)의 단일유전자 원인이라는 것을 의미한다. 현재 추정치는 Shank3와 관련된 결실 및/또는 돌연변이가 ID를 가진 모든 ASD 환자의 약 2%를 차지한다는 것이다. 따라서, Shank3의 기능의 이해는 ASD의 병리학적 메커니즘에 대한 통찰력을 제공할 수 있다.
본원에 사용된 바와 같이, "지적 장애"는 대상체가 지적 기능 및/또는 적응 기능에 결손을 갖게 하는 장애를 의미한다. 지적 기능은, 예를 들어 추론, 문제 해결, 계획, 추상적 사고, 판단, 학업 학습 및/또는 경험 학습을 포함할 수 있다. 지적 기능은 IQ 검사와 같이 당업계에 알려진 임의의 방법을 사용하여 측정될 수 있다. 적응 기능은, 예를 들어 의사소통 및 사회적 기술과 같이 독립적이고 책임있는 방식으로 생활하는 데 필요한 기술을 포함할 수 있다. 일부 경우에, 지적 장애는 아동기 또는 청소년기 동안 명백할 수 있다.
일부 구현예에서, 신경발달 장애는 펠란-맥더미드 증후군(PMS, 22q13.3 결실 증후군)이며, 이는 자폐 유사 행동, 저긴장, 중증 지적 장애 및 언어능력 및 말의 발달 장애를 나타내는 자폐 스펙트럼 장애이다. Shank3은 펠란-맥더미드 증후군에서 결실된 것으로 보고된 유전자 중 하나이다. Shank3의 파괴는 펠란-맥더미드 증후군의 핵심 신경발달 및 신경행동 결손의 원인인 것으로 생각되는데, 온전한 Shank3 유전자를 갖는 고리 염색체 22를 보유하는 개체가 표현형적으로 정상이기 때문이다.
다른 신경발달 장애는, 비제한적으로 주의력 결핍/과잉행동 장애(ADHD), 학습 장애, 예컨대 난독증 또는 난산증, 지적 장애(정신 지체), 행위 또는 운동 장애, 뇌성마비, 시각 및 청각 장애, 발달 말 장애, 신경유전 장애, 예컨대 취약성 X 증후군, 다운 증후군, 레트 증후군, 저성선자극호르몬성 성선저하 증후군(hypogonadotropic hypogonadal syndrome), 및 외상성 뇌 손상을 포함할 수 있다.
대상체
본원에 기재된 방법에 의해 치료될 대상체는 인간 대상체 또는 비인간 대상체일 수 있다. 비인간 대상체는, 예를 들어 비인간 영장류; 농장 동물, 예컨대 소, 말, 염소, 양, 및 돼지; 애완동물, 예컨대 개 및 고양이; 및 설치류를 포함한다.
본원에 기재된 방법에 의해 치료될 대상체는 신경발달 장애를 갖거나, 갖는 것으로 의심되거나, 또는 발병할 위험이 있는 대상체일 수 있다. 일부 구현예에서, 대상체는 신경발달 장애를 갖는 것으로 진단된 한편, 다른 구현예에서, 대상체는 신경발달 장애를 갖는 것으로 진단되지 않았다. 일부 구현예에서, 대상체는 자폐 스펙트럼 장애(ASD)를 갖거나, 갖는 것으로 의심되거나, 또는 발병할 위험이 있는 인간 대상체이다. 일부 구현예에서, 대상체는 펠란-맥더미드 증후군을 갖거나, 갖는 것으로 의심되거나, 또는 발병할 위험이 있는 인간 대상체이다. 일부 구현예에서, 대상체는 대조군 대상체에 비해 Shank3 유전자의 감소된 발현을 갖는 대상체이다. 일부 구현예에서, Shank3 유전자의 발현은 대조군 대상체와 비교하여 대상체에서 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%까지, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 또는 적어도 1000배 감소된다. 일부 구현예에서, 대조군 대상체는 신경발달 장애를 갖지 않거나, 갖는 것으로 의심되지 않거나, 또는 가질 위험이 없는 대상체이다. 일부 구현예에서, 대상체에서 Shank3 유전자의 감소된 발현은 Shank3 유전자의 적어도 하나의 카피의 파괴에 의해 유발된다. 일부 구현예에서, Shank3 유전자의 파괴는 Shank3 유전자의 적어도 하나의 카피 내의 결실을 포함한다. 일부 구현예에서, Shank3 유전자의 파괴는 Shank3 유전자의 적어도 하나의 카피 내에 하나 이상의 돌연변이를 포함한다.
일부 구현예에서, 대상체는 ASD의 하나 이상의 증상을 나타내는 인간 대상체이다. 일부 구현예에서, 대상체는 발달 지연을 나타내는 인간 대상체이다. 일부 구현예에서, 대상체는 지적 장애(ID)를 나타내는 인간 대상체이다. 일부 구현예에서, 대상체는 수면 장애를 나타내는 인간 대상체이다. 일부 구현예에서, 대상체는 저긴장을 나타내는 인간 대상체이다. 일부 구현예에서, 대상체는 언어능력 부족을 나타내는 인간 대상체이다. 일부 구현예에서, 대상체는 언어 지연을 나타내는 인간 대상체이다. 일부 구현예에서, 대상체는 ASD의 임의의 증상 또는 징후를 나타내는 인간 대상체이다.
일부 구현예에서, 대상체는 성인인 인간 대상체이다. 일부 구현예에서, 성인은 25세 초과이다. 일부 구현예에서, 성인은 25세 이하이다. 일부 구현예에서, 성인은 21세 이하이다. 일부 구현예에서, 성인은 18세 이하이다. 일부 구현예에서, 성인은 16세이다. 일부 구현예에서, 대상체는 노인(예컨대, 65세 이상)이다. 일부 구현예에서, 성인은 본원에 개시된 치료에 적합한 성인기의 임의의 연령일 수 있다.
일부 구현예에서, 대상체는 성인이 아닌 인간 대상체이다. 일부 구현예에서, 인간 대상체는 16세 이하이다. 일부 구현예에서, 인간 대상체는 10세 이하이다. 일부 구현예에서, 인간 대상체는 10세 이하이다. 일부 구현예에서, 인간 대상체는 어린이 또는 유아이다. 일부 구현예에서, 인간 대상체는 걸음마 아기이다. 일부 구현예에서, 인간 대상체는 발달의 태아 단계에 있다. 일부 구현예에서, 인간 대상체는 발달의 출생전 단계에 있다.
바이러스 벡터
본원에 개시된 바와 같이, MiniShank3 단백질을 코딩하는 폴리뉴클레오타이드는 바이러스 벡터에서 관심있는 조직 또는 세포로 전달될 수 있다. 본원에 기재된 벡터는, 예컨대 대상체의 특정 기관 또는 중추신경계(CNS)로의 전달을 포함하여, 대상체에게 관심있는 단백질을 코딩하는 핵산을 전달하는 데 사용될 수 있다. 일부 구현예에서, 관심있는 단백질은 Shank 단백질이다. 일부 구현예에서, 관심있는 단백질은 Shank3 단백질이다. 일부 구현예에서, 관심있는 단백질은 MiniShank3 단백질이다.
일부 구현예에서, 본 개시내용은 본원에 개시된 Shank 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 벡터를 제공한다. 일부 구현예에서, 본 개시내용은 Shank3 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 벡터를 제공한다. 일부 구현예에서, 벡터는 바이러스 벡터이다. 일부 구현예에서, 벡터는 AAV 벡터이다.
AAV는 바이러스의 파르보비리대(Parvoviridae) 속에 속하는 복제 결핍 데펜도파르보바이러스(Dependoparvovirus)를 지칭한다. AAV는 자연 발생 바이러스로부터 유래될 수 있거나 재조합일 수 있다. AAV는 자연 발생 캡시드 단백질 또는 재조합 캡시드 단백질로부터 유래될 수 있는 캡시드 내로 패키징될 수 있다. AAV의 단일 가닥 DNA 게놈은 역위 말단 반복(ITR)을 포함한다. ITR은 숙주 게놈에서의 그의 통합 및 그의 절제와 함께 AAV 게놈의 복제 및 캡슐화에 관여한다. 임의의 이론에 구속되지 않으면서, AAV 벡터는 5' ITR 및/또는 3' ITR을 포함하는 하나 이상의 ITR, 하나 이상의 프로모터, 하나 이상의 관심있는 단백질을 코딩하는 하나 이상의 핵산 서열, 및/또는 추가적인 전사후 조절자 요소를 포함할 수 있다. 본원에 개시된 AAV 벡터는, 예를 들어 그 전체가 참조로 본원에 포함된 문헌[Sambrook el al. (Molecular Cloning: A Laboratory Manual. Cold Spring Harbor Laboratory Press, N.Y. (2012))]에 기재된 바와 같이, 당업자에게 알려진 표준 분자 생물학 기술을 사용하여 제조될 수 있다.
일부 구현예에서, AAV는 숙주 세포 게놈으로 통합된다. 일부 구현예에서, AAV는 숙주 게놈 내로 통합되지 않는다. 일부 구현예에서, 본원에 개시된 AAV 벡터는 임의의 알려진 유기체로부터의 서열을 포함할 수 있다. 일부 구현예에서, 본원에 개시된 AAV 벡터는 합성 서열을 포함할 수 있다. AAV 벡터 서열은 당업자에게 알려진 임의의 방식으로, 예컨대 삽입, 결실 또는 치환을 포함시킴으로써, 및/또는 전사후 조절 요소, 예컨대 프로모터, 인핸서, 및 전사 및 번역 종결자, 예컨대 폴리아데닐화 신호의 사용을 통해 변형될 수 있다. 일부 구현예에서, AAV 벡터는 복제 및 통합과 관련된 서열을 포함할 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 MiniShank3은 AAV 벡터를 통해 관심있는 조직 또는 세포로 전달된다. 일부 구현예에서, 본원에 개시된 바와 같은 MiniShank3을 전달하는 AAV 벡터는 대상체의 중추신경계(CNS)로 전달된다. 본원에 사용된 바와 같이, AAV 벡터를 CNS로 전달하는 것은 AAV 벡터를 CNS 내의 관심있는 임의의 조직 또는 세포로 전달하는 것을 포함할 수 있다. 일부 구현예에서, AAV 벡터를 CNS로 전달하는 것은 AAV 벡터를 신경 조직 또는 세포로 전달하는 것을 포함한다. 일부 구현예에서, AAV 벡터를 CNS로 전달하는 것은 AAV 벡터를 뇌로 전달하는 것을 포함한다. 일부 구현예에서, AAV 벡터를 CNS로 전달하는 것은 AAV 벡터를 척수로 전달하는 것을 포함한다. 일부 구현예에서, AAV 벡터를 CNS로 전달하는 것은 AAV 벡터를 백질 및 회백질로 전달하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 바와 같은 MiniShank3을 전달하는 AAV 벡터는 본원에 개시된 바와 같은 치료에 적합한 대상체의 관심있는 임의의 조직 또는 세포로 전달된다.
본 개시내용에서 사용되는 바와 같이, AAV 벡터를 "전달하는 것" 또는 "투여하는 것"은 AAV 벡터 또는 AAV 벡터를 포함하는 조성물을 대상체에게 전달 또는 투여하기 위한 당업계에 공지된 임의의 방법을 포함할 수 있다. 투여는 비제한적으로 AAV 벡터 또는 AAV 벡터를 포함하는 조성물의 직접 투여, 또는 당업계에 공지된 바와 같이 혈액 뇌 장벽을 우회하기 위한 수동 확산 또는 대류 강화 전달(CED)을 통한 말초 투여를 포함할 수 있다. 본원에 기재된 AAV 벡터는 본 개시내용의 양태과 양립할 임의의 조성물로 투여될 수 있다.
AAV 벡터는, 예를 들어 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 및 AAV11을 포함하는 임의의 공지된 AAV 혈청형을 포함할 수 있다. 일부 구현예에서, AAV 혈청형은 AAV9이다. AAV 바이러스의 분기군(clade)은 문헌[Gao et al. (2004) J. Virol. 78(12):6381-6388]에 기재되어 있으며, 이로부터 참조로 포함되어 있다. 일부 구현예에서, CNS로의 전달에 적합한 임의의 AAV 혈청형이 선택될 수 있다.
본 개시내용의 AAV 벡터는 임의의 천연 또는 재조합 AAV 혈청형을 포함하거나 이로부터 유래될 수 있다. 일부 구현예에서, AAV 벡터는 그 내용이 그 전체가 참조로 본원에 포함된 WO 2017/201258A1에 기재된 AAV 혈청형, 예컨대 비제한적으로 AAV1, AAV2, AAV2G9, AAV3, AAV3a, AAV3b, AAV3-3, AAV4, AAV4-4, AAV5, AAV6, AAV6.1, AAV6.2, AAV6.1.2, AAV7, AAV7.2, AAV8, AAV9, AAV9.11, AAV9.13, AAV9.16, AAV9.24, AAV9.45, AAV9.47, AAV9.61, AAV9.68, AAV9.84, AAV9.9, AAV10, AAV11, AAV12, AAV16.3, AAV24.1, AAV27.3, AAV42.12, AAV42-1b, AAV42-2, AAV42-3a, AAV42-3b, AAV42-4, AAV42-5a, AAV42-5b, AAV42-6b, AAV42-8, AAV42-10, AAV42-11, AAV42-12, AAV42-13, AAV42-15, AAV42-aa, AAV43-1, AAV43-12, AAV43-20, AAV43-21, AAV43- 23, AAV43-25, AAV43-5, AAV44.1, AAV44.2, AAV44.5, AAV223.1, AAV223.2, AAV223.4, AAV223.5, AAV223.6, AAV223.7, AAV1-7/rh.48, AAV1-8/rh.49, AAV2-15/rh.62, AAV2- 3/rh.61, AAV2-4/rh.50, AAV2-5/rh.51, AAV3.1/hu.6, AAV3.1/hu.9, AAV3-9/rh.52, AAV3- 11/rh.53, AAV4-8/r11.64, AAV4-9/rh.54, AAV4-19/rh.55, AAV5-3/rh.57, AAV5-22/rh.58, AAV7.3/hu.7, AAV16.8/hu.10, AAV16.12/hu.11, AAV29.3/bb.1, AAV29.5/bb.2, AAV106.1/hu.37, AAV114.3/hu.40, AAV127.2/hu.41, AAV127.5/hu.42, AAV128.3/hu.44, AAV130.4/hu.48, AAV145.1/hu.53, AAV145.5/hu.54, AAV145.6/hu.55, AAV161.10/hu.60, AAV161.6/hu.61, AAV33.12/hu.17, AAV33.4/hu.15, AAV33.8/hu.16, AAV52/hu.19, AAV52.1/hu.20, AAV58.2/hu.25, AAVA3.3, AAVA3.4, AAVA3.5, AAVA3.7, AAVC1, AAVC2, AAVC5, AAV-DJ, AAV-DJ8, AAVF3, AAVF5, AAVH2, AAVrh.72, AAVhu.8, AAVrh.68, AAVrh.70, AAVpi.1, AAVpi.3, AAVpi.2, AAVrh.60, AAVrh.44, AAVrh.65, AAVrh.55, AAVrh.47, AAVrh.69, AAVrh.45, AAVrh.59, AAVhu.12, AAVH6, AAVLK03, AAVH-1/hu.1, AAVH-5/hu.3, AAVLG-10/rh.40, AAVLG-4/rh.38, AAVLG-9/hu.39, AAVN721-8/rh.43, AAVCh.5, AAVCh.5R1, AAVcy.2, AAVcy.3, AAVcy.4, AAVcy.5, AAVCy.5R1, AAVCy.5R2, AAVCy.5R3, AAVCy.5R4, AAVcy.6, AAVhu.1, AAVhu.2, AAVhu.3, AAVhu.4, AAVhu.5, AAVhu.6, AAVhu.7, AAVhu.9, AAVhu.10, AAVhu.11, AAVhu.13, AAVhu.15, AAVhu.16, AAVhu.17, AAVhu.18, AAVhu.20, AAVhu.21, AAVhu.22, AAVhu.23.2, AAVhu.24, AAVhu.25, AAVhu.27, AAVhu.28, AAVhu.29, AAVhu.29R, AAVhu.31, AAVhu.32, AAVhu.34, AAVhu.35, AAVhu.37, AAVhu.39, AAVhu.40, AAVhu.41, AAVhu.42, AAVhu.43, AAVhu.44, AAVhu.44R1, AAVhu.44R2, AAVhu.44R3, AAVhu.45, AAVhu.46, AAVhu.47, AAVhu.48, AAVhu.48R1, AAVhu.48R2, AAVhu.48R3, AAVhu.49, AAVhu.51, AAVhu.52, AAVhu.54, AAVhu.55, AAVhu.56, AAVhu.57, AAVhu.58, AAVhu.60, AAVhu.61, AAVhu.63, AAVhu.64, AAVhu.66, AAVhu.67, AAVhu.14/9, AAVhu.t 19, AAVrh.2, AAVrh.2R, AAVrh.8, AAVrh.8R, AAVrh.10, AAVrh.12, AAVrh.13, AAVrh.13R, AAVrh.14, AAVrh.17, AAVrh.18, AAVrh.19, AAVrh.20, AAVrh.21, AAVrh.22, AAVrh.23, AAVrh.24, AAVrh.25, AAVrh.31, AAVrh.32, AAVrh.33, AAVrh.34, AAVrh.35, AAVrh.36, AAVrh.37, AAVrh.37R2, AAVrh.38, AAVrh.39, AAVrh.40, AAVrh.46, AAVrh.48, AAVrh.48.1, AAVrh.48.1.2, AAVrh.48.2, AAVrh.49, AAVrh.51, AAVrh.52, AAVrh.53, AAVrh.54, AAVrh.56, AAVrh.57, AAVrh.58, AAVrh.61, AAVrh.64, AAVrh.64R1, AAVrh.64R2, AAVrh.67, AAVrh.73, AAVrh.74, AAVrh8R, AAVrh8R A586R 돌연변이체, AAVrh8R R533A 돌연변이체, AAAV, BAAV, 염소 AAV, 소 AAV, AAVhE1.1, AAVhEr1.5, AAVhER1.14, AAVhEr1.8, AAVhEr1.16, AAVhEr1.18, AAVhEr1.35, AAVhEr1.7, AAVhEr1.36, AAVhEr2.29, AAVhEr2.4, AAVhEr2.16, AAVhEr2.30, AAVhEr2.31, AAVhEr2.36, AAVhER1.23, AAVhEr3.1, AAV2.5T , AAV-PAEC, AAV-LK01, AAV-LK02, AAV-LK03, AAV-LK04, AAV-LK05, AAV-LK06, AAV-LK07, AAV-LK08, AAV-LK09, AAV-LK10, AAV-LK11, AAV-LK12, AAV-LK13, AAV-LK14, AAV-LK15, AAV-LK16, AAV-LK17, AAV-LK18, AAV-LK19, AAV-PAEC2, AAV-PAEC4, AAV- PAEC6, AAV-PAEC7, AAV-PAEC8, AAV-PAEC11, AAV-PAEC12, AAV-2-pre-miRNA- 101 , AAV-8h, AAV-8b, AAV-h, AAV-b, AAV SM 10-2, AAV 셔플 100-1 , AAV 셔플 100-3, AAV 셔플 100-7, AAV 셔플 10-2, AAV 셔플 10-6, AAV 셔플 10-8, AAV 셔플 100-2, AAV SM 10-1, AAV SM 10-8 , AAV SM 100-3, AAV SM 100-10, BNP61 AAV, BNP62 AAV, BNP63 AAV, AAVrh.50, AAVrh.43, AAVrh.62, AAVrh.48, AAVhu.19, AAVhu.11, AAVhu.53, AAV4-8/rh.64, AAVLG-9/hu.39, AAV54.5/hu.23, AAV54.2/hu.22, AAV54.7/hu.24, AAV54.1/hu.21, AAV54.4R/hu.27, AAV46.2/hu.28, AAV46.6/hu.29, AAV128.1/hu.43, 트루 타입 AAV(ttAAV), UPENN AAV 10, 일본 AAV 10 혈청형, AAV CBr-7.1, AAV CBr-7.10, AAV CBr-7.2, AAV CBr-7.3, AAV CBr-7.4, AAV CBr-7.5, AAV CBr-7.7, AAV CBr-7.8, AAV CBr-B7.3, AAV CBr-B7.4, AAV CBr-E1, AAV CBr-E2, AAV CBr-E3, AAV CBr-E4, AAV CBr-E5, AAV CBr-e5, AAV CBr-E6, AAV CBr-E7, AAV CBr- E8, AAV CHt-1, AAV CHt-2, AAV CHt-3, AAV CHt-6.1, AAV CHt-6.10, AAV CHt-6.5, AAV CHt-6.6, AAV CHt-6.7, AAV CHt-6.8, AAV CHt-P1, AAV CHt-P2, AAV CHt-P5, AAV CHt-P6, AAV CHt-P8, AAV CHt-P9, AAV CKd-1, AAV CKd-10, AAV CKd-2, AAV CKd-3, AAV CKd-4, AAV CKd-6, AAV CKd-7, AAV CKd-8, AAV CKd-B1, AAV CKd-B2, AAV CKd-B3, AAV CKd-B4, AAV CKd-B5, AAV CKd-B6, AAV CKd-B7, AAV CKd-B8, AAV CKd-H1, AAV CKd-H2, AAV CKd-H3, AAV CKd-H4, AAV CKd-H5, AAV CKd-H6, AAV CKd-N3, AAV CKd-N4, AAV CKd-N9, AAV CLg-F1, AAV CLg-F2, AAV CLg-F3, AAV CLg-F4, AAV CLg-F5, AAV CLg-F6, AAV CLg-F7, AAV CLg-F8, AAV CLv-1, AAV CLv1- 1, AAV Clv1-10, AAV CLv1-2, AAV CLv-12, AAV CLv1-3, AAV CLv-13, AAV CLv1-4, AAV Clv1-7, AAV Clv1-8, AAV Clv1-9, AAV CLv-2, AAV CLv-3, AAV CLv-4, AAV CLv-6, AAV CLv-8, AAV CLv-D1, AAV CLv-D2, AAV CLv-D3, AAV CLv-D4, AAV CLv-D5, AAV CLv-D6, AAV CLv-D7, AAV CLv-D8, AAV CLv-E1, AAV CLv-K1, AAV CLv-K3, AAV CLv-K6, AAV CLv-L4, AAV CLv-L5, AAV CLv-L6, AAV CLv-M1, AAV CLv-M11, AAV CLv-M2, AAV CLv-M5, AAV CLv-M6, AAV CLv-M7, AAV CLv-M8, AAV CLv-M9, AAV CLv-R1, AAV CLv-R2, AAV CLv-R3, AAV CLv-R4, AAV CLv-R5, AAV CLv-R6, AAV CLv-R7, AAV CLv-R8, AAV CLv-R9, AAV CSp-1, AAV CSp-10, AAV CSp-11, AAV CSp-2, AAV CSp-3, AAV CSp-4, AAV CSp-6, AAV CSp-7, AAV CSp-8, AAV CSp-8.10, AAV CSp-8.2, AAV CSp-8.4, AAV CSp-8.5, AAV CSp-8.6, AAV CSp-8.7, AAV CSp-8.8, AAV CSp-8.9, AAV CSp-9, AAV.hu.48R3, AAV.VR-355, AAV3B, AAV4, AAV5, AAVF1/HSC1, AAVF11/HSC11, AAVF12/HSC12, AAVF13/HSC13, AAVF14/HSC14, AAVF15/HSC15, AAVF16/HSC16, AAVF17/HSC17, AAVF2/HSC2, AAVF3/HSC3, AAVF4/HSC4, AAVF5/HSC5, AAVF6/HSC6, AAVF7/HSC7, AAVF8/HSC8, AAVF9/HSC9, AAV-PHP.B(PHP.B), AAV-PHP.A(PHP.A), G2B-26, G2B-13, TH1.1-32 및/또는 TH1.1-35, 및 이의 변이체를 이용하거나 이를 기반으로 할 수 있다. AAV 벡터는 US 9,585,971, US 2017/0166926, 및 WO2020/160337에 추가로 기재되어 있으며, 이들은 그 전체가 본원에 참조로 포함되어 있다.
일부 구현예에서, 본원에 개시된 MiniShank3은 AAV 벡터에 의해 전달된다. 일부 구현예에서, AAV 벡터는 이식유전자 및 이의 조절 서열, 및 선택적으로 5' 및 3' ITR을 포함한다. 일부 구현예에서, 이식유전자 및 그의 조절 서열은 5' 및 3' ITR 서열에 측접된다. 이식유전자는 본원에 개시된 바와 같이 MiniShank3을 코딩하는 하나 이상의 영역을 포함할 수 있다. 이식유전자는 또한 또 다른 단백질을 코딩하는 영역을 포함할 수 있다. 이식유전자는 또한 하나 이상의 발현 제어 서열(예컨대, 폴리-A 테일)을 포함할 수 있다. 일부 구현예에서, AAV 벡터는 적어도 AAV ITR 및 MiniShank3 이식유전자를 포함한다.
일부 구현예에서, AAV는 AAV 입자로 패키징되고 대상체에게 투여되고/되거나 선택된 표적 세포로 전달될 수 있다. 일부 구현예에서, AAV 입자는 AAV 캡시드 단백질을 포함한다. 일부 구현예에서, AAV 입자는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, PHB.eB, AAV.rh8, AAV.rh10, AAV.rh39, AAV.43, AAV2/2-66, AAV2/2-84, 및 AAV2/2-125, 또는 전술한 것 중 임의의 것의 변이체를 포함하는 본원에 개시된 바와 같은 AAV 혈청형으로부터 선택된 적어도 하나의 캡시드 단백질을 포함한다.
일부 구현예에서, AAV 벡터 내의 miniShank3 이식유전자 코딩 서열은 조직 특이적 유전자 발현을 위한 조절 서열에 작동가능하게 연결된다. 일부 경우, 조직 특이적 조절 서열은 조직 특이적 방식으로 전사를 유도하는 조직 특이적 전사 인자에 결합한다. 그러한 조직 특이적 조절 서열(예컨대, 프로모터, 인핸서 등)은 당업계에 잘 알려져 있다. 일부 구현예에서, 조직 특이적 조절 서열은 Syn 프로모터(예컨대, hSyn1)일 수 있다. 일부 구현예에서, 조직 특이적 조절 서열은 뉴런 특이적이며 본원에 기재된 치료에 적합한 임의의 프로모터 또는 인핸서일 수 있다.
일부 구현예에서, AAV 벡터에서 서열번호: 2 또는 4를 포함하는 miniShank3 이식유전자 코딩 서열은 프로모터에 작동 가능하게 연결되고, AAV ITR에 의해 측접된다. 일부 구현예에서, AAV 벡터에서 서열번호: 1 또는 3을 포함하는 miniShank3 이식유전자 코딩 서열은 프로모터에 작동가능하게 연결되고, AAV ITR에 의해 측접된다.
본 개시내용의 양태은 miniShank3 이식유전자를 발현하는 AAV 벡터에 관한 것이다. 일부 구현예에서, miniShank3 이식유전자는 AAV ITR에 의해 측접된다. 일부 구현예에서, AAV ITR은 AAV2 ITR을 포함한다. 일부 구현예에서, AAV ITR은 AAV1 ITR을 포함한다. 일부 구현예에서, AAV ITR은 AAV5 ITR을 포함한다. 일부 구현예에서, AAV ITR은 AAV6 ITR을 포함한다. 일부 구현예에서, AAV ITR은 AAV8 ITR을 포함한다. 일부 구현예에서, AAV ITR은 AAV9 ITR을 포함한다. 일부 구현예에서, AAV ITR은 rh10 ITR을 포함한다. 일부 구현예에서, AAV ITR은 자기 상보적 ITR을 포함할 수 있다.
본원에 기재된 AAV 벡터는 MiniShank3과 같은 이식유전자, 5' 및/또는 3' ITR, 프로모터, 인트론, 및/또는 당업계에 공지된 다른 관련 조절 요소를 포함하는 DNA 작제물을 포함할 수 있는 것으로 이해되어야 한다.
일부 구현예에서, AAV 벡터는 miniShank3 이식유전자 발현을 향상시킬 수 있는 우드척 간염 바이러스 전사후 조절 요소(Woodchuck Hepatitis Virus Posttranscriptional Regulatory Element, WPRE)를 포함한다. 일부 구현예에서, AAV 벡터는 미번역 부분, 예컨대 인트론 또는 5' 또는 3' 미번역 영역을 포함한다. 일부 구현예에서, 인트론은 프로모터/인핸서 서열 및 miniShank3 이식유전자 사이에 위치할 수 있다.
일부 구현예에서, 본원에서 사용되는 AAV 벡터는 자기 상보적 벡터일 수 있다.
도 15는 인간 시냅신 1(hSyn1) 프로모터의 제어 하에 발현되는 인간 miniShank3 이식유전자를 포함하는 AAV 벡터의 예(도 15에서 "AAV-hSyn1-HumanMiniShank3-V1"으로 지칭됨)를 보여준다. 도 15에 나타낸 AAV 벡터는 표 1에서 서열번호: 21로 제공된 서열을 포함한다.
도 15에 나타낸 바와 같이, 서열번호: 21은 인간 Mini-Shank3 유전자, 5'-ITR, 3'-ITR, WPRE, hGH polyA, F1 원점, NeoR/KanR 마커, hSyn1 프로모터, 및 PUC 원점을 포함한다. 일부 구현예에서, 역위 말단 반복(ITR) 서열은 각각 약 145개의 뉴클레오타이드를 포함한다. 이러한 요소는 효과적인 복제 및 캡슐화를 위해 cis에서 유용할 수 있다. 당업자는 당업계에 공지된 AAV 벡터의 임의의 요소가 본 개시내용의 양태와 양립할 수 있음을 인식할 것이다. 당업자는 또한 기능적 MiniShank3 단백질을 코딩하는 본원에 기재된 임의의 폴리뉴클레오타이드 서열이 AAV 전달을 위해 도 15에 나타낸 것과 유사한 DNA 작제물에서 발현될 수 있음을 인식할 것이다. 이들 DNA 작제물은 도 15에 나타낸 요소 중 하나 이상을 포함할 수 있다. 예를 들어, 일부 구현예에서, 서열번호: 1-4 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일성을 포함하는 코딩 서열은 도 15에 나타낸 것과 같은 DNA 작제물에서 발현된다. 일부 구현예에서 서열번호: 1-4 중 어느 하나의 서열을 포함하는 코딩 서열은 도 15에 나타낸 것과 같은 DNA 작제물에서 발현된다. 일부 구현예에서, DNA 작제물은 도 15에 나타낸 요소, 예컨대 프로모터, 5'-ITR, 3'-ITR, WPRE, hGH polyA, F1 원점, NeoR/KanR 마커 및/또는 PUC 원점 중 하나 이상을 포함한다.
일부 구현예에서, 본 개시내용과 관련된 AAV 벡터는 그 사이의 모든 값을 포함하여 서열번호: 21의 서열에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 포함하거나 100% 동일한 MiniShank3 단백질을 코딩하는 핵산 서열을 포함한다. 일부 구현예에서, AAV 벡터는 서열번호: 18의 서열을 포함하는 MiniShank3 단백질을 코딩하는 서열번호: 21에 상응하는 서열을 포함한다.
일부 구현예에서, 그 사이의 모든 값을 포함하여 서열번호: 21의 서열에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일하고 서열번호: 18의 서열을 포함하는 MiniShank3 단백질을 코딩하는 서열을 포함하는 AAV 벡터는 이를 필요로 하는 인간 대상체에게 전달할 수 있고, 신경발달 장애를 가진 인간 대상체를 치료하는 데 적합할 수 있다.
당업자가 이해할 수 있는 바와 같이, 임상 사용을 위해 AAV 벡터를 설계하고 AAV 벡터를 전달하기 위한 당업계에 공지된 임의의 방법은 본 개시내용의 양태과 양립가능할 수 있다. 예를 들어, AAV 벡터 및 전달과 관련된 개시내용의 비제한적 예는 "Adeno-associated virus (AAV) clades, sequences, vectors containing same, and uses therefor"라는 명칭의 미국 특허 7,906,111 및 "AAV-vectors for use in gene therapy of choroideremia"라는 명칭의 미국 특허 9,834,788에 제공되며 참조로 포함되고, 이들 각각은 그 전체가 본원에 참고로 포함되어 있다.
일부 구현예에서, 본 개시내용과 관련된 AAV 벡터는 그 사이의 모든 값을 포함하여 표 1에 제공된 서열번호: 7 또는 21의 서열에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일한 AAV 전달을 위한 MiniShank3 단백질을 코딩하는 서열을 포함한다. 서열번호: 7은 서열번호: 11의 단백질 서열을 코딩한다. 서열번호: 8은 서열번호: 12의 단백질 서열을 코딩한다. 서열번호: 10은 서열번호: 14의 단백질 서열을 코딩한다. 서열번호: 21은 서열번호: 18의 단백질 서열을 코딩한다.
일부 구현예에서, AAV 전달을 위한 MiniShank3 단백질을 코딩하는 AAV 벡터는 표 1에 제공된 서열번호: 11 또는 17-20 중 어느 하나에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일한 서열을 갖는 단백질을 코딩한다.
일부 구현예에서, 본원에 개시된 바와 같은 miniShank3을 전달하기 위해 사용되는 벡터는 렌티바이러스 벡터일 수 있다. 일부 구현예에서, 본원에 개시된 바와 같은 miniShank3을 전달하기 위해 사용되는 벡터는 아데노바이러스 벡터일 수 있다.
일부 구현예에서, 본원에 개시된 벡터 작제물은 표 1에 나타낸 바와 같은 서열번호: 21을 포함할 수 있다.
일부 구현예에서, Shank3 단백질의 폴리뉴클레오타이드를 포함하는 벡터(즉, miniShank3 DNA 작제물)는 관심있는 특정 조직 또는 세포에서 발현될 수 있다. 일부 구현예에서, 본원에 개시된 벡터는 프로모터를 포함한다. 일부 구현예에서, 벡터는 세포 유형 특이적 프로모터를 포함한다. 일부 구현예에서, 프로모터는 인간 프로모터이다. 일부 구현예에서, 인간 프로모터는 인간 시냅신 1(hSyn1)이다. 일부 구현예에서, hSyn1 프로모터는 서열번호: 22에 상응하는 폴리뉴클레오타이드 서열을 갖는다. 일부 구현예에서, 인간 프로모터는 당업계에 공지되고 miniShank3의 제작에 적합한 임의의 프로모터일 수 있다. 일부 구현예에서, 인간 프로모터는 뉴런 조직 및 세포에 대해 높은 특이성을 갖는 임의의 프로모터일 수 있다. 일부 구현예에서, 프로모터는 구성적 프로모터일 수 있다. 예를 들어, 구성적 프로모터는 CAG 프로모터일 수 있다. 당업자가 이해할 수 있는 바와 같이, 선택된 프로모터가 본 개시내용의 양태와 양립가능한 한 임의의 프로모터가 사용될 수 있다.
조성물 및 투여
본 개시내용은 본원에 개시된 바와 같은 AAV 벡터에서 전달된 폴리뉴클레오타이드(예컨대, miniShank3) 및 약제학적으로 허용가능한 담체를 포함하는 약제학적 조성물을 포함하는 조성물을 제공한다.
본 개시내용의 조성물은 AAV 단독, 또는 하나 이상의 다른 바이러스와 조합된 AAV를 포함할 수 있다. 일부 구현예에서, 조성물은 각각 하나 이상의 상이한 Shank 단백질을 갖는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 초과의 상이한 AAV를 포함한다.
적합한 담체는 AAV가 지시된 조치에 비추어 당업자에 의해 쉽게 선택될 수 있다. 예를 들어, 하나의 적합한 담체는 다양한 완충 용액(예컨대, 인산염 완충 식염수)으로 제제화될 수 있는 식염수를 포함한다. 다른 예시적인 담체는 멸균 식염수, 락토스, 수크로스, 인산칼슘, 젤라틴, 덱스트란, 한천, 펙틴, 땅콩유, 참기름 및 물을 포함한다. 담체의 선택은 본 개시내용의 제한이 아니다. AAV 벡터를 포함하는 약제학적 조성물은 US 9,585,971 및 US 2017/0166926에 추가로 기재되어 있으며, 이들은 그 전체가 참조로 본원에 포함되어 있다.
본원에 사용된 바와 같이, "담체"는 임의의 및 모든 용매, 분산 매질, 비히클, 코팅, 희석제, 항균제 및 항진균제, 등장성 및 흡수 지연제, 완충제, 담체 용액, 현탁액, 콜로이드 등을 포함한다. 약제학적 활성 물질에 대한 이러한 매질 및 제제의 사용은 당업계에 잘 알려져 있다. 보충 활성 성분이 또한 조성물에 혼입될 수 있다. 문구 "약제학적으로 허용가능한"은 숙주에 투여될 때 알레르기 또는 유사한 원치 않는 반응을 일으키지 않는 분자 엔티티 및 조성물을 지칭한다.
전달 비히클, 예컨대 리포좀, 나노캡슐, 미세입자, 미소구체, 지질 입자, 소포 등은 본 개시내용의 조성물을 적합한 숙주 세포로 도입하기 위해 사용될 수 있다. 특히, AAV 벡터 전달된 이식유전자는 지질 입자, 리포좀, 소포, 나노구체 또는 나노입자 등에 캡슐화된 전달을 위해 제제화될 수 있다.
이러한 제제는 본원에 개시된 핵산 또는 AAV 작제물의 약제학적으로 허용가능한 제제의 도입에 바람직할 수 있다. 리포좀의 형성 및 사용은 일반적으로 당업자에게 공지되어 있다. 최근에는, 혈청 안정성과 순환 반감기가 개선된 리포좀이 개발되었다(미국 특허 5,741,516). 또한, 잠재적인 약물 담체로서 리포좀 및 리포좀 유사 제제의 다양한 방법이 기재되었다(US 특허 5,567,434; 5,552,157; 5,565,213; 5,738,868 및 5,795,587).
리포좀은 수성 매질에 분산되어 자발적으로 다중층 동심원 이중층 소포(다층 소포(MLV)라고도 함)를 형성하는 인지질로부터 형성된다. MLV는 일반적으로 25 nm 내지 4 μm의 직경을 갖는다. MLV의 초음파 처리는 코어에 수용액을 함유하는, 200~500 Å 범위의 직경을 갖는 작은 단층 소포(SUV)의 형성을 초래한다.
대안적으로, AAV 벡터의 나노캡슐 제제가 사용될 수 있다. 나노캡슐은 일반적으로 안정적이고 재현가능한 방식으로 물질을 포획할 수 있다. 세포내 고분자 과부하로 인한 부작용을 피하기 위해, 이러한 초미세 입자(약 0.1 μm 크기)는 생체내에서 분해될 수 있는 고분자를 사용하여 설계되어야 한다. 이러한 요구사항을 충족하는 생분해성 폴리알킬-시아노아크릴레이트 나노입자가 사용을 위해 고려된다.
일부 구현예에서, AAV 벡터에서 전달되는 핵산을 포함하는 약제학적 조성물은 다른 약제학적 성분, 예컨대 보존제, 또는 화학적 안정제를 포함한다. 적합한 예시적인 방부제는 클로로부탄올, 소르브산칼륨, 소르브산, 이산화황, 프로필 갈레이트, 파라벤, 에틸 바닐린, 글리세린, 페놀, 티메로살, 및 파라클로로페놀을 포함한다. 적합한 화학적 안정제는 젤라틴 및 알부민을 포함한다. 많은 경우에, 등장화제, 예를 들어 당 또는 염화나트륨을 포함하는 것이 바람직할 것이다. 약제학적 조성물의 연장된 흡수는 흡수를 지연시키는 제제, 예를 들어 알루미늄 모노스테아레이트 및 젤라틴을 조성물에 사용함으로써 야기될 수 있다.
AAV 벡터를 전달하기에 적합한 약제학적 형태는 멸균 주사액 또는 분산액의 즉석 제조를 위한 멸균 수용액 또는 분산액 및 멸균 분말을 포함한다. 분산액은 또한 글리세롤, 액체 폴리에틸렌 글리콜, 및 이들의 혼합물 및 오일에서 제조될 수 있다. 일반적인 보관 및 사용 조건 하에서, 이들 제제는 미생물의 성장을 방지하기 위한 보존제를 함유한다. 많은 경우에, 상기 형태는 쉽게 주사할 수 있을 정도로 무균 상태이고 유동적이다. 그것은 제조 및 보관 조건 하에 안정해야 하며 박테리아 및 곰팡이와 같은 미생물의 오염 작용에 대해 보존되어야 한다.
본원에 기재된 방법은 원하는 조직(예를 들어, 뇌)의 세포를 형질감염시키고 과도한 부작용 없이 충분한 수준의 유전자 전달 및 발현을 제공하기에 충분한 양으로 AAV 벡터를 투여하는 단계를 포함한다. 통상적이고 약제학적으로 허용가능한 투여 경로는 비제한적으로 선택된 기관으로의 직접 전달, 경구, 흡입, 안구내, 안면 정맥 주사 및 안와후 주사를 포함하는 정맥내, 뇌실내(ICV), 근육내, 척수강내, 두개내, 피하, 피내, 종양내, 및 기타 비경구 투여 경로를 포함한다. 투여 경로는 원하는 경우 조합될 수 있다. 일부 구현예에서, 본원에 개시된 바와 같은 벡터는 정맥내로 투여된다.
일부 구현예에서, 본 개시내용은 신경발달 장애를 갖는 대상체를 치료하는 방법을 제공한다. 일부 구현예에서, 본 개시내용은 자폐 스펙트럼 장애(ASD)를 갖는 대상체를 치료하는 방법을 제공한다. 일부 구현예에서, 본 개시내용은 펠란-맥더미드 증후군을 갖는 대상체를 치료하는 방법을 제공한다. 본원에 제공된 방법은, 일부 구현예에서 Shank3 단백질(예컨대, miniShank3)을 코딩하는 폴리뉴클레오타이드를 포함하는 벡터를 포함하는 조성물의 유효량을 대상체의 표적 환경 또는 조직에 투여하고 전달하는 단계를 포함한다. 일부 구현예에서, 표적 조직은 피질이다. 일부 구현예에서, 표적 조직은 선조체이다. 일부 구현예에서, 표적 조직은 시상 소뇌이다. 일부 구현예에서, 표적 조직은 해마이다. 일부 구현예에서, 표적 조직은 임의의 뇌 구조이다. 일부 구현예에서, Shank3 단백질(예컨대, miniShank3)을 코딩하는 폴리뉴클레오타이드를 포함하는 벡터를 포함하는 조성물의 유효량을 표적 환경 또는 조직에 투여하고 전달하는 방법은 조성물을 뉴런 또는 다른 뇌 세포 유형에 전달하는 단계를 포함한다. 일부 구현예에서, 벡터는 AAV 벡터이다. 일부 구현예에서, 이를 필요로 하는 대상체의 표적 환경 또는 조직에 핵산을 전달하기 위한 방법은 대상체의 표적 환경 또는 조직에 전달될 적어도 핵산(예컨대, miniShank3)을 포함하는 AAV 벡터를 포함하는 조성물을 제공하는 단계 및 조성물을 대상체에게 투여하는 단계를 포함한다. AAV 벡터의 사용 방법은 US 9,585,971, US 2017/0166926, 및 WO2020/160337에 추가로 기재되어 있으며, 이들은 그 전체가 본원에 참조로 포함된다. 일부 구현예에서, 조성물은 캡시드 단백질을 포함할 수 있다.
일부 구현예에서, Shank3 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 벡터를 포함하는 조성물은 정맥내 투여, 전신 투여, 뇌실내 투여, 자궁내 투여, 척수강내 투여, 안와후 주사 또는 안면 정맥 주사를 통해 대상체에게 전달된다. 일부 구현예에서, 자궁내 투여는 발달의 출생전 단계에 있는 대상체에게 사용된다. 일부 구현예에서, 조성물은 나노입자를 통해 대상체에게 전달된다. 일부 구현예에서, 조성물은 바이러스 벡터를 통해 대상체에게 전달된다. 일부 구현예에서, 조성물은 핵산 물질을 전달하기에 적합한 임의의 담체를 통해 대상체에게 전달된다.
대상체에게 일부 유용하거나 이익이 될 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 벡터를 포함하는 임의의 조성물은 본원에 개시된 방법에 따라 대상체의 표적 환경 또는 조직으로 전달될 수 있다
상기 기재된 전달 방법 외에도, AAV 조성물을 숙주에 전달하는 대안적인 방법으로서 하기 기술이 또한 고려된다. 초음파 치료(즉, 초음파)가 사용되었고, 순환계 내로 및 이를 통한 약물 침투의 속도 및 효능을 향상시키기 위한 장치로서 US 5,656,016에 기재되었다. 고려되는 다른 약물 전달 대안은 골내 주사(미국 특허 5,779,708), 마이크로칩 장치(미국 특허 5,797,898), 안과용 제제(Bourlais et al., 1998), 경피 매트릭스(미국 특허 5,770,219 및 5,783,208) 및 피드백 제어 전달(미국 특허 5,697,899)이다.
특정 "치료 효과"를 달성하는 데 필요한 Shank3 단백질(예컨대, miniShank3)을 코딩하는 폴리뉴클레오타이드를 포함하는 AAV의 용량, 예컨대 절대 벡터 게놈(vg) 또는 약제학적 용액의 밀리리터당 벡터 게놈(vg/mL)의 용량 단위는, 비제한적으로 AAV 투여 경로, 치료 효과를 달성하는 데 필요한 유전자 발현의 수준, 치료될 특정 질환 또는 장애, 및 유전자 산물의 안정성을 포함하는 여러 인자에 따라 달라질 수 있다. 신경발달에 영향을 미치지 않으면서 감염의 최대 백분율을 제공하는 용량도 적합하다. 당업자는 전술한 인자뿐만 아니라 다른 인자에 기초하여 특정 질환 또는 장애를 갖는 환자를 치료하기 위한 AAV 용량 범위를 쉽게 결정할 수 있다.
AAV 벡터의 유효량은 동물 또는 인간 대상체를 감염시키거나 원하는 조직을 표적으로 하기에 충분한 양이다. 유효량은 주로 대상체의 종, 연령, 성별, 체중, 건강, 및 표적화될 조직과 같은 인자에 따라 달라질 것이며, 이는 따라서 대상체와 조직 간에 다를 수 있다. 대상체에게 투여하기 위한 조성물 또는 용량의 맥락에서 용어 "유효량"은 대상체에서 하나 이상의 원하는 반응을 생성하는 조성물의 양 또는 용량을 지칭한다. 일부 구현예에서, 본원에 개시된 조성물의 유효량은 돌연변이된 Shank3 유전자의 효과를 부분적으로 또는 완전히 구제하고/하거나 Shank3 단백질의 기능 손실을 부분적으로 또는 완전히 회복할 수 있다. 유효량은 바람직하지 않은 반응의 수준을 감소시키는 것을 포함할 수 있지만, 일부 구현예에서 그것은 바람직하지 않은 반응을 모두 방지하는 것을 포함한다. 유효량은 또한 바람직하지 않은 반응의 발생을 지연시키는 것을 포함할 수 있다. 유효량은 또한 원하는 치료 종점 또는 원하는 치료 결과를 생성하는 양일 수 있다. 다른 구현예에서, 유효량은 치료 종점 또는 결과와 같은 원하는 반응의 수준을 향상시키는 것을 포함할 수 있다. 상기 중 어느 것의 달성은 통상적인 방법 및 본 출원에 개시된 방법에 의해 모니터링될 수 있다. 유효량은 물론 치료되는 특정 대상체; 병태의 중증도; 연령, 신체 상태, 체격 및 체중을 포함하는 개별 환자 매개변수; 치료 지속기간; 동시 요법의 특성(있는 경우); 특정 투여 경로 및 유사 인자에 따라 달라질 것이다.
예를 들어, 일부 구현예에서, 개체에 투여된 벡터 게놈의 수는 약 6.0x1011 vg 내지 약 9.0x1013 vg 사이의 임의의 값이다. 일부 구현예에서, 대상체에게 투여되는 벡터 게놈의 수는 약 6.0 x1013 vg/mL 내지 약 9.0 x1013 vg 사이의 임의의 값이다. 일부 구현예에서, 대상체에게 투여된 벡터 게놈의 수는 약 1x1010 내지 약 1x1012 vg 사이의 임의의 값이다. 특정 구현예에서, AAV의 유효량은 kg당 1010, 1011, 1012, 1013, 또는 1014 게놈 카피이다. 특정 구현예에서, AAV의 유효량은 대상체당1010, 1011, 1012, 1013, 1014, 또는 1015 게놈 카피이다. 일부 경우에, 약 1011 내지 1013 AAV 게놈 카피 사이의 투여량이 적절하다. 일부 구현예에서, 대상체에게 투여된 벡터 게놈의 수는 본원에 개시된 치료 및 방법에 적합한 임의의 용량일 수 있다.
일부 구현예에서, AAV의 용량은 역일(예컨대, 24시간 기간)당 1회 이하로 대상체에게 투여된다. 일부 구현예에서, AAV의 용량은 2, 3, 4, 5, 6 또는 7 역일당 1회 이하로 대상체에게 투여된다. 일부 구현예에서, AAV의 용량은 역주(예컨대, 7 역일)당 1회 이하로 대상체에게 투여된다. 일부 구현예에서, AAV의 용량은 격주(예컨대, 2 역주 기간에 1회) 이하로 대상체에게 투여된다. 일부 구현예에서, AAV의 용량은 역월당 1회(예컨대, 30일에 1회) 이하로 대상체에게 투여된다. 일부 구현예에서, AAV의 용량은 6 역월당 1회 이하로 대상체에게 투여된다. 일부 구현예에서, AAV의 용량은 역년(예컨대, 365일 또는 윤년의 366일)당 1회 이하로 대상체에게 투여된다. 일부 구현예에서, rAAV의 용량은 2역년(예컨대, 730일 또는 윤년의 731일)당 1회 이하로 대상체에게 투여된다. 일부 구현예에서, AAV의 용량은 3역년(예컨대, 1095일 또는 윤년의 1096일)당 1회 이하로 대상체에게 투여된다.
본원에 개시된 약제학적으로 허용가능한 부형제 및 담체 용액의 제제는 다양한 치료 요법에서 본원에 기재된 특정 조성물을 사용하기 위한 적합한 투여량 및 치료 요법의 개발과 마찬가지로 당업자에게 잘 알려져 있다. 전형적으로, 이들 제제는 적어도 약 0.1%의 활성 화합물 또는 그 이상을 함유할 수 있지만, 활성 성분(들)의 백분율은 물론 달라질 수 있고 편리하게는 총 제제의 중량 또는 부피의 약 1 또는 2% 및 약 70% 또는 80% 이상 사이일 수 있다. 당연히, 각각의 치료학적으로 유용한 조성물에서 활성 화합물의 양은 화합물의 임의의 주어진 단위 용량에서 적합한 투여량이 얻어지는 방식으로 제조될 수 있다. 용해도, 생체이용률, 생물학적 반감기, 투여 경로, 제품 유효 기간뿐만 아니라 기타 약리학적 고려 사항과 같은 인자가 이러한 약제학적 제제를 제조하는 당업자에 의해 고려될 것이며, 이와 같이 다양한 투여량 및 치료 요법이 바람직할 수 있다.
Shank 단백질 네트워크와 관련된 단백질의 발현
본원에 제공된 방법 및 조성물은, 일부 구현예에서 예를 들어 자폐 스펙트럼 장애(ASD) 또는 펠란-맥더미드 증후군과 같은 신경발달 장애를 치료하는 데 유용하다. 본 개시내용의 발명자들은 마우스 모델에서 AAV 벡터와 같은 바이러스 벡터를 통한 miniShank3의 전달이 시냅스후 밀도(PSD) 단백질의 기능성을 회복시키는 데 효과적임을 발견하였다. 일부 구현예에서, PSD 단백질의 발현 수준은 miniShank3 투여의 효능을 평가하는 데 사용된다. 일부 구현예에서, PSD 단백질은 호머이다. 일부 구현예에서, PSD 단백질은 시냅스후 밀도 단백질 95(PSD95)이다. 일부 구현예에서, PSD 단백질은 SynGap1이다. 일부 구현예에서, PSD 단백질은 SAPAP3이다. 일부 구현예에서, PSD 단백질은 NR1이다. 일부 구현예에서, PSD 단백질은 NR2B이다. 일부 구현예에서, PSD 단백질은 GluR2이다. 일부 구현예에서, PSD 단백질은 miniShank3 치료시 개선되거나 회복될 수 있는 임의의 단백질이다.
일부 구현예에서, 처리되지 않은 대조군 대상체와 비교하여 임의의 PSD 단백질의 증가는 miniShank3의 효능을 나타낼 수 있다. 유전자 발현 및 단백질 수준을 검출하는 방법은 당업계에 잘 알려져 있다.
일부 구현예에서, miniShank3으로 치료된 후 대상체에서 호머의 발현은 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 또는 적어도 1000배까지 증가된다. 일부 구현예에서, miniShank3으로 치료된 후 대상체에서 시냅스후 단백질(PSD95)의 발현은 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 또는 적어도 1000배까지 증가된다. 일부 구현예에서, miniShank3으로 치료된 후 대상체에서 SynGap1의 발현은 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 또는 적어도 1000배까지 증가된다. 일부 구현예에서, miniShank3으로 치료된 후 대상체에서 SAPAP3의 발현은 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배 또는 적어도 1000배까지 증가된다. 일부 구현예에서, miniShank3으로 치료된 후 대상체에서 NR1의 발현은 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배 또는 적어도 1000배까지 증가된다. 일부 구현예에서, miniShank3으로 치료된 후 대상체에서 NR2B의 발현은 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배 또는 적어도 1000배까지 증가된다. 일부 구현예에서, miniShank3으로 치료된 후 대상체에서 GluR2의 발현은 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배 또는 적어도 1000배까지 증가된다.
일부 구현예에서, MiniShank3 또는 MiniShank3을 포함하는 조성물의 투여는 수면 효율을 개선할 수 있다. 일부 구현예에서, 대상체는 MiniShank3 단백질과 같은 Shank 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 발현 작제물을 포함하는 조성물의 유효량을 투여받은 후 개선된 수면 효율을 갖는다. 일부 구현예에서, 조성물의 유효량을 투여한 후 대상체의 수면 효율은 대조군 대상체와 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 또는 적어도 1000배까지 증가된다. 개선된 수면 효율은 적은 수면 장애를 포함하며, 이는 비제한적으로 잠들기 어려움 및 잠자는 상태를 유지하기 어려움을 갖는 것을 포함한다. 수면 효율의 측정은 당업계에 공지된 임의의 방법을 사용하여 수행될 수 있다.
일부 구현예에서, MiniShank3 또는 MiniShank3을 포함하는 조성물의 투여는 사회적 장애를 개선할 수 있다. 일부 구현예에서, MiniShank3 단백질과 같은 Shank 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 발현 작제물을 포함하는 조성물의 유효량이 투여된 후 대상체의 사회적 장애가 개선된다. 일부 구현예에서, 조성물의 유효량을 투여한 후 대상체의 사회적 장애는 대조군 대상체와 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 또는 적어도 1000배까지 감소된다. 사회적 장애의 측정은 당업계에 공지된 임의의 방법을 사용하여 수행될 수 있다.
본원에 사용된 바와 같이, "사회적 장애"는 대상체가 자발적인 사회적 상호작용을 나타내지 못하게 하는 행동 이상 또는 결함을 지칭한다.
일부 구현예에서, MiniShank3 또는 MiniShank3을 포함하는 조성물의 투여는 보행 및/또는 운동 협응 결손을 개선할 수 있다. 일부 구현예에서, MiniShank3 단백질과 같은 Shank 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 발현 작제물을 포함하는 조성물의 유효량을 투여한 후에 대상체의 보행 및/또는 운동 협응 결손이 개선된다. 일부 구현예에서, 조성물의 유효량을 투여한 후 대상체의 보행 및/또는 운동 협응 결손은 대조군 대상체와 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 또는 적어도 1000배까지 감소된다. 보행 및/또는 운동 협응 결손의 측정은 당업계에 공지된 임의의 방법을 사용하여 수행될 수 있다.
본원에 사용된 바와 같이, "보행 및/또는 운동 협응 결손"은, 예를 들어 협응 부족, 균형 상실, 및/또는 질질 끄는 걸음걸이를 포함할 수 있다.
일부 구현예에서, MiniShank3 또는 MiniShank3을 포함하는 조성물의 투여는 피질-선조체 시냅스 기능장애를 개선할 수 있다. 일부 구현예에서, MiniShank3 단백질과 같은 Shank 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 발현 작제물을 포함하는 조성물의 유효량을 투여한 후에 대상체의 피질-선조체 시냅스 기능장애가 개선된다. 일부 구현예에서, 조성물의 유효량을 투여한 후 대상체의 피질-선조체 시냅스 기능장애는 대상체 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 또는 적어도 1000배까지 감소된다. 피질-선조체 시냅스 기능장애의 측정은 당업계에 공지된 임의의 방법을 사용하여 수행될 수 있다.
본원에 사용된 바와 같이, "피질-선조체 시냅스 기능장애"는 반복적 및 강박 행동, 예컨대 신경정신병적 장애 및 신경발달 질환, 예컨대 자폐증, 강박 장애, 및 투렛 증후군을 유발할 수 있는 뇌에서의 결함있는 피질선조체 회로를 지칭한다.
본원에 기재된 기술의 일부 양태는 하기 실시예 섹션에 기재된 비제한적인 예시적인 구현예에 기초하여 추가로 이해될 수 있다. 하기 실시예 섹션에 기재된 구현예의 임의의 제한은 하기 실시예 섹션에 기재된 구현예의 제한일 뿐이며 본원에 기재된 임의의 다른 구현예의 제한이 아니다.
실시예
본원에 기재된 본 발명이 보다 완전히 이해될 수 있도록, 하기 실시예가 제시된다. 본 출원에 기재된 실시예는 본원에 제공된 시스템 및 방법을 예시하기 위해 제공되며 어떤 식으로든 그 범위를 제한하는 것으로 해석되지 않아야 한다.
실시예 1: Shank3 돌연변이를 갖는 마우스 모델은 시냅스 결함 및 행동 이상을 나타내었다
Shank3 유전자의 돌연변이가 뇌 발달, 신경 구조, 시냅스 및 회로 기능, 및 행동에 얼마나 영향을 미치는지 연구하기 위해 Shank3 LoF 돌연변이를 갖는 다수의 마우스 및 원숭이 모델이 이전에 개발되었다. 이들 모델은 잠재적인 치료제를 시험하기 위한 기초 역할을 한다.
Shank3 돌연변이체 마우스의 2개의 상이한 대립유전자를 생성하였다: Shank3A 및 Shank3B. Shank3A 돌연변이체 마우스에서, 안키린 반복을 코딩하는 유전자의 일부가 표적화되어, 가장 긴 Shank3 이소형인 Shank3α의 완전한 제거를 초래하였다. 그러나, 다른 2개의 이소형은 영향을 받지 않았다(본원에서 Shank3β 및 Shank3γ로 명명됨). Shank3B 돌연변이체에서, PDZ 도메인이 표적화되어, Shank3α 및 Shank3β 이소형 모두의 완전한 제거 및 추정되는 Shank3γ의 유의한 감소를 야기하였다. 추가 분석은 주로 Shank3B 돌연변이체 마우스에 집중되었다.
Shank3B-/- 마우스는 조직학적 분석을 통해 전체적인 뇌 이상을 나타내지 않았다. 그러나, 3-6개월령에, Shank3B-/- 마우스는 뚜렷한 피부 병변을 발생하였다. 병변은 이유기에 격리된 동물에서 존재하였기 때문에 자초한 것이었고, Shank3B-/- 마우스와 함께 태어날 때부터 수용된 야생형(WT) 마우스에서 병변이 발견되지 않았기 때문에 과도한 서로 핥아주기(allogrooming)로 인한 것은 아니었다. 24시간 비디오 촬영은 병변 전 Shank3B-/- 마우스가 WT 대조군과 비교하여 그루밍에 소모한 시간의 증가를 나타내었음을 밝혀내었고(도 1a-1b), 이는 Shank3B-/- 마우스가 과도한 그루밍 및 자해 행동을 가지고 있었음을 나타낸다. 결론적으로, Shank3B 돌연변이체 마우스는 피부 병변을 유발하는 반복적이고 강박적인 그루밍을 나타내었다.
Shank3 돌연변이체가 사회적 행동에 미치는 영향을 연구하기 위해, 3-챔버 사회적 영역을 사용하여 동물을 이들의 사회적 상호작용의 자발적인 개시 및 사회적 새로움을 구별하는 능력에 대해 조사하였다. 초기에는, 실험 동물을 와이어 케이지 또는 동일하지만 빈 와이어 케이지("빈 케이지") 안에 있는 파트너("스트레인저 1")와 사회적 접촉을 탐색하고 개시하도록 두었다. Shank3B-/- 마우스는 사회적 파트너보다는 빈 케이지와 상호작용하는 것에 대해 분명한 선호도를 보였다(도 2a-2b). 후속 시험에서, 새로운 사회적 파트너("스트레인저 2")를 이전에 비어 있는 와이어 케이지에 도입하였다. WT 마우스는 새로운 동물에 대한 선호도를 나타낸 반면, Shank3B-/- 돌연변이체는 중앙 챔버에서 더 많은 시간을 보냈다(도 2a 및 2c). 결론적으로, Shank3B 돌연변이체 마우스는 사회적 상호작용 결손을 나타내었다.
Shank3 돌연변이체 마우스를 Shank3 돌연변이가 선조체 시냅스에 미치는 영향을 연구하는 데 사용하였다. 기저핵(basal ganglia)은 ASD와 관련된 뇌 영역 중 하나이다. Shank3B-/- 마우스의 반복적인 그루밍 행동은 피질-선조체 기능의 결함을 시사하였다. 더욱이, Shank3은 선조체에서 고도로 발현된 유일한 Shank 패밀리 구성원이었다(도 3a). 따라서, 분석은 선조체 뉴런과 피질-선조체 시냅스에 집중되었다.
Shank3의 파괴가 PSD 단백질 네트워크에 얼마나 영향을 미칠 수 있는지를 결정하기 위해, 선조체로부터의 정제된 PSD를 스캐폴딩 단백질 및 글루타메이트 수용체 서브유닛에 대해 조사하였다(도 3b-3c). Shank3B-/- 마우스에서 SAPAP3, 호머-1b/c 및 PSD93, 및 글루타메이트 수용체 서브유닛 GluR2, NR2A 및 NR2B의 감소된 수준이 관찰되었다. 이것은 선조체에서 PSD의 분자 조성의 변경 및 글루타메이트성 신호전달(glutamatergic signaling)의 파괴를 시사하였고, 이는 Shank 단백질이 마스터 스캐폴드라는 가설을 뒷받침한다.
골지 추적(Golgi tracing)을 사용하여, Shank3B-/- MSN에서 수상돌기 분지(dendritic arbor)의 복잡성, 전체 수상돌기 길이 및 표면적의 증가에 의해 나타난 바와 같이 신경 비대가 발견되었다. 또한, MSN의 염료 필링(dye filling)은 Shank3B-/- 마우스에서 가시 밀도의 감소를 밝혀내었다. EM 분석은 WT에 비해 Shank3B-/- 마우스로부터 PSD의 평균 두께 및 길이의 감소를 보여주었다. 종합하면, 이들 결과는 선조체에서 MSN 및 글루타메이트성 시냅스의 발달에서 Shank3의 중요한 역할을 강조하였다.
시냅스에 대한 Shank3 파괴의 기능적 중요성을 설명하기 위해, 6-7주령의 Shank3B-/- 마우스의 급성 뇌 절편에서 피질-선조체 시냅스 회로의 기록을 수행하고, 동일한 연령의 행동 시험을 수행하였다. 대조군과 비교했을 때 Shank3B-/- 마우스에서 필드 집단 스파이크(field population spike)가 유의하게 감소된 것으로 밝혀졌다(도 4a). 음성 피크 1(NP1) 및 쌍 펄스 비율(paired-pulse ratio, PPR)로 명명된 반응의 활동 전위 구성요소의 진폭에 대한 자극 강도의 관계에 의해 표시된 바와 같이 시냅스전 기능은 분명히 변경되지 않았다. 이들 결과는 전체 필드 반응의 감소가 시냅스 기능의 시냅스후 손상 및/또는 기능적 시냅스 수의 감소로 인한 것일 가능성이 가장 높다는 것을 나타내었다.
배외측(dorsolateral) 선조체 MSN에서 AMPAR-mEPSC의 전체 세포 전압 클램프 기록을 또한 수행하였다. mEPSC의 빈도는 Shank3B-/- MSN에서 유의하게 감소하였으며(도 4b-4c), 이는 PPR에서 결함이 관찰되지 않았기 때문에 Shank3B-/- MSN에서 기능적 시냅스 수의 감소를 시사하였다(도 4e). Shank3B-/- MSN에서 최대 mEPSC 진폭도 감소하였으며(도 4b 및 4d), 이는 이용가능한 시냅스로부터 시냅스후 반응의 감소를 나타낸다. 이들 데이터는 피질-선조체 회로에서의 시냅스후 기능에서 Shank3의 중요한 역할을 입증하였다.
유사한 조사가 원숭이 모델에서 시험된 다음 임상 시험에서 Shank3 돌연변이를 갖는 인간 ASD 환자에서 시험될 것이다.
실시예 2: miniShank3 유전자의 설계 및 제작
본원에 개시된 바와 같은 Shank3 돌연변이에 대한 유전자 요법 전략은 AAV를 사용하여 Shank3 cDNA의 기능적 카피를 뇌 세포로 전달하여 환자에서 Shank3 발현 수준을 회복시키는 것이었다. 그러나, Shank3은 큰 단백질이고 코딩 서열은 ~5.7 kb로 AAV 벡터의 패키징 용량을 초과한다. 이 문제를 해결하기 위해, 소형화된 Shank3(miniShank3)은 그의 기능을 그대로 유지하면서 크기를 줄이는 것을 목표로 설계되었다.
miniShank3의 첫 번째 버전(miniShank3-v1, 도 5b)에서, N-말단 도메인 및 다른 영역, 예컨대 안키린 반복 및 중요하지 않은 것으로 간주되는 프롤린-풍부 도메인의 주요 부분을 포함하는 프롤린-풍부 도메인 및 PDZ 도메인 사이의 연결 서열이 결실되었다. 이것은 Shank3 단백질의 기능에 중요한 것으로 예측된 도메인만 유지함으로써 Shank3 코딩 서열을 2.1 kb까지 효과적으로 감소시켰다.
임의의 이론에 얽매이지 않으면서, Shank3 단백질의 N-말단 도메인(NTD)은 시냅스 가소성에서 특수한 역할을 할 수 있다. 시냅스 가소성은 다양한 자극에 대한 반응으로 그의 시냅스 강도를 조절하는 뉴런의 능력을 지칭하며, 이는 학습하고 환경 변화에 적응하는 인간의 능력의 초석인 것으로 여겨진다. Shank3은 주요 시냅스 가소성 조절자인 CaMKIIα와 특정한 상호작용을 하는 것으로 밝혀졌다. 심각한 ID를 갖는 인간 ASD 환자에서 확인된 미스센스 돌연변이는 이러한 상호작용을 손상시킨다. 동일한 돌연변이를 가진 넉인(knock-in) 마우스가 생성되었고, 이들 마우스는 시냅스 가소성 결함을 가지고 있었다. 이러한 결과를 기초로, miniShank3-v1에 NTD를 추가하는 것은 miniShank3의 기능을 더 개선할 수 있을 것으로 추측되었다.
miniShank3의 두 번째 버전은 NTD를 함유하도록 설계되었다(miniShank3-v2, 도 6b). miniShank3-v2(3.1 kb)는 miniShank3-v1(2.1 kb)보다 상당히 더 크지만, 여전히 AAV 패키징 용량 내이다. miniShank3-v1 데이터를 기초로, 두 버전 모두 Shank3 기능을 회복시키는 데 효과적일 것으로 예상되었다. miniShank3-v2는 시냅스 가소성 기능을 회복시키는 데 특정 이점이 있을 수 있으며, 이는 유전자 요법 치료의 창을 여러 발달 단계로 잠재적으로 확장할 수 있는 효과이다.
피질-선조체 공동 배양을 수행하였다. 요약하면, 1차 피질-선조체 공동 배양물을 이전에 당업계에 설명된 바와 같이 제조하였다. 선조체 조직을 P0 Shank3 InsG3680/InsG3680 돌연변이체로부터 절개하였다. 피질 조직을 P0 야생형 새끼로부터 절개하였다. 조직을 파파인(Worthington Biochemical Corporation)으로 분해하고, 작은 유리 파스퇴르 피펫으로 분리하였다. 약 5백만 개의 선조체 중간 가시 뉴런(MSN)을 1 μg의 AAV-hSyn-GFP 플라스미드 단독 또는 2 μg의 AAV-hSyn1-minishank3 플라스미드와 혼합된 1 μg의 AAV-hSyn1-GFP 플라스미드로 마우스 뉴런 NucleofectorTM 키트(Lonza)를 사용하여 전기천공하였다. 그 다음, 선조체 MSN 및 피질 뉴런을 3:1의 비율로 혼합하고, 0.5 mM 글루타민(Invitrogen), 1X B27(Invitrogen), 50 μg/mL 페니실린/스트렙토마이신(Invitrogen), 50 ng/mL BDNF(R&D Systems), 및 30 ng/mL GDNF(R&D Systems)가 보충된 Neurobasal A 배지(Invitrogen)를 갖는 24-웰 플레이트 내부에 1x105 세포/cm2의 밀도로 폴리 D-라이신/라미닌(Neuvitro, GG-12-1.5-라미닌)으로 사전코팅된 12 mm 커버슬립 상에 플레이팅하였다. 초기 플레이팅 후, 배지의 절반을 3-4일마다 BDNF 및 GDNF가 없는 새로운 배지로 교환하였다.
miniShank3가 Shank3의 주요 기능을 유지하는지 여부를 조사하기 위해, Shank3 돌연변이체 마우스로부터의 배양된 뉴런에서 그의 발현 및 국소화를 먼저 시험하였다. Shank3은 시냅스 단백질이므로, miniShank3이 내인성 Shank3 단백질과 유사하게 시냅스에 국소화되는 것이 중요하였다. GFP 태그된 miniShank3v1이 피질-선조체 공동 배양의 뉴런에서 발현되었을 때, GFP-miniShank3은 시냅스후 마커 PSD95와의 그의 공동국소화에 의해 표시되는, 시냅스에 정확하게 국소화된 것으로 밝혀졌다(도 7a-7h). 따라서, miniShank3은 시냅스 단백질의 핵심 기능을 유지하였다.
실시예 3: 마우스 모델에서 miniShank3의 기능적 표현
miniShank3가 내인성 Shank3의 전체 기능을 포착하는지 여부를 조사하기 위해, Shank3 돌연변이체 마우스에서 신경 기능을 회복하는 MiniShank3-v1의 능력을 시험하였다. Shank3 돌연변이체 마우스는 시냅스 및 행동의 전기생리학적 특성의 이상을 포함하여 시냅스후 밀도(PSD)의 분자 조성에 결손을 나타내는 것으로 이전에 입증되었다. Shank3 InsG3680 돌연변이체 마우스에서 이들 결손 각각을 회복하는 miniShank3-v1의 능력을 시험하였다. 이 마우스는 인간 ASD 환자에게서 발견되는 InsG3680 돌연변이를 모방한다. 이전 연구는 이들 마우스가 ASD와 관련된 분자적, 전기생리학적 및 행동적 결손을 나타내었음을 보여주었다. 따라서, 이 모델을 사용하여 miniShank3-v1이 이러한 돌연변이체 마우스에서 관찰된 결손을 회복시킬 수 있는지 여부를 시험하였다.
GFP-miniShank3-v1을 pHP.eB AAV 벡터에 클로닝하였다. AAV-GFP-miniShank3-v1 바이러스를 제조하고, 안면 정맥 주사를 통해 생후 0 내지 2일(P0-P2) 마우스에 투여하였다. 마우스당 6.42E+11개의 바이러스 게놈(vg)의 용량에서, GFP-miniShank3-v1은 뇌 내의 대부분의 뉴런에서 고도로 발현되는 것으로 밝혀졌다(도 8). AAV-hSyn1-GFP를 대조군으로서 주사하였다.
표준 생화학적 접근법을 사용하여, PSD를 AAV-hSyn1-GFP가 주사된 야생형 마우스, AAV-hSyn1-GFP가 주사된 Shank3 돌연변이체 마우스, 및 AAV-GFP-miniShank3-v1이 주사된 Shank3 돌연변이체 마우스의 뇌로부터 분리하였다(도 9a). 웨스턴 블롯 분석을 사용하여 PSD에서 다양한 시냅스 단백질의 수준을 검출하였다(도 9b). 이전에 보고된 바와 같이, 야생형 마우스와 비교하여, 호머, PSD95, SynGap1, SAPAP3, NR1, NR2B, 및 GluR2를 포함하는 여러 시냅스 단백질의 수준은 Shank3 돌연변이체 마우스의 PSD에서 감소하였다(도 9c-9f). miniShank3-v1의 발현은 이들 시냅스 단백질의 발현 수준을 야생형 수준으로 회복시켰고, 이는 miniShank3-v1이 PSD의 분자 조성을 회복하는 데 완전히 기능적이었음을 나타낸다(도 9c-9f). 결론적으로, miniShank3은 Shank3 돌연변이체 마우스에서 시냅스후 밀도(PSD)의 분자 결함을 회복시킨다.
Shank3은 선조체에서 고도로 발현된다. 피질-선조체 시냅스 통신은 Shank3 돌연변이체 마우스에서 결함이 있다. miniShank3-v1이 시냅스 결함을 회복할 수 있는지 여부를 시험하기 위해, Shank3 돌연변이체 마우스로부터의 급성 뇌 절편에서 피질-선조체 시냅스 회로의 전기생리학적 기록을 수행하였다. 이전에 보고된 바와 같이, 필드 집단 스파이크는 대조군과 비교할 때 Shank3 돌연변이체 마우스에서 유의미하게 감소하였다(도 10a). Shank3 돌연변이체 마우스에서의 이러한 결함은 miniShank3-v1 발현에 의해 구제되었다(도 10a). 시냅스전 기능은 음성 피크 1(NP1; 도 10b)로 명명된 반응의 활동 전위 구성요소의 진폭에 대한 자극 강도의 관계에 의해 표시되는 바와 같이 변경되지 않았다. 이들 결과는 전체 필드 반응의 감소가 시냅스 기능의 시냅스후 손상 및/또는 기능적 시냅스 수의 감소로 인한 가능성이 가장 높으며, 이들 결함은 P0에서 AAV 매개 miniShank3-v1 발현에 의해 효과적으로 교정될 수 있음을 나타내었다. 결론적으로, miniShank3은 Shank3 돌연변이체 마우스에서 피질-선조체 시냅스 결함을 회복시킨다.
이전 연구는 Shank3 돌연변이체 마우스가 펠란-맥더미드 증후군 또는 Shank3 돌연변이를 갖는 환자에서 관찰되는 증상과 관련된 몇 가지 행동 표현형을 나타내는 것으로 나타났다. P0에서 miniShank3-v1 처리는 단지 개선 경향을 나타낸 운동 학습의 단일 분석에서의 성능을 제외하고 Shank3 돌연변이체 마우스에서 모든 시험된 행동 결손을 완전히 구제한 것으로 밝혀졌다. miniShank3-v1 처리는 3-챔버 사회적 상호작용 분석에 의해 측정된 사회적 상호작용 결손(도 11a), 개방 필드 시험에서 이동 거리에 의해 측정된 운동 활동 결함(도 11b), 개방 필드 시험에서 양육 시간에 의해 측정된 탐색적 행동 결손(도 11c), 및 고위 제로 미로에서 나타나는 불안 유사 행동(도 11d)을 완전히 구제하였다. 그러나, 돌연변이체 Shank3에서의 운동 학습 결손은 로타로드 시험에서 약간만 개선되었다(도 11e). 이것은 마우스에서 소뇌 발달이 출생 후에 시작되어 P0에서 AAV 감염을 제한했기 때문에 P0에 주사했을 때 소뇌에서 miniShank3의 매우 낮은 수준의 발현과 관련이 있을 가능성이 있다. 결론적으로, miniShank3은 Shank3 돌연변이체 마우스에서 행동 결함을 회복한다.
실시예 4: miniShank3 유전자 요법에 대한 치료 시기의 결정
이전 연구는 Shank3 돌연변이체에서 특정 행동을 구제하기 위한 중요한 발달적 시간 윈도우가 있음을 보여주었다. miniShank3의 AAV 매개 전달을 위한 효과적인 치료 윈도우를 결정하기 위해, 상이한 발달 단계에서 정맥 내 바이러스 주사를 수행하고, 성체기 동안 행동에 미치는 영향을 분석하였다. 모든 행동 실험을 마우스에 AAV 주사 후 적어도 8주 후에 수행하였다. 요약하면, 야생형 마우스, Shank3 돌연변이체 마우스, 및 상이한 연령(P0, P2, P7 및 P28)에서 Shank3 처리된 Shank3 돌연변이체 마우스를 실험 그룹으로 할당하였다. P0 및 P2에서의 마우스에게 멸균 식염수에 희석된 AAV-PHP.eB-hSyn-GFP 또는 AAV-PHP.eB-hSyn-GFP-MiniShank3의 6.0 x1011개의 총 바이러스 게놈(vg)으로 구성된 20 μl의 주사 혼합물을 정맥내로 주사하였다. P0-P2령의 마우스의 경우, 안면 정맥 주사를 사용하였다. P7 및 P28에서의 마우스에게 AAV-PHP.eB-hSyn-GFP 또는 AAV-PHP.eB-hSyn-GFP-MiniShank3의 7.0x1011개의 총 바이러스 게놈(vg)을 정맥내로 주사하였다. P7 및 P28령의 마우스의 경우, 안와후 주사 또는 뇌실내(ICV) 주사를 사용하였다.
출생후 일(P28)에 MiniShank3 처리는 Shank3 InsG3680 돌연변이체에서 사회적 행동 장애를 완전히 구제하였고, 선호도를 나타내지 않은 처리되지 않은 돌연변이체와 달리 처리된 마우스는 스트레인저 마우스에 대해 강한 선호도를 나타내었다(도 12a). P28 처리된 miniShank3 마우스는 또한 돌연변이체 마우스와 비교하여 유의하게 증가된 보행 활동을 나타내었다(도 12b). P28에서 miniShank3 처리는 운동 학습(도 12c) 및 운동 협응(도 12d)을 유의하게 개선하는 것으로 밝혀졌다. 사회적 행동 및 운동 행동과 대조적으로, P28에서 miniShank3 처리는 불안 유사 행동 및 반복적인 그루밍에 대해 최소한의 효과를 나타내었다(도 12d). 고위 제로 미로에서, miniShank3 처리된 마우스는 개방 팔에서의 탐색 시간에서 돌연변이체 마우스와 유의한 차이를 보이지 않았고(도 12f), 그루밍 분석에서 miniShank3 처리된 마우스는 그루밍 행동의 단지 약간의 감소를 나타내었다(도 12f).
성체 마우스에서 Shank3 발현의 유전적 구제를 설명하는 이전 연구들은 그루밍 표현형이 성체에서 가역적이며 피질-선조체-시상-피질 회로 기능장애가 반복적/강박적 유사 행동과 강하게 관련되어 있음을 보여주었다. P28에서 miniShank3으로 처리된 돌연변이체에서 이러한 행동 표현형의 구제의 부족이 그루밍 관련 뇌 영역에서의 불량한 miniShank3 발현 때문인지 여부를 다루기 위해, P28 처리된 동물에서 GFP 발현을 평가하여 miniShank3의 생체분포를 조사하였고, GFP 발현이 시상에서 매우 낮고 선조체에서 제한됨을 발견하였다. 따라서, P28에서 miniShank3 처리는 사회적 행동, 보행, 및 운동 협응의 결함을 선택적으로 구제한 반면, 이 연령에서 시상 및 선조체의 AAV 기반 표적화를 위한 개선된 전략은 불안 및 반복적 행동에 대한 추가 치료 이점을 가능하게 할 수 있다.
출생후 7일(P7)에 miniShank3가 투여된 돌연변이체 마우스는 P0-P2 주사에서 관찰된 것과 유사하게 그들의 돌연변이체 한배새끼와 비교하여 스트레인저 마우스에 대한 강화된 선호도를 보여주었다(도 13a). 전기생리학 연구들은 P7에서 miniShank3 전달이 Shank3 돌연변이체 마우스에서 관찰된 피질-선조체 시냅스 결함을 회복하기에 충분하다는 것을 보여주었다. 피질-선조체 회로 기능장애는 자폐증 및 강박 장애와 관련된 반복적이고 강박적인 행동과 강하게 관련되어 있었고. Shank3 돌연변이체는 과도한 그루밍 표현형을 나타내었다. 이 이론을 시험하기 위해, 개별 WT 마우스, Shank3 돌연변이체 마우스, 및 P7에서 miniShank3로 처리된 Shank3 돌연변이체 마우스를 2시간 동안 모니터링하고, 세션 동안 그루밍에 소모한 시간의 백분율을 정량화하였다. Shank3 돌연변이체 마우스는 WT 마우스와 비교하여 그루밍에 유의하게 증가된 백분율의 시간을 사용한 것으로 나타났다. 그러나, miniShank3 처리된 마우스는 그루밍하는 데 유의하게 감소된 양의 시간을 사용하였고, 이는 WT 동물과 유사하였다(도 13b).
P7에서 MiniShank3 처리는 개방 필드 시험에서 이동한 총 거리에 의해 측정된 바와 같이 Shank3 돌연변이체에서 관찰된 보행 표현형(도 13c), 고위 제로 미로에서 불안 유사 행동(도 13d-13e)을 완전히 구제하였다. miniShank3의 P0-P2(출생후 0일 - 출생후 2일) 전달과 대조적으로, P7에서 miniShank3으로 처리된 Shank3 돌연변이체 마우스는 돌연변이 한배새끼보다 운동 학습 및 운동 협응 모두에서 유의하게 더 잘 수행하였고(도 13f), 이는 Shank3 돌연변이에서 관찰된 운동 결함이 적절한 발단 단계에서 주어지는 경우 AAV 매개 miniShank3 유전자 요법에 의해 가역적임을 시사한다. 함께, 이러한 행동 결과는 P7에서의 miniShank3 유전자 요법이 Shank3 InsG3680 돌연변이 동물에서 모든 보고된 행동 표현형을 효과적으로 구제할 수 있음을 보여준다.
실시예 5: P7에서 miniShank3의 전신 전달은 Shank3 InsG3680 돌연변이체에서 수면 장애의 개선을 초래한다
펠란-맥더미드 증후군을 갖는 환자 및 SHANK3 돌연변이를 갖는 다른 개체는 종종 잠들고 잠든 상태를 유지하기 어려운 것을 포함하는 심각한 수면 장애를 나타낸다. 예를 들어, 짧은꼬리 원숭이에서의 SHANK3 돌연변이는 현저한 수면 장애를 나타낸다. Shank3 InsG3680 돌연변이체 마우에서의 수면 장애를 평가하기 위해, EEG/EMG 관련 수술을 수행하였고, 3개의 모든 실험 그룹으로부터의 신호를 조사하여 Shank3의 돌연변이에 의해 수면이 영향을 받는지 여부를 결정하였다. InsG3680 동형접합체는 WT 대조군보다 더 짧은 유지 길이(도 13h)와 함께 감소된 NREM 수면 지속 시간(도 13g), 및 NREM 수면 동안 전두엽 EEG에서 델타 리듬(1-4Hz)의 감쇠된 파워(도 13i)를 나타내었다. 이들 결과는 Shank3 돌연변이체 마우스에서 심각한 수면 장애를 보여주었다. P7에 주사된 MiniShank3은 NREM 수면의 감소(도 13g) 및 처리되지 않은 돌연변이체에서 관찰된 감소된 수면 유지 시간(도 13h) 모두를 유의하게 완화시켰다. 또한, P7에 주사된 miniShank3은 감소된 델타 파워를 부분적으로 구제하였다(도 13i). 함께, 이들 결과는 miniShank3이 동형접합 Shank3 InsG3680 마우스에서 수면 장애를 감쇠시킬 수 있고, ASD 관련 행동 표현형을 구제하는 miniShank3의 광범위한 능력과 일치한다는 것을 보여주었다.
실시예 6: P7에서 MiniShank3 처리는 Shank3 InsG3680 돌연변이체에서 발작 행동을 유발하지 않는다
발작 행동에 대한 miniShank3 처리의 잠재적인 효과를 시험하기 위해, WT 마우스, 대조군 바이러스가 주사된 Shank3 돌연변이체, miniShank3이 주사된 Shank3 돌연변이체, 및 Scn2a 돌연변이체를 연구에 포함시켰다. EEG 분석을 위해, 수면 모니터링, 자발 발작, 및 청력 발작과 같은 지표를 수행하였다. 24시간의 기록 동안 안정적인 EEG 기저선에 의해 입증된 바와 같이 Shank3 InsG3680 돌연변이체 마우스에서 자발적인 간질 EEG 이상이 관찰되지 않았다(대표적인 트레이스, 도 14a). 청력 발작(124 dB 음향 자극)을 유도하는 Shank3 돌연변이체의 감수성을 조사하였고, 돌연변이체 마우스에서 청력 발작의 행동 징후가 존재하지 않는 것으로 나타났다. miniShank3의 안전성을 평가하기 위해, P7에 miniShank3가 주사된 돌연변이체 마우스에서 자발적인 간질성 EEG 이상을 조사하였고, EEG 상에서 감지될 수 있는 과흥분 활성이 관찰되지 않았다(도 14a). 또한, Shank3 InsG3680 돌연변이체 마우스 및 miniShank3이 주사된 돌연변이체 마우스는 작은 발작(absence seizure)의 EEG 시그니처인 스파이크-파동 방전(spike-and-wave discharge, SWD)을 나타내지 않았다. 그러나, 빈번한 작은 발작을 초래한 Scn2a에 이형접합 돌연변이를 갖는 동물의 분석은 시간당 약 60회의 SWD 에피소드를 발견하였고, 이는 분석 파이프라인의 유효성을 검증하였다(도 14b). 함께, 이들 결과는 Shank3 InsG3680 돌연변이가 간질 활성을 나타내지 않았고 miniShank3 발현이 검출가능한 발작을 초래하지 않았음을 보여준다.
실시예 7: miniShank3을 이용한 성인 인간 대상체의 치료
자폐 스펙트럼 장애(ASD) 또는 펠란-맥더미드 증후군과 같은 신경발달 장애를 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 성인 대상체는 본원에 기재된 바와 같은 방법, 벡터 및 비자연 발생 폴리뉴클레오타이드를 사용하여 miniShank3에 의해 치료될 수 있다. 성인 인간 대상체는 16세 이상의 임의의 남성 또는 여성 성인을 포함할 수 있다. 25세 미만의 성인이 본원에 개시된 바와 같은 miniShank3 치료에 바람직할 수 있다. 투여 및 전달 방법은 본원에 개시된 바와 같이 안면 정맥 주사 및 뇌실내 주사를 포함할 수 있다. 당업자에게 공지된 다른 방법이 또한 사용될 수 있다. 성인 인간 대상체는 AAV와 같은 바이러스 벡터에 의해 전달되는 miniShank3으로 치료된다. 예를 들어, 성인 인간 대상체는 miniShank3 이식유전자를 발현하는 서열번호: 21의 서열을 포함하는 AAV 벡터로 치료될 수 있다. 임의의 이론에 얽매이지 않으면서, 치료를 위한 용량은 1x1010 내지 1x1012 바이러스 게놈(vg)일 수 있다. 당업자는 성별, 체중, 연령, 질환 상태, 및 질환 유형과 같은 다양한 인자가 특정 성인에 대한 용량을 결정할 때 고려될 수 있음을 이해할 것이다. 용량은 1x1010 및 1x1012 vg 범위 밖일 수 있다. 투여 경로는, 예를 들어 정맥내, 안면 정맥내, 두개내, 뇌실내, 안구내, 또는 경막내일 수 있다.
실시예 8: miniShank3을 이용한 비성인 인간 대상체의 치료
자폐 스펙트럼 장애(ASD), 또는 펠란-맥더미드 증후군과 같은 신경발달 장애를 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 비성인 인간 대상체는 본원에 기재된 바와 같은 방법, 벡터, 및 비자연 발생 폴리뉴클레오타이드를 사용하여 miniShank3에 의해 치료될 수 있다. 비성인 인간 대상체는 16세 이하의 임의의 남성 또는 여성을 포함할 수 있다. 임의의 이론에 얽매이지 않으면서, 유아 또는 걸음마 아기와 같은 10세 이하의 인간 대상체가 본원에 개시된 바와 같은 miniShank3 치료에 바람직할 수 있다. 투여 및 전달 방법은 안면 정맥 주사를 포함할 수 있으며, 뇌실내 주사가 본원에 개시되어 있다. 당업자에게 공지된 다른 방법이 또한 사용될 수 있다. 성인이 아닌 인간 대상체는 AAV와 같은 바이러스 벡터에 의해 전달되는 miniShank3으로 치료된다. 예를 들어, 성인이 아닌 인간 대상체는 miniShank3 이식유전자를 발현하는 서열번호: 21의 서열을 포함하는 AAV 벡터로 치료될 수 있다. 임의의 이론에 구애됨이 없이, 치료를 위한 용량은 1x1010 내지 1x1012 바이러스 게놈(vg)일 수 있다. 당업자는 성별, 체중, 연령, 질환 상태, 및 질환 유형과 같은 다양한 인자가 특정 성인에 대한 용량을 결정할 때 고려될 수 있음을 이해할 것이다. 복용량은 1x1010 및 1x1012 vg 범위 밖일 수 있다. 투여 경로는, 예를 들어 정맥내, 안면 정맥내, 두개내, 뇌실내, 안구내 또는 척수강내일 수 있다. 투여 경로는 성인이 아닌 인간 대상체가 태아 또는 발달의 출생전 단계에 있는 경우 자궁내일 수 있다.
실시예 9: miniShank1 또는 miniShank2를 이용한 인간 대상체의 치료
신경발달 장애, 자폐 스펙트럼 장애(ASD) 또는 펠란-맥더미드 증후군을 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 인간 대상체는 본원에 기재된 바와 같은 방법, 벡터, 및 비자연 발생 폴리뉴클레오타이드를 사용하여 miniShank1 또는 miniShank2로 치료될 수 있다. 성인 인간 대상은 임의의 남성 또는 여성 인간 대상체를 포함할 수 있다. 치료 방법은 miniShank3 작제물(서열번호: 1-4 및 21)이 Shank1(miniShank1) 또는 Shank2(miniShank2)를 포함하도록 변형된 것을 제외하면, 본원에 기재된 방법과 유사할 것이다. 성인 또는 성인이 아닌 인간 대상체는 AAV와 같은 바이러스 벡터에 의해 전달되는 miniShank1 또는 miniShank2로 치료된다. 예를 들어, 성인 인간 또는 성인이 아닌 인간 대상체는 miniShank3 이식유전자를 발현하는 서열번호: 21의 서열을 포함하는 AAV 벡터로 치료될 수 있다. 임의의 이론에 얽매이지 않으면서, 치료를 위한 용량은 1x1010 내지 1x1012 바이러스 게놈(vg)일 수 있다. 당업자는 성별, 체중, 연령, 질환 상태, 및 질환 유형과 같은 다양한 인자가 특정 성인에 대한 용량을 결정할 때 고려될 수 있음을 이해할 것이다. 용량은 1x1010 및 1x1012 vg 범위 밖일 수 있다. 투여 경로는, 예를 들어 정맥내, 안면 정맥내, 두개내, 뇌실내, 안구내, 또는 경막내일 수 있다. 투여 경로는 성인이 아닌 인간 대상체가 태아 또는 발달의 출생전 단계에 있는 경우 자궁내일 수 있다.
실시예 10: 렌티바이러스 바이러스 벡터를 사용한 miniShank3의 전달
자폐 스펙트럼 장애(ASD) 또는 펠란-맥더미드 증후군과 같은 신경 발달 장애를 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 인간 대상체는 본원에 기재된 바와 같은 방법, 벡터 및 비자연 발생 폴리뉴클레오타이드를 사용하여 miniShank1 또는 miniShank2에 의해 치료될 수 있다. 성인 또는 성인이 아닌 인간 대상체는 렌티바이러스와 같은 바이러스 벡터에 의해 전달되는 miniShank3으로 치료된다. 임의의 이론에 얽매이지 않으면서, 치료를 위한 용량은 1x1010 내지 1x1012 바이러스 게놈(vg)일 수 있다. 당업자는 성별, 체중, 연령, 질환 상태, 및 질환 유형과 같은 다양한 인자가 특정 성인에 대한 용량을 결정할 때 고려될 수 있음을 이해할 것이다. 용량은 1x1010 및 1x1012 vg 범위 밖일 수 있다. 투여 경로는, 예를 들어 정맥내, 안면 정맥내, 두개내, 뇌실내, 안구내, 또는 경막내일 수 있다. 투여 경로는 성인이 아닌 인간 대상체가 태아 또는 발달의 출생전 단계에 있는 경우 자궁내일 수 있다.
표 1. 마우스 및 인간 miniShank3 서열 및 벡터 서열
참고문헌
1. Prasad C, Prasad AN, Chodirker BN, Lee C, Dawson AK, Jocelyn LJ, Chudley AE. (2000) Genetic evaluation of pervasive developmental disorders: the terminal 22q13 deletion syndrome may represent a recognizable phenotype. Clin Genet 57:103-109.
2. Precht KS, Lese CM, Spiro RP, Huttenlocher PR, Johnston KM, Baker JC, Christian SL, Kittikamron K, Ledbetter DH. (1998) Two 22q telomere deletions serendipitously detected by FISH. J Med Genet 35:939-942.
3. Manning MA, Cassidy SB, Clericuzio C, Cherry AM, Schwartz S, Hudgins L, Enns GM, Hoyme HE. (2004) Terminal 22q deletion syndrome: a newly recognized cause of speech and language disability in the autism spectrum. Pediatrics 114, 451-457.
4. Wilson HL, Wong AC, Shaw SR, Tse WY, Stapleton GA, Phelan MC, Hu S, Marshall J, McDermid HE. (2003) Molecular characterisation of the 22q13 deletion syndrome supports the role of haploinsufficiency of SHANK3/PROSAP2 in the major neurological symptoms. J Med Genet 40, 575-584.
5. Jeffries AR, Curran S, Elmslie F, Sharma A, Wenger S, Hummel M, Powell J (2005) Molecular and phenotypic characterization of ring chromosome 22. Am J Med Genet A 137:139-147.
6. Durand CM, Betancur C, Boeckers TM, Bockmann J, Chaste P, Fauchereau F, Nygren G, Rastam M, Gillberg IC, Anckarsater H, Sponheim E, Goubran-Botros H, Delorme R, Chabane N, Mouren-Simeoni MC, de Mas P, Bieth E, Roge B, Heron D, Burglen L, Gillberg C, Leboyer M, Bourgeron T. (2007) Mutations in the gene encoding the synaptic scaffolding protein SHANK3 are associated with autism spectrum disorders. Nat Genet 39, 25-27.
7. Moessner R, Marshall CR, Sutcliffe JS, Skaug J, Pinto D, Vincent J, Zwaigenbaum L, Fernandez B, Roberts W, Szatmari P, Scherer SW. (2007) Contribution of SHANK3 mutations to autism spectrum disorder. Am J Hum Genet 81, 1289-1297.
8. Gauthier J, Spiegelman D, Piton A, Lafreniere RG, Laurent S, St-Onge J, Lapointe L, Hamdan FF, Cossette P, Mottron L, Fombonne E, Joober R, Marineau C, Drapeau P, Rouleau GA. (2009) Novel de novo SHANK3 mutation in autistic patients. Am J Med Genet B Neuropsychiatr Genet 150B, 421-424.
9. Boccuto et al., Prevalence of SHANK3 variants in patients with different subtypes of autism spectrum disorders. Eur J Hum Genet. 2013 Mar;21(3):310-6.
10. Betancur C, Buxbaum JD. SHANK3 haploinsufficiency: a "common" but underdiagnosed highly penetrant monogenic cause of autism spectrum disorders. Mol Autism. 2013 Jun 11;4(1):17.
11. Du, Y., Weed, S.A., Xiong, W.C., Marshall, T.D. & Parsons, J.T. (1998) Identification of a novel cortactin SH3 domain-binding protein and its localization to growth cones of cultured neurons. Mol Cell Biol 18, 5838-5851 (1998).
12. Naisbitt S, Kim E, Tu JC, Xiao B, Sala C,Valtschanoff J, Weinberg RJ, Worley PF, Sheng M. (1999) Shank, a novel family of postsynaptic density proteins that binds to the NMDA receptor/PSD-95/GKAP complex and cortactin. Neuron 23: 569-82.
13. Boeckers TM, Winter C, Smalla KH, Kreutz MR, Bockmann J, Seidenbecher C, Garner CC, Gundelfinger ED. (1999a) Proline-rich synapse-associated proteins ProSAP1 and ProSAP2 interact with synaptic proteins of the SAPAP/GKAP family. Biochem Biophys Res Commun. 264:247-52.
14. Boeckers TM, Kreutz MR, Winter C, Zuschratter W, Smalla KH, Sanmarti-Vila L, Wex H, Langnaese K, Bockmann J, Garner CC, Gundelfinger ED. (1999b) Proline-rich synapse-associated protein-1/cortactin binding protein 1 (ProSAP1/CortBP1) is a PDZ-domain protein highly enriched in the postsynaptic density. J Neurosci. 19:6506-18.
15. Sheng, M. & Kim, E. (2000) The Shank family of scaffold proteins. J Cell Sci 113 ( Pt 11), 1851-1856.
16. Montgomery JM, Zamorano PL, Garner CC. (2004) MAGUKs in synapse assembly and function: an emerging view. Cell Mol Life Sci. 61:911-29
17. Kim, E. and M. Sheng (2004). PDZ domain proteins of synapses. Nat Rev Neurosci 5: 771-81.
18. McAllister AK. (2007) Dynamic aspects of CNS synapse formation. Annu Rev Neurosci. 30:425-50.
19. Tu JC, Xiao B, Naisbitt S, Yuan JP, Petralia RS, Brakeman P, Doan A, Aakalu VK, Lanahan AA, Sheng M, Worley PF. (1999) Coupling of mGluR/Homer and PSD-95 complexes by the Shank family of postsynaptic density proteins. Neuron 23, 583-592.
20. Valtschanoff, J.G. & Weinberg, R.J. (2011) Laminar organization of the NMDA receptor complex within the postsynaptic density. J Neurosci 21, 1211-1217.
21. Baron MK, Boeckers TM, Vaida B, Faham S, Gingery M, Sawaya MR, Salyer D, Gundelfinger ED, Bowie JU. (2006) An architectural framework that may lie at the core of the postsynaptic density. Science 311:531-5.
22. Kreienkamp, H.J. (2008) Scaffolding proteins at the postsynaptic density: shank as the architectural framework. Handb Exp Pharmacol, 365-380.
23. Hayashi MK, Tang C, Verpelli C, Narayanan R, Stearns MH, Xu RM, Li H, Sala C, Hayashi Y. (2009) The postsynaptic density proteins Homer and Shank form a polymeric network structure. Cell 137:159-71.
24. Roussignol G, Ango F, Romorini S, Tu JC, Sala C, Worley PF, Bockaert J, Fagni L. (2005) Shank expression is sufficient to induce functional dendritic spine synapses in aspiny neurons. J Neurosci 25, 3560-3570.
25. Sala C, Piech V, Wilson NR, Passafaro M, Liu G, Sheng M. Regulation of dendritic spine morphology and synaptic function by Shank and Homer. (2001) Regulation of dendritic spine morphology and synaptic function by Shank and Homer. Neuron 31, 115-130.
26. Hung AY, Futai K, Sala C, Valtschanoff JG, Ryu J, Woodworth MA, Kidd FL, Sung CC, Miyakawa T, Bear MF, Weinberg RJ, Sheng M. (2008) Smaller dendritic spines, weaker synaptic transmission, but enhanced spatial learning in mice lacking Shank1. J Neurosci. 28:1697-708.
27. American Psychiatric Association. & American Psychiatric Association. Task Force on DSM-IV. Diagnostic and statistical manual of mental disorders : DSM-IV-TR, (American Psychiatric Association, Washington, DC, 2000.
28. Bertrand J, Mars A, Boyle C, Bove F, Yeargin-Allsopp M, Decoufle P. (2001) Prevalence of autism in a United States population: the Brick Township, New Jersey, investigation. Pediatrics 108:1155-1161.
29. Chakrabarti, S. & Fombonne, E. (2005) Pervasive developmental disorders in preschool children: confirmation of high prevalence. Am J Psychiatry 162:1133-1141.
30. Baird G, Simonoff E, Pickles A, Chandler S, Loucas T, Meldrum D, Charman T. (2006) Prevalence of disorders of the autism spectrum in a population cohort of children in South Thames: the Special Needs and Autism Project (SNAP). Lancet 368:210-215.
31. Rosenberg RE, Law JK, Yenokyan G, McGready J, Kaufmann WE, Law PA. (2009) Characteristics and concordance of autism spectrum disorders among 277 twin pairs. Arch Pediatr Adolesc Med 163:907-914.
32. Newschaffer CJ, Croen LA, Daniels J, Giarelli E, Grether JK, Levy SE, Mandell DS, Miller LA, Pinto-Martin J, Reaven J, Reynolds AM, Rice CE, Schendel D, Windham GC. (2007) The epidemiology of autism spectrum disorders. Annu Rev Public Health 28:235-258.
33. Veenstra-VanderWeele, J., Christian, S.L. & Cook, E.H. (2004) Autism as a paradigmatic complex genetic disorder. Annu Rev Genom Hum G. 5, 379-405.
34. Zoghbi, H.Y. [2003] Postnatal neurodevelopmental disorders: meeting at the synapse? Science 302:826-830.
35. Cline H. (2005) Synaptogenesis: a balancing act between excitation and inhibition. Curr Biol. 15:R203-5.
36. Sudhof TC. (2008) Neuroligins and neurexins link synaptic function to cognitive disease. Nature 455:903-11.
37. Betancur C, Sakurai T, Buxbaum JD. (2009) The emerging role of synaptic cell-adhesion pathways in the pathogenesis of autism spectrum disorders. Trends Neurosci. 32:402-12.
38. Bourgeron T. (2009) A synaptic trek to autism. Curr Opin Neurobiol. 19:231-4.
39. Pfeiffer BE, Huber KM. (2009) The state of synapses in fragile X syndrome. Neuroscientist 15:549-67.
40. Abrahams, B.S. & Geschwind, D.H. (2008) Advances in autism genetics: on the threshold of a new neurobiology. Nat Rev Genet 9:341-355.
41. State MW. (2010) The genetics of child psychiatric disorders: focus on autism and Tourette syndrome. Neuron 68:254-69.
42. van de Lagemaat, L.N. & Grant, S.G. (2010) Genome variation and complexity in the autism spectrum. Neuron 67:8-10.
43. Kumar RA, Christian SL. (2009) Genetics of autism spectrum disorders. Curr Neurol Neurosci Rep. 9:188-97.
44. Peca J, Feliciano C, Ting JT, Wang W, Wells MF, Venkatraman TY, Lascola CD, Fu Z and Feng G. (2011) Shank3 mutant mice display autistic-like behaviours and striatal dysfunction. Nature, 472:437
45. Zhou Y, Kaiser T, Monteiro P, Zhang X, Van der Goes MS, Wang D, Barak B, Zeng M, Li C, Lu C, Wells M, Amaya A, Nguyen S, Lewis M, Sanjana N, Zhou Y, Zhang M, Zhang F, Fu Z, Feng G. (2016) Mice with Shank3 mutations associated with ASD and schizophrenia display both shared and distinct defects. Neuron 89:147-162.
46. Guo B, Chen J, Chen Q, Ren K, Feng D, Mao H, Yao H, Yang J, Liu H, Liu Y, Jia F, Qi C, Lynn-Jones T, Hu H, Fu Z, Feng G*, Wang W*, Wu S*. (2019) Anterior cingulate cortex dysfunction underlies social deficits in Shank3 mutant mice. Nat Neurosci. 22(8):1223-1234. *co-corresponding authors.
47. Zhou Y, Sharma J, Ke Q, Landman R, Yuan J, Chen H, Hayden DS, Fisher JW 3rd, Jiang M, Menegas W, Aida T, Yan T, Zou Y, Xu D, Parmar S, Hyman JB, Fanucci-Kiss A, Meisner O, Wang D, Huang Y, Li Y, Bai Y, Ji W, Lai X, Li W, Huang L, Lu Z, Wang L, Anteraper SA, Sur M, Zhou H*, Xiang AP*, Desimone R, Feng G*, Yang S*. (2019) Atypical behaviour and connectivity in SHANK3-mutant macaques. Nature. 570:326-331. *co-corresponding authors.
48. Chen Q, Deister CA, Gao X, Guo B, Lynn-Jones T, Chen N, Wells MF, Liu R, Goard MJ, Dimidschstein J, Feng S, Shi Y, Liao W, Lu Z, Fishell G, Moore CI#, Feng G#. (2020) Dysfunction of cortical GABAergic neurons leads to sensory hyper-reactivity in a Shank3 mouse model of ASD. Nat Neurosci. 23:520-532. #corresponding authors.
49. Wang W, Li C, Chen Q, van der Goes MS, Hawrot J, Yao AY, Gao X, Lu C, Zang Y, Zhang Q, Lyman K, Wang D, Guo B, Wu S, Gerfen CR, Fu Z#, Feng G# (2017) Striatopallidal dysfunction underlies repetitive behavior in Shank3-deficient model of autism. J Clin Invest. pii: 87997. #co-corresponding authors.
50. Mei Y, Monteiro P, Zhou Y, Kim J-A, Gao X, Fu Z and Feng G. (2016) Adult Restoration of Shank3 Expression Rescues Selective Autistic-Like Phenotypes. Nature, 530:481-4.
51. Segal, M., Greenberger, V. & Korkotian, E. Formation of dendritic spines in cultured striatal neurons depends on excitatory afferent activity. Eur. J. Neurosci. 17, 2573-2585 (2003)
52. Tian, X., Kai, L., Hockberger, P. E., Wokosin, D. L. & Surmeier, D. J. medium spiny neurons. 44, 94-108 (2011).
53. Zhang, Q. et al. Impaired dendritic development and memory in sorbs2 knock-out mice. J. Neurosci. 36, 2247-2260 (2016).
54. Luh, L. M., Das, I. & Bertolotti, A. qMotor, a set of rules for sensitive, robust and quantitative measurement of motor performance in mice. Nat. Protoc. 12, 1451-1457 (2017).
청구범위에서, "a", "an" 및 "the"와 같은 관사는 달리 명시되지 않거나 문맥으로부터 달리 명백하지 않는 한 하나 또는 둘 이상을 의미할 수 있다. 그룹의 하나 이상의 구성원 사이에 "또는"을 포함하는 청구항 또는 설명은 달리 명시되지 않거나 문맥으로부터 달리 명백하지 않는 한 그룹 구성원 중 하나, 둘 이상, 또는 모두가 주어진 생성물 또는 과정에 존재하거나, 사용되거나, 관련이 있는 경우 충족되는 것으로 간주된다. 본 개시내용은 그룹의 정확히 하나의 구성원이 주어진 생성물 또는 과정에 존재하거나, 사용되거나, 관련되는 구현예를 포함한다. 본 개시내용은 그룹 구성원 중 둘 이상 또는 모두가 주어진 생성물 또는 과정에 존재하거나, 사용되거나, 관련되는 구현예를 포함한다.
또한, 본 개시내용은 나열된 청구범위 중 하나 이상으로부터의 하나 이상의 제한, 요소, 절 및 설명 용어가 또 다른 청구범위에 도입되는 모든 변형, 조합 및 순열을 포함한다. 예를 들어, 또 다른 청구범위에 종속된 임의의 청구범위는 동일한 기본 청구범위에 종속된 임의의 다른 청구범위에서 발견되는 하나 이상의 제한을 포함하도록 변형될 수 있다. 요소가 목록으로서 제시되는 경우(예컨대, 마쿠쉬 그룹 형식), 요소의 각 하위그룹이 또한 개시되며, 임의의 요소(들)가 그룹에서 제거될 수 있다. 일반적으로, 개시내용 또는 개시내용의 양태가 특정 요소 및/또는 특징을 포함하는 것으로 언급되는 경우, 개시내용 또는 개시내용의 양태의 특정 구현예는 이러한 요소 및/또는 특징으로 구성되거나, 또는 본질적으로 구성되는 것으로 이해되어야 한다. 단순화를 위해, 이들 구현예는 본원에서 이러한 말로 명시적으로 제시되지 않았다. 또한 용어 "포함하는" 및 "함유하는"은 개방적인 것으로 의도되며 추가 요소 또는 단계의 포함을 허용한다는 점에 유의한다. 범위가 주어지는 경우, 달리 명시되지 않는 한, 종점이 이러한 범위에 포함된다. 또한, 달리 나타내지 않거나 문맥 및 당업자의 이해로부터 달리 명백하지 않는 한, 범위로 표현되는 값은 개시내용의 상이한 구현예에서 명시된 범위 내의 임의의 특정 값 또는 하위범위를 문맥에서 달리 명시하지 않는 한 범위의 하한의 단위의 10분의 1까지 가정할 수 있다.
본 출원은 다양한 발행된 특허, 공개된 특허출원, 저널 기사, 및 기타 간행물을 참조하며, 이들 모두는 참조로 본원에 포함된다. 포함된 참고문헌 중 어느 것과 본 명세서 사이에 충돌이 있는 경우, 명세서가 우선할 것이다. 또한, 종래 기술에 속하는 본 개시내용의 임의의 특정 구현예는 임의의 하나 이상의 청구범위에서 명시적으로 제외될 수 있다. 이러한 구현예는 당업자에게 공지된 것으로 간주되기 때문에, 제외가 본원에서 명시적으로 제시되지 않는 경우에도 이들은 제외될 수 있다. 본 개시내용의 임의의 특정 구현예는 선행 기술의 존재와 관련이 있는지 여부에 관계없이 어떤 이유로든 청구범위에서 제외될 수 있다.
당업자는 단지 일상적인 실험을 사용하여 본원에 기술된 특정 구현예에 대한 많은 등가물을 인식하거나 확인할 수 있을 것이다. 본원 기술된 본 구현예의 범위는 상기 설명에 한정되는 것이 아니라, 첨부된 특허청구범위에 기재된 바와 같다. 당업자는 하기 청구범위에 정의된 바와 같은 본 개시내용의 사상 또는 범위를 벗어나지 않고 본 설명에 대한 다양한 변경 및 변형이 이루어질 수 있음을 이해할 것이다.
SEQUENCE LISTING
<110> Massachusetts Institute of Technology
<120> SHANK3 GENE THERAPY APPROACHES
<130> B1195.70108WO00
<140> Not Yet Assigned
<141> Concurrently Herewith
<150> US 63/066,570
<151> 2020-08-17
<160> 22
<170> PatentIn version 3.5
<210> 1
<211> 2121
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 1
atgggcccga agcggaaact ttacagtgcc gtccccggcc gcaagttcat cgctgtgaag 60
gcgcacagcc cgcagggcga gggcgagatc ccgctgcacc gcggcgaggc cgtgaaggtg 120
ctcagcattg gggagggcgg tttctgggag ggaaccgtga agggccgaac aggctggttc 180
ccagctgact gtgtggaaga agtgcagatg cgacagtatg acacccggca tgaaaccaga 240
gaggaccgga cgaagcgtct cttccgccac tacactgtgg gttcctatga cagcctcact 300
tcacacagcg attatgtcat cgatgataag gtggctatcc tgcagaaaag ggaccatgag 360
gggtttggct ttgttctccg gggagccaaa gcagagaccc ccattgagga gtttacaccc 420
acacctgcct tccctgcact ccaatacctt gagtctgtag atgtggaagg tgtggcctgg 480
agggctggac ttcgaactgg ggacttcctc attgaggtga acggagtgaa tgtcgtgaag 540
gttggacaca agcaagtggt gggtctcatc cgtcagggtg gcaaccgcct ggtcatgaag 600
gttgtgtctg tgaccaggaa acccgaggag gatggtgctc ggcgcagagc cccaccaccc 660
ccaaagaggg ctcccagcac cacgctgacc ctgcggtcca agtccatgac ggctgagctc 720
gaggaacttg cttccattcg gagctcagag gaggagccag agctggtatt cgctgtgaac 780
ctgccacctg ctcagctgtc ctccagcgat gaggagacca gagaggagct ggcccgcata 840
gggctagtgc caccccctga agagtttgcc aatgggatcc tgctgaccac cccgccccca 900
gggccgggcc ccttgcccac cacggtaccc agcccggcct cagggaagcc cagcagcgag 960
ctgccccctg cccctgagtc tgcagctgac tctggagtag aggaggctga cactcgaagc 1020
tccagtgacc cccacctgga gaccacaagc accatttcca cagtgtccag catgtccacc 1080
ctgagctcgg agagtgggga actcacggac acccacacct cctttgccga tggacacact 1140
tttctactcg agaagccacc agtgcctccc aagcccaagc tcaagtcccc gctggggaag 1200
gggccggtga ccttcaggga cccgctgctg aagcaatcct cggacagtga gctcatggcc 1260
cagcagcacc atgctgcctc tactgggttg gcttctgctg ctgggcccgc ccgccctcgc 1320
tacctcttcc agagaaggtc caagctgtgg ggggaccccg tggagagtcg ggggctccct 1380
gggcctgaag atgacaaacc aactgtgatc agtgagctca gctcccgtct gcagcagctg 1440
aataaagaca cacgctcctt gggggaggaa ccagttggtg gcctgggcag cctgctggac 1500
cctgctaaga agtcacccat tgcagcagct cggctcttca gcagcctcgg tgagctgagc 1560
accatctcag cgcagcgcag cccggggggc ccgggcggag gggcctccta ctcggtgcgg 1620
cccagcggcc ggtaccccgt ggcgagacga gccccgagcc cagtgaaacc cgcatcgctg 1680
gagcgggtgg aggggctggg ggcgggcgtg ggaggcgcgg ggcggccctt cggcctcacg 1740
cctcccacca tcctcaagtc gtccagcctc tccatcccgc acgaacccaa ggaagtgcgc 1800
ttcgtggtgc gaagtgtgag tgcgcgcagc cgctccccct caccatctcc gctgccctcg 1860
ccttctcccg gctctggccc cagtgccggc ccgcgtcggc catttcaaca gaagcccctg 1920
cagctctgga gcaagttcga tgtgggcgac tggctggaga gcatccactt aggcgagcac 1980
cgagaccgct tcgaggacca tgagatcgaa ggcgcacacc tgcctgcgct caccaaggaa 2040
gacttcgtgg agctgggcgt cacacgcgtt ggccaccgca tgaacatcga gcgtgcgctc 2100
aggcagctgg atggcagctg a 2121
<210> 2
<211> 2124
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 2
atgggcccga agcggaaact ttacagcgcc gtccccggcc gcaagttcat cgccgtgaag 60
gcgcacagcc cgcagggtga aggcgagatc ccgctgcacc gcggcgaggc cgtgaaggtg 120
ctcagcattg gggagggcgg tttctgggag ggaaccgtga aaggccgcac gggctggttc 180
ccggccgact gcgtggagga agtgcagatg aggcagcatg acacacggcc tgaaacgcgg 240
gaggaccgga cgaagcggct ctttcggcac tacacagtgg gctcctacga cagcctcacc 300
tcacacagcg attatgtcat tgatgacaaa gtggctgtcc tgcagaaacg ggaccacgag 360
ggctttggtt ttgtgctccg gggagccaaa gcagagaccc ccatcgagga gttcacgccc 420
acgccagcct tcccggcgct gcagtatctc gagtcggtgg acgtggaggg tgtggcctgg 480
agggccgggc tgcgcacggg agacttcctc atcgaggtga acggggtgaa cgtggtgaag 540
gtcggacaca agcaggtggt ggctctgatt cgccagggtg gcaaccgcct cgtcatgaag 600
gttgtgtctg tgacaaggaa gccagaagag gacggggctc ggcgcagagc cccaccgccc 660
cccaagaggg cccccagcac cacactgacc ctgcgctcca agtccatgac agctgagctc 720
gaggaacttg cctccattcg gagctcagag gaagagccag agctggtgtt tgctgtgaac 780
ctgccacctg cccagctgtc gtccagcgat gaggagacca gggaggagct ggcccgaatt 840
gggttggtgc caccccctga agagtttgcc aacggggtcc tgctggccac cccactcgct 900
ggcccgggcc cctcgcccac cacggtgccc agcccggcct cagggaagcc cagcagtgag 960
ccaccccctg cccctgagtc tgcagccgac tctggggtgg aggaggctga cacacgcagc 1020
tccagcgacc cccacctgga gaccacaagc accatctcca cggtgtccag catgtccacc 1080
ttgagctcgg agagcgggga actcactgac acccacacct ccttcgctga cggacacact 1140
tttctactcg agaagccacc agtgcctccc aagcccaagc tcaagtcccc gctggggaag 1200
gggccggtga ccttcaggga cccgctgctg aagcagtcct cggacagcga gctcatggcc 1260
cagcagcacc acgccgcctc tgccgggctg gcctctgccg ccgggcctgc ccgccctcgc 1320
tacctcttcc agagaaggtc caagctatgg ggggaccccg tggagagccg ggggctccct 1380
gggcctgaag acgacaaacc aactgtgatc agtgagctca gctcccgcct gcagcagctg 1440
aacaaggaca cgcgttccct gggggaggaa ccagttggtg gcctgggcag cctgctggac 1500
cctgccaaga agtcgcccat cgcagcagct cggctcttca gcagcctcgg tgagctgagc 1560
tccatttcag cgcagcgcag ccccgggggc ccgggcggcg gggcctcgta ctcggtgagg 1620
cccagtggcc gctaccccgt ggcgagacgc gccccgagcc cggtgaagcc cgcgtcgctg 1680
gagcgggtgg aggggctggg ggcgggcgcg gggggcgcag ggcggccctt cggcctcacg 1740
ccccccacca tcctcaagtc gtccagcctc tccatcccgc acgagcccaa ggaggtgcgc 1800
ttcgtggtgc gcagcgtgag cgcgcgcagt cgctccccct cgccgtcgcc gctgccctcg 1860
cccgcgtccg gccccggccc cggcgccccc ggcccacgcc gacccttcca gcagaagccg 1920
ctgcagctct ggagcaagtt cgacgtgggc gactggctgg agagcatcca cctaggcgag 1980
caccgcgacc gcttcgagga ccatgagata gaaggcgcgc acctacccgc gcttaccaag 2040
gacgacttcg tggagctggg cgtcacgcgc gtgggccacc gcatgaacat cgagcgcgcg 2100
ctcaggcagc tggacggcag ctga 2124
<210> 3
<211> 3276
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 3
atggacggcc ccggggccag cgccgtggtc gtgcgcgtcg gcatcccgga cctgcaacaa 60
acgaagtgcc tgcgtctgga cccaaccgcg cccgtgtggg ccgccaagca gcgtgtgctc 120
tgcgccctca atcatagcct tcaagacgcg ctcaactacg ggctattcca gcctccctcc 180
cggggtcgcg ccggcaagtt cctggatgaa gagcggctct tacaggacta cccgcctaac 240
ctggacacgc ccctgcccta tctggagttc cgatacaagc ggagagttta tgcccagaac 300
ctcatagatg acaagcagtt tgcaaagcta cacacaaagg caaacctgaa gaagttcatg 360
gactatgtcc agctacacag cacagataag gtggcccgcc tgctggacaa ggggctggac 420
cccaatttcc atgaccctga ctcaggagag tgccctctga gccttgcggc acagttggac 480
aacgccactg acctcctgaa ggttctccgc aacggcggtg ctcatctgga cttccggacc 540
cgagatgggc tgacagccgt ccactgtgct acccgccagc ggaacgcagg ggcattgacg 600
accctgctgg acctgggggc ttcgcctgac tacaaggaca gccgcggcct gacgcccctg 660
taccatagtg ccctaggggg cggggatgcc ctctgttgcg agctgcttct ccatgatcat 720
gcacagctgg ggaccactga tgagaatggt tggcaagaga tccatcaggc ctgtcgcttt 780
ggacacgtgc agcacctgga gcaccttttg ttctatgggg ccaacatggg tgctcagaat 840
gcctcgggaa acacagccct gcacatctgt gccctctaca accaggagag ttgcgcgcgc 900
gtcctgcttt tccgtggtgc caacaaggac gtccgcaatt acaacagcca gacagccttc 960
caggtggcca ttattgcagg gaactttgag cttgccgagg taatcaagac ccacaaagac 1020
tccgatgtcg taccattcag ggaaaccccc agctatgcaa agcgacggcg tctggctggc 1080
ccgagtggcc tggcatcccc acggccctta cagcgctcag ccagtgatat caacctgaaa 1140
ggtgcgccgc cgccccgggg cccgaagcgg aaactttaca gtgccgtccc cggccgcaag 1200
ttcatcgctg tgaaggcgca cagcccgcag ggcgagggcg agatcccgct gcaccgcggc 1260
gaggccgtga aggtgctcag cattggggag ggcggtttct gggagggaac cgtgaagggc 1320
cgaacaggct ggttcccagc tgactgtgtg gaagaagtgc agatgcgaca gtatgacacc 1380
cggcatgaaa ccagagagga ccggacgaag cgtctcttcc gccactacac tgtgggttcc 1440
tatgacagcc tcacttcaca cagcgattat gtcatcgatg ataaggtggc tatcctgcag 1500
aaaagggacc atgaggggtt tggctttgtt ctccggggag ccaaagcaga gacccccatt 1560
gaggagttta cacccacacc tgccttccct gcactccaat accttgagtc tgtagatgtg 1620
gaaggtgtgg cctggagggc tggacttcga actggggact tcctcattga ggtgaacgga 1680
gtgaatgtcg tgaaggttgg acacaagcaa gtggtgggtc tcatccgtca gggtggcaac 1740
cgcctggtca tgaaggttgt gtctgtgacc aggaaacccg aggaggatgg tgctcggcgc 1800
agagccccac cacccccaaa gagggctccc agcaccacgc tgaccctgcg gtccaagtcc 1860
atgacggctg agctcgagga acttgcttcc attcggagct cagaggagga gccagagctg 1920
gtattcgctg tgaacctgcc acctgctcag ctgtcctcca gcgatgagga gaccagagag 1980
gagctggccc gcatagggct agtgccaccc cctgaagagt ttgccaatgg gatcctgctg 2040
accaccccgc ccccagggcc gggccccttg cccaccacgg tacccagccc ggcctcaggg 2100
aagcccagca gcgagctgcc ccctgcccct gagtctgcag ctgactctgg agtagaggag 2160
gctgacactc gaagctccag tgacccccac ctggagacca caagcaccat ttccacagtg 2220
tccagcatgt ccaccctgag ctcggagagt ggggaactca cggacaccca cacctccttt 2280
gccgatggac acacttttct actcgagaag ccaccagtgc ctcccaagcc caagctcaag 2340
tccccgctgg ggaaggggcc ggtgaccttc agggacccgc tgctgaagca atcctcggac 2400
agtgagctca tggcccagca gcaccatgct gcctctactg ggttggcttc tgctgctggg 2460
cccgcccgcc ctcgctacct cttccagaga aggtccaagc tgtgggggga ccccgtggag 2520
agtcgggggc tccctgggcc tgaagatgac aaaccaactg tgatcagtga gctcagctcc 2580
cgtctgcagc agctgaataa agacacacgc tccttggggg aggaaccagt tggtggcctg 2640
ggcagcctgc tggaccctgc taagaagtca cccattgcag cagctcggct cttcagcagc 2700
ctcggtgagc tgagcaccat ctcagcgcag cgcagcccgg ggggcccggg cggaggggcc 2760
tcctactcgg tgcggcccag cggccggtac cccgtggcga gacgagcccc gagcccagtg 2820
aaacccgcat cgctggagcg ggtggagggg ctgggggcgg gcgtgggagg cgcggggcgg 2880
cccttcggcc tcacgcctcc caccatcctc aagtcgtcca gcctctccat cccgcacgaa 2940
cccaaggaag tgcgcttcgt ggtgcgaagt gtgagtgcgc gcagccgctc cccctcacca 3000
tctccgctgc cctcgccttc tcccggctct ggccccagtg ccggcccgcg tcggccattt 3060
caacagaagc ccctgcagct ctggagcaag ttcgatgtgg gcgactggct ggagagcatc 3120
cacttaggcg agcaccgaga ccgcttcgag gaccatgaga tcgaaggcgc acacctgcct 3180
gcgctcacca aggaagactt cgtggagctg ggcgtcacac gcgttggcca ccgcatgaac 3240
atcgagcgtg cgctcaggca gctggatggc agctga 3276
<210> 4
<211> 3279
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 4
atggacggcc ccggggccag cgccgtggtc gtgcgcgtcg gcatcccgga cctgcagcag 60
acgaagtgcc tgcgcctgga cccggccgcg cccgtgtggg ccgccaagca gcgcgtgctc 120
tgcgccctca accacagcct ccaggacgcg ctcaactatg ggcttttcca gccgccctcc 180
cggggccgcg ccggcaagtt cctggatgag gagcggctcc tgcaggagta cccgcccaac 240
ctggacacgc ccctgcccta cctggagttt cgatacaagc ggcgagttta tgcccagaac 300
ctcatcgatg ataagcagtt tgcaaagctt cacacaaagg cgaacctgaa gaagttcatg 360
gactacgtcc agctgcatag cacggacaag gtggcacgcc tgttggacaa ggggctggac 420
cccaacttcc atgaccctga ctcaggagag tgccccctga gcctcgcagc ccagctggac 480
aacgccacgg acctgctaaa ggtgctgaag aatggtggtg cccacctgga cttccgcact 540
cgcgatgggc tcactgccgt gcactgtgcc acacgccagc ggaatgcggc agcactgacg 600
accctgctgg acctgggggc ttcacctgac tacaaggaca gccgcggctt gacacccctc 660
taccacagcg ccctgggggg tggggatgcc ctctgctgtg agctgcttct ccacgaccac 720
gctcagctgg ggatcaccga cgagaatggc tggcaggaga tccaccaggc ctgccgcttt 780
gggcacgtgc agcatctgga gcacctgctg ttctatgggg cagacatggg ggcccagaac 840
gcctcgggga acacagccct gcacatctgt gccctctaca accaggagag ctgtgctcgt 900
gtcctgctct tccgtggagc taacagggat gtccgcaact acaacagcca gacagccttc 960
caggtggcca tcatcgcagg gaactttgag cttgcagagg ttatcaagac ccacaaagac 1020
tcggatgttg taccattcag ggaaaccccc agctatgcga agcggcggcg actggctggc 1080
cccagtggct tggcatcccc tcggcctctg cagcgctcag ccagcgatat caacctgaag 1140
ggggcaccgc cgccccgggg cccgaagcgg aaactttaca gcgccgtccc cggccgcaag 1200
ttcatcgccg tgaaggcgca cagcccgcag ggtgaaggcg agatcccgct gcaccgcggc 1260
gaggccgtga aggtgctcag cattggggag ggcggtttct gggagggaac cgtgaaaggc 1320
cgcacgggct ggttcccggc cgactgcgtg gaggaagtgc agatgaggca gcatgacaca 1380
cggcctgaaa cgcgggagga ccggacgaag cggctctttc ggcactacac agtgggctcc 1440
tacgacagcc tcacctcaca cagcgattat gtcattgatg acaaagtggc tgtcctgcag 1500
aaacgggacc acgagggctt tggttttgtg ctccggggag ccaaagcaga gacccccatc 1560
gaggagttca cgcccacgcc agccttcccg gcgctgcagt atctcgagtc ggtggacgtg 1620
gagggtgtgg cctggagggc cgggctgcgc acgggagact tcctcatcga ggtgaacggg 1680
gtgaacgtgg tgaaggtcgg acacaagcag gtggtggctc tgattcgcca gggtggcaac 1740
cgcctcgtca tgaaggttgt gtctgtgaca aggaagccag aagaggacgg ggctcggcgc 1800
agagccccac cgccccccaa gagggccccc agcaccacac tgaccctgcg ctccaagtcc 1860
atgacagctg agctcgagga acttgcctcc attcggagct cagaggaaga gccagagctg 1920
gtgtttgctg tgaacctgcc acctgcccag ctgtcgtcca gcgatgagga gaccagggag 1980
gagctggccc gaattgggtt ggtgccaccc cctgaagagt ttgccaacgg ggtcctgctg 2040
gccaccccac tcgctggccc gggcccctcg cccaccacgg tgcccagccc ggcctcaggg 2100
aagcccagca gtgagccacc ccctgcccct gagtctgcag ccgactctgg ggtggaggag 2160
gctgacacac gcagctccag cgacccccac ctggagacca caagcaccat ctccacggtg 2220
tccagcatgt ccaccttgag ctcggagagc ggggaactca ctgacaccca cacctccttc 2280
gctgacggac acacttttct actcgagaag ccaccagtgc ctcccaagcc caagctcaag 2340
tccccgctgg ggaaggggcc ggtgaccttc agggacccgc tgctgaagca gtcctcggac 2400
agcgagctca tggcccagca gcaccacgcc gcctctgccg ggctggcctc tgccgccggg 2460
cctgcccgcc ctcgctacct cttccagaga aggtccaagc tatgggggga ccccgtggag 2520
agccgggggc tccctgggcc tgaagacgac aaaccaactg tgatcagtga gctcagctcc 2580
cgcctgcagc agctgaacaa ggacacgcgt tccctggggg aggaaccagt tggtggcctg 2640
ggcagcctgc tggaccctgc caagaagtcg cccatcgcag cagctcggct cttcagcagc 2700
ctcggtgagc tgagctccat ttcagcgcag cgcagccccg ggggcccggg cggcggggcc 2760
tcgtactcgg tgaggcccag tggccgctac cccgtggcga gacgcgcccc gagcccggtg 2820
aagcccgcgt cgctggagcg ggtggagggg ctgggggcgg gcgcgggggg cgcagggcgg 2880
cccttcggcc tcacgccccc caccatcctc aagtcgtcca gcctctccat cccgcacgag 2940
cccaaggagg tgcgcttcgt ggtgcgcagc gtgagcgcgc gcagtcgctc cccctcgccg 3000
tcgccgctgc cctcgcccgc gtccggcccc ggccccggcg cccccggccc acgccgaccc 3060
ttccagcaga agccgctgca gctctggagc aagttcgacg tgggcgactg gctggagagc 3120
atccacctag gcgagcaccg cgaccgcttc gaggaccatg agatagaagg cgcgcaccta 3180
cccgcgctta ccaaggacga cttcgtggag ctgggcgtca cgcgcgtggg ccaccgcatg 3240
aacatcgagc gcgcgctcag gcagctggac ggcagctga 3279
<210> 5
<211> 1730
<212> PRT
<213> Mus musculus
<400> 5
Met Asp Gly Pro Gly Ala Ser Ala Val Val Val Arg Val Gly Ile Pro
1 5 10 15
Asp Leu Gln Gln Thr Lys Cys Leu Arg Leu Asp Pro Thr Ala Pro Val
20 25 30
Trp Ala Ala Lys Gln Arg Val Leu Cys Ala Leu Asn His Ser Leu Gln
35 40 45
Asp Ala Leu Asn Tyr Gly Leu Phe Gln Pro Pro Ser Arg Gly Arg Ala
50 55 60
Gly Lys Phe Leu Asp Glu Glu Arg Leu Leu Gln Asp Tyr Pro Pro Asn
65 70 75 80
Leu Asp Thr Pro Leu Pro Tyr Leu Glu Phe Arg Tyr Lys Arg Arg Val
85 90 95
Tyr Ala Gln Asn Leu Ile Asp Asp Lys Gln Phe Ala Lys Leu His Thr
100 105 110
Lys Ala Asn Leu Lys Lys Phe Met Asp Tyr Val Gln Leu His Ser Thr
115 120 125
Asp Lys Val Ala Arg Leu Leu Asp Lys Gly Leu Asp Pro Asn Phe His
130 135 140
Asp Pro Asp Ser Gly Glu Cys Pro Leu Ser Leu Ala Ala Gln Leu Asp
145 150 155 160
Asn Ala Thr Asp Leu Leu Lys Val Leu Arg Asn Gly Gly Ala His Leu
165 170 175
Asp Phe Arg Thr Arg Asp Gly Leu Thr Ala Val His Cys Ala Thr Arg
180 185 190
Gln Arg Asn Ala Gly Ala Leu Thr Thr Leu Leu Asp Leu Gly Ala Ser
195 200 205
Pro Asp Tyr Lys Asp Ser Arg Gly Leu Thr Pro Leu Tyr His Ser Ala
210 215 220
Leu Gly Gly Gly Asp Ala Leu Cys Cys Glu Leu Leu Leu His Asp His
225 230 235 240
Ala Gln Leu Gly Thr Thr Asp Glu Asn Gly Trp Gln Glu Ile His Gln
245 250 255
Ala Cys Arg Phe Gly His Val Gln His Leu Glu His Leu Leu Phe Tyr
260 265 270
Gly Ala Asn Met Gly Ala Gln Asn Ala Ser Gly Asn Thr Ala Leu His
275 280 285
Ile Cys Ala Leu Tyr Asn Gln Glu Ser Cys Ala Arg Val Leu Leu Phe
290 295 300
Arg Gly Ala Asn Lys Asp Val Arg Asn Tyr Asn Ser Gln Thr Ala Phe
305 310 315 320
Gln Val Ala Ile Ile Ala Gly Asn Phe Glu Leu Ala Glu Val Ile Lys
325 330 335
Thr His Lys Asp Ser Asp Val Val Pro Phe Arg Glu Thr Pro Ser Tyr
340 345 350
Ala Lys Arg Arg Arg Leu Ala Gly Pro Ser Gly Leu Ala Ser Pro Arg
355 360 365
Pro Leu Gln Arg Ser Ala Ser Asp Ile Asn Leu Lys Gly Asp Gln Pro
370 375 380
Ala Ala Ser Pro Gly Pro Thr Leu Arg Ser Leu Pro His Gln Leu Leu
385 390 395 400
Leu Gln Arg Leu Gln Glu Glu Lys Asp Arg Asp Arg Asp Gly Glu Leu
405 410 415
Glu Asn Asp Ile Ser Gly Pro Ser Ala Gly Arg Gly Gly His Asn Lys
420 425 430
Ile Ser Pro Ser Gly Pro Gly Gly Ser Gly Pro Ala Pro Gly Pro Gly
435 440 445
Pro Ala Ser Pro Ala Pro Pro Ala Pro Pro Pro Arg Gly Pro Lys Arg
450 455 460
Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys Phe Ile Ala Val Lys Ala
465 470 475 480
His Ser Pro Gln Gly Glu Gly Glu Ile Pro Leu His Arg Gly Glu Ala
485 490 495
Val Lys Val Leu Ser Ile Gly Glu Gly Gly Phe Trp Glu Gly Thr Val
500 505 510
Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp Cys Val Glu Glu Val Gln
515 520 525
Met Arg Gln Tyr Asp Thr Arg His Glu Thr Arg Glu Asp Arg Thr Lys
530 535 540
Arg Leu Phe Arg His Tyr Thr Val Gly Ser Tyr Asp Ser Leu Thr Ser
545 550 555 560
His Ser Asp Tyr Val Ile Asp Asp Lys Val Ala Ile Leu Gln Lys Arg
565 570 575
Asp His Glu Gly Phe Gly Phe Val Leu Arg Gly Ala Lys Ala Glu Thr
580 585 590
Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala Phe Pro Ala Leu Gln Tyr
595 600 605
Leu Glu Ser Val Asp Val Glu Gly Val Ala Trp Arg Ala Gly Leu Arg
610 615 620
Thr Gly Asp Phe Leu Ile Glu Val Asn Gly Val Asn Val Val Lys Val
625 630 635 640
Gly His Lys Gln Val Val Gly Leu Ile Arg Gln Gly Gly Asn Arg Leu
645 650 655
Val Met Lys Val Val Ser Val Thr Arg Lys Pro Glu Glu Asp Gly Ala
660 665 670
Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg Ala Pro Ser Thr Thr Leu
675 680 685
Thr Leu Arg Ser Lys Ser Met Thr Ala Glu Leu Glu Glu Leu Ala Ser
690 695 700
Ile Arg Arg Arg Lys Gly Glu Lys Leu Asp Glu Ile Leu Ala Val Ala
705 710 715 720
Ala Glu Pro Thr Leu Arg Pro Asp Ile Ala Asp Ala Asp Ser Arg Ala
725 730 735
Ala Thr Val Lys Gln Arg Pro Thr Ser Arg Arg Ile Thr Pro Ala Glu
740 745 750
Ile Ser Ser Leu Phe Glu Arg Gln Gly Leu Pro Gly Pro Glu Lys Leu
755 760 765
Pro Gly Ser Leu Arg Lys Gly Ile Pro Arg Thr Lys Ser Val Gly Glu
770 775 780
Asp Glu Lys Leu Ala Ser Leu Leu Glu Gly Arg Phe Pro Arg Ser Thr
785 790 795 800
Ser Met Gln Asp Thr Val Arg Glu Gly Arg Gly Ile Pro Pro Pro Pro
805 810 815
Gln Thr Ala Pro Pro Pro Pro Pro Ala Pro Tyr Tyr Phe Asp Ser Gly
820 825 830
Pro Pro Pro Thr Phe Ser Pro Pro Pro Pro Pro Gly Arg Ala Tyr Asp
835 840 845
Thr Val Arg Ser Ser Phe Lys Pro Gly Leu Glu Ala Arg Leu Gly Ala
850 855 860
Gly Ala Ala Gly Leu Tyr Asp Pro Ser Thr Pro Leu Gly Pro Leu Pro
865 870 875 880
Tyr Pro Glu Arg Gln Lys Arg Ala Arg Ser Met Ile Ile Leu Gln Asp
885 890 895
Ser Ala Pro Glu Val Gly Asp Val Pro Arg Pro Ala Pro Ala Ala Thr
900 905 910
Pro Pro Glu Arg Pro Lys Arg Arg Pro Arg Pro Ser Gly Pro Asp Ser
915 920 925
Pro Tyr Ala Asn Leu Gly Ala Phe Ser Ala Ser Leu Phe Ala Pro Ser
930 935 940
Lys Pro Gln Arg Arg Lys Ser Pro Leu Val Lys Gln Leu Gln Val Glu
945 950 955 960
Asp Ala Gln Glu Arg Ala Ala Leu Ala Val Gly Ser Pro Gly Pro Val
965 970 975
Gly Gly Ser Phe Ala Arg Glu Pro Ser Pro Thr His Arg Gly Pro Arg
980 985 990
Pro Gly Ser Leu Asp Tyr Ser Ser Gly Glu Gly Leu Gly Leu Thr Phe
995 1000 1005
Gly Gly Pro Ser Pro Gly Pro Val Lys Glu Arg Arg Leu Glu Glu
1010 1015 1020
Arg Arg Arg Ser Thr Val Phe Leu Ser Val Gly Ala Ile Glu Gly
1025 1030 1035
Ser Pro Pro Ser Ala Asp Leu Pro Ser Leu Gln Pro Ser Arg Ser
1040 1045 1050
Ile Asp Glu Arg Leu Leu Gly Thr Gly Ala Thr Thr Gly Arg Asp
1055 1060 1065
Leu Leu Leu Pro Ser Pro Val Ser Ala Leu Lys Pro Leu Val Gly
1070 1075 1080
Gly Pro Ser Leu Gly Pro Ser Gly Ser Thr Phe Ile His Pro Leu
1085 1090 1095
Thr Gly Lys Pro Leu Asp Pro Ser Ser Pro Leu Ala Leu Ala Leu
1100 1105 1110
Ala Ala Arg Glu Arg Ala Leu Ala Ser Gln Thr Pro Ser Arg Ser
1115 1120 1125
Pro Thr Pro Val His Ser Pro Asp Ala Asp Arg Pro Gly Pro Leu
1130 1135 1140
Phe Val Asp Val Gln Thr Arg Asp Ser Glu Arg Gly Pro Leu Ala
1145 1150 1155
Ser Pro Ala Phe Ser Pro Arg Ser Pro Ala Trp Ile Pro Val Pro
1160 1165 1170
Ala Arg Arg Glu Ala Glu Lys Pro Pro Arg Glu Glu Arg Lys Ser
1175 1180 1185
Pro Glu Asp Lys Lys Ser Met Ile Leu Ser Val Leu Asp Thr Ser
1190 1195 1200
Leu Gln Arg Pro Ala Gly Leu Ile Val Val His Ala Thr Ser Asn
1205 1210 1215
Gly Gln Glu Pro Ser Arg Leu Gly Ala Glu Glu Glu Arg Pro Gly
1220 1225 1230
Thr Pro Glu Leu Ala Pro Ala Pro Met Gln Ala Ala Ala Val Ala
1235 1240 1245
Glu Pro Met Pro Ser Pro Arg Ala Gln Pro Pro Gly Ser Ile Pro
1250 1255 1260
Ala Asp Pro Gly Pro Gly Gln Gly Ser Ser Glu Glu Glu Pro Glu
1265 1270 1275
Leu Val Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser
1280 1285 1290
Asp Glu Glu Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro
1295 1300 1305
Pro Pro Glu Glu Phe Ala Asn Gly Ile Leu Leu Thr Thr Pro Pro
1310 1315 1320
Pro Gly Pro Gly Pro Leu Pro Thr Thr Val Pro Ser Pro Ala Ser
1325 1330 1335
Gly Lys Pro Ser Ser Glu Leu Pro Pro Ala Pro Glu Ser Ala Ala
1340 1345 1350
Asp Ser Gly Val Glu Glu Ala Asp Thr Arg Ser Ser Ser Asp Pro
1355 1360 1365
His Leu Glu Thr Thr Ser Thr Ile Ser Thr Val Ser Ser Met Ser
1370 1375 1380
Thr Leu Ser Ser Glu Ser Gly Glu Leu Thr Asp Thr His Thr Ser
1385 1390 1395
Phe Ala Asp Gly His Thr Phe Leu Leu Glu Lys Pro Pro Val Pro
1400 1405 1410
Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly Lys Gly Pro Val Thr
1415 1420 1425
Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp Ser Glu Leu Met
1430 1435 1440
Ala Gln Gln His His Ala Ala Ser Thr Gly Leu Ala Ser Ala Ala
1445 1450 1455
Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser Lys Leu
1460 1465 1470
Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu Asp
1475 1480 1485
Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln
1490 1495 1500
Leu Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly
1505 1510 1515
Leu Gly Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala
1520 1525 1530
Ala Arg Leu Phe Ser Ser Leu Gly Glu Leu Ser Thr Ile Ser Ala
1535 1540 1545
Gln Arg Ser Pro Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val
1550 1555 1560
Arg Pro Ser Gly Arg Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro
1565 1570 1575
Val Lys Pro Ala Ser Leu Glu Arg Val Glu Gly Leu Gly Ala Gly
1580 1585 1590
Val Gly Gly Ala Gly Arg Pro Phe Gly Leu Thr Pro Pro Thr Ile
1595 1600 1605
Leu Lys Ser Ser Ser Leu Ser Ile Pro His Glu Pro Lys Glu Val
1610 1615 1620
Arg Phe Val Val Arg Ser Val Ser Ala Arg Ser Arg Ser Pro Ser
1625 1630 1635
Pro Ser Pro Leu Pro Ser Pro Ser Pro Gly Ser Gly Pro Ser Ala
1640 1645 1650
Gly Pro Arg Arg Pro Phe Gln Gln Lys Pro Leu Gln Leu Trp Ser
1655 1660 1665
Lys Phe Asp Val Gly Asp Trp Leu Glu Ser Ile His Leu Gly Glu
1670 1675 1680
His Arg Asp Arg Phe Glu Asp His Glu Ile Glu Gly Ala His Leu
1685 1690 1695
Pro Ala Leu Thr Lys Glu Asp Phe Val Glu Leu Gly Val Thr Arg
1700 1705 1710
Val Gly His Arg Met Asn Ile Glu Arg Ala Leu Arg Gln Leu Asp
1715 1720 1725
Gly Ser
1730
<210> 6
<211> 1731
<212> PRT
<213> Homo sapiens
<400> 6
Met Asp Gly Pro Gly Ala Ser Ala Val Val Val Arg Val Gly Ile Pro
1 5 10 15
Asp Leu Gln Gln Thr Lys Cys Leu Arg Leu Asp Pro Ala Ala Pro Val
20 25 30
Trp Ala Ala Lys Gln Arg Val Leu Cys Ala Leu Asn His Ser Leu Gln
35 40 45
Asp Ala Leu Asn Tyr Gly Leu Phe Gln Pro Pro Ser Arg Gly Arg Ala
50 55 60
Gly Lys Phe Leu Asp Glu Glu Arg Leu Leu Gln Glu Tyr Pro Pro Asn
65 70 75 80
Leu Asp Thr Pro Leu Pro Tyr Leu Glu Phe Arg Tyr Lys Arg Arg Val
85 90 95
Tyr Ala Gln Asn Leu Ile Asp Asp Lys Gln Phe Ala Lys Leu His Thr
100 105 110
Lys Ala Asn Leu Lys Lys Phe Met Asp Tyr Val Gln Leu His Ser Thr
115 120 125
Asp Lys Val Ala Arg Leu Leu Asp Lys Gly Leu Asp Pro Asn Phe His
130 135 140
Asp Pro Asp Ser Gly Glu Cys Pro Leu Ser Leu Ala Ala Gln Leu Asp
145 150 155 160
Asn Ala Thr Asp Leu Leu Lys Val Leu Lys Asn Gly Gly Ala His Leu
165 170 175
Asp Phe Arg Thr Arg Asp Gly Leu Thr Ala Val His Cys Ala Thr Arg
180 185 190
Gln Arg Asn Ala Ala Ala Leu Thr Thr Leu Leu Asp Leu Gly Ala Ser
195 200 205
Pro Asp Tyr Lys Asp Ser Arg Gly Leu Thr Pro Leu Tyr His Ser Ala
210 215 220
Leu Gly Gly Gly Asp Ala Leu Cys Cys Glu Leu Leu Leu His Asp His
225 230 235 240
Ala Gln Leu Gly Ile Thr Asp Glu Asn Gly Trp Gln Glu Ile His Gln
245 250 255
Ala Cys Arg Phe Gly His Val Gln His Leu Glu His Leu Leu Phe Tyr
260 265 270
Gly Ala Asp Met Gly Ala Gln Asn Ala Ser Gly Asn Thr Ala Leu His
275 280 285
Ile Cys Ala Leu Tyr Asn Gln Glu Ser Cys Ala Arg Val Leu Leu Phe
290 295 300
Arg Gly Ala Asn Arg Asp Val Arg Asn Tyr Asn Ser Gln Thr Ala Phe
305 310 315 320
Gln Val Ala Ile Ile Ala Gly Asn Phe Glu Leu Ala Glu Val Ile Lys
325 330 335
Thr His Lys Asp Ser Asp Val Val Pro Phe Arg Glu Thr Pro Ser Tyr
340 345 350
Ala Lys Arg Arg Arg Leu Ala Gly Pro Ser Gly Leu Ala Ser Pro Arg
355 360 365
Pro Leu Gln Arg Ser Ala Ser Asp Ile Asn Leu Lys Gly Glu Ala Gln
370 375 380
Pro Ala Ala Ser Pro Gly Pro Ser Leu Arg Ser Leu Pro His Gln Leu
385 390 395 400
Leu Leu Gln Arg Leu Gln Glu Glu Lys Asp Arg Asp Arg Asp Ala Asp
405 410 415
Gln Glu Ser Asn Ile Ser Gly Pro Leu Ala Gly Arg Ala Gly Gln Ser
420 425 430
Lys Ile Ser Pro Ser Gly Pro Gly Gly Pro Gly Pro Ala Pro Gly Pro
435 440 445
Gly Pro Ala Pro Pro Ala Pro Pro Ala Pro Pro Pro Arg Gly Pro Lys
450 455 460
Arg Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys Phe Ile Ala Val Lys
465 470 475 480
Ala His Ser Pro Gln Gly Glu Gly Glu Ile Pro Leu His Arg Gly Glu
485 490 495
Ala Val Lys Val Leu Ser Ile Gly Glu Gly Gly Phe Trp Glu Gly Thr
500 505 510
Val Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp Cys Val Glu Glu Val
515 520 525
Gln Met Arg Gln His Asp Thr Arg Pro Glu Thr Arg Glu Asp Arg Thr
530 535 540
Lys Arg Leu Phe Arg His Tyr Thr Val Gly Ser Tyr Asp Ser Leu Thr
545 550 555 560
Ser His Ser Asp Tyr Val Ile Asp Asp Lys Val Ala Val Leu Gln Lys
565 570 575
Arg Asp His Glu Gly Phe Gly Phe Val Leu Arg Gly Ala Lys Ala Glu
580 585 590
Thr Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala Phe Pro Ala Leu Gln
595 600 605
Tyr Leu Glu Ser Val Asp Val Glu Gly Val Ala Trp Arg Ala Gly Leu
610 615 620
Arg Thr Gly Asp Phe Leu Ile Glu Val Asn Gly Val Asn Val Val Lys
625 630 635 640
Val Gly His Lys Gln Val Val Ala Leu Ile Arg Gln Gly Gly Asn Arg
645 650 655
Leu Val Met Lys Val Val Ser Val Thr Arg Lys Pro Glu Glu Asp Gly
660 665 670
Ala Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg Ala Pro Ser Thr Thr
675 680 685
Leu Thr Leu Arg Ser Lys Ser Met Thr Ala Glu Leu Glu Glu Leu Ala
690 695 700
Ser Ile Arg Arg Arg Lys Gly Glu Lys Leu Asp Glu Met Leu Ala Ala
705 710 715 720
Ala Ala Glu Pro Thr Leu Arg Pro Asp Ile Ala Asp Ala Asp Ser Arg
725 730 735
Ala Ala Thr Val Lys Gln Arg Pro Thr Ser Arg Arg Ile Thr Pro Ala
740 745 750
Glu Ile Ser Ser Leu Phe Glu Arg Gln Gly Leu Pro Gly Pro Glu Lys
755 760 765
Leu Pro Gly Ser Leu Arg Lys Gly Ile Pro Arg Thr Lys Ser Val Gly
770 775 780
Glu Asp Glu Lys Leu Ala Ser Leu Leu Glu Gly Arg Phe Pro Arg Ser
785 790 795 800
Thr Ser Met Gln Asp Pro Val Arg Glu Gly Arg Gly Ile Pro Pro Pro
805 810 815
Pro Gln Thr Ala Pro Pro Pro Pro Pro Ala Pro Tyr Tyr Phe Asp Ser
820 825 830
Gly Pro Pro Pro Ala Phe Ser Pro Pro Pro Pro Pro Gly Arg Ala Tyr
835 840 845
Asp Thr Val Arg Ser Ser Phe Lys Pro Gly Leu Glu Ala Arg Leu Gly
850 855 860
Ala Gly Ala Ala Gly Leu Tyr Glu Pro Gly Ala Ala Leu Gly Pro Leu
865 870 875 880
Pro Tyr Pro Glu Arg Gln Lys Arg Ala Arg Ser Met Ile Ile Leu Gln
885 890 895
Asp Ser Ala Pro Glu Ser Gly Asp Ala Pro Arg Pro Pro Pro Ala Ala
900 905 910
Thr Pro Pro Glu Arg Pro Lys Arg Arg Pro Arg Pro Pro Gly Pro Asp
915 920 925
Ser Pro Tyr Ala Asn Leu Gly Ala Phe Ser Ala Ser Leu Phe Ala Pro
930 935 940
Ser Lys Pro Gln Arg Arg Lys Ser Pro Leu Val Lys Gln Leu Gln Val
945 950 955 960
Glu Asp Ala Gln Glu Arg Ala Ala Leu Ala Val Gly Ser Pro Gly Pro
965 970 975
Gly Gly Gly Ser Phe Ala Arg Glu Pro Ser Pro Thr His Arg Gly Pro
980 985 990
Arg Pro Gly Gly Leu Asp Tyr Gly Ala Gly Asp Gly Pro Gly Leu Ala
995 1000 1005
Phe Gly Gly Pro Gly Pro Ala Lys Asp Arg Arg Leu Glu Glu Arg
1010 1015 1020
Arg Arg Ser Thr Val Phe Leu Ser Val Gly Ala Ile Glu Gly Ser
1025 1030 1035
Ala Pro Gly Ala Asp Leu Pro Ser Leu Gln Pro Ser Arg Ser Ile
1040 1045 1050
Asp Glu Arg Leu Leu Gly Thr Gly Pro Thr Ala Gly Arg Asp Leu
1055 1060 1065
Leu Leu Pro Ser Pro Val Ser Ala Leu Lys Pro Leu Val Ser Gly
1070 1075 1080
Pro Ser Leu Gly Pro Ser Gly Ser Thr Phe Ile His Pro Leu Thr
1085 1090 1095
Gly Lys Pro Leu Asp Pro Ser Ser Pro Leu Ala Leu Ala Leu Ala
1100 1105 1110
Ala Arg Glu Arg Ala Leu Ala Ser Gln Ala Pro Ser Arg Ser Pro
1115 1120 1125
Thr Pro Val His Ser Pro Asp Ala Asp Arg Pro Gly Pro Leu Phe
1130 1135 1140
Val Asp Val Gln Ala Arg Asp Pro Glu Arg Gly Ser Leu Ala Ser
1145 1150 1155
Pro Ala Phe Ser Pro Arg Ser Pro Ala Trp Ile Pro Val Pro Ala
1160 1165 1170
Arg Arg Glu Ala Glu Lys Val Pro Arg Glu Glu Arg Lys Ser Pro
1175 1180 1185
Glu Asp Lys Lys Ser Met Ile Leu Ser Val Leu Asp Thr Ser Leu
1190 1195 1200
Gln Arg Pro Ala Gly Leu Ile Val Val His Ala Thr Ser Asn Gly
1205 1210 1215
Gln Glu Pro Ser Arg Leu Gly Gly Ala Glu Glu Glu Arg Pro Gly
1220 1225 1230
Thr Pro Glu Leu Ala Pro Ala Pro Met Gln Ser Ala Ala Val Ala
1235 1240 1245
Glu Pro Leu Pro Ser Pro Arg Ala Gln Pro Pro Gly Gly Thr Pro
1250 1255 1260
Ala Asp Ala Gly Pro Gly Gln Gly Ser Ser Glu Glu Glu Pro Glu
1265 1270 1275
Leu Val Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser
1280 1285 1290
Asp Glu Glu Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro
1295 1300 1305
Pro Pro Glu Glu Phe Ala Asn Gly Val Leu Leu Ala Thr Pro Leu
1310 1315 1320
Ala Gly Pro Gly Pro Ser Pro Thr Thr Val Pro Ser Pro Ala Ser
1325 1330 1335
Gly Lys Pro Ser Ser Glu Pro Pro Pro Ala Pro Glu Ser Ala Ala
1340 1345 1350
Asp Ser Gly Val Glu Glu Ala Asp Thr Arg Ser Ser Ser Asp Pro
1355 1360 1365
His Leu Glu Thr Thr Ser Thr Ile Ser Thr Val Ser Ser Met Ser
1370 1375 1380
Thr Leu Ser Ser Glu Ser Gly Glu Leu Thr Asp Thr His Thr Ser
1385 1390 1395
Phe Ala Asp Gly His Thr Phe Leu Leu Glu Lys Pro Pro Val Pro
1400 1405 1410
Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly Lys Gly Pro Val Thr
1415 1420 1425
Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp Ser Glu Leu Met
1430 1435 1440
Ala Gln Gln His His Ala Ala Ser Ala Gly Leu Ala Ser Ala Ala
1445 1450 1455
Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser Lys Leu
1460 1465 1470
Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu Asp
1475 1480 1485
Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln
1490 1495 1500
Leu Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly
1505 1510 1515
Leu Gly Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala
1520 1525 1530
Ala Arg Leu Phe Ser Ser Leu Gly Glu Leu Ser Ser Ile Ser Ala
1535 1540 1545
Gln Arg Ser Pro Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val
1550 1555 1560
Arg Pro Ser Gly Arg Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro
1565 1570 1575
Val Lys Pro Ala Ser Leu Glu Arg Val Glu Gly Leu Gly Ala Gly
1580 1585 1590
Ala Gly Gly Ala Gly Arg Pro Phe Gly Leu Thr Pro Pro Thr Ile
1595 1600 1605
Leu Lys Ser Ser Ser Leu Ser Ile Pro His Glu Pro Lys Glu Val
1610 1615 1620
Arg Phe Val Val Arg Ser Val Ser Ala Arg Ser Arg Ser Pro Ser
1625 1630 1635
Pro Ser Pro Leu Pro Ser Pro Ala Ser Gly Pro Gly Pro Gly Ala
1640 1645 1650
Pro Gly Pro Arg Arg Pro Phe Gln Gln Lys Pro Leu Gln Leu Trp
1655 1660 1665
Ser Lys Phe Asp Val Gly Asp Trp Leu Glu Ser Ile His Leu Gly
1670 1675 1680
Glu His Arg Asp Arg Phe Glu Asp His Glu Ile Glu Gly Ala His
1685 1690 1695
Leu Pro Ala Leu Thr Lys Asp Asp Phe Val Glu Leu Gly Val Thr
1700 1705 1710
Arg Val Gly His Arg Met Asn Ile Glu Arg Ala Leu Arg Gln Leu
1715 1720 1725
Asp Gly Ser
1730
<210> 7
<211> 7459
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 7
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtttaat taagtgtcta gactgcagag 180
ggccctgcgt atgagtgcaa gtgggtttta ggaccaggat gaggcggggt gggggtgcct 240
acctgacgac cgaccccgac ccactggaca agcacccaac ccccattccc caaattgcgc 300
atcccctatc agagaggggg aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag 360
cttcagcacc gcggacagtg ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca 420
gcactgaagg cgcgctgacg tcactcgccg gtcccccgca aactcccctt cccggccacc 480
ttggtcgcgt ccgcgccgcc gccggcccag ccggaccgca ccacgcgagg cgcgagatag 540
gggggcacgg gcgcgaccat ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg 600
cggtgggcag cggaggagtc gtgtcgtgcc tgagagcgca gtcgagaaac cggctagagg 660
atccttcgaa accggtgcta gcagcgctgt taacaccatg gtgagcaagg gcgaggagct 720
gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg gccacaagtt 780
cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc tgaagttcat 840
ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg 900
cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct tcaagtccgc 960
catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg gcaactacaa 1020
gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg agctgaaggg 1080
catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca actacaacag 1140
ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga acttcaagat 1200
ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc agaacacccc 1260
catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc agtccgccct 1320
gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg tgaccgccgc 1380
cgggatcact ctcggcatgg acgagctgta caagggaagc ggaggaattc acggcccgaa 1440
gcggaaactt tacagtgccg tccccggccg caagttcatc gctgtgaagg cgcacagccc 1500
gcagggcgag ggcgagatcc cgctgcaccg cggcgaggcc gtgaaggtgc tcagcattgg 1560
ggagggcggt ttctgggagg gaaccgtgaa gggccgaaca ggctggttcc cagctgactg 1620
tgtggaagaa gtgcagatgc gacagtatga cacccggcat gaaaccagag aggaccggac 1680
gaagcgtctc ttccgccact acactgtggg ttcctatgac agcctcactt cacacagcga 1740
ttatgtcatc gatgataagg tggctatcct gcagaaaagg gaccatgagg ggtttggctt 1800
tgttctccgg ggagccaaag cagagacccc cattgaggag tttacaccca cacctgcctt 1860
ccctgcactc caataccttg agtctgtaga tgtggaaggt gtggcctgga gggctggact 1920
tcgaactggg gacttcctca ttgaggtgaa cggagtgaat gtcgtgaagg ttggacacaa 1980
gcaagtggtg ggtctcatcc gtcagggtgg caaccgcctg gtcatgaagg ttgtgtctgt 2040
gaccaggaaa cccgaggagg atggtgctcg gcgcagagcc ccaccacccc caaagagggc 2100
tcccagcacc acgctgaccc tgcggtccaa gtccatgacg gctgagctcg aggaacttgc 2160
ttccattcgg agctcagagg aggagccaga gctggtattc gctgtgaacc tgccacctgc 2220
tcagctgtcc tccagcgatg aggagaccag agaggagctg gcccgcatag ggctagtgcc 2280
accccctgaa gagtttgcca atgggatcct gctgaccacc ccgcccccag ggccgggccc 2340
cttgcccacc acggtaccca gcccggcctc agggaagccc agcagcgagc tgccccctgc 2400
ccctgagtct gcagctgact ctggagtaga ggaggctgac actcgaagct ccagtgaccc 2460
ccacctggag accacaagca ccatttccac agtgtccagc atgtccaccc tgagctcgga 2520
gagtggggaa ctcacggaca cccacacctc ctttgccgat ggacacactt ttctactcga 2580
gaagccacca gtgcctccca agcccaagct caagtccccg ctggggaagg ggccggtgac 2640
cttcagggac ccgctgctga agcaatcctc ggacagtgag ctcatggccc agcagcacca 2700
tgctgcctct actgggttgg cttctgctgc tgggcccgcc cgccctcgct acctcttcca 2760
gagaaggtcc aagctgtggg gggaccccgt ggagagtcgg gggctccctg ggcctgaaga 2820
tgacaaacca actgtgatca gtgagctcag ctcccgtctg cagcagctga ataaagacac 2880
acgctccttg ggggaggaac cagttggtgg cctgggcagc ctgctggacc ctgctaagaa 2940
gtcacccatt gcagcagctc ggctcttcag cagcctcggt gagctgagca ccatctcagc 3000
gcagcgcagc ccggggggcc cgggcggagg ggcctcctac tcggtgcggc ccagcggccg 3060
gtaccccgtg gcgagacgag ccccgagccc agtgaaaccc gcatcgctgg agcgggtgga 3120
ggggctgggg gcgggcgtgg gaggcgcggg gcggcccttc ggcctcacgc ctcccaccat 3180
cctcaagtcg tccagcctct ccatcccgca cgaacccaag gaagtgcgct tcgtggtgcg 3240
aagtgtgagt gcgcgcagcc gctccccctc accatctccg ctgccctcgc cttctcccgg 3300
ctctggcccc agtgccggcc cgcgtcggcc atttcaacag aagcccctgc agctctggag 3360
caagttcgat gtgggcgact ggctggagag catccactta ggcgagcacc gagaccgctt 3420
cgaggaccat gagatcgaag gcgcacacct gcctgcgctc accaaggaag acttcgtgga 3480
gctgggcgtc acacgcgttg gccaccgcat gaacatcgag cgtgcgctca ggcagctgga 3540
tggcagctga gcggccatcg tcgacggcgc gccaagctta tcgataatca acctctggat 3600
tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt 3660
ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc 3720
tcctccttgt ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg 3780
caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc 3840
accacctgtc agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa 3900
ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat 3960
tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc tgctcgccta tgttgccacc 4020
tggattctgc gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt 4080
ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc gtcttcgcct tcgccctcag 4140
acgagtcgga tctccctttg ggccgcctcc ccgcatcgat accgagcgct gctcgagaga 4200
tctacgggtg gcatccctgt gacccctccc cagtgcctct cctggccctg gaagttgcca 4260
ctccagtgcc caccagcctt gtcctaataa aattaagttg catcattttg tctgactagg 4320
tgtccttcta taatattatg gggtggaggg gggtggtatg gagcaagggg caagttggga 4380
agacaacctg tagggcctgc ggggtctatt gggaaccaag ctggagtgca gtggcacaat 4440
cttggctcac tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct cagcctcccg 4500
agttgttggg attccaggca tgcatgacca ggctcagcta atttttgttt ttttggtaga 4560
gacggggttt caccatattg gccaggctgg tctccaactc ctaatctcag gtgatctacc 4620
caccttggcc tcccaaattg ctgggattac aggcgtgaac cactgctccc ttccctgtcc 4680
ttctgatttt gtaggtaacc acgtgcggac cgagcggccg caggaacccc tagtgatgga 4740
gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc 4800
ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca 4860
ggggcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatacg 4920
tcaaagcaac catagtacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 4980
acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 5040
ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 5100
ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga tttgggtgat 5160
ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 5220
acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcgggc 5280
tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg 5340
atttaacaaa aatttaacgc gaattttaac aaaatattaa cgtttacaat tttatggtgc 5400
actctcagta caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca 5460
cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 5520
accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga 5580
cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 5640
tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 5700
taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 5760
tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 5820
gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 5880
gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 5940
cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 6000
tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac 6060
tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 6120
atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 6180
ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 6240
gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 6300
gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 6360
gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 6420
gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 6480
gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 6540
cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 6600
atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 6660
tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 6720
ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 6780
gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 6840
tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 6900
ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 6960
ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 7020
gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 7080
ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 7140
tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 7200
ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 7260
agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 7320
agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 7380
gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 7440
tggccttttg ctcacatgt 7459
<210> 8
<211> 5331
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 8
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtttaat taagtgtcta gactgcagag 180
ggccctgcgt atgagtgcaa gtgggtttta ggaccaggat gaggcggggt gggggtgcct 240
acctgacgac cgaccccgac ccactggaca agcacccaac ccccattccc caaattgcgc 300
atcccctatc agagaggggg aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag 360
cttcagcacc gcggacagtg ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca 420
gcactgaagg cgcgctgacg tcactcgccg gtcccccgca aactcccctt cccggccacc 480
ttggtcgcgt ccgcgccgcc gccggcccag ccggaccgca ccacgcgagg cgcgagatag 540
gggggcacgg gcgcgaccat ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg 600
cggtgggcag cggaggagtc gtgtcgtgcc tgagagcgca gtcgagaaac cggctagagg 660
atccttcgaa accggtgcta gcagcgctgt taacaccatg gtgagcaagg gcgaggagct 720
gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg gccacaagtt 780
cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc tgaagttcat 840
ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg 900
cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct tcaagtccgc 960
catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg gcaactacaa 1020
gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg agctgaaggg 1080
catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca actacaacag 1140
ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga acttcaagat 1200
ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc agaacacccc 1260
catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc agtccgccct 1320
gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg tgaccgccgc 1380
cgggatcact ctcggcatgg acgagctgta caagtaaggc gcgcccctgc agggaattcg 1440
atatcaagct tatcgataat caacctctgg attacaaaat ttgtgaaaga ttgactggta 1500
ttcttaacta tgttgctcct tttacgctat gtggatacgc tgctttaatg cctttgtatc 1560
atgctattgc ttcccgtatg gctttcattt tctcctcctt gtataaatcc tggttgctgt 1620
ctctttatga ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg 1680
ctgacgcaac ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt 1740
tcgctttccc cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct 1800
ggacaggggc tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt 1860
cctttccttg gctgctcgcc tatgttgcca cctggattct gcgcgggacg tccttctgct 1920
acgtcccttc ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc 1980
ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct 2040
ccccgcatcg ataccgagcg ctgctcgaga gatctacggg tggcatccct gtgacccctc 2100
cccagtgcct ctcctggccc tggaagttgc cactccagtg cccaccagcc ttgtcctaat 2160
aaaattaagt tgcatcattt tgtctgacta ggtgtccttc tataatatta tggggtggag 2220
gggggtggta tggagcaagg ggcaagttgg gaagacaacc tgtagggcct gcggggtcta 2280
ttgggaacca agctggagtg cagtggcaca atcttggctc actgcaatct ccgcctcctg 2340
ggttcaagcg attctcctgc ctcagcctcc cgagttgttg ggattccagg catgcatgac 2400
caggctcagc taatttttgt ttttttggta gagacggggt ttcaccatat tggccaggct 2460
ggtctccaac tcctaatctc aggtgatcta cccaccttgg cctcccaaat tgctgggatt 2520
acaggcgtga accactgctc ccttccctgt ccttctgatt ttgtaggtaa ccacgtgcgg 2580
accgagcggc cgcaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 2640
tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc 2700
tcagtgagcg agcgagcgcg cagctgcctg caggggcgcc tgatgcggta ttttctcctt 2760
acgcatctgt gcggtatttc acaccgcata cgtcaaagca accatagtac gcgccctgta 2820
gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca 2880
gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct 2940
ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc 3000
acctcgaccc caaaaaactt gatttgggtg atggttcacg tagtgggcca tcgccctgat 3060
agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc 3120
aaactggaac aacactcaac cctatctcgg gctattcttt tgatttataa gggattttgc 3180
cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta 3240
acaaaatatt aacgtttaca attttatggt gcactctcag tacaatctgc tctgatgccg 3300
catagttaag ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc 3360
tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga 3420
ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata cgcctatttt 3480
tataggttaa tgtcatgata ataatggttt cttagacgtc aggtggcact tttcggggaa 3540
atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca 3600
tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc 3660
aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc 3720
acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt 3780
acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt 3840
ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg 3900
ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact 3960
caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg 4020
ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga 4080
aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg 4140
aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa 4200
tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac 4260
aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc 4320
cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca 4380
ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga 4440
gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta 4500
agcattggta actgtcagac caagtttact catatatact ttagattgat ttaaaacttc 4560
atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc 4620
cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt 4680
cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac 4740
cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct 4800
tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact 4860
tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg 4920
ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata 4980
aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga 5040
cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag 5100
ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg 5160
agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac 5220
ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca 5280
acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg t 5331
<210> 9
<211> 6369
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 9
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtttaat taagtgtcta gactgcagag 180
ggccctgcgt atgagtgcaa gtgggtttta ggaccaggat gaggcggggt gggggtgcct 240
acctgacgac cgaccccgac ccactggaca agcacccaac ccccattccc caaattgcgc 300
atcccctatc agagaggggg aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag 360
cttcagcacc gcggacagtg ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca 420
gcactgaagg cgcgctgacg tcactcgccg gtcccccgca aactcccctt cccggccacc 480
ttggtcgcgt ccgcgccgcc gccggcccag ccggaccgca ccacgcgagg cgcgagatag 540
gggggcacgg gcgcgaccat ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg 600
cggtgggcag cggaggagtc gtgtcgtgcc tgagagcgca gtcgagaaac cggctagagg 660
atccttcgaa accggtgcta gcaccatgcc taagaagaag agaaaggtat gcaggtcaca 720
ccaaaatttg cctgcattac cggtcgatgc aacgagtgat gaggttcgca agaacctgat 780
ggacatgttc agggatcgcc aggcgttttc tgagcatacc tggaaaatgc ttctgtccgt 840
ttgccggtcg tgggcggcat ggtgcaagtt gaataaccgg aaatggtttc ccgcagaacc 900
tgaagatgtt cgcgattatc ttctatatct tcaggcgcgc ggtctggcag taaaaactat 960
ccagcaacat ttgggccagc taaacatgct tcatcgtcgg tccgggctgc cacgaccaag 1020
tgacagcaat gctgtttcac tggttatgcg gcggatccga aaagaaaacg ttgatgccgg 1080
tgaacgtgca aaacaggctc tagcgttcga acgcactgat ttcgaccagg ttcgttcact 1140
catggaaaat agcgatcgct gccaggatat acgtaatctg gcatttctgg ggattgctta 1200
taacaccctg ttacgtatag ccgaaattgc caggatcagg gttaaagata tctcacgtac 1260
tgacggtggg agaatgttaa tccatattgg cagaacgaaa acgctggtta gcaccgcagg 1320
tgtagagaag gcacttagcc tgggggtaac taaactggtc gagcgatgga tttccgtctc 1380
tggtgtagct gatgatccga ataactacct gttttgccgg gtcagaaaaa atggtgttgc 1440
cgcgccatct gccaccagcc agctatcaac tcgcgccctg gaagggattt ttgaagcaac 1500
tcatcgattg atttacggcg ctaaggatga ctctggtcag agatacctgg cctggtctgg 1560
acacagtgcc cgtgtcggag ccgcgcgaga tatggcccgc gctggagttt caataccgga 1620
gatcatgcaa gctggtggct ggaccaatgt aaatattgtc atgaactata tccgtaacct 1680
ggatagtgaa acaggggcaa tggtgcgcct gctggaagat ggcgatgtta acgtgagcaa 1740
gggcgaggag ctgttcaccg gggtggtgcc catcctggtc gagctggacg gcgacgtaaa 1800
cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg gcaagctgac 1860
cctgaagttc atctgcacca ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac 1920
cctgacctac ggcgtgcagt gcttcagccg ctaccccgac cacatgaagc agcacgactt 1980
cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc accatcttct tcaaggacga 2040
cggcaactac aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat 2100
cgagctgaag ggcatcgact tcaaggagga cggcaacatc ctggggcaca agctggagta 2160
caactacaac agccacaacg tctatatcat ggccgacaag cagaagaacg gcatcaaggt 2220
gaacttcaag atccgccaca acatcgagga cggcagcgtg cagctcgccg accactacca 2280
gcagaacacc cccatcggcg acggccccgt gctgctgccc gacaaccact acctgagcac 2340
ccagtccgcc ctgagcaaag accccaacga gaagcgcgat cacatggtcc tgctggagtt 2400
cgtgaccgcc gccgggatca ctctcggcat ggacgagctg tacaagtaag tcgacggcgc 2460
gcccctgcag ggaattcgat atcaagctta tcgataatca acctctggat tacaaaattt 2520
gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt ggatacgctg 2580
ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc tcctccttgt 2640
ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg caacgtggcg 2700
tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc accacctgtc 2760
agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa ctcatcgccg 2820
cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat tccgtggtgt 2880
tgtcggggaa atcatcgtcc tttccttggc tgctcgccta tgttgccacc tggattctgc 2940
gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt ccttcccgcg 3000
gcctgctgcc ggctctgcgg cctcttccgc gtcttcgcct tcgccctcag acgagtcgga 3060
tctccctttg ggccgcctcc ccgcatcgat accgagcgct gctcgagaga tctacgggtg 3120
gcatccctgt gacccctccc cagtgcctct cctggccctg gaagttgcca ctccagtgcc 3180
caccagcctt gtcctaataa aattaagttg catcattttg tctgactagg tgtccttcta 3240
taatattatg gggtggaggg gggtggtatg gagcaagggg caagttggga agacaacctg 3300
tagggcctgc ggggtctatt gggaaccaag ctggagtgca gtggcacaat cttggctcac 3360
tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct cagcctcccg agttgttggg 3420
attccaggca tgcatgacca ggctcagcta atttttgttt ttttggtaga gacggggttt 3480
caccatattg gccaggctgg tctccaactc ctaatctcag gtgatctacc caccttggcc 3540
tcccaaattg ctgggattac aggcgtgaac cactgctccc ttccctgtcc ttctgatttt 3600
gtaggtaacc acgtgcggac cgagcggccg caggaacccc tagtgatgga gttggccact 3660
ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg 3720
ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca ggggcgcctg 3780
atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatacg tcaaagcaac 3840
catagtacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg 3900
tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc 3960
tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc 4020
gatttagtgc tttacggcac ctcgacccca aaaaacttga tttgggtgat ggttcacgta 4080
gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta 4140
atagtggact cttgttccaa actggaacaa cactcaaccc tatctcgggc tattcttttg 4200
atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa 4260
aatttaacgc gaattttaac aaaatattaa cgtttacaat tttatggtgc actctcagta 4320
caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca cccgctgacg 4380
cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg accgtctccg 4440
ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc 4500
tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct tagacgtcag 4560
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 4620
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 4680
ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 4740
gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt 4800
tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt 4860
ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg 4920
tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga 4980
atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa 5040
gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga 5100
caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa 5160
ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca 5220
ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 5280
ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 5340
ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 5400
gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 5460
ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 5520
taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 5580
agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 5640
atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 5700
aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 5760
caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 5820
ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc 5880
cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 5940
tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 6000
gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 6060
ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 6120
gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 6180
caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 6240
ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 6300
tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 6360
ctcacatgt 6369
<210> 10
<211> 5703
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 10
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtttaat taagtgtcta gactgcagag 180
ggccctgcgt atgagtgcaa gtgggtttta ggaccaggat gaggcggggt gggggtgcct 240
acctgacgac cgaccccgac ccactggaca agcacccaac ccccattccc caaattgcgc 300
atcccctatc agagaggggg aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag 360
cttcagcacc gcggacagtg ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca 420
gcactgaagg cgcgctgacg tcactcgccg gtcccccgca aactcccctt cccggccacc 480
ttggtcgcgt ccgcgccgcc gccggcccag ccggaccgca ccacgcgagg cgcgagatag 540
gggggcacgg gcgcgaccat ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg 600
cggtgggcag cggaggagtc gtgtcgtgcc tgagagcgca gtcgagaaac cggctagagg 660
atccttcgaa accggtgcta gcaccatgcc taagaagaag agaaaggtat gcaggtcaca 720
ccaaaatttg cctgcattac cggtcgatgc aacgagtgat gaggttcgca agaacctgat 780
ggacatgttc agggatcgcc aggcgttttc tgagcatacc tggaaaatgc ttctgtccgt 840
ttgccggtcg tgggcggcat ggtgcaagtt gaataaccgg aaatggtttc ccgcagaacc 900
tgaagatgtt cgcgattatc ttctatatct tcaggcgcgc ggtctggcag taaaaactat 960
ccagcaacat ttgggccagc taaacatgct tcatcgtcgg tccgggctgc cacgaccaag 1020
tgacagcaat gctgtttcac tggttatgcg gcggatccga gttaacgtga gcaagggcga 1080
ggagctgttc accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca 1140
caagttcagc gtgtccggcg agggcgaggg cgatgccacc tacggcaagc tgaccctgaa 1200
gttcatctgc accaccggca agctgcccgt gccctggccc accctcgtga ccaccctgac 1260
ctacggcgtg cagtgcttca gccgctaccc cgaccacatg aagcagcacg acttcttcaa 1320
gtccgccatg cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa 1380
ctacaagacc cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct 1440
gaagggcatc gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta 1500
caacagccac aacgtctata tcatggccga caagcagaag aacggcatca aggtgaactt 1560
caagatccgc cacaacatcg aggacggcag cgtgcagctc gccgaccact accagcagaa 1620
cacccccatc ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcacccagtc 1680
cgccctgagc aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac 1740
cgccgccggg atcactctcg gcatggacga gctgtacaag taagtcgacg gcgcgcccct 1800
gcagggaatt cgatatcaag cttatcgata atcaacctct ggattacaaa atttgtgaaa 1860
gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac gctgctttaa 1920
tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc ttgtataaat 1980
cctggttgct gtctctttat gaggagttgt ggcccgttgt caggcaacgt ggcgtggtgt 2040
gcactgtgtt tgctgacgca acccccactg gttggggcat tgccaccacc tgtcagctcc 2100
tttccgggac tttcgctttc cccctcccta ttgccacggc ggaactcatc gccgcctgcc 2160
ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg gtgttgtcgg 2220
ggaaatcatc gtcctttcct tggctgctcg cctatgttgc cacctggatt ctgcgcggga 2280
cgtccttctg ctacgtccct tcggccctca atccagcgga ccttccttcc cgcggcctgc 2340
tgccggctct gcggcctctt ccgcgtcttc gccttcgccc tcagacgagt cggatctccc 2400
tttgggccgc ctccccgcat cgataccgag cgctgctcga gagatctacg ggtggcatcc 2460
ctgtgacccc tccccagtgc ctctcctggc cctggaagtt gccactccag tgcccaccag 2520
ccttgtccta ataaaattaa gttgcatcat tttgtctgac taggtgtcct tctataatat 2580
tatggggtgg aggggggtgg tatggagcaa ggggcaagtt gggaagacaa cctgtagggc 2640
ctgcggggtc tattgggaac caagctggag tgcagtggca caatcttggc tcactgcaat 2700
ctccgcctcc tgggttcaag cgattctcct gcctcagcct cccgagttgt tgggattcca 2760
ggcatgcatg accaggctca gctaattttt gtttttttgg tagagacggg gtttcaccat 2820
attggccagg ctggtctcca actcctaatc tcaggtgatc tacccacctt ggcctcccaa 2880
attgctggga ttacaggcgt gaaccactgc tcccttccct gtccttctga ttttgtaggt 2940
aaccacgtgc ggaccgagcg gccgcaggaa cccctagtga tggagttggc cactccctct 3000
ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt 3060
gcccgggcgg cctcagtgag cgagcgagcg cgcagctgcc tgcaggggcg cctgatgcgg 3120
tattttctcc ttacgcatct gtgcggtatt tcacaccgca tacgtcaaag caaccatagt 3180
acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg 3240
ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 3300
cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 3360
gtgctttacg gcacctcgac cccaaaaaac ttgatttggg tgatggttca cgtagtgggc 3420
catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 3480
gactcttgtt ccaaactgga acaacactca accctatctc gggctattct tttgatttat 3540
aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 3600
acgcgaattt taacaaaata ttaacgttta caattttatg gtgcactctc agtacaatct 3660
gctctgatgc cgcatagtta agccagcccc gacacccgcc aacacccgct gacgcgccct 3720
gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct 3780
gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gagacgaaag ggcctcgtga 3840
tacgcctatt tttataggtt aatgtcatga taataatggt ttcttagacg tcaggtggca 3900
cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt tttctaaata cattcaaata 3960
tgtatccgct catgagacaa taaccctgat aaatgcttca ataatattga aaaaggaaga 4020
gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca ttttgccttc 4080
ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat cagttgggtg 4140
cacgagtggg ttacatcgaa ctggatctca acagcggtaa gatccttgag agttttcgcc 4200
ccgaagaacg ttttccaatg atgagcactt ttaaagttct gctatgtggc gcggtattat 4260
cccgtattga cgccgggcaa gagcaactcg gtcgccgcat acactattct cagaatgact 4320
tggttgagta ctcaccagtc acagaaaagc atcttacgga tggcatgaca gtaagagaat 4380
tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt ctgacaacga 4440
tcggaggacc gaaggagcta accgcttttt tgcacaacat gggggatcat gtaactcgcc 4500
ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt gacaccacga 4560
tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta cttactctag 4620
cttcccggca acaattaata gactggatgg aggcggataa agttgcagga ccacttctgc 4680
gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt gagcgtgggt 4740
ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc gtagttatct 4800
acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct gagataggtg 4860
cctcactgat taagcattgg taactgtcag accaagttta ctcatatata ctttagattg 4920
atttaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt gataatctca 4980
tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc gtagaaaaga 5040
tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa 5100
aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga 5160
aggtaactgg cttcagcaga gcgcagatac caaatactgt ccttctagtg tagccgtagt 5220
taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt 5280
taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac tcaagacgat 5340
agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca cagcccagct 5400
tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga gaaagcgcca 5460
cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc ggaacaggag 5520
agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct gtcgggtttc 5580
gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg agcctatgga 5640
aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct tttgctcaca 5700
tgt 5703
<210> 11
<211> 950
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 11
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Gly
225 230 235 240
Ser Gly Gly Ile His Gly Pro Lys Arg Lys Leu Tyr Ser Ala Val Pro
245 250 255
Gly Arg Lys Phe Ile Ala Val Lys Ala His Ser Pro Gln Gly Glu Gly
260 265 270
Glu Ile Pro Leu His Arg Gly Glu Ala Val Lys Val Leu Ser Ile Gly
275 280 285
Glu Gly Gly Phe Trp Glu Gly Thr Val Lys Gly Arg Thr Gly Trp Phe
290 295 300
Pro Ala Asp Cys Val Glu Glu Val Gln Met Arg Gln Tyr Asp Thr Arg
305 310 315 320
His Glu Thr Arg Glu Asp Arg Thr Lys Arg Leu Phe Arg His Tyr Thr
325 330 335
Val Gly Ser Tyr Asp Ser Leu Thr Ser His Ser Asp Tyr Val Ile Asp
340 345 350
Asp Lys Val Ala Ile Leu Gln Lys Arg Asp His Glu Gly Phe Gly Phe
355 360 365
Val Leu Arg Gly Ala Lys Ala Glu Thr Pro Ile Glu Glu Phe Thr Pro
370 375 380
Thr Pro Ala Phe Pro Ala Leu Gln Tyr Leu Glu Ser Val Asp Val Glu
385 390 395 400
Gly Val Ala Trp Arg Ala Gly Leu Arg Thr Gly Asp Phe Leu Ile Glu
405 410 415
Val Asn Gly Val Asn Val Val Lys Val Gly His Lys Gln Val Val Gly
420 425 430
Leu Ile Arg Gln Gly Gly Asn Arg Leu Val Met Lys Val Val Ser Val
435 440 445
Thr Arg Lys Pro Glu Glu Asp Gly Ala Arg Arg Arg Ala Pro Pro Pro
450 455 460
Pro Lys Arg Ala Pro Ser Thr Thr Leu Thr Leu Arg Ser Lys Ser Met
465 470 475 480
Thr Ala Glu Leu Glu Glu Leu Ala Ser Ile Arg Ser Ser Glu Glu Glu
485 490 495
Pro Glu Leu Val Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser
500 505 510
Ser Asp Glu Glu Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro
515 520 525
Pro Pro Glu Glu Phe Ala Asn Gly Ile Leu Leu Thr Thr Pro Pro Pro
530 535 540
Gly Pro Gly Pro Leu Pro Thr Thr Val Pro Ser Pro Ala Ser Gly Lys
545 550 555 560
Pro Ser Ser Glu Leu Pro Pro Ala Pro Glu Ser Ala Ala Asp Ser Gly
565 570 575
Val Glu Glu Ala Asp Thr Arg Ser Ser Ser Asp Pro His Leu Glu Thr
580 585 590
Thr Ser Thr Ile Ser Thr Val Ser Ser Met Ser Thr Leu Ser Ser Glu
595 600 605
Ser Gly Glu Leu Thr Asp Thr His Thr Ser Phe Ala Asp Gly His Thr
610 615 620
Phe Leu Leu Glu Lys Pro Pro Val Pro Pro Lys Pro Lys Leu Lys Ser
625 630 635 640
Pro Leu Gly Lys Gly Pro Val Thr Phe Arg Asp Pro Leu Leu Lys Gln
645 650 655
Ser Ser Asp Ser Glu Leu Met Ala Gln Gln His His Ala Ala Ser Thr
660 665 670
Gly Leu Ala Ser Ala Ala Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln
675 680 685
Arg Arg Ser Lys Leu Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro
690 695 700
Gly Pro Glu Asp Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg
705 710 715 720
Leu Gln Gln Leu Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val
725 730 735
Gly Gly Leu Gly Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala
740 745 750
Ala Ala Arg Leu Phe Ser Ser Leu Gly Glu Leu Ser Thr Ile Ser Ala
755 760 765
Gln Arg Ser Pro Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val Arg
770 775 780
Pro Ser Gly Arg Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro Val Lys
785 790 795 800
Pro Ala Ser Leu Glu Arg Val Glu Gly Leu Gly Ala Gly Val Gly Gly
805 810 815
Ala Gly Arg Pro Phe Gly Leu Thr Pro Pro Thr Ile Leu Lys Ser Ser
820 825 830
Ser Leu Ser Ile Pro His Glu Pro Lys Glu Val Arg Phe Val Val Arg
835 840 845
Ser Val Ser Ala Arg Ser Arg Ser Pro Ser Pro Ser Pro Leu Pro Ser
850 855 860
Pro Ser Pro Gly Ser Gly Pro Ser Ala Gly Pro Arg Arg Pro Phe Gln
865 870 875 880
Gln Lys Pro Leu Gln Leu Trp Ser Lys Phe Asp Val Gly Asp Trp Leu
885 890 895
Glu Ser Ile His Leu Gly Glu His Arg Asp Arg Phe Glu Asp His Glu
900 905 910
Ile Glu Gly Ala His Leu Pro Ala Leu Thr Lys Glu Asp Phe Val Glu
915 920 925
Leu Gly Val Thr Arg Val Gly His Arg Met Asn Ile Glu Arg Ala Leu
930 935 940
Arg Gln Leu Asp Gly Ser
945 950
<210> 12
<211> 239
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 12
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1 5 10 15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
20 25 30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
35 40 45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
50 55 60
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65 70 75 80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
85 90 95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
100 105 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
115 120 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
130 135 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145 150 155 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
165 170 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
195 200 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
210 215 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 13
<211> 587
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 13
Met Pro Lys Lys Lys Arg Lys Val Cys Arg Ser His Gln Asn Leu Pro
1 5 10 15
Ala Leu Pro Val Asp Ala Thr Ser Asp Glu Val Arg Lys Asn Leu Met
20 25 30
Asp Met Phe Arg Asp Arg Gln Ala Phe Ser Glu His Thr Trp Lys Met
35 40 45
Leu Leu Ser Val Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Asn
50 55 60
Arg Lys Trp Phe Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu
65 70 75 80
Tyr Leu Gln Ala Arg Gly Leu Ala Val Lys Thr Ile Gln Gln His Leu
85 90 95
Gly Gln Leu Asn Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Ser
100 105 110
Asp Ser Asn Ala Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn
115 120 125
Val Asp Ala Gly Glu Arg Ala Lys Gln Ala Leu Ala Phe Glu Arg Thr
130 135 140
Asp Phe Asp Gln Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln
145 150 155 160
Asp Ile Arg Asn Leu Ala Phe Leu Gly Ile Ala Tyr Asn Thr Leu Leu
165 170 175
Arg Ile Ala Glu Ile Ala Arg Ile Arg Val Lys Asp Ile Ser Arg Thr
180 185 190
Asp Gly Gly Arg Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val
195 200 205
Ser Thr Ala Gly Val Glu Lys Ala Leu Ser Leu Gly Val Thr Lys Leu
210 215 220
Val Glu Arg Trp Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn
225 230 235 240
Tyr Leu Phe Cys Arg Val Arg Lys Asn Gly Val Ala Ala Pro Ser Ala
245 250 255
Thr Ser Gln Leu Ser Thr Arg Ala Leu Glu Gly Ile Phe Glu Ala Thr
260 265 270
His Arg Leu Ile Tyr Gly Ala Lys Asp Asp Ser Gly Gln Arg Tyr Leu
275 280 285
Ala Trp Ser Gly His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala
290 295 300
Arg Ala Gly Val Ser Ile Pro Glu Ile Met Gln Ala Gly Gly Trp Thr
305 310 315 320
Asn Val Asn Ile Val Met Asn Tyr Ile Arg Asn Leu Asp Ser Glu Thr
325 330 335
Gly Ala Met Val Arg Leu Leu Glu Asp Gly Asp Val Asn Val Ser Lys
340 345 350
Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp
355 360 365
Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly
370 375 380
Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly
385 390 395 400
Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly
405 410 415
Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln His Asp Phe
420 425 430
Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe
435 440 445
Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu
450 455 460
Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys
465 470 475 480
Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser
485 490 495
His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys Val
500 505 510
Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala
515 520 525
Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu
530 535 540
Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro
545 550 555 560
Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala
565 570 575
Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
580 585
<210> 14
<211> 365
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 14
Met Pro Lys Lys Lys Arg Lys Val Cys Arg Ser His Gln Asn Leu Pro
1 5 10 15
Ala Leu Pro Val Asp Ala Thr Ser Asp Glu Val Arg Lys Asn Leu Met
20 25 30
Asp Met Phe Arg Asp Arg Gln Ala Phe Ser Glu His Thr Trp Lys Met
35 40 45
Leu Leu Ser Val Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Asn
50 55 60
Arg Lys Trp Phe Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu
65 70 75 80
Tyr Leu Gln Ala Arg Gly Leu Ala Val Lys Thr Ile Gln Gln His Leu
85 90 95
Gly Gln Leu Asn Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Ser
100 105 110
Asp Ser Asn Ala Val Ser Leu Val Met Arg Arg Ile Arg Val Asn Val
115 120 125
Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu
130 135 140
Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly
145 150 155 160
Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr
165 170 175
Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr
180 185 190
Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln His
195 200 205
Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr
210 215 220
Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys
225 230 235 240
Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp
245 250 255
Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr
260 265 270
Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile
275 280 285
Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln
290 295 300
Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val
305 310 315 320
Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys
325 330 335
Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr
340 345 350
Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
355 360 365
<210> 15
<211> 5193
<212> DNA
<213> Mus musculus
<400> 15
atggacggcc ccggggccag cgccgtggtc gtgcgcgtcg gcatcccgga cctgcaacaa 60
acgaagtgcc tgcgtctgga cccaaccgcg cccgtgtggg ccgccaagca gcgtgtgctc 120
tgcgccctca atcatagcct tcaagacgcg ctcaactacg ggctattcca gcctccctcc 180
cggggtcgcg ccggcaagtt cctggatgaa gagcggctct tacaggacta cccgcctaac 240
ctggacacgc ccctgcccta tctggagttc cgatacaagc ggagagttta tgcccagaac 300
ctcatagatg acaagcagtt tgcaaagcta cacacaaagg caaacctgaa gaagttcatg 360
gactatgtcc agctacacag cacagataag gtggcccgcc tgctggacaa ggggctggac 420
cccaatttcc atgaccctga ctcaggagag tgccctctga gccttgcggc acagttggac 480
aacgccactg acctcctgaa ggttctccgc aacggcggtg ctcatctgga cttccggacc 540
cgagatgggc tgacagccgt ccactgtgct acccgccagc ggaacgcagg ggcattgacg 600
accctgctgg acctgggggc ttcgcctgac tacaaggaca gccgcggcct gacgcccctg 660
taccatagtg ccctaggggg cggggatgcc ctctgttgcg agctgcttct ccatgatcat 720
gcacagctgg ggaccactga tgagaatggt tggcaagaga tccatcaggc ctgtcgcttt 780
ggacacgtgc agcacctgga gcaccttttg ttctatgggg ccaacatggg tgctcagaat 840
gcctcgggaa acacagccct gcacatctgt gccctctaca accaggagag ttgcgcgcgc 900
gtcctgcttt tccgtggtgc caacaaggac gtccgcaatt acaacagcca gacagccttc 960
caggtggcca ttattgcagg gaactttgag cttgccgagg taatcaagac ccacaaagac 1020
tccgatgtcg taccattcag ggaaaccccc agctatgcaa agcgacggcg tctggctggc 1080
ccgagtggcc tggcatcccc acggccctta cagcgctcag ccagtgatat caacctgaaa 1140
ggtgatcagc ccgcagcttc tccagggccc actctccgaa gcctccctca tcaactcttg 1200
ctccagaggc ttcaggagga gaaagaccgt gacagggatg gtgaactgga gaatgacatc 1260
agcggcccct cagcaggcag gggtggccac aacaagatca gccccagtgg gcccggcgga 1320
tccggccccg cgcccggccc cggcccggcg tctcccgcgc cccccgcgcc gccgccccgg 1380
ggcccgaagc ggaaacttta cagtgccgtc cccggccgca agttcatcgc tgtgaaggcg 1440
cacagcccgc agggcgaggg cgagatcccg ctgcaccgcg gcgaggccgt gaaggtgctc 1500
agcattgggg agggcggttt ctgggaggga accgtgaagg gccgaacagg ctggttccca 1560
gctgactgtg tggaagaagt gcagatgcga cagtatgaca cccggcatga aaccagagag 1620
gaccggacga agcgtctctt ccgccactac actgtgggtt cctatgacag cctcacttca 1680
cacagcgatt atgtcatcga tgataaggtg gctatcctgc agaaaaggga ccatgagggg 1740
tttggctttg ttctccgggg agccaaagca gagaccccca ttgaggagtt tacacccaca 1800
cctgccttcc ctgcactcca ataccttgag tctgtagatg tggaaggtgt ggcctggagg 1860
gctggacttc gaactgggga cttcctcatt gaggtgaacg gagtgaatgt cgtgaaggtt 1920
ggacacaagc aagtggtggg tctcatccgt cagggtggca accgcctggt catgaaggtt 1980
gtgtctgtga ccaggaaacc cgaggaggat ggtgctcggc gcagagcccc accaccccca 2040
aagagggctc ccagcaccac gctgaccctg cggtccaagt ccatgacggc tgagctcgag 2100
gaacttgctt ccattcggag aagaaaaggg gagaagttgg atgagatcct ggcagttgcc 2160
gcggagccga cactgaggcc ggacattgca gatgctgact cgagggcggc cactgtcaag 2220
cagcggccca ccagccggag gatcacccct gctgagatca gctcattgtt tgagcgccag 2280
ggcctcccag gcccagagaa gctgccgggc tctctgcgga aggggattcc acggaccaaa 2340
tctgtagggg aggatgagaa gctggcatcc ctactggaag ggcgcttccc acgcagcacg 2400
tcaatgcagg acacagtgcg tgaaggtcga ggcattccac ccccgccgca gaccgccccg 2460
ccacccccac ccgcgcccta ctacttcgac tccgggccac cccccacctt ctcaccgccg 2520
ccaccaccgg gccgggccta tgacactgtg cgctccagct tcaaaccagg cctggaggct 2580
cgtctgggtg cgggggccgc cggcctgtat gatccgagca cgcctctggg cccgctgccc 2640
taccctgagc gtcagaagcg tgcgcgctcc atgatcatac tgcaggactc tgcgccagaa 2700
gtgggtgatg tcccccggcc tgcgcctgcc gccacaccgc ctgagcgccc caagcgccgg 2760
cctcggccgt caggccctga tagtccctat gccaacctgg gcgccttcag tgccagcctc 2820
ttcgctccgt cgaaaccaca gcgccgcaag agcccgctgg tgaagcagct tcaggtggag 2880
gacgctcagg agcgcgcggc cctggccgtg ggtagcccgg gaccagtggg cggaagcttt 2940
gcacgagaac cctctccgac gcaccgcggg ccccggccag gcagccttga ctacagctct 3000
ggagaaggcc taggccttac cttcggcggc cctagccctg gcccagtcaa ggagcggcgc 3060
ctggaggagc gacgccgttc cactgtgttc ctctctgtgg gtgccatcga gggcagccct 3120
cccagcgcgg atctgccatc cctacaaccc tcccgctcca ttgatgagcg cctcctgggg 3180
acaggcgcca ccactggccg cgatttgcta ctcccctccc ctgtctctgc tctgaagcca 3240
ttggtcggtg gtcccagcct tgggccctca ggctccacct tcatccaccc tctcactggc 3300
aaacccttgg atcctagctc acccttagct cttgctctgg ctgcccggga gcgggctctg 3360
gcctcgcaaa caccttcccg gtcccccaca cctgtgcaca gccccgatgc tgaccgccct 3420
ggacccctct ttgtggatgt gcaaacccga gactctgaga gaggaccgtt ggcttcccca 3480
gccttctccc ctcggagtcc agcgtggatt ccagtgcctg ctcggagaga ggcagagaag 3540
ccccctcggg aagagcggaa gtcaccagag gacaagaagt ccatgatcct cagcgtcttg 3600
gacacgtcct tgcaacggcc agctggcctc attgttgtgc atgccaccag caatgggcag 3660
gagcccagca ggctgggggc tgaagaggag cgccccggta ctccggagct ggccccagcc 3720
cccatgcagg cagcagctgt ggcagagccc atgccaagcc cccgggccca gccccctggc 3780
agcatcccag cagatcccgg gccaggtcaa ggcagctcag aggaggagcc agagctggta 3840
ttcgctgtga acctgccacc tgctcagctg tcctccagcg atgaggagac cagagaggag 3900
ctggcccgca tagggctagt gccaccccct gaagagtttg ccaatgggat cctgctgacc 3960
accccgcccc cagggccggg ccccttgccc accacggtac ccagcccggc ctcagggaag 4020
cccagcagcg agctgccccc tgcccctgag tctgcagctg actctggagt agaggaggct 4080
gacactcgaa gctccagtga cccccacctg gagaccacaa gcaccatttc cacagtgtcc 4140
agcatgtcca ccctgagctc ggagagtggg gaactcacgg acacccacac ctcctttgcc 4200
gatggacaca cttttctact cgagaagcca ccagtgcctc ccaagcccaa gctcaagtcc 4260
ccgctgggga aggggccggt gaccttcagg gacccgctgc tgaagcaatc ctcggacagt 4320
gagctcatgg cccagcagca ccatgctgcc tctactgggt tggcttctgc tgctgggccc 4380
gcccgccctc gctacctctt ccagagaagg tccaagctgt ggggggaccc cgtggagagt 4440
cgggggctcc ctgggcctga agatgacaaa ccaactgtga tcagtgagct cagctcccgt 4500
ctgcagcagc tgaataaaga cacacgctcc ttgggggagg aaccagttgg tggcctgggc 4560
agcctgctgg accctgctaa gaagtcaccc attgcagcag ctcggctctt cagcagcctc 4620
ggtgagctga gcaccatctc agcgcagcgc agcccggggg gcccgggcgg aggggcctcc 4680
tactcggtgc ggcccagcgg ccggtacccc gtggcgagac gagccccgag cccagtgaaa 4740
cccgcatcgc tggagcgggt ggaggggctg ggggcgggcg tgggaggcgc ggggcggccc 4800
ttcggcctca cgcctcccac catcctcaag tcgtccagcc tctccatccc gcacgaaccc 4860
aaggaagtgc gcttcgtggt gcgaagtgtg agtgcgcgca gccgctcccc ctcaccatct 4920
ccgctgccct cgccttctcc cggctctggc cccagtgccg gcccgcgtcg gccatttcaa 4980
cagaagcccc tgcagctctg gagcaagttc gatgtgggcg actggctgga gagcatccac 5040
ttaggcgagc accgagaccg cttcgaggac catgagatcg aaggcgcaca cctgcctgcg 5100
ctcaccaagg aagacttcgt ggagctgggc gtcacacgcg ttggccaccg catgaacatc 5160
gagcgtgcgc tcaggcagct ggatggcagc tga 5193
<210> 16
<211> 5421
<212> DNA
<213> Homo sapiens
<400> 16
atgcagctga gccgcgccgc cgccgccgcc gccgccgccc ctgcggagcc cccggagccg 60
ctgtcccccg cgccggcccc ggccccggcc ccccccggcc ccctcccgcg cagcgcggcc 120
gacggggctc cggcgggggg gaaggggggg ccggggcgcc gcgcggagtc cccgggcgct 180
ccgttccccg gcgcgagcgg ccccggcccg ggccccggcg cggggatgga cggccccggg 240
gccagcgccg tggtcgtgcg cgtcggcatc ccggacctgc agcagacgaa gtgcctgcgc 300
ctggacccgg ccgcgcccgt gtgggccgcc aagcagcgcg tgctctgcgc cctcaaccac 360
agcctccagg acgcgctcaa ctatgggctt ttccagccgc cctcccgggg ccgcgccggc 420
aagttcctgg atgaggagcg gctcctgcag gagtacccgc ccaacctgga cacgcccctg 480
ccctacctgg agtttcgata caagcggcga gtttatgccc agaacctcat cgatgataag 540
cagtttgcaa agcttcacac aaaggcgaac ctgaagaagt tcatggacta cgtccagctg 600
catagcacgg acaaggtggc acgcctgttg gacaaggggc tggaccccaa cttccatgac 660
cctgactcag gagagtgccc cctgagcctc gcagcccagc tggacaacgc cacggacctg 720
ctaaaggtgc tgaagaatgg tggtgcccac ctggacttcc gcactcgcga tgggctcact 780
gccgtgcact gtgccacacg ccagcggaat gcggcagcac tgacgaccct gctggacctg 840
ggggcttcac ctgactacaa ggacagccgc ggcttgacac ccctctacca cagcgccctg 900
gggggtgggg atgccctctg ctgtgagctg cttctccacg accacgctca gctggggatc 960
accgacgaga atggctggca ggagatccac caggcctgcc gctttgggca cgtgcagcat 1020
ctggagcacc tgctgttcta tggggcagac atgggggccc agaacgcctc ggggaacaca 1080
gccctgcaca tctgtgccct ctacaaccag gagagctgtg ctcgtgtcct gctcttccgt 1140
ggagctaaca gggatgtccg caactacaac agccagacag ccttccaggt ggccatcatc 1200
gcagggaact ttgagcttgc agaggttatc aagacccaca aagactcgga tgttgtacca 1260
ttcagggaaa cccccagcta tgcgaagcgg cggcgactgg ctggccccag tggcttggca 1320
tcccctcggc ctctgcagcg ctcagccagc gatatcaacc tgaaggggga ggcacagcca 1380
gcagcttctc ctggaccctc gctgagaagc ctcccccacc agctgctgct ccagcggctg 1440
caagaggaga aagatcgtga ccgggatgcc gaccaggaga gcaacatcag tggcccttta 1500
gcaggcaggg ccggccaaag caagatcagc ccgagcgggc ccggcggccc cggccccgcg 1560
cccggccccg gccccgcgcc ccctgcgccc cccgcaccgc cgccccgggg cccgaagcgg 1620
aaactttaca gcgccgtccc cggccgcaag ttcatcgccg tgaaggcgca cagcccgcag 1680
ggtgaaggcg agatcccgct gcaccgcggc gaggccgtga aggtgctcag cattggggag 1740
ggcggtttct gggagggaac cgtgaaaggc cgcacgggct ggttcccggc cgactgcgtg 1800
gaggaagtgc agatgaggca gcatgacaca cggcctgaaa cgcgggagga ccggacgaag 1860
cggctctttc ggcactacac agtgggctcc tacgacagcc tcacctcaca cagcgattat 1920
gtcattgatg acaaagtggc tgtcctgcag aaacgggacc acgagggctt tggttttgtg 1980
ctccggggag ccaaagcaga gacccccatc gaggagttca cgcccacgcc agccttcccg 2040
gcgctgcagt atctcgagtc ggtggacgtg gagggtgtgg cctggagggc cgggctgcgc 2100
acgggagact tcctcatcga ggtgaacggg gtgaacgtgg tgaaggtcgg acacaagcag 2160
gtggtggctc tgattcgcca gggtggcaac cgcctcgtca tgaaggttgt gtctgtgaca 2220
aggaagccag aagaggacgg ggctcggcgc agagccccac cgccccccaa gagggccccc 2280
agcaccacac tgaccctgcg ctccaagtcc atgacagctg agctcgagga acttgcctcc 2340
attcggagaa gaaaagggga gaagctggac gagatgctgg cagccgccgc agagccaacg 2400
ctgcggccag acatcgcaga cgcagactcc agagccgcca ccgtcaaaca gaggcccacc 2460
agtcggagga tcacacccgc cgagattagc tcattgtttg aacgccaggg cctcccaggc 2520
ccagagaagc tgccgggctc cttgcggaag gggattccac ggaccaagtc tgtaggggag 2580
gacgagaagc tggcgtccct gctggaaggg cgcttcccgc ggagcacctc gatgcaagac 2640
ccggtgcgcg agggtcgcgg catcccgccc ccgccgcaga ccgcgccgcc tcccccgccc 2700
gcgccctact acttcgactc ggggccgccc ccggccttct cgccgccgcc cccgccgggc 2760
cgcgcctacg acacggtgcg ctccagcttc aagcccggcc tggaggcgcg cctgggcgcg 2820
ggcgctgccg gcctgtacga gccgggcgcg gccctcggcc cgctgccgta tcccgagcgg 2880
cagaagcgcg cgcgctccat gatcatcctg caggactcgg cgcccgagtc gggcgacgcc 2940
cctcgacccc cgcccgcggc caccccgccc gagcgaccca agcgccggcc gcggccgccc 3000
ggccccgaca gcccctacgc caacctgggc gccttcagcg ccagcctctt cgctccgtcc 3060
aagccgcagc gccgcaagag ccccctggtg aagcagctgc aggtggagga cgcgcaggag 3120
cgcgcggccc tggccgtggg cagccccggt cccggcggcg gcagcttcgc ccgcgagccc 3180
tccccgaccc accgcggtcc gcgcccgggt ggcctcgact acggcgcggg cgatggcccg 3240
gggctcgcgt tcggcggccc gggcccggcc aaggaccggc ggctggagga gcggcgccgc 3300
tccactgtgt tcctgtccgt gggggccatc gagggcagcg cccccggcgc ggatctgcca 3360
tccctacagc cctcccgctc catcgacgag cgcctcctgg ggaccggccc caccgccggc 3420
cgcgacctgc tgctgccctc cccggtgtct gccctgaagc cgttggtcag cggcccgagc 3480
ctggggccct cgggttccac cttcatccac ccactcaccg gcaaacccct ggaccccagc 3540
tcacccctgg cccttgccct ggctgcccga gagcgagctc tggcctccca ggcgccctcc 3600
cggtccccca cacccgtgca cagtcccgac gccgaccgcc ccggacccct gtttgtggat 3660
gtacaggccc gggacccaga gcgagggtcc ctggcttccc cggctttctc cccacggagc 3720
ccagcctgga ttcctgtgcc tgctcgcagg gaggcagaga aggtcccccg ggaggagcgg 3780
aagtcacccg aggacaagaa gtccatgatc ctcagcgtcc tggacacatc cctgcagcgg 3840
ccagctggcc tcatcgttgt gcacgccacc agcaacgggc aggagcccag caggctgggg 3900
ggggccgaag aggagcgccc gggcaccccg gagttggccc cggcccccat gcagtcagcg 3960
gctgtggcag agcccctgcc cagcccccgg gcccagcccc ctggtggcac cccggcagac 4020
gccgggccag gccagggcag ctcagaggaa gagccagagc tggtgtttgc tgtgaacctg 4080
ccacctgccc agctgtcgtc cagcgatgag gagaccaggg aggagctggc ccgaattggg 4140
ttggtgccac cccctgaaga gtttgccaac ggggtcctgc tggccacccc actcgctggc 4200
ccgggcccct cgcccaccac ggtgcccagc ccggcctcag ggaagcccag cagtgagcca 4260
ccccctgccc ctgagtctgc agccgactct ggggtggagg aggctgacac acgcagctcc 4320
agcgaccccc acctggagac cacaagcacc atctccacgg tgtccagcat gtccaccttg 4380
agctcggaga gcggggaact cactgacacc cacacctcct tcgctgacgg acacactttt 4440
ctactcgaga agccaccagt gcctcccaag cccaagctca agtccccgct ggggaagggg 4500
ccggtgacct tcagggaccc gctgctgaag cagtcctcgg acagcgagct catggcccag 4560
cagcaccacg ccgcctctgc cgggctggcc tctgccgccg ggcctgcccg ccctcgctac 4620
ctcttccaga gaaggtccaa gctatggggg gaccccgtgg agagccgggg gctccctggg 4680
cctgaagacg acaaaccaac tgtgatcagt gagctcagct cccgcctgca gcagctgaac 4740
aaggacacgc gttccctggg ggaggaacca gttggtggcc tgggcagcct gctggaccct 4800
gccaagaagt cgcccatcgc agcagctcgg ctcttcagca gcctcggtga gctgagctcc 4860
atttcagcgc agcgcagccc cgggggcccg ggcggcgggg cctcgtactc ggtgaggccc 4920
agtggccgct accccgtggc gagacgcgcc ccgagcccgg tgaagcccgc gtcgctggag 4980
cgggtggagg ggctgggggc gggcgcgggg ggcgcagggc ggcccttcgg cctcacgccc 5040
cccaccatcc tcaagtcgtc cagcctctcc atcccgcacg agcccaagga ggtgcgcttc 5100
gtggtgcgca gcgtgagcgc gcgcagtcgc tccccctcgc cgtcgccgct gccctcgccc 5160
gcgtccggcc ccggccccgg cgcccccggc ccacgccgac ccttccagca gaagccgctg 5220
cagctctgga gcaagttcga cgtgggcgac tggctggaga gcatccacct aggcgagcac 5280
cgcgaccgct tcgaggacca tgagatagaa ggcgcgcacc tacccgcgct taccaaggac 5340
gacttcgtgg agctgggcgt cacgcgcgtg ggccaccgca tgaacatcga gcgcgcgctc 5400
aggcagctgg acggcagctg a 5421
<210> 17
<211> 706
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 17
Met Gly Pro Lys Arg Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys Phe
1 5 10 15
Ile Ala Val Lys Ala His Ser Pro Gln Gly Glu Gly Glu Ile Pro Leu
20 25 30
His Arg Gly Glu Ala Val Lys Val Leu Ser Ile Gly Glu Gly Gly Phe
35 40 45
Trp Glu Gly Thr Val Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp Cys
50 55 60
Val Glu Glu Val Gln Met Arg Gln Tyr Asp Thr Arg His Glu Thr Arg
65 70 75 80
Glu Asp Arg Thr Lys Arg Leu Phe Arg His Tyr Thr Val Gly Ser Tyr
85 90 95
Asp Ser Leu Thr Ser His Ser Asp Tyr Val Ile Asp Asp Lys Val Ala
100 105 110
Ile Leu Gln Lys Arg Asp His Glu Gly Phe Gly Phe Val Leu Arg Gly
115 120 125
Ala Lys Ala Glu Thr Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala Phe
130 135 140
Pro Ala Leu Gln Tyr Leu Glu Ser Val Asp Val Glu Gly Val Ala Trp
145 150 155 160
Arg Ala Gly Leu Arg Thr Gly Asp Phe Leu Ile Glu Val Asn Gly Val
165 170 175
Asn Val Val Lys Val Gly His Lys Gln Val Val Gly Leu Ile Arg Gln
180 185 190
Gly Gly Asn Arg Leu Val Met Lys Val Val Ser Val Thr Arg Lys Pro
195 200 205
Glu Glu Asp Gly Ala Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg Ala
210 215 220
Pro Ser Thr Thr Leu Thr Leu Arg Ser Lys Ser Met Thr Ala Glu Leu
225 230 235 240
Glu Glu Leu Ala Ser Ile Arg Ser Ser Glu Glu Glu Pro Glu Leu Val
245 250 255
Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser Asp Glu Glu
260 265 270
Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro Pro Pro Glu Glu
275 280 285
Phe Ala Asn Gly Ile Leu Leu Thr Thr Pro Pro Pro Gly Pro Gly Pro
290 295 300
Leu Pro Thr Thr Val Pro Ser Pro Ala Ser Gly Lys Pro Ser Ser Glu
305 310 315 320
Leu Pro Pro Ala Pro Glu Ser Ala Ala Asp Ser Gly Val Glu Glu Ala
325 330 335
Asp Thr Arg Ser Ser Ser Asp Pro His Leu Glu Thr Thr Ser Thr Ile
340 345 350
Ser Thr Val Ser Ser Met Ser Thr Leu Ser Ser Glu Ser Gly Glu Leu
355 360 365
Thr Asp Thr His Thr Ser Phe Ala Asp Gly His Thr Phe Leu Leu Glu
370 375 380
Lys Pro Pro Val Pro Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly Lys
385 390 395 400
Gly Pro Val Thr Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp Ser
405 410 415
Glu Leu Met Ala Gln Gln His His Ala Ala Ser Thr Gly Leu Ala Ser
420 425 430
Ala Ala Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser Lys
435 440 445
Leu Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu Asp
450 455 460
Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln Leu
465 470 475 480
Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly Leu Gly
485 490 495
Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala Ala Arg Leu
500 505 510
Phe Ser Ser Leu Gly Glu Leu Ser Thr Ile Ser Ala Gln Arg Ser Pro
515 520 525
Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val Arg Pro Ser Gly Arg
530 535 540
Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro Val Lys Pro Ala Ser Leu
545 550 555 560
Glu Arg Val Glu Gly Leu Gly Ala Gly Val Gly Gly Ala Gly Arg Pro
565 570 575
Phe Gly Leu Thr Pro Pro Thr Ile Leu Lys Ser Ser Ser Leu Ser Ile
580 585 590
Pro His Glu Pro Lys Glu Val Arg Phe Val Val Arg Ser Val Ser Ala
595 600 605
Arg Ser Arg Ser Pro Ser Pro Ser Pro Leu Pro Ser Pro Ser Pro Gly
610 615 620
Ser Gly Pro Ser Ala Gly Pro Arg Arg Pro Phe Gln Gln Lys Pro Leu
625 630 635 640
Gln Leu Trp Ser Lys Phe Asp Val Gly Asp Trp Leu Glu Ser Ile His
645 650 655
Leu Gly Glu His Arg Asp Arg Phe Glu Asp His Glu Ile Glu Gly Ala
660 665 670
His Leu Pro Ala Leu Thr Lys Glu Asp Phe Val Glu Leu Gly Val Thr
675 680 685
Arg Val Gly His Arg Met Asn Ile Glu Arg Ala Leu Arg Gln Leu Asp
690 695 700
Gly Ser
705
<210> 18
<211> 707
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 18
Met Gly Pro Lys Arg Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys Phe
1 5 10 15
Ile Ala Val Lys Ala His Ser Pro Gln Gly Glu Gly Glu Ile Pro Leu
20 25 30
His Arg Gly Glu Ala Val Lys Val Leu Ser Ile Gly Glu Gly Gly Phe
35 40 45
Trp Glu Gly Thr Val Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp Cys
50 55 60
Val Glu Glu Val Gln Met Arg Gln His Asp Thr Arg Pro Glu Thr Arg
65 70 75 80
Glu Asp Arg Thr Lys Arg Leu Phe Arg His Tyr Thr Val Gly Ser Tyr
85 90 95
Asp Ser Leu Thr Ser His Ser Asp Tyr Val Ile Asp Asp Lys Val Ala
100 105 110
Val Leu Gln Lys Arg Asp His Glu Gly Phe Gly Phe Val Leu Arg Gly
115 120 125
Ala Lys Ala Glu Thr Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala Phe
130 135 140
Pro Ala Leu Gln Tyr Leu Glu Ser Val Asp Val Glu Gly Val Ala Trp
145 150 155 160
Arg Ala Gly Leu Arg Thr Gly Asp Phe Leu Ile Glu Val Asn Gly Val
165 170 175
Asn Val Val Lys Val Gly His Lys Gln Val Val Ala Leu Ile Arg Gln
180 185 190
Gly Gly Asn Arg Leu Val Met Lys Val Val Ser Val Thr Arg Lys Pro
195 200 205
Glu Glu Asp Gly Ala Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg Ala
210 215 220
Pro Ser Thr Thr Leu Thr Leu Arg Ser Lys Ser Met Thr Ala Glu Leu
225 230 235 240
Glu Glu Leu Ala Ser Ile Arg Ser Ser Glu Glu Glu Pro Glu Leu Val
245 250 255
Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser Asp Glu Glu
260 265 270
Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro Pro Pro Glu Glu
275 280 285
Phe Ala Asn Gly Val Leu Leu Ala Thr Pro Leu Ala Gly Pro Gly Pro
290 295 300
Ser Pro Thr Thr Val Pro Ser Pro Ala Ser Gly Lys Pro Ser Ser Glu
305 310 315 320
Pro Pro Pro Ala Pro Glu Ser Ala Ala Asp Ser Gly Val Glu Glu Ala
325 330 335
Asp Thr Arg Ser Ser Ser Asp Pro His Leu Glu Thr Thr Ser Thr Ile
340 345 350
Ser Thr Val Ser Ser Met Ser Thr Leu Ser Ser Glu Ser Gly Glu Leu
355 360 365
Thr Asp Thr His Thr Ser Phe Ala Asp Gly His Thr Phe Leu Leu Glu
370 375 380
Lys Pro Pro Val Pro Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly Lys
385 390 395 400
Gly Pro Val Thr Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp Ser
405 410 415
Glu Leu Met Ala Gln Gln His His Ala Ala Ser Ala Gly Leu Ala Ser
420 425 430
Ala Ala Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser Lys
435 440 445
Leu Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu Asp
450 455 460
Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln Leu
465 470 475 480
Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly Leu Gly
485 490 495
Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala Ala Arg Leu
500 505 510
Phe Ser Ser Leu Gly Glu Leu Ser Ser Ile Ser Ala Gln Arg Ser Pro
515 520 525
Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val Arg Pro Ser Gly Arg
530 535 540
Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro Val Lys Pro Ala Ser Leu
545 550 555 560
Glu Arg Val Glu Gly Leu Gly Ala Gly Ala Gly Gly Ala Gly Arg Pro
565 570 575
Phe Gly Leu Thr Pro Pro Thr Ile Leu Lys Ser Ser Ser Leu Ser Ile
580 585 590
Pro His Glu Pro Lys Glu Val Arg Phe Val Val Arg Ser Val Ser Ala
595 600 605
Arg Ser Arg Ser Pro Ser Pro Ser Pro Leu Pro Ser Pro Ala Ser Gly
610 615 620
Pro Gly Pro Gly Ala Pro Gly Pro Arg Arg Pro Phe Gln Gln Lys Pro
625 630 635 640
Leu Gln Leu Trp Ser Lys Phe Asp Val Gly Asp Trp Leu Glu Ser Ile
645 650 655
His Leu Gly Glu His Arg Asp Arg Phe Glu Asp His Glu Ile Glu Gly
660 665 670
Ala His Leu Pro Ala Leu Thr Lys Asp Asp Phe Val Glu Leu Gly Val
675 680 685
Thr Arg Val Gly His Arg Met Asn Ile Glu Arg Ala Leu Arg Gln Leu
690 695 700
Asp Gly Ser
705
<210> 19
<211> 1091
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 19
Met Asp Gly Pro Gly Ala Ser Ala Val Val Val Arg Val Gly Ile Pro
1 5 10 15
Asp Leu Gln Gln Thr Lys Cys Leu Arg Leu Asp Pro Thr Ala Pro Val
20 25 30
Trp Ala Ala Lys Gln Arg Val Leu Cys Ala Leu Asn His Ser Leu Gln
35 40 45
Asp Ala Leu Asn Tyr Gly Leu Phe Gln Pro Pro Ser Arg Gly Arg Ala
50 55 60
Gly Lys Phe Leu Asp Glu Glu Arg Leu Leu Gln Asp Tyr Pro Pro Asn
65 70 75 80
Leu Asp Thr Pro Leu Pro Tyr Leu Glu Phe Arg Tyr Lys Arg Arg Val
85 90 95
Tyr Ala Gln Asn Leu Ile Asp Asp Lys Gln Phe Ala Lys Leu His Thr
100 105 110
Lys Ala Asn Leu Lys Lys Phe Met Asp Tyr Val Gln Leu His Ser Thr
115 120 125
Asp Lys Val Ala Arg Leu Leu Asp Lys Gly Leu Asp Pro Asn Phe His
130 135 140
Asp Pro Asp Ser Gly Glu Cys Pro Leu Ser Leu Ala Ala Gln Leu Asp
145 150 155 160
Asn Ala Thr Asp Leu Leu Lys Val Leu Arg Asn Gly Gly Ala His Leu
165 170 175
Asp Phe Arg Thr Arg Asp Gly Leu Thr Ala Val His Cys Ala Thr Arg
180 185 190
Gln Arg Asn Ala Gly Ala Leu Thr Thr Leu Leu Asp Leu Gly Ala Ser
195 200 205
Pro Asp Tyr Lys Asp Ser Arg Gly Leu Thr Pro Leu Tyr His Ser Ala
210 215 220
Leu Gly Gly Gly Asp Ala Leu Cys Cys Glu Leu Leu Leu His Asp His
225 230 235 240
Ala Gln Leu Gly Thr Thr Asp Glu Asn Gly Trp Gln Glu Ile His Gln
245 250 255
Ala Cys Arg Phe Gly His Val Gln His Leu Glu His Leu Leu Phe Tyr
260 265 270
Gly Ala Asn Met Gly Ala Gln Asn Ala Ser Gly Asn Thr Ala Leu His
275 280 285
Ile Cys Ala Leu Tyr Asn Gln Glu Ser Cys Ala Arg Val Leu Leu Phe
290 295 300
Arg Gly Ala Asn Lys Asp Val Arg Asn Tyr Asn Ser Gln Thr Ala Phe
305 310 315 320
Gln Val Ala Ile Ile Ala Gly Asn Phe Glu Leu Ala Glu Val Ile Lys
325 330 335
Thr His Lys Asp Ser Asp Val Val Pro Phe Arg Glu Thr Pro Ser Tyr
340 345 350
Ala Lys Arg Arg Arg Leu Ala Gly Pro Ser Gly Leu Ala Ser Pro Arg
355 360 365
Pro Leu Gln Arg Ser Ala Ser Asp Ile Asn Leu Lys Gly Ala Pro Pro
370 375 380
Pro Arg Gly Pro Lys Arg Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys
385 390 395 400
Phe Ile Ala Val Lys Ala His Ser Pro Gln Gly Glu Gly Glu Ile Pro
405 410 415
Leu His Arg Gly Glu Ala Val Lys Val Leu Ser Ile Gly Glu Gly Gly
420 425 430
Phe Trp Glu Gly Thr Val Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp
435 440 445
Cys Val Glu Glu Val Gln Met Arg Gln Tyr Asp Thr Arg His Glu Thr
450 455 460
Arg Glu Asp Arg Thr Lys Arg Leu Phe Arg His Tyr Thr Val Gly Ser
465 470 475 480
Tyr Asp Ser Leu Thr Ser His Ser Asp Tyr Val Ile Asp Asp Lys Val
485 490 495
Ala Ile Leu Gln Lys Arg Asp His Glu Gly Phe Gly Phe Val Leu Arg
500 505 510
Gly Ala Lys Ala Glu Thr Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala
515 520 525
Phe Pro Ala Leu Gln Tyr Leu Glu Ser Val Asp Val Glu Gly Val Ala
530 535 540
Trp Arg Ala Gly Leu Arg Thr Gly Asp Phe Leu Ile Glu Val Asn Gly
545 550 555 560
Val Asn Val Val Lys Val Gly His Lys Gln Val Val Gly Leu Ile Arg
565 570 575
Gln Gly Gly Asn Arg Leu Val Met Lys Val Val Ser Val Thr Arg Lys
580 585 590
Pro Glu Glu Asp Gly Ala Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg
595 600 605
Ala Pro Ser Thr Thr Leu Thr Leu Arg Ser Lys Ser Met Thr Ala Glu
610 615 620
Leu Glu Glu Leu Ala Ser Ile Arg Ser Ser Glu Glu Glu Pro Glu Leu
625 630 635 640
Val Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser Asp Glu
645 650 655
Glu Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro Pro Pro Glu
660 665 670
Glu Phe Ala Asn Gly Ile Leu Leu Thr Thr Pro Pro Pro Gly Pro Gly
675 680 685
Pro Leu Pro Thr Thr Val Pro Ser Pro Ala Ser Gly Lys Pro Ser Ser
690 695 700
Glu Leu Pro Pro Ala Pro Glu Ser Ala Ala Asp Ser Gly Val Glu Glu
705 710 715 720
Ala Asp Thr Arg Ser Ser Ser Asp Pro His Leu Glu Thr Thr Ser Thr
725 730 735
Ile Ser Thr Val Ser Ser Met Ser Thr Leu Ser Ser Glu Ser Gly Glu
740 745 750
Leu Thr Asp Thr His Thr Ser Phe Ala Asp Gly His Thr Phe Leu Leu
755 760 765
Glu Lys Pro Pro Val Pro Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly
770 775 780
Lys Gly Pro Val Thr Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp
785 790 795 800
Ser Glu Leu Met Ala Gln Gln His His Ala Ala Ser Thr Gly Leu Ala
805 810 815
Ser Ala Ala Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser
820 825 830
Lys Leu Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu
835 840 845
Asp Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln
850 855 860
Leu Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly Leu
865 870 875 880
Gly Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala Ala Arg
885 890 895
Leu Phe Ser Ser Leu Gly Glu Leu Ser Thr Ile Ser Ala Gln Arg Ser
900 905 910
Pro Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val Arg Pro Ser Gly
915 920 925
Arg Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro Val Lys Pro Ala Ser
930 935 940
Leu Glu Arg Val Glu Gly Leu Gly Ala Gly Val Gly Gly Ala Gly Arg
945 950 955 960
Pro Phe Gly Leu Thr Pro Pro Thr Ile Leu Lys Ser Ser Ser Leu Ser
965 970 975
Ile Pro His Glu Pro Lys Glu Val Arg Phe Val Val Arg Ser Val Ser
980 985 990
Ala Arg Ser Arg Ser Pro Ser Pro Ser Pro Leu Pro Ser Pro Ser Pro
995 1000 1005
Gly Ser Gly Pro Ser Ala Gly Pro Arg Arg Pro Phe Gln Gln Lys
1010 1015 1020
Pro Leu Gln Leu Trp Ser Lys Phe Asp Val Gly Asp Trp Leu Glu
1025 1030 1035
Ser Ile His Leu Gly Glu His Arg Asp Arg Phe Glu Asp His Glu
1040 1045 1050
Ile Glu Gly Ala His Leu Pro Ala Leu Thr Lys Glu Asp Phe Val
1055 1060 1065
Glu Leu Gly Val Thr Arg Val Gly His Arg Met Asn Ile Glu Arg
1070 1075 1080
Ala Leu Arg Gln Leu Asp Gly Ser
1085 1090
<210> 20
<211> 1092
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 20
Met Asp Gly Pro Gly Ala Ser Ala Val Val Val Arg Val Gly Ile Pro
1 5 10 15
Asp Leu Gln Gln Thr Lys Cys Leu Arg Leu Asp Pro Ala Ala Pro Val
20 25 30
Trp Ala Ala Lys Gln Arg Val Leu Cys Ala Leu Asn His Ser Leu Gln
35 40 45
Asp Ala Leu Asn Tyr Gly Leu Phe Gln Pro Pro Ser Arg Gly Arg Ala
50 55 60
Gly Lys Phe Leu Asp Glu Glu Arg Leu Leu Gln Glu Tyr Pro Pro Asn
65 70 75 80
Leu Asp Thr Pro Leu Pro Tyr Leu Glu Phe Arg Tyr Lys Arg Arg Val
85 90 95
Tyr Ala Gln Asn Leu Ile Asp Asp Lys Gln Phe Ala Lys Leu His Thr
100 105 110
Lys Ala Asn Leu Lys Lys Phe Met Asp Tyr Val Gln Leu His Ser Thr
115 120 125
Asp Lys Val Ala Arg Leu Leu Asp Lys Gly Leu Asp Pro Asn Phe His
130 135 140
Asp Pro Asp Ser Gly Glu Cys Pro Leu Ser Leu Ala Ala Gln Leu Asp
145 150 155 160
Asn Ala Thr Asp Leu Leu Lys Val Leu Lys Asn Gly Gly Ala His Leu
165 170 175
Asp Phe Arg Thr Arg Asp Gly Leu Thr Ala Val His Cys Ala Thr Arg
180 185 190
Gln Arg Asn Ala Ala Ala Leu Thr Thr Leu Leu Asp Leu Gly Ala Ser
195 200 205
Pro Asp Tyr Lys Asp Ser Arg Gly Leu Thr Pro Leu Tyr His Ser Ala
210 215 220
Leu Gly Gly Gly Asp Ala Leu Cys Cys Glu Leu Leu Leu His Asp His
225 230 235 240
Ala Gln Leu Gly Ile Thr Asp Glu Asn Gly Trp Gln Glu Ile His Gln
245 250 255
Ala Cys Arg Phe Gly His Val Gln His Leu Glu His Leu Leu Phe Tyr
260 265 270
Gly Ala Asp Met Gly Ala Gln Asn Ala Ser Gly Asn Thr Ala Leu His
275 280 285
Ile Cys Ala Leu Tyr Asn Gln Glu Ser Cys Ala Arg Val Leu Leu Phe
290 295 300
Arg Gly Ala Asn Arg Asp Val Arg Asn Tyr Asn Ser Gln Thr Ala Phe
305 310 315 320
Gln Val Ala Ile Ile Ala Gly Asn Phe Glu Leu Ala Glu Val Ile Lys
325 330 335
Thr His Lys Asp Ser Asp Val Val Pro Phe Arg Glu Thr Pro Ser Tyr
340 345 350
Ala Lys Arg Arg Arg Leu Ala Gly Pro Ser Gly Leu Ala Ser Pro Arg
355 360 365
Pro Leu Gln Arg Ser Ala Ser Asp Ile Asn Leu Lys Gly Ala Pro Pro
370 375 380
Pro Arg Gly Pro Lys Arg Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys
385 390 395 400
Phe Ile Ala Val Lys Ala His Ser Pro Gln Gly Glu Gly Glu Ile Pro
405 410 415
Leu His Arg Gly Glu Ala Val Lys Val Leu Ser Ile Gly Glu Gly Gly
420 425 430
Phe Trp Glu Gly Thr Val Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp
435 440 445
Cys Val Glu Glu Val Gln Met Arg Gln His Asp Thr Arg Pro Glu Thr
450 455 460
Arg Glu Asp Arg Thr Lys Arg Leu Phe Arg His Tyr Thr Val Gly Ser
465 470 475 480
Tyr Asp Ser Leu Thr Ser His Ser Asp Tyr Val Ile Asp Asp Lys Val
485 490 495
Ala Val Leu Gln Lys Arg Asp His Glu Gly Phe Gly Phe Val Leu Arg
500 505 510
Gly Ala Lys Ala Glu Thr Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala
515 520 525
Phe Pro Ala Leu Gln Tyr Leu Glu Ser Val Asp Val Glu Gly Val Ala
530 535 540
Trp Arg Ala Gly Leu Arg Thr Gly Asp Phe Leu Ile Glu Val Asn Gly
545 550 555 560
Val Asn Val Val Lys Val Gly His Lys Gln Val Val Ala Leu Ile Arg
565 570 575
Gln Gly Gly Asn Arg Leu Val Met Lys Val Val Ser Val Thr Arg Lys
580 585 590
Pro Glu Glu Asp Gly Ala Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg
595 600 605
Ala Pro Ser Thr Thr Leu Thr Leu Arg Ser Lys Ser Met Thr Ala Glu
610 615 620
Leu Glu Glu Leu Ala Ser Ile Arg Ser Ser Glu Glu Glu Pro Glu Leu
625 630 635 640
Val Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser Asp Glu
645 650 655
Glu Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro Pro Pro Glu
660 665 670
Glu Phe Ala Asn Gly Val Leu Leu Ala Thr Pro Leu Ala Gly Pro Gly
675 680 685
Pro Ser Pro Thr Thr Val Pro Ser Pro Ala Ser Gly Lys Pro Ser Ser
690 695 700
Glu Pro Pro Pro Ala Pro Glu Ser Ala Ala Asp Ser Gly Val Glu Glu
705 710 715 720
Ala Asp Thr Arg Ser Ser Ser Asp Pro His Leu Glu Thr Thr Ser Thr
725 730 735
Ile Ser Thr Val Ser Ser Met Ser Thr Leu Ser Ser Glu Ser Gly Glu
740 745 750
Leu Thr Asp Thr His Thr Ser Phe Ala Asp Gly His Thr Phe Leu Leu
755 760 765
Glu Lys Pro Pro Val Pro Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly
770 775 780
Lys Gly Pro Val Thr Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp
785 790 795 800
Ser Glu Leu Met Ala Gln Gln His His Ala Ala Ser Ala Gly Leu Ala
805 810 815
Ser Ala Ala Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser
820 825 830
Lys Leu Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu
835 840 845
Asp Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln
850 855 860
Leu Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly Leu
865 870 875 880
Gly Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala Ala Arg
885 890 895
Leu Phe Ser Ser Leu Gly Glu Leu Ser Ser Ile Ser Ala Gln Arg Ser
900 905 910
Pro Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val Arg Pro Ser Gly
915 920 925
Arg Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro Val Lys Pro Ala Ser
930 935 940
Leu Glu Arg Val Glu Gly Leu Gly Ala Gly Ala Gly Gly Ala Gly Arg
945 950 955 960
Pro Phe Gly Leu Thr Pro Pro Thr Ile Leu Lys Ser Ser Ser Leu Ser
965 970 975
Ile Pro His Glu Pro Lys Glu Val Arg Phe Val Val Arg Ser Val Ser
980 985 990
Ala Arg Ser Arg Ser Pro Ser Pro Ser Pro Leu Pro Ser Pro Ala Ser
995 1000 1005
Gly Pro Gly Pro Gly Ala Pro Gly Pro Arg Arg Pro Phe Gln Gln
1010 1015 1020
Lys Pro Leu Gln Leu Trp Ser Lys Phe Asp Val Gly Asp Trp Leu
1025 1030 1035
Glu Ser Ile His Leu Gly Glu His Arg Asp Arg Phe Glu Asp His
1040 1045 1050
Glu Ile Glu Gly Ala His Leu Pro Ala Leu Thr Lys Asp Asp Phe
1055 1060 1065
Val Glu Leu Gly Val Thr Arg Val Gly His Arg Met Asn Ile Glu
1070 1075 1080
Arg Ala Leu Arg Gln Leu Asp Gly Ser
1085 1090
<210> 21
<211> 6701
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 21
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtttaat taagtgtcta gactgcagag 180
ggccctgcgt atgagtgcaa gtgggtttta ggaccaggat gaggcggggt gggggtgcct 240
acctgacgac cgaccccgac ccactggaca agcacccaac ccccattccc caaattgcgc 300
atcccctatc agagaggggg aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag 360
cttcagcacc gcggacagtg ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca 420
gcactgaagg cgcgctgacg tcactcgccg gtcccccgca aactcccctt cccggccacc 480
ttggtcgcgt ccgcgccgcc gccggcccag ccggaccgca ccacgcgagg cgcgagatag 540
gggggcacgg gcgcgaccat ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg 600
cggtgggcag cggaggagtc gtgtcgtgcc tgagagcgca gtcgagaaac cggctagagg 660
atccttcgaa accggtgcta gcatgggccc gaagcggaaa ctttacagcg ccgtccccgg 720
ccgcaagttc atcgccgtga aggcgcacag cccgcagggt gaaggcgaga tcccgctgca 780
ccgcggcgag gccgtgaagg tgctcagcat tggggagggc ggtttctggg agggaaccgt 840
gaaaggccgc acgggctggt tcccggccga ctgcgtggag gaagtgcaga tgaggcagca 900
tgacacacgg cctgaaacgc gggaggaccg gacgaagcgg ctctttcggc actacacagt 960
gggctcctac gacagcctca cctcacacag cgattatgtc attgatgaca aagtggctgt 1020
cctgcagaaa cgggaccacg agggctttgg ttttgtgctc cggggagcca aagcagagac 1080
ccccatcgag gagttcacgc ccacgccagc cttcccggcg ctgcagtatc tcgagtcggt 1140
ggacgtggag ggtgtggcct ggagggccgg gctgcgcacg ggagacttcc tcatcgaggt 1200
gaacggggtg aacgtggtga aggtcggaca caagcaggtg gtggctctga ttcgccaggg 1260
tggcaaccgc ctcgtcatga aggttgtgtc tgtgacaagg aagccagaag aggacggggc 1320
tcggcgcaga gccccaccgc cccccaagag ggcccccagc accacactga ccctgcgctc 1380
caagtccatg acagctgagc tcgaggaact tgcctccatt cggagctcag aggaagagcc 1440
agagctggtg tttgctgtga acctgccacc tgcccagctg tcgtccagcg atgaggagac 1500
cagggaggag ctggcccgaa ttgggttggt gccaccccct gaagagtttg ccaacggggt 1560
cctgctggcc accccactcg ctggcccggg cccctcgccc accacggtgc ccagcccggc 1620
ctcagggaag cccagcagtg agccaccccc tgcccctgag tctgcagccg actctggggt 1680
ggaggaggct gacacacgca gctccagcga cccccacctg gagaccacaa gcaccatctc 1740
cacggtgtcc agcatgtcca ccttgagctc ggagagcggg gaactcactg acacccacac 1800
ctccttcgct gacggacaca cttttctact cgagaagcca ccagtgcctc ccaagcccaa 1860
gctcaagtcc ccgctgggga aggggccggt gaccttcagg gacccgctgc tgaagcagtc 1920
ctcggacagc gagctcatgg cccagcagca ccacgccgcc tctgccgggc tggcctctgc 1980
cgccgggcct gcccgccctc gctacctctt ccagagaagg tccaagctat ggggggaccc 2040
cgtggagagc cgggggctcc ctgggcctga agacgacaaa ccaactgtga tcagtgagct 2100
cagctcccgc ctgcagcagc tgaacaagga cacgcgttcc ctgggggagg aaccagttgg 2160
tggcctgggc agcctgctgg accctgccaa gaagtcgccc atcgcagcag ctcggctctt 2220
cagcagcctc ggtgagctga gctccatttc agcgcagcgc agccccgggg gcccgggcgg 2280
cggggcctcg tactcggtga ggcccagtgg ccgctacccc gtggcgagac gcgccccgag 2340
cccggtgaag cccgcgtcgc tggagcgggt ggaggggctg ggggcgggcg cggggggcgc 2400
agggcggccc ttcggcctca cgccccccac catcctcaag tcgtccagcc tctccatccc 2460
gcacgagccc aaggaggtgc gcttcgtggt gcgcagcgtg agcgcgcgca gtcgctcccc 2520
ctcgccgtcg ccgctgccct cgcccgcgtc cggccccggc cccggcgccc ccggcccacg 2580
ccgacccttc cagcagaagc cgctgcagct ctggagcaag ttcgacgtgg gcgactggct 2640
ggagagcatc cacctaggcg agcaccgcga ccgcttcgag gaccatgaga tagaaggcgc 2700
gcacctaccc gcgcttacca aggacgactt cgtggagctg ggcgtcacgc gcgtgggcca 2760
ccgcatgaac atcgagcgcg cgctcaggca gctggacggc agctgacggc gcgccaagct 2820
tatcgataat caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta 2880
tgttgctcct tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc 2940
ttcccgtatg gctttcattt tctcctcctt gtataaatcc tggttgctgt ctctttatga 3000
ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac 3060
ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt tcgctttccc 3120
cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc 3180
tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt cctttccttg 3240
gctgctcgcc tatgttgcca cctggattct gcgcgggacg tccttctgct acgtcccttc 3300
ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc ggcctcttcc 3360
gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct ccccgcatcg 3420
ataccgagcg ctgctcgaga gatctacggg tggcatccct gtgacccctc cccagtgcct 3480
ctcctggccc tggaagttgc cactccagtg cccaccagcc ttgtcctaat aaaattaagt 3540
tgcatcattt tgtctgacta ggtgtccttc tataatatta tggggtggag gggggtggta 3600
tggagcaagg ggcaagttgg gaagacaacc tgtagggcct gcggggtcta ttgggaacca 3660
agctggagtg cagtggcaca atcttggctc actgcaatct ccgcctcctg ggttcaagcg 3720
attctcctgc ctcagcctcc cgagttgttg ggattccagg catgcatgac caggctcagc 3780
taatttttgt ttttttggta gagacggggt ttcaccatat tggccaggct ggtctccaac 3840
tcctaatctc aggtgatcta cccaccttgg cctcccaaat tgctgggatt acaggcgtga 3900
accactgctc ccttccctgt ccttctgatt ttgtaggtaa ccacgtgcgg accgagcggc 3960
cgcaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg 4020
aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg 4080
agcgagcgcg cagctgcctg caggggcgcc tgatgcggta ttttctcctt acgcatctgt 4140
gcggtatttc acaccgcata cgtcaaagca accatagtac gcgccctgta gcggcgcatt 4200
aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 4260
gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 4320
agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 4380
caaaaaactt gatttgggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 4440
tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 4500
aacactcaac cctatctcgg gctattcttt tgatttataa gggattttgc cgatttcggc 4560
ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 4620
aacgtttaca attttatggt gcactctcag tacaatctgc tctgatgccg catagttaag 4680
ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc tgctcccggc 4740
atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc 4800
gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata cgcctatttt tataggttaa 4860
tgtcatgata ataatggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgg 4920
aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata 4980
accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg 5040
tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac 5100
gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact 5160
ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat 5220
gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga 5280
gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac 5340
agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat 5400
gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac 5460
cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct 5520
gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac 5580
gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac aattaataga 5640
ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg 5700
gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact 5760
ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac 5820
tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta 5880
actgtcagac caagtttact catatatact ttagattgat ttaaaacttc atttttaatt 5940
taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga 6000
gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc 6060
tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt 6120
ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc 6180
gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc 6240
tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg 6300
cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg 6360
gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga 6420
actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc 6480
ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg 6540
gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg 6600
atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt 6660
tttacggttc ctggcctttt gctggccttt tgctcacatg t 6701
<210> 22
<211> 495
<212> DNA
<213> Homo sapiens
<400> 22
gtgtctagac tgcagagggc cctgcgtatg agtgcaagtg ggttttagga ccaggatgag 60
gcggggtggg ggtgcctacc tgacgaccga ccccgaccca ctggacaagc acccaacccc 120
cattccccaa attgcgcatc ccctatcaga gagggggagg ggaaacagga tgcggcgagg 180
cgcgtgcgca ctgccagctt cagcaccgcg gacagtgcct tcgcccccgc ctggcggcgc 240
gcgccaccgc cgcctcagca ctgaaggcgc gctgacgtca ctcgccggtc ccccgcaaac 300
tccccttccc ggccaccttg gtcgcgtccg cgccgccgcc ggcccagccg gaccgcacca 360
cgcgaggcgc gagatagggg ggcacgggcg cgaccatctg cgctgcggcg ccggcgactc 420
agcgctgcct cagtctgcgg tgggcagcgg aggagtcgtg tcgtgcctga gagcgcagtc 480
gagaaaccgg ctaga 495
Claims (79)
- Shank3 단백질을 코딩하는 비자연 발생 폴리뉴클레오타이드로서,
Shank3 단백질은 SH3 도메인, PDZ 도메인, 호머(Homer) 결합 도메인, 코르탁틴(Cortactin) 결합 도메인, 및 SAM 도메인을 포함하고;
SH3 도메인은 서열번호: 6의 잔기 474-525에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 473-524에 대해 적어도 90% 동일성을 포함하고/거나;
PDZ 도메인은 서열번호: 6의 잔기 573-662에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 572-661에 대해 적어도 90% 동일성을 포함하고/거나;
호머 결합 도메인은 서열번호: 5 또는 6의 잔기 1294-1323에 대해 적어도 90% 동일성을 포함하고/거나;
코르탁틴 결합 도메인은 서열번호: 5 또는 6의 잔기 1400-1426에 대해 적어도 90% 동일성을 포함하고/거나;
SAM 도메인은 서열번호: 6의 잔기 1664-1729에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 1663-1728에 대해 적어도 90% 동일성을 포함하며;
폴리뉴클레오타이드는 4.7 kb 미만인 폴리뉴클레오타이드. - 제1항에 있어서, 폴리뉴클레오타이드는 프롤린-풍부 영역을 추가로 포함하는 것인 폴리뉴클레오타이드.
- 제1항 또는 제2항에 있어서, SH3 도메인은 서열번호: 6의 잔기 474-525 또는 서열번호: 5의 잔기 473-524를 포함하고/거나, PDZ 도메인은 서열번호: 6의 잔기 573-662 또는 서열번호: 5의 잔기 572-661을 포함하고/거나, 호머 결합 도메인은 서열번호: 5 또는 6의 잔기 1294-1323을 포함하고/거나, 코르탁틴 결합 도메인은 서열번호: 5 또는 6의 잔기 1400-1426을 포함하고/거나 SAM 도메인은 서열번호: 6의 잔기 1664-1729 또는 서열번호: 5의 잔기 1663-1728을 포함하는 것인 폴리뉴클레오타이드.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 서열번호: 1 또는 2에 대해 적어도 90% 동일성을 포함하는 것인 폴리뉴클레오타이드.
- 제4항에 있어서, 폴리뉴클레오타이드는 서열번호: 1 또는 2를 포함하는 것인 폴리뉴클레오타이드.
- 제1항에 있어서, 폴리뉴클레오타이드에 의해 코딩된 Shank3 단백질은 안키린 반복 도메인을 추가로 포함하는 것인 폴리뉴클레오타이드.
- 제6항에 있어서, 안키린 반복 도메인은 서열번호: 6의 잔기 148-345에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 147-313에 대해 적어도 90% 동일성을 포함하는 것인 폴리뉴클레오타이드.
- 제7항에 있어서, 안키린 반복 도메인은 서열번호: 6의 잔기 148-345 또는 서열번호: 5의 잔기 147-313을 포함하는 것인 폴리뉴클레오타이드.
- 제6항 내지 제8항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 서열번호: 3 또는 4에 대해 적어도 90% 동일성을 포함하는 것인 폴리뉴클레오타이드.
- 제9항에 있어서, 폴리뉴클레오타이드는 서열번호: 3 또는 4를 포함하는 것인 폴리뉴클레오타이드.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 약 4.6 kb, 4.5 kb, 4.4 kb, 4.3 kb, 4.2 kb, 4.1 kb, 4.0 kb, 3.9 kb, 3.8 kb, 3.7 kb, 3.6 kb, 3.5 kb, 3.4 kb, 3.3 kb, 3.2 kb, 3.1 kb, 3.0 kb, 2.9 kb, 2.8 kb, 2.7 kb, 2.6 kb, 2.5 kb, 2.4 kb, 2.3 kb, 2.2 kb, 또는 2.1 kb 미만인 폴리뉴클레오타이드.
- 제1항 내지 제11항 중 어느 한 항에 있어서, Shank3 단백질은 서열번호: 5 또는 6의 전장에 걸쳐 서열번호: 5 또는 6에 대해 65% 미만 동일한 것인 폴리뉴클레오타이드.
- 제1항 내지 제12항 중 어느 한 항에 있어서, Shank3 단백질은 서열번호: 17-20 중 어느 하나에 대해 적어도 90% 동일한 아미노산 서열을 포함하는 것인 폴리뉴클레오타이드.
- 제13항에 있어서, Shank3 단백질은 서열번호: 17-20 중 어느 하나의 아미노산 서열을 포함하는 것인 폴리뉴클레오타이드.
- 제1항 내지 제14항 중 어느 한 항의 폴리펩타이드에 의해 코딩되는 Shank3 단백질.
- 제1항 내지 제14항 중 어느 한 항의 폴리뉴클레오타이드를 포함하는 벡터.
- 제16항에 있어서, 벡터는 바이러스 벡터인 벡터.
- 제17항에 있어서, 벡터는 AAV 벡터인 벡터.
- 제18항에 있어서, 벡터는 제1항 내지 제14항 중 어느 한 항의 폴리뉴클레오타이드에 작동가능하게 연결된 프로모터를 포함하는 것인 AAV 벡터.
- 제19항에 있어서, 폴리뉴클레오타이드는 AAV 역위 말단 반복(ITR)에 의해 측접된 것인 AAV 벡터.
- 제18항 내지 제20항 중 어느 한 항에 있어서, AAV 벡터는 서열번호: 7 또는 21에 대해 적어도 90% 동일한 서열을 포함하는 것인 AAV 벡터.
- 제21항에 있어서, AAV 벡터는 서열번호: 7 또는 21의 서열을 포함하는 것인 AAV 벡터.
- 제19항 내지 제21항 중 어느 한 항의 AAV 벡터 및 캡시드 단백질을 포함하는 AAV 입자로서, 캡시드는 AAV1, 2, 5, 6, 8, 9, rh10, 및 PHP.eB로부터 선택되는 혈청형의 것인 AAV 입자.
- 제23항에 있어서, 혈청형은 AAV9인 AAV 입자.
- 제23항에 있어서, 혈청형은 AAV10인 AAV 입자.
- 제23항에 있어서, 혈청형은 AAV9-PHP.eB 혈청형인 AAV 입자.
- 제19항에 있어서, 프로모터는 인간 프로모터인 AAV 벡터.
- 제27항에 있어서, 프로모터는 hSyn1인 AAV 벡터.
- 제18항 내지 제21항 중 어느 한 항의 AAV 벡터 또는 제23항 내지 제26항의 AAV 입자를 이를 필요로 하는 대상체에게 투여하는 단계를 포함하는 방법.
- 제29항에 있어서, AAV 벡터 또는 입자는 정맥내로 투여되는 것인 방법.
- 제29항에 있어서, AAV 벡터 또는 입자는 대상체의 뇌로 전달되는 것인 방법.
- 제29항에 있어서, AAV 벡터 또는 입자는 대상체의 피질, 선조체 및/또는 시상으로 전달되는 것인 방법.
- 제29항에 있어서, 대상체는 인간 대상체인 방법.
- 제33항에 있어서, 인간 대상체는 성인인 방법.
- 제33항에 있어서, 인간 대상체는 성인이 아닌 것인 방법.
- 제334항에 있어서, 인간 대상체는 25세 이하인 방법.
- 제35항에 있어서, 인간 대상체는 10세 이하인 방법.
- 제28항 내지 제36항 중 어느 한 항에 있어서, 대상체는 신경발달 장애를 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 것인 방법.
- 제29항 내지 제37항 중 어느 한 항에 있어서, 대상체는 자폐 스펙트럼 장애(ASD)를 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 것인 방법.
- 제29항 내지 제37항 중 어느 한 항에 있어서, 대상체는 ASD의 하나 이상의 증상을 나타내는 것인 방법.
- 제29항 내지 제37항 중 어느 한 항에 있어서, 대상체는 펠란-맥더미드 증후군(Phelan-McDermid syndrome)을 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 것인 방법.
- 제29항 내지 제41항 중 어느 한 항에 있어서, 대상체는 발달 지연, 지적 장애(ID), 수면 장애, 저긴장, 언어능력 부족 또는 언어 지연 중 하나 이상을 나타내는 것인 방법.
- 제29항 내지 제42항 중 어느 한 항에 있어서, 대상체는 대조군 대상체에 비해 Shank3 유전자의 감소된 발현을 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 것인 방법.
- 제43항에 있어서, 대조군 대상체는 신경발달 장애, 자폐 스펙트럼 장애(ASD) 및/또는 펠란-맥더미드 증후군을 갖지 않거나, 갖는 것으로 의심되지 않거나, 또는 가질 위험이 없는 대상체인 방법.
- 제43항 또는 제44항에 있어서, Shank3 유전자의 감소된 발현은 Shank3 유전자의 적어도 하나의 카피의 파괴에 의해 유발되는 것인 방법.
- 제45항에 있어서, Shank3 유전자의 파괴는 Shank3 유전자의 적어도 하나의 카피 내에 결실을 포함하는 것인 방법.
- 제45항에 있어서, Shank3 유전자의 파괴는 Shank3 유전자의 적어도 하나의 카피 내에 하나 이상의 돌연변이를 포함하는 것인 방법.
- 신경 발달 장애를 갖는 대상체를 치료하는 방법으로서, AAV 벡터를 포함하는 조성물의 유효량을 대상체에게 투여하는 단계를 포함하고, AAV 벡터는 Shank3 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 것인 방법.
- 자폐 스펙트럼 장애(ASD)를 갖는 대상체를 치료하는 방법으로서, AAV 벡터를 포함하는 조성물의 유효량을 대상체에게 투여하는 단계를 포함하고, AAV 벡터는 Shank3 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 것인 방법.
- 펠란-맥더미드 증후군을 갖는 대상체를 치료하는 방법으로서, AAV 벡터를 포함하는 조성물의 유효량을 대상체에게 투여하는 단계를 포함하고, AAV 벡터는 Shank3 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 것인 방법.
- 제48항 내지 제50항 중 어느 한 항에 있어서, Shank3 단백질은 SH3 도메인, PDZ 도메인, 호머 결합 도메인, 코르탁틴 결합 도메인, 및 SAM 도메인을 포함하는 것인 방법.
- 제48항 내지 제50항 중 어느 한 항에 있어서, Shank3 단백질은 안키린 반복 도메인을 추가로 포함하는 것인 방법.
- 제52항에 있어서, 안키린 반복 도메인은 서열번호: 6의 잔기 148-345에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 147-313에 대해 적어도 90% 동일성을 포함하는 것인 방법.
- 제51항 내지 제53항 중 어느 한 항에 있어서, SH3 도메인은 서열번호: 6의 잔기 474-525에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 473-524에 대해 적어도 90% 동일성을 포함하고/거나;
PDZ 도메인은 서열번호: 6의 잔기 573-662에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 572-661에 대해 적어도 90% 동일성을 포함하고/거나;
호머 결합 도메인은 서열번호: 5 또는 6의 잔기 1294-1323에 대해 적어도 90% 동일성을 포함하고/거나;
코르탁틴 결합 도메인은 서열번호: 5 또는 6의 잔기 1400-1426에 대해 적어도 90% 동일성을 포함하고/거나;
SAM 도메인은 서열번호: 6의 잔기 1664-1729에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 1663-1728에 대해 적어도 90% 동일성을 포함하는 것인 방법. - 제48항 내지 제50항 중 어느 한 항에 있어서, SH3 도메인은 서열번호: 6의 잔기 474-525 또는 서열번호: 5의 잔기 473-524를 포함하고/거나,
PDZ 도메인은 서열번호: 6의 잔기 573-662 또는 서열번호: 5의 잔기 572-661을 포함하고/거나,
호머 결합 도메인은 서열번호: 5 또는 6의 잔기 1294-1323을 포함하고/거나,
코르탁틴 결합 도메인은 서열번호: 5 또는 6의 잔기 1400-1426을 포함하고/거나;
SAM 도메인은 서열번호: 6의 잔기 1664-1729 또는 서열번호: 5의 잔기 1663-1728을 포함하는 것인 방법. - 제47항 내지 제49항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 4.7 kb 미만인 방법.
- 제48항 내지 제50항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 약 4.6 kb, 4.5 kb, 4.4 kb, 4.3 kb, 4.2 kb, 4.1 kb, 4.0 kb, 3.9 kb, 3.8 kb, 3.7 kb, 3.6 kb, 3.5 kb, 3.4 kb, 3.3 kb, 3.2 kb, 3.1 kb, 3.0 kb, 2.9 kb, 2.8 kb, 2.7 kb, 2.6 kb, 2.5 kb, 2.4 kb, 2.3 kb, 2.2 kb, 또는 2.1 kb 미만인 방법.
- 제48항 내지 제50항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 프롤린-풍부 영역을 추가로 포함하는 것인 방법.
- 제48항 내지 제50항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 서열번호: 1-4 중 어느 하나에 대해 적어도 90% 동일성을 포함하는 것인 방법.
- 제48항 내지 제50항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 서열번호: 1-4 중 어느 하나를 포함하는 것인 방법.
- 제478항 내지 제50항 중 어느 한 항에 있어서, 대상체는 인간 대상체인 방법.
- 제61항에 있어서, 인간 대상체는 성인인 방법.
- 제61항에 있어서, 인간 대상체는 성인이 아닌 것인 방법.
- 제62항에 있어서, 인간 대상체는 25세 이하인 방법.
- 제63항에 있어서, 인간 대상체는 10세 이하인 방법.
- 제48항 내지 제65항 중 어느 한 항에 있어서, 조성물은 정맥내로 투여되는 것인 방법.
- 제48항 내지 제65항 중 어느 한 항에 있어서, 조성물은 대상체의 뇌로 전달되는 것인 방법.
- 제48항 내지 제65항 중 어느 한 항에 있어서, 조성물은 대상체의 선조체 및/또는 시상으로 전달되는 것인 방법.
- 제48항 내지 제68항 중 어느 한 항에 있어서, 대상체는 발달 지연, 지적 장애(ID), 수면 장애, 저긴장, 언어능력 부족 또는 언어 지연 중 하나 이상을 나타내는 것인 방법.
- 제48항에 있어서, 자폐 스펙트럼 장애(ASD)는 자폐 장애를 포함하는 것인 방법.
- 제48항 내지 제70항 중 어느 한 항에 있어서, 대상체는 대조군 대상체에 비해 Shank3 유전자의 감소된 발현을 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 것인 방법.
- 제71항에 있어서, 대조군 대상체는 신경발달 장애, 자폐 스펙트럼 장애(ASD) 및/또는 펠란-맥더미드 증후군을 갖지 않거나, 갖는 것으로 의심되지 않거나, 가질 위험이 없는 대상체인 방법.
- 제71항 또는 제72항에 있어서, Shank3 유전자의 감소된 발현은 Shank3 유전자의 적어도 하나의 카피의 파괴에 의해 유발되는 것인 방법.
- 제73항에 있어서, Shank3 유전자의 파괴는 Shank3 유전자의 적어도 하나의 카피 내에 결실을 포함하는 것인 방법.
- 제73항에 있어서, Shank3 유전자의 파괴는 Shank3 유전자의 적어도 하나의 카피 내에 하나 이상의 돌연변이를 포함하는 것인 방법.
- 제48항 내지 제50항 중 어느 한 항에 있어서, 대상체는 조성물의 유효량을 투여받은 후 개선된 수면 효율을 갖는 것인 방법.
- 제48항 내지 제76항 중 어느 한 항에 있어서, 조성물은 약제학적으로 허용가능한 담체 내에 있는 것인 방법.
- 서열번호: 17-20 중 어느 하나에 대해 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 서열을 포함하는 MiniShank3 단백질.
- 제78항에 있어서, MiniShank3 단백질은 서열번호: 17-20 중 어느 하나의 서열을 포함하는 것인 MiniShank3 단백질.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063066570P | 2020-08-17 | 2020-08-17 | |
US63/066,570 | 2020-08-17 | ||
PCT/US2021/046382 WO2022040239A1 (en) | 2020-08-17 | 2021-08-17 | Shank3 gene therapy approaches |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230051578A true KR20230051578A (ko) | 2023-04-18 |
Family
ID=77951796
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237009262A KR20230051578A (ko) | 2020-08-17 | 2021-08-17 | Shank3 유전자 치료 접근법 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20230340041A1 (ko) |
EP (1) | EP4196494A1 (ko) |
JP (1) | JP2023539574A (ko) |
KR (1) | KR20230051578A (ko) |
CN (1) | CN116406305A (ko) |
AU (1) | AU2021328570A1 (ko) |
BR (1) | BR112023003023A2 (ko) |
CA (1) | CA3192052A1 (ko) |
IL (1) | IL300526A (ko) |
MX (1) | MX2023001998A (ko) |
WO (1) | WO2022040239A1 (ko) |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5549910A (en) | 1989-03-31 | 1996-08-27 | The Regents Of The University Of California | Preparation of liposome and lipid complex compositions |
US5252334A (en) | 1989-09-08 | 1993-10-12 | Cygnus Therapeutic Systems | Solid matrix system for transdermal drug delivery |
JP3218637B2 (ja) | 1990-07-26 | 2001-10-15 | 大正製薬株式会社 | 安定なリポソーム水懸濁液 |
JP2958076B2 (ja) | 1990-08-27 | 1999-10-06 | 株式会社ビタミン研究所 | 遺伝子導入用多重膜リポソーム及び遺伝子捕捉多重膜リポソーム製剤並びにその製法 |
US5741516A (en) | 1994-06-20 | 1998-04-21 | Inex Pharmaceuticals Corporation | Sphingosomes for enhanced drug delivery |
US5795587A (en) | 1995-01-23 | 1998-08-18 | University Of Pittsburgh | Stable lipid-comprising drug delivery complexes and methods for their production |
US5697899A (en) | 1995-02-07 | 1997-12-16 | Gensia | Feedback controlled drug delivery system |
US5738868A (en) | 1995-07-18 | 1998-04-14 | Lipogenics Ltd. | Liposome compositions and kits therefor |
US5656016A (en) | 1996-03-18 | 1997-08-12 | Abbott Laboratories | Sonophoretic drug delivery system |
US5797898A (en) | 1996-07-02 | 1998-08-25 | Massachusetts Institute Of Technology | Microchip drug delivery devices |
US5783208A (en) | 1996-07-19 | 1998-07-21 | Theratech, Inc. | Transdermal drug delivery matrix for coadministering estradiol and another steroid |
US5779708A (en) | 1996-08-15 | 1998-07-14 | Cyberdent, Inc. | Intraosseous drug delivery device and method |
EP2292779B1 (en) | 2003-09-30 | 2016-11-16 | The Trustees Of The University Of Pennsylvania | Adeno-associated virus (AAV) clades, sequences, vectors containing same, and uses thereof |
GB201103062D0 (en) | 2011-02-22 | 2011-04-06 | Isis Innovation | Method |
WO2015038958A1 (en) | 2013-09-13 | 2015-03-19 | California Institute Of Technology | Selective recovery |
IL259842B (en) | 2015-12-11 | 2022-08-01 | California Inst Of Techn | Targeted peptides for the targeting of adeno-associated viruses -aavs- |
KR20220108216A (ko) | 2016-05-18 | 2022-08-02 | 보이저 테라퓨틱스, 인크. | 헌팅톤 질환을 치료하기 위한 조성물 및 방법 |
WO2020160337A1 (en) | 2019-01-30 | 2020-08-06 | The Broad Institute, Inc. | Systems for evolved adeno-associated viruses (aavs) for targeted delivery |
IT201900008877A1 (it) * | 2019-06-13 | 2020-12-13 | Univ Bologna Alma Mater Studiorum | Nuovi costrutti per terapia genica |
-
2021
- 2021-08-17 CN CN202180070681.7A patent/CN116406305A/zh active Pending
- 2021-08-17 US US18/021,693 patent/US20230340041A1/en active Pending
- 2021-08-17 EP EP21778597.1A patent/EP4196494A1/en active Pending
- 2021-08-17 JP JP2023512119A patent/JP2023539574A/ja active Pending
- 2021-08-17 MX MX2023001998A patent/MX2023001998A/es unknown
- 2021-08-17 WO PCT/US2021/046382 patent/WO2022040239A1/en unknown
- 2021-08-17 AU AU2021328570A patent/AU2021328570A1/en active Pending
- 2021-08-17 CA CA3192052A patent/CA3192052A1/en active Pending
- 2021-08-17 BR BR112023003023A patent/BR112023003023A2/pt unknown
- 2021-08-17 IL IL300526A patent/IL300526A/en unknown
- 2021-08-17 KR KR1020237009262A patent/KR20230051578A/ko unknown
Also Published As
Publication number | Publication date |
---|---|
BR112023003023A2 (pt) | 2023-04-11 |
EP4196494A1 (en) | 2023-06-21 |
CA3192052A1 (en) | 2022-02-24 |
US20230340041A1 (en) | 2023-10-26 |
MX2023001998A (es) | 2023-05-04 |
IL300526A (en) | 2023-04-01 |
WO2022040239A8 (en) | 2022-06-23 |
JP2023539574A (ja) | 2023-09-15 |
AU2021328570A1 (en) | 2023-03-09 |
WO2022040239A1 (en) | 2022-02-24 |
CN116406305A (zh) | 2023-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108753824B (zh) | 用于治疗视网膜营养不良的病毒载体 | |
KR102178322B1 (ko) | 변형된 인자 ix, 및 세포, 기관 및 조직으로 유전자를 전달하기 위한 조성물, 방법 및 용도 | |
CN108289933B (zh) | 作为认知和行为障碍药物的哺乳动物Klotho的分泌型剪接变体 | |
KR102604096B1 (ko) | 윌슨병을 치료하기 위한 유전자 치료 | |
KR102654180B1 (ko) | 프롤린 및 알라닌 잔기가 풍부한 반복적인 아미노산 서열을 암호화하고 낮은 반복적인 뉴클레오티드 서열을 갖는 핵산 | |
CN112218882A (zh) | Foxp3在经编辑的cd34+细胞中的表达 | |
US20030177507A1 (en) | Nematodes as model organisms for the investigation of neurodegenerative diseases, in particular parkinsons disease, uses and methods for the discovery of substances and genes which can used in the treatment of the above disease states and identification of anematode gene | |
KR20170107481A (ko) | 신규한 마이크로-디스트로핀 및 관련된 사용 방법 | |
CN110662839A (zh) | 用于细胞疗法的基于靶向性配体-有效负载的药物递送 | |
AU2016302335A1 (en) | GLP-1 and use thereof in compositions for treating metabolic diseases | |
KR20210005146A (ko) | 유전자 편집된 t 세포에서의 인간 foxp3의 발현 | |
KR20230062873A (ko) | 염기 편집 효소 | |
JP2023524010A (ja) | 高効率遺伝子送達系 | |
TW202227476A (zh) | 編碼GJB2之重組腺相關病毒(rAAV)及其用途 | |
KR20230038508A (ko) | Mybpc3 폴리펩티드 및 그의 용도 | |
KR20210005178A (ko) | X-연관 고 igm 증후군에서의 치료적 게놈 편집 | |
KR20230051578A (ko) | Shank3 유전자 치료 접근법 | |
CN112203697A (zh) | 编码氨基己糖苷酶alpha和beta亚基的双顺反子AAV载体及其用途 | |
KR20230170686A (ko) | 부정맥유발 우심실 심근병증에 대한 유전자 치료법 | |
CN112342234B (zh) | 一种调控n-乙酰神经氨酸产量提高的重组枯草芽孢杆菌 | |
KR20220142502A (ko) | 근육 특이적 핵산 조절 요소 및 이의 방법 및 용도 | |
US9493747B2 (en) | Engineered transglutaminase barrel proteins | |
US20230346977A1 (en) | Treatment of neuromuscular diseases via gene therapy that expresses klotho protein | |
TW201030146A (en) | High-expression promoter and method for producing gene product using the same | |
KR20240021166A (ko) | 스테레오실린 이중 벡터 시스템을 사용하여 감각신경성 청력 상실을 치료하기 위한 조성물 및 방법 |