KR20050105273A - 단일 분자로 기능하는 분지쇄 중성 아미노산 트랜스포터 - Google Patents
단일 분자로 기능하는 분지쇄 중성 아미노산 트랜스포터 Download PDFInfo
- Publication number
- KR20050105273A KR20050105273A KR1020057016478A KR20057016478A KR20050105273A KR 20050105273 A KR20050105273 A KR 20050105273A KR 1020057016478 A KR1020057016478 A KR 1020057016478A KR 20057016478 A KR20057016478 A KR 20057016478A KR 20050105273 A KR20050105273 A KR 20050105273A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- gly
- protein
- ala
- ser
- Prior art date
Links
- 102000012106 Neutral Amino Acid Transport Systems Human genes 0.000 title description 7
- 108010036505 Neutral Amino Acid Transport Systems Proteins 0.000 title description 7
- 150000001413 amino acids Chemical class 0.000 claims abstract description 174
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 126
- 230000007935 neutral effect Effects 0.000 claims abstract description 111
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 74
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract 13
- 239000011734 sodium Substances 0.000 claims description 62
- 210000004027 cell Anatomy 0.000 claims description 55
- 239000002773 nucleotide Substances 0.000 claims description 48
- 125000003729 nucleotide group Chemical group 0.000 claims description 48
- 241000282414 Homo sapiens Species 0.000 claims description 46
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 claims description 46
- 229910052708 sodium Inorganic materials 0.000 claims description 46
- 239000000758 substrate Substances 0.000 claims description 37
- 238000000034 method Methods 0.000 claims description 31
- 239000000126 substance Substances 0.000 claims description 27
- 230000002401 inhibitory effect Effects 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 15
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 10
- 210000004881 tumor cell Anatomy 0.000 claims description 9
- 239000003112 inhibitor Substances 0.000 claims description 8
- 229940079593 drug Drugs 0.000 claims description 7
- 239000003814 drug Substances 0.000 claims description 7
- 239000013612 plasmid Substances 0.000 claims description 7
- 230000000295 complement effect Effects 0.000 claims description 6
- 238000001727 in vivo Methods 0.000 claims description 6
- 230000035755 proliferation Effects 0.000 claims description 6
- 210000000056 organ Anatomy 0.000 claims description 5
- 239000000523 sample Substances 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 239000013613 expression plasmid Substances 0.000 claims description 4
- 230000001737 promoting effect Effects 0.000 claims description 4
- 230000004060 metabolic process Effects 0.000 claims description 3
- 231100000614 poison Toxicity 0.000 claims description 3
- 239000002574 poison Substances 0.000 claims description 3
- 230000009471 action Effects 0.000 claims description 2
- 239000003053 toxin Substances 0.000 claims 2
- 231100000765 toxin Toxicity 0.000 claims 2
- 108050005273 Amino acid transporters Proteins 0.000 abstract description 33
- 102000034263 Amino acid transporters Human genes 0.000 abstract description 32
- 238000007792 addition Methods 0.000 abstract description 13
- 238000012217 deletion Methods 0.000 abstract description 2
- 230000037430 deletion Effects 0.000 abstract description 2
- 238000006467 substitution reaction Methods 0.000 abstract description 2
- 238000003306 harvesting Methods 0.000 description 111
- 229940024606 amino acid Drugs 0.000 description 109
- 235000001014 amino acid Nutrition 0.000 description 109
- 229960003136 leucine Drugs 0.000 description 108
- 230000032258 transport Effects 0.000 description 87
- 210000000287 oocyte Anatomy 0.000 description 85
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 76
- 101710183375 Large neutral amino acids transporter small subunit 3 Proteins 0.000 description 75
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 70
- 101000708573 Homo sapiens Y+L amino acid transporter 2 Proteins 0.000 description 62
- 102100038269 Large neutral amino acids transporter small subunit 3 Human genes 0.000 description 57
- 101100454355 Rattus norvegicus Slc7a8 gene Proteins 0.000 description 55
- 101150013310 Slc43a2 gene Proteins 0.000 description 55
- 239000002299 complementary DNA Substances 0.000 description 54
- 102100034693 Large neutral amino acids transporter small subunit 4 Human genes 0.000 description 48
- 108020004414 DNA Proteins 0.000 description 40
- 238000002474 experimental method Methods 0.000 description 40
- 230000000694 effects Effects 0.000 description 37
- 235000018102 proteins Nutrition 0.000 description 37
- 239000000243 solution Substances 0.000 description 32
- 108010078791 Carrier Proteins Proteins 0.000 description 30
- 101100020614 Mus musculus Slc43a2 gene Proteins 0.000 description 29
- 230000006870 function Effects 0.000 description 27
- 102000044510 human SLC7A6 Human genes 0.000 description 27
- 150000001875 compounds Chemical class 0.000 description 25
- 241000699666 Mus <mouse, genus> Species 0.000 description 20
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 18
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 16
- 101100020613 Homo sapiens SLC43A2 gene Proteins 0.000 description 15
- 108010050848 glycylleucine Proteins 0.000 description 14
- 108010081551 glycylphenylalanine Proteins 0.000 description 14
- 101100454357 Mus musculus Slc43a1 gene Proteins 0.000 description 13
- 210000001519 tissue Anatomy 0.000 description 13
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 13
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 12
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 11
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 11
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 11
- 238000000636 Northern blotting Methods 0.000 description 11
- 108020004999 messenger RNA Proteins 0.000 description 11
- 102000000325 Amino Acid Transport System L Human genes 0.000 description 10
- 108010055672 Amino Acid Transport System L Proteins 0.000 description 10
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 10
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 10
- HDFGOPSGAURCEO-UHFFFAOYSA-N N-ethylmaleimide Chemical compound CCN1C(=O)C=CC1=O HDFGOPSGAURCEO-UHFFFAOYSA-N 0.000 description 10
- 108091006232 SLC7A5 Proteins 0.000 description 10
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 10
- 210000003734 kidney Anatomy 0.000 description 10
- 125000000896 monocarboxylic acid group Chemical group 0.000 description 10
- MPUVBVXDFRDIPT-UHFFFAOYSA-N 2-Amino-2-norbornanecarboxylic acid Chemical compound C1CC2C(N)(C(O)=O)CC1C2 MPUVBVXDFRDIPT-UHFFFAOYSA-N 0.000 description 9
- 241000282326 Felis catus Species 0.000 description 9
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 9
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 9
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 9
- GHAZCVNUKKZTLG-UHFFFAOYSA-N N-ethyl-succinimide Natural products CCN1C(=O)CCC1=O GHAZCVNUKKZTLG-UHFFFAOYSA-N 0.000 description 9
- 108091034057 RNA (poly(A)) Proteins 0.000 description 9
- 108090000765 processed proteins & peptides Proteins 0.000 description 9
- 150000003839 salts Chemical class 0.000 description 9
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 8
- 108091060211 Expressed sequence tag Proteins 0.000 description 8
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 8
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 8
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 8
- 102100038235 Large neutral amino acids transporter small subunit 2 Human genes 0.000 description 8
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 8
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 8
- 206010028980 Neoplasm Diseases 0.000 description 8
- 108091006313 SLC3A2 Proteins 0.000 description 8
- 108091006238 SLC7A8 Proteins 0.000 description 8
- BKOKTRCZXRIQPX-ZLUOBGJFSA-N Ser-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N BKOKTRCZXRIQPX-ZLUOBGJFSA-N 0.000 description 8
- 210000004556 brain Anatomy 0.000 description 8
- 230000001419 dependent effect Effects 0.000 description 8
- 238000009396 hybridization Methods 0.000 description 8
- 229960000310 isoleucine Drugs 0.000 description 8
- 229960005190 phenylalanine Drugs 0.000 description 8
- 108010070643 prolylglutamic acid Proteins 0.000 description 8
- 108010029020 prolylglycine Proteins 0.000 description 8
- 108010061238 threonyl-glycine Proteins 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 102100033400 4F2 cell-surface antigen heavy chain Human genes 0.000 description 7
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 7
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 7
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 7
- 238000007796 conventional method Methods 0.000 description 7
- 230000001605 fetal effect Effects 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 7
- 230000026731 phosphorylation Effects 0.000 description 7
- 238000006366 phosphorylation reaction Methods 0.000 description 7
- 102000004196 processed proteins & peptides Human genes 0.000 description 7
- 229960004295 valine Drugs 0.000 description 7
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 6
- 150000008575 L-amino acids Chemical class 0.000 description 6
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 6
- 241000880493 Leptailurus serval Species 0.000 description 6
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 6
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 6
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 6
- APMXLWHMIVWLLR-BZSNNMDCSA-N Phe-Tyr-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 APMXLWHMIVWLLR-BZSNNMDCSA-N 0.000 description 6
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 6
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 6
- 108010081404 acein-2 Proteins 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 239000000427 antigen Substances 0.000 description 6
- 108091007433 antigens Proteins 0.000 description 6
- 102000036639 antigens Human genes 0.000 description 6
- 108010008355 arginyl-glutamine Proteins 0.000 description 6
- 201000011510 cancer Diseases 0.000 description 6
- 210000000170 cell membrane Anatomy 0.000 description 6
- 239000000460 chlorine Substances 0.000 description 6
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 6
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 6
- 210000003494 hepatocyte Anatomy 0.000 description 6
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 6
- 239000012528 membrane Substances 0.000 description 6
- 108010005942 methionylglycine Proteins 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 229960004441 tyrosine Drugs 0.000 description 6
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 5
- IKDOHQHEFPPGJG-FXQIFTODSA-N Gln-Asp-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IKDOHQHEFPPGJG-FXQIFTODSA-N 0.000 description 5
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 5
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 5
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 5
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 5
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 5
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 5
- 102100038204 Large neutral amino acids transporter small subunit 1 Human genes 0.000 description 5
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 5
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 5
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 5
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 5
- 206010060862 Prostate cancer Diseases 0.000 description 5
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 5
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 5
- JMBRNXUOLJFURW-BEAPCOKYSA-N Thr-Phe-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N)O JMBRNXUOLJFURW-BEAPCOKYSA-N 0.000 description 5
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 5
- -1 aromatic amino acids Chemical class 0.000 description 5
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 5
- 108010053037 kyotorphin Proteins 0.000 description 5
- 108010057821 leucylproline Proteins 0.000 description 5
- 210000004185 liver Anatomy 0.000 description 5
- 229960004452 methionine Drugs 0.000 description 5
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 5
- 210000002826 placenta Anatomy 0.000 description 5
- 229920001184 polypeptide Polymers 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 210000000813 small intestine Anatomy 0.000 description 5
- 229910001415 sodium ion Inorganic materials 0.000 description 5
- 238000010186 staining Methods 0.000 description 5
- 239000004474 valine Substances 0.000 description 5
- KDSNLYIMUZNERS-UHFFFAOYSA-N 2-methylpropanamine Chemical compound CC(C)CN KDSNLYIMUZNERS-UHFFFAOYSA-N 0.000 description 4
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 4
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 4
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 4
- ANRZCQXIXGDXLR-CWRNSKLLSA-N Asn-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC(=O)N)N)C(=O)O ANRZCQXIXGDXLR-CWRNSKLLSA-N 0.000 description 4
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 4
- NRVQLLDIJJEIIZ-VZFHVOOUSA-N Cys-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N)O NRVQLLDIJJEIIZ-VZFHVOOUSA-N 0.000 description 4
- 150000008574 D-amino acids Chemical class 0.000 description 4
- RGHNJXZEOKUKBD-SQOUGZDYSA-M D-gluconate Chemical group OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O RGHNJXZEOKUKBD-SQOUGZDYSA-M 0.000 description 4
- ROHFNLRQFUQHCH-RXMQYKEDSA-N D-leucine Chemical compound CC(C)C[C@@H](N)C(O)=O ROHFNLRQFUQHCH-RXMQYKEDSA-N 0.000 description 4
- 229930182819 D-leucine Natural products 0.000 description 4
- KZKBJEUWNMQTLV-XDTLVQLUSA-N Gln-Ala-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZKBJEUWNMQTLV-XDTLVQLUSA-N 0.000 description 4
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 4
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 4
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 4
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 4
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 4
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 4
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 4
- IALVDKNUFSTICJ-GMOBBJLQSA-N Ile-Met-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IALVDKNUFSTICJ-GMOBBJLQSA-N 0.000 description 4
- 208000008839 Kidney Neoplasms Diseases 0.000 description 4
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 4
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 4
- ZDSNOSQHMJBRQN-SRVKXCTJSA-N Leu-Asp-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZDSNOSQHMJBRQN-SRVKXCTJSA-N 0.000 description 4
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 4
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 4
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 4
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 4
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 4
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 4
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 4
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 4
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 4
- QRHWTCJBCLGYRB-FXQIFTODSA-N Met-Ala-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O QRHWTCJBCLGYRB-FXQIFTODSA-N 0.000 description 4
- YKWHHKDMBZBMLG-GUBZILKMSA-N Met-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCSC)N YKWHHKDMBZBMLG-GUBZILKMSA-N 0.000 description 4
- MVBZBRKNZVJEKK-DTWKUNHWSA-N Met-Gly-Pro Chemical compound CSCC[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N MVBZBRKNZVJEKK-DTWKUNHWSA-N 0.000 description 4
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 4
- KRLKICLNEICJGV-STQMWFEESA-N Met-Phe-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 KRLKICLNEICJGV-STQMWFEESA-N 0.000 description 4
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 4
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 4
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 4
- 102000003923 Protein Kinase C Human genes 0.000 description 4
- 108090000315 Protein Kinase C Proteins 0.000 description 4
- 206010038389 Renal cancer Diseases 0.000 description 4
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 4
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 4
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 4
- TVPQRPNBYCRRLL-IHRRRGAJSA-N Ser-Phe-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O TVPQRPNBYCRRLL-IHRRRGAJSA-N 0.000 description 4
- STGXWWBXWXZOER-MBLNEYKQSA-N Thr-Ala-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 STGXWWBXWXZOER-MBLNEYKQSA-N 0.000 description 4
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 4
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 4
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 4
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 4
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 4
- NXQAOORHSYJRGH-AAEUAGOBSA-N Trp-Gly-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 NXQAOORHSYJRGH-AAEUAGOBSA-N 0.000 description 4
- YMNSKLWJSOANFS-OYDLWJJNSA-N Trp-Trp-Met Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(O)=O YMNSKLWJSOANFS-OYDLWJJNSA-N 0.000 description 4
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 4
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 4
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 108010060455 des-Tyr- beta-casomorphin Proteins 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000001400 expression cloning Methods 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 229940050410 gluconate Drugs 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 4
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 4
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 4
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 4
- 108010017446 glycyl-prolyl-arginyl-proline Proteins 0.000 description 4
- 210000002216 heart Anatomy 0.000 description 4
- 108010027338 isoleucylcysteine Proteins 0.000 description 4
- BMFVGAAISNGQNM-UHFFFAOYSA-N isopentylamine Chemical compound CC(C)CCN BMFVGAAISNGQNM-UHFFFAOYSA-N 0.000 description 4
- 201000010982 kidney cancer Diseases 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 210000004072 lung Anatomy 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 108010068488 methionylphenylalanine Proteins 0.000 description 4
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 238000012552 review Methods 0.000 description 4
- 210000003079 salivary gland Anatomy 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 108010071207 serylmethionine Proteins 0.000 description 4
- 210000002027 skeletal muscle Anatomy 0.000 description 4
- 210000000952 spleen Anatomy 0.000 description 4
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 4
- 108010073969 valyllysine Proteins 0.000 description 4
- 108010027345 wheylin-1 peptide Proteins 0.000 description 4
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 3
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 3
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 3
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 3
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 3
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 3
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 3
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 3
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 3
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 3
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 3
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 3
- 108020004635 Complementary DNA Proteins 0.000 description 3
- VPQZSNQICFCCSO-BJDJZHNGSA-N Cys-Leu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VPQZSNQICFCCSO-BJDJZHNGSA-N 0.000 description 3
- WVLZTXGTNGHPBO-SRVKXCTJSA-N Cys-Leu-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O WVLZTXGTNGHPBO-SRVKXCTJSA-N 0.000 description 3
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 3
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 3
- LPHGXOWFAXFCPX-KKUMJFAQSA-N Glu-Pro-Phe Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O LPHGXOWFAXFCPX-KKUMJFAQSA-N 0.000 description 3
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 3
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 3
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 3
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 3
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 3
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 3
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- XVZJRZQIHJMUBG-TUBUOCAGSA-N His-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CN=CN1)N XVZJRZQIHJMUBG-TUBUOCAGSA-N 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- STVVMTBJNDTZBF-VIFPVBQESA-N L-phenylalaninol Chemical compound OC[C@@H](N)CC1=CC=CC=C1 STVVMTBJNDTZBF-VIFPVBQESA-N 0.000 description 3
- DQPQTXMIRBUWKO-DCAQKATOSA-N Leu-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N DQPQTXMIRBUWKO-DCAQKATOSA-N 0.000 description 3
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 3
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 3
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 3
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 3
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 3
- NRFGTHFONZYFNY-MGHWNKPDSA-N Leu-Ile-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NRFGTHFONZYFNY-MGHWNKPDSA-N 0.000 description 3
- CPONGMJGVIAWEH-DCAQKATOSA-N Leu-Met-Ala Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O CPONGMJGVIAWEH-DCAQKATOSA-N 0.000 description 3
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 108010065395 Neuropep-1 Proteins 0.000 description 3
- HGNGAMWHGGANAU-WHOFXGATSA-N Phe-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HGNGAMWHGGANAU-WHOFXGATSA-N 0.000 description 3
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 3
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 3
- SZYBZVANEAOIPE-UBHSHLNASA-N Phe-Met-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O SZYBZVANEAOIPE-UBHSHLNASA-N 0.000 description 3
- ZTVSVSFBHUVYIN-UFYCRDLUSA-N Phe-Tyr-Met Chemical compound C([C@@H](C(=O)N[C@@H](CCSC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=C(O)C=C1 ZTVSVSFBHUVYIN-UFYCRDLUSA-N 0.000 description 3
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 3
- BHHGXPLMPWCGHP-UHFFFAOYSA-N Phenethylamine Chemical compound NCCC1=CC=CC=C1 BHHGXPLMPWCGHP-UHFFFAOYSA-N 0.000 description 3
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 3
- 108091006212 SLC7 Proteins 0.000 description 3
- WXWDPFVKQRVJBJ-CIUDSAMLSA-N Ser-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N WXWDPFVKQRVJBJ-CIUDSAMLSA-N 0.000 description 3
- LWMQRHDTXHQQOV-MXAVVETBSA-N Ser-Ile-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LWMQRHDTXHQQOV-MXAVVETBSA-N 0.000 description 3
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 3
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 3
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 3
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 3
- KWQBJOUOSNJDRR-XAVMHZPKSA-N Thr-Cys-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N)O KWQBJOUOSNJDRR-XAVMHZPKSA-N 0.000 description 3
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 3
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 3
- XKTWZYNTLXITCY-QRTARXTBSA-N Trp-Val-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 XKTWZYNTLXITCY-QRTARXTBSA-N 0.000 description 3
- HFJJDMOFTCQGEI-STECZYCISA-N Tyr-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HFJJDMOFTCQGEI-STECZYCISA-N 0.000 description 3
- UBKKNELWDCBNCF-STQMWFEESA-N Tyr-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UBKKNELWDCBNCF-STQMWFEESA-N 0.000 description 3
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 3
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 3
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 3
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 3
- WHNSHJJNWNSTSU-BZSNNMDCSA-N Val-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 WHNSHJJNWNSTSU-BZSNNMDCSA-N 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 3
- 108010091871 leucylmethionine Proteins 0.000 description 3
- 108010012058 leucyltyrosine Proteins 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 108010038320 lysylphenylalanine Proteins 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 108010085203 methionylmethionine Proteins 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 229960002429 proline Drugs 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 2
- COEXAQSTZUWMRI-STQMWFEESA-N (2s)-1-[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 COEXAQSTZUWMRI-STQMWFEESA-N 0.000 description 2
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 2
- JUEUYDRZJNQZGR-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]acetyl]amino]-3-phenylpropanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JUEUYDRZJNQZGR-UHFFFAOYSA-N 0.000 description 2
- DGNHGRLDBKAPEH-UHFFFAOYSA-N 3-azaniumyl-2,2-dimethylpropanoate Chemical compound NCC(C)(C)C(O)=O DGNHGRLDBKAPEH-UHFFFAOYSA-N 0.000 description 2
- XMIIGOLPHOKFCH-UHFFFAOYSA-N 3-phenylpropionic acid Chemical compound OC(=O)CCC1=CC=CC=C1 XMIIGOLPHOKFCH-UHFFFAOYSA-N 0.000 description 2
- UNBMPKNTYKDYCG-UHFFFAOYSA-N 4-methylpentan-2-amine Chemical compound CC(C)CC(C)N UNBMPKNTYKDYCG-UHFFFAOYSA-N 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 2
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 2
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 2
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 2
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 2
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 2
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 2
- AUFACLFHBAGZEN-ZLUOBGJFSA-N Ala-Ser-Cys Chemical compound N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O AUFACLFHBAGZEN-ZLUOBGJFSA-N 0.000 description 2
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 2
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 2
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 2
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 2
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 2
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 2
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 2
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 2
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 2
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 2
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 2
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 2
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 2
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 2
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 2
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 2
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 2
- WAEWODAAWLGLMK-OYDLWJJNSA-N Arg-Trp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WAEWODAAWLGLMK-OYDLWJJNSA-N 0.000 description 2
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 2
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 2
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 2
- RLHANKIRBONJBK-IHRRRGAJSA-N Asn-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N RLHANKIRBONJBK-IHRRRGAJSA-N 0.000 description 2
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 2
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 2
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 2
- UWMIZBCTVWVMFI-FXQIFTODSA-N Asp-Ala-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UWMIZBCTVWVMFI-FXQIFTODSA-N 0.000 description 2
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 2
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 2
- PJERDVUTUDZPGX-ZKWXMUAHSA-N Asp-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC(O)=O PJERDVUTUDZPGX-ZKWXMUAHSA-N 0.000 description 2
- SNAWMGHSCHKSDK-GUBZILKMSA-N Asp-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SNAWMGHSCHKSDK-GUBZILKMSA-N 0.000 description 2
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 2
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 2
- WWOYXVBGHAHQBG-FXQIFTODSA-N Asp-Met-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O WWOYXVBGHAHQBG-FXQIFTODSA-N 0.000 description 2
- YODBPLSWNJMZOJ-BPUTZDHNSA-N Asp-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N YODBPLSWNJMZOJ-BPUTZDHNSA-N 0.000 description 2
- CZIVKMOEXPILDK-SRVKXCTJSA-N Asp-Tyr-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O CZIVKMOEXPILDK-SRVKXCTJSA-N 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 101100002679 Chlorobium chlorochromatii (strain CaD3) aroE gene Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- FEJCUYOGOBCFOQ-ACZMJKKPSA-N Cys-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N FEJCUYOGOBCFOQ-ACZMJKKPSA-N 0.000 description 2
- PORWNQWEEIOIRH-XHNCKOQMSA-N Cys-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N)C(=O)O PORWNQWEEIOIRH-XHNCKOQMSA-N 0.000 description 2
- HBHMVBGGHDMPBF-GARJFASQSA-N Cys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N HBHMVBGGHDMPBF-GARJFASQSA-N 0.000 description 2
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 2
- XZKJEOMFLDVXJG-KATARQTJSA-N Cys-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)N)O XZKJEOMFLDVXJG-KATARQTJSA-N 0.000 description 2
- NMWZMKLDGZXRKP-BZSNNMDCSA-N Cys-Phe-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NMWZMKLDGZXRKP-BZSNNMDCSA-N 0.000 description 2
- SMEYEQDCCBHTEF-FXQIFTODSA-N Cys-Pro-Ala Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O SMEYEQDCCBHTEF-FXQIFTODSA-N 0.000 description 2
- DQUWSUWXPWGTQT-DCAQKATOSA-N Cys-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CS DQUWSUWXPWGTQT-DCAQKATOSA-N 0.000 description 2
- ABLQPNMKLMFDQU-BIIVOSGPSA-N Cys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CS)N)C(=O)O ABLQPNMKLMFDQU-BIIVOSGPSA-N 0.000 description 2
- MJOYUXLETJMQGG-IHRRRGAJSA-N Cys-Tyr-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MJOYUXLETJMQGG-IHRRRGAJSA-N 0.000 description 2
- WOACHWLUOFZLGJ-GUBZILKMSA-N Gln-Arg-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O WOACHWLUOFZLGJ-GUBZILKMSA-N 0.000 description 2
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 2
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 2
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 2
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 2
- QBEWLBKBGXVVPD-RYUDHWBXSA-N Gln-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N QBEWLBKBGXVVPD-RYUDHWBXSA-N 0.000 description 2
- ZVQZXPADLZIQFF-FHWLQOOXSA-N Gln-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 ZVQZXPADLZIQFF-FHWLQOOXSA-N 0.000 description 2
- DOQUICBEISTQHE-CIUDSAMLSA-N Gln-Pro-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O DOQUICBEISTQHE-CIUDSAMLSA-N 0.000 description 2
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 2
- GZWOBWMOMPFPCD-CIUDSAMLSA-N Glu-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N GZWOBWMOMPFPCD-CIUDSAMLSA-N 0.000 description 2
- PKYAVRMYTBBRLS-FXQIFTODSA-N Glu-Cys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O PKYAVRMYTBBRLS-FXQIFTODSA-N 0.000 description 2
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 2
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 2
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 2
- CAVMESABQIKFKT-IUCAKERBSA-N Glu-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N CAVMESABQIKFKT-IUCAKERBSA-N 0.000 description 2
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 2
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 2
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 2
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 2
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 2
- DTRUBYPMMVPQPD-YUMQZZPRSA-N Gly-Gln-Arg Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DTRUBYPMMVPQPD-YUMQZZPRSA-N 0.000 description 2
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 2
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 2
- LUJVWKKYHSLULQ-ZKWXMUAHSA-N Gly-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN LUJVWKKYHSLULQ-ZKWXMUAHSA-N 0.000 description 2
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 2
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 2
- QLQDIJBYJZKQPR-BQBZGAKWSA-N Gly-Met-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN QLQDIJBYJZKQPR-BQBZGAKWSA-N 0.000 description 2
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 2
- QVDGHDFFYHKJPN-QWRGUYRKSA-N Gly-Phe-Cys Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O QVDGHDFFYHKJPN-QWRGUYRKSA-N 0.000 description 2
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 2
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 2
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 2
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 2
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 2
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 2
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 2
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- LDFWDDVELNOGII-MXAVVETBSA-N His-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N LDFWDDVELNOGII-MXAVVETBSA-N 0.000 description 2
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 2
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 2
- JGFWUKYIQAEYAH-DCAQKATOSA-N His-Ser-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JGFWUKYIQAEYAH-DCAQKATOSA-N 0.000 description 2
- GBMSSORHVHAYLU-QTKMDUPCSA-N His-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N)O GBMSSORHVHAYLU-QTKMDUPCSA-N 0.000 description 2
- 101000605028 Homo sapiens Large neutral amino acids transporter small subunit 3 Proteins 0.000 description 2
- 101000969630 Homo sapiens Monocarboxylate transporter 10 Proteins 0.000 description 2
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 2
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 2
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 2
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 2
- VCYVLFAWCJRXFT-HJPIBITLSA-N Ile-Cys-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N VCYVLFAWCJRXFT-HJPIBITLSA-N 0.000 description 2
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 2
- KEKTTYCXKGBAAL-VGDYDELISA-N Ile-His-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N KEKTTYCXKGBAAL-VGDYDELISA-N 0.000 description 2
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 2
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 2
- XHBYEMIUENPZLY-GMOBBJLQSA-N Ile-Pro-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O XHBYEMIUENPZLY-GMOBBJLQSA-N 0.000 description 2
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 2
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- FFEARJCKVFRZRR-UHFFFAOYSA-N L-Methionine Natural products CSCCC(N)C(O)=O FFEARJCKVFRZRR-UHFFFAOYSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- 229930182844 L-isoleucine Natural products 0.000 description 2
- 239000004395 L-leucine Substances 0.000 description 2
- 235000019454 L-leucine Nutrition 0.000 description 2
- 229930195722 L-methionine Natural products 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- KVRKAGGMEWNURO-CIUDSAMLSA-N Leu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N KVRKAGGMEWNURO-CIUDSAMLSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 2
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 2
- USTCFDAQCLDPBD-XIRDDKMYSA-N Leu-Asn-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N USTCFDAQCLDPBD-XIRDDKMYSA-N 0.000 description 2
- FOEHRHOBWFQSNW-KATARQTJSA-N Leu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N)O FOEHRHOBWFQSNW-KATARQTJSA-N 0.000 description 2
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 2
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 2
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 2
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 2
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 2
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 2
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 2
- JRJLGNFWYFSJHB-HOCLYGCPSA-N Leu-Gly-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRJLGNFWYFSJHB-HOCLYGCPSA-N 0.000 description 2
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 2
- OHZIZVWQXJPBJS-IXOXFDKPSA-N Leu-His-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OHZIZVWQXJPBJS-IXOXFDKPSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 2
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 2
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 2
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 2
- AUNMOHYWTAPQLA-XUXIUFHCSA-N Leu-Met-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AUNMOHYWTAPQLA-XUXIUFHCSA-N 0.000 description 2
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 2
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 2
- MJWVXZABPOKJJF-ACRUOGEOSA-N Leu-Phe-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MJWVXZABPOKJJF-ACRUOGEOSA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 2
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 2
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 2
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 2
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 2
- WBRJVRXEGQIDRK-XIRDDKMYSA-N Leu-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 WBRJVRXEGQIDRK-XIRDDKMYSA-N 0.000 description 2
- HQBOMRTVKVKFMN-WDSOQIARSA-N Leu-Trp-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O HQBOMRTVKVKFMN-WDSOQIARSA-N 0.000 description 2
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 2
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 2
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 2
- PGBPWPTUOSCNLE-JYJNAYRXSA-N Lys-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N PGBPWPTUOSCNLE-JYJNAYRXSA-N 0.000 description 2
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 2
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 2
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 2
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 2
- PINHPJWGVBKQII-SRVKXCTJSA-N Lys-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N PINHPJWGVBKQII-SRVKXCTJSA-N 0.000 description 2
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 2
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 2
- VSTNAUBHKQPVJX-IHRRRGAJSA-N Lys-Met-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O VSTNAUBHKQPVJX-IHRRRGAJSA-N 0.000 description 2
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 2
- DLAFCQWUMFMZSN-GUBZILKMSA-N Met-Arg-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N DLAFCQWUMFMZSN-GUBZILKMSA-N 0.000 description 2
- SQUTUWHAAWJYES-GUBZILKMSA-N Met-Asp-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SQUTUWHAAWJYES-GUBZILKMSA-N 0.000 description 2
- MNNKPHGAPRUKMW-BPUTZDHNSA-N Met-Asp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 MNNKPHGAPRUKMW-BPUTZDHNSA-N 0.000 description 2
- CKRRYCJKCRZOCU-GUBZILKMSA-N Met-Cys-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCSC CKRRYCJKCRZOCU-GUBZILKMSA-N 0.000 description 2
- VOOINLQYUZOREH-SRVKXCTJSA-N Met-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N VOOINLQYUZOREH-SRVKXCTJSA-N 0.000 description 2
- UZVKFARGHHMQGX-IUCAKERBSA-N Met-Gly-Met Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCSC UZVKFARGHHMQGX-IUCAKERBSA-N 0.000 description 2
- LQTGGXSOMDSWTQ-UNQGMJICSA-N Met-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCSC)N)O LQTGGXSOMDSWTQ-UNQGMJICSA-N 0.000 description 2
- YIGCDRZMZNDENK-UNQGMJICSA-N Met-Thr-Phe Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YIGCDRZMZNDENK-UNQGMJICSA-N 0.000 description 2
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- WXNXCEHXYPACJF-ZETCQYMHSA-N N-acetyl-L-leucine Chemical compound CC(C)C[C@@H](C(O)=O)NC(C)=O WXNXCEHXYPACJF-ZETCQYMHSA-N 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- 239000000020 Nitrocellulose Substances 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 2
- SEPNOAFMZLLCEW-UBHSHLNASA-N Phe-Ala-Val Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O SEPNOAFMZLLCEW-UBHSHLNASA-N 0.000 description 2
- VUYCNYVLKACHPA-KKUMJFAQSA-N Phe-Asp-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VUYCNYVLKACHPA-KKUMJFAQSA-N 0.000 description 2
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 2
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 2
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 2
- HTXVATDVCRFORF-MGHWNKPDSA-N Phe-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N HTXVATDVCRFORF-MGHWNKPDSA-N 0.000 description 2
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 2
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 2
- OWSLLRKCHLTUND-BZSNNMDCSA-N Phe-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OWSLLRKCHLTUND-BZSNNMDCSA-N 0.000 description 2
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 2
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 2
- MRWOVVNKSXXLRP-IHPCNDPISA-N Phe-Ser-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MRWOVVNKSXXLRP-IHPCNDPISA-N 0.000 description 2
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 2
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 2
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 2
- ABEFOXGAIIJDCL-SFJXLCSZSA-N Phe-Thr-Trp Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 ABEFOXGAIIJDCL-SFJXLCSZSA-N 0.000 description 2
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 2
- OYEUSRAZOGIDBY-JYJNAYRXSA-N Pro-Arg-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OYEUSRAZOGIDBY-JYJNAYRXSA-N 0.000 description 2
- KQCCDMFIALWGTL-GUBZILKMSA-N Pro-Asn-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 KQCCDMFIALWGTL-GUBZILKMSA-N 0.000 description 2
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 2
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 2
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 2
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 2
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 2
- YYARMJSFDLIDFS-FKBYEOEOSA-N Pro-Phe-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YYARMJSFDLIDFS-FKBYEOEOSA-N 0.000 description 2
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 2
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 2
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 108010079005 RDV peptide Proteins 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 229940124639 Selective inhibitor Drugs 0.000 description 2
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 2
- DSSOYPJWSWFOLK-CIUDSAMLSA-N Ser-Cys-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O DSSOYPJWSWFOLK-CIUDSAMLSA-N 0.000 description 2
- MPPHJZYXDVDGOF-BWBBJGPYSA-N Ser-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CO MPPHJZYXDVDGOF-BWBBJGPYSA-N 0.000 description 2
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 2
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 2
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 2
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 2
- RQXDSYQXBCRXBT-GUBZILKMSA-N Ser-Met-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RQXDSYQXBCRXBT-GUBZILKMSA-N 0.000 description 2
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 2
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 2
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 2
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 2
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 101710137500 T7 RNA polymerase Proteins 0.000 description 2
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 2
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 2
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 2
- UHBPFYOQQPFKQR-JHEQGTHGSA-N Thr-Gln-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UHBPFYOQQPFKQR-JHEQGTHGSA-N 0.000 description 2
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 2
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 2
- YUPVPKZBKCLFLT-QTKMDUPCSA-N Thr-His-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N)O YUPVPKZBKCLFLT-QTKMDUPCSA-N 0.000 description 2
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 2
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 2
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 2
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 2
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 2
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 2
- HSQXHRIRJSFDOH-URLPEUOOSA-N Thr-Phe-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HSQXHRIRJSFDOH-URLPEUOOSA-N 0.000 description 2
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 2
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 2
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 2
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- AVYVKJMBNLPWRX-WFBYXXMGSA-N Trp-Ala-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 AVYVKJMBNLPWRX-WFBYXXMGSA-N 0.000 description 2
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 2
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 2
- XOLLWQIBBLBAHQ-WDSOQIARSA-N Trp-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O XOLLWQIBBLBAHQ-WDSOQIARSA-N 0.000 description 2
- UJGDFQRPYGJBEH-AAEUAGOBSA-N Trp-Ser-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N UJGDFQRPYGJBEH-AAEUAGOBSA-N 0.000 description 2
- BOBZBMOTRORUPT-XIRDDKMYSA-N Trp-Ser-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 BOBZBMOTRORUPT-XIRDDKMYSA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 2
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 2
- BYAKMYBZADCNMN-JYJNAYRXSA-N Tyr-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYAKMYBZADCNMN-JYJNAYRXSA-N 0.000 description 2
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 2
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 2
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 2
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 2
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 2
- PYXQBKJPHNCTNW-CYDGBPFRSA-N Val-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N PYXQBKJPHNCTNW-CYDGBPFRSA-N 0.000 description 2
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 2
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 2
- SJLVYVZBFDTRCG-DCAQKATOSA-N Val-Lys-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N SJLVYVZBFDTRCG-DCAQKATOSA-N 0.000 description 2
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 2
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 2
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 2
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 2
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- DLAMVQGYEVKIRE-UHFFFAOYSA-N alpha-(methylamino)isobutyric acid Chemical compound CNC(C)(C)C(O)=O DLAMVQGYEVKIRE-UHFFFAOYSA-N 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 150000001449 anionic compounds Chemical class 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 229910052801 chlorine Inorganic materials 0.000 description 2
- 229960001231 choline Drugs 0.000 description 2
- OEYIOHPDSNJKLS-UHFFFAOYSA-N choline Chemical compound C[N+](C)(C)CCO OEYIOHPDSNJKLS-UHFFFAOYSA-N 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 235000004554 glutamine Nutrition 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010081985 glycyl-cystinyl-aspartic acid Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 2
- CGIGDMFJXJATDK-UHFFFAOYSA-N indomethacin Chemical compound CC1=C(CC(O)=O)C2=CC(OC)=CC=C2N1C(=O)C1=CC=C(Cl)C=C1 CGIGDMFJXJATDK-UHFFFAOYSA-N 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- FGKJLKRYENPLQH-UHFFFAOYSA-N isocaproic acid Chemical compound CC(C)CCC(O)=O FGKJLKRYENPLQH-UHFFFAOYSA-N 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- QVDXUKJJGUSGLS-LURJTMIESA-N methyl L-leucinate Chemical compound COC(=O)[C@@H](N)CC(C)C QVDXUKJJGUSGLS-LURJTMIESA-N 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 229920001220 nitrocellulos Polymers 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 230000035764 nutrition Effects 0.000 description 2
- 210000001672 ovary Anatomy 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- 230000035515 penetration Effects 0.000 description 2
- 239000012466 permeate Substances 0.000 description 2
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 2
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 2
- NMHMNPHRMNGLLB-UHFFFAOYSA-N phloretic acid Chemical compound OC(=O)CCC1=CC=C(O)C=C1 NMHMNPHRMNGLLB-UHFFFAOYSA-N 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 210000002307 prostate Anatomy 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 235000004400 serine Nutrition 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 210000001550 testis Anatomy 0.000 description 2
- 235000008521 threonine Nutrition 0.000 description 2
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 2
- 210000001541 thymus gland Anatomy 0.000 description 2
- 229960004799 tryptophan Drugs 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 108010045269 tryptophyltryptophan Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- XJODGRWDFZVTKW-LURJTMIESA-N (2s)-4-methyl-2-(methylamino)pentanoic acid Chemical compound CN[C@H](C(O)=O)CC(C)C XJODGRWDFZVTKW-LURJTMIESA-N 0.000 description 1
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 1
- XYHKNCXZYYTLRG-UHFFFAOYSA-N 1h-imidazole-2-carbaldehyde Chemical compound O=CC1=NC=CN1 XYHKNCXZYYTLRG-UHFFFAOYSA-N 0.000 description 1
- NWYYWIJOWOLJNR-UHFFFAOYSA-N 2-Amino-3-methyl-1-butanol Chemical compound CC(C)C(N)CO NWYYWIJOWOLJNR-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- 239000001763 2-hydroxyethyl(trimethyl)azanium Substances 0.000 description 1
- GWYFCOCPABKNJV-UHFFFAOYSA-M 3-Methylbutanoic acid Natural products CC(C)CC([O-])=O GWYFCOCPABKNJV-UHFFFAOYSA-M 0.000 description 1
- DBLDQZASZZMNSL-QMMMGPOBSA-N 4-[(2s)-2-amino-3-hydroxypropyl]phenol Chemical compound OC[C@@H](N)CC1=CC=C(O)C=C1 DBLDQZASZZMNSL-QMMMGPOBSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 1
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- CXZFXHGJJPVUJE-CIUDSAMLSA-N Ala-Cys-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O)N CXZFXHGJJPVUJE-CIUDSAMLSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- XYTNPQNAZREREP-XQXXSGGOSA-N Ala-Glu-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XYTNPQNAZREREP-XQXXSGGOSA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 1
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- RNHKOQHGYMTHFR-UBHSHLNASA-N Ala-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 RNHKOQHGYMTHFR-UBHSHLNASA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 1
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 1
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 1
- PYDIIVKGTBRIEL-SZMVWBNQSA-N Arg-Trp-Pro Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(O)=O PYDIIVKGTBRIEL-SZMVWBNQSA-N 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- ORXCYAFUCSTQGY-FXQIFTODSA-N Asn-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N ORXCYAFUCSTQGY-FXQIFTODSA-N 0.000 description 1
- QQEWINYJRFBLNN-DLOVCJGASA-N Asn-Ala-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QQEWINYJRFBLNN-DLOVCJGASA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 1
- XXAOXVBAWLMTDR-ZLUOBGJFSA-N Asn-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N XXAOXVBAWLMTDR-ZLUOBGJFSA-N 0.000 description 1
- QRHYAUYXBVVDSB-LKXGYXEUSA-N Asn-Cys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QRHYAUYXBVVDSB-LKXGYXEUSA-N 0.000 description 1
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 1
- XVAPVJNJGLWGCS-ACZMJKKPSA-N Asn-Glu-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVAPVJNJGLWGCS-ACZMJKKPSA-N 0.000 description 1
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- JGIAYNNXZKKKOW-KKUMJFAQSA-N Asn-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N JGIAYNNXZKKKOW-KKUMJFAQSA-N 0.000 description 1
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 1
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 1
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- XEGZSHSPQNDNRH-JRQIVUDYSA-N Asn-Tyr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XEGZSHSPQNDNRH-JRQIVUDYSA-N 0.000 description 1
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 1
- KDFQZBWWPYQBEN-ZLUOBGJFSA-N Asp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N KDFQZBWWPYQBEN-ZLUOBGJFSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- LTXGDRFJRZSZAV-CIUDSAMLSA-N Asp-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N LTXGDRFJRZSZAV-CIUDSAMLSA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 1
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 1
- XUVTWGPERWIERB-IHRRRGAJSA-N Asp-Pro-Phe Chemical compound N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O XUVTWGPERWIERB-IHRRRGAJSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 1
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 1
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 1
- FIRWLDUOFOULCA-XIRDDKMYSA-N Asp-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N FIRWLDUOFOULCA-XIRDDKMYSA-N 0.000 description 1
- BPAUXFVCSYQDQX-JRQIVUDYSA-N Asp-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)O)N)O BPAUXFVCSYQDQX-JRQIVUDYSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 101100014044 Chlorobium chlorochromatii (strain CaD3) gatB gene Proteins 0.000 description 1
- 235000019743 Choline chloride Nutrition 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- NOCCABSVTRONIN-CIUDSAMLSA-N Cys-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CS)N NOCCABSVTRONIN-CIUDSAMLSA-N 0.000 description 1
- BVFQOPGFOQVZTE-ACZMJKKPSA-N Cys-Gln-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O BVFQOPGFOQVZTE-ACZMJKKPSA-N 0.000 description 1
- VBPGTULCFGKGTF-ACZMJKKPSA-N Cys-Glu-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VBPGTULCFGKGTF-ACZMJKKPSA-N 0.000 description 1
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 1
- XTHUKRLJRUVVBF-WHFBIAKZSA-N Cys-Gly-Ser Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O XTHUKRLJRUVVBF-WHFBIAKZSA-N 0.000 description 1
- OZHXXYOHPLLLMI-CIUDSAMLSA-N Cys-Lys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OZHXXYOHPLLLMI-CIUDSAMLSA-N 0.000 description 1
- UIKLEGZPIOXFHJ-DLOVCJGASA-N Cys-Phe-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O UIKLEGZPIOXFHJ-DLOVCJGASA-N 0.000 description 1
- QQOWCDCBFFBRQH-IXOXFDKPSA-N Cys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N)O QQOWCDCBFFBRQH-IXOXFDKPSA-N 0.000 description 1
- JLZCAZJGWNRXCI-XKBZYTNZSA-N Cys-Thr-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O JLZCAZJGWNRXCI-XKBZYTNZSA-N 0.000 description 1
- SAEVTQWAYDPXMU-KATARQTJSA-N Cys-Thr-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O SAEVTQWAYDPXMU-KATARQTJSA-N 0.000 description 1
- IRKLTAKLAFUTLA-KATARQTJSA-N Cys-Thr-Lys Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CCCCN)C(O)=O IRKLTAKLAFUTLA-KATARQTJSA-N 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- HNDVDQJCIGZPNO-RXMQYKEDSA-N D-histidine Chemical compound OC(=O)[C@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-RXMQYKEDSA-N 0.000 description 1
- 229930195721 D-histidine Natural products 0.000 description 1
- FFEARJCKVFRZRR-SCSAIBSYSA-N D-methionine Chemical compound CSCC[C@@H](N)C(O)=O FFEARJCKVFRZRR-SCSAIBSYSA-N 0.000 description 1
- 229930182818 D-methionine Natural products 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241001302160 Escherichia coli str. K-12 substr. DH10B Species 0.000 description 1
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 1
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 1
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 1
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 1
- QYKBTDOAMKORGL-FXQIFTODSA-N Gln-Gln-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QYKBTDOAMKORGL-FXQIFTODSA-N 0.000 description 1
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- CGVWDTRDPLOMHZ-FXQIFTODSA-N Gln-Glu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CGVWDTRDPLOMHZ-FXQIFTODSA-N 0.000 description 1
- LLRJEFPKIIBGJP-DCAQKATOSA-N Gln-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LLRJEFPKIIBGJP-DCAQKATOSA-N 0.000 description 1
- MAGNEQBFSBREJL-DCAQKATOSA-N Gln-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N MAGNEQBFSBREJL-DCAQKATOSA-N 0.000 description 1
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 1
- PODFFOWWLUPNMN-DCAQKATOSA-N Gln-His-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PODFFOWWLUPNMN-DCAQKATOSA-N 0.000 description 1
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 1
- MWERYIXRDZDXOA-QEWYBTABSA-N Gln-Ile-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MWERYIXRDZDXOA-QEWYBTABSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 1
- GURIQZQSTBBHRV-SRVKXCTJSA-N Gln-Lys-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GURIQZQSTBBHRV-SRVKXCTJSA-N 0.000 description 1
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 1
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 1
- QFXNFFZTMFHPST-DZKIICNBSA-N Gln-Phe-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)N)N QFXNFFZTMFHPST-DZKIICNBSA-N 0.000 description 1
- CTJRFALAOYAJBX-NWLDYVSISA-N Gln-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N)O CTJRFALAOYAJBX-NWLDYVSISA-N 0.000 description 1
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 1
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 1
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 1
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 1
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- JGHNIWVNCAOVRO-DCAQKATOSA-N Glu-His-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGHNIWVNCAOVRO-DCAQKATOSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 1
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- MIIGESVJEBDJMP-FHWLQOOXSA-N Glu-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 MIIGESVJEBDJMP-FHWLQOOXSA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 1
- GZBZACMXFIPIDX-WHFBIAKZSA-N Gly-Cys-Asp Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN)C(=O)O GZBZACMXFIPIDX-WHFBIAKZSA-N 0.000 description 1
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- ORXZVPZCPMKHNR-IUCAKERBSA-N Gly-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 ORXZVPZCPMKHNR-IUCAKERBSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 1
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- HHRODZSXDXMUHS-LURJTMIESA-N Gly-Met-Gly Chemical compound CSCC[C@H](NC(=O)C[NH3+])C(=O)NCC([O-])=O HHRODZSXDXMUHS-LURJTMIESA-N 0.000 description 1
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- MUGLKCQHTUFLGF-WPRPVWTQSA-N Gly-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)CN MUGLKCQHTUFLGF-WPRPVWTQSA-N 0.000 description 1
- 108010063380 Glycine Plasma Membrane Transport Proteins Proteins 0.000 description 1
- 102000010726 Glycine Plasma Membrane Transport Proteins Human genes 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- TXLQHACKRLWYCM-DCAQKATOSA-N His-Glu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O TXLQHACKRLWYCM-DCAQKATOSA-N 0.000 description 1
- OEROYDLRVAYIMQ-YUMQZZPRSA-N His-Gly-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O OEROYDLRVAYIMQ-YUMQZZPRSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000655246 Homo sapiens Neutral amino acid transporter A Proteins 0.000 description 1
- 101000724418 Homo sapiens Neutral amino acid transporter B(0) Proteins 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 1
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- FGBRXCZYVRFNKQ-MXAVVETBSA-N Ile-Phe-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N FGBRXCZYVRFNKQ-MXAVVETBSA-N 0.000 description 1
- VZSDQFZFTCVEGF-ZEWNOJEFSA-N Ile-Phe-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O VZSDQFZFTCVEGF-ZEWNOJEFSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- WXLYNEHOGRYNFU-URLPEUOOSA-N Ile-Thr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N WXLYNEHOGRYNFU-URLPEUOOSA-N 0.000 description 1
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- FORGMRSGVSYZQR-YFKPBYRVSA-N L-leucinamide Chemical compound CC(C)C[C@H](N)C(N)=O FORGMRSGVSYZQR-YFKPBYRVSA-N 0.000 description 1
- 229930182821 L-proline Natural products 0.000 description 1
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 1
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- BAJIJEGGUYXZGC-CIUDSAMLSA-N Leu-Asn-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N BAJIJEGGUYXZGC-CIUDSAMLSA-N 0.000 description 1
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 1
- HUEBCHPSXSQUGN-GARJFASQSA-N Leu-Cys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N HUEBCHPSXSQUGN-GARJFASQSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- RSFGIMMPWAXNML-MNXVOIDGSA-N Leu-Gln-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSFGIMMPWAXNML-MNXVOIDGSA-N 0.000 description 1
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 1
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- WXDRGWBQZIMJDE-ULQDDVLXSA-N Leu-Phe-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O WXDRGWBQZIMJDE-ULQDDVLXSA-N 0.000 description 1
- MVVSHHJKJRZVNY-ACRUOGEOSA-N Leu-Phe-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MVVSHHJKJRZVNY-ACRUOGEOSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- URHJPNHRQMQGOZ-RHYQMDGZSA-N Leu-Thr-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O URHJPNHRQMQGOZ-RHYQMDGZSA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 1
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 1
- CRNNMTHBMRFQNG-GUBZILKMSA-N Lys-Glu-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N CRNNMTHBMRFQNG-GUBZILKMSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- OJDFAABAHBPVTH-MNXVOIDGSA-N Lys-Ile-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OJDFAABAHBPVTH-MNXVOIDGSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- UDXSLGLHFUBRRM-OEAJRASXSA-N Lys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCCN)N)O UDXSLGLHFUBRRM-OEAJRASXSA-N 0.000 description 1
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 1
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- XABXVVSWUVCZST-GVXVVHGQSA-N Lys-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN XABXVVSWUVCZST-GVXVVHGQSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 102000012750 Membrane Glycoproteins Human genes 0.000 description 1
- 108010090054 Membrane Glycoproteins Proteins 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 1
- VTKPSXWRUGCOAC-GUBZILKMSA-N Met-Ala-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCSC VTKPSXWRUGCOAC-GUBZILKMSA-N 0.000 description 1
- AHZNUGRZHMZGFL-GUBZILKMSA-N Met-Arg-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCNC(N)=N AHZNUGRZHMZGFL-GUBZILKMSA-N 0.000 description 1
- NKDSBBBPGIVWEI-RCWTZXSCSA-N Met-Arg-Thr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NKDSBBBPGIVWEI-RCWTZXSCSA-N 0.000 description 1
- ACYHZNZHIZWLQF-BQBZGAKWSA-N Met-Asn-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ACYHZNZHIZWLQF-BQBZGAKWSA-N 0.000 description 1
- GVIVXNFKJQFTCE-YUMQZZPRSA-N Met-Gly-Gln Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O GVIVXNFKJQFTCE-YUMQZZPRSA-N 0.000 description 1
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 1
- HGAJNEWOUHDUMZ-SRVKXCTJSA-N Met-Leu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O HGAJNEWOUHDUMZ-SRVKXCTJSA-N 0.000 description 1
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 1
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 102100032884 Neutral amino acid transporter A Human genes 0.000 description 1
- 102100028267 Neutral amino acid transporter B(0) Human genes 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 1
- LBSARGIQACMGDF-WBAXXEDZSA-N Phe-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 LBSARGIQACMGDF-WBAXXEDZSA-N 0.000 description 1
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 1
- UUWCIPUVJJIEEP-SRVKXCTJSA-N Phe-Asn-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N UUWCIPUVJJIEEP-SRVKXCTJSA-N 0.000 description 1
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 1
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 1
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 1
- DVOCGBNHAUHKHJ-DKIMLUQUSA-N Phe-Ile-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O DVOCGBNHAUHKHJ-DKIMLUQUSA-N 0.000 description 1
- RORUIHAWOLADSH-HJWJTTGWSA-N Phe-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 RORUIHAWOLADSH-HJWJTTGWSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 1
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 1
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 1
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- SRBFGSGDNNQABI-FHWLQOOXSA-N Pro-Leu-Trp Chemical compound N([C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C(=O)[C@@H]1CCCN1 SRBFGSGDNNQABI-FHWLQOOXSA-N 0.000 description 1
- CPRLKHJUFAXVTD-ULQDDVLXSA-N Pro-Leu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CPRLKHJUFAXVTD-ULQDDVLXSA-N 0.000 description 1
- SPLBRAKYXGOFSO-UNQGMJICSA-N Pro-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@@H]2CCCN2)O SPLBRAKYXGOFSO-UNQGMJICSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 1
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 108010065868 RNA polymerase SP6 Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 1
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 1
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 1
- KNCJWSPMTFFJII-ZLUOBGJFSA-N Ser-Cys-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KNCJWSPMTFFJII-ZLUOBGJFSA-N 0.000 description 1
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 1
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 102100035265 Testis anion transporter 1 Human genes 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 1
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- PJCYRZVSACOYSN-ZJDVBMNYSA-N Thr-Thr-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O PJCYRZVSACOYSN-ZJDVBMNYSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 1
- PXYJUECTGMGIDT-WDSOQIARSA-N Trp-Arg-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 PXYJUECTGMGIDT-WDSOQIARSA-N 0.000 description 1
- RCMHSGRBJCMFLR-BPUTZDHNSA-N Trp-Met-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 RCMHSGRBJCMFLR-BPUTZDHNSA-N 0.000 description 1
- WMIUTJPFHMMUGY-ZFWWWQNUSA-N Trp-Pro-Gly Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)NCC(=O)O WMIUTJPFHMMUGY-ZFWWWQNUSA-N 0.000 description 1
- VMXLNDRJXVAJFT-JYBASQMISA-N Trp-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O VMXLNDRJXVAJFT-JYBASQMISA-N 0.000 description 1
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 1
- HSVPZJLMPLMPOX-BPNCWPANSA-N Tyr-Arg-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O HSVPZJLMPLMPOX-BPNCWPANSA-N 0.000 description 1
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 1
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 1
- FFCRCJZJARTYCG-KKUMJFAQSA-N Tyr-Cys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O FFCRCJZJARTYCG-KKUMJFAQSA-N 0.000 description 1
- WDGDKHLSDIOXQC-ACRUOGEOSA-N Tyr-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WDGDKHLSDIOXQC-ACRUOGEOSA-N 0.000 description 1
- SBLZVFCEOCWRLS-BPNCWPANSA-N Tyr-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N SBLZVFCEOCWRLS-BPNCWPANSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- GPLTZEMVOCZVAV-UFYCRDLUSA-N Tyr-Tyr-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 GPLTZEMVOCZVAV-UFYCRDLUSA-N 0.000 description 1
- RMRFSFXLFWWAJZ-HJOGWXRNSA-N Tyr-Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 RMRFSFXLFWWAJZ-HJOGWXRNSA-N 0.000 description 1
- DZGWFCGJZKJUFP-UHFFFAOYSA-N Tyramine Natural products NCCC1=CC=C(O)C=C1 DZGWFCGJZKJUFP-UHFFFAOYSA-N 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- JFAWZADYPRMRCO-UBHSHLNASA-N Val-Ala-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JFAWZADYPRMRCO-UBHSHLNASA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- IQQYYFPCWKWUHW-YDHLFZDLSA-N Val-Asn-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N IQQYYFPCWKWUHW-YDHLFZDLSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 1
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 1
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 1
- OJOMXGVLFKYDKP-QXEWZRGKSA-N Val-Met-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OJOMXGVLFKYDKP-QXEWZRGKSA-N 0.000 description 1
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 1
- BCBFMJYTNKDALA-UFYCRDLUSA-N Val-Phe-Phe Chemical compound N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O BCBFMJYTNKDALA-UFYCRDLUSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 1
- SDHZOOIGIUEPDY-JYJNAYRXSA-N Val-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 SDHZOOIGIUEPDY-JYJNAYRXSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- USXYVSTVPHELAF-RCWTZXSCSA-N Val-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N)O USXYVSTVPHELAF-RCWTZXSCSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- IRAUYEAFPFPVND-UVBJJODRSA-N Val-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 IRAUYEAFPFPVND-UVBJJODRSA-N 0.000 description 1
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 1
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- SXEHKFHPFVVDIR-UHFFFAOYSA-N [4-(4-hydrazinylphenyl)phenyl]hydrazine Chemical compound C1=CC(NN)=CC=C1C1=CC=C(NN)C=C1 SXEHKFHPFVVDIR-UHFFFAOYSA-N 0.000 description 1
- 229960000669 acetylleucine Drugs 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 150000003862 amino acid derivatives Chemical class 0.000 description 1
- 230000037354 amino acid metabolism Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000003293 antisense oligodeoxyribonucleotide Substances 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010028263 bacteriophage T3 RNA polymerase Proteins 0.000 description 1
- GWYFCOCPABKNJV-UHFFFAOYSA-N beta-methyl-butyric acid Natural products CC(C)CC(O)=O GWYFCOCPABKNJV-UHFFFAOYSA-N 0.000 description 1
- 210000003969 blast cell Anatomy 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 150000005693 branched-chain amino acids Chemical class 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 125000006297 carbonyl amino group Chemical group [H]N([*:2])C([*:1])=O 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- SGMZJAMFUVOLNK-UHFFFAOYSA-M choline chloride Chemical compound [Cl-].C[N+](C)(C)CCO SGMZJAMFUVOLNK-UHFFFAOYSA-M 0.000 description 1
- 229960003178 choline chloride Drugs 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000008406 drug-drug interaction Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 229960002743 glutamine Drugs 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 229960002885 histidine Drugs 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 238000002991 immunohistochemical analysis Methods 0.000 description 1
- 229960000905 indomethacin Drugs 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- NWYYWIJOWOLJNR-RXMQYKEDSA-N l-valinol Chemical compound CC(C)[C@H](N)CO NWYYWIJOWOLJNR-RXMQYKEDSA-N 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000002429 large intestine Anatomy 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 235000011164 potassium chloride Nutrition 0.000 description 1
- 108010007439 proline transporter Proteins 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 108091005703 transmembrane proteins Proteins 0.000 description 1
- 102000035160 transmembrane proteins Human genes 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 210000005239 tubule Anatomy 0.000 description 1
- 229960003732 tyramine Drugs 0.000 description 1
- DZGWFCGJZKJUFP-UHFFFAOYSA-O tyraminium Chemical compound [NH3+]CCC1=CC=C(O)C=C1 DZGWFCGJZKJUFP-UHFFFAOYSA-O 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Gastroenterology & Hepatology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Toxicology (AREA)
- General Chemical & Material Sciences (AREA)
- Pharmacology & Pharmacy (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Hematology (AREA)
- Obesity (AREA)
- Diabetes (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
Abstract
본 발명은 단일 분자로 기능하여 분지쇄 아미노산을 중심으로 하는 중성 아미노산을 수송하는 신규 아미노산 트랜스포터 및 그 유전자를 제공하는 것을 목적으로 한다. 본 발명은 서열번호 2, 4, 6 또는 8로 나타낸 아미노산 서열로 되거나, 또는 서열번호 2, 4, 6 또는 8로 나타낸 아미노산 서열에서 1 또는 몇 개의 아미노산이 결실, 치환 또는 부가된 아미노산 서열로 되는, 분지쇄 아미노산을 중심으로 하는 중성 아미노산 및 그 유사 물질을 나트륨 비의존적으로 수송하는 능력을 단일 분자로 발휘하는 단백질을 제공한다. 본 발명은 또한, 서열번호 1, 3, 5, 또는 7로 나타낸 염기서열로 되는 DNA, 또는 그것과 하이브리다이즈할 수 있는 DNA로 되는 유전자로서, 분지쇄 아미노산을 나트륨 비의존적으로 수송하는 능력을 단일 분자로 발휘하는 단백질을 코딩하는 유전자를 제공한다.
Description
본 발명은 분지쇄(branched) 중성 아미노산 및 그 유사 물질의 나트륨 비의존적 수송에 관여하는 단백질, 및 그 단백질을 코딩하는 유전자에 관한 것이다.
세포는, 영양으로서 아미노산을 상시 수중에 넣는 것을 필요로 하며, 이 기능은 세포막에 존재하는 막단백질인 아미노산 트랜스포터가 담당하고 있다. 특히 중성 아미노산 수송계 L는, 많은 필수 아미노산의 세포에의 공급을 담당하는 것으로부터 세포 영양에 있어서 가장 중요한 수송기구의 하나인 것과 동시에, 장관으로부터의 흡수, 신장 요세관으로부터의 재흡수, 혈액·조직 관문의 통과에 대해서도 중요한 역할을 완수하고 있다. 또한, 중성 아미노산 수송계 L는, 기질 선택성이 넓은 것으로부터, 중성 아미노산 유사 물질이나 중성 아미노산과 유사한 구조를 갖는 약물이나 독물을 수송하는 것으로도 알려져 있다.
중성 아미노산 수송계 L는, 원래 아미노산 유사 화합물인 BCH(2-aminobicyclo-(2,2,1)-heptane-2-carboxylic acid)에 의해 특이적으로 억제되는 아미노산 수송계로서 종양 세포주로 처음 기재되었으며, 그 후 배양 세포, 막소포 표본, 적출장기 표본 또는 in vivo 표본을 이용해 검토되었다[Christensen, Physiological Reviews, 1990년, 제70권, 제1호, p. 43-77]. 중성 아미노산 수송계 L은, 나트륨 비의존적인, 즉 그 기능에 나트륨 이온을 필요로 하지 않는 트랜스포터이다. 그 수송 기질 선택성이나 수송 특성은, 세포나 조직에 의해 차이가 있는 것이 알려져 있다.
그러나, 종래의 방법으로는 중성 아미노산 및 그 유사 물질 수송의 상세한 것이나, 세포의 생존 또는 증식에 대한 중성 아미노산 수송계 L의 역할을 해석하는 것이 곤란하여, 중성 아미노산 수송계 L의 기능을 담당하는 중성 아미노산 트랜스포터의 유전자를 단리하여 상세한 기능 해석을 가능하도록 하는 것이 요망되고 있다.
중성 아미노산 트랜스포터로서는, 나트륨 의존적인 트랜스포터로서 ASCT1 및 ASCT2가 클로닝되어 있다[金井, Current Opinion in Cell Biology, 1997년, 제9권, 제4호, p. 565-572]. 그러나, 이들은 알라닌, 세린, 시스테인, 트레오닌, 글루타민을 주된 기질로 하는 것이고, 중성 아미노산 수송계 L과는 기질 선택성이 차이가 난다. 또한, 글리신 트랜스포터와 프롤린 트랜스포터가 클로닝되어 있지만, 중성 아미노산 수송계 L와는 다르다[Amara & Kuhar, Annual Review of Neuroscience, 1993년, 제16권, p. 73-93].
트랜스포터 자체는 아니지만, 아미노산 트랜스포터의 활성화 인자라고 생각되고 있는 막 관통 구조를 1 회밖에 가지지 않는 2형막 당단백질인 rBAT 및 4F2hc의 cDNA가 클로닝되어 있어, 이들을 아후리카트메가엘 난모세포에 발현시키면 중성 아미노산과 함께 알칼리성 아미노산의 수확을 활성화하는 것이 알려져 있다[Palacin, The Journal of Experimental Biology, 1994년, 제196권, p. 123-137].
수송계 L에 상당하는 트랜스포터로서 중성 아미노산 트랜스포터 LAT1[金井 외, The Journal of Biological Chemistry, 1999년, 제273권, 제37호, p. 23629-23632] 및 LAT2[瀨川 외, The Journal of Biological Chemistry, 1999년, 제274권, 제28호, p. 19745-19751]이 클로닝되어 있다. 양자는 4F2hc와 헤테로 이량체를 형성하는 것에 의해 기능하는 트랜스포터로, 양자 공히 Na+ 비의존적인 수송을 나타낸다. LAT1는 류신, 이소류신, 발린, 페닐알라닌, 타이로신, 트립토판, 메티오닌, 히스티딘 등 대형의 중성 아미노산을 수송하는 교환 수송 활성을 나타내고, LAT2는 대형의 중성 아미노산에 더하여 글리신, 알라닌, 세린, 시스테인, 트레오닌 등 소형의 중성 아미노산도 수송하는 넓은 기질 선택성을 가진다. 그러나, 이 2 종의 수송계 L 트랜스포터만으로는, 전신의 수송계 L을 설명할 수는 없고, 다른 미동정의 수송계 L 동형체(isoform)가 존재하는 것으로 상정되고 있다.
기존의 수송계 L 트랜스포터 LAT1 및 LAT2는 SLC7 패밀리에 속하는 헤테로 이량체형 단백질이고, 1회 막관통형 단백질인 4F2hc와 연결하는 것에 의해 기능성의 트랜스포터를 형성한다. 이미 공개된 마우스 게놈 및 인간 게놈 데이터베이스에서 SLC7 패밀리의 기능 미동정된 멤버를 탐색하였으나, 그 안에서 새로운 수송계 L에 상당하는 신규 트랜스포터는 발견되지 않았다. 따라서, 미동정의 새로운 수송계 L 트랜스포터는 SLC7 패밀리 이외의 단백질일 가능성이 상정되고 있다.
더우기, 중성 아미노산 트랜스포터 LAT1의 유사 단백질로서 중성 아미노산 및 알칼리성 아미노산을 수송하는 수송계 y+L의 기능을 갖는 y+LAT1과 y+LAT2가 클로닝되어 있다[Torrents 외, The Journal of Biological Chemistry, 1998년, 제273권, 제49호, p. 32437-32445]. 또한, y+LAT1, y+LAT2 모두 보조 인자 4F2hc와 공존하는 것에 의해서만 기능하는 것으로 나타났다. y+LAT1과 y+LAT2는 중성 아미노산으로서는 글루타민, 류신, 이소류신을 주로 수송하여, 중성 아미노산에 대한 기질 선택성은 좁다.
게다가, 방향족 아미노산을 수송하는 중성 아미노산 트랜스포터로서 수송계 T에 상당하는 아미노산 트랜스포터 TAT1[김 외, The Journal of Biological Chemistry, 2001년, 제276권, 제20호, p. 17221-17228]이 클로닝되어 있다. TAT1은 트립토판, 타이로신, 페닐알라닌 등의 방향족 아미노산을 Na+비의존적으로 수송하지만, 류신, 이소류신, 발린 등의 분지 아미노산은 받아들이지 않고, 수송계 L 특이적인 억제약 BCH에 의해 억제되지 않고, 아미노산 수송계 L과는 다르다.
본 출원 발명에 관련된 선행기술문헌정보는 다음과 같다.
1. Christensen, Physiological Reviews, 1990년, 제70권, 제1호, p. 43-77
2. 金井, Current Opinion in Cell Biology, 1997년, 제9권, 제4호, p. 565-572
3. Amara & Kuhar, Annual Review of Neuroscience, 1993년, 제16권, p. 73-93
4. Palacin, The Journal of Experimental Biology, 1994년, 제196권, p. 123-137
5. 金井 외, The Journal of Biological Chemistry, 1999년, 제273권, 제37호, p. 23629-23632
6. 瀨川 외, The Journal of Biological Chemistry, 1999년, 제274권, 제28호, p. 19745-19751
7. Torrents 외, The Journal of Biological Chemistry, 1998년, 제273권, 제49호, p. 32437-32445
8. 김 외, The Journal of Biological Chemistry, 2001년, 제276권, 제20호, p. 17221-17228
9. Cole 외, Genomics , 1998년, 제51권, 제2호, p. 282-287
도 1은 인간 FLC4 세포 유래 mRNA 및 그 크기 분획을 주입한 난모세포에 의한 류신의 수확 실험 결과를 나타낸다.
도 2는 인간 LAT3와 마우스 LAT3의 아미노산 서열의 비교를 나타낸다. 예상되는 막 관통 부위를 굵은선으로 나타냈다. 또한, 예상되는 당쇄 부가 부위를 #, 프로테인키나제 C 의존성의 인산화 부위를 *, 타이로신 인산화 부위를 &로 나타냈다.
도 3은 인간의 각 장기 조직에 있어서 LAT3 유전자 mRNA의 발현을 노던 블롯팅에 의해 해석한 결과를 나타낸 도면에 대신하는 사진이다.
도 4는 인간 LAT3 유전자의 cRNA를 주입한 난모세포에 의한 류신 수확 실험의 결과를 나타낸다.
도 5는 인간 LAT3 유전자의 cRNA를 주입한 난모세포에 의한 류신 수확 실험에 있어서 첨가하는 염의 영향을 조사한 결과를 나타낸다.
도 6은 인간 LAT3 유전자의 cRNA를 주입한 난모세포에 의한 류신 수확 실험에 있어서 기질 류신의 농도의 영향을 조사한 결과를 나타내는 그래프. 삽입도는 그 Eadie-Hofstee 플롯.
도 7은 인간 LAT3 유전자의 cRNA를 주입한 난모세포에 의한 류신 수확 실험에 있어서, 계에 글리신 및 각종 L-아미노산을 첨가한 영향을 조사한 결과를 나타낸다.
도 8은 인간 LAT3 유전자의 cRNA를 주입한 난모세포에 의한 류신 수확 실험에 있어서, 계에 각종 D-아미노산을 첨가한 영향을 조사한 결과를 나타낸다.
도 9는 인간 LAT3 유전자의 cRNA를 주입한 난모세포에 의한 류신 수확 실험에 있어서, 계에 각종 아미노산 수송계 선택적 억제약을 첨가한 영향을 조사한 결과를 나타낸다.
도 10은 인간 LAT3 유전자의 cRNA를 주입한 난모세포에 의한 류신 수확 실험에 있어서, 계에 각종 아미노산 유도체를 첨가한 영향을 조사한 결과를 나타내는 그래프이다.
R1-CH(NH2)COOH, L-류신; R1-CH(NH2)CH2OH, L-류신올; R1-CH2NH2, 이소펜틸아민; R1-CH2COOH, 4-메틸발레르산; R1-CH(NH2)CH3, 1,3-디메틸-n-부틸아민; R1-CH(NH2)CONH2, L-류신아미드; R1-CH(NH2)COOCH3, L-류신-메틸에스테르; R1-CH(NHCOCH3)COOH, N-아세틸-L-류신; R1-CH(NHCH3)COOH, N-메틸-L-류신; R2-CH(NH2)COOH, L-발린; R2-CH(NH2)CH2OH, L-발린올; R2-CH2NH2, 이소부틸아민; R2-CH2COOH, 이소발레르산; R3-CH(NH2)COOH, L-페닐알라닌; R3-CH(NH2)CH2OH, L-페닐알라닌올; R3-CH2NH2, 2-페닐에틸아민; R3-CH2COOH, 3-페닐프로피온산; R4-CH(NH2)COOH, L-타이로신; R4-CH(NH2)CH2OH, L-타이로신올; R4-CH2NH2, 타이라민; R4-CH2COOH, 3-(p-히드록시페닐)프로피온산.
도 11은 인간 LAT3 유전자의 cRNA를 주입한 난모세포에 의한 류신 수확 실험에 있어서, 계에 각종 음이온성 화합물을 첨가한 영향을 조사한 결과를 나타낸다.
도 12는 인간 LAT3 유전자의 cRNA를 주입한 난모세포에 의한 방사능 표지 L-아미노산 및 L-아미노산의 수확을 조사한 결과를 나타낸다.
도 13은 인간 LAT3 유전자의 cRNA를 주입한 난모세포에 의한 류신 수확 실험에 있어서 pH의 영향을 조사한 결과를 나타낸다.
도 14는 인간 LAT3 유전자의 cRNA를 주입한 난모세포에 의한 14C-류신의 방출 시간 경과를 조사한 결과를 나타내는 그래프. □: 대조로서 인간 LAT3 유전자의 cRNA 대신 물을 주입한 난모세포에 있어서 14C-류신의 방출, Na+ 비함유 수확용 용액에 류신 미첨가한 경우. ■: 대조로서 인간 LAT3 유전자의 cRNA 대신 물을 주입한 난모세포에 있어서 14C-류신의 방출, Na+ 비함유 수확용 용액에 류신 첨가한 경우. ○: 인간 LAT3 유전자의 cRNA를 주입한 난모세포에 있어서 14C-류신의 방출, Na+ 비함유 수확용 용액에 류신 미첨가한 경우. ●: 인간 LAT3 유전자의 cRNA를 주입한 난모세포에 있어서 14C-류신의 방출, Na+ 비함유 수확용 용액에 류신 첨가한 경우. 세로축은 방출된 방사활성을 난모세포에 주입한 방사활성에 대한 %로 나타낸 것이다.
도 15는 인간 LAT3 유전자의 cRNA를 주입한 난모세포에 의한 류신 수확 실험에 있어서, N-에틸말레이미드(NEM) 처리의 영향을 조사한 결과를 나타내는 그래프.
도 16은 인간 전립선암(A 및 B) 및 인간 신장암(C 및 D)에 있어서 항LAT3 항체에 의한 LAT3의 면역조직화학적 해석의 결과를 나타낸 사진. A 및 C: 항LAT3 항체에 의한 염색상. B 및 D: 항원 펩티드에 의한 흡수 실험.
도 17은 인간 LAT3와 인간 LAT4의 아미노산 서열의 비교를 나타내는 도면.
도 18은 인간 LAT4와 마우스 LAT4의 아미노산 서열의 비교를 나타내는 도면. 예상되는 막 관통 부위를 굵은선으로 나타냈다. 또, 예상되는 당쇄 부가 부위를 #, cAMP 의존성 인산화 부위를 +, 프로테인키나제 C 의존성 인산화 부위를 *로 나타냈다.
도 19는 마우스 LAT4 유전자의 cRNA를 주입한 난모세포에 의한 류신 수확 실험에 있어서, 첨가하는 염의 영향을 조사한 결과를 나타내는 그래프.
도 20은 마우스 LAT4 유전자의 cRNA를 주입한 난모세포에 의한 류신 수확 실험에 있어서, 계에 글리신 및 각종 L-아미노산을 첨가한 영향을 조사한 결과를 나타내는 그래프.
도 21은 마우스 LAT4 유전자의 cRNA를 주입한 난모세포에 의한 류신 수확 실험에 있어서, 계에 각종 D-아미노산을 첨가한 영향을 조사한 결과를 나타내는 그래프.
도 22는 마우스 LAT4 유전자의 cRNA를 주입한 난모세포에 의한 류신 수확 실험에 있어서, 계에 각종 아미노산 수송계 선택적 억제약을 첨가한 영향을 조사한 결과를 나타내는 그래프.
도 23은 마우스 LAT4 유전자의 cRNA를 주입한 난모세포에 의한 방사능 표지 L-아미노산 및 L-아미노산의 수확을 조사한 결과를 나타내는 그래프.
도 24는 인간의 각 장기 조직에 있어서 LAT4 유전자 mRNA의 발현을 노던 블롯팅에 의해 해석한 결과를 나타낸 도면에 대신하는 사진이다.
도 25는 마우스의 각 장기 조직에 있어서 LAT4 유전자 mRNA의 발현을 노던 블롯팅에 의해 해석한 결과를 나타낸 도면에 대신하는 사진이다.
본 발명의 목적은, 단일 분자로서 나트륨 비의존적으로 분지쇄 중성 아미노산을 수송하는 수송계 L의 기능을 나타내는 트랜스포터 및 그 트랜스포터를 코딩하는 유전자를 제공하는 것에 있다. 그 외의 목적에 대해서는 이하의 기재에 의해 분명하게 될 것이다.
본 발명자들은, 인간 간세포 암세포주 FLC4로부터 추출한 폴리(A)+RNA를 재료로 해서 아후리카트메가엘 난모세포 발현계를 이용한 발현 클로닝을 실시하여, 단일 분자로 분지쇄 중성 아미노산을 수송하는 능력을 발휘하는 수송계 L의 성질을 나타내는 신규 트랜스포터의 유전자를 클로닝하였다. 게다가 그것과 유사한 서열을 갖는 다른 유전자를 EST(expressed sequence tag) 데이터베이스를 이용하여 동정하였다. 이들 유전자의 산물을 아후리카트메가엘의 난모세포에 발현시켜, 그 기능 특성을 분명히 해여 본 발명을 완성하기에 이르렀다.
즉, 본 발명은 이하의 (A) 내지 (H)로부터 선택되는 단백질로서, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 단백질을 제공한다.
(A) 서열번호 2로 나타낸 아미노산 서열로 되는 단백질.
(B) 서열번호 4로 나타낸 아미노산 서열로 되는 단백질.
(C) 서열번호 6으로 나타낸 아미노산 서열로 되는 단백질.
(D) 서열번호 8로 나타낸 아미노산 서열로 되는 단백질.
(E) 서열번호 2로 나타낸 아미노산 서열에서 1 또는 몇 개의 아미노산이 결실, 치환 또는 부가된 아미노산 서열로 되는 단백질.
(F) 서열번호 4로 나타낸 아미노산 서열에서 1 또는 몇 개의 아미노산이 결실, 치환 또는 부가된 아미노산 서열로 되는 단백질.
(G) 서열번호 6으로 나타낸 아미노산 서열에서 1 또는 몇 개의 아미노산이 결실, 치환 또는 부가된 아미노산 서열로 되는 단백질.
(H) 서열번호 8로 나타낸 아미노산 서열에서 1 또는 몇 개의 아미노산이 결실, 치환 또는 부가된 아미노산 서열로 되는 단백질.
또한, 본 발명은 이하의 (a) 내지 (h)로부터 선택되는 DNA로서, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 단백질을 코딩하는 DNA로 되는 유전자를 제공한다.
(a) 서열번호 1로 나타낸 염기서열로 되는 DNA.
(b) 서열번호 3으로 나타낸 염기서열로 되는 DNA.
(c) 서열번호 5로 나타낸 염기서열로 되는 DNA.
(d) 서열번호 7로 나타낸 염기서열로 되는 DNA.
(e) 서열번호 1로 나타낸 염기서열로 되는 DNA와 스트린젠트인 조건하에서 하이브리다이즈하는 DNA.
(f) 서열번호 3으로 나타낸 염기서열로 되는 DNA와 스트린젠트인 조건하에서 하이브리다이즈하는 DNA.
(g) 서열번호 5로 나타낸 염기서열로 되는 DNA와 스트린젠트인 조건하에서 하이브리다이즈하는 DNA.
(h) 서열번호 7로 나타낸 염기서열로 되는 DNA와 스트린젠트인 조건하에서 하이브리다이즈하는 DNA.
서열번호 2로 나타낸 아미노산 서열은, 인간 간세포 암세포주 FLC4 유래의 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터(인간 LAT3)의 아미노산 서열(559 아미노산)을 나타낸다. 그리고, 당해 트랜스포터를 코딩하는 cDNA의 염기서열은 서열번호 1에 나타낸다.
서열번호 4로 나타낸 아미노산 서열은, 마우스 침샘 유래의 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터(마우스 LAT3)의 아미노산 서열(564 아미노산)을 나타낸다. 그리고, 당해 트랜스포터를 코딩하는 cDNA의 염기서열은 서열번호 3에 나타낸다.
서열번호 6으로 나타낸 아미노산 서열은, 인간 태아 뇌 유래의 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터(인간 LAT4)의 아미노산 서열(573 아미노산)을 나타낸다. 그리고, 당해 트랜스포터를 코딩하는 cDNA의 염기서열은 서열번호 5에 나타낸다.
서열번호 8로 나타낸 아미노산 서열은, 마우스 신장 유래의 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터(마우스 LAT4)의 아미노산 서열(568 아미노산)을 나타낸다. 그리고, 당해 트랜스포터를 코딩하는 cDNA의 염기서열은 서열번호 7에 나타낸다.
본 발명에 따른, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 단백질, 즉 아미노산 트랜스포터 LAT3(L-type amino acid transporter 3) 및 LAT4(L-type amino acid transporter 4)는, 류신, 이소류신, 발린 등의 분지쇄 아미노산 및 페닐알라닌을 중심으로 하는 중성 아미노산을 선택적으로 수송하는(수확하는) 능력을 갖는다.
본 발명에 따른, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터 LAT3를 개입시킨 중성 아미노산의 수송은, 분지쇄 아미노산 알코올 및 페닐알라닌올에 의해 강하게 억제된다. 또한, LAT3를 개입시킨 중성 아미노산의 수송은 N-에틸말레이미드에 의해 억제된다.
본 발명에 따른, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터 LAT3는, 인간 체내에 있어서 췌장, 간장, 골격근, 심장, 골수 및 태아 간장에서 강하게 발현하며, 신장, 태반, 폐, 소장, 난소, 정소, 전립선 및 비장에서 약하게 발현하고 있다.
또한, 본 발명에 따른, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터 LAT4는, 인간 체내에 있어서 태반, 신장, 골격근, 뇌, 심장, 비장, 폐, 백혈구, 소장에서 강하게 발현하며, 간장 및 흉선에서 약하게 발현하고 있다.
본 발명은 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터 및 그것을 코딩하는 유전자를 이용하는 발명에 관한 것이다.
즉, 본 발명은 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터를 코딩하는 유전자 또는 당해 유전자 내의 단백질을 코딩하는 유전자를 포함하는 플라스미드, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터를 코딩하는 유전자의 염기서열에 있어서 연속하는 14 염기 이상의 부분 서열 또는 그 상보적 서열을 포함하는 뉴클레오티드, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터에 대한 항체를 제공한다.
본 발명은, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터를 이용하여, 당해 단백질이 갖는 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력에 대한 피검물질의 기질 또는 저해 물질로서의 작용을 검출하는 방법을 제공한다.
더우기 본 발명은, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터, 그 특이항체, 그 기능 촉진 물질 또는 기능 억제 물질, 또는 당해 트랜스포터를 코딩하는 유전자의 안티센스 뉴클레오티드를 이용하여, 당해 단백질이 갖는 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 변조시키는 것에 의해, 정상 세포 또는 종양 세포의 증식을 제어하여, 당해 단백질에 의해 수송되는 약물, 독물, 또는 외래성 이물체내 동태를 변경하거나, 또는 당해 단백질에 의해 수송되는 분지쇄 중성 아미노산의 체내 동태 또는 생체내 대사를 변경하는 방법을 제공한다.
본 발명에 따른, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 단백질로서는, 이하 서열목록의 서열번호 2, 4, 6 또는 8로 나타낸 아미노산 서열을 갖는 단백질을 들 수 있다.
서열번호 2로 나타낸 아미노산 서열을 갖는 단백질은 인간 간세포 암세포주 FLC4 유래의, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터(인간 LAT3)이다.
서열번호 4로 나타낸 아미노산 서열을 갖는 단백질은 마우스 침샘 유래의, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터(마우스 LAT3)이다.
서열번호 6으로 나타낸 아미노산 서열을 갖는 단백질은 인간 태아 뇌 유래의, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터(인간 LAT4)이다.
서열번호 8로 나타낸 아미노산 서열을 갖는 단백질은 마우스 신장 유래의, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터(마우스 LAT4)이다.
본 발명의 단백질로서는 그 밖에, 예를 들어 서열번호 2, 4, 6 또는 8로 나타낸 아미노산 서열에서 1 또는 몇 개의 아미노산의 결실, 치환 또는 부가된 아미노산 서열을 갖는 단백질을 들 수 있다. 아미노산의 결실, 치환 또는 부가는, 아미노산 수송 활성이 없어지지 않는 정도이면 좋고, 서열번호 2에 있어서는 통상 1∼약 111개, 바람직하게는 1∼ 약 56개, 서열번호 4에 있어서는 통상 1∼ 약 113개, 바람직하게는 1∼ 약 57개, 서열번호 6에 있어서는 통상 1∼ 약 115개, 바람직하게는 1∼ 약 57개, 서열번호 8에 있어서는 통상 1∼ 약 114개, 바람직하게는 1∼ 약 57개이다. 이와 같은 단백질은, 서열번호 1 및 서열번호 2로 나타낸 아미노산 서열과 통상 1∼80 %, 바람직하게는 1∼90 %의 아미노산 서열의 상동성(homology)을 갖는다.
서열번호 2에 나타낸 아미노산 서열은, 인간 전립선암에 높게 발현하는 기능 미동정의 서열로서 보고된 POV1[Cole 외, Genomics , 1998년, 제51권, 제2호, p. 282-287]과 동일하였다. 서열번호 4, 6 및 8에 나타낸 아미노산 서열은 보고되어 있지 않은 신규의 것으로 생각된다.
본 발명의, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 단백질을 코딩하는 유전자로는, 이하 서열목록의 서열번호 1, 3, 5 또는 7로 나타낸 염기서열을 갖는 유전자를 들 수 있다.
서열번호 1로 나타낸 염기서열은, 인간 간세포 암세포주 FLC4 유래의, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터(인간 LAT3) 유전자의 전체 길이 cDNA 염기서열(약 2.5 kbp)를 나타낸다.
서열번호 2로 나타낸 염기서열은, 마우스 침샘 유래의, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터(마우스 LAT3) 유전자의 전체 길이 cDNA 염기서열(약 2.5 kbp)를 나타낸다.
서열번호 3으로 나타낸 염기서열은, 인간 태아 뇌 유래의, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터(인간 LAT4) 유전자의 전체 길이 cDNA 염기서열(약 3.3 kbp)를 나타낸다.
서열번호 4로 나타낸 염기서열은, 마우스 신장 유래의, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 아미노산 트랜스포터(마우스 LAT4) 유전자의 전체 길이 cDNA 염기서열(약 3.2 kbp)를 나타낸다.
본 발명의 유전자로서는, 그 밖에 서열번호 1, 3, 5 또는 7로 나타낸 염기서열로 되는 DNA와 스트린젠트인 조건하에서 하이브리다이즈할 수 있는 DNA를 포함하는 것을 들 수 있다. 이와 같이 하이브리다이즈할 수 있는 DNA는, 그 DNA에 코딩되는 단백질이 중성 아미노산을 수송하는 능력을 갖는 것이면 좋다. 이와 같은 DNA는 서열번호 1, 3, 5 또는 7로 나타낸 염기서열과 통상 70 % 이상, 바람직하게는 80 % 이상의 염기서열의 상동성을 가진다. 이와 같은 DNA로는, 자연계에서 발견되는 변이형 유전자, 인위적으로 개변한 변이형 유전자, 이종 생물 유래의 상동 유전자 등이 포함된다.
본 발명에 있어서, 스트린젠트인 조건하에서의 하이브리다이제이션은, 통상 하이브리다이제이션을 5xSSC 또는 이와 동등한 염 농도의 하이브리다이제이션 용액 중, 37-42 ℃의 온도조건 하, 약 12 시간 행하고, 5xSSC 또는 이와 동등한 염 농도의 용액 등으로 필요에 따라 예비 세정을 행한 후, 1xSSC 또는 이와 동등한 염 농도의 용액 중에서 세정을 행하는 것에 의해 실시할 수 있다.
본 발명의 분지쇄 중성 아미노산 및 그 유사 물질을 선택적으로 수송하는 기능을 단일 분자로 발휘하는 나트륨 비의존성 아미노산 트랜스포터의 유전자는, 적당한 포유동물의 조직이나 세포를 유전자 근원으로 이용하여 스크리닝을 실시하는 것에 의해 단리 취득할 수 있다. 포유동물로서는 개, 소, 말, 염소, 양, 원숭이, 돼지, 토끼, 래트 및 마우스 등의 비인간 동물 외에, 인간을 들 수 있다.
유전자의 스크리닝 및 단리는, 발현 클로닝(expression cloning) 등에 의해 바람직하게 실시할 수 있다.
예를 들면, 인간 간세포 암세포주 FLC4를 유전자 근원으로 이용하여, 이로부터 mRNA(폴리(A)+RNA)를 조제한다. 이것을 크기 분획하여, 각 분획에 대해서 아후리카트메가엘 난모세포에 도입한다.
mRNA를 도입한 난모세포에 대해서, 예를 들어 류신 등을 기질로 하여 세포 내로의 기질의 수송(수확)을 측정하여, 높은 수확 활성을 나타낸 mRNA 분획을 선택하는 것에 의해 LAT3의 mRNA를 농축할 수 있다. 이 농축된 mRNA를 기초로 cDNA 라이브러리를 제작한다. 라이브러리의 cDNA로부터 약 500 클론을 1 그룹으로 cRNA(캡화된 것)를 조정하고, 각각의 그룹을 난모세포에 도입하여 기질의 수확 활성을 지표로 하여 양성 그룹을 선택한다. 양성 그룹을 찾아내면, 그것을 한층 더 소그룹으로 나누어 같은 조작을 반복하는 것에 의해, LAT3 유전자의 cDNA를 포함한 클론을 얻을 수 있다.
또한, LAT4의 cDNA 단리는 상동성 클로닝 등에 의해 매우 적합하게 실시할 수 있다.
예를 들어, 인간 태아 뇌 또는 마우스 신장을 유전자 근원으로 하여, 그 mRNA(폴리(A)+RNA)를 이용해서 cDNA 라이브러리를 제작한다. EST(expressed sequence tag) 데이터베이스 검색에 의해 얻을 수 있는 LAT3 유사 서열(예를 들어, GenBankTM/EBI/DDBJ accession No. AW162917)에 상당하는 프로브를 이용하여 cDNA 라이브러리를 스크리닝하는 것에 의해 LAT4 유전자의 cDNA를 포함한 클론을 얻을 수 있다.
얻어진 cDNA에 대해서는, 상법에 의해 염기서열을 결정하고, 번역 영역을 해석하여, 이것에 코딩되는 단백질, 즉, LAT3 또는 LAT4의 아미노산 서열을 결정할 수 있다.
얻어진 cDNA가, 분지쇄 중성 아미노산을 선택적으로 수송하는 단일 분자로 기능을 발휘하는 나트륨 비의존성 아미노산 트랜스포터 유전자의 cDNA인 것, 즉 cDNA에 코딩된 유전자 산물이 분지쇄 중성 아미노산을 선택적으로 수송하는 단일 분자로 기능하는 나트륨 비의존성 아미노산 트랜스포터인 것은, 예를 들어 다음과 같이 검증할 수 있다. 즉, 얻어진 LAT3 유전자 또는 LAT4 유전자의 cDNA로부터 조정한, 이것에 상보적인 RNA(cRNA)(캡화된 것)를 난모세포 내에 도입하여 발현시켜 분지쇄 중성 아미노산을 세포 내로 수송하는(수확하는) 능력을, 적당한 분지쇄 중성 아미노산을 기질로 하는 통상의 수확 시험(Kanai and Hediger, Nature, 제360권, 467-471 페이지, 1992년)에 의해 세포 내로의 기질의 수확을 측정하는 것으로부터 확인할 수 있다.
얻어진 LAT3 유전자 또는 LAT4 유전자의 cDNA로부터 조정한, 이것에 상보적인 RNA(cRNA)를 이용하여, in vitro 번역법[Hediger 등, Biochim . Biophys . Acta , 제1064권, 360 페이지, 1991년]에 의해 LAT3 또는 LAT4 단백질을 합성하고, 전기 영동에 의해 단백질의 크기, 당 부가 유무 등을 검토할 수 있다.
또한, 발현 세포에 대해서는, 동일한 수확 실험을 응용하여 LAT3 또는 LAT4의 특성, 예를 들어, LAT3가 아미노산의 통과촉진 확산형의 수송을 실시한다는 특성이나, LAT3 또는 LAT4의 기질 선택성, pH 의존성 등을 조사할 수 있다.
얻어진 LAT3 유전자 또는 LAT4 유전자의 cDNA를 이용하여 다른 유전자 근원으로부터 제작된 적당한 cDNA 라이브러리 또는 게놈 DNA 라이브러리를 스크리닝하는 것에 의해, 다른 조직, 다른 생물 유래의 상동 유전자나 염색체 유전자 등을 단리할 수 있다.
또한, 개시된 본 발명 유전자의 염기서열(서열번호 1, 3, 5 또는 7에 나타낸 염기서열, 또는 그 일부)의 정보에 근거해서 설계된 합성 프라이머를 이용하여, 통상의 PCR(Polymerase Chain Reaction) 법에 의해 cDNA 라이브러리 또는 게놈 DNA 라이브러리로부터 유전자를 단리할 수 있다.
cDNA 라이브러리 또는 게놈 DNA 라이브러리 등의 DNA 라이브러리는, 예를 들어, 「Molecular cloning」[Sambrook, J., Fritsh, E.F. 및 Manitis, T., Cold Spring Harbor Press에 의해 1989에 발간]에 기재된 방법에 의해 조제할 수 있다. 또는, 시판 라이브러리가 있는 경우는 이것을 이용할 수도 있다.
본 발명의 단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터(LAT3 또는 LAT4)는, 예를 들어, 그것을 코딩하는 cDNA를 이용하여 유전자 재조합 기술에 의해 생산할 수 있다. 예를 들어, LAT3 또는 LAT4를 코딩하는 DNA(cDNA 등)를 적당한 발현벡터에 넣어 얻어진 재조합 DNA를 적당한 숙주세포에 도입할 수 있다. 폴리펩티드를 생산하기 위한 발현계(숙주-벡터계)로서는, 예를 들어 세균, 효모, 곤충 세포 및 포유류 세포의 발현계 등을 들 수 있다. 이 중에서 기능 단백질을 얻기 위해서는 곤충 세포 및 포유류 세포를 이용하는 것이 바람직하다.
예를 들면, 폴리펩티드를 포유류 세포로 발현시키는 경우에는, 단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터 LAT3 또는 LAT4를 코딩하는 DNA를, 적당한 발현벡터(예를 들어, 아데노 바이러스계 벡터, RNA 종양 바이러스계 벡터, 파필로마 바이러스 벡터, 우크시니어 바이러스 벡터, SV40계 벡터 등) 중의 적당한 프로모터(예를 들어, 사이토메갈로 바이러스 프로모터, SV40 프로모터, LTR 프로모터, elongation 1a 프로모터 등)의 하류에 삽입해 발현벡터를 구축한다. 다음에, 얻어진 발현벡터로 적당한 동물세포를 형질전환하고 형질전환체를 적당한 배지에서 배양하는 것에 의해, 목적으로 하는 폴리펩티드가 생산된다. 숙주로 하는 포유동물 세포로서는, 원숭이 COS-7 세포, 차이니즈 햄스터 CHO 세포, 인간 HeLa 세포, 또는 마우스 S2 세포 등의 세포주 등을 들 수 있다.
단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터 LAT3 또는 LAT4를 코딩하는 DNA로서는, 예를 들어, 서열번호 1, 3, 5 또는 7로 나타낸 염기서열을 갖는 cDNA를 이용할 수가 있으며, 이밖에 상기 cDNA 서열로 한정되지 않고 아미노산 서열에 대응하는 DNA를 설계하여 폴리펩티드를 코딩하는 DNA로서 이용할 수도 있다. 이 경우, 하나의 아미노산을 코딩하는 코돈은 각각 1∼6 종류 알려져 있어, 사용하는 코돈을 임의로 선택하여도 좋지만, 예를 들어 발현에 이용하는 숙주의 코돈 사용 빈도를 고려하여, 보다 발현 효율이 높은 서열을 설계할 수가 있다. 설계한 염기서열을 갖는 DNA는, DNA의 화학 합성, 상기 cDNA의 단편화와 결합, 염기서열의 일부 개변 등에 의해 취득할 수 있다. 인위적인 염기서열의 일부 개변, 변이 도입은, 원하는 개변을 코딩하는 합성 올리고 뉴클레오티드로부터 이루어지는 프라이머를 이용해 부위 특이적 변이 도입법(site specific mutagenesis)[Mark, D.F. et al., Proceedings of National Academy of Sciences, 제81권, 제5662페이지(1984년)] 등에 의해 실시할 수 있다.
본 발명의 단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터 또는 이것과 면역학적 동등성을 갖는 폴리펩티드를 이용하여 그 항체를 취득할 수가 있다. 항체는 단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터의 검출이나 정제 등에 이용할 수 있다. 항체는 본 발명의 단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터, 그 단편, 또는 그 부분 서열을 갖는 합성 펩티드 등을 항원으로 이용하여 제조할 수 있다. 폴리클로날 항체는 숙주 동물(예를 들어, 래트나 토끼 등)에 항원을 접종하고 면역 혈청을 회수하는 통상의 방법에 의해 제조할 수가 있고, 모노클로날 항체는 통상의 하이브리도마법 등의 기술에 의해 제조할 수 있다.
본 발명의 단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터 LAT3 또는 LAT4, 그 유전자 및 그 발현 세포는 LAT3 또는 LAT4가 존재하는 세포막이나, LAT3 또는 LAT4가 존재한다고 예상되는 부위에서의 투과 효율에 대한 생체외 시험에 사용할 수 있다. 또한, 단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터 LAT3 또는 LAT4, 그 유전자 및 그 발현 세포는 LAT3 또는 LAT4가 존재하는 세포막이나, LAT3 또는 LAT4가 존재한다고 예상되는 부위를 효율 좋게 투과하는 화합물의 개발에 사용할 수 있다. 게다가, 단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터 LAT3 또는 LAT4, 그 유전자 및 그 발현 세포는 LAT3 또는 LAT4가 존재하는 세포막이나, LAT3 또는 LAT4가 존재한다고 예상되는 부위에서의 약물간 상호작용의 생체외 시험에 사용할 수 있다.
본 발명의 단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터 LAT3 또는 LAT4를 억제하는 것에 의해, LAT3 또는 LAT4를 발현하는 세포막이나, LAT3 또는 LAT4가 존재한다고 예상되는 부위의 특정 화합물의 투과를 제한할 수가 있다. 또한, 본 발명의 단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터 LAT3 또는 LAT4, 그 유전자 및 그 발현 세포는 LAT3 또는 LAT4에 의해 수송되는 화합물의 세포막 통과나, LAT3 또는 LAT4가 존재한다고 예상되는 부위의 투과를 제한하는 약물(LAT3 또는 LAT4의 특이적 저해제 등)의 개발에 사용할 수 있다.
본 발명의 단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존 트랜스포터 LAT3 또는 LAT4, 그 유전자 및 그 발현 세포는 LAT3 또는 LAT4를 억제하는 것에 의해, LAT3 또는 LAT4를 고레벨에 발현하는 세포의 증식 억제 효과의 생체외 시험에 사용할 수 있다. LAT3 또는 LAT4의 억제의 목적으로는, 그 억제약을 사용하거나, 또는 안티센스 올리고 DNA나 특이 항체를 사용할 수 있다.
또한, 본 발명의 단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존 트랜스포터 LAT3 또는 LAT4, 그 유전자 및 그 발현 세포를 이용하여, 종양 세포 등의 LAT3 또는 LAT4를 고레벨로 발현하는 세포의 증식을 억제하는 목적으로 사용하는 LAT3 또는 LAT4의 기능 억제약이나 기능 억제 작용을 갖는 모노클로날 항체를 개발할 수가 있다.
한편, 일본특허출원 2003-062379 명세서에 기재된 내용은 본 명세서에 모두 도입된다.
실시예
다음 실시예에 의해 본 발명을 보다 상세하게 설명하지만, 본 발명이 이들 실시예만으로 한정되는 것은 아니다.
또한, 다음 실시예에 있어서, 각 조작은 특히 명시가 없는 한 「Molecular Cloning」[Sambrook, J., Fritsh, E.F. 및 Manitis, T., Cold Spring Harbor에서 1989년 발간]에 기재된 방법에 의해 실시하며, 시판 시약이나 키트를 이용하는 경우에는 시판품의 지시서에 따라서 사용하였다.
실시예 1: 단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터 LAT3의 인간 cDNA의 클로닝
(1) 인간 간세포암 유래 세포주 FLC4로부터의 발현 클로닝
金井 등의 방법(Kanai and Hediger, Nature, 제360권, 467-471페이지, 1992년)에 준하여, 발현 클로닝법에 따라 다음과 같이 시행하였다.
겔 전기 영동에 의해 인간 간세포 암 세포주 FLC4 유래 폴리(A)+RNA 400 ㎍을 분획하였다.
분획에 의해 얻어진 각 분획을 아후리카트메가엘 난모세포에 주입하여 3 일간 배양하였다.
RNA 주입한 난모세포에 대하여, 기질로서 류신을 이용해서 기질의 수확 실험을 金井 등의 방법(Kanai and Hediger, Nature, 제360권, 467-471페이지, 1992년)에 준하여 다음과 같이 시행하였다. 기질로서 14C-L-류신(100 μM)을 포함한 Na+ 비함유 수확용 용액[100 mM 염화콜린, 2 mM 염화칼륨, 1.8 mM 염화칼슘, 1 mM 염화마그네슘, 5 mM HEPES, pH 7.4] 중에서 30 분간 난모세포를 배양하고 세포 내에 도입된 방사능의 카운트로 기질의 수확율을 측정하였다. 이 계에 있어서, 인간 간세포종 유래 세포주 FLC4의 폴리(A)+RNA(mRNA)를 주입한 난모세포를 대조로 하여, 물을 주입한 난모세포와 비교하여 류신의 수확 항진을 볼 수 있었다(도 1).
크기 분획에 의해 얻어진 각 RNA 분획 중, RNA를 주입한 난모세포가 가장 높은 류신의 수확율을 나타낸 분획을 선택하였다(도 1). 이 분획의 폴리(A)+RNA(2.2∼2.7 kb)에 대하여, cDNA 합성 및 핵외 유전자 클로닝용 키트(상품명: Superscript Plasmid System, Gibco사)을 사용해서 cDNA 라이브러리를 작성하였다. 이들 DNA는 플라스미드 pSPORT1(Gibco사)의 제한효소 SalI 및 NotI 인식 부위에 도입하고, 얻어진 재조합 플라스미드 DNA를 대장균 DH10B 주의 competent cell(상품명: Electro Max DH10B Competent Cell, Gibco사)에 도입하였다. 얻어진 형질전환체를 니트로셀룰로스막 상에서 배양하여 1 플레이트 당 약 500 개의 콜로니를 얻을 수 있었다. 이들 콜로니로부터 플라스미드 DNA를 조제하고, 이들을 제한효소 NotI로 절단하였다. 얻어진 DNA를 이용하여, in vitro 전사에 의해 캡화된 cRNA를 합성하였다.
얻어진 cRNA(약 50 ng)를 난모세포에 주입하였다. 이들 난모세포에 대하여 상기와 같이 하여 류신 수확 실험을 행하는 것에 의해 양성 클론의 스크리닝을 실시하였다. 스크리닝의 경우에는, 복수의 클론으로부터 추출한 DNA를 풀한 그룹에 대하여 조사하고, 어느 그룹에서 류신 수확이 확인될 경우 그것을 복수의 그룹으로 더욱 분할하여 한층 더 스크리닝을 실시하였다.
얻어진 클론, 즉 인간 분지쇄 중성 아미노산 트랜스포터 LAT3의 cDNA를 포함하는 클론에 대해서, 염기서열 결정을 위한 합성 프라이머를 이용하여 다이 터미네이터 사이클 시퀀싱법(Applied Biosystems사)에 의해 cDNA의 염기서열을 결정하였다.
이에 의해, 인간 LAT3 유전자의 염기서열을 얻을 수 있었다. 또한, cDNA의 염기서열을 상법에 의해 해석하여 cDNA의 번역 영역과 그곳에 코딩된 LAT3의 아미노산 서열을 결정하였다.
이 서열을, 서열목록의 서열번호 2로 나타냈다.
인간 LAT3는 인간 전립선암에 고발현하는 기능 미동정의 서열로서 보고된 POV1[Cole 외, Genomics, 1998년, 제51권, 제2호, p. 282-287]과 동일한 아미노산 서열을 나타냈다.
TopPred2 알고리즘[Gunnar von Heijne, J. Mol . Biol . 225, 487-494 (1992)]에 의해 LAT3의 아미노산 서열을 해석한 결과, 도 2에 나타낸 바와 같이 12 개의 막관통 영역(membrane-spanning domain)이 예상되었다. 또한, 제 1 막관통 부위와 제 2 막관통 부위 사이의 세포외 루프에는 당 부가 부위, 제 6 막관통 부위와 제 7 막관통 부위 사이의 긴 세포내 루프에는 2 개의 프로테인키나제 C 의존성 인산화 부위 및 1 개의 타이로신 인산화 부위, 제 8 막관통 부위와 제 9 막관통 부위 사이의 세포내 루프에는 1 개의 프로테인키나제 C 의존성 인산화 부위라고 생각되는 부위가 있었다(도 2).
(2) 인간의 여러 조직에서의 LAT3 유전자의 발현(노던 블롯팅에 의한 해석)
인간 LAT3 유전자의 제1790-1936번째 염기에 상당하는 cDNA 단편을 32P-dCTP로 표지하고 이것을 프로브로서 이용하여, 인간의 여러 조직으로부터 추출한 폴리(A)+RNA를 포함한 Multiple Tissue Northern Blots(Human, Clontech사)에 대하여, 노던 하이브리다이제이션을 이하와 같이 행하였다. 이 필터막을 42 ℃에서 32P-dCTP로 표지한 LAT3 cDNA 단편을 포함하는 하이브리다이제이션액으로 하룻밤 하이브리다이제이션을 실시하였다. 필터를 65 ℃에서 0.1% SDS를 포함하는 0.1xSSC로 세정하였다.
노던 블롯팅의 결과(도 3), 췌장, 간장, 골격근, 심장, 골수, 및 태아 간장에서 강하게 발현하고, 신장, 태반, 폐, 소장, 난소, 정소, 전립선, 및 비장에서 약하게 발현하고 있는 것으로 나타났다.
실시예 2: 단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터 LAT3의 마우스 cDNA의 동정
인간 LAT3 번역 영역의 염기서열을 이용한 EST(expressed sequence tag) 데이터베이스 검색에 의해 얻어진 인간 LAT3와 유사한 마우스 침샘 유래의 염기서열(GenBankTM/EBI/DDBJ accession No. BG865268)에 상당하는 cDNA 클론을 IMAGE (Integrated and Molecular Analysis of Genomes and their Expression)에서 구입하고(IMAGE clone I.D.: 4910149), 염기서열 결정을 위한 합성 프라이머를 이용하여 다이 터미네이터 사이클 시퀀싱법(Applied Biosystems사)에 의해 cDNA 전체 길이의 염기서열을 결정하였다. 또한, cDNA의 염기서열을 상법에 의해 해석하여 cDNA의 번역 영역과 그곳에 코딩되는 단백질의 아미노산 서열을 결정하였다.
이 서열을, 서열목록의 서열번호 4로 나타냈다.
마우스 LAT3와 인간 LAT3의 아미노산 서열의 비교를 도 2에 나타냈다. 마우스 LAT3와 인간 LAT3의 아미노산 서열은 82%의 상동성을 가지고 있었다.
실시예 3: 단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터 LAT3의 특징
(1) 인간 LAT3의 메가엘 난모세포에의 기능 발현
인간 LAT3의 cDNA를 포함하는 발현 플라스미드 벡터 pSPORT1를 제한효소 NotI로 절단하고, T7RNA 폴리머라제를 이용하여 cRNA(cDNA에 상보적인 RNA)를 조제하였다.
인간 LAT3 유전자 cRNA 25 ng을 난모세포에 주입하는 것에 의해 발현시켜 3 일간 배양하였다.
류신의 수확 실험은, 상기 실시예 1(1) 기재 방법에 준하여 다음과 같이 행하였다. 즉, 인간 LAT3 유전자 cRNA, 또는 대조로서 물을 주입한 난모세포를, 14C-L-류신(100 μM)을 포함하는 Na+ 비함유 수확용 용액(실시예 1(1) 참조) 중에서 10 분 배양하고 세포 내로의 방사능의 수확을 측정하였다.
그 결과(도 4), 대조로서 물을 주입한 난모세포에 비해, LAT3를 발현시킨 난모세포에서 류신의 큰 수확을 얻을 수 있었다. 이미 보고되어 있는 수송계 L 트랜스포터 LAT1 및 LAT2는, 그 기능 발현에 1회 막관통형 보조인자 4F2hc와 공존할 것이 요구되지만, LAT3는 4F2hc를 필요로 하지 않고 단독으로 기능을 발휘하였다.
(2) 인간 LAT3의 수송 활성의 염 의존성
인간 LAT3 유전자 cRNA를 주입한 난모세포에 의한 류신 수확 실험에서 배지에 첨가하는 염의 영향을 조사하였다. 류신의 수확 실험은, 인간 LAT3 유전자 cRNA를 주입한 난모세포를 이용하여 상기 실시예 3(1) 기재 방법에 준하여 실시하였다.
수확용 용액은, 나트륨 이온의 영향을 보는 경우 표준 수확용 용액 대신 Na+ 비함유 수확용 용액을 이용하였다. 염소 이온의 영향을 보는 경우는 표준 수확용 용액 대신 Cl- 비함유 수확용 용액(표준 수확용 용액의 Cl-을 글루코네이트로 대체한 것)을 이용하였다.
그 결과(도 5), 세포외 나트륨을 콜린으로 대신하여도, 세포외 염소 이온을 글루코네이트로 바꾸어도, 류신 수확에 어떤 영향을 주지 않았다. 이것으로부터, LAT3는 나트륨 이온 및 염소 이온에 비의존적으로 작용하는 트랜스포터인 것으로 나타났다.
(3) 인간 LAT3의 동력학 시험
분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터 LAT3의 동력학 시험을 실시하였다. 기질 류신의 농도의 차이에 의한 류신 수확율의 변화를 조사하는 것에 의해, LAT3의 동력학 시험을 실시하였다.
류신의 수확 실험은, 류신 농도 1, 3, 10, 30, 60, 100, 200, 400, 1000, 2000, 3000 μM에서, 인간 LAT3 유전자 cRNA를 주입한 난모세포를 이용하여 상기 실시예 3(1) 기재 방법에 준하여 실시하였다. 그 결과(도 6), 류신의 수확은 농도 의존적인 포화성의 수확을 나타내어, 트랜스포터를 개입시키는 수송인 것이 확인되었다. 더우기, LAT3를 개입시키는 류신의 수송은 고친화성 성분과 저친화성 성분으로 되는 것으로 밝혀졌다(도 6 삽입도).
(4) 인간 LAT3의 기질 선택성(아미노산 및 그 유사 물질 첨가에 의한 저해 실험)
인간 LAT3 유전자 cRNA를 주입한 난모세포에 의한 류신의 수확 실험에서, 계로의 각종 아미노산 및 그 유사 물질 첨가의 영향을 조사하였다.
류신의 수확 실험은, 인간 LAT3 유전자 cRNA를 주입한 난모세포를 이용하여 상기 실시예 3(1) 기재 방법에 준하여 실시하였다. 단, Na+ 비함유 수확용 용액을 이용하여 10 mM의 각종 화합물(비표지) 존재하 및 비존재하에서 14C-류신(100 μM)의 도입을 측정하였다.
그 결과(도 7), 이소류신, 발린, 페닐알라닌, 메티오닌에서 강한 cis-저해 효과가 관찰되었다. 산성 아미노산(아스파라긴산, 글루타민산), 염기성 아미노산(리진, 아르기닌) 및 프롤린은 LAT3를 개입시키는 14C-류신의 수확에 영향을 주지 않았다.
D-아미노산 가운데 D-류신에 의해, LAT3를 개입시키는 14C-류신의 수확의 비교적 강한 억제 효과를 얻을 수 있었다(도 8).
수송계 특이적 억제약인 BCH(2-aminobicyclo-(2,2,1)-heptane-2-carboxylic acid), AIB(α-aminoisobutyric acid), MeAIB(α-(aminomethyl)isobutyric acid)의 효과를 조사하였고, LAT3를 개입시키는 14C-류신의 수확은 수송계 L 특이적 억제약 BCH 보다 강하게 억제되어 LAT3가 수송계 L 트랜스포터인 것으로 나타났다(도 9).
LAT3를 개입시키는 14C-류신의 수확은, 류신올로 강하게 억제되었다(도 10). 또, 발린올, 페닐알라닌올도 비교적 강한 14C-류신의 수확 억제 효과를 나타냈다(도 10). 이소펜틸아민, 1,3-디메틸-n-부틸아민, 류신-메틸에스테르, N-아세틸류신, 이소부틸아민, 페닐에틸아민도 유의적인 억제 효과를 나타냈다(도 10).
LAT3를 개입시키는 14C-류신의 수확에 대한 각종 음이온성 화합물의 영향을 검토하였다. 그 결과(도 11), 오크라톡신 A, 인도메타신에 의한 강한 억제 효과가 관찰되었다. 또한, 프로베네시드 및 살리실산도 약하면서 유의적인 억제 효과를 나타내었다.
(5) 인간 LAT3의 기질 선택성(각종 아미노산 및 그 유사 물질을 기질로 하는 수확 시험)
각종 아미노산 및 그 유사 물질을 기질로 하여 LAT3에 의한 수확을 조사하였다.
각종 아미노산 및 그 유사 물질의 수확 실험은, 인간 LAT3 유전자 cRNA를 주입한 난모세포를 이용하여 상기 실시예 3(1) 기재 방법에 준하여 실시하였다. 단, 기질로서는 14C-류신으로 바꾸어 방사능 표지된 각종의 화합물을 이용하였다.
그 결과(도 12), L-류신(14C 화합물), L-이소류신(14C 화합물), L-발린(14C 화합물), L-페닐알라닌(14C 화합물)을 기질로 하였을 경우에, 난모세포로의 큰 수확이 인정되었다. 또한, L-메티오닌(14C 화합물), L-타이로신(14C 화합물), L-프롤린(14C 화합물)을 기질로 하였을 경우, 난모세포로의 작으면서 유의적인 수확이 인정되었다. D-류신(14C 화합물)을 기질로 하였을 경우에도, 난모세포로의 유의적인 수확이 인정되었다. 오크라톡신 A는 LAT3를 개입시키는 14C-류신의 수확을 강력하게 억제하였지만, 오크라톡신 A(14C 화합물)는 LAT3에 의해 수송되지 않았다.
(6) 인간 LAT3의 수송 활성의 pH 의존성
인간 LAT3 유전자 cRNA를 주입한 난모세포에 의한 류신 수확 실험에 있어서 pH의 영향을 조사하였다.
류신의 수확 실험은 인간 LAT3 유전자 cRNA를 주입한 난모세포를 이용하여 상기 실시예 3(1) 기재 방법에 준하여 실시하였다.
그 결과, 류신 수확에는 pH 7.0∼8.5로 안정된 값을 나타내는 생리학적 pH가 본 트랜스포터의 적정 pH로 생각되었다(도 13).
(7) 인간 LAT3를 개입시키는 아미노산의 방출 시험
인간 LAT3 유전자 cRNA를 주입한 난모세포에 있어서, 전 부하된 14C-류신의 LAT3를 개입시키는 방출을 조사하였다.
인간 LAT3 유전자 cRNA를 주입한 난모세포에 100 nℓ의 400 μM 14C-류신(2 nCi)을 주입하고, 빙냉의 류신을 포함하지 않는 Na+ 비함유 수확용 용액으로 세정한 후, 실온(18∼22 ℃)의 류신(1 mM) 첨가 또는 미첨가의 Na+ 비함유 수확용 용액으로 옮겨, 세포외로 방출되는 14C-류신의 양을 측정하였다. 또한, 대조로서 인간 LAT3 유전자 cRNA 대신 물을 주입한 난모세포에도 마찬가지로 100 nℓ의 400 μM 14C-류신(2 nCi)을 주입하고, 동일하게 시행하여 세포외로 방출되는 14C-류신의 양을 측정하였다.
그 결과, 인간 LAT3에 있어서는 세포외에 류신을 첨가하지 않은 경우에도 14C-류신의 유의적인 방출이 관찰되고, 그 방출은 세포외에 류신을 첨가하는 것에 의해 약간 상승하였지만, 큰 변화는 없었다(도 14). 이에 대하여, 대조로서 인간 LAT3 유전자 cRNA 대신 물을 주입한 난모세포에 있어서는, 세포외 류신 첨가 유무에 관계없이 14C-류신의 유의적인 방출은 관찰되지 않았다(도 14). 따라서, LAT3는 약간의 교환수송 모드를 포함할 가능성을 남기며, 대부분 통과촉진 확산형 수송을 매개하는 트랜스포터인 것으로 결론내렸다.
(8) N-에틸말레이미드의 영향
인간 LAT3 유전자 cRNA를 주입한 난모세포에 있어서, 14C-류신의 수확에 대한 N-에틸말레이미드의 영향을 검토하였다.
인간 LAT3 유전자 cRNA를 주입한 난모세포, 인간 LAT3 유전자 cRNA와 4F2hc 유전자 cRNA를 주입한 난모세포, 또는 대조로서 물을 주입한 난모세포를, 14C-L-류신(100 μM)을 포함한 Na+ 비함유 수확용 용액(실시예 3(2) 참조) 중에서 10 분간 배양하고, 실시예 3(1) 기재 방법에 준하여 세포내로의 방사능의 수확을 측정하였다. 이 경우, 5 mM의 N-에틸말레이미드의 15 분간 전처리, 및 수확용 용액중 5 mM N-에틸말레이미드 함유 유무가, 14C-L-류신 수확량에 미치는 영향을 검토하였다.
그 결과, N-에틸말레이미드 전처치에 의해, LAT3에 의한 14C-L-류신의 수확은 거의 완전하게 억제되었다(도 15). 이 N-에틸말레이미드의 효과는 수확용 용액 중 N-에틸말레이미드 존재의 유무에 의한 것이 아니었다. 이에 대하여, LAT1에 의한 14C-L-류신 수확은 N-에틸말레이미드에 의해 영향을 받지 않았다(도 15).
(9) 인간 전립선암 및 인간 신암에 있어서의 LAT3의 발현.
상법에 따라 인간 전립선암 및 인간 신암의 외과수술 적출 표본의 파라핀 절편을 친화성(affinity) 정제 항LAT3 항혈청(2 ㎍/㎖)으로 처리한 후, 디아미노벤지딘으로 발색시켰다. 또한, 염색의 특이성을 검토하는 목적으로, 200 ㎍/㎖의 항원 펩티드 존재하에서 친화성 정제 항LAT3 항혈청(2 ㎍/㎖)으로 처리하는 실험도 행하였다.
그 결과, 인간 전립선암(도 16a) 및 인간 신암(도 16c)에서는, 종양 세포에 일치하여 LAT3의 염색을 볼 수 있었다. 이 염색은, 항원 펩티드의 존재하에서 항LAT3 항체를 작용시켰을 경우에는 검출되지 않고, 염색의 특이성이 나타났다(도 16b 및 d).
(10) 마우스 LAT3의 기능 확인
실시예 2에 의해 얻어진 마우스 LAT3의 cDNA를 NotI로 절단하고 SP6RNA 폴리머라제를 이용하여 cRNA를 조제하였다. 마우스 LAT3 유전자 cRNA를 난모세포에 발현시켜 14C-류신의 수확을 측정하였다.
마우스 LAT3 유전자 cRNA 25 ng를 난모세포에 주입하는 것에 의해 발현시키고 3 일간 배양하였다. 마우스 LAT3 유전자 cRNA를 주입한 난모세포에 대해서, 기질로서 류신을 이용하여 기질의 수확 실험을 실시예 3(1)에 준하여 행하였다.
그 결과, 류신의 수확은 인간 LAT3와 같이, 마우스 LAT3를 발현시킨 난모세포에서는 대조로서 물을 주입한 난모세포에 비해 큰 류신의 수확이 관찰되었다. 게다가, 마우스 LAT3도 인간 LAT3와 같은 기질 선택성을 나타내는 것으로 나타났다.
실시예 4: 단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터 LAT4의 인간 및 마우스 cDNA의 동정
(1) LAT4 cDNA 의 동정
인간 LAT3의 번역 영역의 염기서열을 이용한 EST(expressed sequence tag) 데이터베이스의 검색에 의해 얻어진, 인간 LAT3와 유사한 인간 태아 뇌 유래의 염기서열(GenBankTM/EBI/DDBJ accession No. AW162917)에 상당하는 cDNA 클론(IMAGE clone I.D.: 2783525), 및 인간 LAT3와 유사한 마우스 신장 유래의 염기서열(GenBankTM/EBI/DDBJ accession No. AW106550)에 상당하는 cDNA 클론(IMAGE clone I.D.: 2235970)을 IMAGE(Integrated and Molecular Analysis of Genomes and their Expression)으로부터 구입하고, 염기서열 결정을 위한 합성 프라이머를 이용하여 다이 터미네이터 사이클 시퀀싱법(Applied Biosystems사)에 의해, cDNA 전체 길이의 염기서열을 결정하였다. 또한, cDNA의 염기서열을 상법에 의해 해석하여 cDNA의 번역 영역과 그곳에 코딩되는 단백질의 아미노산 서열을 결정하였다.
이 인간 서열을 서열목록의 서열번호 3으로, 마우스 서열을 서열목록의 서열번호 4로 나타냈다.
인간 LAT3와 인간 LAT4의 아미노산 서열의 비교를 도 17에 나타냈다. 인간 LAT3와 인간 LAT4의 아미노산 서열은 58 %의 상동성을 가지고 있었다.
인간 LAT3와 마우스 LAT4의 아미노산 서열의 비교를 도 18에 나타냈다. 인간 LAT3와 마우스 LAT4의 아미노산 서열은 90 %의 상동성을 가지고 있었다.
(2) 인간 및 마우스의 여러 조직에 있어서 LAT4 유전자의 발현(노던 블롯팅에 의한 해석)
인간 LAT4 유전자의 제307-1012번째의 염기에 상당하는 cDNA 단편을 32P-dCTP로 표지하고 이것을 프로브로 이용하여, 인간의 여러 조직으로부터 추출한 폴리(A)+RNA를 포함하는 Multiple Tissue Northern Blots(Human, Clontech사)에 대하여, 노던 하이브리다이제이션을 다음과 같이 행하였다. 이 필터막을 42 ℃에서 32P-dCTP로 표지한 LAT4 cDNA 단편을 포함하는 하이브리다이제이션액으로 하룻밤 하이브리다이제이션을 실시하였다. 필터를 65 ℃에서 0.1% SDS를 포함하는 0.1xSSC로 세정하였다.
노던 블롯팅의 결과(도 24), 태반, 신장, 및 골격근에서 강하게 발현하고, 백혈구, 뇌, 심장, 비장, 소장, 폐, 및 대장에서 약하게 발현하며, 흉선, 및 간장에서 한층 더 약하게 발현하고 있는 것으로 나타났다.
마우스 LAT4 유전자의 제122-525번째 염기에 상당하는 cDNA 단편을 32P-dCTP로 표지하고 이것을 프로브로 이용하여, 마우스의 여러 조직으로부터 추출한 RNA에 대해서 노던 블롯팅을 다음과 같이 행하였다. 3 ㎍의 폴리(A)+RNA를 1% 아가로스/포름알데히드 겔로 전기영동한 후, 니트로셀룰로스 필터에 옮겼다. 이 필터를 42 ℃에서 32P-dCTP로 표지한 마우스 LAT4 cDNA 단편을 포함하는 하이브리다이제이션액으로 하룻밤 하이브리다이제이션을 실시하였다. 필터를 65 ℃에서 0.1% SDS를 포함하는 0.1xSSC로 세정하였다.
노던 블롯팅 결과(도 25), 신장, 태반, 뇌, 소장에서 강하게 발현하는 것으로 나타났다.
실시예 5: 단일 분자로 기능하는 분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터 LAT4의 특징
(1) 마우스 LAT4의 메가엘 난모세포에서의 기능 발현
마우스 LAT4의 cDNA를 포함하는 발현 플라스미드 벡터 pcDNA3.1(+)을 제한효소 XbaI로 절단하고, T7 RNA 폴리머라제를 이용하여 cRNA(cDNA에 상보적인 RNA)를 조제하였다.
마우스 LAT4 유전자 cRNA 25 ng을 난모세포에 주입하는 것에 의해 발현시키고 3 일간 배양하였다.
류신의 수확 실험은 상기 실시예 3(1) 기재 방법에 준하여 다음과 같이 행하였다. 즉, 마우스 LAT4 유전자 cRNA, 또는 대조로서 물을 주입한 난모세포를 14C-L-류신(100 μM)을 포함하는 Na+비함유 수확용 용액(실시예 3(1) 참조) 중에서 10 분간 배양하여 세포내 방사능의 수확을 측정하였다.
그 결과, 대조로서 물을 주입한 난모세포에 비해 LAT4를 발현시킨 난모세포에서 류신의 큰 수확을 얻을 수 있었다. LAT3와 마찬가지로, 또한 벌써 보고되어 있는 수송계 L 트랜스포터 LAT1 및 LAT2와 달리, LAT4는 4F2hc를 필요로 하지 않고 단독으로 기능을 발휘하였다.
(2) 마우스 LAT4의 수송 활성의 염 의존성
마우스 LAT4 cRNA를 주입한 난모세포에 의한 류신 수확 실험에서 배지에 첨가하는 염의 영향을 조사하였다. 류신의 수확 실험은, 마우스 LAT4 유전자 cRNA를 주입한 난모세포를 이용하여 상기 실시예 3(1) 기재 방법에 준해 실시하였다.
수확용 용액은, 나트륨 이온의 영향을 보는 경우, 표준 수확용 용액 대신 Na+ 비함유 수확용 용액을 이용하였다. 염소 이온의 영향을 보는 경우는, 표준 수확용 용액 대신 Cl- 비함유 수확용 용액(표준 수확용 용액의 Cl-를 글루코네이트로 대체한 것)을 이용하였다.
그 결과(도 19), 세포외 나트륨을 콜린으로 대체하여도, 세포외 염소 이온을 글루코네이트로 바꾸어도, 류신 수확에 어떤 영향을 주지 않았다. 이로부터, LAT4는 나트륨 이온 및 염소 이온에 비의존적으로 작용하는 트랜스포터인 것으로 나타났다.
(3) 마우스 LAT4의 동력학 시험
분지쇄 중성 아미노산을 선택적으로 수송하는 나트륨 비의존성 아미노산 트랜스포터 LAT4의 동력학 시험을 실시하였다. 기질 류신의 농도 차이에 의한 류신 수확율의 변화를 조사하는 것에 의해 LAT3의 동력학 시험을 실시하였다.
류신의 수확 실험은, 류신 농도 0.01, 0.03, 0.1, 0.3, 1, 3, 10 mM에서, 마우스 LAT4 cRNA를 주입한 난모세포를 이용하여 상기 실시예 3(1) 기재 방법에 준하여 실시하였다. 그 결과, 류신의 수확은 농도 의존적인 포화성 수확을 나타내어, 트랜스포터를 개입시키는 수송인 것으로 확인되었다. 더우기, LAT4를 개입시키는 류신의 수송은 LAT3를 개입시키는 류신의 수송과 마찬가지로, 고친화성 성분과 저친화성 성분으로 되는 것으로 밝혀졌다.
(4) 마우스 LAT4의 기질 선택성(아미노산 및 그 유사 물질 첨가에 의한 저해 실험)
마우스 LAT4 유전자 cRNA를 주입한 난모세포에 의한 류신의 수확 실험에서, 계에 각종 아미노산 및 그 유사 물질을 첨가하는 영향을 조사하였다.
류신의 수확 실험은, 마우스 LAT4 유전자 cRNA를 주입한 난모세포를 이용하여 전기 실시예 3(1) 기재 방법에 준하여 실시하였다. 단, Na+ 비함유 수확용 용액을 이용하여 10 mM의 각종 화합물(비표지)의 존재하 및 비존재하에서, 14C-류신(100 μM)의 수확을 측정하였다.
그 결과(도 20), 이소류신, 발린, 페닐알라닌, 메티오닌에서 강한 cis-저해 효과가 관찰되었다. 산성 아미노산(아스파라긴산, 글루타민산), 염기성 아미노산(리진, 아르기닌) 및 프롤린은 LAT4를 개입시키는 14C-류신의 수확에 영향을 주지 않았다.
D-아미노산 중 D-류신, D-히스티딘, D-메티오닌에 의해, LAT4를 개입시키는 14C-류신 수확의 비교적 강한 억제 효과를 얻을 수 있었다(도 21).
수송계 특이적 억제약인 BCH(2-aminobicyclo-(2,2,1)-heptane-2-carboxylic acid), AIB(α-aminoisobutyric acid), MeAIB(α-(aminomethyl)isobutyric acid)의 효과를 조사한 결과, LAT4를 개입시키는 14C-류신의 수확은 수송계 L 특이적 억제약 BCH보다 강하게 억제되어 LAT4가 수송계 L 트랜스포터인 것으로 나타났다(도 22).
(5) 마우스 LAT4의 기질 선택성(각종 아미노산 및 그 유사 물질을 기질로 하는 수확 시험)
각종 아미노산 및 그 유사 물질을 기질로하여 LAT4에 의한 수확을 조사하였다.
각종 아미노산 및 그 유사 물질의 수확 실험은, 마우스 LAT4 유전자 cRNA를 주입한 난모세포를 이용하여 전기 실시예 3(1) 기재 방법에 준하여 실시하였다. 단, 기질은 14C-류신으로 바꾸어 방사능 표지된 각종 화합물을 이용하였다.
그 결과(도 23), L-류신(14C 화합물), L-이소류신(14C 화합물), L-발린(14C 화합물), L-페닐알라닌(14C 화합물), L-메티오닌(14C 화합물)을 기질로 하였을 경우, 난모세포로의 큰 수확이 인정되었다. D-류신(14C 화합물)을 기질로 하였을 경우도, 난모세포로의 유의적인 수확이 인정되었다.
(6) 인간 LAT4의 기능의 확인
실시예 4에서 얻어진 인간 LAT4의 cDNA를 XhoI로 절단하고, T3 RNA 폴리머라제를 이용하여 cRNA를 조제하였다. 인간 LAT4 유전자 cRNA를 난모세포에 발현시키고 14C-류신의 수확을 측정하였다.
인간 LAT4 유전자 cRNA 25 ng를 난모세포에 주입하는 것에 의해 발현시키고 3 일간 배양하였다. 인간 LAT4 유전자 cRNA를 주입한 난모세포에 대해서, 기질로 류신을 이용하여 기질의 수확 실험을 실시예 3(1)에 준하여 행하였다.
그 결과, 류신의 수확은 마우스 LAT4와 마찬가지로, 인간 LAT4를 발현시킨 난모세포에서 대조로서 물을 주입한 난모세포에 비해 큰 류신의 수확이 관찰되었다. 게다가, 인간 LAT4도 마우스 LAT4와 같은 기질 선택성을 나타내는 것으로 나타났다.
본 발명의 단일 분자로 기능하는 분지쇄 중성 아미노산 트랜스포터는, 해당 트랜스포터의 발현장소에서 분지쇄 중성 아미노산 및 약물이나 외래성 이물도 포함하는 아미노산 유사 화합물 수송의 생체외에서의 검토, 또는 이를 기본으로 하는 이들 화합물의 체내 동태의 생체외에서의 예측을 가능하게 한다. 게다가 해당 트랜스포터의 발현장소를 효율 좋게 투과하는 약물의 개발에 유용한 것으로 생각된다. 또한, 본 발명의 단일 분자로 기능하는 분지쇄 중성 아미노산 트랜스포터는, 해당 트랜스포터가 갖는 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 변조시키는 것에 의해, 아미노산 대사를 변조시키는 방법, 정상세포 및 종양세포의 세포증식을 제어하는 방법의 개발에 이용할 수 있다. 또한, 해당 트랜스포터는 종양 항원으로서, 종양세포와 정상세포를 구별하는 수단으로서 이용할 수 있다.
<110> HUMAN CELL SYSTEMS, INC.
<120> BRANCHED NEUTRAL AMINO ACID TRANSPORTERS ACTING AS SINGLE
MOLECULE
<130> PI051274/PCT/JP
<150> JP2003-062379
<151> 2003-03-07
<160> 8
<170> KopatentIn 1.71
<210> 1
<211> 2525
<212> DNA
<213> Homo sapiens
<220>
<221> CDS
<222> (257)..(1933)
<400> 1
gcttcgcaga cctctggcgc ccggcgggtt cccagttccc ccgcttcttc cgaggagaca 60
gcggaggcga ggccaccggg ctgtcaggct gaagctccgt ggcggccggg tcctgcacgc 120
agagaagacc ccagcgccgg cgcggctcag ggctgggccc acgggactcc ggacgcgccg 180
cgaaagcgtt gcgctcccgg aggcgtccgc agctgctggc tgctcatttg ccggtgaccg 240
gaggctcggg gccagc atg gcc ccc acg ctg caa cag gcg tac cgg agg 289
Met Ala Pro Thr Leu Gln Gln Ala Tyr Arg Arg
1 5 10
cgc tgg tgg atg gcc tgc acg gct gtg ctg gag aac ctc ttc ttc tct 337
Arg Trp Trp Met Ala Cys Thr Ala Val Leu Glu Asn Leu Phe Phe Ser
15 20 25
gct gta ctc ctg ggc tgg ggc tcc ctg ttg atc att ctg aag aac gag 385
Ala Val Leu Leu Gly Trp Gly Ser Leu Leu Ile Ile Leu Lys Asn Glu
30 35 40
ggc ttc tat tcc agc acg tgc cca gct gag agc agc acc aac acc acc 433
Gly Phe Tyr Ser Ser Thr Cys Pro Ala Glu Ser Ser Thr Asn Thr Thr
45 50 55
cag gat gag cag cgc agg tgg cca ggc tgt gac cag cag gac gag atg 481
Gln Asp Glu Gln Arg Arg Trp Pro Gly Cys Asp Gln Gln Asp Glu Met
60 65 70 75
ctc aac ctg ggc ttc acc att ggt tcc ttc gtg ctc agc gcc acc acc 529
Leu Asn Leu Gly Phe Thr Ile Gly Ser Phe Val Leu Ser Ala Thr Thr
80 85 90
ctg cca ctg ggg atc ctc atg gac cgc ttt ggc ccc cga ccc gtg cgg 577
Leu Pro Leu Gly Ile Leu Met Asp Arg Phe Gly Pro Arg Pro Val Arg
95 100 105
ctg gtt ggc agt gcc tgc ttc act gcg tcc tgc acc ctc atg gcc ctg 625
Leu Val Gly Ser Ala Cys Phe Thr Ala Ser Cys Thr Leu Met Ala Leu
110 115 120
gcc tcc cgg gac gtg gaa gct ctg tct ccg ttg ata ttc ctg gcg ctg 673
Ala Ser Arg Asp Val Glu Ala Leu Ser Pro Leu Ile Phe Leu Ala Leu
125 130 135
tcc ctg aat ggc ttt ggt ggc atc tgc cta acg ttc act tca ctc acg 721
Ser Leu Asn Gly Phe Gly Gly Ile Cys Leu Thr Phe Thr Ser Leu Thr
140 145 150 155
ctg ccc aac atg ttt ggg aac ctg cgc tcc acg tta atg gcc ctc atg 769
Leu Pro Asn Met Phe Gly Asn Leu Arg Ser Thr Leu Met Ala Leu Met
160 165 170
att ggc tct tac gcc tct tct gcc att acg ttc cca gga atc aag ctg 817
Ile Gly Ser Tyr Ala Ser Ser Ala Ile Thr Phe Pro Gly Ile Lys Leu
175 180 185
atc tac gat gcc ggt gtg gcc ttc gtg gtc atc atg ttc acc tgg tct 865
Ile Tyr Asp Ala Gly Val Ala Phe Val Val Ile Met Phe Thr Trp Ser
190 195 200
ggc ctg gcc tgc ctt atc ttt ctg aac tgc acc ctc aac tgg ccc atc 913
Gly Leu Ala Cys Leu Ile Phe Leu Asn Cys Thr Leu Asn Trp Pro Ile
205 210 215
gaa gcc ttt cct gcc cct gag gaa gtc aat tac acg aag aag atc aag 961
Glu Ala Phe Pro Ala Pro Glu Glu Val Asn Tyr Thr Lys Lys Ile Lys
220 225 230 235
ctg agt ggg ctg gcc ctg gac cac aag gtg aca ggt gac ctc ttc tac 1009
Leu Ser Gly Leu Ala Leu Asp His Lys Val Thr Gly Asp Leu Phe Tyr
240 245 250
acc cat gtg acc acc atg ggc cag agg ctc agc cag aag gcc ccc agc 1057
Thr His Val Thr Thr Met Gly Gln Arg Leu Ser Gln Lys Ala Pro Ser
255 260 265
ctg gag gac ggt tcg gat gcc ttc atg tca ccc cag gat gtt cgg ggc 1105
Leu Glu Asp Gly Ser Asp Ala Phe Met Ser Pro Gln Asp Val Arg Gly
270 275 280
acc tca gaa aac ctt cct gag agg tct gtc ccc tta cgc aag agc ctc 1153
Thr Ser Glu Asn Leu Pro Glu Arg Ser Val Pro Leu Arg Lys Ser Leu
285 290 295
tgc tcc ccc act ttc ctg tgg agc ctc ctc acc atg ggc atg acc cag 1201
Cys Ser Pro Thr Phe Leu Trp Ser Leu Leu Thr Met Gly Met Thr Gln
300 305 310 315
ctg cgg atc atc ttc tac atg gct gct gtg aac aag atg ctg gag tac 1249
Leu Arg Ile Ile Phe Tyr Met Ala Ala Val Asn Lys Met Leu Glu Tyr
320 325 330
ctt gtg act ggt ggc cag gag cat gag aca aat gaa cag caa caa aag 1297
Leu Val Thr Gly Gly Gln Glu His Glu Thr Asn Glu Gln Gln Gln Lys
335 340 345
gtg gca gag aca gtt ggg ttc tac tcc tcc gtc ttc ggg gcc atg cag 1345
Val Ala Glu Thr Val Gly Phe Tyr Ser Ser Val Phe Gly Ala Met Gln
350 355 360
ctg ttg tgc ctt ctc acc tgc ccc ctc att ggc tac atc atg gac tgg 1393
Leu Leu Cys Leu Leu Thr Cys Pro Leu Ile Gly Tyr Ile Met Asp Trp
365 370 375
cgg atc aag gac tgc gtg gac gcc cca act cag ggc act gtc ctc gga 1441
Arg Ile Lys Asp Cys Val Asp Ala Pro Thr Gln Gly Thr Val Leu Gly
380 385 390 395
gat gcc agg gac ggg gtt gct acc aaa tcc atc aga cca cgc tac tgc 1489
Asp Ala Arg Asp Gly Val Ala Thr Lys Ser Ile Arg Pro Arg Tyr Cys
400 405 410
aag atc caa aag ctc acc aat gcc atc agt gcc ttc acc ctg acc aac 1537
Lys Ile Gln Lys Leu Thr Asn Ala Ile Ser Ala Phe Thr Leu Thr Asn
415 420 425
ctg ctg ctt gtg ggt ttt ggc atc acc tgt ctc atc aac aac tta cac 1585
Leu Leu Leu Val Gly Phe Gly Ile Thr Cys Leu Ile Asn Asn Leu His
430 435 440
ctc cag ttt gtg acc ttt gtc ctg cac acc att gtt cga ggt ttc ttc 1633
Leu Gln Phe Val Thr Phe Val Leu His Thr Ile Val Arg Gly Phe Phe
445 450 455
cac tca gcc tgt ggg agt ctc tat gct gca gtg ttc cca tcc aac cac 1681
His Ser Ala Cys Gly Ser Leu Tyr Ala Ala Val Phe Pro Ser Asn His
460 465 470 475
ttt ggg acg ctg aca ggc ctg cag tcc ctc atc agt gct gtg ttc gcc 1729
Phe Gly Thr Leu Thr Gly Leu Gln Ser Leu Ile Ser Ala Val Phe Ala
480 485 490
ttg ctt cag cag cca ctt ttc atg gcg atg gtg gga ccc ctg aaa gga 1777
Leu Leu Gln Gln Pro Leu Phe Met Ala Met Val Gly Pro Leu Lys Gly
495 500 505
gag ccc ttc tgg gtg aat ctg ggc ctc ctg cta ttc tca ctc ctg gga 1825
Glu Pro Phe Trp Val Asn Leu Gly Leu Leu Leu Phe Ser Leu Leu Gly
510 515 520
ttc ctg ttg cct tcc tac ctc ttc tat tac cgt gcc cgg ctc cag cag 1873
Phe Leu Leu Pro Ser Tyr Leu Phe Tyr Tyr Arg Ala Arg Leu Gln Gln
525 530 535
gag tac gcc gcc aat ggg atg ggc cca ctg aag gtg ctt agc ggc tct 1921
Glu Tyr Ala Ala Asn Gly Met Gly Pro Leu Lys Val Leu Ser Gly Ser
540 545 550 555
gag gtg acc gca tagactt ctcagaccaa gggacctgga tgacaggcaa 1970
Glu Val Thr Ala
tcaaggcctg agcaaccaaa aggagtgccc catatggctt ttctacctgt aacatgcaca 2030
tagagccatg gccgtagatt tataaatacc aagagaagtt ctatttttgt aaagactgca 2090
aaaaggagga aaaaaaacct tcaaaaacgc cccctaagtc aacgctccat tgactgaaga 2150
cagtccctat cctagagggg ttgagctttc ttcctccttg ggttggagga gaccagggtg 2210
cctcttatct ccttctagcg gtctgcctcc tggtacctct tggggggatc ggcaaacagg 2270
ctacccctga ggtcccatgt gccatgagtg tgcacacatg catgtgtctg tgtatgtgtg 2330
aatgtgagag agacacagcc ctcctttcag aaggaaaggg gcctgaggtg ccagctgtgt 2390
cctgggttag gggttggggg tcggcccctt ccagggccag gagggcaggt tccctctctg 2450
gtgctgctgc ttgcaagtct tagaggaaat aaaaagggaa gtgagagaaa aaaaaaaaaa 2510
aaaaaaaaaa aaaaa 2525
<210> 2
<211> 559
<212> PRT
<213> Homo sapiens
<400> 2
Met Ala Pro Thr Leu Gln Gln Ala Tyr Arg Arg Arg Trp Trp Met Ala
1 5 10 15
Cys Thr Ala Val Leu Glu Asn Leu Phe Phe Ser Ala Val Leu Leu Gly
20 25 30
Trp Gly Ser Leu Leu Ile Ile Leu Lys Asn Glu Gly Phe Tyr Ser Ser
35 40 45
Thr Cys Pro Ala Glu Ser Ser Thr Asn Thr Thr Gln Asp Glu Gln Arg
50 55 60
Arg Trp Pro Gly Cys Asp Gln Gln Asp Glu Met Leu Asn Leu Gly Phe
65 70 75 80
Thr Ile Gly Ser Phe Val Leu Ser Ala Thr Thr Leu Pro Leu Gly Ile
85 90 95
Leu Met Asp Arg Phe Gly Pro Arg Pro Val Arg Leu Val Gly Ser Ala
100 105 110
Cys Phe Thr Ala Ser Cys Thr Leu Met Ala Leu Ala Ser Arg Asp Val
115 120 125
Glu Ala Leu Ser Pro Leu Ile Phe Leu Ala Leu Ser Leu Asn Gly Phe
130 135 140
Gly Gly Ile Cys Leu Thr Phe Thr Ser Leu Thr Leu Pro Asn Met Phe
145 150 155 160
Gly Asn Leu Arg Ser Thr Leu Met Ala Leu Met Ile Gly Ser Tyr Ala
165 170 175
Ser Ser Ala Ile Thr Phe Pro Gly Ile Lys Leu Ile Tyr Asp Ala Gly
180 185 190
Val Ala Phe Val Val Ile Met Phe Thr Trp Ser Gly Leu Ala Cys Leu
195 200 205
Ile Phe Leu Asn Cys Thr Leu Asn Trp Pro Ile Glu Ala Phe Pro Ala
210 215 220
Pro Glu Glu Val Asn Tyr Thr Lys Lys Ile Lys Leu Ser Gly Leu Ala
225 230 235 240
Leu Asp His Lys Val Thr Gly Asp Leu Phe Tyr Thr His Val Thr Thr
245 250 255
Met Gly Gln Arg Leu Ser Gln Lys Ala Pro Ser Leu Glu Asp Gly Ser
260 265 270
Asp Ala Phe Met Ser Pro Gln Asp Val Arg Gly Thr Ser Glu Asn Leu
275 280 285
Pro Glu Arg Ser Val Pro Leu Arg Lys Ser Leu Cys Ser Pro Thr Phe
290 295 300
Leu Trp Ser Leu Leu Thr Met Gly Met Thr Gln Leu Arg Ile Ile Phe
305 310 315 320
Tyr Met Ala Ala Val Asn Lys Met Leu Glu Tyr Leu Val Thr Gly Gly
325 330 335
Gln Glu His Glu Thr Asn Glu Gln Gln Gln Lys Val Ala Glu Thr Val
340 345 350
Gly Phe Tyr Ser Ser Val Phe Gly Ala Met Gln Leu Leu Cys Leu Leu
355 360 365
Thr Cys Pro Leu Ile Gly Tyr Ile Met Asp Trp Arg Ile Lys Asp Cys
370 375 380
Val Asp Ala Pro Thr Gln Gly Thr Val Leu Gly Asp Ala Arg Asp Gly
385 390 395 400
Val Ala Thr Lys Ser Ile Arg Pro Arg Tyr Cys Lys Ile Gln Lys Leu
405 410 415
Thr Asn Ala Ile Ser Ala Phe Thr Leu Thr Asn Leu Leu Leu Val Gly
420 425 430
Phe Gly Ile Thr Cys Leu Ile Asn Asn Leu His Leu Gln Phe Val Thr
435 440 445
Phe Val Leu His Thr Ile Val Arg Gly Phe Phe His Ser Ala Cys Gly
450 455 460
Ser Leu Tyr Ala Ala Val Phe Pro Ser Asn His Phe Gly Thr Leu Thr
465 470 475 480
Gly Leu Gln Ser Leu Ile Ser Ala Val Phe Ala Leu Leu Gln Gln Pro
485 490 495
Leu Phe Met Ala Met Val Gly Pro Leu Lys Gly Glu Pro Phe Trp Val
500 505 510
Asn Leu Gly Leu Leu Leu Phe Ser Leu Leu Gly Phe Leu Leu Pro Ser
515 520 525
Tyr Leu Phe Tyr Tyr Arg Ala Arg Leu Gln Gln Glu Tyr Ala Ala Asn
530 535 540
Gly Met Gly Pro Leu Lys Val Leu Ser Gly Ser Glu Val Thr Ala
545 550 555
<210> 3
<211> 2519
<212> DNA
<213> mouse
<220>
<221> CDS
<222> (257)..(1948)
<400> 3
ggcttcacct atctgtggcg ccaggacggt tcccagatcc actgcttctt tcgagggcgc 60
agacgaggtg agaccggcgg ttccgaggcc cgctgggtct ggcacgcagg gaagacaccc 120
cgcgtggatg cgatttggaa ttgggatcct gggtctcagg agatccggag tgtggaagcg 180
ccggggagac tctgtgttac tccgggtgtc aacagctgcg ggaggcaagt ttgtcgggga 240
cagagtctcg gccacc atg gct ccc acg ctg aag cag gcg tac cgc agg 289
Met Ala Pro Thr Leu Lys Gln Ala Tyr Arg Arg
1 5 10
cgc tgg tgg atg gct tgc acc gct gtg gtg gag aac ctc ttc ttc tcc 337
Arg Trp Trp Met Ala Cys Thr Ala Val Val Glu Asn Leu Phe Phe Ser
15 20 25
gcg gtg ctc ctg ggc tgg gcc tcc ctg ctg atc atg ctc aag aag gaa 385
Ala Val Leu Leu Gly Trp Ala Ser Leu Leu Ile Met Leu Lys Lys Glu
30 35 40
ggc ttc tat tcc agc ctg tgc cca gct gag aac agg acc aat acc acc 433
Gly Phe Tyr Ser Ser Leu Cys Pro Ala Glu Asn Arg Thr Asn Thr Thr
45 50 55
caa gat gaa cag cat cag tgg aca agc tgt gac cag cag gaa aag atg 481
Gln Asp Glu Gln His Gln Trp Thr Ser Cys Asp Gln Gln Glu Lys Met
60 65 70 75
ctc aac ctg ggt ttc acc att ggc tcc ttc ctg ctg agt gct acc aca 529
Leu Asn Leu Gly Phe Thr Ile Gly Ser Phe Leu Leu Ser Ala Thr Thr
80 85 90
ctg cct ctg gga att ctc atg gac cgc ttt ggg ccc agg cct ctt cga 577
Leu Pro Leu Gly Ile Leu Met Asp Arg Phe Gly Pro Arg Pro Leu Arg
95 100 105
ctg gtg ggc agt gcc tgc ttt gcc gca tcc tgc act cta atg gcc ttg 625
Leu Val Gly Ser Ala Cys Phe Ala Ala Ser Cys Thr Leu Met Ala Leu
110 115 120
gcc tcc agg gac act gaa gtt ttg tct cca ttg ata ttc ctg gca ctg 673
Ala Ser Arg Asp Thr Glu Val Leu Ser Pro Leu Ile Phe Leu Ala Leu
125 130 135
tcc ttg aat gga ttt gct ggc atc tgc tta acg ttt acc tca ctc acg 721
Ser Leu Asn Gly Phe Ala Gly Ile Cys Leu Thr Phe Thr Ser Leu Thr
140 145 150 155
ctg ccc aac atg ttt ggg aat ttg cga tcc act ttc atg gcc ctc atg 769
Leu Pro Asn Met Phe Gly Asn Leu Arg Ser Thr Phe Met Ala Leu Met
160 165 170
att ggc tcc tat gcg tct tct gcc atc acg ttc cct gga atc aag ctg 817
Ile Gly Ser Tyr Ala Ser Ser Ala Ile Thr Phe Pro Gly Ile Lys Leu
175 180 185
atc tac gat gcc gga gtc ccc ttc act gtc atc atg ttc aca tgg tct 865
Ile Tyr Asp Ala Gly Val Pro Phe Thr Val Ile Met Phe Thr Trp Ser
190 195 200
ggc ctg gcc tgt ctc atc ttt ttg aac tgt gct ctc aac tgg cct gca 913
Gly Leu Ala Cys Leu Ile Phe Leu Asn Cys Ala Leu Asn Trp Pro Ala
205 210 215
gaa gcc ttt cct gcc cct gag gaa gtt gac tac acg aag aag atc aaa 961
Glu Ala Phe Pro Ala Pro Glu Glu Val Asp Tyr Thr Lys Lys Ile Lys
220 225 230 235
ctc att ggg tta gcc ttg gac cac aag gtc aca ggt gac cgc ttc tac 1009
Leu Ile Gly Leu Ala Leu Asp His Lys Val Thr Gly Asp Arg Phe Tyr
240 245 250
acc cat gta acc att gtg ggt cag cgg ctg agt cag aag tcc ccc agc 1057
Thr His Val Thr Ile Val Gly Gln Arg Leu Ser Gln Lys Ser Pro Ser
255 260 265
ctg gag gag ggc gct gac gcc ttt att tca tcc ccg gat atc cct ggt 1105
Leu Glu Glu Gly Ala Asp Ala Phe Ile Ser Ser Pro Asp Ile Pro Gly
270 275 280
acc tca gag gag act cct gaa aag tct gtc cct ttt cgc aag agc ctc 1153
Thr Ser Glu Glu Thr Pro Glu Lys Ser Val Pro Phe Arg Lys Ser Leu
285 290 295
tgc tcc ccc att ttc ctg tgg agc ctt gtc acc atg ggc atg acc cag 1201
Cys Ser Pro Ile Phe Leu Trp Ser Leu Val Thr Met Gly Met Thr Gln
300 305 310 315
ctt cgg gtc atc ttc tat atg ggt gct atg aac aag atc ctg gag ttc 1249
Leu Arg Val Ile Phe Tyr Met Gly Ala Met Asn Lys Ile Leu Glu Phe
320 325 330
att gtg act ggt ggc aag gaa cgt gag aca aat gag cag aga cag aag 1297
Ile Val Thr Gly Gly Lys Glu Arg Glu Thr Asn Glu Gln Arg Gln Lys
335 340 345
gtg gag gag aca gtt gag ttc tac tct tcc atc ttt gga gtc atg cag 1345
Val Glu Glu Thr Val Glu Phe Tyr Ser Ser Ile Phe Gly Val Met Gln
350 355 360
ctg ttg tgt ctt ctc acc tgc ccc ctc att ggc tac atc atg gac tgg 1393
Leu Leu Cys Leu Leu Thr Cys Pro Leu Ile Gly Tyr Ile Met Asp Trp
365 370 375
cgc atc aag gac tgt gtg gat gct cca acg gag ggc acc ctg aat gag 1441
Arg Ile Lys Asp Cys Val Asp Ala Pro Thr Glu Gly Thr Leu Asn Glu
380 385 390 395
aat gct tcc ttt gga gat gcc aga gat ggg gct agc acc aag ttc act 1489
Asn Ala Ser Phe Gly Asp Ala Arg Asp Gly Ala Ser Thr Lys Phe Thr
400 405 410
aga cca cgc tac cgc aag gta caa aag ctc acc aat gcc atc aat gcc 1537
Arg Pro Arg Tyr Arg Lys Val Gln Lys Leu Thr Asn Ala Ile Asn Ala
415 420 425
ttc acc ctg acc aac atc ctg ctt gtg ggt ttc ggc atc gcc tgc ctc 1585
Phe Thr Leu Thr Asn Ile Leu Leu Val Gly Phe Gly Ile Ala Cys Leu
430 435 440
atc aag aac tta cac ctg cag ttg ctg gcc ttt gtc ctg cat acc ata 1633
Ile Lys Asn Leu His Leu Gln Leu Leu Ala Phe Val Leu His Thr Ile
445 450 455
gtt cgc ggt ttc ttc cac tca gcc tgt gga ggt ctc tac gct gct gtg 1681
Val Arg Gly Phe Phe His Ser Ala Cys Gly Gly Leu Tyr Ala Ala Val
460 465 470 475
ttc ccg tcc aat cat ttt ggg aca ctg aca ggt ctt cag tct ctc atc 1729
Phe Pro Ser Asn His Phe Gly Thr Leu Thr Gly Leu Gln Ser Leu Ile
480 485 490
agt gcc gtg ttt gct ctg ctg caa cag cta ctc ttc atg gcc atg gtg 1777
Ser Ala Val Phe Ala Leu Leu Gln Gln Leu Leu Phe Met Ala Met Val
495 500 505
gga ccc ctg cat gga gat ccc ttc tgg gtg aac ctg ggc ctc cta ctt 1825
Gly Pro Leu His Gly Asp Pro Phe Trp Val Asn Leu Gly Leu Leu Leu
510 515 520
ctc tcg ttc ctg gga ttt ctc cta cct tcc tac ctc tac tac tac cgg 1873
Leu Ser Phe Leu Gly Phe Leu Leu Pro Ser Tyr Leu Tyr Tyr Tyr Arg
525 530 535
tct cgc ctg cag aga gag tat gcc acc aat ttg gta gac cca cag aag 1921
Ser Arg Leu Gln Arg Glu Tyr Ala Thr Asn Leu Val Asp Pro Gln Lys
540 545 550 555
gtg ctc aat act tcg aag gtg gct aca ta gactcctgag gccaagagac 1970
Val Leu Asn Thr Ser Lys Val Ala Thr
560
ttggaggaca ggcagtcaag gcctgataaa ccgaagggaa tggcctgtgg ctttctacct 2030
gcatcgtgtt catagagccg ggttctgtgg atttataaat actaagagtt ctatttttgt 2090
agggacttgc aaaaaaggaa acaaacagaa caaaaccccc aaaccaaaaa cagcccttaa 2150
aaaactcccc ccaaccaagc tatccatcaa ctgaagacag tgcccgttcc agtggtattg 2210
ggccatcgtc tttgaaaaga aagtgtgggg ctgccctttc tccacacttg gcctaggagc 2270
ctctgtggag ttgccttctg aaaactcatg ggatcagtga acagaccaca ctaagattcc 2330
agccgccaag tgtgcacaca tatatgttac gcacatgcat attgcatcct ttcctgcagg 2390
agaaggactg aggggctggc tgtatccagg atggggtgtg ggggctggag ggcgggttcc 2450
ctccctgatg ctgtttctta caggtcttag aggaaataaa aagggaaatg aaaaaaaaaa 2510
aaaaaaaaa 2519
<210> 4
<211> 564
<212> PRT
<213> mouse
<400> 4
Met Ala Pro Thr Leu Lys Gln Ala Tyr Arg Arg Arg Trp Trp Met Ala
1 5 10 15
Cys Thr Ala Val Val Glu Asn Leu Phe Phe Ser Ala Val Leu Leu Gly
20 25 30
Trp Ala Ser Leu Leu Ile Met Leu Lys Lys Glu Gly Phe Tyr Ser Ser
35 40 45
Leu Cys Pro Ala Glu Asn Arg Thr Asn Thr Thr Gln Asp Glu Gln His
50 55 60
Gln Trp Thr Ser Cys Asp Gln Gln Glu Lys Met Leu Asn Leu Gly Phe
65 70 75 80
Thr Ile Gly Ser Phe Leu Leu Ser Ala Thr Thr Leu Pro Leu Gly Ile
85 90 95
Leu Met Asp Arg Phe Gly Pro Arg Pro Leu Arg Leu Val Gly Ser Ala
100 105 110
Cys Phe Ala Ala Ser Cys Thr Leu Met Ala Leu Ala Ser Arg Asp Thr
115 120 125
Glu Val Leu Ser Pro Leu Ile Phe Leu Ala Leu Ser Leu Asn Gly Phe
130 135 140
Ala Gly Ile Cys Leu Thr Phe Thr Ser Leu Thr Leu Pro Asn Met Phe
145 150 155 160
Gly Asn Leu Arg Ser Thr Phe Met Ala Leu Met Ile Gly Ser Tyr Ala
165 170 175
Ser Ser Ala Ile Thr Phe Pro Gly Ile Lys Leu Ile Tyr Asp Ala Gly
180 185 190
Val Pro Phe Thr Val Ile Met Phe Thr Trp Ser Gly Leu Ala Cys Leu
195 200 205
Ile Phe Leu Asn Cys Ala Leu Asn Trp Pro Ala Glu Ala Phe Pro Ala
210 215 220
Pro Glu Glu Val Asp Tyr Thr Lys Lys Ile Lys Leu Ile Gly Leu Ala
225 230 235 240
Leu Asp His Lys Val Thr Gly Asp Arg Phe Tyr Thr His Val Thr Ile
245 250 255
Val Gly Gln Arg Leu Ser Gln Lys Ser Pro Ser Leu Glu Glu Gly Ala
260 265 270
Asp Ala Phe Ile Ser Ser Pro Asp Ile Pro Gly Thr Ser Glu Glu Thr
275 280 285
Pro Glu Lys Ser Val Pro Phe Arg Lys Ser Leu Cys Ser Pro Ile Phe
290 295 300
Leu Trp Ser Leu Val Thr Met Gly Met Thr Gln Leu Arg Val Ile Phe
305 310 315 320
Tyr Met Gly Ala Met Asn Lys Ile Leu Glu Phe Ile Val Thr Gly Gly
325 330 335
Lys Glu Arg Glu Thr Asn Glu Gln Arg Gln Lys Val Glu Glu Thr Val
340 345 350
Glu Phe Tyr Ser Ser Ile Phe Gly Val Met Gln Leu Leu Cys Leu Leu
355 360 365
Thr Cys Pro Leu Ile Gly Tyr Ile Met Asp Trp Arg Ile Lys Asp Cys
370 375 380
Val Asp Ala Pro Thr Glu Gly Thr Leu Asn Glu Asn Ala Ser Phe Gly
385 390 395 400
Asp Ala Arg Asp Gly Ala Ser Thr Lys Phe Thr Arg Pro Arg Tyr Arg
405 410 415
Lys Val Gln Lys Leu Thr Asn Ala Ile Asn Ala Phe Thr Leu Thr Asn
420 425 430
Ile Leu Leu Val Gly Phe Gly Ile Ala Cys Leu Ile Lys Asn Leu His
435 440 445
Leu Gln Leu Leu Ala Phe Val Leu His Thr Ile Val Arg Gly Phe Phe
450 455 460
His Ser Ala Cys Gly Gly Leu Tyr Ala Ala Val Phe Pro Ser Asn His
465 470 475 480
Phe Gly Thr Leu Thr Gly Leu Gln Ser Leu Ile Ser Ala Val Phe Ala
485 490 495
Leu Leu Gln Gln Leu Leu Phe Met Ala Met Val Gly Pro Leu His Gly
500 505 510
Asp Pro Phe Trp Val Asn Leu Gly Leu Leu Leu Leu Ser Phe Leu Gly
515 520 525
Phe Leu Leu Pro Ser Tyr Leu Tyr Tyr Tyr Arg Ser Arg Leu Gln Arg
530 535 540
Glu Tyr Ala Thr Asn Leu Val Asp Pro Gln Lys Val Leu Asn Thr Ser
545 550 555 560
Lys Val Ala Thr
<210> 5
<211> 3271
<212> DNA
<213> Homo sapiens
<220>
<221> CDS
<222> (308)..(2026)
<400> 5
gtcagggtcc ctgggagagg cagccctcgg atctgcccct gcccacctca cgctgcgttc 60
catgctggcc ccaggcgatg tcagtcctgc tgcaggccag gactagttcc acggccctga 120
gcatgcgtta gccccttctt gcctccatgc ctcagtttac ctcggagtga gctgcgggag 180
acgtctccct gcctggccgg ggcggctctg tcgtagcgga gggcagcggt acgagccggc 240
cgcgggctcg gggtgtccca ggtggtgcag agccggagcc ggagccggag ccgcgccgcg 300
ccgcacc atg gcg ccc acc ctg gcc act gcc cat cgg cgc cgc tgg tgg 349
Met Ala Pro Thr Leu Ala Thr Ala His Arg Arg Arg Trp Trp
1 5 10
atg gcc tgc acg gcc gtg ctg gag aac ctc ctc ttc tcg gca gtc ctc 397
Met Ala Cys Thr Ala Val Leu Glu Asn Leu Leu Phe Ser Ala Val Leu
15 20 25 30
ctg ggc tgg ggc tcg ctg ctc atc atg ctc aag tca gag ggc ttt tac 445
Leu Gly Trp Gly Ser Leu Leu Ile Met Leu Lys Ser Glu Gly Phe Tyr
35 40 45
tcc tac ctg tgt acc gag cca gag aat gtc acc aat ggc aca gtg ggc 493
Ser Tyr Leu Cys Thr Glu Pro Glu Asn Val Thr Asn Gly Thr Val Gly
50 55 60
ggc aca gca gag ccg ggg cac gag gag gtg agc tgg atg aac ggc tgg 541
Gly Thr Ala Glu Pro Gly His Glu Glu Val Ser Trp Met Asn Gly Trp
65 70 75
ctc agc tgc cag gcc cag gac gag atg cta aat ttg gcc ttc act gtg 589
Leu Ser Cys Gln Ala Gln Asp Glu Met Leu Asn Leu Ala Phe Thr Val
80 85 90
ggc tcc ttt ctg ctc agt gcc atc acc ctg ccc ctg ggt atc gtc atg 637
Gly Ser Phe Leu Leu Ser Ala Ile Thr Leu Pro Leu Gly Ile Val Met
95 100 105 110
gac aag tat ggc ccg agg aag ctc agg ctg ctg ggc agc gcc tgc ttc 685
Asp Lys Tyr Gly Pro Arg Lys Leu Arg Leu Leu Gly Ser Ala Cys Phe
115 120 125
gcg gtt tcc tgc ttg ctg att gcg tac gga gca agt aaa cca aac gct 733
Ala Val Ser Cys Leu Leu Ile Ala Tyr Gly Ala Ser Lys Pro Asn Ala
130 135 140
ctc tcc gtg ctc atc ttc atc gcc ctg gct ctg aat ggc ttt ggt ggg 781
Leu Ser Val Leu Ile Phe Ile Ala Leu Ala Leu Asn Gly Phe Gly Gly
145 150 155
atg tgt atg acc ttc acc tca tta aca ctg ccc aac atg ttc ggc gac 829
Met Cys Met Thr Phe Thr Ser Leu Thr Leu Pro Asn Met Phe Gly Asp
160 165 170
ctt cgg tcc acg ttt att gcc ttg atg att ggg tcc tac gcc tcc tcg 877
Leu Arg Ser Thr Phe Ile Ala Leu Met Ile Gly Ser Tyr Ala Ser Ser
175 180 185 190
gca gtc acc ttt cca gga atc aag ctc atc tat gat gct ggt gtc tcc 925
Ala Val Thr Phe Pro Gly Ile Lys Leu Ile Tyr Asp Ala Gly Val Ser
195 200 205
ttc atc gtc gtc ctc gtg gtc tgg gcc ggc tgc tcc ggg ctg gtt ttc 973
Phe Ile Val Val Leu Val Val Trp Ala Gly Cys Ser Gly Leu Val Phe
210 215 220
ctc aac tgc ttc ttt aac tgg ccc ctt gag ccc ttc ccg ggg ccg gag 1021
Leu Asn Cys Phe Phe Asn Trp Pro Leu Glu Pro Phe Pro Gly Pro Glu
225 230 235
gac atg gac tac tcg gtg aag atc aag ttc agc tgg ctg ggc ttt gac 1069
Asp Met Asp Tyr Ser Val Lys Ile Lys Phe Ser Trp Leu Gly Phe Asp
240 245 250
cac aag atc aca ggg aag cag ttc tac aag cag gtg acc acg gtg ggc 1117
His Lys Ile Thr Gly Lys Gln Phe Tyr Lys Gln Val Thr Thr Val Gly
255 260 265 270
cgg cgc ctg agt gtg ggc agc tcc atg agg agt gcc aag gag cag gtg 1165
Arg Arg Leu Ser Val Gly Ser Ser Met Arg Ser Ala Lys Glu Gln Val
275 280 285
gcg ctg cag gag ggc cac aag ctg tgc ctg tcc acc gtc gac ctg gag 1213
Ala Leu Gln Glu Gly His Lys Leu Cys Leu Ser Thr Val Asp Leu Glu
290 295 300
gtg aag tgc cag ccg gat gcc gca gtg gcc ccc tcc ttc atg cac agc 1261
Val Lys Cys Gln Pro Asp Ala Ala Val Ala Pro Ser Phe Met His Ser
305 310 315
gtg ttc agc ccc atc ctg ctg ctc agc ctg gtc acc atg tgc gtc acg 1309
Val Phe Ser Pro Ile Leu Leu Leu Ser Leu Val Thr Met Cys Val Thr
320 325 330
cag ctg cgg ctc atc ttc tac atg ggg gct atg aac aac atc ctc aag 1357
Gln Leu Arg Leu Ile Phe Tyr Met Gly Ala Met Asn Asn Ile Leu Lys
335 340 345 350
ttc ctg gtc agc ggc gac cag aag aca gtg atg gcc acg gtt ggc ctc 1405
Phe Leu Val Ser Gly Asp Gln Lys Thr Val Met Ala Thr Val Gly Leu
355 360 365
tac acc tcc atc ttc ggc gtg ctc cag ctg ctg tgc ctg ctg acg gcc 1453
Tyr Thr Ser Ile Phe Gly Val Leu Gln Leu Leu Cys Leu Leu Thr Ala
370 375 380
ccc gtc att ggc tac atc atg gac tgg agg ctg aag gag tgt gaa gac 1501
Pro Val Ile Gly Tyr Ile Met Asp Trp Arg Leu Lys Glu Cys Glu Asp
385 390 395
gcc tcc gag gag ccc gag gag aaa gac gcc aac caa ggc gag aag aaa 1549
Ala Ser Glu Glu Pro Glu Glu Lys Asp Ala Asn Gln Gly Glu Lys Lys
400 405 410
aag aag aag cgg gac cgg cag atc cag aag atc act aat gcc atg cgg 1597
Lys Lys Lys Arg Asp Arg Gln Ile Gln Lys Ile Thr Asn Ala Met Arg
415 420 425 430
gcc ttc gcc ttc acc aac ctg ctg ctc gtg ggc ttt ggg gtg acc tgc 1645
Ala Phe Ala Phe Thr Asn Leu Leu Leu Val Gly Phe Gly Val Thr Cys
435 440 445
ctc att ccc aac ctg cct ctc cag atc ctc tcc ttc atc ctg cac aca 1693
Leu Ile Pro Asn Leu Pro Leu Gln Ile Leu Ser Phe Ile Leu His Thr
450 455 460
atc gtg cga gga ttc atc cac tcc gct gtc ggg ggc ctg tac gct gcc 1741
Ile Val Arg Gly Phe Ile His Ser Ala Val Gly Gly Leu Tyr Ala Ala
465 470 475
gtg tac ccc tcc acc cag ttc ggc agc ctc acg gga ctg cag tct ctg 1789
Val Tyr Pro Ser Thr Gln Phe Gly Ser Leu Thr Gly Leu Gln Ser Leu
480 485 490
atc agc gcg ctc ttc gcc ctt ctg cag cag ccg ctg ttt ctg gcc atg 1837
Ile Ser Ala Leu Phe Ala Leu Leu Gln Gln Pro Leu Phe Leu Ala Met
495 500 505 510
atg ggt cct ctc cag gga gac cct ctg tgg gtg aac gtg ggg ctg ctc 1885
Met Gly Pro Leu Gln Gly Asp Pro Leu Trp Val Asn Val Gly Leu Leu
515 520 525
ctt ctc agc ctg ctg ggc ttc tgc ctc ccg ctc tac ctg atc tgc tac 1933
Leu Leu Ser Leu Leu Gly Phe Cys Leu Pro Leu Tyr Leu Ile Cys Tyr
530 535 540
cgg cgc cag ctg gag cgg cag ctg cag cag agg cag gag gat gac aaa 1981
Arg Arg Gln Leu Glu Arg Gln Leu Gln Gln Arg Gln Glu Asp Asp Lys
545 550 555
ctc ttc ctc aaa atc aac ggc tcg tcc aac cag gag gcc ttc gtg tagt 2030
Leu Phe Leu Lys Ile Asn Gly Ser Ser Asn Gln Glu Ala Phe Val
560 565 570
ggctgccgcc tcggaactgc ggtctcctgc ctgtgcttca gtgactgacc cctgtcctgc 2090
ccctccagag taccccacgc acccccagga ccttcgccgt ctccgtgcca gcgttcacgc 2150
tccctcccgg ggccctgcct cggagctctg tggtggaagg acgggagagg gccccggaca 2210
cgcgagtttt ctcctgccga acgcaggggc tgccctgact ttgctctgcc gccccccggg 2270
gacccggggc ctggggtctc tgtggtgcct gcagcaggag ccaggaacgc ccggcaggca 2330
ggcgctctcc cgccagtgtc tggattctgc ctcttgccaa agcagagggg gctgccatcc 2390
cctgcctgcc acctgcccct cggctgcatg cccacagcca tacctgcctg aggacaaagg 2450
cttgcactgt ctcgcctgcg cctggccccc accccctccc cggccagcct gaggctgcct 2510
gaggaaggaa ggacccgctt cctgttgtcg gtgctaattc ctttgtaatt ccagccccct 2570
gtcgcctgtc cagggcctgc ccacccgttg gaggccggtg gagaagcccc acctggctta 2630
tgccctggag agggtttagc gggctgggtg gacccctcgc ctcctccccg agggccaatg 2690
ccgcggacac gttttcactg tcaccctcgt tctgtctgcc acctgaaggg aatttgagga 2750
ccgccgccag ggcaccccgt acatacacac agctgctttt gtggaggtgg acgaaaggct 2810
gtggccggca gacgtggagg tccaggccgg ggtggggacg tgggtgggtc cgaggggtgt 2870
gtggggtcgg ggtgggctct aggagttagc ccttatcccc actgaccagg cgggagccgc 2930
caggcctgca gctgggccag tgcccaggag ccatcctggc gtggggccag gagcttgtcc 2990
aaggccacag gcccacagca ccccctgccg gcgggctccg tggggccctg gagctgatga 3050
cgggggaggc ccgtccgcct ggcccaccaa cccgcccacc ttgactgccc ccagaagtgt 3110
gtcttgagac ctcctgggcg tgcttagagg ggtgagttgt gtttggattt ttagttattt 3170
tctcttcagt tttattagac ttctttttta taaagcaata aatccatttt cctccgggta 3230
agggatgccc cttctggcat atcaaaaaaa aaaaaaaaaa a 3271
<210> 6
<211> 573
<212> PRT
<213> Homo sapiens
<400> 6
Met Ala Pro Thr Leu Ala Thr Ala His Arg Arg Arg Trp Trp Met Ala
1 5 10 15
Cys Thr Ala Val Leu Glu Asn Leu Leu Phe Ser Ala Val Leu Leu Gly
20 25 30
Trp Gly Ser Leu Leu Ile Met Leu Lys Ser Glu Gly Phe Tyr Ser Tyr
35 40 45
Leu Cys Thr Glu Pro Glu Asn Val Thr Asn Gly Thr Val Gly Gly Thr
50 55 60
Ala Glu Pro Gly His Glu Glu Val Ser Trp Met Asn Gly Trp Leu Ser
65 70 75 80
Cys Gln Ala Gln Asp Glu Met Leu Asn Leu Ala Phe Thr Val Gly Ser
85 90 95
Phe Leu Leu Ser Ala Ile Thr Leu Pro Leu Gly Ile Val Met Asp Lys
100 105 110
Tyr Gly Pro Arg Lys Leu Arg Leu Leu Gly Ser Ala Cys Phe Ala Val
115 120 125
Ser Cys Leu Leu Ile Ala Tyr Gly Ala Ser Lys Pro Asn Ala Leu Ser
130 135 140
Val Leu Ile Phe Ile Ala Leu Ala Leu Asn Gly Phe Gly Gly Met Cys
145 150 155 160
Met Thr Phe Thr Ser Leu Thr Leu Pro Asn Met Phe Gly Asp Leu Arg
165 170 175
Ser Thr Phe Ile Ala Leu Met Ile Gly Ser Tyr Ala Ser Ser Ala Val
180 185 190
Thr Phe Pro Gly Ile Lys Leu Ile Tyr Asp Ala Gly Val Ser Phe Ile
195 200 205
Val Val Leu Val Val Trp Ala Gly Cys Ser Gly Leu Val Phe Leu Asn
210 215 220
Cys Phe Phe Asn Trp Pro Leu Glu Pro Phe Pro Gly Pro Glu Asp Met
225 230 235 240
Asp Tyr Ser Val Lys Ile Lys Phe Ser Trp Leu Gly Phe Asp His Lys
245 250 255
Ile Thr Gly Lys Gln Phe Tyr Lys Gln Val Thr Thr Val Gly Arg Arg
260 265 270
Leu Ser Val Gly Ser Ser Met Arg Ser Ala Lys Glu Gln Val Ala Leu
275 280 285
Gln Glu Gly His Lys Leu Cys Leu Ser Thr Val Asp Leu Glu Val Lys
290 295 300
Cys Gln Pro Asp Ala Ala Val Ala Pro Ser Phe Met His Ser Val Phe
305 310 315 320
Ser Pro Ile Leu Leu Leu Ser Leu Val Thr Met Cys Val Thr Gln Leu
325 330 335
Arg Leu Ile Phe Tyr Met Gly Ala Met Asn Asn Ile Leu Lys Phe Leu
340 345 350
Val Ser Gly Asp Gln Lys Thr Val Met Ala Thr Val Gly Leu Tyr Thr
355 360 365
Ser Ile Phe Gly Val Leu Gln Leu Leu Cys Leu Leu Thr Ala Pro Val
370 375 380
Ile Gly Tyr Ile Met Asp Trp Arg Leu Lys Glu Cys Glu Asp Ala Ser
385 390 395 400
Glu Glu Pro Glu Glu Lys Asp Ala Asn Gln Gly Glu Lys Lys Lys Lys
405 410 415
Lys Arg Asp Arg Gln Ile Gln Lys Ile Thr Asn Ala Met Arg Ala Phe
420 425 430
Ala Phe Thr Asn Leu Leu Leu Val Gly Phe Gly Val Thr Cys Leu Ile
435 440 445
Pro Asn Leu Pro Leu Gln Ile Leu Ser Phe Ile Leu His Thr Ile Val
450 455 460
Arg Gly Phe Ile His Ser Ala Val Gly Gly Leu Tyr Ala Ala Val Tyr
465 470 475 480
Pro Ser Thr Gln Phe Gly Ser Leu Thr Gly Leu Gln Ser Leu Ile Ser
485 490 495
Ala Leu Phe Ala Leu Leu Gln Gln Pro Leu Phe Leu Ala Met Met Gly
500 505 510
Pro Leu Gln Gly Asp Pro Leu Trp Val Asn Val Gly Leu Leu Leu Leu
515 520 525
Ser Leu Leu Gly Phe Cys Leu Pro Leu Tyr Leu Ile Cys Tyr Arg Arg
530 535 540
Gln Leu Glu Arg Gln Leu Gln Gln Arg Gln Glu Asp Asp Lys Leu Phe
545 550 555 560
Leu Lys Ile Asn Gly Ser Ser Asn Gln Glu Ala Phe Val
565 570
<210> 7
<211> 3236
<212> DNA
<213> mouse
<220>
<221> CDS
<222> (123)..(1826)
<400> 7
agaaaaggcg ccgggcgggc ccgatacaca ctggtaggag ccgggtgagc tggactccca 60
ggatccgggt ctcagacgag ggtgtctgca gaaccggagc ccgaccaccg ccacaccgca 120
cc atg gcg ccc acc ctg gcc act gcc cat cgg cgc cgc tgg tgg 164
Met Ala Pro Thr Leu Ala Thr Ala His Arg Arg Arg Trp Trp
1 5 10
atg gcc tgc acc gct gtg ttg gaa aac ctc ctt ttc tcc gca gtc ctc 212
Met Ala Cys Thr Ala Val Leu Glu Asn Leu Leu Phe Ser Ala Val Leu
15 20 25 30
ctg ggc tgg ggt tcg ctg ctc atc atg ctc aag tcc gag ggc ttt tac 260
Leu Gly Trp Gly Ser Leu Leu Ile Met Leu Lys Ser Glu Gly Phe Tyr
35 40 45
tcc tac ctg tgt acg aag cca gag aat gtc act aac agc acg gtc ggg 308
Ser Tyr Leu Cys Thr Lys Pro Glu Asn Val Thr Asn Ser Thr Val Gly
50 55 60
ggc agc gca gag ccg gaa ccc gag gag ttg agc ctg gtg aat ggc tgg 356
Gly Ser Ala Glu Pro Glu Pro Glu Glu Leu Ser Leu Val Asn Gly Trp
65 70 75
ctc agc tgt aag gcc cag gat gag att ctg aat ttg gcc ttc acc gtg 404
Leu Ser Cys Lys Ala Gln Asp Glu Ile Leu Asn Leu Ala Phe Thr Val
80 85 90
ggc tcc ttc ctg ctc agt gcc atc acc ctg cct ctg ggc atc atc atg 452
Gly Ser Phe Leu Leu Ser Ala Ile Thr Leu Pro Leu Gly Ile Ile Met
95 100 105 110
gac aag tat ggt cca agg aag ctc agg ctg ctg ggc agt gct tgc ttt 500
Asp Lys Tyr Gly Pro Arg Lys Leu Arg Leu Leu Gly Ser Ala Cys Phe
115 120 125
gct gtc tcc tgc ttg ctg att gca tat gga gca agt aac cca gac tcg 548
Ala Val Ser Cys Leu Leu Ile Ala Tyr Gly Ala Ser Asn Pro Asp Ser
130 135 140
ctc tct gtg ctc atc ttt atc gcc ttg gct ctg aac ggc ttt ggg ggg 596
Leu Ser Val Leu Ile Phe Ile Ala Leu Ala Leu Asn Gly Phe Gly Gly
145 150 155
atg tgc atg acg ttc act tcg tta aca ctg ccc aat atg ttc ggc gac 644
Met Cys Met Thr Phe Thr Ser Leu Thr Leu Pro Asn Met Phe Gly Asp
160 165 170
ctt cgg tcc aca ttt att gcc ttg atg att gga tcc tac gct tcc tca 692
Leu Arg Ser Thr Phe Ile Ala Leu Met Ile Gly Ser Tyr Ala Ser Ser
175 180 185 190
gca gtt acc ttc cca gga ata aag ctc atc tac gac gct ggc gcc tcc 740
Ala Val Thr Phe Pro Gly Ile Lys Leu Ile Tyr Asp Ala Gly Ala Ser
195 200 205
ttc att ggc atc cta gtg gtc tgg gct ggc tgc tct ggc ctg gtt ttt 788
Phe Ile Gly Ile Leu Val Val Trp Ala Gly Cys Ser Gly Leu Val Phe
210 215 220
ttc aac tgt ttc ttc aac tgg cca ctc gag ccc ttc cca ggc tca gag 836
Phe Asn Cys Phe Phe Asn Trp Pro Leu Glu Pro Phe Pro Gly Ser Glu
225 230 235
gac atg gac tac tcg gtg aag atc aag ttc agc tgg cta ggc ttt gac 884
Asp Met Asp Tyr Ser Val Lys Ile Lys Phe Ser Trp Leu Gly Phe Asp
240 245 250
cac aag atc aca ggg aag cag ttc tac aag cag gtg acc aca gtg ggg 932
His Lys Ile Thr Gly Lys Gln Phe Tyr Lys Gln Val Thr Thr Val Gly
255 260 265 270
cgc cgt ctg agc gtg ggc agc tct atg cgg act gcc aag gag caa gcc 980
Arg Arg Leu Ser Val Gly Ser Ser Met Arg Thr Ala Lys Glu Gln Ala
275 280 285
gcc ctg cag gag ggc cac aag ctg tgt ctg tcc act gtg gac ctg gag 1028
Ala Leu Gln Glu Gly His Lys Leu Cys Leu Ser Thr Val Asp Leu Glu
290 295 300
gtg aag tgc cag cct gat gct gca gcg gcc cca tcg ttt atg cac agt 1076
Val Lys Cys Gln Pro Asp Ala Ala Ala Ala Pro Ser Phe Met His Ser
305 310 315
gtg ttc agc ccc ctc ctg gtg ctc agc ctg gtc acc atg tgt gtc aca 1124
Val Phe Ser Pro Leu Leu Val Leu Ser Leu Val Thr Met Cys Val Thr
320 325 330
cag ctg cga ctt atc ttc tac atg ggg gct atg aac agc atc ctt gag 1172
Gln Leu Arg Leu Ile Phe Tyr Met Gly Ala Met Asn Ser Ile Leu Glu
335 340 345 350
ttc ctg gtc agg ggg gac cag aag aca gtt gcc ctc tat acc tcc atc 1220
Phe Leu Val Arg Gly Asp Gln Lys Thr Val Ala Leu Tyr Thr Ser Ile
355 360 365
ttt ggc gca ctc cag ctg ctc tgc ctg ctg aca gct cct gtc atc ggc 1268
Phe Gly Ala Leu Gln Leu Leu Cys Leu Leu Thr Ala Pro Val Ile Gly
370 375 380
tac atc atg gac tgg aag ctg aaa gag tgt gaa gat act tca gag gag 1316
Tyr Ile Met Asp Trp Lys Leu Lys Glu Cys Glu Asp Thr Ser Glu Glu
385 390 395
cct gag gag gaa gaa ggc act caa ggt gaa aag aag cag aaa cga gac 1364
Pro Glu Glu Glu Glu Gly Thr Gln Gly Glu Lys Lys Gln Lys Arg Asp
400 405 410
agg cag att cag aaa gtc acg aat gcc atg cgg gcc ttc gcc ttt aca 1412
Arg Gln Ile Gln Lys Val Thr Asn Ala Met Arg Ala Phe Ala Phe Thr
415 420 425 430
aac gtg ctg ctt gtg ggt ttt ggg gtg acc tgc ctc att ccc aac ctg 1460
Asn Val Leu Leu Val Gly Phe Gly Val Thr Cys Leu Ile Pro Asn Leu
435 440 445
cct cta cag atc ttc tcc ttc gtc ctg cac aca att gtg cga gga ttc 1508
Pro Leu Gln Ile Phe Ser Phe Val Leu His Thr Ile Val Arg Gly Phe
450 455 460
atc cac tct gcc gta ggg ggc cta tac gct gcc gtg tac ccc tcc aca 1556
Ile His Ser Ala Val Gly Gly Leu Tyr Ala Ala Val Tyr Pro Ser Thr
465 470 475
cag ttt ggt agc ctc act gga ctg cag tcc ctg gtc agt gcg ctc ttt 1604
Gln Phe Gly Ser Leu Thr Gly Leu Gln Ser Leu Val Ser Ala Leu Phe
480 485 490
gct ctc ctg cag cag ccg ctg tat ctg gcc atg atg ggt cct ctg gga 1652
Ala Leu Leu Gln Gln Pro Leu Tyr Leu Ala Met Met Gly Pro Leu Gly
495 500 505 510
gga gac cct ctg tgg gtg aac gtg ggt ctg ctc gcc atg agc atg ctg 1700
Gly Asp Pro Leu Trp Val Asn Val Gly Leu Leu Ala Met Ser Met Leu
515 520 525
ggc ttc tgc ctg ccc ctt tac ctc atc tgc tac cgg cgc cag ctg gag 1748
Gly Phe Cys Leu Pro Leu Tyr Leu Ile Cys Tyr Arg Arg Gln Leu Glu
530 535 540
agg cag ctg cag cag aag agg gaa gac agc aag ctg ttc ctt aag atc 1796
Arg Gln Leu Gln Gln Lys Arg Glu Asp Ser Lys Leu Phe Leu Lys Ile
545 550 555
aat ggc tca tcc aac cgg gag gct ttc gtg tagt gcccacccac 1840
Asn Gly Ser Ser Asn Arg Glu Ala Phe Val
560 565
cgcctcagtt gtggcctcct gcctgtgctt cagtgactga ctgcagtcat ctccccaccc 1900
cagaggacct catgctctcc ctggatcctg cccttcacca cactggagcc catacttcct 1960
cagaaccacc tggccctgcc gtggagtgct ggtgtggagg gacaggagag ggcctgggac 2020
aagtgaacct cccactgcca gaagctgggc tgccctggcc tagctgtcac cccaggggct 2080
ctgaagtctc ccgatctcca tggggcttgt acctggagcc aaggggacct tttcagcgag 2140
catttctttc tttttatttt ttctttctct ttctcactga tcggattctg cctcttgcca 2200
aagcagaggg gcctgccatc ctccagcaca ctacctgtcc ctgagctgca cgcccaccaa 2260
ccacgcccac ctgaggacaa aggcttgcgc tgtctgcact ccccttgctt ggccccttac 2320
ctcccctggc cagtctggct gcctgaggaa ggaaggaccc gcttcctgtt gttggtgcta 2380
acccctttgt catcccaaca cccccctgcc cgtggctagt ctctggcccc tcttttcctt 2440
gaaagcctga gaagaagccc cccctgtctc aggctgggga aggagtggag ggcagactat 2500
ttacacaaag cctcaagagc cctgggccag gcttcttcct ccggagccag agcagtgtct 2560
ctctgctggc acgctttgtt ccagtctgca acctgaaggg aactaagggg acaccacaag 2620
ggcaccctcc catccaccca cagctgtttt tctggggtgg aaataaggct gtgactagac 2680
atgaggagcc aagcctaaat agggaagagg attagtgagt aacccgaggg gtgtgtgttt 2740
atgtggtacg tgtgtgtgca tgtgtgtata tggtaggagg ctagccccag gggctgcttt 2800
tatcagagtg gaccagacca gaagccagcc agccctacag caggctcaaa ataggagtca 2860
gccttgcttt atgatgggga cctgtgtgta tcggtgtgat cacagtgccc cctgctggca 2920
gactcacatc aggggactgg aacggttcat gtagtagaag cctagccggc ctgcctggct 2980
cactaaccca ccttgccttg acaaccccta gaaaccctgc ctgagacctc ttggggtgcc 3040
aagaggggta cattggtttt taagtttatg gttttctctt gttttatcat gattcttttt 3100
atgaagcaat aaatccattt ccctgttggt aatggatgcc cctcctcacg tatcagctaa 3160
ttactgtatg tgcctatttt atatttgaga ggagagacag ggcaaaaggg tctgccagga 3220
aaaaaaaaaa aaaaaa 3236
<210> 8
<211> 568
<212> PRT
<213> mouse
<400> 8
Met Ala Pro Thr Leu Ala Thr Ala His Arg Arg Arg Trp Trp Met Ala
1 5 10 15
Cys Thr Ala Val Leu Glu Asn Leu Leu Phe Ser Ala Val Leu Leu Gly
20 25 30
Trp Gly Ser Leu Leu Ile Met Leu Lys Ser Glu Gly Phe Tyr Ser Tyr
35 40 45
Leu Cys Thr Lys Pro Glu Asn Val Thr Asn Ser Thr Val Gly Gly Ser
50 55 60
Ala Glu Pro Glu Pro Glu Glu Leu Ser Leu Val Asn Gly Trp Leu Ser
65 70 75 80
Cys Lys Ala Gln Asp Glu Ile Leu Asn Leu Ala Phe Thr Val Gly Ser
85 90 95
Phe Leu Leu Ser Ala Ile Thr Leu Pro Leu Gly Ile Ile Met Asp Lys
100 105 110
Tyr Gly Pro Arg Lys Leu Arg Leu Leu Gly Ser Ala Cys Phe Ala Val
115 120 125
Ser Cys Leu Leu Ile Ala Tyr Gly Ala Ser Asn Pro Asp Ser Leu Ser
130 135 140
Val Leu Ile Phe Ile Ala Leu Ala Leu Asn Gly Phe Gly Gly Met Cys
145 150 155 160
Met Thr Phe Thr Ser Leu Thr Leu Pro Asn Met Phe Gly Asp Leu Arg
165 170 175
Ser Thr Phe Ile Ala Leu Met Ile Gly Ser Tyr Ala Ser Ser Ala Val
180 185 190
Thr Phe Pro Gly Ile Lys Leu Ile Tyr Asp Ala Gly Ala Ser Phe Ile
195 200 205
Gly Ile Leu Val Val Trp Ala Gly Cys Ser Gly Leu Val Phe Phe Asn
210 215 220
Cys Phe Phe Asn Trp Pro Leu Glu Pro Phe Pro Gly Ser Glu Asp Met
225 230 235 240
Asp Tyr Ser Val Lys Ile Lys Phe Ser Trp Leu Gly Phe Asp His Lys
245 250 255
Ile Thr Gly Lys Gln Phe Tyr Lys Gln Val Thr Thr Val Gly Arg Arg
260 265 270
Leu Ser Val Gly Ser Ser Met Arg Thr Ala Lys Glu Gln Ala Ala Leu
275 280 285
Gln Glu Gly His Lys Leu Cys Leu Ser Thr Val Asp Leu Glu Val Lys
290 295 300
Cys Gln Pro Asp Ala Ala Ala Ala Pro Ser Phe Met His Ser Val Phe
305 310 315 320
Ser Pro Leu Leu Val Leu Ser Leu Val Thr Met Cys Val Thr Gln Leu
325 330 335
Arg Leu Ile Phe Tyr Met Gly Ala Met Asn Ser Ile Leu Glu Phe Leu
340 345 350
Val Arg Gly Asp Gln Lys Thr Val Ala Leu Tyr Thr Ser Ile Phe Gly
355 360 365
Ala Leu Gln Leu Leu Cys Leu Leu Thr Ala Pro Val Ile Gly Tyr Ile
370 375 380
Met Asp Trp Lys Leu Lys Glu Cys Glu Asp Thr Ser Glu Glu Pro Glu
385 390 395 400
Glu Glu Glu Gly Thr Gln Gly Glu Lys Lys Gln Lys Arg Asp Arg Gln
405 410 415
Ile Gln Lys Val Thr Asn Ala Met Arg Ala Phe Ala Phe Thr Asn Val
420 425 430
Leu Leu Val Gly Phe Gly Val Thr Cys Leu Ile Pro Asn Leu Pro Leu
435 440 445
Gln Ile Phe Ser Phe Val Leu His Thr Ile Val Arg Gly Phe Ile His
450 455 460
Ser Ala Val Gly Gly Leu Tyr Ala Ala Val Tyr Pro Ser Thr Gln Phe
465 470 475 480
Gly Ser Leu Thr Gly Leu Gln Ser Leu Val Ser Ala Leu Phe Ala Leu
485 490 495
Leu Gln Gln Pro Leu Tyr Leu Ala Met Met Gly Pro Leu Gly Gly Asp
500 505 510
Pro Leu Trp Val Asn Val Gly Leu Leu Ala Met Ser Met Leu Gly Phe
515 520 525
Cys Leu Pro Leu Tyr Leu Ile Cys Tyr Arg Arg Gln Leu Glu Arg Gln
530 535 540
Leu Gln Gln Lys Arg Glu Asp Ser Lys Leu Phe Leu Lys Ile Asn Gly
545 550 555 560
Ser Ser Asn Arg Glu Ala Phe Val
565
Claims (22)
- 이하의 (A) 내지 (H)로부터 선택되는 단백질로서, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 단백질.(A) 서열번호 2로 나타낸 아미노산 서열로 되는 단백질.(B) 서열번호 4로 나타낸 아미노산 서열로 되는 단백질.(C) 서열번호 6으로 나타낸 아미노산 서열로 되는 단백질.(D) 서열번호 8로 나타낸 아미노산 서열로 되는 단백질.(E) 서열번호 2로 나타낸 아미노산 서열에서 1 또는 몇 개의 아미노산이 결실, 치환 또는 부가된 아미노산 서열로 되는 단백질.(F) 서열번호 4로 나타낸 아미노산 서열에서 1 또는 몇 개의 아미노산이 결실, 치환 또는 부가된 아미노산 서열로 되는 단백질.(G) 서열번호 6으로 나타낸 아미노산 서열에서 1 또는 몇 개의 아미노산이 결실, 치환 또는 부가된 아미노산 서열로 되는 단백질.(H) 서열번호 8로 나타낸 아미노산 서열에서 1 또는 몇 개의 아미노산이 결실, 치환 또는 부가된 아미노산 서열로 되는 단백질.
- 제 1 항에 있어서, 인간 또는 마우스 유래인 단백질.
- 제 1 항에 있어서, 장기, 조직, 또는 배양세포 유래인 단백질.
- 제 1 항 내지 제 3 항의 어느 한 항의 단백질을 코딩하는 유전자.
- 이하의 (a) 내지 (h)로부터 선택되는 DNA로서, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 단백질을 코딩하는 DNA로 되는 유전자.(a) 서열번호 1로 나타낸 염기서열로 되는 DNA.(b) 서열번호 3으로 나타낸 염기서열로 되는 DNA.(c) 서열번호 5로 나타낸 염기서열로 되는 DNA.(d) 서열번호 7로 나타낸 염기서열로 되는 DNA.(e) 서열번호 1로 나타낸 염기서열로 되는 DNA와 스트린젠트인 조건하에서 하이브리다이즈하는 DNA.(f) 서열번호 3으로 나타낸 염기서열로 되는 DNA와 스트린젠트인 조건하에서 하이브리다이즈하는 DNA.(g) 서열번호 5로 나타낸 염기서열로 되는 DNA와 스트린젠트인 조건하에서 하이브리다이즈하는 DNA.(h) 서열번호 7로 나타낸 염기서열로 되는 DNA와 스트린젠트인 조건하에서 하이브리다이즈하는 DNA.
- 제 5 항에 있어서, 인간 또는 마우스 유래인 유전자.
- 제 5 항에 있어서, 장기, 조직, 또는 배양세포 유래인 유전자.
- 제 4 항 내지 제 7 항의 어느 한 항의 유전자 또는 당해 유전자 중의 단백질을 코딩하는 유전자를 포함하는 플라스미드.
- 제 8 항에 있어서, 발현 플라스미드.
- 제 8 항 또는 제 9 항의 플라스미드로 형질전환된 숙주 세포.
- 서열번호 1, 3, 5 또는 7로 나타낸 염기서열 중의 연속하는 14 염기 이상의 부분 서열 또는 그 상보적인 서열을 포함하는 뉴클레오티드.
- 제 11 항에 있어서, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 단백질을 코딩하는 유전자를 검출하기 위한 프로브로서 사용되는 뉴클레오티드.
- 제 11 항에 있어서, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 단백질을 코딩하는 유전자의 발현을 변조시키기 위하여 사용되는 뉴클레오티드.
- 제 1 항 내지 제 3 항의 어느 한 항의 단백질에 대한 항체.
- 제 1 항 내지 제 3 항의 어느 한 항의 단백질을 이용하여, 당해 단백질이 갖는, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력에 대한 피검물질의 기질 또는 저해 물질로서의 작용을 검출하는 방법.
- 제 1 항 내지 제 3 항의 어느 한 항의 단백질, 그 특이 항체, 그 기능 촉진 물질 또는 기능 억제 물질을 이용하여, 당해 단백질이 갖는, 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 변조시키는 것에 의해, 정상세포 또는 종양세포의 증식을 제어하는 방법.
- 제 1 항 내지 제 3 항의 어느 한 항의 단백질, 그 특이 항체, 그 기능 촉진 물질 또는 기능 억제 물질을 이용하여, 당해 단백질이 갖는, 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 변조시키는 것에 의해, 당해 단백질에 의해 수송되는 약물, 독물, 또는 외래성 이물의 체내 동태를 변경하는 방법.
- 제 1 항 내지 제 3 항의 어느 한 항의 단백질, 그 특이 항체, 그 기능 촉진 물질 또는 기능 억제 물질을 이용하여, 당해 단백질을 특정의 세포에 과잉 발현시키거나, 또는 이미 세포에 존재하는 당해 단백질이 갖는 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 변조시키는 것에 의해, 당해 단백질에 의해 수송되는 분지쇄 중성 아미노산의 체내 동태 또는 생체내 대사를 변경하는 방법.
- 제 13 항의 뉴클레오티드를 이용하여, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 단백질의 발현을 변조시키는 것에 의해, 정상세포 또는 종양세포의 증식을 제어하는 방법.
- 제 13 항의 뉴클레오티드를 이용하여, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 단백질의 발현을 변조시키는 것에 의해, 당해 단백질에 의해 수송되는 약물, 독물, 또는 외래성 이물의 체내 동태를 변경하는 방법.
- 제 13 항의 뉴클레오티드를 이용하여, 나트륨 비의존적으로 분지쇄 중성 아미노산 및 그 유사 물질을 수송하는 능력을 단일 분자로 발휘하는 단백질의 발현을 변조시키는 것에 의해, 당해 단백질에 의해 수송되는 분지쇄 중성 아미노산의 체내 동태 또는 생체내 대사를 변경하는 방법.
- 제 1 항 내지 제 3 항의 어느 한 항의 단백질에 대한 특이 항체, 또는 제 11 항 및 제 12 항의 뉴클레오티드를 이용하여 종양세포와 정상세포를 구별하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003062379 | 2003-03-07 | ||
JPJP-P-2003-00062379 | 2003-03-07 | ||
PCT/JP2004/002905 WO2004078970A1 (ja) | 2003-03-07 | 2004-03-05 | 単一分子で機能する分枝鎖中性アミノ酸トランスポーター |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050105273A true KR20050105273A (ko) | 2005-11-03 |
KR101083385B1 KR101083385B1 (ko) | 2011-11-14 |
Family
ID=32959004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020057016478A KR101083385B1 (ko) | 2003-03-07 | 2004-03-05 | 단일 분자로 기능하는 분지쇄 중성 아미노산 트랜스포터 |
Country Status (8)
Country | Link |
---|---|
US (1) | US7553642B2 (ko) |
EP (1) | EP1609858B1 (ko) |
JP (2) | JP4660375B2 (ko) |
KR (1) | KR101083385B1 (ko) |
CN (1) | CN100590196C (ko) |
AT (1) | ATE420952T1 (ko) |
DE (1) | DE602004019062D1 (ko) |
WO (1) | WO2004078970A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107200779B (zh) * | 2017-07-03 | 2020-04-03 | 中国农业大学 | 稳定过表达LAT3的β细胞株的制备方法及其应用 |
CN114306601A (zh) * | 2020-09-28 | 2022-04-12 | 中国科学院上海营养与健康研究所 | 一种l型氨基酸转运蛋白抑制剂或拮抗剂有效干预糖尿病的方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001508407A (ja) * | 1996-11-13 | 2001-06-26 | 財団法人相模中央化学研究所 | 膜貫通ドメインを有するヒト蛋白質およびそれをコードするdna |
AU4885297A (en) | 1996-11-13 | 1998-06-03 | Protegene Inc. | Human proteins having transmembrane domains and DNAs encoding these prot eins |
AU5128799A (en) * | 1998-07-24 | 2000-02-14 | Government Of The United States Of America, As Represented By The Secretary Of The Department Of Health And Human Services, The | Pb 39, a gene dysregulated in prostate cancer, and uses thereof |
US7226731B1 (en) * | 1998-07-24 | 2007-06-05 | The United States Of America, As Represented By The Secretary Of The Department Of Health And Human Services | PB 39, a gene dysregulated in prostate cancer, and uses thereof |
AU2001231177A1 (en) * | 2000-01-25 | 2001-08-07 | Hyseq, Inc. | Methods and materials relating to hematopoietic cytokine-like polypeptides and polynucleotides |
JP2002112780A (ja) * | 2000-10-03 | 2002-04-16 | Keio Gijuku | ヒト膀胱癌抗原 |
JP2002223765A (ja) * | 2001-01-31 | 2002-08-13 | Keio Gijuku | ヒト悪性黒色腫抗原 |
CA2438571A1 (en) * | 2001-02-12 | 2002-12-12 | Curagen Corporation | Novel proteins and nucleic acids encoding same |
US20030108963A1 (en) * | 2001-07-25 | 2003-06-12 | Millennium Pharmaceuticals, Inc. | Novel genes, compositions, kit, and methods for identification, assessment, prevention and therapy of prostate cancer |
JP2003125780A (ja) * | 2001-10-22 | 2003-05-07 | Mitsubishi Pharma Corp | 新規gpcr、それをコードする遺伝子及びそれらの用途 |
-
2004
- 2004-03-05 JP JP2005503151A patent/JP4660375B2/ja not_active Expired - Lifetime
- 2004-03-05 DE DE602004019062T patent/DE602004019062D1/de not_active Expired - Lifetime
- 2004-03-05 CN CN200480006122A patent/CN100590196C/zh not_active Expired - Fee Related
- 2004-03-05 US US10/547,975 patent/US7553642B2/en active Active
- 2004-03-05 KR KR1020057016478A patent/KR101083385B1/ko active IP Right Grant
- 2004-03-05 WO PCT/JP2004/002905 patent/WO2004078970A1/ja active Application Filing
- 2004-03-05 EP EP04717881A patent/EP1609858B1/en not_active Expired - Lifetime
- 2004-03-05 AT AT04717881T patent/ATE420952T1/de not_active IP Right Cessation
-
2010
- 2010-05-24 JP JP2010117983A patent/JP5281039B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2010252796A (ja) | 2010-11-11 |
KR101083385B1 (ko) | 2011-11-14 |
ATE420952T1 (de) | 2009-01-15 |
JP5281039B2 (ja) | 2013-09-04 |
JPWO2004078970A1 (ja) | 2006-06-08 |
CN1756842A (zh) | 2006-04-05 |
CN100590196C (zh) | 2010-02-17 |
JP4660375B2 (ja) | 2011-03-30 |
EP1609858A4 (en) | 2007-11-07 |
DE602004019062D1 (de) | 2009-03-05 |
US7553642B2 (en) | 2009-06-30 |
EP1609858A1 (en) | 2005-12-28 |
EP1609858B1 (en) | 2009-01-14 |
WO2004078970A1 (ja) | 2004-09-16 |
US20060246538A1 (en) | 2006-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hui et al. | Fatty acid transporters in animal cells | |
US20070122422A1 (en) | Sodium-independent small neutral amino acid transporter transporting L- and D- amino acids | |
JP5281039B2 (ja) | 単一分子で機能する分枝鎖中性アミノ酸トランスポーター | |
JP4592131B2 (ja) | シスチン、塩基性アミノ酸及び中性アミノ酸を基質とするトランスポーター及びその遺伝子 | |
JP4157192B2 (ja) | 中性アミノ酸トランスポーター及びその遺伝子 | |
US20020048787A1 (en) | Isolated human transporter proteins, nucleic acid molecules encoding human transporter proteins, and uses thereof | |
JP2000342270A (ja) | 広い基質選択性を有する中性アミノ酸トランスポーター及びその遺伝子 | |
JP4161103B2 (ja) | 小型中性アミノ酸を輸送するナトリウム非依存性トランスポーター及びその遺伝子、及びその機能特定を可能にした融合タンパク質作製によるトランスポーターの機能解析法 | |
JP4278906B2 (ja) | 酸性アミノ酸を輸送するナトリウム非依存性トランスポーター及びその遺伝子 | |
WO2001092468A2 (en) | Novel compositions for the expression of the human peptide histidine transporter 1 and methods of use thereof | |
EP1489170B1 (en) | Transporter selectively transporting sulfate conjugate and its gene | |
US20040161754A1 (en) | Human erg2 potassium channel | |
CA2428979A1 (en) | Human erg2 potassium channel | |
CA2517489A1 (en) | Novel protein usable in screening drug improving diabetes | |
JP2002000279A (ja) | 初期造血に関わるys68遺伝子 | |
CA2432214A1 (fr) | Gene implique dans la regulation de l'apoptose | |
JP2002300881A (ja) | 新規なgタンパク質共役型受容体タンパク質及びその遺伝子 | |
CA2435292A1 (en) | Human hyperpolarization-activated cyclic nucleotide-gated cation channel hcn1 | |
JP2003000253A (ja) | 新規なgタンパク質共役型受容体タンパク質及びその遺伝子 | |
JP2003009868A (ja) | 新規なgタンパク質共役型受容体タンパク質及びその遺伝子 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20141028 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20151030 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20161028 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20171027 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20181029 Year of fee payment: 8 |