JP2002176981A - T細胞分化調節因子 - Google Patents
T細胞分化調節因子Info
- Publication number
- JP2002176981A JP2002176981A JP2000377898A JP2000377898A JP2002176981A JP 2002176981 A JP2002176981 A JP 2002176981A JP 2000377898 A JP2000377898 A JP 2000377898A JP 2000377898 A JP2000377898 A JP 2000377898A JP 2002176981 A JP2002176981 A JP 2002176981A
- Authority
- JP
- Japan
- Prior art keywords
- ser
- lys
- leu
- glu
- pro
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 210000001744 T-lymphocyte Anatomy 0.000 title claims abstract description 51
- 230000024245 cell differentiation Effects 0.000 title claims abstract description 33
- 230000001105 regulatory effect Effects 0.000 title claims abstract description 9
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 61
- 102000004169 proteins and genes Human genes 0.000 claims description 29
- 150000001413 amino acids Chemical class 0.000 claims description 26
- 230000000694 effects Effects 0.000 claims description 8
- 230000001737 promoting effect Effects 0.000 claims description 7
- 239000002773 nucleotide Substances 0.000 claims description 4
- 125000003729 nucleotide group Chemical group 0.000 claims description 4
- 239000003112 inhibitor Substances 0.000 claims description 3
- 229940122498 Gene expression inhibitor Drugs 0.000 claims description 2
- 239000003795 chemical substances by application Substances 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 5
- 235000010469 Glycine max Nutrition 0.000 claims 1
- 244000068988 Glycine max Species 0.000 claims 1
- 101100326215 Pseudomonas aeruginosa bla gene Proteins 0.000 claims 1
- 230000004069 differentiation Effects 0.000 abstract description 15
- 101000901099 Homo sapiens Achaete-scute homolog 1 Proteins 0.000 abstract description 14
- 241000699670 Mus sp. Species 0.000 abstract description 9
- 102000051614 SET domains Human genes 0.000 abstract description 9
- 108700039010 SET domains Proteins 0.000 abstract description 9
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 abstract description 6
- 239000012634 fragment Substances 0.000 abstract description 6
- 238000000034 method Methods 0.000 abstract description 6
- 210000000581 natural killer T-cell Anatomy 0.000 abstract description 5
- 230000002093 peripheral effect Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 abstract description 2
- 241000282326 Felis catus Species 0.000 description 45
- 210000004027 cell Anatomy 0.000 description 44
- 239000005090 green fluorescent protein Substances 0.000 description 31
- 235000018102 proteins Nutrition 0.000 description 21
- 241000880493 Leptailurus serval Species 0.000 description 19
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 18
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 18
- 230000014509 gene expression Effects 0.000 description 18
- 108020004414 DNA Proteins 0.000 description 17
- 108010026333 seryl-proline Proteins 0.000 description 16
- 108010062796 arginyllysine Proteins 0.000 description 15
- 108010054155 lysyllysine Proteins 0.000 description 15
- 108010077544 Chromatin Proteins 0.000 description 13
- 241000699666 Mus <mouse, genus> Species 0.000 description 13
- 210000003483 chromatin Anatomy 0.000 description 13
- 239000002299 complementary DNA Substances 0.000 description 13
- 108010009298 lysylglutamic acid Proteins 0.000 description 12
- 102100026265 Histone-lysine N-methyltransferase ASH1L Human genes 0.000 description 11
- 101000785963 Homo sapiens Histone-lysine N-methyltransferase ASH1L Proteins 0.000 description 11
- 210000001541 thymus gland Anatomy 0.000 description 11
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 10
- 235000001014 amino acid Nutrition 0.000 description 10
- 108010065920 Insulin Lispro Proteins 0.000 description 9
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 9
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 9
- 108010050848 glycylleucine Proteins 0.000 description 9
- 108010031719 prolyl-serine Proteins 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- 102000001805 Bromodomains Human genes 0.000 description 8
- 108050009021 Bromodomains Proteins 0.000 description 8
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 8
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 8
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 8
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 8
- 102000001183 RAG-1 Human genes 0.000 description 8
- 108010068380 arginylarginine Proteins 0.000 description 8
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 8
- 108010071207 serylmethionine Proteins 0.000 description 8
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 7
- 108060006897 RAG1 Proteins 0.000 description 7
- 108010047495 alanylglycine Proteins 0.000 description 7
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 6
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 6
- XHUCVVHRLNPZSZ-CIUDSAMLSA-N Glu-Gln-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XHUCVVHRLNPZSZ-CIUDSAMLSA-N 0.000 description 6
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 6
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 6
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 6
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 6
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 6
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 6
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 6
- 108010070643 prolylglutamic acid Proteins 0.000 description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 5
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 5
- 101100021264 Caenorhabditis elegans lin-59 gene Proteins 0.000 description 5
- 108010033040 Histones Proteins 0.000 description 5
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 5
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 5
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 5
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 5
- 210000000601 blood cell Anatomy 0.000 description 5
- 210000004556 brain Anatomy 0.000 description 5
- 108010049041 glutamylalanine Proteins 0.000 description 5
- 108010034529 leucyl-lysine Proteins 0.000 description 5
- 208000032839 leukemia Diseases 0.000 description 5
- 108010018625 phenylalanylarginine Proteins 0.000 description 5
- 230000001177 retroviral effect Effects 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 108010020532 tyrosyl-proline Proteins 0.000 description 5
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 4
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 4
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 4
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 4
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 4
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 4
- NGTYEHIRESTSRX-UWVGGRQHSA-N Arg-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NGTYEHIRESTSRX-UWVGGRQHSA-N 0.000 description 4
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 4
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 4
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 4
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 4
- YRZIYQGXTSBRLT-AVGNSLFASA-N Asp-Phe-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YRZIYQGXTSBRLT-AVGNSLFASA-N 0.000 description 4
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 4
- WVWRADGCZPIJJR-IHRRRGAJSA-N Cys-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CS)N WVWRADGCZPIJJR-IHRRRGAJSA-N 0.000 description 4
- 101150112014 Gapdh gene Proteins 0.000 description 4
- UICOTGULOUGGLC-NUMRIWBASA-N Gln-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UICOTGULOUGGLC-NUMRIWBASA-N 0.000 description 4
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 4
- QLPYYTDOUQNJGQ-AVGNSLFASA-N Glu-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N QLPYYTDOUQNJGQ-AVGNSLFASA-N 0.000 description 4
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 4
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 4
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 4
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 4
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 4
- NGBGZCUWFVVJKC-IRXDYDNUSA-N Gly-Tyr-Tyr Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NGBGZCUWFVVJKC-IRXDYDNUSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- ZPVJJPAIUZLSNE-DCAQKATOSA-N His-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O ZPVJJPAIUZLSNE-DCAQKATOSA-N 0.000 description 4
- YEKYGQZUBCRNGH-DCAQKATOSA-N His-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CO)C(=O)O YEKYGQZUBCRNGH-DCAQKATOSA-N 0.000 description 4
- 102100022103 Histone-lysine N-methyltransferase 2A Human genes 0.000 description 4
- 102000006947 Histones Human genes 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 4
- 101001045846 Homo sapiens Histone-lysine N-methyltransferase 2A Proteins 0.000 description 4
- 101000702559 Homo sapiens Probable global transcription activator SNF2L2 Proteins 0.000 description 4
- 101000702545 Homo sapiens Transcription activator BRG1 Proteins 0.000 description 4
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 4
- GMUYXHHJAGQHGB-TUBUOCAGSA-N Ile-Thr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMUYXHHJAGQHGB-TUBUOCAGSA-N 0.000 description 4
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 4
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 4
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 4
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 4
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 4
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 4
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 4
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 4
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 4
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 4
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 4
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 4
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 4
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 4
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 4
- FGMHXLULNHTPID-KKUMJFAQSA-N Lys-His-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CN=CN1 FGMHXLULNHTPID-KKUMJFAQSA-N 0.000 description 4
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 4
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 4
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 4
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 4
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- 108010079364 N-glycylalanine Proteins 0.000 description 4
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 4
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 4
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 4
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 4
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 4
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 4
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 4
- RNEFESSBTOQSAC-DCAQKATOSA-N Pro-Ser-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O RNEFESSBTOQSAC-DCAQKATOSA-N 0.000 description 4
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 4
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 4
- 102100031021 Probable global transcription activator SNF2L2 Human genes 0.000 description 4
- 101710194492 SET-binding protein Proteins 0.000 description 4
- BLPYXIXXCFVIIF-FXQIFTODSA-N Ser-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N)CN=C(N)N BLPYXIXXCFVIIF-FXQIFTODSA-N 0.000 description 4
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 4
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 4
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 4
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 4
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 4
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 4
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 4
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 4
- FGBLCMLXHRPVOF-IHRRRGAJSA-N Ser-Tyr-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FGBLCMLXHRPVOF-IHRRRGAJSA-N 0.000 description 4
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 4
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 4
- 108091008874 T cell receptors Proteins 0.000 description 4
- AYCQVUUPIJHJTA-IXOXFDKPSA-N Thr-His-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O AYCQVUUPIJHJTA-IXOXFDKPSA-N 0.000 description 4
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 4
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 4
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 4
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 4
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 4
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 4
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 4
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 230000011712 cell development Effects 0.000 description 4
- 108010060199 cysteinylproline Proteins 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 4
- 108010089804 glycyl-threonine Proteins 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 108010027338 isoleucylcysteine Proteins 0.000 description 4
- 108010053037 kyotorphin Proteins 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 210000001165 lymph node Anatomy 0.000 description 4
- 108010003700 lysyl aspartic acid Proteins 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 4
- 108010090894 prolylleucine Proteins 0.000 description 4
- 108010048818 seryl-histidine Proteins 0.000 description 4
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 230000001629 suppression Effects 0.000 description 4
- 108010061238 threonyl-glycine Proteins 0.000 description 4
- 230000009258 tissue cross reactivity Effects 0.000 description 4
- 108010051110 tyrosyl-lysine Proteins 0.000 description 4
- 241001430294 unidentified retrovirus Species 0.000 description 4
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 3
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 3
- CRCCTGPNZUCAHE-DCAQKATOSA-N Arg-His-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 CRCCTGPNZUCAHE-DCAQKATOSA-N 0.000 description 3
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 3
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 3
- 101000741929 Caenorhabditis elegans Serine/threonine-protein phosphatase 2A catalytic subunit Proteins 0.000 description 3
- 108700004411 Drosophila ASH1 Proteins 0.000 description 3
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 3
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 3
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 3
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 3
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 3
- IAYPZSHNZQHQNO-KKUMJFAQSA-N His-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N IAYPZSHNZQHQNO-KKUMJFAQSA-N 0.000 description 3
- 108010052497 Histone Chaperones Proteins 0.000 description 3
- 102000018754 Histone Chaperones Human genes 0.000 description 3
- CTHAJJYOHOBUDY-GHCJXIJMSA-N Ile-Cys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N CTHAJJYOHOBUDY-GHCJXIJMSA-N 0.000 description 3
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 3
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 3
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 3
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 3
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 3
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 3
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 3
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 3
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 3
- WKTSCAXSYITIJJ-PCBIJLKTSA-N Phe-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O WKTSCAXSYITIJJ-PCBIJLKTSA-N 0.000 description 3
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 3
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 3
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 3
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 3
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 3
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 3
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 239000000427 antigen Substances 0.000 description 3
- 108091007433 antigens Proteins 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- 230000001973 epigenetic effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- 108010079547 glutamylmethionine Proteins 0.000 description 3
- 108010018006 histidylserine Proteins 0.000 description 3
- 210000002861 immature t-cell Anatomy 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 108010012581 phenylalanylglutamate Proteins 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 108010004914 prolylarginine Proteins 0.000 description 3
- 108010029020 prolylglycine Proteins 0.000 description 3
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000010361 transduction Methods 0.000 description 3
- 230000026683 transduction Effects 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 2
- IMIZPWSVYADSCN-UHFFFAOYSA-N 4-methyl-2-[[4-methyl-2-[[4-methyl-2-(pyrrolidine-2-carbonylamino)pentanoyl]amino]pentanoyl]amino]pentanoic acid Chemical compound CC(C)CC(C(O)=O)NC(=O)C(CC(C)C)NC(=O)C(CC(C)C)NC(=O)C1CCCN1 IMIZPWSVYADSCN-UHFFFAOYSA-N 0.000 description 2
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 2
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 2
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 2
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 2
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 2
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 2
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 2
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 2
- KMGOBAQSCKTBGD-DLOVCJGASA-N Ala-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CN=CN1 KMGOBAQSCKTBGD-DLOVCJGASA-N 0.000 description 2
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 2
- QPBSRMDNJOTFAL-AICCOOGYSA-N Ala-Leu-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QPBSRMDNJOTFAL-AICCOOGYSA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 2
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 2
- GKAZXNDATBWNBI-DCAQKATOSA-N Ala-Met-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N GKAZXNDATBWNBI-DCAQKATOSA-N 0.000 description 2
- MAZZQZWCCYJQGZ-GUBZILKMSA-N Ala-Pro-Arg Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MAZZQZWCCYJQGZ-GUBZILKMSA-N 0.000 description 2
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 2
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 2
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 2
- AUFACLFHBAGZEN-ZLUOBGJFSA-N Ala-Ser-Cys Chemical compound N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O AUFACLFHBAGZEN-ZLUOBGJFSA-N 0.000 description 2
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 2
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 2
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 2
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 2
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 2
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 2
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 2
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 2
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 2
- PVSNBTCXCQIXSE-JYJNAYRXSA-N Arg-Arg-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PVSNBTCXCQIXSE-JYJNAYRXSA-N 0.000 description 2
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 2
- USNSOPDIZILSJP-FXQIFTODSA-N Arg-Asn-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O USNSOPDIZILSJP-FXQIFTODSA-N 0.000 description 2
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 2
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 2
- OANWAFQRNQEDSY-DCAQKATOSA-N Arg-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N OANWAFQRNQEDSY-DCAQKATOSA-N 0.000 description 2
- XTGGTAWGUFXJSV-NAKRPEOUSA-N Arg-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N XTGGTAWGUFXJSV-NAKRPEOUSA-N 0.000 description 2
- PTVGLOCPAVYPFG-CIUDSAMLSA-N Arg-Gln-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PTVGLOCPAVYPFG-CIUDSAMLSA-N 0.000 description 2
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 2
- OBFTYSPXDRROQO-SRVKXCTJSA-N Arg-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCN=C(N)N OBFTYSPXDRROQO-SRVKXCTJSA-N 0.000 description 2
- BJNUAWGXPSHQMJ-DCAQKATOSA-N Arg-Gln-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O BJNUAWGXPSHQMJ-DCAQKATOSA-N 0.000 description 2
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 2
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 2
- JTZUZBADHGISJD-SRVKXCTJSA-N Arg-His-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JTZUZBADHGISJD-SRVKXCTJSA-N 0.000 description 2
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 2
- UAOSDDXCTBIPCA-QXEWZRGKSA-N Arg-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UAOSDDXCTBIPCA-QXEWZRGKSA-N 0.000 description 2
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 2
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- GIMTZGADWZTZGV-DCAQKATOSA-N Arg-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GIMTZGADWZTZGV-DCAQKATOSA-N 0.000 description 2
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 2
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 2
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 2
- JBIRFLWXWDSDTR-CYDGBPFRSA-N Arg-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCN=C(N)N)N JBIRFLWXWDSDTR-CYDGBPFRSA-N 0.000 description 2
- STHNZYKCJHWULY-AVGNSLFASA-N Arg-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O STHNZYKCJHWULY-AVGNSLFASA-N 0.000 description 2
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 2
- ISJWBVIYRBAXEB-CIUDSAMLSA-N Arg-Ser-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISJWBVIYRBAXEB-CIUDSAMLSA-N 0.000 description 2
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 2
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 2
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 2
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 2
- PTNFNTOBUDWHNZ-GUBZILKMSA-N Asn-Arg-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O PTNFNTOBUDWHNZ-GUBZILKMSA-N 0.000 description 2
- DNYRZPOWBTYFAF-IHRRRGAJSA-N Asn-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)O DNYRZPOWBTYFAF-IHRRRGAJSA-N 0.000 description 2
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 2
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 2
- YQNBILXAUIAUCF-CIUDSAMLSA-N Asn-Cys-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N YQNBILXAUIAUCF-CIUDSAMLSA-N 0.000 description 2
- SPIPSJXLZVTXJL-ZLUOBGJFSA-N Asn-Cys-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O SPIPSJXLZVTXJL-ZLUOBGJFSA-N 0.000 description 2
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 2
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 2
- ZKDGORKGHPCZOV-DCAQKATOSA-N Asn-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZKDGORKGHPCZOV-DCAQKATOSA-N 0.000 description 2
- AITGTTNYKAWKDR-CIUDSAMLSA-N Asn-His-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O AITGTTNYKAWKDR-CIUDSAMLSA-N 0.000 description 2
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 2
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 2
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 2
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 2
- GIQCDTKOIPUDSG-GARJFASQSA-N Asn-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N)C(=O)O GIQCDTKOIPUDSG-GARJFASQSA-N 0.000 description 2
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 2
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 2
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 2
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 2
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 2
- FHCRKXCTKSHNOE-QEJZJMRPSA-N Asn-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FHCRKXCTKSHNOE-QEJZJMRPSA-N 0.000 description 2
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 2
- SKQTXVZTCGSRJS-SRVKXCTJSA-N Asn-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O SKQTXVZTCGSRJS-SRVKXCTJSA-N 0.000 description 2
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 2
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 2
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 2
- ILJQISGMGXRZQQ-IHRRRGAJSA-N Asp-Arg-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ILJQISGMGXRZQQ-IHRRRGAJSA-N 0.000 description 2
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 2
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 2
- FTNVLGCFIJEMQT-CIUDSAMLSA-N Asp-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N FTNVLGCFIJEMQT-CIUDSAMLSA-N 0.000 description 2
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 2
- QCLHLXDWRKOHRR-GUBZILKMSA-N Asp-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N QCLHLXDWRKOHRR-GUBZILKMSA-N 0.000 description 2
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 2
- ZSVJVIOVABDTTL-YUMQZZPRSA-N Asp-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N ZSVJVIOVABDTTL-YUMQZZPRSA-N 0.000 description 2
- RWHHSFSWKFBTCF-KKUMJFAQSA-N Asp-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N RWHHSFSWKFBTCF-KKUMJFAQSA-N 0.000 description 2
- YRBGRUOSJROZEI-NHCYSSNCSA-N Asp-His-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O YRBGRUOSJROZEI-NHCYSSNCSA-N 0.000 description 2
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 2
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 2
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 2
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 2
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 2
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 2
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 2
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 2
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 2
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 2
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 2
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 2
- NJLLRXWFPQQPHV-SRVKXCTJSA-N Asp-Tyr-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJLLRXWFPQQPHV-SRVKXCTJSA-N 0.000 description 2
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 2
- ALMIMUZAWTUNIO-BZSNNMDCSA-N Asp-Tyr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ALMIMUZAWTUNIO-BZSNNMDCSA-N 0.000 description 2
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 2
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 2
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 2
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 2
- JGLWFWXGOINXEA-YDHLFZDLSA-N Asp-Val-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JGLWFWXGOINXEA-YDHLFZDLSA-N 0.000 description 2
- GMXSSZUVDNPRMA-FXQIFTODSA-N Cys-Arg-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GMXSSZUVDNPRMA-FXQIFTODSA-N 0.000 description 2
- CEZSLNCYQUFOSL-BQBZGAKWSA-N Cys-Arg-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O CEZSLNCYQUFOSL-BQBZGAKWSA-N 0.000 description 2
- OLIYIKRCOZBFCW-ZLUOBGJFSA-N Cys-Asp-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)C(=O)O OLIYIKRCOZBFCW-ZLUOBGJFSA-N 0.000 description 2
- YMBAVNPKBWHDAW-CIUDSAMLSA-N Cys-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N YMBAVNPKBWHDAW-CIUDSAMLSA-N 0.000 description 2
- DVKQPQKQDHHFTE-ZLUOBGJFSA-N Cys-Cys-Asn Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N)C(=O)N DVKQPQKQDHHFTE-ZLUOBGJFSA-N 0.000 description 2
- GUKYYUFHWYRMEU-WHFBIAKZSA-N Cys-Gly-Asp Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O GUKYYUFHWYRMEU-WHFBIAKZSA-N 0.000 description 2
- LBOLGUYQEPZSKM-YUMQZZPRSA-N Cys-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N LBOLGUYQEPZSKM-YUMQZZPRSA-N 0.000 description 2
- MKMKILWCRQLDFJ-DCAQKATOSA-N Cys-Lys-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MKMKILWCRQLDFJ-DCAQKATOSA-N 0.000 description 2
- RWVBNRYBHAGYSG-GUBZILKMSA-N Cys-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)N RWVBNRYBHAGYSG-GUBZILKMSA-N 0.000 description 2
- RAGIABZNLPZBGS-FXQIFTODSA-N Cys-Pro-Cys Chemical compound N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(O)=O RAGIABZNLPZBGS-FXQIFTODSA-N 0.000 description 2
- KVCJEMHFLGVINV-ZLUOBGJFSA-N Cys-Ser-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KVCJEMHFLGVINV-ZLUOBGJFSA-N 0.000 description 2
- ZGERHCJBLPQPGV-ACZMJKKPSA-N Cys-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N ZGERHCJBLPQPGV-ACZMJKKPSA-N 0.000 description 2
- YNJBLTDKTMKEET-ZLUOBGJFSA-N Cys-Ser-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O YNJBLTDKTMKEET-ZLUOBGJFSA-N 0.000 description 2
- FNXOZWPPOJRBRE-XGEHTFHBSA-N Cys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CS)N)O FNXOZWPPOJRBRE-XGEHTFHBSA-N 0.000 description 2
- 108700023507 Drosophila trx Proteins 0.000 description 2
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 2
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 2
- RGRMOYQUIJVQQD-SRVKXCTJSA-N Gln-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N RGRMOYQUIJVQQD-SRVKXCTJSA-N 0.000 description 2
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 2
- UVAOVENCIONMJP-GUBZILKMSA-N Gln-Cys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O UVAOVENCIONMJP-GUBZILKMSA-N 0.000 description 2
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 2
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 2
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 2
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 2
- LVSYIKGMLRHKME-IUCAKERBSA-N Gln-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N LVSYIKGMLRHKME-IUCAKERBSA-N 0.000 description 2
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 2
- HHQCBFGKQDMWSP-GUBZILKMSA-N Gln-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HHQCBFGKQDMWSP-GUBZILKMSA-N 0.000 description 2
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 2
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 2
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 2
- HSHCEAUPUPJPTE-JYJNAYRXSA-N Gln-Leu-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HSHCEAUPUPJPTE-JYJNAYRXSA-N 0.000 description 2
- QMVCEWKHIUHTSD-GUBZILKMSA-N Gln-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QMVCEWKHIUHTSD-GUBZILKMSA-N 0.000 description 2
- WHVLABLIJYGVEK-QEWYBTABSA-N Gln-Phe-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WHVLABLIJYGVEK-QEWYBTABSA-N 0.000 description 2
- DRNMNLKUUKKPIA-HTUGSXCWSA-N Gln-Phe-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)CCC(N)=O)C(O)=O DRNMNLKUUKKPIA-HTUGSXCWSA-N 0.000 description 2
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 2
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 2
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 2
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 2
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 2
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 2
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 2
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 2
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 2
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 2
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 2
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 2
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 2
- GLWXKFRTOHKGIT-ACZMJKKPSA-N Glu-Asn-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GLWXKFRTOHKGIT-ACZMJKKPSA-N 0.000 description 2
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 2
- KVBPDJIFRQUQFY-ACZMJKKPSA-N Glu-Cys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O KVBPDJIFRQUQFY-ACZMJKKPSA-N 0.000 description 2
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 2
- XMVLTPMCUJTJQP-FXQIFTODSA-N Glu-Gln-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N XMVLTPMCUJTJQP-FXQIFTODSA-N 0.000 description 2
- WLIPTFCZLHCNFD-LPEHRKFASA-N Glu-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O WLIPTFCZLHCNFD-LPEHRKFASA-N 0.000 description 2
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 2
- IFZWDJWERARYFC-WNHJNPCNSA-N Glu-Glu-Gln-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 IFZWDJWERARYFC-WNHJNPCNSA-N 0.000 description 2
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 2
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 2
- NJPQBTJSYCKCNS-HVTMNAMFSA-N Glu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N NJPQBTJSYCKCNS-HVTMNAMFSA-N 0.000 description 2
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 2
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 2
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 2
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 2
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 2
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 2
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 2
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 2
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 2
- UMHRCVCZUPBBQW-GARJFASQSA-N Glu-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UMHRCVCZUPBBQW-GARJFASQSA-N 0.000 description 2
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 2
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 2
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 2
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 2
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 2
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 2
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 2
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 2
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 2
- MIWJDJAMMKHUAR-ZVZYQTTQSA-N Glu-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)O)N MIWJDJAMMKHUAR-ZVZYQTTQSA-N 0.000 description 2
- BKMOHWJHXQLFEX-IRIUXVKKSA-N Glu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N)O BKMOHWJHXQLFEX-IRIUXVKKSA-N 0.000 description 2
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 2
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 2
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 2
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 2
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 2
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 2
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 2
- GNPVTZJUUBPZKW-WDSKDSINSA-N Gly-Gln-Ser Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GNPVTZJUUBPZKW-WDSKDSINSA-N 0.000 description 2
- HFXJIZNEXNIZIJ-BQBZGAKWSA-N Gly-Glu-Gln Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFXJIZNEXNIZIJ-BQBZGAKWSA-N 0.000 description 2
- ORXZVPZCPMKHNR-IUCAKERBSA-N Gly-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 ORXZVPZCPMKHNR-IUCAKERBSA-N 0.000 description 2
- CQIIXEHDSZUSAG-QWRGUYRKSA-N Gly-His-His Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CQIIXEHDSZUSAG-QWRGUYRKSA-N 0.000 description 2
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 2
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 2
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 2
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 2
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 2
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 2
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 2
- ZKJZBRHRWKLVSJ-ZDLURKLDSA-N Gly-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)O ZKJZBRHRWKLVSJ-ZDLURKLDSA-N 0.000 description 2
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 2
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 2
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 2
- HDXNWVLQSQFJOX-SRVKXCTJSA-N His-Arg-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HDXNWVLQSQFJOX-SRVKXCTJSA-N 0.000 description 2
- YPLYIXGKCRQZGW-SRVKXCTJSA-N His-Arg-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YPLYIXGKCRQZGW-SRVKXCTJSA-N 0.000 description 2
- IDNNYVGVSZMQTK-IHRRRGAJSA-N His-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N IDNNYVGVSZMQTK-IHRRRGAJSA-N 0.000 description 2
- WMKXFMUJRCEGRP-SRVKXCTJSA-N His-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N WMKXFMUJRCEGRP-SRVKXCTJSA-N 0.000 description 2
- WGVPDSNCHDEDBP-KKUMJFAQSA-N His-Asp-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WGVPDSNCHDEDBP-KKUMJFAQSA-N 0.000 description 2
- ZZLWLWSUIBSMNP-CIUDSAMLSA-N His-Asp-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZZLWLWSUIBSMNP-CIUDSAMLSA-N 0.000 description 2
- IDQKGZWUPVOGPZ-GUBZILKMSA-N His-Cys-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IDQKGZWUPVOGPZ-GUBZILKMSA-N 0.000 description 2
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 2
- WGHJXSONOOTTCZ-JYJNAYRXSA-N His-Glu-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WGHJXSONOOTTCZ-JYJNAYRXSA-N 0.000 description 2
- VJJSDSNFXCWCEJ-DJFWLOJKSA-N His-Ile-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O VJJSDSNFXCWCEJ-DJFWLOJKSA-N 0.000 description 2
- QMUHTRISZMFKAY-MXAVVETBSA-N His-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N QMUHTRISZMFKAY-MXAVVETBSA-N 0.000 description 2
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 2
- YXXKBPJEIYFGOD-MGHWNKPDSA-N His-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N YXXKBPJEIYFGOD-MGHWNKPDSA-N 0.000 description 2
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 2
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 2
- FFKJUTZARGRVTH-KKUMJFAQSA-N His-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FFKJUTZARGRVTH-KKUMJFAQSA-N 0.000 description 2
- DLTCGJZBNFOWFL-LKTVYLICSA-N His-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N DLTCGJZBNFOWFL-LKTVYLICSA-N 0.000 description 2
- UWNUQPZUSRFIIN-JUKXBJQTSA-N His-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N UWNUQPZUSRFIIN-JUKXBJQTSA-N 0.000 description 2
- BCSGDNGNHKBRRJ-ULQDDVLXSA-N His-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N BCSGDNGNHKBRRJ-ULQDDVLXSA-N 0.000 description 2
- GGXUJBKENKVYNV-ULQDDVLXSA-N His-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N GGXUJBKENKVYNV-ULQDDVLXSA-N 0.000 description 2
- 102000003964 Histone deacetylase Human genes 0.000 description 2
- 108090000353 Histone deacetylase Proteins 0.000 description 2
- 108700005087 Homeobox Genes Proteins 0.000 description 2
- 101000654718 Homo sapiens SET-binding protein Proteins 0.000 description 2
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 2
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 2
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 2
- XLDYDEDTGMHUCZ-GHCJXIJMSA-N Ile-Asp-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N XLDYDEDTGMHUCZ-GHCJXIJMSA-N 0.000 description 2
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 2
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 2
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 2
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 2
- QRTVJGKXFSYJGW-KBIXCLLPSA-N Ile-Glu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N QRTVJGKXFSYJGW-KBIXCLLPSA-N 0.000 description 2
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 2
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 2
- JXMSHKFPDIUYGS-SIUGBPQLSA-N Ile-Glu-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N JXMSHKFPDIUYGS-SIUGBPQLSA-N 0.000 description 2
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 2
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 2
- AREBLHSMLMRICD-PYJNHQTQSA-N Ile-His-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AREBLHSMLMRICD-PYJNHQTQSA-N 0.000 description 2
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 2
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 2
- UWLHDGMRWXHFFY-HPCHECBXSA-N Ile-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1CCC[C@@H]1C(=O)O)N UWLHDGMRWXHFFY-HPCHECBXSA-N 0.000 description 2
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 2
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 2
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 2
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 2
- UYNXBNHVWFNVIN-HJWJTTGWSA-N Ile-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 UYNXBNHVWFNVIN-HJWJTTGWSA-N 0.000 description 2
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 2
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 2
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 2
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 2
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 2
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 2
- REXAUQBGSGDEJY-IGISWZIWSA-N Ile-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N REXAUQBGSGDEJY-IGISWZIWSA-N 0.000 description 2
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 2
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 2
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 2
- 241000018427 Iphisa elegans Species 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 2
- BAJIJEGGUYXZGC-CIUDSAMLSA-N Leu-Asn-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N BAJIJEGGUYXZGC-CIUDSAMLSA-N 0.000 description 2
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 2
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 2
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 2
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 2
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 2
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 2
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 2
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 2
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 2
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 2
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 2
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 2
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 2
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 2
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 2
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 2
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 2
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 2
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 2
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 2
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 2
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 2
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 2
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 2
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 2
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 2
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 2
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 2
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 2
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 2
- ZGGVHTQAPHVMKM-IHPCNDPISA-N Leu-Trp-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N ZGGVHTQAPHVMKM-IHPCNDPISA-N 0.000 description 2
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 2
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 2
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 2
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 2
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 2
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 2
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 2
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 2
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 2
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 2
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 2
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 2
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 2
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 2
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 2
- RLZDUFRBMQNYIJ-YUMQZZPRSA-N Lys-Cys-Gly Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N RLZDUFRBMQNYIJ-YUMQZZPRSA-N 0.000 description 2
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 2
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 2
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 2
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 2
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 2
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 2
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 2
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 2
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 2
- SQJSXOQXJYAVRV-SRVKXCTJSA-N Lys-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N SQJSXOQXJYAVRV-SRVKXCTJSA-N 0.000 description 2
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 2
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 2
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 2
- PYFNONMJYNJENN-AVGNSLFASA-N Lys-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PYFNONMJYNJENN-AVGNSLFASA-N 0.000 description 2
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 2
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 2
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 2
- TYEJPFJNAHIKRT-DCAQKATOSA-N Lys-Met-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N TYEJPFJNAHIKRT-DCAQKATOSA-N 0.000 description 2
- JPYPRVHMKRFTAT-KKUMJFAQSA-N Lys-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N JPYPRVHMKRFTAT-KKUMJFAQSA-N 0.000 description 2
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 2
- WGILOYIKJVQUPT-DCAQKATOSA-N Lys-Pro-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WGILOYIKJVQUPT-DCAQKATOSA-N 0.000 description 2
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 2
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 2
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 2
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 2
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 2
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 2
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 2
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 2
- FPQMQEOVSKMVMA-ACRUOGEOSA-N Lys-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CCCCN)N)O FPQMQEOVSKMVMA-ACRUOGEOSA-N 0.000 description 2
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 2
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 2
- YNOVBMBQSQTLFM-DCAQKATOSA-N Met-Asn-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O YNOVBMBQSQTLFM-DCAQKATOSA-N 0.000 description 2
- TUSOIZOVPJCMFC-FXQIFTODSA-N Met-Asp-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O TUSOIZOVPJCMFC-FXQIFTODSA-N 0.000 description 2
- TZLYIHDABYBOCJ-FXQIFTODSA-N Met-Asp-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O TZLYIHDABYBOCJ-FXQIFTODSA-N 0.000 description 2
- YLLWCSDBVGZLOW-CIUDSAMLSA-N Met-Gln-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O YLLWCSDBVGZLOW-CIUDSAMLSA-N 0.000 description 2
- OXHSZBRPUGNMKW-DCAQKATOSA-N Met-Gln-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OXHSZBRPUGNMKW-DCAQKATOSA-N 0.000 description 2
- OGAZPKJHHZPYFK-GARJFASQSA-N Met-Glu-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGAZPKJHHZPYFK-GARJFASQSA-N 0.000 description 2
- WWWGMQHQSAUXBU-BQBZGAKWSA-N Met-Gly-Asn Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O WWWGMQHQSAUXBU-BQBZGAKWSA-N 0.000 description 2
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 2
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 2
- BKIFWLQFOOKUCA-DCAQKATOSA-N Met-His-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N BKIFWLQFOOKUCA-DCAQKATOSA-N 0.000 description 2
- RVYDCISQIGHAFC-ZPFDUUQYSA-N Met-Ile-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O RVYDCISQIGHAFC-ZPFDUUQYSA-N 0.000 description 2
- HGAJNEWOUHDUMZ-SRVKXCTJSA-N Met-Leu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O HGAJNEWOUHDUMZ-SRVKXCTJSA-N 0.000 description 2
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 2
- IRVONVRHHJXWTK-RWMBFGLXSA-N Met-Lys-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N IRVONVRHHJXWTK-RWMBFGLXSA-N 0.000 description 2
- CNAGWYQWQDMUGC-IHRRRGAJSA-N Met-Phe-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CNAGWYQWQDMUGC-IHRRRGAJSA-N 0.000 description 2
- VQILILSLEFDECU-GUBZILKMSA-N Met-Pro-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O VQILILSLEFDECU-GUBZILKMSA-N 0.000 description 2
- MQASRXPTQJJNFM-JYJNAYRXSA-N Met-Pro-Phe Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MQASRXPTQJJNFM-JYJNAYRXSA-N 0.000 description 2
- SBFPAAPFKZPDCZ-JYJNAYRXSA-N Met-Pro-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SBFPAAPFKZPDCZ-JYJNAYRXSA-N 0.000 description 2
- PCTFVQATEGYHJU-FXQIFTODSA-N Met-Ser-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O PCTFVQATEGYHJU-FXQIFTODSA-N 0.000 description 2
- WRXOPYNEKGZWAZ-FXQIFTODSA-N Met-Ser-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O WRXOPYNEKGZWAZ-FXQIFTODSA-N 0.000 description 2
- SPSSJSICDYYTQN-HJGDQZAQSA-N Met-Thr-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O SPSSJSICDYYTQN-HJGDQZAQSA-N 0.000 description 2
- 108060004795 Methyltransferase Proteins 0.000 description 2
- 102000016397 Methyltransferase Human genes 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- LBSARGIQACMGDF-WBAXXEDZSA-N Phe-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 LBSARGIQACMGDF-WBAXXEDZSA-N 0.000 description 2
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 2
- KIAWKQJTSGRCSA-AVGNSLFASA-N Phe-Asn-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KIAWKQJTSGRCSA-AVGNSLFASA-N 0.000 description 2
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 2
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 2
- RGZYXNFHYRFNNS-MXAVVETBSA-N Phe-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGZYXNFHYRFNNS-MXAVVETBSA-N 0.000 description 2
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 2
- MJAYDXWQQUOURZ-JYJNAYRXSA-N Phe-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MJAYDXWQQUOURZ-JYJNAYRXSA-N 0.000 description 2
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 2
- FUAIIFPQELBNJF-ULQDDVLXSA-N Phe-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FUAIIFPQELBNJF-ULQDDVLXSA-N 0.000 description 2
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 2
- ZVRJWDUPIDMHDN-ULQDDVLXSA-N Phe-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 ZVRJWDUPIDMHDN-ULQDDVLXSA-N 0.000 description 2
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 2
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 2
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 2
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 2
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 2
- SJRQWEDYTKYHHL-SLFFLAALSA-N Phe-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O SJRQWEDYTKYHHL-SLFFLAALSA-N 0.000 description 2
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 2
- CDHURCQGUDNBMA-UBHSHLNASA-N Phe-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDHURCQGUDNBMA-UBHSHLNASA-N 0.000 description 2
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 2
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 2
- 241000233805 Phoenix Species 0.000 description 2
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 2
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 2
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 2
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 2
- NUZHSNLQJDYSRW-BZSNNMDCSA-N Pro-Arg-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NUZHSNLQJDYSRW-BZSNNMDCSA-N 0.000 description 2
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 2
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 2
- WPQKSRHDTMRSJM-CIUDSAMLSA-N Pro-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 WPQKSRHDTMRSJM-CIUDSAMLSA-N 0.000 description 2
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 2
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 2
- PTLOFJZJADCNCD-DCAQKATOSA-N Pro-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 PTLOFJZJADCNCD-DCAQKATOSA-N 0.000 description 2
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 2
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 2
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 2
- AJCRQOHDLCBHFA-SRVKXCTJSA-N Pro-His-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AJCRQOHDLCBHFA-SRVKXCTJSA-N 0.000 description 2
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 2
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 2
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 2
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 2
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 2
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 2
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 2
- PUQRDHNIOONJJN-AVGNSLFASA-N Pro-Lys-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O PUQRDHNIOONJJN-AVGNSLFASA-N 0.000 description 2
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 2
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 2
- DWPXHLIBFQLKLK-CYDGBPFRSA-N Pro-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 DWPXHLIBFQLKLK-CYDGBPFRSA-N 0.000 description 2
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 2
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 2
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 2
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 2
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 2
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 2
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 2
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 2
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 2
- WWXNZNWZNZPDIF-SRVKXCTJSA-N Pro-Val-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 WWXNZNWZNZPDIF-SRVKXCTJSA-N 0.000 description 2
- STGVYUTZKGPRCI-GUBZILKMSA-N Pro-Val-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 STGVYUTZKGPRCI-GUBZILKMSA-N 0.000 description 2
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 2
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 2
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 2
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 2
- JJKSSJVYOVRJMZ-FXQIFTODSA-N Ser-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)CN=C(N)N JJKSSJVYOVRJMZ-FXQIFTODSA-N 0.000 description 2
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 2
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 2
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 2
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 2
- SFZKGGOGCNQPJY-CIUDSAMLSA-N Ser-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N SFZKGGOGCNQPJY-CIUDSAMLSA-N 0.000 description 2
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 2
- CJNCVBHTDXKTMJ-CYDGBPFRSA-N Ser-Asp-Lys-Pro Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(O)=O CJNCVBHTDXKTMJ-CYDGBPFRSA-N 0.000 description 2
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 2
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 2
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 2
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 2
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 2
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 2
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 2
- UAJAYRMZGNQILN-BQBZGAKWSA-N Ser-Gly-Met Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UAJAYRMZGNQILN-BQBZGAKWSA-N 0.000 description 2
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 2
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 2
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 2
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 2
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 2
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 2
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 2
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 2
- JUTGONBTALQWMK-NAKRPEOUSA-N Ser-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N JUTGONBTALQWMK-NAKRPEOUSA-N 0.000 description 2
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 2
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 2
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 2
- QPPYAWVLAVXISR-DCAQKATOSA-N Ser-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QPPYAWVLAVXISR-DCAQKATOSA-N 0.000 description 2
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 2
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 2
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 2
- SOACHCFYJMCMHC-BWBBJGPYSA-N Ser-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O SOACHCFYJMCMHC-BWBBJGPYSA-N 0.000 description 2
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 2
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 2
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 2
- XPVIVVLLLOFBRH-XIRDDKMYSA-N Ser-Trp-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@@H](N)CO)C(O)=O XPVIVVLLLOFBRH-XIRDDKMYSA-N 0.000 description 2
- GSCVDSBEYVGMJQ-SRVKXCTJSA-N Ser-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)O GSCVDSBEYVGMJQ-SRVKXCTJSA-N 0.000 description 2
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 2
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 2
- SGZVZUCRAVSPKQ-FXQIFTODSA-N Ser-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N SGZVZUCRAVSPKQ-FXQIFTODSA-N 0.000 description 2
- RCOUFINCYASMDN-GUBZILKMSA-N Ser-Val-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O RCOUFINCYASMDN-GUBZILKMSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 2
- VOGXLRKCWFLJBY-HSHDSVGOSA-N Thr-Arg-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VOGXLRKCWFLJBY-HSHDSVGOSA-N 0.000 description 2
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 2
- DGOJNGCGEYOBKN-BWBBJGPYSA-N Thr-Cys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)O DGOJNGCGEYOBKN-BWBBJGPYSA-N 0.000 description 2
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 2
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 2
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 2
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 2
- XSTGOZBBXFKGHA-YJRXYDGGSA-N Thr-His-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O XSTGOZBBXFKGHA-YJRXYDGGSA-N 0.000 description 2
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 2
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 2
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 2
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 2
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 2
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 2
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 2
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 2
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 2
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 2
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 2
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 2
- TZQWJCGVCIJDMU-HEIBUPTGSA-N Thr-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N)O TZQWJCGVCIJDMU-HEIBUPTGSA-N 0.000 description 2
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 2
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 2
- DIHPMRTXPYMDJZ-KAOXEZKKSA-N Thr-Tyr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N)O DIHPMRTXPYMDJZ-KAOXEZKKSA-N 0.000 description 2
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 2
- 102100031027 Transcription activator BRG1 Human genes 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- CPZTZWFFGVKHEA-SZMVWBNQSA-N Trp-Gln-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N CPZTZWFFGVKHEA-SZMVWBNQSA-N 0.000 description 2
- LJCLHMPCYYXVPR-VJBMBRPKSA-N Trp-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N LJCLHMPCYYXVPR-VJBMBRPKSA-N 0.000 description 2
- NFVQCNMGJILYMI-SZMVWBNQSA-N Trp-Met-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O NFVQCNMGJILYMI-SZMVWBNQSA-N 0.000 description 2
- XGEUYEOEZYFHRL-KKXDTOCCSA-N Tyr-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XGEUYEOEZYFHRL-KKXDTOCCSA-N 0.000 description 2
- YLRLHDFMMWDYTK-KKUMJFAQSA-N Tyr-Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 YLRLHDFMMWDYTK-KKUMJFAQSA-N 0.000 description 2
- FFCRCJZJARTYCG-KKUMJFAQSA-N Tyr-Cys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O FFCRCJZJARTYCG-KKUMJFAQSA-N 0.000 description 2
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 2
- YIKDYZDNRCNFQB-KKUMJFAQSA-N Tyr-His-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O YIKDYZDNRCNFQB-KKUMJFAQSA-N 0.000 description 2
- WVGKPKDWYQXWLU-BZSNNMDCSA-N Tyr-His-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WVGKPKDWYQXWLU-BZSNNMDCSA-N 0.000 description 2
- AVIQBBOOTZENLH-KKUMJFAQSA-N Tyr-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N AVIQBBOOTZENLH-KKUMJFAQSA-N 0.000 description 2
- YKCXQOBTISTQJD-BZSNNMDCSA-N Tyr-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YKCXQOBTISTQJD-BZSNNMDCSA-N 0.000 description 2
- WOAQYWUEUYMVGK-ULQDDVLXSA-N Tyr-Lys-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOAQYWUEUYMVGK-ULQDDVLXSA-N 0.000 description 2
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 2
- XYNFFTNEQDWZNY-ULQDDVLXSA-N Tyr-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N XYNFFTNEQDWZNY-ULQDDVLXSA-N 0.000 description 2
- IGXLNVIYDYONFB-UFYCRDLUSA-N Tyr-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 IGXLNVIYDYONFB-UFYCRDLUSA-N 0.000 description 2
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 2
- 108010064997 VPY tripeptide Proteins 0.000 description 2
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 2
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 2
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 2
- IDKGBVZGNTYYCC-QXEWZRGKSA-N Val-Asn-Pro Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(O)=O IDKGBVZGNTYYCC-QXEWZRGKSA-N 0.000 description 2
- FRUYSSRPJXNRRB-GUBZILKMSA-N Val-Cys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FRUYSSRPJXNRRB-GUBZILKMSA-N 0.000 description 2
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 2
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 2
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 2
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 2
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 2
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 2
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 2
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- IEBGHUMBJXIXHM-AVGNSLFASA-N Val-Lys-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N IEBGHUMBJXIXHM-AVGNSLFASA-N 0.000 description 2
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 2
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 2
- LGXUZJIQCGXKGZ-QXEWZRGKSA-N Val-Pro-Asn Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N LGXUZJIQCGXKGZ-QXEWZRGKSA-N 0.000 description 2
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 2
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 2
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 2
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 2
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 2
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 2
- CFIBZQOLUDURST-IHRRRGAJSA-N Val-Tyr-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CS)C(=O)O)N CFIBZQOLUDURST-IHRRRGAJSA-N 0.000 description 2
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 2
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 230000030741 antigen processing and presentation Effects 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 230000027455 binding Effects 0.000 description 2
- 230000022131 cell cycle Effects 0.000 description 2
- 210000004720 cerebrum Anatomy 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- 230000008482 dysregulation Effects 0.000 description 2
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 2
- 229960005542 ethidium bromide Drugs 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 238000012226 gene silencing method Methods 0.000 description 2
- 108010037389 glutamyl-cysteinyl-lysine Proteins 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 2
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 2
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 2
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 2
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 238000005734 heterodimerization reaction Methods 0.000 description 2
- 108010009253 histidyl-asparaginyl-glutamyl-leucine Proteins 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 101150003074 hoxa5 gene Proteins 0.000 description 2
- 102000056667 human SETBP1 Human genes 0.000 description 2
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 108010068488 methionylphenylalanine Proteins 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 108010020432 prolyl-prolylisoleucine Proteins 0.000 description 2
- 238000007634 remodeling Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 108010005652 splenotritin Proteins 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 2
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 2
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 2
- 108010009962 valyltyrosine Proteins 0.000 description 2
- 230000004572 zinc-binding Effects 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102100021324 5-azacytidine-induced protein 2 Human genes 0.000 description 1
- 208000036762 Acute promyelocytic leukaemia Diseases 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- YWWATNIVMOCSAV-UBHSHLNASA-N Ala-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YWWATNIVMOCSAV-UBHSHLNASA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 1
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 1
- MUGAESARFRGOTQ-IGNZVWTISA-N Ala-Tyr-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N MUGAESARFRGOTQ-IGNZVWTISA-N 0.000 description 1
- OOBVTWHLKYJFJH-FXQIFTODSA-N Arg-Ala-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O OOBVTWHLKYJFJH-FXQIFTODSA-N 0.000 description 1
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 1
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 1
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 1
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 1
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 1
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 1
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 1
- LUVODTFFSXVOAG-ACZMJKKPSA-N Asn-Cys-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N LUVODTFFSXVOAG-ACZMJKKPSA-N 0.000 description 1
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 1
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- DBWYWXNMZZYIRY-LPEHRKFASA-N Asp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O DBWYWXNMZZYIRY-LPEHRKFASA-N 0.000 description 1
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 1
- WXASLRQUSYWVNE-FXQIFTODSA-N Asp-Cys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N WXASLRQUSYWVNE-FXQIFTODSA-N 0.000 description 1
- SWTQDYFZVOJVLL-KKUMJFAQSA-N Asp-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N)O SWTQDYFZVOJVLL-KKUMJFAQSA-N 0.000 description 1
- YVHGKXAOSVBGJV-CIUDSAMLSA-N Asp-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N YVHGKXAOSVBGJV-CIUDSAMLSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 1
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 1
- HCOQNGIHSXICCB-IHRRRGAJSA-N Asp-Tyr-Arg Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O HCOQNGIHSXICCB-IHRRRGAJSA-N 0.000 description 1
- 101100447462 Brugia malayi G3PD gene Proteins 0.000 description 1
- 101100021265 Caenorhabditis elegans lin-5 gene Proteins 0.000 description 1
- BIVLWXQGXJLGKG-BIIVOSGPSA-N Cys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)C(=O)O BIVLWXQGXJLGKG-BIIVOSGPSA-N 0.000 description 1
- SDXQKJAWASHMIZ-CIUDSAMLSA-N Cys-Glu-Met Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O SDXQKJAWASHMIZ-CIUDSAMLSA-N 0.000 description 1
- PQHYZJPCYRDYNE-QWRGUYRKSA-N Cys-Gly-Phe Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PQHYZJPCYRDYNE-QWRGUYRKSA-N 0.000 description 1
- XGHYKIDVGYYHDC-JBDRJPRFSA-N Cys-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N XGHYKIDVGYYHDC-JBDRJPRFSA-N 0.000 description 1
- SSNJZBGOMNLSLA-CIUDSAMLSA-N Cys-Leu-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O SSNJZBGOMNLSLA-CIUDSAMLSA-N 0.000 description 1
- XLLSMEFANRROJE-GUBZILKMSA-N Cys-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N XLLSMEFANRROJE-GUBZILKMSA-N 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108700015019 Drosophila Acf Proteins 0.000 description 1
- 101100002913 Drosophila melanogaster ash1 gene Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 238000012413 Fluorescence activated cell sorting analysis Methods 0.000 description 1
- 101150010789 GPB1 gene Proteins 0.000 description 1
- 241001123946 Gaga Species 0.000 description 1
- 241000287826 Gallus Species 0.000 description 1
- 208000034951 Genetic Translocation Diseases 0.000 description 1
- WOACHWLUOFZLGJ-GUBZILKMSA-N Gln-Arg-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O WOACHWLUOFZLGJ-GUBZILKMSA-N 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- KJRXLVZYJJLUCV-DCAQKATOSA-N Gln-Arg-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KJRXLVZYJJLUCV-DCAQKATOSA-N 0.000 description 1
- FJAYYNIXQNERSO-ACZMJKKPSA-N Gln-Cys-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FJAYYNIXQNERSO-ACZMJKKPSA-N 0.000 description 1
- QYKBTDOAMKORGL-FXQIFTODSA-N Gln-Gln-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QYKBTDOAMKORGL-FXQIFTODSA-N 0.000 description 1
- LFIVHGMKWFGUGK-IHRRRGAJSA-N Gln-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LFIVHGMKWFGUGK-IHRRRGAJSA-N 0.000 description 1
- JNEITCMDYWKPIW-GUBZILKMSA-N Gln-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JNEITCMDYWKPIW-GUBZILKMSA-N 0.000 description 1
- KHGGWBRVRPHFMH-PEFMBERDSA-N Gln-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHGGWBRVRPHFMH-PEFMBERDSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 1
- AMHIFFIUJOJEKJ-SZMVWBNQSA-N Gln-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N AMHIFFIUJOJEKJ-SZMVWBNQSA-N 0.000 description 1
- BJVBMSTUUWGZKX-JYJNAYRXSA-N Gln-Tyr-His Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BJVBMSTUUWGZKX-JYJNAYRXSA-N 0.000 description 1
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- GZWOBWMOMPFPCD-CIUDSAMLSA-N Glu-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N GZWOBWMOMPFPCD-CIUDSAMLSA-N 0.000 description 1
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- ZMVCLTGPGWJAEE-JYJNAYRXSA-N Glu-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)O ZMVCLTGPGWJAEE-JYJNAYRXSA-N 0.000 description 1
- OHWJUIXZHVIXJJ-GUBZILKMSA-N Glu-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N OHWJUIXZHVIXJJ-GUBZILKMSA-N 0.000 description 1
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 1
- XNOWYPDMSLSRKP-GUBZILKMSA-N Glu-Met-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O XNOWYPDMSLSRKP-GUBZILKMSA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 1
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 1
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 1
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 1
- YSDLIYZLOTZZNP-UWVGGRQHSA-N Gly-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN YSDLIYZLOTZZNP-UWVGGRQHSA-N 0.000 description 1
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 1
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 1
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 1
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 1
- 102100036738 Guanine nucleotide-binding protein subunit alpha-11 Human genes 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 102000010437 HD domains Human genes 0.000 description 1
- 108050001906 HD domains Proteins 0.000 description 1
- 101150033506 HOX gene Proteins 0.000 description 1
- MWAJSVTZZOUOBU-IHRRRGAJSA-N His-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 MWAJSVTZZOUOBU-IHRRRGAJSA-N 0.000 description 1
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 1
- WKEABZIITNXXQZ-CIUDSAMLSA-N His-Ser-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N WKEABZIITNXXQZ-CIUDSAMLSA-N 0.000 description 1
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 1
- 102100022846 Histone acetyltransferase KAT2B Human genes 0.000 description 1
- 102100029234 Histone-lysine N-methyltransferase NSD2 Human genes 0.000 description 1
- 101710196680 Histone-lysine N-methyltransferase NSD2 Proteins 0.000 description 1
- 108010048671 Homeodomain Proteins Proteins 0.000 description 1
- 102000009331 Homeodomain Proteins Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101100112025 Homo sapiens CHAF1A gene Proteins 0.000 description 1
- 101100283445 Homo sapiens GNA11 gene Proteins 0.000 description 1
- 101001046967 Homo sapiens Histone acetyltransferase KAT2A Proteins 0.000 description 1
- 101001047006 Homo sapiens Histone acetyltransferase KAT2B Proteins 0.000 description 1
- 101100342378 Homo sapiens KMT2A gene Proteins 0.000 description 1
- 101001131829 Homo sapiens P protein Proteins 0.000 description 1
- 101000835998 Homo sapiens SRA stem-loop-interacting RNA-binding protein, mitochondrial Proteins 0.000 description 1
- 101000800488 Homo sapiens T-cell leukemia homeobox protein 1 Proteins 0.000 description 1
- 101000971144 Homo sapiens Tyrosine-protein kinase BAZ1B Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- IIXDMJNYALIKGP-DJFWLOJKSA-N Ile-Asn-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IIXDMJNYALIKGP-DJFWLOJKSA-N 0.000 description 1
- FJWYJQRCVNGEAQ-ZPFDUUQYSA-N Ile-Asn-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N FJWYJQRCVNGEAQ-ZPFDUUQYSA-N 0.000 description 1
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 1
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 1
- OONBGFHNQVSUBF-KBIXCLLPSA-N Ile-Gln-Cys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(O)=O OONBGFHNQVSUBF-KBIXCLLPSA-N 0.000 description 1
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 1
- 108090001007 Interleukin-8 Proteins 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- KWURTLAFFDOTEQ-GUBZILKMSA-N Leu-Cys-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KWURTLAFFDOTEQ-GUBZILKMSA-N 0.000 description 1
- NHHKSOGJYNQENP-SRVKXCTJSA-N Leu-Cys-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N NHHKSOGJYNQENP-SRVKXCTJSA-N 0.000 description 1
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 1
- SSJBMGCZZXCGJJ-DCAQKATOSA-N Lys-Asp-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O SSJBMGCZZXCGJJ-DCAQKATOSA-N 0.000 description 1
- MRWXLRGAFDOILG-DCAQKATOSA-N Lys-Gln-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRWXLRGAFDOILG-DCAQKATOSA-N 0.000 description 1
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 1
- ZASPELYMPSACER-HOCLYGCPSA-N Lys-Gly-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZASPELYMPSACER-HOCLYGCPSA-N 0.000 description 1
- GTAXSKOXPIISBW-AVGNSLFASA-N Lys-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N GTAXSKOXPIISBW-AVGNSLFASA-N 0.000 description 1
- HQXSFFSLXFHWOX-IXOXFDKPSA-N Lys-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N)O HQXSFFSLXFHWOX-IXOXFDKPSA-N 0.000 description 1
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 1
- YWJQHDDBFAXNIR-MXAVVETBSA-N Lys-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N YWJQHDDBFAXNIR-MXAVVETBSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- GVKINWYYLOLEFQ-XIRDDKMYSA-N Lys-Trp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O GVKINWYYLOLEFQ-XIRDDKMYSA-N 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- ACYHZNZHIZWLQF-BQBZGAKWSA-N Met-Asn-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ACYHZNZHIZWLQF-BQBZGAKWSA-N 0.000 description 1
- NCVJJAJVWILAGI-SRVKXCTJSA-N Met-Gln-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NCVJJAJVWILAGI-SRVKXCTJSA-N 0.000 description 1
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 1
- OTKQHDPECKUDSB-SZMVWBNQSA-N Met-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OTKQHDPECKUDSB-SZMVWBNQSA-N 0.000 description 1
- 210000004460 N cell Anatomy 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 108091008758 NR0A5 Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108010047956 Nucleosomes Proteins 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 1
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 1
- OPEVYHFJXLCCRT-AVGNSLFASA-N Phe-Gln-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O OPEVYHFJXLCCRT-AVGNSLFASA-N 0.000 description 1
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 1
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 1
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 108091036407 Polyadenylation Proteins 0.000 description 1
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 1
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 1
- WECYCNFPGZLOOU-FXQIFTODSA-N Pro-Asn-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O WECYCNFPGZLOOU-FXQIFTODSA-N 0.000 description 1
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- HBBBLSVBQGZKOZ-GUBZILKMSA-N Pro-Met-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O HBBBLSVBQGZKOZ-GUBZILKMSA-N 0.000 description 1
- ZJXXCGZFYQQETF-CYDGBPFRSA-N Pro-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 ZJXXCGZFYQQETF-CYDGBPFRSA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- OOZJHTXCLJUODH-QXEWZRGKSA-N Pro-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 OOZJHTXCLJUODH-QXEWZRGKSA-N 0.000 description 1
- 102000006478 Protein Phosphatase 2 Human genes 0.000 description 1
- 108010058956 Protein Phosphatase 2 Proteins 0.000 description 1
- 108010087776 Proto-Oncogene Proteins c-myb Proteins 0.000 description 1
- 102000009096 Proto-Oncogene Proteins c-myb Human genes 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- -1 S45251) Proteins 0.000 description 1
- 102100025491 SRA stem-loop-interacting RNA-binding protein, mitochondrial Human genes 0.000 description 1
- 108010041897 SU(VAR)3-9 Proteins 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 1
- KNCJWSPMTFFJII-ZLUOBGJFSA-N Ser-Cys-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KNCJWSPMTFFJII-ZLUOBGJFSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- QNBVFKZSSRYNFX-CUJWVEQBSA-N Ser-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N)O QNBVFKZSSRYNFX-CUJWVEQBSA-N 0.000 description 1
- 101150040974 Set gene Proteins 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 108700042076 T-Cell Receptor alpha Genes Proteins 0.000 description 1
- 102100033111 T-cell leukemia homeobox protein 1 Human genes 0.000 description 1
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 1
- UYTYTDMCDBPDSC-URLPEUOOSA-N Thr-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N UYTYTDMCDBPDSC-URLPEUOOSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 1
- BZTSQFWJNJYZSX-JRQIVUDYSA-N Thr-Tyr-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O BZTSQFWJNJYZSX-JRQIVUDYSA-N 0.000 description 1
- 102100030246 Transcription factor Sp1 Human genes 0.000 description 1
- 101710085924 Transcription factor Sp1 Proteins 0.000 description 1
- DNUJCLUFRGGSDJ-YLVFBTJISA-N Trp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DNUJCLUFRGGSDJ-YLVFBTJISA-N 0.000 description 1
- UUZYQOUJTORBQO-ZVZYQTTQSA-N Trp-Val-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 UUZYQOUJTORBQO-ZVZYQTTQSA-N 0.000 description 1
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 1
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 1
- JBBYKPZAPOLCPK-JYJNAYRXSA-N Tyr-Arg-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O JBBYKPZAPOLCPK-JYJNAYRXSA-N 0.000 description 1
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 1
- XMNDQSYABVWZRK-BZSNNMDCSA-N Tyr-Asn-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XMNDQSYABVWZRK-BZSNNMDCSA-N 0.000 description 1
- ARMNWLJYHCOSHE-KKUMJFAQSA-N Tyr-Pro-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O ARMNWLJYHCOSHE-KKUMJFAQSA-N 0.000 description 1
- VYQQQIRHIFALGE-UWJYBYFXSA-N Tyr-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VYQQQIRHIFALGE-UWJYBYFXSA-N 0.000 description 1
- 102100021575 Tyrosine-protein kinase BAZ1B Human genes 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- JXCOEPXCBVCTRD-JYJNAYRXSA-N Val-Tyr-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JXCOEPXCBVCTRD-JYJNAYRXSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 108010045514 alpha-lactorphin Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000000612 antigen-presenting cell Anatomy 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 230000006718 epigenetic regulation Effects 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 102000047119 human OCA2 Human genes 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 238000002826 magnetic-activated cell sorting Methods 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 210000001623 nucleosome Anatomy 0.000 description 1
- 101150095319 orc1 gene Proteins 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000007918 pathogenicity Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 101150013400 rag1 gene Proteins 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 102220058908 rs751646468 Human genes 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 210000002536 stromal cell Anatomy 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 108091035539 telomere Proteins 0.000 description 1
- 102000055501 telomere Human genes 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- 230000002992 thymic effect Effects 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Landscapes
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Peptides Or Proteins (AREA)
Abstract
(57)【要約】
【課題】 未分化な胸腺細胞で発現され、末梢の成熟T
細胞には発現されない、未分化な胸腺細胞に特異的なT
細胞分化調節因子を提供する。 【解決手段】 ショウジョウバエの転写因子ASH1に
高い相同性のある遺伝子SAB1をマウスからクローニ
ングし、その断片であるSETドメイン及びPHDドメ
インを得る。 【効果】 SET及びPHDドメインがT細胞又はNK
T細胞の分化を抑制する。
細胞には発現されない、未分化な胸腺細胞に特異的なT
細胞分化調節因子を提供する。 【解決手段】 ショウジョウバエの転写因子ASH1に
高い相同性のある遺伝子SAB1をマウスからクローニ
ングし、その断片であるSETドメイン及びPHDドメ
インを得る。 【効果】 SET及びPHDドメインがT細胞又はNK
T細胞の分化を抑制する。
Description
【0001】
【発明の属する技術分野】本発明はT細胞若しくはNK
T細胞、血液細胞又は神経細胞の分化調節因子に関す
る。より詳細には本発明は、未分化な胸腺細胞で特異的
に発現される遺伝子調節因子の一部の構造を有する分化
調節因子に関する。
T細胞、血液細胞又は神経細胞の分化調節因子に関す
る。より詳細には本発明は、未分化な胸腺細胞で特異的
に発現される遺伝子調節因子の一部の構造を有する分化
調節因子に関する。
【0002】
【従来の技術】抗原提示細胞や標的細胞中で抗原プロセ
シングを受け細胞内で分解されたペプチド断片は、MH
C分子(主要組織適合抗原)に結合して、細胞の表面に
抗原−MHC複合体として提示される(抗原提示)。T
細胞はこの抗原−MHC複合体を認識するが、その認識
を担い抗原特異性を決定するのが、T細胞受容体(TC
R)である。このTCRの抗原認識に伴う活性化の結
果、未熟T細胞においては分化、選択が、成熟T細胞に
おいては増殖、不応答状態、細胞死が誘導される。さら
にTCRは遺伝子再編成に基づいて抗原認識に膨大な多
様性を発揮する。
シングを受け細胞内で分解されたペプチド断片は、MH
C分子(主要組織適合抗原)に結合して、細胞の表面に
抗原−MHC複合体として提示される(抗原提示)。T
細胞はこの抗原−MHC複合体を認識するが、その認識
を担い抗原特異性を決定するのが、T細胞受容体(TC
R)である。このTCRの抗原認識に伴う活性化の結
果、未熟T細胞においては分化、選択が、成熟T細胞に
おいては増殖、不応答状態、細胞死が誘導される。さら
にTCRは遺伝子再編成に基づいて抗原認識に膨大な多
様性を発揮する。
【0003】細胞系譜決定及び細胞分化の過程には高次
クロマチン構造の後成的調節が基礎にあると考えられて
いる(Festenstein et al.,Sci
ence,271,1123−1125(199
6))。初期のT細胞発生においては、分化の進行は再
編成されたTCR遺伝子産物によって構成されるプレT
細胞受容体及びT細胞受容体を介したフィードバックシ
グナル(TCRシグナル)によって調節されるが、これ
はras−MAPキナーゼ系のシグナル伝達機構に依存
していることが知られている(Tanaka et a
l.,Immunol.Rev.,148,71−19
9(1995))。このようなフィードバックシグナル
がないと、組換え活性化遺伝子(RAG)−1欠損マウ
スやTCRα欠損マウスのように、T細胞の分化がCD
4-CD8-又はCD4+CD8+段階で止まってしまうこ
とになる(図1A)。
クロマチン構造の後成的調節が基礎にあると考えられて
いる(Festenstein et al.,Sci
ence,271,1123−1125(199
6))。初期のT細胞発生においては、分化の進行は再
編成されたTCR遺伝子産物によって構成されるプレT
細胞受容体及びT細胞受容体を介したフィードバックシ
グナル(TCRシグナル)によって調節されるが、これ
はras−MAPキナーゼ系のシグナル伝達機構に依存
していることが知られている(Tanaka et a
l.,Immunol.Rev.,148,71−19
9(1995))。このようなフィードバックシグナル
がないと、組換え活性化遺伝子(RAG)−1欠損マウ
スやTCRα欠損マウスのように、T細胞の分化がCD
4-CD8-又はCD4+CD8+段階で止まってしまうこ
とになる(図1A)。
【0004】
【発明が解決しようとする課題】リンパ球や血液細胞等
がその未分化な前駆細胞から形成されるためには、細胞
分化に伴ってそれぞれ特異的な遺伝子発現パターンを確
立する必要がある。従来、遺伝子の発現調節については
プロモーターの特異的な配列を認識しRNAポリメラー
ゼによる転写活性を高める因子が詳細に解析されてきた
が、これらの転写因子が細胞核の中でクロマチンと呼ば
れる複雑な高次構造を保っている標的遺伝子をどのよう
に認識するかという機序に関しては、分子レベルでの解
明が待たれていた。
がその未分化な前駆細胞から形成されるためには、細胞
分化に伴ってそれぞれ特異的な遺伝子発現パターンを確
立する必要がある。従来、遺伝子の発現調節については
プロモーターの特異的な配列を認識しRNAポリメラー
ゼによる転写活性を高める因子が詳細に解析されてきた
が、これらの転写因子が細胞核の中でクロマチンと呼ば
れる複雑な高次構造を保っている標的遺伝子をどのよう
に認識するかという機序に関しては、分子レベルでの解
明が待たれていた。
【0005】本発明は、胸腺・骨髄・中枢神経などでそ
れぞれT細胞・血液細胞・神経細胞などに分化する前駆
細胞においてクロマチン構造を調節し、クロマチンレベ
ルでの遺伝子制御によって細胞の分化を調節する因子を
提供することを目的とする。
れぞれT細胞・血液細胞・神経細胞などに分化する前駆
細胞においてクロマチン構造を調節し、クロマチンレベ
ルでの遺伝子制御によって細胞の分化を調節する因子を
提供することを目的とする。
【0006】
【課題を解決するための手段】本発明者はT細胞又はN
KT細胞の分化調節因子を探索する目的で、未分化な胸
腺細胞(T細胞又はNKT細胞の前駆細胞を含むと考え
られる)に特異的に発現される遺伝子調節因子をスクリ
ーニングし、ショウジョウバエでクロマチンの高次構造
を制御することが知られている転写因子ASH1に高い
相同性のある遺伝子SAB1(配列番号3)を発見し、
その一部分であるSETドメイン(配列番号2)又はP
HDドメイン(配列番号1)がT細胞又はNKT細胞の
分化を調節する重要な因子であることを見出し、本発明
をなすに至った。
KT細胞の分化調節因子を探索する目的で、未分化な胸
腺細胞(T細胞又はNKT細胞の前駆細胞を含むと考え
られる)に特異的に発現される遺伝子調節因子をスクリ
ーニングし、ショウジョウバエでクロマチンの高次構造
を制御することが知られている転写因子ASH1に高い
相同性のある遺伝子SAB1(配列番号3)を発見し、
その一部分であるSETドメイン(配列番号2)又はP
HDドメイン(配列番号1)がT細胞又はNKT細胞の
分化を調節する重要な因子であることを見出し、本発明
をなすに至った。
【0007】本発明は、配列番号1若しくは2のアミノ
酸配列、又は一個若しくは数個のアミノ酸が欠失、置換
若しくは付加されたアミノ酸配列からなるT細胞分化調
節因子に関する。
酸配列、又は一個若しくは数個のアミノ酸が欠失、置換
若しくは付加されたアミノ酸配列からなるT細胞分化調
節因子に関する。
【0008】本発明はまた、配列番号1若しくは2のア
ミノ酸配列、又は一個若しくは数個のアミノ酸が欠失、
置換若しくは付加されたアミノ酸配列からなるT細胞分
化調節因子を含むT細胞分化阻害剤に関する。
ミノ酸配列、又は一個若しくは数個のアミノ酸が欠失、
置換若しくは付加されたアミノ酸配列からなるT細胞分
化調節因子を含むT細胞分化阻害剤に関する。
【0009】本発明はさらにまた、配列番号1若しくは
2のアミノ酸配列、又は一個若しくは数個のアミノ酸が
欠失、置換若しくは付加されたアミノ酸配列からなるT
細胞分化調節因子を含むHOXA5遺伝子発現阻害剤に
関する。
2のアミノ酸配列、又は一個若しくは数個のアミノ酸が
欠失、置換若しくは付加されたアミノ酸配列からなるT
細胞分化調節因子を含むHOXA5遺伝子発現阻害剤に
関する。
【0010】本発明はさらにまた、以下の(a)又は
(b)のタンパク質: (a)配列番号3のアミノ酸配列からなるタンパク質、
(b)配列番号3のアミノ酸配列において一個又は数個
のアミノ酸が欠失、置換又は付加されたアミノ酸配列か
らなり、かつT細胞分化促進活性を有するタンパク質に
関する。
(b)のタンパク質: (a)配列番号3のアミノ酸配列からなるタンパク質、
(b)配列番号3のアミノ酸配列において一個又は数個
のアミノ酸が欠失、置換又は付加されたアミノ酸配列か
らなり、かつT細胞分化促進活性を有するタンパク質に
関する。
【0011】本発明はさらにまた、上記(a)又は
(b)のタンパク質をコードする遺伝子に関する。本発
明はさらにまた、以下の(c)又は(d)からなる遺伝
子: (c)配列番号4の塩基配列からなるDNA、(d)配
列番号4の塩基配列からなるDNAとストリンジェント
な条件でハイブリダイズし、かつT細胞分化促進活性を
有するタンパク質をコードするDNA、に関する。
(b)のタンパク質をコードする遺伝子に関する。本発
明はさらにまた、以下の(c)又は(d)からなる遺伝
子: (c)配列番号4の塩基配列からなるDNA、(d)配
列番号4の塩基配列からなるDNAとストリンジェント
な条件でハイブリダイズし、かつT細胞分化促進活性を
有するタンパク質をコードするDNA、に関する。
【0012】本発明はさらにまた、上記(a)又は
(b)のタンパク質のタンパク質を含むT細胞分化調節
因子に関する。本発明はさらにまた、上記(a)又は
(b)のタンパク質を含むT細胞分化促進剤に関する。
(b)のタンパク質のタンパク質を含むT細胞分化調節
因子に関する。本発明はさらにまた、上記(a)又は
(b)のタンパク質を含むT細胞分化促進剤に関する。
【0013】
【発明の実施の形態】CD4-CD8-段階以降の、T細
胞分化のための新規な後成的遺伝子調節因子を同定する
ために、本発明者はマウスから、サプレッションサブト
ラクティブPCRにより分化が阻止されたRAG1-/-
胸腺細胞において優先的に発現される遺伝子をスクリー
ニングしたところ、単離されたクローンのうち、或るク
ローン(A25)が、ショウジョウバエのトリソラック
スグループ(trx−G)の一員であるASH1(ab
sent,small,or homeotic di
scs−1)(Tripoulas et al.,G
enetics,143,913−928(199
6))のPHDフィンガーと高い相同性を示すことを見
出した。
胞分化のための新規な後成的遺伝子調節因子を同定する
ために、本発明者はマウスから、サプレッションサブト
ラクティブPCRにより分化が阻止されたRAG1-/-
胸腺細胞において優先的に発現される遺伝子をスクリー
ニングしたところ、単離されたクローンのうち、或るク
ローン(A25)が、ショウジョウバエのトリソラック
スグループ(trx−G)の一員であるASH1(ab
sent,small,or homeotic di
scs−1)(Tripoulas et al.,G
enetics,143,913−928(199
6))のPHDフィンガーと高い相同性を示すことを見
出した。
【0014】本発明のT細胞分化調節因子は、未分化な
胸腺細胞で特異的に発現されるが、末梢の成熟T細胞で
は発現されない。図1Bに示すように、A25由来のプ
ライマーセットにより増幅したmRNAは野生種の胸腺
細胞よりもRAG1-/-及びTCRα-/-胸腺細胞の方が
約十倍も多く存在する。このことはA25がβ−選択又
はポジティブ選択をこれから受ける細胞中に蓄積するこ
とを示唆している。ここでTCRα-/-の胸腺細胞と野
生種の胸腺細胞との間の定量的な差は、野生種の胸腺細
胞の一分画のみを代表するにすぎない成熟CD4及びC
D8T細胞によって説明できるほど単純ではなく、むし
ろ、この定量的な差はTCRα-/-胸腺細胞におけるC
D4+CD8+細胞と野生種胸腺におけるCD4+CD8+
細胞との間の定性的な差を強調しているといえる。
胸腺細胞で特異的に発現されるが、末梢の成熟T細胞で
は発現されない。図1Bに示すように、A25由来のプ
ライマーセットにより増幅したmRNAは野生種の胸腺
細胞よりもRAG1-/-及びTCRα-/-胸腺細胞の方が
約十倍も多く存在する。このことはA25がβ−選択又
はポジティブ選択をこれから受ける細胞中に蓄積するこ
とを示唆している。ここでTCRα-/-の胸腺細胞と野
生種の胸腺細胞との間の定量的な差は、野生種の胸腺細
胞の一分画のみを代表するにすぎない成熟CD4及びC
D8T細胞によって説明できるほど単純ではなく、むし
ろ、この定量的な差はTCRα-/-胸腺細胞におけるC
D4+CD8+細胞と野生種胸腺におけるCD4+CD8+
細胞との間の定性的な差を強調しているといえる。
【0015】A25クローンのための完全長cDNAを
cDNA末端の急速増幅(RACE)とcDNAライブ
ラリースクリーニングにより単離し、sab1と命名し
た。マウスのsab1 cDNA(配列番号4)は、新
規な2669個のアミノ酸からなる蛋白質(配列番号
3)をコードしており(配列番号9)、ヒトSEBやシ
ョウジョウバエASH1に高い相同性を有している。S
IMアラインメントの結果、SAB1672-1564対SEB
591-1407で39.3%、SAB11692-2529対ASH1
1221-2086で42.1%であった。マウスのSAB1
(mSAB1;配列番号3)は二つの部分からなる核局
在化シグナルを7つ有し、N末端からC末端の順にAT
フックモチーフ、拡張SET(Su(var)3−9,E
(z),and trxhomologyの略)ドメイン、ブロモドメ
イン、PHDフィンガー、及びBAH(bromo−adjacen
t homologyの略)ドメインの組合せを有する(図2
A)。
cDNA末端の急速増幅(RACE)とcDNAライブ
ラリースクリーニングにより単離し、sab1と命名し
た。マウスのsab1 cDNA(配列番号4)は、新
規な2669個のアミノ酸からなる蛋白質(配列番号
3)をコードしており(配列番号9)、ヒトSEBやシ
ョウジョウバエASH1に高い相同性を有している。S
IMアラインメントの結果、SAB1672-1564対SEB
591-1407で39.3%、SAB11692-2529対ASH1
1221-2086で42.1%であった。マウスのSAB1
(mSAB1;配列番号3)は二つの部分からなる核局
在化シグナルを7つ有し、N末端からC末端の順にAT
フックモチーフ、拡張SET(Su(var)3−9,E
(z),and trxhomologyの略)ドメイン、ブロモドメ
イン、PHDフィンガー、及びBAH(bromo−adjacen
t homologyの略)ドメインの組合せを有する(図2
A)。
【0016】クローン化されたsab1 cDNAは長
さ10.5kbで胸腺における転写産物サイズにほぼ匹
敵している(図1C)。未熟T細胞においてsab1が
優先的に発現するということと一致してsab1転写産
物はリンパ節においてはほとんど検出できない。特にs
ab1はまた脳(大脳)において高濃度で発現する。脳
における転写産物サイズは13kbであり、このことは
異なる態様でスプライシングを受けるエクソンが存在す
ることを示唆している。
さ10.5kbで胸腺における転写産物サイズにほぼ匹
敵している(図1C)。未熟T細胞においてsab1が
優先的に発現するということと一致してsab1転写産
物はリンパ節においてはほとんど検出できない。特にs
ab1はまた脳(大脳)において高濃度で発現する。脳
における転写産物サイズは13kbであり、このことは
異なる態様でスプライシングを受けるエクソンが存在す
ることを示唆している。
【0017】SAB1はPHD(配列番号1)と呼ばれ
るC4HC3型亜鉛結合モチーフを有している。このPH
DドメインはSAB1のアミノ酸配列(配列番号3)の
残基2285〜2331に相当し、その対応DNAはs
ab1 cDNA(配列番号4)の塩基7396〜75
36に相当する。このPHDはASH1(70.2%の
同一性)やC.elegans LIN−59(33.
1%の同一性)において見出されるタンパク質と高度な
相同性を有しており、またヒストンデアセチラーゼと相
互作用することが知られているMi−2(Zhang
et al,Cell,95,279−289(199
8))やATRX(McDowellet al,Pr
oc.Natl.Acad.Sci.USA 96,1
3983−13988(1999))とも高度な相同性
を有している(図2B)。SAB1のPHDフィンガー
は、非メチル化CpGに結合し得るDnmt(DNAメ
チルトランスフェラーゼ)及びALL1に存在するシス
テインリッチ(CXXC)転写抑制ドメイン(Cros
s et al,Nature Genet.,16,
256−259(1997),Shin Voo et
al,Mol.Cell.Biol.,20,210
8−2121(2000))に整列している。SAB1
のPHDに隣接してBAHドメインが存在し、これはO
rc1 BAHドメインの場合(Triolo et
al,Nature 381,251−252(199
6)及びPak et al,Cell 91,311
−323(1997))と同様に遺伝子サイレンシング
に密接な関係のあると思われるASH1及びLIN−5
9に対してそれぞれ47.7%及び33.1%の同一性
を有している。
るC4HC3型亜鉛結合モチーフを有している。このPH
DドメインはSAB1のアミノ酸配列(配列番号3)の
残基2285〜2331に相当し、その対応DNAはs
ab1 cDNA(配列番号4)の塩基7396〜75
36に相当する。このPHDはASH1(70.2%の
同一性)やC.elegans LIN−59(33.
1%の同一性)において見出されるタンパク質と高度な
相同性を有しており、またヒストンデアセチラーゼと相
互作用することが知られているMi−2(Zhang
et al,Cell,95,279−289(199
8))やATRX(McDowellet al,Pr
oc.Natl.Acad.Sci.USA 96,1
3983−13988(1999))とも高度な相同性
を有している(図2B)。SAB1のPHDフィンガー
は、非メチル化CpGに結合し得るDnmt(DNAメ
チルトランスフェラーゼ)及びALL1に存在するシス
テインリッチ(CXXC)転写抑制ドメイン(Cros
s et al,Nature Genet.,16,
256−259(1997),Shin Voo et
al,Mol.Cell.Biol.,20,210
8−2121(2000))に整列している。SAB1
のPHDに隣接してBAHドメインが存在し、これはO
rc1 BAHドメインの場合(Triolo et
al,Nature 381,251−252(199
6)及びPak et al,Cell 91,311
−323(1997))と同様に遺伝子サイレンシング
に密接な関係のあると思われるASH1及びLIN−5
9に対してそれぞれ47.7%及び33.1%の同一性
を有している。
【0018】SAB1はホメオティック遺伝子のポジテ
ィブレギュレーター(trx−G)及びネガティブレギ
ュレーター(Pc−G)の両方に見出し得るSETドメ
イン(配列番号2)を有している。このSETドメイン
はSAB1のアミノ酸配列(配列番号3)の残基183
8〜1986に相当し、その対応DNAはsab1cD
NA(配列番号4)の塩基6055〜6501に相当す
る。
ィブレギュレーター(trx−G)及びネガティブレギ
ュレーター(Pc−G)の両方に見出し得るSETドメ
イン(配列番号2)を有している。このSETドメイン
はSAB1のアミノ酸配列(配列番号3)の残基183
8〜1986に相当し、その対応DNAはsab1cD
NA(配列番号4)の塩基6055〜6501に相当す
る。
【0019】SAB1のSETドメインはショウジョウ
バエのtrxとともにホモ二量化及びヘテロ二量化を仲
介することが示されているASH1の一つ(Razov
skaia et al,Mol.Cell Bio
l.,19,6441−6447(1999),Raz
ovskaia et al,Oncogene,1
9,351−357(2000))と49.3%の同一
性を共有している。SET−PHD−BAHドメインの
進化的保存とともに、SAB1の組織特異的及び発生段
階特異的な発現は、このようなドメインが初期T細胞発
生において重要な役割を演じることを強く示唆するもの
である。
バエのtrxとともにホモ二量化及びヘテロ二量化を仲
介することが示されているASH1の一つ(Razov
skaia et al,Mol.Cell Bio
l.,19,6441−6447(1999),Raz
ovskaia et al,Oncogene,1
9,351−357(2000))と49.3%の同一
性を共有している。SET−PHD−BAHドメインの
進化的保存とともに、SAB1の組織特異的及び発生段
階特異的な発現は、このようなドメインが初期T細胞発
生において重要な役割を演じることを強く示唆するもの
である。
【0020】本発明者は優性ネガティブコンペティター
としてSAB1(配列番号3)のSETドメイン(配列
番号2)又はPHDドメイン(配列番号1)のいずれか
を発現させることにより、T細胞の内在的SAB1の機
能を阻害することを試みたところ、T細胞発生の特定の
段階において要求されるSAB1の重要な機能的ドメイ
ンを決定することができた。すなわち、SAB1だけで
なく、SAB1の一部分であるSET又はPHDドメイ
ンがT細胞又はNKT細胞の分化を調節する重要な因子
であることを見出し、本発明がなされたのである。
としてSAB1(配列番号3)のSETドメイン(配列
番号2)又はPHDドメイン(配列番号1)のいずれか
を発現させることにより、T細胞の内在的SAB1の機
能を阻害することを試みたところ、T細胞発生の特定の
段階において要求されるSAB1の重要な機能的ドメイ
ンを決定することができた。すなわち、SAB1だけで
なく、SAB1の一部分であるSET又はPHDドメイ
ンがT細胞又はNKT細胞の分化を調節する重要な因子
であることを見出し、本発明がなされたのである。
【0021】本発明において、T細胞分化促進活性と
は、ある検出系でT細胞を一段階上のより成熟した段階
に向かわせる作用をいい、例えばCD4-CD8-からC
D4+CD8+細胞へ向かわせる作用をいう。
は、ある検出系でT細胞を一段階上のより成熟した段階
に向かわせる作用をいい、例えばCD4-CD8-からC
D4+CD8+細胞へ向かわせる作用をいう。
【0022】得られたsab1遺伝子等の遺伝子治療等
への応用は、sab1に異常のある患者から細胞を取り
だし、細胞にsab1を投与し、その細胞を培養した
後、再び生体内に導入することにより行うことができ
る。遺伝子の投与は、遺伝子をベクターDNAに組み込
み導入することにより細胞内で発現させる方法がある。
ここで使用できるベクターとしては、病原性をなくした
ウイルス(ウイルスベクター法など)やウイルスベクタ
ーの副作用を避けた人工ベクター(リポフェクション法
など)を挙げることができる。
への応用は、sab1に異常のある患者から細胞を取り
だし、細胞にsab1を投与し、その細胞を培養した
後、再び生体内に導入することにより行うことができ
る。遺伝子の投与は、遺伝子をベクターDNAに組み込
み導入することにより細胞内で発現させる方法がある。
ここで使用できるベクターとしては、病原性をなくした
ウイルス(ウイルスベクター法など)やウイルスベクタ
ーの副作用を避けた人工ベクター(リポフェクション法
など)を挙げることができる。
【0023】SAB1はクロマチンの高次構造を制御す
る遺伝子群に特徴的な五つのドメインを有している。こ
れらのドメインの正確な機能は現時点では不明である
が、既知のタンパク質との相同性から推察するとN末端
から順に、(1)ATフックモチーフを多く含み、SE
T/NAP1(ヒストンシャペロン)に結合すると予想
される領域、(2)トリソラックスやポリコムなどのク
ロマチン制御因子との相互作用に関与すると思われるS
ETドメイン、(3)アセチル化ヒストンに結合する可
能性のあるブロモドメイン、(4)CBP/p300な
どの転写活性化因子と反応するPHDフィンガー、及び
(5)遺伝子発現抑制との関連が示唆されているBAH
ドメインが並んでいる。この中で、ヒストンシャペロン
結合ドメイン、ブロモドメイン、PHDドメインの三つ
は、いずれもクロマチンの基本単位であるヌクレオソー
ムとその構成分子ヒストンの動態に深い関わりを持って
いることが予想される。
る遺伝子群に特徴的な五つのドメインを有している。こ
れらのドメインの正確な機能は現時点では不明である
が、既知のタンパク質との相同性から推察するとN末端
から順に、(1)ATフックモチーフを多く含み、SE
T/NAP1(ヒストンシャペロン)に結合すると予想
される領域、(2)トリソラックスやポリコムなどのク
ロマチン制御因子との相互作用に関与すると思われるS
ETドメイン、(3)アセチル化ヒストンに結合する可
能性のあるブロモドメイン、(4)CBP/p300な
どの転写活性化因子と反応するPHDフィンガー、及び
(5)遺伝子発現抑制との関連が示唆されているBAH
ドメインが並んでいる。この中で、ヒストンシャペロン
結合ドメイン、ブロモドメイン、PHDドメインの三つ
は、いずれもクロマチンの基本単位であるヌクレオソー
ムとその構成分子ヒストンの動態に深い関わりを持って
いることが予想される。
【0024】特にSAB1の一部分であるPHDドメイ
ン(配列番号1)は、レトロウイルスを用いて未分化な
胸腺細胞に導入すると、内因性SAB1タンパク質と競
合してT細胞の分化を阻害する。また、SETドメイン
(配列番号2)も程度は落ちるものの同様にT細胞の分
化を阻害する。即ち、SAB1は胸腺のCD4-CD8-
及びCD4+CD8+細胞に特異的に発現されており、C
D4-CD8-においてその機能を競合的に阻害するとC
D4+CD8+細胞への分化が抑制され、従ってより成熟
したCD4細胞又はCD8細胞の産生も起こらなくな
る。
ン(配列番号1)は、レトロウイルスを用いて未分化な
胸腺細胞に導入すると、内因性SAB1タンパク質と競
合してT細胞の分化を阻害する。また、SETドメイン
(配列番号2)も程度は落ちるものの同様にT細胞の分
化を阻害する。即ち、SAB1は胸腺のCD4-CD8-
及びCD4+CD8+細胞に特異的に発現されており、C
D4-CD8-においてその機能を競合的に阻害するとC
D4+CD8+細胞への分化が抑制され、従ってより成熟
したCD4細胞又はCD8細胞の産生も起こらなくな
る。
【0025】さらに、SAB1のPHDドメイン(配列
番号1)は、前骨髄性白血病細胞であるHL60に発現
させると、血液幹細胞の増殖と分化に重要な役割を持っ
ているHOXA5遺伝子の発現をも抑制する。ヒトSA
B1のプロモーターには普遍的な転写因子であるSp1
に加えて血液細胞やリンパ球に特異的なc−Myb及び
C/EBPαなどの認識部位があり、SAB1はこれら
の転写因子の制御下にあってHOX遺伝子などを介して
血液細胞やT細胞の前駆細胞がそれぞれどのような分化
経路を選択するかを決定する機構に関わっていると考え
られる。
番号1)は、前骨髄性白血病細胞であるHL60に発現
させると、血液幹細胞の増殖と分化に重要な役割を持っ
ているHOXA5遺伝子の発現をも抑制する。ヒトSA
B1のプロモーターには普遍的な転写因子であるSp1
に加えて血液細胞やリンパ球に特異的なc−Myb及び
C/EBPαなどの認識部位があり、SAB1はこれら
の転写因子の制御下にあってHOX遺伝子などを介して
血液細胞やT細胞の前駆細胞がそれぞれどのような分化
経路を選択するかを決定する機構に関わっていると考え
られる。
【0026】PHDドメインを介するSAB1と他のタ
ンパク質との相互作用がCD4-CD8-細胞の分化に極
めて重要であり、結果としてSAB1がCD4-CD8-
細胞の分化においてスイッチの役割を担っている。ま
た、SAB1が図2C(Muchardt et a
l,EMBO J.12,4279−4290(199
3);Khavari et al.,Nature
366,170−174(1993);Ito et
al.,Genes Dev.13,1529−153
9(1999))に示すように、BRM及びBRG1
(酵母SWI2/SNF2の哺乳類ホモログ)及びWS
TF(ショウジョウバエAcf1の哺乳類ホモログ)の
ようなクロマチン再構成因子に特徴的なブロモドメイン
を有していることから、高次のクロマチン構造の調節に
直接関与していることが考えられる。
ンパク質との相互作用がCD4-CD8-細胞の分化に極
めて重要であり、結果としてSAB1がCD4-CD8-
細胞の分化においてスイッチの役割を担っている。ま
た、SAB1が図2C(Muchardt et a
l,EMBO J.12,4279−4290(199
3);Khavari et al.,Nature
366,170−174(1993);Ito et
al.,Genes Dev.13,1529−153
9(1999))に示すように、BRM及びBRG1
(酵母SWI2/SNF2の哺乳類ホモログ)及びWS
TF(ショウジョウバエAcf1の哺乳類ホモログ)の
ようなクロマチン再構成因子に特徴的なブロモドメイン
を有していることから、高次のクロマチン構造の調節に
直接関与していることが考えられる。
【0027】酵母GCN5及びヒトP/CAF中のブロ
モドメインはヒストンH3及びH4のN末端尾部に結合
することが示されているので(Ornaghi et
al.,J.Mol.Biol. 287,1−7(1
999);Dhalluinet al.,Natur
e 399,491−496(1999))、SAB1
がヒストン上の後成的遺伝子マーク(アセチル化ヒスト
ンなど生化学的に修飾されたクロマチンの構造)を認識
している可能性がある。ショウジョウバエASH1は、
ショウジョウバエゲノム中のメチルCpGの欠失のよう
な基本的な生物学的相違を反映していると考えられる偽
ブロモドメイン(図2C及び図2AにおけるΨBRO
M)を有している。
モドメインはヒストンH3及びH4のN末端尾部に結合
することが示されているので(Ornaghi et
al.,J.Mol.Biol. 287,1−7(1
999);Dhalluinet al.,Natur
e 399,491−496(1999))、SAB1
がヒストン上の後成的遺伝子マーク(アセチル化ヒスト
ンなど生化学的に修飾されたクロマチンの構造)を認識
している可能性がある。ショウジョウバエASH1は、
ショウジョウバエゲノム中のメチルCpGの欠失のよう
な基本的な生物学的相違を反映していると考えられる偽
ブロモドメイン(図2C及び図2AにおけるΨBRO
M)を有している。
【0028】高度に保存されたC末端とは対照的に、S
AB1とASH1のN末端の間にはほとんどホモロジー
はない(図2A)。機能的類似性が依然として観察され
るのは、SAB1 N末端がヒトタンパク質(SEB)
に高度に相同であり、これがSET/NAPファミリー
ヒストンシャペロンに結合するからであり(vonLi
ndern et al.,Mol.Cell Bio
l. 12,3346−3355(1992))、一方
ASH1 N末端はSET/NAPに相同な領域を含ん
でいるからである。SETは細胞周期におけるG2/M
遷移を調節する分子であるタンパク質フォスファターゼ
2Aの阻害剤であり、ヒトALL1のATフックトリプ
レットとSETとの相互作用はヒトの白血病発生に関与
していると考えられる(Adler et al.,
J.Biol.Chem. 272,28407−28
414(1997))。染色体1q21(これは様々な
リンパ腫においてしばしば転座することが知られてい
る)上のヒトsab1遺伝子のマッピングによりsab
1を含む染色体転座がヒトの悪性腫瘍に関連していると
いう見解が指示される。
AB1とASH1のN末端の間にはほとんどホモロジー
はない(図2A)。機能的類似性が依然として観察され
るのは、SAB1 N末端がヒトタンパク質(SEB)
に高度に相同であり、これがSET/NAPファミリー
ヒストンシャペロンに結合するからであり(vonLi
ndern et al.,Mol.Cell Bio
l. 12,3346−3355(1992))、一方
ASH1 N末端はSET/NAPに相同な領域を含ん
でいるからである。SETは細胞周期におけるG2/M
遷移を調節する分子であるタンパク質フォスファターゼ
2Aの阻害剤であり、ヒトALL1のATフックトリプ
レットとSETとの相互作用はヒトの白血病発生に関与
していると考えられる(Adler et al.,
J.Biol.Chem. 272,28407−28
414(1997))。染色体1q21(これは様々な
リンパ腫においてしばしば転座することが知られてい
る)上のヒトsab1遺伝子のマッピングによりsab
1を含む染色体転座がヒトの悪性腫瘍に関連していると
いう見解が指示される。
【0029】SAB1のN末端は上述のようにSETタ
ンパク質を介して細胞周期調節因子であるPP2Aの活
性を制御している可能性が高い。ここで注目されるの
は、SAB1と相同性のあるALL1やMMSET(い
ずれもトリソラックスグループに属する)ばかりでな
く、set遺伝子自体も白血病で転座を起こすことであ
る。PP2A活性の制御不全が多くの白血病の原因の一
つとなっているという可能性は、やはり白血病で転座す
ることのあるHOX11がSETタンパク質と同様PP
2A活性を抑制するということからも支持される。AL
L1ではSET結合ドメインを含むN末端が白血病の発
生に十分であることから、染色体1q21上のsab1
遺伝子が転座を起こしてSAB1のN末端が発現された
場合、PP2A活性の制御不全から細胞の増殖異常を引
き起こす可能性が高いと考えられる。
ンパク質を介して細胞周期調節因子であるPP2Aの活
性を制御している可能性が高い。ここで注目されるの
は、SAB1と相同性のあるALL1やMMSET(い
ずれもトリソラックスグループに属する)ばかりでな
く、set遺伝子自体も白血病で転座を起こすことであ
る。PP2A活性の制御不全が多くの白血病の原因の一
つとなっているという可能性は、やはり白血病で転座す
ることのあるHOX11がSETタンパク質と同様PP
2A活性を抑制するということからも支持される。AL
L1ではSET結合ドメインを含むN末端が白血病の発
生に十分であることから、染色体1q21上のsab1
遺伝子が転座を起こしてSAB1のN末端が発現された
場合、PP2A活性の制御不全から細胞の増殖異常を引
き起こす可能性が高いと考えられる。
【0030】本発明において、アミノ酸の欠失、置換又
は付加は、出願前周知技術である部位特定変異誘発(N
ucleic Acid Research、10(2
0)、6487−6500(1982)等参照)により
実施することができ、アミノ酸の欠失、置換又は付加に
関し、1個又は数個のアミノ酸とは、部位特定変異誘発
法により欠失、置換又は付加できる程度の数のアミノ酸
を意味する。
は付加は、出願前周知技術である部位特定変異誘発(N
ucleic Acid Research、10(2
0)、6487−6500(1982)等参照)により
実施することができ、アミノ酸の欠失、置換又は付加に
関し、1個又は数個のアミノ酸とは、部位特定変異誘発
法により欠失、置換又は付加できる程度の数のアミノ酸
を意味する。
【0031】また、遺伝子sab1とハイブリダイズす
る程度としては、通常の条件下(例えばDIG DNA
Labeling kit(ベーリンガー・マンハイ
ム社製Cat No.1175033)でプローブをラ
ベルした場合に、32℃のDIG Easy Hyb溶
液(ベーリンガー・マンハイム社製Cat No.16
03558)中でハイブリダイズさせ、50℃の0.5
xSSC溶液(0.1%[w/v]SDSを含む)中で
メンブレンを洗浄する条件(1xSSCは0.15M
NaCl、0.015M クエン酸ナトリウムである)
でのサザンハイブリダイゼーションで、遺伝子sab1
にハイブリダイズする程度であればよい。
る程度としては、通常の条件下(例えばDIG DNA
Labeling kit(ベーリンガー・マンハイ
ム社製Cat No.1175033)でプローブをラ
ベルした場合に、32℃のDIG Easy Hyb溶
液(ベーリンガー・マンハイム社製Cat No.16
03558)中でハイブリダイズさせ、50℃の0.5
xSSC溶液(0.1%[w/v]SDSを含む)中で
メンブレンを洗浄する条件(1xSSCは0.15M
NaCl、0.015M クエン酸ナトリウムである)
でのサザンハイブリダイゼーションで、遺伝子sab1
にハイブリダイズする程度であればよい。
【0032】
【実施例】本発明を以下の例によりさらに具体的に説明
するが、本発明の範囲はこれらの実施例に限定されるこ
とはないと解されるべきである。
するが、本発明の範囲はこれらの実施例に限定されるこ
とはないと解されるべきである。
【0033】例1 SAB1遺伝子は、T細胞受容体欠損マウスと正常マウ
スの胸腺において、前者に多く、後者に少なく発現する
遺伝子であり、CD4-CD8-段階以降の、T細胞分化
のための新規な後成的調節因子として、ディファレンシ
ャルスクリーニング法によってクローニングした。ま
ず、マウスからサプレッションサブトラクティブPCR
により、分化が阻止されたRAG1-/-胸腺細胞におい
て優先的に発現される遺伝子をスクリーニングした。野
生型、C57BL/6、RAG1-/-、及びTCRα-/-
マウス(Jackson Lab.,USA)の胸腺か
ら、MACSビーズ分離カラム(Miltenyi B
iotech)を用いて製造者のプロトコルに従って、
ポリ(A)尾部mRNAを単離した。サプレッションサ
ブトラクティブPCRを、CLONTECH PCR−
Select(商標)cDNAサブトラクションキット
(Clontech)を用いて製造者のプロトコルに従
い、サーマルサイクラー(MJ Research)を
用いて行った。
スの胸腺において、前者に多く、後者に少なく発現する
遺伝子であり、CD4-CD8-段階以降の、T細胞分化
のための新規な後成的調節因子として、ディファレンシ
ャルスクリーニング法によってクローニングした。ま
ず、マウスからサプレッションサブトラクティブPCR
により、分化が阻止されたRAG1-/-胸腺細胞におい
て優先的に発現される遺伝子をスクリーニングした。野
生型、C57BL/6、RAG1-/-、及びTCRα-/-
マウス(Jackson Lab.,USA)の胸腺か
ら、MACSビーズ分離カラム(Miltenyi B
iotech)を用いて製造者のプロトコルに従って、
ポリ(A)尾部mRNAを単離した。サプレッションサ
ブトラクティブPCRを、CLONTECH PCR−
Select(商標)cDNAサブトラクションキット
(Clontech)を用いて製造者のプロトコルに従
い、サーマルサイクラー(MJ Research)を
用いて行った。
【0034】単離されたクローンのうち、或るクローン
(A25)が、ショウジョウバエtrx−Gの一つのメ
ンバーであるASH1のPHDフィンガーと高い相同性
を示すことを見出した。このA25及びG3PDHプラ
イマーセットを用いて等量の逆転写産物を増幅した。増
幅のための反応は94℃、1分の1サイクル、94℃、
10秒、59℃、15秒及び72℃、1分の30サイク
ルとした。産物を電気泳動後、臭化エチジウムで標識
し、標識強度をNIH−イメージソフトウェアを用いて
定量した。使用したプライマーは、A25センス:5’
−AGTGAGGCCGACAGCAGCGA−3’
(配列番号5)、A25アンチセンス:5’−ACAC
TGCTCACAAAGGTAGTG−3’(配列番号
6)、G3PDHセンス:5’−ACCACAGTCC
ATGCCATCAC−3’(配列番号7)、G3PD
Hアンチセンス:5’−TCCACCACCCTGTT
TGCTGTA−3’(配列番号8)とした。
(A25)が、ショウジョウバエtrx−Gの一つのメ
ンバーであるASH1のPHDフィンガーと高い相同性
を示すことを見出した。このA25及びG3PDHプラ
イマーセットを用いて等量の逆転写産物を増幅した。増
幅のための反応は94℃、1分の1サイクル、94℃、
10秒、59℃、15秒及び72℃、1分の30サイク
ルとした。産物を電気泳動後、臭化エチジウムで標識
し、標識強度をNIH−イメージソフトウェアを用いて
定量した。使用したプライマーは、A25センス:5’
−AGTGAGGCCGACAGCAGCGA−3’
(配列番号5)、A25アンチセンス:5’−ACAC
TGCTCACAAAGGTAGTG−3’(配列番号
6)、G3PDHセンス:5’−ACCACAGTCC
ATGCCATCAC−3’(配列番号7)、G3PD
Hアンチセンス:5’−TCCACCACCCTGTT
TGCTGTA−3’(配列番号8)とした。
【0035】図1Bに示すように、A25由来のプライ
マーセットにより増幅したmRNAは野生種の胸腺細胞
よりもRAG1-/-及びTCRα-/-胸腺細胞の方が約十
倍も多く存在した。全長cDNAをRAG1-/-マウス
の胸腺のmRNAから5’及び3’RACEを行い、並
びに11日目の胚のλgt11cDNAライブラリーの
スクリーニングを3回行うことにより、sab1をクロ
ーニングした(Clontech)。マウスのsab1
cDNA(配列番号4)は新規な2669個のアミノ
酸からなる蛋白質(配列番号3)をコードしており(配
列番号9)、ヒトSEBやショウジョウバエASH1に
高い相同性を有している。SIMアラインメントの結
果、SAB1672-1564対SEB591-1407で39.3%、
SAB11692-2529対ASH11221-2086で42.1%で
あった。マウスのSAB1(mSAB1;配列番号3)
は二つの部分からなる核局在化シグナルを7つ有し、N
末端からC末端の順にATフックモチーフ、拡張SET
ドメイン、ブロモドメイン、PHDフィンガー、及びB
AHドメインの組合せを有する(図2A)。クローン化
されたsab1 cDNAは長さ10.5kbで胸腺に
おける転写産物サイズにほぼ匹敵していた(図1C)。
未熟T細胞においてsab1が優先的に発現するという
ことと一致してsab1転写産物はリンパ節においては
ほとんど検出できなかった。特にsab1はまた脳(大
脳)において高濃度で発現した。脳における転写産物サ
イズは13kbであった。
マーセットにより増幅したmRNAは野生種の胸腺細胞
よりもRAG1-/-及びTCRα-/-胸腺細胞の方が約十
倍も多く存在した。全長cDNAをRAG1-/-マウス
の胸腺のmRNAから5’及び3’RACEを行い、並
びに11日目の胚のλgt11cDNAライブラリーの
スクリーニングを3回行うことにより、sab1をクロ
ーニングした(Clontech)。マウスのsab1
cDNA(配列番号4)は新規な2669個のアミノ
酸からなる蛋白質(配列番号3)をコードしており(配
列番号9)、ヒトSEBやショウジョウバエASH1に
高い相同性を有している。SIMアラインメントの結
果、SAB1672-1564対SEB591-1407で39.3%、
SAB11692-2529対ASH11221-2086で42.1%で
あった。マウスのSAB1(mSAB1;配列番号3)
は二つの部分からなる核局在化シグナルを7つ有し、N
末端からC末端の順にATフックモチーフ、拡張SET
ドメイン、ブロモドメイン、PHDフィンガー、及びB
AHドメインの組合せを有する(図2A)。クローン化
されたsab1 cDNAは長さ10.5kbで胸腺に
おける転写産物サイズにほぼ匹敵していた(図1C)。
未熟T細胞においてsab1が優先的に発現するという
ことと一致してsab1転写産物はリンパ節においては
ほとんど検出できなかった。特にsab1はまた脳(大
脳)において高濃度で発現した。脳における転写産物サ
イズは13kbであった。
【0036】SAB1はPHD(配列番号1)と呼ばれ
るC4HC3型亜鉛結合モチーフを有している。このPH
DドメインはSAB1のアミノ酸配列(配列番号3)の
残基2285〜2331に相当し、その対応DNAはs
ab1 cDNA(配列番号4)の塩基7396〜75
36に相当する。PHDはASH1(70.2%の同一
性)やC.elegans LIN−59(33.1%
の同一性)において見出されるタンパク質と高度な相同
性を有しており、またヒストンデアセチラーゼと相互作
用することが知られているMi−2やATRXとも高度
な相同性を有している(図2B)。SAB1のPHDフ
ィンガーは、非メチル化CpGに結合し得るDnmt
(DNAメチルトランスフェラーゼ)及びALL1に存
在するシステインリッチ(CXXC)転写抑制ドメイン
に整列している。SAB1 PHDに隣接してBAHド
メインが存在し、これはOrc1 BAHドメインの場
合と同様に遺伝子サイレンシングに密接な関係のあると
思われるASH1及びLIN−59に対してそれぞれ4
7.7%及び33.1%の同一性を有している。
るC4HC3型亜鉛結合モチーフを有している。このPH
DドメインはSAB1のアミノ酸配列(配列番号3)の
残基2285〜2331に相当し、その対応DNAはs
ab1 cDNA(配列番号4)の塩基7396〜75
36に相当する。PHDはASH1(70.2%の同一
性)やC.elegans LIN−59(33.1%
の同一性)において見出されるタンパク質と高度な相同
性を有しており、またヒストンデアセチラーゼと相互作
用することが知られているMi−2やATRXとも高度
な相同性を有している(図2B)。SAB1のPHDフ
ィンガーは、非メチル化CpGに結合し得るDnmt
(DNAメチルトランスフェラーゼ)及びALL1に存
在するシステインリッチ(CXXC)転写抑制ドメイン
に整列している。SAB1 PHDに隣接してBAHド
メインが存在し、これはOrc1 BAHドメインの場
合と同様に遺伝子サイレンシングに密接な関係のあると
思われるASH1及びLIN−59に対してそれぞれ4
7.7%及び33.1%の同一性を有している。
【0037】SAB1はホメオティック遺伝子のポジテ
ィブレギュレーター(trx−G)及びネガティブレギ
ュレーター(Pc−G)の両方に見出し得るSETドメ
イン(配列番号2)を有している。このSETドメイン
はSAB1のアミノ酸配列(配列番号3)の残基183
8〜1986に相当し、その対応DNAはsab1cD
NA(配列番号4)の塩基6055〜6501に相当す
る。SETはショウジョウバエのtrxとともにホモ二
量化及びヘテロ二量化を仲介することが示されているA
SH1の一つと49.3%の同一性を共有している。
ィブレギュレーター(trx−G)及びネガティブレギ
ュレーター(Pc−G)の両方に見出し得るSETドメ
イン(配列番号2)を有している。このSETドメイン
はSAB1のアミノ酸配列(配列番号3)の残基183
8〜1986に相当し、その対応DNAはsab1cD
NA(配列番号4)の塩基6055〜6501に相当す
る。SETはショウジョウバエのtrxとともにホモ二
量化及びヘテロ二量化を仲介することが示されているA
SH1の一つと49.3%の同一性を共有している。
【0038】例2 田中ら、「疾患へのアプローチ」(仁保編),第13−
26頁、九州大学出版社、福岡(1996年)に記載し
たように、関心のあるタンパク質を発現するバイシスト
ロン性の(二つのシストロンを持つ)レトロウイルスベ
クターをグリーン蛍光タンパク質(GFP)とともに構
築した。同じ転写産物上で内部リボソームエントリーサ
イト(IRES)から翻訳されたGFPは発現レベルの
指標として役立った(図3A)。種々の構築体の転写効
率を初めNIH3T3フィブロブラスト細胞系を用いて
評価した(図3B−D)。SAB1断片はまず三つの核
局在化シグナル(NLS)とmycエピトープを含むp
CMV/myc/nuc(Invitrogen)にク
ローニングし、次いでcDNA/NLS/myc−ta
g断片を、オランダ癌研究所のT.N.Schumac
her博士から提供されたpMX.IRES.GFPベ
クターにサブクローニングした。
26頁、九州大学出版社、福岡(1996年)に記載し
たように、関心のあるタンパク質を発現するバイシスト
ロン性の(二つのシストロンを持つ)レトロウイルスベ
クターをグリーン蛍光タンパク質(GFP)とともに構
築した。同じ転写産物上で内部リボソームエントリーサ
イト(IRES)から翻訳されたGFPは発現レベルの
指標として役立った(図3A)。種々の構築体の転写効
率を初めNIH3T3フィブロブラスト細胞系を用いて
評価した(図3B−D)。SAB1断片はまず三つの核
局在化シグナル(NLS)とmycエピトープを含むp
CMV/myc/nuc(Invitrogen)にク
ローニングし、次いでcDNA/NLS/myc−ta
g断片を、オランダ癌研究所のT.N.Schumac
her博士から提供されたpMX.IRES.GFPベ
クターにサブクローニングした。
【0039】バイシストロン性のSET−GFR及びP
HD−GFPベクターは、モノシストロン性のGFPベ
クターと比較してGFPの発現量が低かったが、充分検
知できる程度の発現量が認められた。レトロウイルスパ
ッケージ細胞系(Phoenix)はG.Noran博
士(スタンフォード大学)により提供されたものを用い
た。レトロウイルス構築体は標準的な燐酸カルシウム法
によりフェニックス細胞中に一時的にトランスフェクト
され、レトロウイルスの上澄液を36時間と72時間の
間に集めた。胎生14日の胸腺由来のCD4-CD8-細
胞を、100ng/mlSCF及び20ng/mlIL
−7(共にGenzyme)を含むレトロウイルスカク
テルで48時間培養した。レトロウイルスによって形質
導入された胸腺細胞を、次いで胸腺間質細胞と共に再凝
集し、さらに7日間培養した。T細胞の分化を、FAC
Scan(Beckton Dickinson)及び
FlowJoソフトウェア(Tree Star)を用
いてCD8b−PE及びCD4−Cy(共にPharm
ingen)で標識した後、FACS分析により評価し
た。GFP又はSET−GFPで形質導入された細胞は
NIH3T3細胞におけるレベルに比例したレベルでレ
ポーター遺伝子を発現することができた(図3E−
G)。
HD−GFPベクターは、モノシストロン性のGFPベ
クターと比較してGFPの発現量が低かったが、充分検
知できる程度の発現量が認められた。レトロウイルスパ
ッケージ細胞系(Phoenix)はG.Noran博
士(スタンフォード大学)により提供されたものを用い
た。レトロウイルス構築体は標準的な燐酸カルシウム法
によりフェニックス細胞中に一時的にトランスフェクト
され、レトロウイルスの上澄液を36時間と72時間の
間に集めた。胎生14日の胸腺由来のCD4-CD8-細
胞を、100ng/mlSCF及び20ng/mlIL
−7(共にGenzyme)を含むレトロウイルスカク
テルで48時間培養した。レトロウイルスによって形質
導入された胸腺細胞を、次いで胸腺間質細胞と共に再凝
集し、さらに7日間培養した。T細胞の分化を、FAC
Scan(Beckton Dickinson)及び
FlowJoソフトウェア(Tree Star)を用
いてCD8b−PE及びCD4−Cy(共にPharm
ingen)で標識した後、FACS分析により評価し
た。GFP又はSET−GFPで形質導入された細胞は
NIH3T3細胞におけるレベルに比例したレベルでレ
ポーター遺伝子を発現することができた(図3E−
G)。
【0040】これとは対照的に、PHD−GFPがNI
H3T3細胞中では低いレベルでしか発現されないとい
うことを考慮に入れても、PHD−GFPのより高いレ
ベルを発現する細胞は十分には表現されなかった(図3
G)。SET又はPHDドメインがT細胞分化に影響を
与えたのかどうかをさらに決定するために、全細胞をG
FPの発現が陰性又は陽性の細胞群に分け(図3E、F
及びGの点線で示した)、CD4/CD8発現プロファ
イルをそれぞれの集団について分析した。レトロウイル
ス的に形質導入した細胞(GFP+;K−M)と形質導
入していない細胞(GFP-;H−J)との比較によ
り、PHD−GFPの発現及びより低い範囲ではあるが
SET−GFPの発現が分化したCD4+CD8+細胞の
数の減少を引き起こしたことがわかる。したがって、S
AB1とそのPHDドメインを介した他のタンパク質と
の相互作用がCD4-CD8-細胞の分化に極めて重要で
あることがわかった。
H3T3細胞中では低いレベルでしか発現されないとい
うことを考慮に入れても、PHD−GFPのより高いレ
ベルを発現する細胞は十分には表現されなかった(図3
G)。SET又はPHDドメインがT細胞分化に影響を
与えたのかどうかをさらに決定するために、全細胞をG
FPの発現が陰性又は陽性の細胞群に分け(図3E、F
及びGの点線で示した)、CD4/CD8発現プロファ
イルをそれぞれの集団について分析した。レトロウイル
ス的に形質導入した細胞(GFP+;K−M)と形質導
入していない細胞(GFP-;H−J)との比較によ
り、PHD−GFPの発現及びより低い範囲ではあるが
SET−GFPの発現が分化したCD4+CD8+細胞の
数の減少を引き起こしたことがわかる。したがって、S
AB1とそのPHDドメインを介した他のタンパク質と
の相互作用がCD4-CD8-細胞の分化に極めて重要で
あることがわかった。
【0041】
【発明の効果】ショウジョウバエの転写因子ASH1に
高い相同性のある遺伝子SAB1の断片であるSET及
びPHDドメインがT細胞又はNKT細胞の分化を抑制
する。
高い相同性のある遺伝子SAB1の断片であるSET及
びPHDドメインがT細胞又はNKT細胞の分化を抑制
する。
【0042】
【配列表】 SEQUENCE LISTING <110> TAISHO PHARMACEUTICAL CO.LTD.<120> T CELL DIFFERENTIATION-REGULATI NG FACTOR<130> DA-2938<160> 9<210> 1<211> 47<212> PRT<213> MOUSE<400> 1 Val Ile Arg Cys Ile Cys Gly Leu Tyr Lys Asp Glu Gly Leu Met 5 10 15 Ile Gln Cys Asp Lys Cys Met Val Trp Gln His Cys Asp Cys Met 20 25 30 Gly Val Asn Thr Asp Val Glu His Tyr Leu Cys Glu Gln Cys Asp 35 40 45 Pro Arg <210> 2 <211> 149 <212> PRT <213> MOUSE <400> 2 Arg Ile Gln Arg His Glu Trp Val Gln Cys Leu Glu Arg Phe Arg 5 10 15 Ala Glu Glu Lys Gly Trp Gly Ile Arg Thr Lys Glu Pro Leu Lys 20 25 30 Ala Gly Gln Phe Ile Ile Glu Tyr Leu Gly Glu Val Val Ser Glu 35 40 45 Gln Glu Phe Arg Asn Arg Met Ile Glu Gln Tyr His Asn His Ser 50 55 60 Asp His Tyr Cys Leu Asn Leu Asp Ser Gly Met Val Ile Asp Ser 65 70 75 Tyr Arg Met Gly Asn Glu Ala Arg Phe Ile Asn His Ser Cys Asp 80 85 90 Pro Asn Cys Glu Met Gln Lys Trp Ser Val Asn Gly Val Tyr Arg 95 100 105 Ile Gly Leu Tyr Ala Leu Lys Asp Met Pro Ala Gly Thr Glu Leu 110 115 120 Thr Tyr Asp Tyr Asn Phe His Ser Phe Asn Val Glu Lys Gln Gln 125 130 135 Leu Cys Lys Cys Gly Phe Glu Lys Cys Arg Gly Ile Ile Gly 140 145 <210> 3 <211> 2669 <212> PRT <213> MOUSE <400> 3 Met Phe Asn Ala Ala Val Gly Leu Ile Asn Lys Asp Ser Val Lys 5 10 15 Lys Leu Gly Thr Gly Thr Thr Ala Val Phe Ile Asn Lys Asp Leu 20 25 30 Gly Lys Lys Pro Gly Ala Ile Thr Thr Val Gly Leu Leu Ser Lys 35 40 45Glu Ser Gly Lys Lys Leu Gl y Ile Gly Ile Val Pro Gly Leu Val 50 55 60 Asn Lys Glu Ser Gly Lys Lys Leu Gly Leu Gly Thr Val Val Gly 65 70 75 Leu Val Asn Lys Glu Leu Gly Lys Lys Leu Ser Ser Thr Val Gly 80 85 90 Leu Val Ala Lys Asp Val Thr Lys Lys Ile Val Ala Ser Ser Ala 95 100 105 Met Gly Leu Val Asn Lys Asp Ile Gly Lys Lys Leu Leu Asn Cys 110 115 120 Pro Met Ala Gly Gln Leu Gly Ser Lys Asp Ala Leu Asn Leu Lys 125 130 135 Ser Glu Ala Leu Leu Pro Thr Gln Glu Gln Leu Lys Ala Ser Cys 140 145 150 Ser Ala Asn Ile Ser Asn His Asp Ser Gln Glu Leu Pro Glu Ser 155 160 165 Leu Lys Asp Ser Ala Thr Gly Lys Ala Phe Glu Lys Ser Val Met 170 175 180 Arg His Ser Lys Glu Ser Met Leu Glu Lys Phe Ser Val Arg Lys 185 190 195 Glu Ile Thr Asn Leu Glu Lys Glu Met Phe Asn Glu Gly Thr Cys 200 205 210 Ile Gln Gln Asp Asn Phe Ser Ser Ser Glu Arg Gly Ala Phe Glu 215 220 225 Thr Ser Lys His Glu Lys Gln Pro Pro Val Tyr Cys Thr Ser Pro 230 235 240 Asp Phe Gln Ile Gly Gly Ala Ser Asp Ala Ser Thr Ala Lys Ser 245 250 255 Pro Phe Ser Ala Val Gly Glu Ser Asn Leu Pro Ser Ser Ser Pro 260 265 270 Thr Val Ser Val Asn Pro Val Thr Arg Ser Pro Pro Glu Ala Ser 275 280 285 Ser Gln Leu Val Pro Asn Pro Leu Leu Leu Asn Ser Thr Ala Glu 290 295 300 Gln Met Glu Glu Ile Ser Glu Ser Ile Gly Lys Ser Gln Phe Thr 305 310 315 Ala Glu Ser Thr His Leu Asn Val Gly His Arg Ser Leu Gly His 320 325 330 Ser Leu Ser Ile Glu Cys Lys Gly Ile Asp Lys Glu Leu Asn Glu 335 340 345 Ser Lys Asn Thr His Leu Asp Ile Pro Arg Ile Ser Ser Ser Leu 350 355 360 Gly Lys Lys Pro Ser Leu Thr Ser Asp Ser Gly Ile His Ala Ile 365 370 375 Thr Pro Ser Val Val Asn Phe Thr Ser Leu Phe Ser Asn Lys Pro 380 385 390 Phe Leu Lys Leu Gly Ala Val Thr Ala Pro Asp Lys His Cys Gln 395 400 405 Val Ala Glu Ser Leu Ser Ser Ser Phe Gln Ser Lys Pro Leu Lys 410 415 420 Lys Glu Lys Glu Glu Lys Pro Arg Trp Thr Lys Val Val Ala Arg 425 430 435 Ser Thr Cys Arg Ser Pro Lys Gly Leu Asp Leu Glu Arg Ser Glu 440 445 450 Leu Phe Lys Asn Val Ser Cys Ser Ser Leu Ser Asn Ser Ser Glu 455 460 465 Pro Ala Lys Phe Met Lys Thr Ile Gly Ala Ser Ser Phe Val Asp 470 475 480 His Asp Phe Leu Lys Arg Arg Leu Pro Lys Leu Ser Lys Ser Ser 485 490 495 Ala Pro Ser Leu Ala Leu Leu Thr Asp Ser Glu Lys Pro Ser His 500 505 510 Lys Ser Phe Ile Thr His Lys Leu Ser Ser Ser Met Cys Val Thr 515 520 525 Ser Asp Leu Leu Ser Asp Ile Tyr Lys Pro Lys Arg Gly Arg Pro 530 535 540 Lys Ser Lys Glu Met Pro Gln Leu Glu Gly Pro Pro Lys Arg Thr 545 550 555 Leu Lys Ile Pro Ala Ser Lys Val Phe Ser Leu Gln Ser Lys Glu 560 565 570 Glu Gln Glu Pro Pro Ile Leu Gln Pro Glu Ile Glu Ile Pro Ser 575 580 585 Phe Lys Gln Ser Leu Ser Val Ser Pro Phe Pro Lys Lys Arg Gly 590 595 600 Arg Pro Lys Arg Gln Met Arg Ser Pro Val Lys Met Lys Pro Pro 605 610 615 Val Leu Ser Val Ala Pro Phe Val Ala Thr Glu Ser Pro Ser Lys 620 625 630 Leu Glu Ser Glu Ser Glu Asn His Arg Ser Ser Ser Asp Phe Phe 635 640 645 Glu Ser Glu Asp Gln Leu Gln Asp Thr Asp Asp Leu Asp Asp Ser 650 655 660 His Arg Gln Ser Val Cys Ser Met Ser Asp Leu Glu Met Glu Pro 665 670 675 Asp Lys Lys Ile Ser Lys Arg Asn Asn Gly Gln Leu Met Lys Thr 680 685 690 Ile Ile Arg Lys Ile Asn Lys Met Lys Thr Leu Lys Arg Lys Lys 695 700 705 Leu Leu Asn Gln Ile Leu Ser Ser Ser Val Glu Ser Ser Asn Lys 710 715 720 Gly Lys Val Gln Ser Lys Leu His Asn Thr Val Ser Ser Leu Ala 725 730 735 Ala Thr Phe Gly Ser Lys Leu Gly Gln Gln Ile Asn Val Ser Lys 740 745 750 Lys Gly Thr Ile Tyr Ile Gly Lys Arg Arg Gly Arg Lys Pro Lys 755 760 765 Thr Val Leu Asn Gly Leu Leu Ser Gly Ser Pro Ala Ser Leu Ala 770 775 780 Val Leu Glu Lys Thr Ala Gln Gln Ala Ala Gly Ser Ala Leu Gly 785 790 795 Gln Ile Leu Pro Pro Leu Leu Pro Ser Pro Val Ser Ser Ser Glu 800 805 810 Ile Leu Pro Ser Pro Ile Cys Ser Gln Ser Ser Gly Thr Ser Gly 815 820 825 Gly Gln Ser Pro Val Ser Ser Asp Ala Gly Phe Val Glu Pro Ser 830 835 840 Ser Val Pro Tyr Leu His Val His Ser Arg Gln Gly Ser Met Ile 845 850 855 Gln Thr Leu Ala Met Lys Lys Ala Ser Lys Gly Arg Arg Arg Leu 860 865 870 Ser Pro Pro Thr Leu Leu Pro Asn Ser Pro Ser His Leu Ser Glu 875 880 885 Leu Thr Ser Leu Lys Glu Ala Thr Pro Ser Pro Val Ser Glu Ser 890 895 900 His Ser Asp Glu Thr Ile Pro Ser Asp Ser Gly Ile Gly Thr Asp 905 910 915 Asn Asn Ser Thr Ser Asp Arg Ala Glu Lys Phe Cys Gly Gln Lys 920 925 930 Lys Arg Arg His Ser Phe Glu His Ile Ser Leu Ile Pro Pro Glu 935 940 945 Thr Ser Thr Val Leu Asn Ser Leu Lys Glu Lys His Lys His Lys 950 955 960 Cys Lys Arg Arg Ser His Asp Tyr Leu Ser Tyr Asp Lys Met Lys 965 970 975 Arg Gln Lys Arg Lys Arg Lys Lys Lys Tyr Pro Gln Leu Arg Asn 980 985 990 Arg Gln Asp Pro Asp Phe Ile Ala Glu Leu Glu Glu Leu Ile Ser 995 1000 1005 Arg Leu Ser Glu Ile Arg Ile Thr His Arg Ser His His Phe Ile 1010 1015 1020 Pro Arg Asp Leu Leu Pro Thr Ile Phe Arg Ile Asn Phe Asn Ser 1025 1030 1035 Phe Tyr Thr His Pro Ser Phe Pro Leu Asp Pro Leu His Tyr Ile 1040 1045 1050 Arg Lys Pro Asp Leu Lys Lys Lys Arg Gly Arg Pro Pro Lys Met 1055 1060 1065 Arg Glu Ala Met Ala Glu Met Pro Phe Met His Ser Leu Ser Phe 1070 1075 1080 Pro Leu Ser Ser Thr Gly Phe Tyr Pro Ser Tyr Gly Met Pro Tyr 1085 1090 1095 Ser Pro Ser Pro Leu Thr Ala Ala Pro Ile Gly Leu Gly Tyr Tyr 1100 1105 1110 Gly Arg Tyr Pro Pro Thr Leu Tyr Pro Pro Pro Pro Ser Pro Ser 1115 1120 1125 Phe Thr Thr Pro Leu Pro Pro Pro Ser Tyr Met His Ala Gly His 1130 1135 1140 Leu Leu Leu Asn Pro Thr Lys Tyr His Lys Lys Lys His Lys Leu 1145 1150 1155 Leu Arg Gln Glu Ala Phe Leu Thr Thr Ser Arg Thr Pro Leu Leu 1160 1165 1170 Ser Met Ser Thr Tyr Pro Ser Val Pro Pro Glu Met Ala Tyr Gly 1175 1180 1185 Trp Met Val Glu His Lys His Arg His Arg His Lys His Arg Glu 1190 1195 1200 His Arg Ser Glu Gln Pro Gln Val Ser Met Asp Ser Gly Ser Ser 1205 1210 1215 Arg Ser Val Leu Glu Ser Leu Lys Arg Tyr Arg Phe Gly Lys Asp 1220 1225 1230 Thr Val Gly Asp Arg Tyr Lys His Lys Glu Lys His Arg Cys His 1235 1240 1245 Met Ser Cys Pro His Leu Ser Pro Ser Lys Asn Leu Ile Asn Arg 1250 1255 1260 Glu Glu Gln Trp Val Ser Arg Glu Pro Ser Glu Ser Ser Ser Leu 1265 1270 1275 Ala Leu Gly Leu Gln Thr Pro Leu Gln Ile Asp Cys Ser Glu Ser 1280 1285 1290 Ser Pro Ser Leu Ser Leu Gly Gly Phe Thr Pro Asn Ser Glu Pro 1295 1300 1305 Ala Ser Ser Asp Glu His Met Asn Leu Phe Thr Ser Ala Ile Gly 1310 1315 1320 Ser Cys Arg Val Ser Asn Pro Asn Ser Ser Cys Arg Lys Lys Leu 1325 1330 1335 Thr Asp Ser Pro Gly Leu Phe Pro Val Gln Asp Thr Ala Leu Asn 1340 1345 1350 Arg Pro His Arg Lys Glu Pro Leu Pro Ser Ser Glu Arg Ala Ile 1355 1360 1365 Gln Ser Leu Ala Gly Ser Gln Ser Ala Ser Asp Lys Pro Ser Gln 1370 1375 1380 Arg Ser Ser Glu Ser Thr Asn Cys Ser Pro Thr Arg Lys Arg Ser 1385 1390 1395 Ser Ser Glu Ser Thr Ser Ser Thr Val Asn Gly Val Pro Ser Arg 1400 1405 1410 Ser Pro Arg Leu Val Ala Ser Met Asp Asp Ser Val Asp Ser Leu 1415 1420 1425 Leu Gln Arg Ile Val His His Asp Glu Gln Glu Ser Met Glu Lys 1430 1435 1440 Asn Gly Asp Ala Ser Ile Thr Thr Val Ser Ala Pro Pro Ser Ser 1445 1450 1455 Ser Pro Gly His Ser Tyr Ser Lys Glu Arg Ala Leu Gly Lys Ser 1460 1465 1470 Asp Ser Leu Leu Val Pro Ala Val Pro Asn Asp Ser Cys Ser Asn 1475 1480 1485 Ile Pro Leu Leu Ser Glu Lys Ser Ala Ser Arg Cys Ser Pro His 1490 1495 1500 His Ile Lys Arg Ser Val Val Glu Ala Met Gln Arg Gln Ala Arg 1505 1510 1515 Lys Met Cys Asn Tyr Asp Lys Ile Leu Ala Thr Lys Lys Asn Leu 1520 1525 1530 Asp His Val Asn Lys Ile Leu Lys Ala Lys Lys Leu Gln Arg Gln 1535 1540 1545 Ala Arg Thr Gly Asn Asn Phe Val Lys Arg Arg Pro Gly Arg Pro 1550 1555 1560 Arg Lys Cys Pro Leu Gln Ala Val Val Ser Met Gln Ala Phe Gln 1565 1570 1575 Ala Ala Gln Phe Val Ser Pro Glu Leu Asn Glu Gly Glu Asp Met 1580 1585 1590 Ser Leu His Leu Ser Pro Asp Thr Val Thr Asp Val Ile Glu Ala 1595 1600 1605 Val Val Gln Ser Val Asn Leu Thr Ser Glu His Lys Lys Gly Val 1610 1615 1620 Lys Arg Lys Asn Trp Leu Leu Glu Glu Gln Thr Arg Lys Lys Gln 1625 1630 1635 Lys Thr Val Pro Glu Glu Glu Glu Gln Glu Asn Asn Lys Ser Phe 1640 1645 1650 Ile Glu Thr Pro Val Glu Ile Pro Ser Pro Leu Glu Thr Pro Ala 1655 1660 1665 Glu Pro Ser Glu Pro Glu Asn Thr Leu Gln Pro Val Leu Ala Leu 1670 1675 1680 Ile Pro Arg Glu Lys Lys Ala Pro Arg Pro Pro Lys Lys Lys Tyr 1685 1690 1695 Gln Arg Ala Gly Leu Tyr Ser Asp Val Ser Lys Thr Ile Asp Pro 1700 1705 1710 Lys Ser Arg Leu Ile Gln Leu Lys Lys Glu Lys Leu Glu Tyr Thr 1715 1720 1725 Pro Gly Glu His Glu Tyr Gly Leu Phe Pro Ala Pro Ile His Val 1730 1735 1740 Gly Lys Tyr Leu Arg Gln Lys Arg Ile Asp Phe Gln Leu Pro Tyr 1745 1750 1755 Asp Ile Leu Trp Gln Trp Lys His Asn Gln Leu Tyr Lys Lys Pro 1760 1765 1770 Asp Val Pro Leu Tyr Lys Lys Ile Arg Ser Asn Val Tyr Val Asp 1775 1780 1785 Val Lys Pro Leu Ser Gly Tyr Glu Ala Thr Thr Cys Asn Cys Lys 1790 1795 1800 Lys Pro Asp Asp Asp Thr Arg Lys Gly Cys Gly Asp Asp Cys Leu 1805 1810 1815 Asn Arg Met Ile Phe Ala Glu Cys Ser Pro Asn Thr Cys Pro Cys 1820 1825 1830 Gly Glu Gln Cys Cys Asn Gln Arg Ile Gln Arg His Glu Trp Val 1835 1840 1845 Gln Cys Leu Glu Arg Phe Arg Ala Glu Glu Lys Gly Trp Gly Ile 1850 1855 1860 Arg Thr Lys Glu Pro Leu Lys Ala Gly Gln Phe Ile Ile Glu Tyr 1865 1870 1875 Leu Gly Glu Val Val Ser Glu Gln Glu Phe Arg Asn Arg Met Ile 1880 1885 1890 Glu Gln Tyr His Asn His Ser Asp His Tyr Cys Leu Asn Leu Asp 1895 1900 1905 Ser Gly Met Val Ile Asp Ser Tyr Arg Met Gly Asn Glu Ala Arg 1910 1915 1920 Phe Ile Asn His Ser Cys Asp Pro Asn Cys Glu Met Gln Lys Trp 1925 1930 1935 Ser Val Asn Gly Val Tyr Arg Ile Gly Leu Tyr Ala Leu Lys Asp 1940 1945 1950 Met Pro Ala Gly Thr Glu Leu Thr Tyr Asp Tyr Asn Phe His Ser 1955 1960 1965 Phe Asn Val Glu Lys Gln Gln Leu Cys Lys Cys Gly Phe Glu Lys 1970 1975 1980 Cys Arg Gly Ile Ile Gly Gly Lys Ser Gln Arg Met Asn Gly Leu 1985 1990 1995 Pro Ser His Lys Gly Ser Gln Ser Ser Ser Thr His Arg Lys Ser 2000 2005 2010 Ala Arg Ala Lys Glu Lys Arg Lys Ser Lys His Lys Leu Lys Lys 2015 2020 2025 Arg Lys Gly His Pro Ser Glu Glu Pro Ser Glu Asn Ile Asn Thr 2030 2035 2040 Pro Thr Arg Leu Thr Pro Gln Leu Gln Met Lys Pro Met Ser Asn 2045 2050 2055 Arg Glu Arg Asn Phe Val Leu Lys His His Val Phe Leu Val Arg 2060 2065 2070 Asn Trp Glu Lys Ile His Gln Lys Gln Glu Glu Val Lys His Thr 2075 2080 2085 Arg Asp Ile His Ser Ala Ser Leu Tyr Thr Arg Trp Asn Gly Leu 2090 2095 2100 Cys Arg Asp Asp Gly Asn Ile Lys Ser Asp Val Phe Met Thr Gln 2105 2110 2115 Phe Ser Ala Leu Gln Thr Ala Arg Ser Val Arg Thr Arg Arg Leu 2120 2125 2130 Ala Ala Ala Glu Glu Asn Leu Glu Val Ala Arg Ala Ala Arg Leu 2135 2140 2145 Ala Gln Ile Phe Lys Glu Ile Cys Asp Gly Ile Ile Ser Tyr Arg 2150 2155 2160 Asp Ser Ser Gln Gln Thr Leu Ala Ala Pro Leu Leu Asn Leu Pro 2165 2170 2175 Pro Lys Lys Lys Asn Ala Asp Tyr Tyr Glu Lys Ile Ser Asp Pro 2180 2185 2190 Leu Asp Leu Ser Thr Ile Glu Lys Gln Ile Leu Ile Gly Tyr Tyr 2195 2200 2205 Lys Thr Val Glu Ala Phe Asp Ala Asp Met Leu Lys Val Phe Arg 2210 2215 2220 Asn Ala Glu Lys Tyr Tyr Gly Arg Lys Ser Pro Ile Gly Arg Asp 2225 2230 2235 Val Cys Arg Leu Arg Lys Ala Tyr Tyr Ser Ala Arg His Glu Ala 2240 2245 2250 Ser Ala Gln Ile Asp Glu Ile Val Gly Glu Thr Ala Ser Glu Ala 2255 2260 2265 Asp Ser Ser Glu Thr Ser Val Ser Glu Lys Glu Ser Gly His Glu 2270 2275 2280 Lys Asp Asp Asp Val Ile Arg Cys Ile Cys Gly Leu Tyr Lys Asp 2285 2290 2295 Glu Gly Leu Met Ile Gln Cys Asp Lys Cys Met Val Trp Gln His 2300 2305 2310 Cys Asp Cys Met Gly Val Asn Thr Asp Val Glu His Tyr Leu Cys 2315 2320 2325 Glu Gln Cys Asp Pro Arg Pro Val Asp Arg Glu Val Pro Met Ile 2330 2335 2340 Pro Arg Pro His Tyr Ala Gln Pro Gly Cys Val Tyr Phe Ile Cys 2345 2350 2355 Leu Leu Arg Asp Asp Leu Leu Leu Arg Gln Gly His Cys Val Tyr 2360 2365 2370 Leu Met Arg Asp Ser Arg Arg Thr Pro Asp Gly His Pro Val Arg 2375 2380 2385 Gln Ser Tyr Arg Leu Leu Ser His Ile Asn Arg Asp Lys Leu Asp 2390 2395 2400 Ile Phe Arg Ile Glu Lys Leu Trp Lys Asn Glu Lys Glu Glu Arg 2405 2410 2415 Phe Ala Phe Gly His His Tyr Phe Arg Pro His Glu Thr His His 2420 2425 2430 Ser Pro Ser Arg Arg Phe Tyr His Asn Glu Leu Phe Arg Val Pro 2435 2440 2445 Leu Tyr Glu Ile Ile Pro Leu Glu Ala Val Val Gly Thr Cys Cys 2450 2455 2460 Val Leu Asp Leu Tyr Thr Tyr Cys Lys Gly Arg Pro Lys Gly Ile 2465 2470 2475 Lys Glu Gln Asp Val Tyr Ile Cys Asp Tyr Arg Leu Asp Lys Ser 2480 2485 2490 Ala His Leu Phe Tyr Lys Ile His Arg Asn Arg Tyr Pro Val Cys 2495 2500 2505 Thr Lys Pro Tyr Ala Phe Asp His Phe Pro Lys Lys Leu Thr Pro 2510 2515 2520 Lys Arg Asp Phe Ser Pro His Tyr Val Pro Asp Asn Tyr Lys Arg 2525 2530 2535 Asn Gly Gly Arg Ser Ser Trp Lys Ser Glu Arg Ser Lys Pro Pro 2540 2545 2550 Leu Lys Asp Leu Gly Gln Glu Asp Asp Ala Leu Pro Leu Ile Glu 2555 2560 2565 Glu Val Leu Ala Ser Gln Glu Gln Ala Ala Arg Glu Val Pro Ser 2570 2575 2580 Pro Glu Glu Pro Asp Gln Glu Arg Ala Thr Gly Asp Ile Gly Asp 2585 2590 2595 Ala Glu Lys Lys Pro Glu Glu Ser Ser Gln Glu Ala Gln Leu Ala 2600 2605 2610 Ser Thr Pro Glu Glu Arg Arg His Ser Gln Arg Glu Arg Leu Asn 2615 2620 2625 Gln Ile Leu Leu Asn Leu Leu Glu Lys Ile Pro Gly Lys Asn Ala 2630 2635 2640 Ile Asp Val Thr Tyr Leu Leu Glu Glu Gly Ser Gly Arg Lys Leu 2645 2650 2655 Arg Arg Arg Thr Leu Phe Ile Pro Glu Asn Ser Phe Arg Lys 2660 2665 2669 <210> 4 <211> 10069 <212> DNA <213> MOUSE <400> 4 10 20 30 40 50 60 cggattcctt agatgttatt tgcttaaaaa caaacgacaa accaagtaca gcggtacctc 60 tgatcaaaat ctgaaactag ttaacacgtt ttctcttccc acatctacaa acctcgttcc 120 taacctcttg ctgttgcctt ctcgagtttg ggggagaaaa gaaaatcaat ggatacagac 180 tgttatttat gaaaagaggc atattctaat agtcataagg caatgtgttt aagagctgca 240 cctgaacaaa tcttctccaa gctgaagatg gtcaccaact ctgtaatctg tagagtggat 300 ccacttgctc gagtcactgg gtcacacgaa tagcttcact atgccttaag gaggcatgtt 360 acatctatgg gatgtacaag tatttgaaaa gaataacatt aagaggaaaa ggacagcctt 420 gcaaatatca gtttcttata taaatgacaa cagtggcatg tggccccctt ttaatacccc 480 aacaattgta caagagtggg agaagttgtt gttgttgata accattatct ttcaggtgag 540 cctatgttca atgcagcagt aggcctgatc aataaggact ctgtgaaaaa attgggaact 600 ggcactacag ccgtattcat taataaagac ttaggcaaaa agccaggggc tatcactaca 660 gttggactgc tgagcaaaga atcaggaaag aagctaggca ttggtattgt tccagggcta 720 gtgaataaag agtctggcaa gaaattagga cttggcaccg tagttggact ggttaataaa 780 gagttgggaa agaaactgag ttctacagtt ggcctagtgg ccaaggatgt tacgaagaag 840 attgtagcaa gctcagcaat gggattggtt aataaggaca ttggaaagaa attattaaat 900 tgtcctatgg caggacaact gggcagtaaa gatgccttaa accttaaatc tgaagcactg 960 ctccccactc aggaacaact taaggcttcc tgtagtgcaa acataagtaa tcatgacagt 1020 caagaacttc ctgagtctct gaaagacagt gctaccggca aagcttttga gaagagtgtt 1080 atgcggcata gtaaagaaag catgttggaa aaattttcag tccgaaaaga aattactaat 1140 ttggagaaag aaatgtttaa tgaaggaaca tgcattcagc aagacaattt ctcatctagt 1200 gaaaggggag cctttgaaac ctcaaaacat gaaaagcagc ctcctgtgta ttgcacttct 1260 cctgactttc aaataggagg tgcctctgat gcctctacag ctaaatctcc cttcagtgca 1320 gtaggcgaaa gcaaccttcc ttcctcgtca cctactgtat ctgttaatcc tgtaaccagg 1380 agtccccctg aagcttcttc acagttggtt ccaaacccat tacttttaaa ttctacagca 1440 gaacaaatgg aagaaatctc tgaatctatt ggaaagagcc agtttactgc tgaaagtacc 1500 cacttgaatg ttggtcacag atcattaggt catagcttaa gtattgagtg taaaggaatt 1560 gataaagaac taaatgaatc aaaaaataca catctagata ttcctagaat aagttcttcc 1620 ttgggaaaaa agccaagttt gacttctgac tctggtattc atgcaattac tccttccgtt 1680 gttaatttta ctagtttgtt tagtaacaaa ccttttttaa agcttggtgc agtcactgca 1740 ccagacaaac actgccaggt tgctgaaagc ctaagctcga gtttccagtc caaaccattg 1800 aaaaaagaaa aggaagaaaa acctcggtgg actaaagtgg tggcaagaag cacatgccgg 1860 tctccaaaag gactagactt agaaagatca gagcttttta agaatgtttc ttgtagctca 1920 ctatcaaata gttctgagcc agcgaagttt atgaaaacta tcggagcatc atcattcgtc 1980 gatcatgact tccttaaacg ccgattgcca aagttgagta agtcttcagc tccatctctt 2040 gctcttttaa ccgacagcga gaaaccatct cataagtctt ttattactca caaactgtcc 2100 tccagtatgt gtgtcactag cgatcttttg tcggatattt ataagcccaa gagaggaaga 2160 cctaaatcca aggaaatgcc tcagctagaa ggtccaccta aaaggacttt aaaaatacct 2220 gcctctaaag ttttttcttt acagtctaaa gaagagcaag aacccccaat tttacaacca 2280 gaaattgaaa ttccttcctt caagcaaagt ttgtctgtat ctccttttcc aaaaaaaaga 2340 ggcaggccta aaaggcagat gaggtctcca gtgaagatga aaccccctgt cctgtcagtg 2400 gctccatttg ttgccactga aagtccaagt aagctcgagt ctgaaagtga gaaccataga 2460 agtagcagtg acttttttga gagtgaggac cagcttcagg acacagacga cttagatgac 2520 agtcacaggc aaagtgtctg tagtatgagt gaccttgaga tggaaccaga taaaaaaatt 2580 agcaagcgaa acaatggaca attaatgaaa acaattatcc gaaaaataaa taaaatgaag 2640 actttaaaga gaaaaaaact gttgaatcag attctttcga gttctgtaga atcaagtaat 2700 aaaggaaaag tgcagtccaa gcttcacaat acagtctcaa gtcttgctgc cacatttggc 2760 tctaaattgg ggcaacaaat caatgtcagc aagaaaggaa ccatttacat agggaagaga 2820 agggggcgga aaccaaaaac cgtcttaaat ggcctgcttt ctggtagccc tgccagcctt 2880 gctgtgcttg aaaaaacagc tcagcaggca gctgggtcag cattaggaca gatcctcccc 2940 cctttactgc catcacctgt tagtagctct gagatccttc catcacctat ttgctctcag 3000 tcttctggga ctagtggagg tcagagccct gttagtagtg acgcaggctt tgttgaacct 3060 agctcagtgc catatttgca tgtgcactcc agacagggca gtatgattca gactcttgca 3120 atgaagaagg cttccaaggg cagaaggcgg ctctctcctc ctactttgtt gccaaattct 3180 ccttctcatt tgagtgaact cacatccctg aaagaagcca ctccttcccc agttagtgag 3240 tctcatagtg acgagaccat tcccagtgac agtggcattg ggacagataa taatagcaca 3300 tcagacaggg cagagaagtt ttgtggacag aaaaagagga gacattcttt tgagcacatt 3360 tctctgattc cccctgaaac ttctaccgtc ctaaacagtc tcaaagaaaa acacaaacac 3420 aaatgtaagc gcaggagtca cgattacctc agctatgaca agatgaaaag acagaagcga 3480 aaacggaaaa agaaatatcc ccagcttcga aataggcagg atccagactt catcgcagaa 3540 ctagaggagc tgataagtcg tctaagtgag attcggatca cccatcgaag ccatcatttt 3600 attccccgag acctcctgcc aactattttt cgaatcaact ttaatagttt ctatacacat 3660 ccttcttttc ccttagaccc attgcactac attcggaaac ctgacttaaa aaagaaacga 3720 gggaggcccc ctaagatgag ggaggcaatg gcagaaatgc cttttatgca cagccttagt 3780 tttcctttat ctagtactgg attttatcct tcttatggca tgccttactc tccctcaccc 3840 cttacagctg ctccaatagg attagggtat tatggaaggt atccccccac tctttatcca 3900 ccgccaccat ctccttcatt caccactcca ctgccacctc cctcctatat gcatgctggt 3960 catttattgc tcaatcctac caaatatcat aagaaaaagc ataagctgct tagacaggag 4020 gcttttctta caaccagcag gacccctctc ctttccatga gcacctaccc cagcgtacct 4080 ccagagatgg cttatggttg gatggtggag cacaaacaca gacaccgtca caaacacaga 4140 gagcaccgtt ctgaacagcc ccaggtttcc atggatagtg gctcttccag atccgtcttg 4200 gagtctttga aacgttaccg atttggtaag gatactgttg gagatcgata taagcataag 4260 gaaaagcaca ggtgtcacat gtcctgccct catctctctc cttcaaagaa cttaataaac 4320 agagaagaac agtgggtttc tcgagagcct tcagaatcaa gttctttagc cttgggattg 4380 caaacacctt tacaaattga ctgctcagaa agttctccca gtttgtccct tggaggattt 4440 actcccaatt ctgagccagc cagcagtgat gaacatatga acctttttac aagtgcaata 4500 ggcagctgca gagtttcaaa ccctaactcc agttgccgga agaaattaac tgacagcccc 4560 gggctctttc ctgtacaaga tactgcacta aatcggcctc acagaaagga accattacct 4620 tccagtgaaa gggcaataca gtcgttggca ggttcccagt cagcttccga taaaccttcc 4680 cagcgatcat cagaaagcac aaattgtagc cctactcgta aaaggtcttc atctgagagt 4740 acttcttcaa cagtgaatgg agttccttcc agaagtccca gattggttgc ttctatggat 4800 gattctgtag acagtctgtt gcagcggata gtacatcacg atgagcaaga gtccatggag 4860 aaaaacggtg atgcttccat tacaactgtg tctgcaccac cttcttccag tccaggccat 4920 agctacagca aggagcgagc cttaggtaaa tcagacagcc ttctagtgcc tgcagtcccg 4980 aatgactctt gcagtaatat cccacttctt tctgaaaagt cagcaagtag gtgttccccc 5040 catcacatca agagaagtgt agttgaagct atgcaacgcc aagctcggaa aatgtgcaat 5100 tatgacaaaa tcttggccac caagaaaaac ctggaccatg ttaataaaat tttaaaagcc 5160 aaaaaacttc aaaggcaggc caggacagga aacaattttg tgaaacgcag accaggtcga 5220 cctcggaaat gccccctcca agcagtggtg tcaatgcaag ccttccaggc cgcccagttt 5280 gtcagcccgg aattgaatga aggcgaagac atgtccctgc acctaagtcc agacacagtc 5340 actgatgtga tcgaggctgt ggttcagagt gtgaacctca cttcagaaca taagaagggg 5400 gtgaagagga aaaattggct gttagaagaa cagactagga aaaagcagaa gacagtacca 5460 gaggaagaag agcaagaaaa caataaaagc tttatagaaa caccagttga aattcccagt 5520 cctcttgaaa cgcctgctga accttctgaa cctgaaaata ccttgcaacc tgtgctggct 5580 ctcatcccac gagaaaagaa ggccccacgt cctccaaaga agaaatacca gagagctggg 5640 ctgtattctg atgtttccaa aacaatagac ccaaagagcc gattaatcca attaaagaaa 5700 gaaaagttgg agtatactcc aggagagcac gagtatgggt tgttcccagc gcccattcat 5760 gttggaaagt atctcagaca gaagagaatt gacttccagc ttccctatga tattctctgg 5820 cagtggaaac acaatcagct atacaaaaag ccagatgtcc ccctgtataa aaaaatccgt 5880 tcaaatgtct atgttgatgt caaaccactt tctggttatg aggctaccac ctgtaattgt 5940 aagaagccag atgacgacac caggaagggc tgtggggatg actgcctaaa tagaatgatc 6000 tttgctgagt gttcccctaa cacttgcccc tgtggtgagc agtgctgtaa ccagaggata 6060 cagaggcatg agtgggtgca gtgtctggaa cgatttcgag ctgaggaaaa aggttgggga 6120 attagaacca aagaacccct aaaagctggc cagttcatca ttgaatacct aggggaagtt 6180 gtcagcgaac aagaattcag gaacaggatg attgagcaat atcataatca cagtgaccac 6240 tactgtttaa acctggatag cggaatggtg attgacagtt accgcatggg aaatgaggcc 6300 agattcatca accacagctg tgacccaaat tgtgaaatgc agaaatggtc tgttaatgga 6360 gtgtaccgta ttggactgta tgcacttaag gatatgccag ctgggacaga gcttacctat 6420 gattacaact ttcattcctt caatgtagaa aaacagcaac tttgtaaatg tggttttgag 6480 aagtgtcgag gaatcattgg aggcaagagt caacggatga acggactccc tagccataaa 6540 ggtagccagt cttcaagcac gcatagaaag tctgcacggg cgaaagagaa gcggaagtcc 6600 aagcacaagc tgaagaaaag gaaaggccat ccctctgaag agcccagtga aaacatcaac 6660 accccaacaa gattgactcc acagttacag atgaagccaa tgtccaacag agagaggaac 6720 ttcgtgctaa agcaccatgt gttcttggtg cgaaactggg aaaagatcca tcagaagcag 6780 gaggaggtga agcacacccg tgacatccac tcagcatcgc tgtacacccg ctggaacggc 6840 ctctgtcggg acgacgggaa cattaagtct gatgtcttca tgacccagtt ctctgccctg 6900 cagacagcta gatctgttcg aacaagacgc ttggcagctg cagaggaaaa cctggaagtg 6960 gctcgggcag cgcgcctagc acagatcttc aaagagatct gtgatggcat catctcctac 7020 agagactctt cccagcaaac ccttgcagct ccacttttga atcttccccc aaagaaaaaa 7080 aatgctgact attatgagaa gatctctgac cccctggatc tcagcaccat agagaagcag 7140 atcctcattg ggtattacaa aacagtggag gctttcgatg ctgacatgct taaggtcttt 7200 cggaatgctg agaagtacta tgggcgtaaa tccccaattg ggagagatgt ttgccgctta 7260 cgaaaggcct attacagcgc ccggcatgaa gcttcggctc agatcgatga gattgtggga 7320 gaaacggcca gtgaggccga cagcagcgag acctcagtct ccgagaagga gagcgggcac 7380 gagaaggatg atgatgttat ccgctgcatc tgcggcctct ataaagatga aggcctcatg 7440 atccagtgtg acaagtgcat ggtgtggcag cactgcgact gcatgggtgt gaacacggat 7500 gtggagcact acctttgtga gcagtgtgac cctcggcctg tggacaggga ggtacccatg 7560 atccctaggc cccactatgc ccagcccggc tgtgtctact tcatctgttt actccgagat 7620 gacttgctgc ttcgtcaggg tcattgtgtg tacctgatga gggacagtcg gcgcacgcct 7680 gatggccacc cagtccgtca gtcctacaga ctcttatctc acattaaccg agataaactt 7740 gacatcttta gaatcgagaa gctctggaag aatgaaaaag aagaacggtt tgcctttggt 7800 caccattatt tccgcccaca tgagactcat cactctccat cccgtcggtt ctatcacaac 7860 gagctgttcc gggtgcccct ctatgagatc attcccttgg aggccgtagt tgggacctgc 7920 tgtgtgttgg acctttatac atactgtaaa gggagaccca aaggaataaa ggaacaagat 7980 gtgtatatct gtgattatcg gcttgacaag tcagcacacc ttttttacaa gattcatcgg 8040 aatcgatatc cggtctgcac caagccctat gcctttgatc atttccccaa gaagctcact 8100 cccaaaagag acttctcacc tcattatgtc ccagacaact acaagaggaa cggaggacga 8160 tcatcctgga agtctgaacg ctcaaagcca cccctaaaag acctaggaca agaagatgat 8220 gctttgccct tgattgaaga ggtactggct agtcaggagc aagcagccag ggaagtgccc 8280 agccctgagg agccagacca ggaaagagcc actggggaca ttggggacgc tgaaaagaaa 8340 ccagaggaga gcagtcaaga agcccagtta gccagcacac ctgaggagcg aaggcacagc 8400 cagagggaac ggctcaacca gatcctgctc aacctccttg agaaaatacc tgggaaaaat 8460 gccattgacg tgacctacct gctggaggaa gggtccggca ggaaactgcg aaggcgcact 8520 ttgtttatac cagaaaatag ctttcggaag tgactctcaa aaggatgaga accgcgagcg 8580 agcacctggg atccaacggc accatcaagt ccagcctctt gctctctgga catggactgg 8640 ggcagaaaag ttctgttcag gcaagggggg tggggtcacg tttctgacat ggtactttct 8700 aaagctcgga gctagtggaa agggaaagga agtaggcttg tctgagacgg gtgcgtttac 8760 ttctctctct ggcttctcct gagggttaac agagacagga ggactacact tggagtagcc 8820 agaagctact ggtactttcc agcacttcca aagggaaggg tccggaccca gcctgccccg 8880 tttatctctt agctctaaga gctacgtcag agacctaaac aggtcagtag ctgaggcctc 8940 ttttaagttc ctttaacggg aaagttcttt ctcccttctt gcccaaccag gtcaaagtac 9000 tagaacatga atcagctgct cagagcactt agaactgctg ccactctccc tacctctgtt 9060 cccagagtag agtcagtaga accagggagg cggagaggcc cccatggggt ccgaagggca 9120 gtattggtaa ttatttttgg tttacccttc ataacctgcc gaacatactt tttcctcctg 9180 agaaagccca gcccccgcca gcacacatgc tgcttctctt cctgtgtgtc tgctgtgcaa 9240 aagattcacg tccaagaaag aaaaacggtt tgtaaaactg cataaaccct catacacttc 9300 tcccctaaca aaactcacta cagaactgtt gagcagtgtt cactctcgga gtgtttgttc 9360 taagtgtagg ttaccgagtg aaacactact cttattttct taactgtata gttccggtgt 9420 ccgtccctcc cacgagtccc attttccttc cacctttctg aatgacttca tcatcaggag 9480 gtatagccag ggtcaccttc tcacccagtc tcttgaccag aagttaccag accatactgt 9540 ctctttacaa gtaaaattca aaaagctttg ctttgtcttc tcagacatac atatgcatat 9600 gaaaagatgg tttttaaatg tgccaagttt atgtgtgtgt ataaatatat atatgtgtgt 9660 gtgtgcgtgt atatatatat gtgtgtgtgt gtatgtgtat atatatatgt gtgtgtgggt 9720 gcgagtgtgc gagtatgtgt atgtgggggt gggtgcgcgt gtgtgtgtgt gtgtgtatgc 9780 tgtgagattg gtaagcaata cattagtaaa cacatcttca ttactctttt ccaatactgg 9840 accaatgatg tcctaactgt acatttcctt ccccttatga tgacgacgct ctgactcatt 9900 taggtagaga catttgacca ccttcattcc attgattttt ttttttctcc tttctgtgtt 9960 attcttaagg gaaaagagag agagagaaag aggggatggc atagatcccc ttgagcagag 10020 aaaaagcaaa atattttatt aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 10069 <210> 5 <211> 20 <212> DNA <213> MOUSE <400> 5 agtgaggccg acagcagcga 20 <210> 6<211> 21<212> DNA<213> MOUSE<400> 6acactgctca caaaggtagt g 21 <210> 7<211> 20<212> DNA<213> MOUSE<400> 7accacagtcc atgccatcac 20 <210> 8<211> 21<212> DNA<213> MOUSE<400> 8tccaccaccc tgtttgctgt a 21 <210> 9<211> 10069<212> DNA<213> MOUSEcggattcctt agatgttatt tgcttaaaaa c aaacgacaa accaagtaca gcggtacctc 60 tgatcaaaat ctgaaactag ttaacacgtt ttctcttccc acatctacaa acctcgttcc 120 taacctcttg ctgttgcctt ctcgagtttg ggggagaaaa gaaaatcaat ggatacagac 180 tgttatttat gaaaagaggc atattctaat agtcataagg caatgtgttt aagagctgca 240 cctgaacaaa tcttctccaa gctgaagatg gtcaccaact ctgtaatctg tagagtggat 300 ccacttgctc gagtcactgg gtcacacgaa tagcttcact atgccttaag gaggcatgtt 360 acatctatgg gatgtacaag tatttgaaaa gaataacatt aagaggaaaa ggacagcctt 420 gcaaatatca gtttcttata taaatgacaa cagtggcatg tggccccctt ttaatacccc 480 aacaattgta caagagtggg agaagttgtt gttgttgata accattatct ttcaggtgag 540 cct 543 atg ttc aat gca gca gta ggc ctg atc aat aag gac tct gtg aaa 588 Met Phe Asn Ala Ala Val Gly Leu Ile Asn Lys Asp Ser Val Lys 5 10 15 aaa ttg gga act ggc act aca gcc gta ttc att aat aaa gac tta 633 Lys Leu Gly Thr Gly Thr Thr Ala Val Phe Ile Asn Lys Asp Leu 20 25 30 ggc aaa aag cca ggg gct atc act aca gtt gga ctg ctg agc aaa 678 Gly Lys Lys Pro Gly Ala Ile Thr Thr Val Gly Leu Leu Ser Lys 35 40 45 gaa tca gga aag aag cta ggc att ggt att gtt cca ggg cta gtg 723 Glu Ser Gly Lys Lys Leu Gly Ile Gly Ile Val Pro Gly Leu Val 50 55 60 aat aaa gag tct ggc aag aaa tta gga ctt ggc acc gta gtt gga 768 Asn Lys Glu Ser Gly Lys Lys Leu Gly Leu Gly Thr Val Val Gly 65 70 75 ctg gtt aat aaa gag ttg gga aag aaa ctg agt tct aca gtt ggc 813 Leu Val Asn Lys Glu Leu Gly Lys Lys Leu Ser Ser Thr Val Gly 80 85 90 cta gtg gcc aag gat gtt acg aag aag att gta gca agc tca gca 858 Leu Val Ala Lys Asp Val Thr Lys Lys Ile Val Ala Ser Ser Ala 95 100 105 atg gga ttg gtt aat aag gac att gga aag aaa tta tta aat tgt 903 Met Gly Leu Val Asn Lys Asp Ile Gly Lys Lys Leu Leu Asn Cys 110 115 120 cct atg gca gga caa ctg ggc agt aaa gat gcc tta aac ctt aaa 948 Pro Met Ala Gly Gln Leu Gly Ser Lys Asp Ala Leu Asn Leu Lys 125 130 135 tct gaa gca ctg ctc ccc act cag gaa caa ctt aag gct tcc tgt 993 Ser Glu Ala Leu Leu Pro Thr Gln Glu Gln Leu Lys Ala Ser Cys 140 145 150 agt gca aac ata agt aat cat gac agt caa gaa ctt cct gag tct 1038 Ser Ala Asn Ile Ser Asn His Asp Ser Gln Glu Leu Pro Glu Ser 155 160 165 ctg aaa gac agt gct acc ggc aaa gct ttt gag aag agt gtt atg 1083 Leu Lys Asp Ser Ala Thr Gly Lys Ala Phe Glu Lys Ser Val Met 170 175 180 cgg cat agt aaa gaa agc atg ttg gaa aaa ttt tca gtc cga aaa 1128 Arg His Ser Lys Glu Ser Met Leu Glu Lys Phe Ser Val Arg Lys 185 190 195 gaa att act aat ttg gag aaa gaa atg ttt aat gaa gga aca tgc 1173 Glu Ile Thr Asn Leu Glu Lys Glu Met Phe Asn Glu Gly Thr Cys 200 205 210 att cag caa gac aat ttc tca tct agt gaa agg gga gcc ttt gaa 1218 Ile Gln Gln Asp Asn Phe Ser Ser Ser Glu Arg Gly Ala Phe Glu 215 220 225 acc tca aaa cat gaa aag cag cct cct gtg tat tgc act tct cct 1263 Thr Ser Lys His Glu Lys Gln Pro Pro Val Tyr Cys Thr Ser Pro 230 235 240 gac ttt caa ata gga ggt gcc tct gat gcc tct aca gct aaa tct 1308 Asp Phe Gln Ile Gly Gly Ala Ser Asp Ala Ser Thr Ala Lys Ser 245 250 255 ccc ttc agt gca gta ggc gaa agc aac ctt cct tcc tcg tca cct 1353 Pro Phe Ser Ala Val Gly Glu Ser Asn Leu Pro Ser Ser Ser Pro 260 265 270 act gta tct gtt aat cct gta acc agg agt ccc cct gaa gct tct 1398 Thr Val Ser Val Asn Pro Val Thr Arg Ser Pro Pro Glu Ala Ser 275 280 285 tca cag ttg gtt cca aac cca tta ctt tta aat tct aca gca gaa 1443 Ser Gln Leu Val Pro Asn Pro Leu Leu Leu Asn Ser Thr Ala Glu 290 295 300 caa atg gaa gaa atc tct gaa tct att gga aag agc cag ttt act 1488 Gln Met Glu Glu Ile Ser Glu Ser Ile Gly Lys Ser Gln Phe Thr 305 310 315 gct gaa agt acc cac ttg aat gtt ggt cac aga tca tta ggt cat 1533 Ala Glu Ser Thr His Leu Asn Val Gly His Arg Ser Leu Gly His 320 325 330 agc tta agt att gag tgt aaa gga att gat aaa gaa cta aat gaa 1578 Ser Leu Ser Ile Glu Cys Lys Gly Ile Asp Lys Glu Leu Asn Glu 335 340 345 tca aaa aat aca cat cta gat att cct aga ata agt tct tcc ttg 1623 Ser Lys Asn Thr His Leu Asp Ile Pro Arg Ile Ser Ser Ser Leu 350 355 360 gga aaa aag cca agt ttg act tct gac tct ggt att cat gca att 1668 Gly Lys Lys Pro Ser Leu Thr Ser Asp Ser Gly Ile His Ala Ile 365 370 375 act cct tcc gtt gtt aat ttt act agt ttg ttt agt aac aaa cct 1713 Thr Pro Ser Val Val Asn Phe Thr Ser Leu Phe Ser Asn Lys Pro 380 385 390 ttt tta aag ctt ggt gca gtc act gca cca gac aaa cac tgc cag 1758 Phe Leu Lys Leu Gly Ala Val Thr Ala Pro Asp Lys His Cys Gln 395 400 405 gtt gct gaa agc cta agc tcg agt ttc cag tcc aaa cca ttg aaa 1803 Val Ala Glu Ser Leu Ser Ser Ser Phe Gln Ser Lys Pro Leu Lys 410 415 420 aaa gaa aag gaa gaa aaa cct cgg tgg act aaa gtg gtg gca aga 1848 Lys Glu Lys Glu Glu Lys Pro Arg Trp Thr Lys Val Val Ala Arg 425 430 435 agc aca tgc cgg tct cca aaa gga cta gac tta gaa aga tca gag 1893 Ser Thr Cys Arg Ser Pro Lys Gly Leu Asp Leu Glu Arg Ser Glu 440 445 450 ctt ttt aag aat gtt tct tgt agc tca cta tca aat agt tct gag 1938 Leu Phe Lys Asn Val Ser Cys Ser Ser Leu Ser Asn Ser Ser Glu 455 460 465 cca gcg aag ttt atg aaa act atc gga gca tca tca ttc gtc gat 1983 Pro Ala Lys Phe Met Lys Thr Ile Gly Ala Ser Ser Phe Val Asp 470 475 480 cat gac ttc ctt aaa cgc cga ttg cca aag ttg agt aag tct tca 2028 His Asp Phe Leu Lys Arg Arg Leu Pro Lys Leu Ser Lys Ser Ser 485 490 495 gct cca tct ctt gct ctt tta acc gac agc gag aaa cca tct cat 2073 Ala Pro Ser Leu Ala Leu Leu Thr Asp Ser Glu Lys Pro Ser His 500 505 510 aag tct ttt att act cac aaa ctg tcc tcc agt atg tgt gtc act 2118 Lys Ser Phe Ile Thr His Lys Leu Ser Ser Ser Met Cys Val Thr 515 520 525 agc gat ctt ttg tcg gat att tat aag ccc aag aga gga aga cct 2163 Ser Asp Leu Leu Ser Asp Ile Tyr Lys Pro Lys Arg Gly Arg Pro 530 535 540 aaa tcc aag gaa atg cct cag cta gaa ggt cca cct aaa agg act 2208 Lys Ser Lys Glu Met Pro Gln Leu Glu Gly Pro Pro Lys Arg Thr 545 550 555 tta aaa ata cct gcc tct aaa gtt ttt tct tta cag tct aaa gaa 2253 Leu Lys Ile Pro Ala Ser Lys Val Phe Ser Leu Gln Ser Lys Glu 560 565 570 gag caa gaa ccc cca att tta caa cca gaa att gaa att cct tcc 2298 Glu Gln Glu Pro Pro Ile Leu Gln Pro Glu Ile Glu Ile Pro Ser 575 580 585 ttc aag caa agt ttg tct gta tct cct ttt cca aaa aaa aga ggc 2343 Phe Lys Gln Ser Leu Ser Val Ser Pro Phe Pro Lys Lys Arg Gly 590 595 600 agg cct aaa agg cag atg agg tct cca gtg aag atg aaa ccc cct 2388 Arg Pro Lys Arg Gln Met Arg Ser Pro Val Lys Met Lys Pro Pro 605 610 615 gtc ctg tca gtg gct cca ttt gtt gcc act gaa agt cca agt aag 2433 Val Leu Ser Val Ala Pro Phe Val Ala Thr Glu Ser Pro Ser Lys 620 625 630 ctc gag tct gaa agt gag aac cat aga agt agc agt gac ttt ttt 2478 Leu Glu Ser Glu Ser Glu Asn His Arg Ser Ser Ser Asp Phe Phe 635 640 645 gag agt gag gac cag ctt cag gac aca gac gac tta gat gac agt 2523 Glu Ser Glu Asp Gln Leu Gln Asp Thr Asp Asp Leu Asp Asp Ser 650 655 660 cac agg caa agt gtc tgt agt atg agt gac ctt gag atg gaa cca 2568 His Arg Gln Ser Val Cys Ser Met Ser Asp Leu Glu Met Glu Pro 665 670 675 gat aaa aaa att agc aag cga aac aat gga caa tta atg aaa aca 2613 Asp Lys Lys Ile Ser Lys Arg Asn Asn Gly Gln Leu Met Lys Thr 680 685 690 att atc cga aaa ata aat aaa atg aag act tta aag aga aaa aaa 2658 Ile Ile Arg Lys Ile Asn Lys Met Lys Thr Leu Lys Arg Lys Lys 695 700 705 ctg ttg aat cag att ctt tcg agt tct gta gaa tca agt aat aaa 2703 Leu Leu Asn Gln Ile Leu Ser Ser Ser Val Glu Ser Ser Asn Lys 710 715 720 gga aaa gtg cag tcc aag ctt cac aat aca gtc tca agt ctt gct 2748 Gly Lys Val Gln Ser Lys Leu His Asn Thr Val Ser Ser Leu Ala 725 730 735 gcc aca ttt ggc tct aaa ttg ggg caa caa atc aat gtc agc aag 2793 Ala Thr Phe Gly Ser Lys Leu Gly Gln Gln Ile Asn Val Ser Lys 740 745 750 aaa gga acc att tac ata ggg aag aga agg ggg cgg aaa cca aaa 2838 Lys Gly Thr Ile Tyr Ile Gly Lys Arg Arg Gly Arg Lys Pro Lys 755 760 765 acc gtc tta aat ggc ctg ctt tct ggt agc cct gcc agc ctt gct 2883 Thr Val Leu Asn Gly Leu Leu Ser Gly Ser Pro Ala Ser Leu Ala 770 775 780 gtg ctt gaa aaa aca gct cag cag gca gct ggg tca gca tta gga 2928 Val Leu Glu Lys Thr Ala Gln Gln Ala Ala Gly Ser Ala Leu Gly 785 790 795 cag atc ctc ccc cct tta ctg cca tca cct gtt agt agc tct gag 2973 Gln Ile Leu Pro Pro Leu Leu Pro Ser Pro Val Ser Ser Ser Glu 800 805 810 atc ctt cca tca cct att tgc tct cag tct tct ggg act agt gga 3018 Ile Leu Pro Ser Pro Ile Cys Ser Gln Ser Ser Gly Thr Ser Gly 815 820 825 ggt cag agc cct gtt agt agt gac gca ggc ttt gtt gaa cct agc 3063 Gly Gln Ser Pro Val Ser Ser Asp Ala Gly Phe Val Glu Pro Ser 830 835 840 tca gtg cca tat ttg cat gtg cac tcc aga cag ggc agt atg att 3108 Ser Val Pro Tyr Leu His Val His Ser Arg Gln Gly Ser Met Ile 845 850 855 cag act ctt gca atg aag aag gct tcc aag ggc aga agg cgg ctc 3153 Gln Thr Leu Ala Met Lys Lys Ala Ser Lys Gly Arg Arg Arg Leu 860 865 870 tct cct cct act ttg ttg cca aat tct cct tct cat ttg agt gaa 3198 Ser Pro Pro Thr Leu Leu Pro Asn Ser Pro Ser His Leu Ser Glu 875 880 885 ctc aca tcc ctg aaa gaa gcc act cct tcc cca gtt agt gag tct 3243 Leu Thr Ser Leu Lys Glu Ala Thr Pro Ser Pro Val Ser Glu Ser 890 895 900 cat agt gac gag acc att ccc agt gac agt ggc att ggg aca gat 3288 His Ser Asp Glu Thr Ile Pro Ser Asp Ser Gly Ile Gly Thr Asp 905 910 915 aat aat agc aca tca gac agg gca gag aag ttt tgt gga cag aaa 3333 Asn Asn Ser Thr Ser Asp Arg Ala Glu Lys Phe Cys Gly Gln Lys 920 925 930 aag agg aga cat tct ttt gag cac att tct ctg att ccc cct gaa 3378 Lys Arg Arg His Ser Phe Glu His Ile Ser Leu Ile Pro Pro Glu 935 940 945 act tct acc gtc cta aac agt ctc aaa gaa aaa cac aaa cac aaa 3423 Thr Ser Thr Val Leu Asn Ser Leu Lys Glu Lys His Lys His Lys 950 955 960 tgt aag cgc agg agt cac gat tac ctc agc tat gac aag atg aaa 3468 Cys Lys Arg Arg Ser His Asp Tyr Leu Ser Tyr Asp Lys Met Lys 965 970 975 aga cag aag cga aaa cgg aaa aag aaa tat ccc cag ctt cga aat 3513 Arg Gln Lys Arg Lys Arg Lys Lys Lys Tyr Pro Gln Leu Arg Asn 980 985 990 agg cag gat cca gac ttc atc gca gaa cta gag gag ctg ata agt 3558 Arg Gln Asp Pro Asp Phe Ile Ala Glu Leu Glu Glu Leu Ile Ser 995 1000 1005 cgt cta agt gag att cgg atc acc cat cga agc cat cat ttt att 3603 Arg Leu Ser Glu Ile Arg Ile Thr His Arg Ser His His Phe Ile 1010 1015 1020 ccc cga gac ctc ctg cca act att ttt cga atc aac ttt aat agt 3648 Pro Arg Asp Leu Leu Pro Thr Ile Phe Arg Ile Asn Phe Asn Ser 1025 1030 1035 ttc tat aca cat cct tct ttt ccc tta gac cca ttg cac tac att 3693 Phe Tyr Thr His Pro Ser Phe Pro Leu Asp Pro Leu His Tyr Ile 1040 1045 1050 cgg aaa cct gac tta aaa aag aaa cga ggg agg ccc cct aag atg 3738 Arg Lys Pro Asp Leu Lys Lys Lys Arg Gly Arg Pro Pro Lys Met 1055 1060 1065 agg gag gca atg gca gaa atg cct ttt atg cac agc ctt agt ttt 3783 Arg Glu Ala Met Ala Glu Met Pro Phe Met His Ser Leu Ser Phe 1070 1075 1080 cct tta tct agt act gga ttt tat cct tct tat ggc atg cct tac 3828 Pro Leu Ser Ser Thr Gly Phe Tyr Pro Ser Tyr Gly Met Pro Tyr 1085 1090 1095 tct ccc tca ccc ctt aca gct gct cca ata gga tta ggg tat tat 3873 Ser Pro Ser Pro Leu Thr Ala Ala Pro Ile Gly Leu Gly Tyr Tyr 1100 1105 1110 gga agg tat ccc ccc act ctt tat cca ccg cca cca tct cct tca 3918 Gly Arg Tyr Pro Pro Thr Leu Tyr Pro Pro Pro Pro Ser Pro Ser 1115 1120 1125 ttc acc act cca ctg cca cct ccc tcc tat atg cat gct ggt cat 3963 Phe Thr Thr Pro Leu Pro Pro Pro Ser Tyr Met His Ala Gly His 1130 1135 1140 tta ttg ctc aat cct acc aaa tat cat aag aaa aag cat aag ctg 4008 Leu Leu Leu Asn Pro Thr Lys Tyr His Lys Lys Lys His Lys Leu 1145 1150 1155 ctt aga cag gag gct ttt ctt aca acc agc agg acc cct ctc ctt 4053 Leu Arg Gln Glu Ala Phe Leu Thr Thr Ser Arg Thr Pro Leu Leu 1160 1165 1170 tcc atg agc acc tac ccc agc gta cct cca gag atg gct tat ggt 4098 Ser Met Ser Thr Tyr Pro Ser Val Pro Pro Glu Met Ala Tyr Gly 1175 1180 1185 tgg atg gtg gag cac aaa cac aga cac cgt cac aaa cac aga gag 4143 Trp Met Val Glu His Lys His Arg His Arg His Lys His Arg Glu 1190 1195 1200 cac cgt tct gaa cag ccc cag gtt tcc atg gat agt ggc tct tcc 4188 His Arg Ser Glu Gln Pro Gln Val Ser Met Asp Ser Gly Ser Ser 1205 1210 1215 aga tcc gtc ttg gag tct ttg aaa cgt tac cga ttt ggt aag gat 4233 Arg Ser Val Leu Glu Ser Leu Lys Arg Tyr Arg Phe Gly Lys Asp 1220 1225 1230 act gtt gga gat cga tat aag cat aag gaa aag cac agg tgt cac 4278 Thr Val Gly Asp Arg Tyr Lys His Lys Glu Lys His Arg Cys His 1235 1240 1245 atg tcc tgc cct cat ctc tct cct tca aag aac tta ata aac aga 4323 Met Ser Cys Pro His Leu Ser Pro Ser Lys Asn Leu Ile Asn Arg 1250 1255 1260 gaa gaa cag tgg gtt tct cga gag cct tca gaa tca agt tct tta 4368 Glu Glu Gln Trp Val Ser Arg Glu Pro Ser Glu Ser Ser Ser Leu 1265 1270 1275 gcc ttg gga ttg caa aca cct tta caa att gac tgc tca gaa agt 4413 Ala Leu Gly Leu Gln Thr Pro Leu Gln Ile Asp Cys Ser Glu Ser 1280 1285 1290 tct ccc agt ttg tcc ctt gga gga ttt act ccc aat tct gag cca 4458 Ser Pro Ser Leu Ser Leu Gly Gly Phe Thr Pro Asn Ser Glu Pro 1295 1300 1305 gcc agc agt gat gaa cat atg aac ctt ttt aca agt gca ata ggc 4503 Ala Ser Ser Asp Glu His Met Asn Leu Phe Thr Ser Ala Ile Gly 1310 1315 1320 agc tgc aga gtt tca aac cct aac tcc agt tgc cgg aag aaa tta 4548 Ser Cys Arg Val Ser Asn Pro Asn Ser Ser Cys Arg Lys Lys Leu 1325 1330 1335 act gac agc ccc ggg ctc ttt cct gta caa gat act gca cta aat 4593 Thr Asp Ser Pro Gly Leu Phe Pro Val Gln Asp Thr Ala Leu Asn 1340 1345 1350 cgg cct cac aga aag gaa cca tta cct tcc agt gaa agg gca ata 4638 Arg Pro His Arg Lys Glu Pro Leu Pro Ser Ser Glu Arg Ala Ile 1355 1360 1365 cag tcg ttg gca ggt tcc cag tca gct tcc gat aaa cct tcc cag 4683 Gln Ser Leu Ala Gly Ser Gln Ser Ala Ser Asp Lys Pro Ser Gln 1370 1375 1380 cga tca tca gaa agc aca aat tgt agc cct act cgt aaa agg tct 4728 Arg Ser Ser Glu Ser Thr Asn Cys Ser Pro Thr Arg Lys Arg Ser 1385 1390 1395 tca tct gag agt act tct tca aca gtg aat gga gtt cct tcc aga 4773 Ser Ser Glu Ser Thr Ser Ser Thr Val Asn Gly Val Pro Ser Arg 1400 1405 1410 agt ccc aga ttg gtt gct tct atg gat gat tct gta gac agt ctg 4818 Ser Pro Arg Leu Val Ala Ser Met Asp Asp Ser Val Asp Ser Leu 1415 1420 1425 ttg cag cgg ata gta cat cac gat gag caa gag tcc atg gag aaa 4863 Leu Gln Arg Ile Val His His Asp Glu Gln Glu Ser Met Glu Lys 1430 1435 1440 aac ggt gat gct tcc att aca act gtg tct gca cca cct tct tcc 4908 Asn Gly Asp Ala Ser Ile Thr Thr Val Ser Ala Pro Pro Ser Ser 1445 1450 1455 agt cca ggc cat agc tac agc aag gag cga gcc tta ggt aaa tca 4953 Ser Pro Gly His Ser Tyr Ser Lys Glu Arg Ala Leu Gly Lys Ser 1460 1465 1470 gac agc ctt cta gtg cct gca gtc ccg aat gac tct tgc agt aat 4998 Asp Ser Leu Leu Val Pro Ala Val Pro Asn Asp Ser Cys Ser Asn 1475 1480 1485 atc cca ctt ctt tct gaa aag tca gca agt agg tgt tcc ccc cat 5043 Ile Pro Leu Leu Ser Glu Lys Ser Ala Ser Arg Cys Ser Pro His 1490 1495 1500 cac atc aag aga agt gta gtt gaa gct atg caa cgc caa gct cgg 5088 His Ile Lys Arg Ser Val Val Glu Ala Met Gln Arg Gln Ala Arg 1505 1510 1515 aaa atg tgc aat tat gac aaa atc ttg gcc acc aag aaa aac ctg 5133 Lys Met Cys Asn Tyr Asp Lys Ile Leu Ala Thr Lys Lys Asn Leu 1520 1525 1530 gac cat gtt aat aaa att tta aaa gcc aaa aaa ctt caa agg cag 5178 Asp His Val Asn Lys Ile Leu Lys Ala Lys Lys Leu Gln Arg Gln 1535 1540 1545 gcc agg aca gga aac aat ttt gtg aaa cgc aga cca ggt cga cct 5223 Ala Arg Thr Gly Asn Asn Phe Val Lys Arg Arg Pro Gly Arg Pro 1550 1555 1560 cgg aaa tgc ccc ctc caa gca gtg gtg tca atg caa gcc ttc cag 5268 Arg Lys Cys Pro Leu Gln Ala Val Val Ser Met Gln Ala Phe Gln 1565 1570 1575 gcc gcc cag ttt gtc agc ccg gaa ttg aat gaa ggc gaa gac atg 5313 Ala Ala Gln Phe Val Ser Pro Glu Leu Asn Glu Gly Glu Asp Met 1580 1585 1590 tcc ctg cac cta agt cca gac aca gtc act gat gtg atc gag gct 5358 Ser Leu His Leu Ser Pro Asp Thr Val Thr Asp Val Ile Glu Ala 1595 1600 1605 gtg gtt cag agt gtg aac ctc act tca gaa cat aag aag ggg gtg 5403 Val Val Gln Ser Val Asn Leu Thr Ser Glu His Lys Lys Gly Val 1610 1615 1620 aag agg aaa aat tgg ctg tta gaa gaa cag act agg aaa aag cag 5448 Lys Arg Lys Asn Trp Leu Leu Glu Glu Gln Thr Arg Lys Lys Gln 1625 1630 1635 aag aca gta cca gag gaa gaa gag caa gaa aac aat aaa agc ttt 5493 Lys Thr Val Pro Glu Glu Glu Glu Gln Glu Asn Asn Lys Ser Phe 1640 1645 1650 ata gaa aca cca gtt gaa att ccc agt cct ctt gaa acg cct gct 5538 Ile Glu Thr Pro Val Glu Ile Pro Ser Pro Leu Glu Thr Pro Ala 1655 1660 1665 gaa cct tct gaa cct gaa aat acc ttg caa cct gtg ctg gct ctc 5583 Glu Pro Ser Glu Pro Glu Asn Thr Leu Gln Pro Val Leu Ala Leu 1670 1675 1680 atc cca cga gaa aag aag gcc cca cgt cct cca aag aag aaa tac 5628 Ile Pro Arg Glu Lys Lys Ala Pro Arg Pro Pro Lys Lys Lys Tyr 1685 1690 1695 cag aga gct ggg ctg tat tct gat gtt tcc aaa aca ata gac cca 5673 Gln Arg Ala Gly Leu Tyr Ser Asp Val Ser Lys Thr Ile Asp Pro 1700 1705 1710 aag agc cga tta atc caa tta aag aaa gaa aag ttg gag tat act 5718 Lys Ser Arg Leu Ile Gln Leu Lys Lys Glu Lys Leu Glu Tyr Thr 1715 1720 1725 cca gga gag cac gag tat ggg ttg ttc cca gcg ccc att cat gtt 5763 Pro Gly Glu His Glu Tyr Gly Leu Phe Pro Ala Pro Ile His Val 1730 1735 1740 gga aag tat ctc aga cag aag aga att gac ttc cag ctt ccc tat 5808 Gly Lys Tyr Leu Arg Gln Lys Arg Ile Asp Phe Gln Leu Pro Tyr 1745 1750 1755 gat att ctc tgg cag tgg aaa cac aat cag cta tac aaa aag cca 5853 Asp Ile Leu Trp Gln Trp Lys His Asn Gln Leu Tyr Lys Lys Pro 1760 1765 1770 gat gtc ccc ctg tat aaa aaa atc cgt tca aat gtc tat gtt gat 5898 Asp Val Pro Leu Tyr Lys Lys Ile Arg Ser Asn Val Tyr Val Asp 1775 1780 1785 gtc aaa cca ctt tct ggt tat gag gct acc acc tgt aat tgt aag 5943 Val Lys Pro Leu Ser Gly Tyr Glu Ala Thr Thr Cys Asn Cys Lys 1790 1795 1800 aag cca gat gac gac acc agg aag ggc tgt ggg gat gac tgc cta 5988 Lys Pro Asp Asp Asp Thr Arg Lys Gly Cys Gly Asp Asp Cys Leu 1805 1810 1815 aat aga atg atc ttt gct gag tgt tcc cct aac act tgc ccc tgt 6033 Asn Arg Met Ile Phe Ala Glu Cys Ser Pro Asn Thr Cys Pro Cys 1820 1825 1830 ggt gag cag tgc tgt aac cag agg ata cag agg cat gag tgg gtg 6078 Gly Glu Gln Cys Cys Asn Gln Arg Ile Gln Arg His Glu Trp Val 1835 1840 1845 cag tgt ctg gaa cga ttt cga gct gag gaa aaa ggt tgg gga att 6123 Gln Cys Leu Glu Arg Phe Arg Ala Glu Glu Lys Gly Trp Gly Ile 1850 1855 1860 aga acc aaa gaa ccc cta aaa gct ggc cag ttc atc att gaa tac 6168 Arg Thr Lys Glu Pro Leu Lys Ala Gly Gln Phe Ile Ile Glu Tyr 1865 1870 1875 cta ggg gaa gtt gtc agc gaa caa gaa ttc agg aac agg atg att 6213 Leu Gly Glu Val Val Ser Glu Gln Glu Phe Arg Asn Arg Met Ile 1880 1885 1890 gag caa tat cat aat cac agt gac cac tac tgt tta aac ctg gat 6258 Glu Gln Tyr His Asn His Ser Asp His Tyr Cys Leu Asn Leu Asp 1895 1900 1905 agc gga atg gtg att gac agt tac cgc atg gga aat gag gcc aga 6303 Ser Gly Met Val Ile Asp Ser Tyr Arg Met Gly Asn Glu Ala Arg 1910 1915 1920 ttc atc aac cac agc tgt gac cca aat tgt gaa atg cag aaa tgg 6348 Phe Ile Asn His Ser Cys Asp Pro Asn Cys Glu Met Gln Lys Trp 1925 1930 1935 tct gtt aat gga gtg tac cgt att gga ctg tat gca ctt aag gat 6393 Ser Val Asn Gly Val Tyr Arg Ile Gly Leu Tyr Ala Leu Lys Asp 1940 1945 1950 atg cca gct ggg aca gag ctt acc tat gat tac aac ttt cat tcc 6438 Met Pro Ala Gly Thr Glu Leu Thr Tyr Asp Tyr Asn Phe His Ser 1955 1960 1965 ttc aat gta gaa aaa cag caa ctt tgt aaa tgt ggt ttt gag aag 6483 Phe Asn Val Glu Lys Gln Gln Leu Cys Lys Cys Gly Phe Glu Lys 1970 1975 1980 tgt cga gga atc att gga ggc aag agt caa cgg atg aac gga ctc 6528 Cys Arg Gly Ile Ile Gly Gly Lys Ser Gln Arg Met Asn Gly Leu 1985 1990 1995 cct agc cat aaa ggt agc cag tct tca agc acg cat aga aag tct 6573 Pro Ser His Lys Gly Ser Gln Ser Ser Ser Thr His Arg Lys Ser 2000 2005 2010 gca cgg gcg aaa gag aag cgg aag tcc aag cac aag ctg aag aaa 6618 Ala Arg Ala Lys Glu Lys Arg Lys Ser Lys His Lys Leu Lys Lys 2015 2020 2025 agg aaa ggc cat ccc tct gaa gag ccc agt gaa aac atc aac acc 6663 Arg Lys Gly His Pro Ser Glu Glu Pro Ser Glu Asn Ile Asn Thr 2030 2035 2040 cca aca aga ttg act cca cag tta cag atg aag cca atg tcc aac 6708 Pro Thr Arg Leu Thr Pro Gln Leu Gln Met Lys Pro Met Ser Asn 2045 2050 2055 aga gag agg aac ttc gtg cta aag cac cat gtg ttc ttg gtg cga 6753 Arg Glu Arg Asn Phe Val Leu Lys His His Val Phe Leu Val Arg 2060 2065 2070 aac tgg gaa aag atc cat cag aag cag gag gag gtg aag cac acc 6798 Asn Trp Glu Lys Ile His Gln Lys Gln Glu Glu Val Lys His Thr 2075 2080 2085 cgt gac atc cac tca gca tcg ctg tac acc cgc tgg aac ggc ctc 6843 Arg Asp Ile His Ser Ala Ser Leu Tyr Thr Arg Trp Asn Gly Leu 2090 2095 2100 tgt cgg gac gac ggg aac att aag tct gat gtc ttc atg acc cag 6888 Cys Arg Asp Asp Gly Asn Ile Lys Ser Asp Val Phe Met Thr Gln 2105 2110 2115 ttc tct gcc ctg cag aca gct aga tct gtt cga aca aga cgc ttg 6933 Phe Ser Ala Leu Gln Thr Ala Arg Ser Val Arg Thr Arg Arg Leu 2120 2125 2130 gca gct gca gag gaa aac ctg gaa gtg gct cgg gca gcg cgc cta 6978 Ala Ala Ala Glu Glu Asn Leu Glu Val Ala Arg Ala Ala Arg Leu 2135 2140 2145 gca cag atc ttc aaa gag atc tgt gat ggc atc atc tcc tac aga 7023 Ala Gln Ile Phe Lys Glu Ile Cys Asp Gly Ile Ile Ser Tyr Arg 2150 2155 2160 gac tct tcc cag caa acc ctt gca gct cca ctt ttg aat ctt ccc 7068 Asp Ser Ser Gln Gln Thr Leu Ala Ala Pro Leu Leu Asn Leu Pro 2165 2170 2175 cca aag aaa aaa aat gct gac tat tat gag aag atc tct gac ccc 7113 Pro Lys Lys Lys Asn Ala Asp Tyr Tyr Glu Lys Ile Ser Asp Pro 2180 2185 2190 ctg gat ctc agc acc ata gag aag cag atc ctc att ggg tat tac 7158 Leu Asp Leu Ser Thr Ile Glu Lys Gln Ile Leu Ile Gly Tyr Tyr 2195 2200 2205 aaa aca gtg gag gct ttc gat gct gac atg ctt aag gtc ttt cgg 7203 Lys Thr Val Glu Ala Phe Asp Ala Asp Met Leu Lys Val Phe Arg 2210 2215 2220 aat gct gag aag tac tat ggg cgt aaa tcc cca att ggg aga gat 7248 Asn Ala Glu Lys Tyr Tyr Gly Arg Lys Ser Pro Ile Gly Arg Asp 2225 2230 2235 gtt tgc cgc tta cga aag gcc tat tac agc gcc cgg cat gaa gct 7293 Val Cys Arg Leu Arg Lys Ala Tyr Tyr Ser Ala Arg His Glu Ala 2240 2245 2250 tcg gct cag atc gat gag att gtg gga gaa acg gcc agt gag gcc 7338 Ser Ala Gln Ile Asp Glu Ile Val Gly Glu Thr Ala Ser Glu Ala 2255 2260 2265 gac agc agc gag acc tca gtc tcc gag aag gag agc ggg cac gag 7383 Asp Ser Ser Glu Thr Ser Val Ser Glu Lys Glu Ser Gly His Glu 2270 2275 2280 aag gat gat gat gtt atc cgc tgc atc tgc ggc ctc tat aaa gat 7428 Lys Asp Asp Asp Val Ile Arg Cys Ile Cys Gly Leu Tyr Lys Asp 2285 2290 2295 gaa ggc ctc atg atc cag tgt gac aag tgc atg gtg tgg cag cac 7473 Glu Gly Leu Met Ile Gln Cys Asp Lys Cys Met Val Trp Gln His 2300 2305 2310 tgc gac tgc atg ggt gtg aac acg gat gtg gag cac tac ctt tgt 7518 Cys Asp Cys Met Gly Val Asn Thr Asp Val Glu His Tyr Leu Cys 2315 2320 2325 gag cag tgt gac cct cgg cct gtg gac agg gag gta ccc atg atc 7563 Glu Gln Cys Asp Pro Arg Pro Val Asp Arg Glu Val Pro Met Ile 2330 2335 2340 cct agg ccc cac tat gcc cag ccc ggc tgt gtc tac ttc atc tgt 7608 Pro Arg Pro His Tyr Ala Gln Pro Gly Cys Val Tyr Phe Ile Cys 2345 2350 2355 tta ctc cga gat gac ttg ctg ctt cgt cag ggt cat tgt gtg tac 7653 Leu Leu Arg Asp Asp Leu Leu Leu Arg Gln Gly His Cys Val Tyr 2360 2365 2370 ctg atg agg gac agt cgg cgc acg cct gat ggc cac cca gtc cgt 7698 Leu Met Arg Asp Ser Arg Arg Thr Pro Asp Gly His Pro Val Arg 2375 2380 2385 cag tcc tac aga ctc tta tct cac att aac cga gat aaa ctt gac 7743 Gln Ser Tyr Arg Leu Leu Ser His Ile Asn Arg Asp Lys Leu Asp 2390 2395 2400 atc ttt aga atc gag aag ctc tgg aag aat gaa aaa gaa gaa cgg 7788 Ile Phe Arg Ile Glu Lys Leu Trp Lys Asn Glu Lys Glu Glu Arg 2405 2410 2415 ttt gcc ttt ggt cac cat tat ttc cgc cca cat gag act cat cac 7833 Phe Ala Phe Gly His His Tyr Phe Arg Pro His Glu Thr His His 2420 2425 2430 tct cca tcc cgt cgg ttc tat cac aac gag ctg ttc cgg gtg ccc 7878 Ser Pro Ser Arg Arg Phe Tyr His Asn Glu Leu Phe Arg Val Pro 2435 2440 2445 ctc tat gag atc att ccc ttg gag gcc gta gtt ggg acc tgc tgt 7923 Leu Tyr Glu Ile Ile Pro Leu Glu Ala Val Val Gly Thr Cys Cys 2450 2455 2460 gtg ttg gac ctt tat aca tac tgt aaa ggg aga ccc aaa gga ata 7968 Val Leu Asp Leu Tyr Thr Tyr Cys Lys Gly Arg Pro Lys Gly Ile 2465 2470 2475 aag gaa caa gat gtg tat atc tgt gat tat cgg ctt gac aag tca 8013 Lys Glu Gln Asp Val Tyr Ile Cys Asp Tyr Arg Leu Asp Lys Ser 2480 2485 2490 gca cac ctt ttt tac aag att cat cgg aat cga tat ccg gtc tgc 8058 Ala His Leu Phe Tyr Lys Ile His Arg Asn Arg Tyr Pro Val Cys 2495 2500 2505 acc aag ccc tat gcc ttt gat cat ttc ccc aag aag ctc act ccc 8103 Thr Lys Pro Tyr Ala Phe Asp His Phe Pro Lys Lys Leu Thr Pro 2510 2515 2520 aaa aga gac ttc tca cct cat tat gtc cca gac aac tac aag agg 8148 Lys Arg Asp Phe Ser Pro His Tyr Val Pro Asp Asn Tyr Lys Arg 2525 2530 2535 aac gga gga cga tca tcc tgg aag tct gaa cgc tca aag cca ccc 8193 Asn Gly Gly Arg Ser Ser Trp Lys Ser Glu Arg Ser Lys Pro Pro 2540 2545 2550 cta aaa gac cta gga caa gaa gat gat gct ttg ccc ttg att gaa 8238 Leu Lys Asp Leu Gly Gln Glu Asp Asp Ala Leu Pro Leu Ile Glu 2555 2560 2565 gag gta ctg gct agt cag gag caa gca gcc agg gaa gtg ccc agc 8283 Glu Val Leu Ala Ser Gln Glu Gln Ala Ala Arg Glu Val Pro Ser 2570 2575 2580 cct gag gag cca gac cag gaa aga gcc act ggg gac att ggg gac 8328 Pro Glu Glu Pro Asp Gln Glu Arg Ala Thr Gly Asp Ile Gly Asp 2585 2590 2595 gct gaa aag aaa cca gag gag agc agt caa gaa gcc cag tta gcc 8373 Ala Glu Lys Lys Pro Glu Glu Ser Ser Gln Glu Ala Gln Leu Ala 2600 2605 2610 agc aca cct gag gag cga agg cac agc cag agg gaa cgg ctc aac 8418 Ser Thr Pro Glu Glu Arg Arg His Ser Gln Arg Glu Arg Leu Asn 2615 2620 2625 cag atc ctg ctc aac ctc ctt gag aaa ata cct ggg aaa aat gcc 8463 Gln Ile Leu Leu Asn Leu Leu Glu Lys Ile Pro Gly Lys Asn Ala 2630 2635 2640 att gac gtg acc tac ctg ctg gag gaa ggg tcc ggc agg aaa ctg 8508 Ile Asp Val Thr Tyr Leu Leu Glu Glu Gly Ser Gly Arg Lys Leu 2645 2650 2655 cga agg cgc act ttg ttt ata cca gaa aat agc ttt cgg aag tga 8553 Arg Arg Arg Thr Leu Phe Ile Pro Glu Asn Ser Phe Arg Lys 2660 2665 2669 ctctcaaaag gatgagaacc gcgagcgagc acctgggatc caacggcacc atcaagtcca 8613 gcctcttgct ctctggacat ggactggggc agaaaagttc tgttcaggca aggggggtgg 8673 ggtcacgttt ctgacatggt actttctaaa gctcggagct agtggaaagg gaaaggaagt 8733 aggcttgtct gagacgggtg cgtttacttc tctctctggc ttctcctgag ggttaacaga 8793 gacaggagga ctacacttgg agtagccaga agctactggt actttccagc acttccaaag 8853 ggaagggtcc ggacccagcc tgccccgttt atctcttagc tctaagagct acgtcagaga 8913 cctaaacagg tcagtagctg aggcctcttt taagttcctt taacgggaaa gttctttctc 8973 ccttcttgcc caaccaggtc aaagtactag aacatgaatc agctgctcag agcacttaga 9033 actgctgcca ctctccctac ctctgttccc agagtagagt cagtagaacc agggaggcgg 9093 agaggccccc atggggtccg aagggcagta ttggtaatta tttttggttt acccttcata 9153 acctgccgaa catacttttt cctcctgaga aagcccagcc cccgccagca cacatgctgc 9213 ttctcttcct gtgtgtctgc tgtgcaaaag attcacgtcc aagaaagaaa aacggtttgt 9273 aaaactgcat aaaccctcat acacttctcc cctaacaaaa ctcactacag aactgttgag 9333 cagtgttcac tctcggagtg tttgttctaa gtgtaggtta ccgagtgaaa cactactctt 9393 attttcttaa ctgtatagtt ccggtgtccg tccctcccac gagtcccatt ttccttccac 9453 ctttctgaat gacttcatca tcaggaggta tagccagggt caccttctca cccagtctct 9513 tgaccagaag ttaccagacc atactgtctc tttacaagta aaattcaaaa agctttgctt 9573 tgtcttctca gacatacata tgcatatgaa aagatggttt ttaaatgtgc caagtttatg 9633 tgtgtgtata aatatatata tgtgtgtgtg tgcgtgtata tatatatgtg tgtgtgtgta 9693 tgtgtatata tatatgtgtg tgtgggtgcg agtgtgcgag tatgtgtatg tgggggtggg 9753 tgcgcgtgtg tgtgtgtgtg tgtatgctgt gagattggta agcaatacat tagtaaacac 9813 atcttcatta ctcttttcca atactggacc aatgatgtcc taactgtaca tttccttccc 9873 cttatgatga cgacgctctg actcatttag gtagagacat ttgaccacct tcattccatt 9933 gatttttttt tttctccttt ctgtgttatt cttaagggaa aagagagaga gagaaagagg 9993 ggatggcata gatccccttg agcagagaaa aagcaaaata ttttattaaa aaaaaaaaaa 10053 aaaaaaaaaa aaaaaa 10069& #26;
【図1】T細胞欠損マウスを用いたディファレンシャル
スクリーニング。 (A)RAG1及びTCRα遺伝子ノックアウトにより
影響されるT細胞分化チェックポイントのスキーム図。 (B)RAG1-/-、TCRα-/-及び野生型マウス由来
の胸腺におけるクローンA25及びG3PDHのRT−
PCR分析。数値は臭化エチジウムで標識したA25P
CR断片の、G3PDHに対して規格化した相対強度。 (C)胸腺(Th)、リンパ節(LN)、睾丸(T
e)、卵巣(Ov)、脳(Br)、肝(Lv)、心臓
(Ht)、及び肺(Lg)におけるsab1発現のノー
ザンブロット分析。RNAサイズマーカーも示す。
スクリーニング。 (A)RAG1及びTCRα遺伝子ノックアウトにより
影響されるT細胞分化チェックポイントのスキーム図。 (B)RAG1-/-、TCRα-/-及び野生型マウス由来
の胸腺におけるクローンA25及びG3PDHのRT−
PCR分析。数値は臭化エチジウムで標識したA25P
CR断片の、G3PDHに対して規格化した相対強度。 (C)胸腺(Th)、リンパ節(LN)、睾丸(T
e)、卵巣(Ov)、脳(Br)、肝(Lv)、心臓
(Ht)、及び肺(Lg)におけるsab1発現のノー
ザンブロット分析。RNAサイズマーカーも示す。
【図2】SAB1とクロマチン調節タンパク質のホモロ
ジー。 (A)クロマチン再構築因子とtrx−Gタンパク質の
Pfamドメインのスキーム図。付加的なモチーフを注
釈付の白枠で示す。 (B)SAB1、ASH1、及びMTDM及びALL1
のCXXCモチーフを有するLIN−59のPHDフィ
ンガー(上部の黒丸は保存されたシステイン残基を示
す)と、他のタンパク質のPHDフィンガー(下部の白
丸は保存されたC4HC3モチーフを示す)の整列。 (C)P/CAF(PDB受託番号、1B91)の構造
データに従ったブロモドメインの整列。DDBJ/EM
BL/ジーンバンク受託番号:Homo sapien
sP/CAF(hP/CAF,AAC50890),B
RM(hBRM,S45251),BRG1(hBRG
1,S39059),WSTF(hWSTF,AAD0
8675),ALL1(hALL1,Q03164),
AC005065(hAC005065,AAD047
21),SEB(hSEB,BAA82444)及びM
TDM(hMTDM,AAD54057);Gallu
s gallusPolybromo−1(gPB1,
CAA62353);Drosophila mela
nogaster Ash1(dASH1,AAB01
100);Caenorabditis elegan
s LIN−59(nLIN−59,AAD4932
4);及びSchizosaccharomyces
pombe Rsc1(yRsc1,NP_01157
0)。
ジー。 (A)クロマチン再構築因子とtrx−Gタンパク質の
Pfamドメインのスキーム図。付加的なモチーフを注
釈付の白枠で示す。 (B)SAB1、ASH1、及びMTDM及びALL1
のCXXCモチーフを有するLIN−59のPHDフィ
ンガー(上部の黒丸は保存されたシステイン残基を示
す)と、他のタンパク質のPHDフィンガー(下部の白
丸は保存されたC4HC3モチーフを示す)の整列。 (C)P/CAF(PDB受託番号、1B91)の構造
データに従ったブロモドメインの整列。DDBJ/EM
BL/ジーンバンク受託番号:Homo sapien
sP/CAF(hP/CAF,AAC50890),B
RM(hBRM,S45251),BRG1(hBRG
1,S39059),WSTF(hWSTF,AAD0
8675),ALL1(hALL1,Q03164),
AC005065(hAC005065,AAD047
21),SEB(hSEB,BAA82444)及びM
TDM(hMTDM,AAD54057);Gallu
s gallusPolybromo−1(gPB1,
CAA62353);Drosophila mela
nogaster Ash1(dASH1,AAB01
100);Caenorabditis elegan
s LIN−59(nLIN−59,AAD4932
4);及びSchizosaccharomyces
pombe Rsc1(yRsc1,NP_01157
0)。
【図3】T細胞発生に対するSAB1断片の優勢ネガテ
ィブ効果。 (A)pMXベクターに基づくバイシストロン性のレト
ロウイルス構築体。 (B−D)GFPのみ(B)、SET−GFP(C)又
はPHD−GFP(D)で形質導入されたNIH3T3
フィブロブラストにおけるGFP発現のヒストグラム。 (E−F)GFPのみ(E)、SET−GFP(F)又
はPHD−GFP(G)での形質導入後の培養胸腺細胞
におけるGFPの発現。 (H−J)GFPのみ(H)、SET−GFP(I)又
はPHD−GFP(J)での形質導入後のGFP-細胞
におけるCD4及びCD8の発現。 (K−M)GFPのみ(K)、SET−GFP(L)又
はPHD−GFP(M)での形質導入後のGFP+細胞
におけるCD4及びCD8の発現。
ィブ効果。 (A)pMXベクターに基づくバイシストロン性のレト
ロウイルス構築体。 (B−D)GFPのみ(B)、SET−GFP(C)又
はPHD−GFP(D)で形質導入されたNIH3T3
フィブロブラストにおけるGFP発現のヒストグラム。 (E−F)GFPのみ(E)、SET−GFP(F)又
はPHD−GFP(G)での形質導入後の培養胸腺細胞
におけるGFPの発現。 (H−J)GFPのみ(H)、SET−GFP(I)又
はPHD−GFP(J)での形質導入後のGFP-細胞
におけるCD4及びCD8の発現。 (K−M)GFPのみ(K)、SET−GFP(L)又
はPHD−GFP(M)での形質導入後のGFP+細胞
におけるCD4及びCD8の発現。
フロントページの続き Fターム(参考) 4B024 BA21 BA80 CA04 DA02 EA02 GA11 HA11 4C084 AA01 AA07 BA01 BA02 BA08 BA19 BA21 BA22 DC50 4H045 AA10 AA30 BA10 CA40 DA01 EA20 EA50 FA74
Claims (8)
- 【請求項1】 配列番号1若しくは2のアミノ酸配列、
又は一個若しくは数個のアミノ酸が欠失、置換若しくは
付加されたアミノ酸配列からなるT細胞分化調節因子。 - 【請求項2】 請求項1のT細胞分化調節因子を含むT
細胞分化阻害剤。 - 【請求項3】 請求項1のT細胞分化調節因子を含むH
OXA5遺伝子発現阻害剤。 - 【請求項4】 以下の(a)又は(b)のタンパク質: (a)配列番号3のアミノ酸配列からなるタンパク質、
(b)配列番号3のアミノ酸配列において一個又は数個
のアミノ酸が欠失、置換又は付加されたアミノ酸配列か
らなり、かつT細胞分化促進活性を有するタンパク質。 - 【請求項5】 請求項4の(a)又は(b)のタンパク
質をコードする遺伝子。 - 【請求項6】 以下の(c)又は(d)からなる遺伝
子: (c)配列番号4の塩基配列からなるDNA、(d)配
列番号4の塩基配列からなるDNAとストリンジェント
な条件でハイブリダイズし、かつT細胞分化促進活性を
有するタンパク質をコードするDNA。 - 【請求項7】 請求項4のタンパク質を含むT細胞分化
調節因子。 - 【請求項8】 請求項4のタンパク質を含むT細胞分化
促進剤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000377898A JP2002176981A (ja) | 2000-12-12 | 2000-12-12 | T細胞分化調節因子 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000377898A JP2002176981A (ja) | 2000-12-12 | 2000-12-12 | T細胞分化調節因子 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002176981A true JP2002176981A (ja) | 2002-06-25 |
Family
ID=18846558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000377898A Pending JP2002176981A (ja) | 2000-12-12 | 2000-12-12 | T細胞分化調節因子 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002176981A (ja) |
-
2000
- 2000-12-12 JP JP2000377898A patent/JP2002176981A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hiller et al. | Developmental regulation of transcription by a tissue-specific TAF homolog | |
Sakaguchi et al. | Cloning of the human claudin-2 5′-flanking region revealed a TATA-less promoter with conserved binding sites in mouse and human for caudal-related homeodomain proteins and hepatocyte nuclear factor-1α | |
Suwanichkul et al. | Glucocorticoids and insulin regulate expression of the human gene for insulin-like growth factor-binding protein-1 through proximal promoter elements. | |
JP2024023294A (ja) | 遺伝子編集のためのcpf1関連方法及び組成物 | |
AU2021290257A1 (en) | Globin gene therapy for treating hemoglobinopathies | |
KR20230057487A (ko) | 게놈 조정을 위한 방법 및 조성물 | |
Chang et al. | Functional reconstruction of trans regulation of the Ultrabithorax promoter by the products of two antagonistic genes, trithorax and Polycomb | |
US7741113B2 (en) | Cell-specific molecule and method for importing DNA into osteoblast nuclei | |
Fischer et al. | Structure and Evolution of the HumanSPRR3Gene: Implications for Function and Regulation | |
CN113544257A (zh) | 中国仓鼠卵巢细胞中内源性逆转录病毒的表征及灭活 | |
KR20210082205A (ko) | 레트로바이러스 인테그라제-Cas9 융합 단백질을 이용한 유도된 비상동 DNA 삽입에 의한 게놈 편집 | |
AU726918B2 (en) | TGFbeta signal transduction proteins, genes, and uses related thereto | |
Walpole et al. | Identification and characterization of the human homologue (RAI2) of a mouse retinoic acid-induced gene in Xp22 | |
WO1997022697A9 (en) | TGFβ SIGNAL TRANSDUCTION PROTEINS, GENES, AND USES RELATED THERETO | |
CN113874512A (zh) | 诱导毛细胞分化的组合物和方法 | |
KR20220018495A (ko) | 영양요구성 선택 방법 | |
Lee et al. | Molecular analysis of the cDNA and genomic DNA encoding mouse RNA helicase A | |
RU2183465C2 (ru) | Новые способы характеризации соединений, стимулирующих экспрессию stf-1 в клетках панкреатических островков | |
Johanson et al. | Transcriptional activation of the myogenin gene by MEF2-mediated recruitment of myf5 is inhibited by adenovirus E1A protein | |
US6994999B1 (en) | Isolated DNA molecule comprising the promoter sequence of a bovine myostatin gene | |
Katsuoka et al. | One enhancer mediates mafK transcriptional activation in both hematopoietic and cardiac muscle cells | |
US20180140720A1 (en) | Compositions and methods for tissue regeneration | |
Long et al. | Stimulation of the murine Uchl1 gene promoter by the B-Myb transcription factor | |
JP2002176981A (ja) | T細胞分化調節因子 | |
Smits et al. | Molecular cloning and characterization of the mouse Ecm1 gene and its 5′ regulatory sequences |